文 | 罗sir

博弈论是分析存在相互依赖情况下理性人如何决策的理论工具。

在现实生活中,我们总是能看到一些“老实人”因为善良被欺负被针对,面对这一现象,我们应该如何选择博弈?

为了解决这一问题,我们依然举例博弈论中的经典悖论——囚徒困境来说明这个问题。

至于为何要用囚徒困境来说明这一问题,我们后续会提到这个经典悖论中的适用性和普遍性。

打开网易新闻 查看精彩图片

01

01

囚徒困境:个人理性和集体理性原则

囚徒困境:个人理性和集体理性原则

我们假定有两个犯罪嫌疑人共同作案。警察抓住他们以后,分开拘押,并告诉他们:你们两个人可以选择坦白,或是不坦白;如果一个人坦白,另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方会被判刑10年,如果两人都坦白,则会每人各判刑5年;如果两人都抵赖的话,因证据不足,则每人会在关押1年后释放。

那么,这两个犯罪嫌疑人应该如何选择?

打开网易新闻 查看精彩图片

我们看到,这里博弈的有两个参与人:犯罪嫌疑人A和B;且每个人都有两个行动方式:坦白或不坦白;但两个人都隔离审查,谁都不能观察到对方是否选择坦白还是不坦白,因此我们说这是一个不完美信息静态博弈

即他们双方之间无法知道对方的决策方式。

现在我们来看看参与人A和B会如何决策。我们首先假定他们都是理性的,没人会想去坐牢,哪怕是多坐一天都会带来更多的痛苦。因此,他们的目标是能少坐就少坐。

同时呢,我们还假定他们每个人只会关心自己的利益得失。那么不管对A还是B来说,坦白就是最优的选择,因为他们无法实现约定不坦白,也无法假定对方会选择不坦白,那么此时他们个人的最佳决策就是选择坦白。

如果两人都选择坦白,那么等待他们的就是一起被判刑5年。

打开网易新闻 查看精彩图片

但是,就这两个囚徒而言,在这个博弈中的帕累托最优是“都不坦白”,各只坐一年牢。所谓帕累托最优,就是指是指资源分配的一种最为理想的状态。

这里我们要提到的一个概念就是个人理性集体理性之间的矛盾。

对上述A和B两个人来说,个人的理性是选择坦白,因为我们无法得知对方的策略如何;但是从集体理性的角度出发,选择都不坦白,各坐一年牢,才是对双方的最优选择。

现在我们回到前文中的问题,为何人善总是被人欺?

囚徒困境告诉我们,很多时候两方或以上的人数在选择博弈的时候,大家遵循的是个人理性的原则,因为信息不对等,我们无法准确预估对方的选择是如何的。

但是就善良的人来说,他可能会选择集体理性原则来做出决策,即替对方考虑并以此为决策依据。而根据囚徒困境来看,如果一方选择个人理性作为决策参考,那么对应的,选择集体理性的另一方就会面临吃亏。

这就是所谓“人善被人欺”的博弈困境。

打开网易新闻 查看精彩图片

为了让这个观点更通俗易懂,我们还是拿囚徒困境举例。

02

02

囚徒困境实例

囚徒困境实例

在上述囚徒困境中,如果我们假设嫌疑人A是“善良的”,那么他可能就会选择双方都不坦白。因为从集体理性出发,双方都不坦白,那么仅仅只判刑1年,这是有利于双方的帕累托最优。

但在实际情况下,嫌疑人B为了更符合自身的利益,那么他会根据个人理性作为决策依据。即自己受到的损失最小,那么嫌疑人B就会选择坦白。

那么现在我们再来看这个博弈结果,嫌疑人A顾全大局考虑,选择不坦白。嫌疑人B从个人理性出发,选择坦白。那么得出的结果就是,嫌疑人A因为不坦白,被判刑10年,嫌疑人B因为坦白,而被立即释放。

由此,这是博弈论中的为何人善被人欺的原因所在。即我们在做出决策的时候,常常会考虑到对方的情绪和局面,也正因为为对方着想过多,导致我们在博弈中出现了“人善被人欺”的不利博弈局面。

打开网易新闻 查看精彩图片

也许你此时有点明白这个道理,但也许还显得懵懵懂懂,为了加强你的印象,我们再例举一个生活中的常见博弈场景:借钱

我们假设,一个多年未曾联系的大学朋友突然打电话找你借五百元钱。那么此时你的选择通常只有两个:借给他,或者不借给他。

而根据个人理性原则来看,这个朋友你不曾联系,也与你现在没有什么交集,况且借出去了能不能还给自己都是未知,那么此时你的最优选择是不借给他。

但如果从集体理性角度来看呢?这个大学朋友几乎是恳求着告诉你,自己很久没吃过饭了,这五百元可以解决他的一个月伙食费用。

打开网易新闻 查看精彩图片

那么我们现在来看这个博弈局面:

个人理性原则:你选择不借给他,你不会有任何损失。但他可能会失去一个月的伙食费用。

集体理性原则:你暂时损失五百元钱,他说不定会还给你。而对方呢,则可以得到五百元钱,继续生活一个月下去。

如果你足够考虑到对方的可怜状态,又想到对方是你的大学室友,那么你会选择借给他。而其结果呢,很可能是这五百元钱付之东流,你损失五百元失去一个大学室友。

所以我们说,为什么“老实人”总是会被欺负?因为他们往往都顾及到对方的感受和得失,从而在一次又一次的博弈中,自己的个人理性原则为了集体理性原则受到损失。

打开网易新闻 查看精彩图片

当然,在实际的现实生活中,这样的博弈例子还有许多许多。朋友叫你明天请假去某地玩耍,但自己明明要上班,按理来说最好的选择是拒绝他不去,但碍于朋友的面子,只能服从于集体理性原则,选择向公司请假,陪朋友去玩一天。

那些无法推脱不愿去参加的聚会、帮忙带饭带奶茶等等,都是个人理性服从于集体理性原则下的自我受损行为。

现在,你或许可以发出感慨,博弈论竟会如此神奇?

我要说的是,生活中的博弈无处不在,但很多时候,我们没有建立系统的博弈思维,我们是很难分清这是否是在博弈,从而导致为了不拒绝别人,个人理性服从集体理性导致自己长期受损。

打开网易新闻 查看精彩图片

那么我们应该如何改变这一局面?

建立博弈思维,走出人性逻辑怪圈。

03

03

博弈思维:利己就是最大的利他

博弈思维:利己就是最大的利他

我在本文开篇就点出,博弈论是分析存在相互依赖情况下理性人如何决策的理论工具。

这句话有两个关键点,其一是相互依赖,其二是理性人。

换句话说,任何产生依赖关系的双方,都存在博弈局面,而在博弈之中,我们又假定人是理性人。

那么根据这一原则,建立博弈思维的重点就在于依赖关系。

打开网易新闻 查看精彩图片

在生活中,任何一切交易关系、依赖关系本质上都是一种博弈状态。但千万不要认为“博弈”是一种贬义词,博弈作为一种客观存在的状态,我们需要理性认识到它的存在。

而运用博弈思维思考,我们需要知道以下几点:

1. 参与人

2. 集体理性和个人理性原则

3. 选择权和选择带来的后果

参与人,是指的参与方都有哪些人。集体理性和个人理性原则,通俗地讲就是利己思维和利他思维。至于选择权和选择的后果,就是我们需要通过博弈中的已知信息去推测,可能出现的几种后果。

当我们知道了这几点信息,那么我们就可以快速在脑海中列出各项选择以及选择所带来的后果。

打开网易新闻 查看精彩图片

而在面对博弈中个人理性和集体原则之间,我的建议是:选择个人理性原则。

即只求个体的最优选择,不求集体的最优选择。

逻辑思维的罗振宇说过一句话我很喜欢:商业就是最大的慈善。开公司,创造就业、带动GDP的增长,这不就是最大的慈善吗?

同理,利己其实就是最大的利他行为。为什么这么说?

我们拿企业做广告之间的竞争博弈举一个例子:

企业做广告的成本很高,不一定能给企业来带利润,但为什么大部分企业都做广告呢?我们假定某个行业内有两个企业,如果每个企业都不做广告,那么他们之间各得10元利润;如果都做广告,各得4元的利润;如果一个企业不做广告,那么做广告的企业就可以赚到12元,不做广告的企业就只能赚到2元。

打开网易新闻 查看精彩图片

而按照博弈中的个人理性原则,就是两个企业都做广告。因为无论别人做广告与否,你的最优选择都是做广告。但是如果按照集体理性原则博弈,那么有一方就会选择不做广告,为什么?因为在集体理性原则看来,双方都不做广告都赚10元,是最佳选择。

但在实际过程中,选择集体理性原则博弈的公司,就会面临巨大的亏损,因为他假定对方也不做广告,大家都赚10元,但是对方却做了广告,那么只能导致自己赚2元钱。

从这个类似于囚徒困境的例子中,我们可以得出:利己实际上就是最大的利他行为

按照囚徒困境来看,双方都选择不做广告是最为合算的。但实际情况是,由于没有签订相应的契约,选择集体理性原则博弈的一方,必然会承担最大的损失。

打开网易新闻 查看精彩图片

经济学原则也表明,利己行为也是能够促进社会效益最大化的。

当我们所有人都追求自己想要的物质精神、财富,那么整个社会的总财富才会增加。同理,按照分工理论来看,当我们都只做自己份内的事情,那么所有人都会享受到整个商业社会带来的商品和物质供应。

现在,我们可以用博弈论来解决人善被人欺的问题了。具体应该怎么做?

建立博弈思维,用个人理性原则作为决策依据,在触及自己核心利益的时候,我们应该明白:利己才是最大的利他。

打开网易新闻 查看精彩图片

END.