1832
需用时 03:39
博弈入门:囚徒困境

什么是囚徒困境?

一个经典的囚徒困境描述如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下选择:认罪并作证检控对方(相关术语称“背叛”对方)或是保持沉默(相关术语称“合作”)。

若一人选择背叛,而对方选合作,则此人将即时获释,合作者将判监10年。

若二人都选合作,则二人同样判监半年。 若二人都互相背叛,则二人同样判监2年。

我们可以用一张表格来表述:

甲沉默(合作) 甲认罪(背叛)
乙沉默(合作) 二人同服刑半年 甲获释;乙服刑10年
乙认罪(背叛) 甲服刑10年;乙获释 二人同服刑2年

如果你是其中之一,只考虑尽量使自己服刑年份最小化的话,你会怎么选?我相信大部分的人会选择“背叛”,确实有太多理由让人选择背叛了,比如有人坚信对方会背叛你,而你不愿意选择合作而服刑10年,所以你选择背叛而服刑2年。他的理由对他来说已经很充分了,但是我们还需要考虑另一种情况,就是乙坚信甲不会背叛他,那么乙应该选择什么?乙还是应该选择背叛,因为乙选择背叛就能立即获释,而乙选择合作还需要服刑半年。在这种情况下,无论甲作何选择,对乙来说选择背叛总是优于选择合作,那么我们称背叛是乙的“优势策略”。无论是实验的事实还是简单的分析,都告诉我们背叛是每个人的最佳选择。所以最终两个人都会选择背叛,而同服刑2年,这就是囚徒困境的结果。

为什么称之为困境?

既然每个人都作了对自己而言的最优选择,为什么这仍是一个困境?答案之一是“总收益”下降了。把两个人的服刑年数之和相加,你会发现这并非是这两人团体的最佳选择,因为从总刑期来看,共同合作的总刑期1年要优于共同背叛的总刑期4年。相信你已经发现在这里服刑年份的绝对大小并不重要,重要的是它的相对大小。如果刑期的相对大小不作改变,背叛仍是“优势策略”,那么最终双方还是会选择背叛。困境的另外一层意思是,如果我们允许犯人事先沟通协商,或是把两人放在同一间屋子里让他们一起回答,或是让一个人先听到另一个人的回答,这会改变最终的结果吗?答案是否定的,在囚徒困境中人们无法通过沟通来达成团体最优,因为这与信任无关——无论你有多大的信念认为对方会选择什么,你选择背叛总能得到更多的好处。

现在让我们做一些小小的改变,帮助大家更好的理解什么是囚徒困境。如果我们把共同合作的服刑年份也改为两人同服刑2年,结果会怎样?尽管背叛仍然是优势策略,但是因为共同合作与共同总收益相同,所以最后的均衡并没有造成无谓的损失,严格来说这就不能再被称为“囚徒困境”了。再设想一下,如果出现一人背叛,而另一人合作的情形时,背叛方仍然需要服刑一年,那么此时背叛就不再是优势策略了,你的选择将会取决于你对对方信任程度的考量,如果你坚信对方会合作,那你最好也选择合作而获刑半年,而不是选择背叛而获刑1年。此时沟通将会变得有效,努力让对方相信你更关注在对方选择合作的情况下,你选择合作的而得到半年刑期要优于比选择背叛而得到的1年刑期,而不是去关注于在对方背叛的情况下,你选择合作得到的10年刑期要劣于选择背叛的2年刑期。不论是何种改变,囚徒困境都不再是囚徒困境。

现实中的囚徒困境

尽管这只是一个模型,而且略微的修改都将改变整个博弈的性质,现实中仍有许多囚徒困境的例子:

在一个合作项目中,大家都想偷懒而指望着自己从别人的劳动中获得好处;在自行车赛中,大家都不想在比赛前期处于领先位置来承担风力,因而一开始的整体速度很慢,而到了中后期,如果一旦有人试图长期占据领先位置,那么其它选手以及整个队伍就会共同背叛,大幅追赶。

企业之间的价格战,每个企业都希望降低价格来吸引更多的消费者;企业投放广告也是囚徒困境的结果,如果别人投放了大量的广告那你最好也跟着投放来避免市场被别人抢去,而如果别人不投放广告,那你还是应该投放广告来占有市场。

国家间的关税战,双方都增加关税来保护本国商品,最终导致双方都失去对方的市场;国家间的军备竞赛,大炮和黄油之间的抉择,是将资源用于增加军备还是改善经济;再比如公用品悲剧——属于多数人的公共财产常常是最少受人照顾的事物,渔民的过渡捕捞,牧羊人的无节制放牧,乃至全球变暖和碳排放问题都属于公用品悲剧。

由于我们已经注意到通过增加沟通来建立信任并不能改善结果,那么有哪些改善总收益的方式呢?

最常用的是建立起带有强制性的协约,规定对背叛行为的惩罚,或是把单次博弈变为多次博弈(惩罚将在之后的博弈中体现出来),再或是通过教育手段来改变人们的思想。有时这些方法会很有效,但有时只能维持一段时间,当双方都为共同背叛而付出代价时,也许他们会考虑重新制定协议。

一道思考题

假设猪圈里有一头大猪和一头小猪,有一个开关控制食物供应,但供应口远离开关。如果小猪按下开关,那么当小猪赶到供应口之前,大猪就会把食物全部吃完;而如果大猪按下开关,那么大猪赶到时只能和小猪抢食部分残渣。如果你是小猪,你会按吗?这里有优势策略吗?

更多讨论请在小组围观:

http://www.guokr.com/post/2860/

The End

发布于2010-12-03, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

冰羊

数学控

pic