囚徒困境和纳什均衡

有一个从极其简单的问题出发,发展成影响及其深远的理论,还获得了诺贝尔经济学奖。我们先来看看这个问题。

警方逮捕甲、乙两名嫌疑人,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑人,分别和两人见面,并向双方提供以下相同的选择:

若一人认罪检举对方,而对方否认,认罪的人将功折罪获释,否认者重判10年。

若二人都否认,则证据不强,二人都判半年。

若二人都认罪检举对方,则二人都判2年。

下面的假设完全是因为方便儿子女儿做出理性选择加的,一开始不用这些假设,他们都宣称自己无罪,哈哈哈。假设嫌疑人的确犯了罪,而你们是嫌疑人各自的律师,只能和自己的顾客联系,不能和另外的嫌疑人及律师联系,你们的职责是给各自的嫌疑人建议让他获得最轻的判决。你们会做出怎样的建议?

哥哥和阿妹都选择了认罪检举。推理过程是这样的:

如果选择认罪检举,那么取决于另外一个嫌疑人是认罪检举还是否认,我方得到的刑期分别是2年和0年。如果选择否认,那么取决于另外一个嫌疑人是认罪检举还是否认,我方得到的刑期分别是10年和半年。那么我方的策略应该是认罪检举。

到这里,我们得到了什么结果呢?两个嫌疑人都认罪检举,各自获刑两年,总共4年。

接下来我们看看这张表:G代表哥哥的嫌疑人,M代表阿妹的嫌疑人

G认罪 G否认
M认罪 G=2,M=2 G=10,M=0
M否认 G=0, M=10 G=0.5,M=0.5


虽然每个个人都采取了对自己最有利的决策,但对两个人整体来说,却错过了集体的最优方案,那就是两人都否认,各获刑半年,总共1年。

我们会不会想,该怎么解释我们的社会又是怎样出现利他行为,找到集体最优方案的呢?爸爸上大学时在政治经济学课上就拿这个做的一篇论文题目,我们下次再讲,好不好?

 

给好奇的读者:

对个体的最有利的决策的那个点(G认罪,M认罪),叫做纳什均衡点,这是因为任何个人的改变将会导致对该个人自己不利的结果。纳什是个美国数学家,他的这个成果应用到经济学和其它领域里面,获得了1994年的诺贝尔奖。