走进纳什均衡
2018-02-26漂流
漂 流
2015年5月24日,著名数学家、诺贝尔经济学奖得主约翰·纳什和妻子在美国新泽西州因车祸遇难.当时,纳什刚从挪威领取阿贝尔奖,在夫人的陪同下回到美国.除了诺贝尔经济学奖之外,纳什还在1994年获得过阿贝尔奖.约翰·纳什的去世引起了中国媒体的广泛关注,粉丝们以各种方式缅怀这位数学天才.
1928年,约翰·纳什出生于美国西弗吉尼亚州的一个中产阶级家庭.他从小性格就很孤僻,宁愿自己读书也不愿和别的孩子玩耍.小的时候,纳什的数学成绩并不突出,但到了中学,他的数学才能逐渐展露.他获得美国普林斯顿大学的博士学位时,在其博士论文里提出了一个重要概念,即后来的“纳什均衡”博弈理论,这同时为他获得1994年诺贝尔经济学奖奠定了基础.
1958年,纳什因在数学领域取得的杰出成就被美国《财富》杂志评为新一代天才数学家中最杰出的人物.但正当他的事业如日中天、家庭美满幸福的时候,30岁的纳什得了严重的精神分裂症.直到20世纪80年代,纳什才渐渐从精神分裂症中走出来,并在1994年获得了诺贝尔经济学奖.
学校经济学系经常会举办有关博弈论的论坛,纳什有时候会参加,但是他几乎从不发言,每次都是静静地来,静静地走.
“这人是个天才.”
这就是纳什的硕士导师给他写的推荐信,只有一句话的推荐信.
纳什闪光的数学才能,还有他和妻子艾莉西亚二十年来与折磨他的精神疾病作抗争的不凡经历也曾感动好莱坞.2002年获得奥斯卡最佳影片奖的电影《美丽心灵》就是根据这段传奇改编而成的.国人知道纳什大多是因为电影《美丽心灵》,但纳什留给这个世界最重要的遗产却是他的“纳什均衡”理论.
《美丽心灵》剧照
当时博弈论仍然处于起步阶段,冯·诺依曼是该领域的先行者,他对零和博弈作了非常深入的研究.所谓零和博弈,就是所有对局者收益的综合为零,一方获益必然意味着一方损失.可现实生活中的博弈没有这么简单,双赢和两败俱伤的情况常有发生.
当纳什在1950年发表对非合作博弈的研究成果时,博弈学界眼前为之一亮.所谓“纳什均衡”,即“在不存在外部强制执行的情况下,每一个人是否有积极性去自觉遵守这个协议?如果每个人都有积极性遵守这个协议,这个协议就构成一个纳什均衡”.
“囚徒困境”是理解纳什均衡的重要案例,其重要的结论是,人们为了自己的利益,而不愿意合作,最后的结果注定是损人不利己.
囚徒困境的故事:两个歹徒在一位富豪的卧室作案,被赶来的警察逮住.富豪死在旁边,他俩却不承认杀人的事实,辩解说,他们只是来偷点东西,他们进来时,富豪已经死了.警方把两个歹徒分开关在两个房间进行审讯,并给他们讲清楚了政策:如果两个人都坦白了杀人罪行,那么都将被判无期徒刑;如果其中的一个坦白了,另一个抵赖,那么坦白者将被无罪释放,抵赖者将被判处死刑.如果两个都抵赖,因为证据不足,只能按偷窃罪判处他们有期徒刑一年.
我们不妨站在其中一个歹徒的立场上,设想一下他会如何思考.他应该会想,我应该继续抵赖吗?如果我兄弟在那边坦白了,我不就死定了吗?那么,我应该坦白吗?如果我兄弟也坦白了,那我们俩就都得被判无期了.但如果他还是抵赖,我就能无罪释放了.
大家可以思考一下,如果换做是你,面对这样的情境,你会选择什么?我们为什么选择坦白而不是抵赖?假如大家都选择抵赖,只会被判处有期徒刑一年呢!
让我们把两个歹徒分别称为张三和李四.为了更清楚直观地看到两个歹徒的选择和获刑之间的关系,我们来看这张表:
刚才的这个表格,叫作博弈矩阵.类似的表格,在中学数学的应用题中我们有时也会遇到.这个表中的张三和李四,在博弈论中,被称为局中人.他们每一个人都有坦白和抵赖两个选择,这两个选择被称为局中人的策略.两个人各自的选择组合在一起,造就了两人各自的结局.例如,当李四选择坦白,张三选择抵赖的时候,李四会被无罪释放,而张三会被判死刑.两人的选择所得到的结果被称为局中人的收益.这样,传说中的博弈的三要素就构成了:局中人,局中人的策略以及局中人选择策略所获得的收益.
对张三来说,尽管他不知道李四作何选择,但他发现无论李四选择什么,他选择“坦白”总是最好的.显然,李四也会如此想,最终他们都被判无期徒刑.但是,倘若他们都选择“抵赖”,每人只被判有期徒刑一年.可是,都选择抵赖的结果往往在现实生活中不会出现.
囚徒困境的例子在现实生活中有很多.
商家的价格战就是如此:假设我是一位经营家电的零售商.在我商铺的周围有很多的竞争对手.现在我面临降价与不降价的选择:如果对手不降价,那么我降价是有利可图的.如果对手降价,那么我也必须降价,否则我就会面临一件都卖不出去的局面.所以,降价就成为我的优势选择.这对于我的竞争对手来说也同样如此.这样拼到底的最终结果就是我和我的竞争对手都只有微薄的利润.当然,结果也可能更惨,大家一起关门大吉.
读懂“囚徒困境”,理解纳什均衡,也是我们对大师最好的纪念.