APP下载

从博弈实验看博弈论作为社会科学方法论的局限性

2012-11-14刘晓丽

关键词:纳什博弈论平均数

刘晓丽

(南京大学哲学系,江苏南京210093)

从博弈实验看博弈论作为社会科学方法论的局限性

刘晓丽

(南京大学哲学系,江苏南京210093)

博弈论是社会科学的通用方法论,它通过构建模型分析社会现象和社会规律。然而博弈论的理想主体的假定使得它的理论预测与实际现象存在偏离。本文设计并进行了一个博弈实验,该实验有176人参与。通过分析该博弈的实验解与其理论解发生偏离的原因,本文指出博弈论的局限性,并提出了可能的改进路径。

博弈论;理性人假定;公共知识;社会科学方法论

博弈论是研究理性人的互动的理论,或者说研究交互决策的理论。1928年,冯·诺依曼证明了博弈论的基本原理,宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统应用于经济领域,奠定了这一学科的基础和理论体系。1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚定的基础。塞尔顿、哈桑尼、谢林、奥曼等人的研究也大大推动了博弈论的发展。因此,尽管博弈论是一门新生的学科,但是它今天已经发展成为有较完善的理论体系的科学。

今天,博弈论已经成为社会科学的通用方法论。尽管它是演绎科学,对社会现象有强大的解释力,然而,由于其理想主体的假定使得其演绎出的理论解与实际博弈结果存在差异。许多实验经济学家通过博弈实验研究实际中人们的博弈过程,分析博弈论的演绎解与博弈实验结果之间的差异。如2002年诺贝尔经济学奖就颁发给了丹尼尔·卡尼曼和迈农·史密斯,他们是实验经济学的先驱。今天在西方学术界通过实验来验证博弈的理论结果已经成为一种潮流。本文下面设计并进行了一个博弈实验,通过分析实验结果与理论解的差异,分析博弈论作为社会科学方法论的局限性,并提出改进的可能路径。

一、博弈实验及结果分析

1.实验描述

我们设计了如下的一个博弈实验①该实验是与“逻辑与科学方法基础”的主讲教师博士生导师潘天群教授共同完成的。。该实验的参与人是南京大学选修文化素质课“逻辑与科学方法基础”的大学生,他们是二三年级的学生,文理科学生均有。

该实验是以试题的形式进行的,该试题作为期末试卷中的最后一道题。该题目为:

在0-100之间选择一个数字,规则是:若你选择的数字“是或最接近”在座同学所选择的数字的平均数的2/3(即在座同学所选数的总和除以总人数之后所得数字的2/3,如:若平均数为90,你应当选2/3x90=60),你将获胜。请给出你选择的理由。

实验说明:

(1)实验参与者即参加考试的学生,事前不知道这是一个实验;

(2)该课程教师以讲座的形式给实验参与者传授过博弈论知识,但没有提到所进行的博弈;

(3)因为(2),他们中的大多数掌握“博弈”、“公共知识”等概念;

(4)试卷是保密的,没有任何学生预先知道考试内容,考试过程中学生间无任何交流;

(5)该博弈的理论解(即纳什均衡)为0或1。

2.实验结果

对于考试中的每个学生,在这个博弈实验中他能够获胜的关键是,他要准确猜测他人是如何选择的,一旦他猜测正确,他将他猜测的平均数乘以2/3便是获胜答案。

共有176人参加了考试。排除掉5个不明确的选择,供分析的实际选择数为171个(其中3个选择非整数)。实验结果为(按照数字大小排序):

“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

3.结果分析

在这些所选择的数字中,最大的数字为75,最小的数字为0。171个数字相加后的平均数为21.91,本博弈胜出解:21.84×2/3=14.61。

这个博弈中,0和1是均衡解(下一部分将分析),它们是“理论解”。在该实验中,0是所选最多的数字,共有46人选择,比例为26.9%;选1的为14人,比例为8.2%。两者相加共有60人,比例为35.1%。

从上述数据可以看出,在这场博弈中,“实验解”为14.61,最接近该数的是14或15,这和“理论解”的“0”或“1”不同。在本实验中,没有人选择14,而选择15的有3人,这3人是该实验的胜出者。

若按照区间来统计,实验结果的分布情况见表1。本博弈实验的“实验解”14.61落在11-20之间。若我们把11-20看成是胜出区间,则有7人胜出。

表1 实验结果区间分布统计

对于这些选择,有以下值得注意的几点:

第一,67以上的选择都是不理性的,因为参加考试的学生数为150-200之间,这是公共知识,即使所有的学生都选择100,胜出的数字都不会超过67。但是还有3位学生选择了大于67的数字,其中选择的最大数为75。他们在给出这些选择时没有给出理由。

第三,有三个区间处的选择比例较高:0-10间为38.6%,21-30间为17.6%,31-40间为25.7%。从所给理由可看出,不同区间的选择者考虑群体的互动推理的步骤存在差别,如0-10区间的选择者考虑他人的推理步骤比31-40区间的选择者多些。

第四,值得注意的是,11-20区间里的选择较少(事实上是,在这个博弈中所选择的数字落在这个区间是最有可能胜出的)。原因可能是,一旦选择者进行了多步的互动推理,他们便能够将这样的推理进行下去,从而将选择向理论解0或1靠近。

第五,有一些“智慧的”选择者,他们知道理论解,但他们知道存在不完全理性的选择,因而他们没有选择理论解。尽管他们的选择没有胜出,他们的推理是有智慧的。这里,本文选择了其中2个。一位选择22的学生是这样给出他所选择的理由的:“作为理性人,我不会选择大于2/3×100的数,因为即使所有人都选择最大数,平均数的2/3也不会超过2/3×100。如果大家和我一样理智,那么大家都不会选择大于2/3×100,那么我不会选择大于100×2/3×2/3。因为他们选择最大的他们可能会选的数,平均数的2/3也不会超过2/3×2/3× 100。依此类推,如果全班都充分理智,那么全班最终都会选择1,然而我不认为班里的人都是足够理智,故平均数的2/3会大于1。根据两次游戏,平均数的2/3在20~30。如果是我,我会选择靠近20的数,那我就22吧。”一个选择10的学生的理由是:“如果其他人都是随机选择,那么平均数最后可能接近于50,50×2/3≈33。但是,如果所有人都选择接近33的数,那么33为平均数,33×2/3≈22……如此推理应该为1。但是并非所有人均是理性、均会如此计算。我对南大有信心,所以,我将数字选得接近1一点,选10。”

第六,有一些选择是没有考虑到他人的选择。如有这样一些理由:“大家都认为60是及格分,所以我选择59”,“58是我的幸运数字”,等等。

二、博弈的理论解分析

本实验是一个多人完全信息静态博弈:参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果,每一参与者的收益函数在所有参与者之间是公共知识①命题p是某个群体的公共知识指的是,该群体的每个人知道p,每个人知道知道每个人知道p……。

在这个实验中,参加考试的176位学生是参与者,每个考生同时对0-100之间的数字进行选择行动,即每个参与者的策略空间Si∈(0,100),即有101种可能的策略。根据所有考生的选择,每个考生最后得出自己的结果,对每个考生来说,结果无非就是,自己的选择是“大家所选数字的平均数的2/3”,胜出;要么与“大家所选数字的平均数的2/3”不一致,失败。

我们假定该博弈的参与人都是绝对理性人(事实上,这个要求在实际中难以达到,这也是本文要得到的一个结论)。

我们来分析绝对理性人的推理过程。

要理解和把握“城乡文化一体化”的涵义,不能仅仅就事论事,否则极有可能含糊其辞,甚至以讹传讹。本文拟采取层级分离法,从三个依次递进的层次逐一进行剖析,即先后解析“一体化”、“城乡一体化”、“城乡文化一体化”,以此来理解和把握“城乡文化一体化”的涵义。

在这个博弈中策略组合有176×101种,每种策略组合下,每个人的收益是公共知识。如:如所有人都选100,平均数为100,此时每人都失败,胜出结果是100× 2/3=67;如175人都选100,有一个人选择了67,那么选100的人失败,而选择67的人胜出……所以这些是理性参与人的公共知识。

我们看到,任何人都不应该选67或以上,或者选择67或以上是非理性的,因为所选择的数字的最大平均数为100,此时胜出的数字为67,因此选择67以上而获胜的可能性是没有。因此,作为理性人他们都不会选择67或以上。

每个人都不会选择67或以上,这本身也是公共知识。在这样的公共知识的前提下,45以上的选择都是不合理的,因为对每个人而言,只有在他人都选择67以上,我选择45或以上才是合理的(67的2/3约为45)。

每个人都不会选择45或以上,这本身也是公共知识。于是,每个人都认为不应该选择30或以上。

……

结论是:每个人选择0或1是合理的,它们是该博弈的理论解。

事实上,每个人选择0或都选择1是纳什均衡:对每个人而言,在其他人不改变选择的情况下,当下的选择是最优的。

在所有人均选择0的情况下,因为对于每个人而言,若所有人都选择0的话,0便成为平均数,该数的2/3还是0。这样,他选择0是最优选择:在他人不改变选择的情况下,他改变选择将失败。因此这点构成纳什均衡。

在所有人均选择1的情况下,同样,对于每个人而言,在其他人选择1的情况下,平均数1的2/3为0.67,此时1最接近该数。因此,他选择1是最优选择,并且若他改变了他的选择他将失败。因此,这点也构成纳什均衡。

当然,面对多个纳什均衡,作为理性的参与人作何选择才能胜出呢?具体到这个博弈中,每个人要考虑的是,他选择0还是选择1才能胜出呢?

他会这样思考:没有理由认为其中一个比另外一个更有可能胜出,这样,选择0或1胜出的概率为50%,但是,他人能够与我有同样的想法。既然如此,期望平均数应该为0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,选择0是最优选择。

从上面的分析可见,尽管0和1是纳什均衡点,但选择0是最优选择。

三、改进博弈论的可能路径

本文已经表明,上述博弈是一个完全信息静态博弈,然而,本实验的实验解(14.61)与理论解(0或1)之间发生偏离。本文认为,有两个主要原因:

第一,博弈论中所假定的理想主体与实际中的决策主体不相符合。理想的博弈参与人是绝对理性人:他们能够进行任何有穷步骤的推理,能够分析所有有穷可能的情况,并且他们的推理、分析是在瞬时完成的,而实际博弈中人们是有界理性的。在我们的博弈实验中若参与者是理想主体,他们能够做本文上一部分那样的分析,他们应当知道0和1是均衡解,也能够预测0是最有可能实现的结果。本实验表明,并不是所有人都能够做出这样分析的。并且,在实际中存在完全非理性的选择,如本实验中选择大于67的3人,这不是完全偶然现象。

第二,博弈论假定了博弈中参与人是理性的是博弈参与人之间的公共知识,而在实际博弈中这一点不能保证,并且博弈参与人越多,理性人是公共知识越不能保证。本实验参与人有近200人,这是实验者之间的公共知识,这也使得选择者对他人的理性没有信心。上面本文给出一个选择者选择的理由,他对在座的同学“有信心”才将数字选得“接近1一点,选10”;若绝对有信心,应当选择理论解0或1。

博弈论作为社会科学的方法论工具有其巨大的威力,然而由于其假定与现实的偏离使得其理论解与实验解存在巨大偏离。根据上述两点原因,我们可以通过修改博弈论的假定而改进博弈论。这个改进路径有两条:第一,弱化博弈论的理性人假定,引进西蒙的有界理性概念;第二,弱化理性人的公共知识假定,用公共p信念来替代公共知识假定[2]。通过这样的改进,博弈论能够更好地作为社会科学的方法论以解释社会现象。

[1] Ken Binmore.Why Experiment in Economics?[J].The E-conomic Journal,1999(2).

[2] 周章买.从博弈论看公共P-信念对协同攻击难题的解决[J].哲学动态,2010(5).

[3] Martin Hollis,Robert Sugden.Rationality in Action[J].Mind.New Series,1993,102.

[4] 罗伯特·吉本斯.博弈论基础[M].高峰 译.北京:中国社会科学出版社,1999.

C3

A

1671-511X(2012)04-0020-03

2011-12-26

刘晓丽(1982-),女,河南许昌人,南京大学哲学系博士研究生,研究方向:科学逻辑。

猜你喜欢

纳什博弈论平均数
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
不一样的平均数
关注加权平均数中的“权”
平均数应用举隅
说说加权平均数
无知之幕与博弈:从“黄灯规则”看博弈论的一种实践方案
爱,纳什博弈人生的真理
樊畿不等式及其在博弈论中的应用
博弈论视角下的建筑工程外包道德风险