合作行为的一个联盟博弈分析
——兼论社会和谐基本要素
2012-12-08孙鹤
孙 鹤
(云南农业大学 经济管理学院,云南 昆明 650201)
2012-05-20
2012-06-06 网络出版时间:2012-9-29 15:43
孙鹤(1954-),男,云南昆明人,博士,教授,主要从事经济学研究。
http://www.cnki.net/kcms/detail/53.1044.S.20120929.1543.201205.35_035.html
云南农业大学学报 Journal of Yunnan Agricultural University,2012, 6(5): 35-39
10.3969/j.issn.1004-390X(s).2012.05.008
合作行为的一个联盟博弈分析
——兼论社会和谐基本要素
孙 鹤
(云南农业大学 经济管理学院,云南 昆明 650201)
合作是人类发展的主旋律,人们期望合作共赢,社会追求和谐共处。由于联盟博弈对完全信息的要求极高,不仅要求一般的完全信息,还要求知晓博弈对手采取的行动、策略及其是否遵守联合行动和利益分割的协定。因此,把联盟博弈分析与非合作博弈分析加以对比,可以彰显信息交流和相互信任对合作发生的重要性。本文以联盟博弈为分析工具,以揭示合作行为发生的基本条件。这些基本条件是:博弈应该存在非空核,也就是合作的基础应该是可以实现共赢,参与合作的任何一方都比不合作时要好;应该具备信息的高度完全性,也就是各方可以实现信息公开和充分交流;坚持追求长期利益,不为一念之差和短期诱惑所动;要对违约行为实现实在的惩罚;建立牢固的相互信任,珍惜自己的信誉;第三方监督对于合作的发展有着重要意义。
合作行为;社会和谐; 联盟博弈;信任;第三方监督
纵观人类历史,合作是一个主旋律。人们创造了各种各样的机制来实现合作、发展合作。市场机制和政府都是其中两个最基本的机制,当然它们也在不断地完善过程中。倡导社会和谐历来是中华民族处理社会集团和民族关系的主流思想,中华民族之所以发展壮大成世界上最伟大的民族之一与它具有内在的强大凝聚力密不可分。深入剖析这种凝聚力的产生与来源无疑有助于正确理解、贯彻执行中国共产党的社会和谐政策,实现社会和民族团结、共享繁荣昌盛。本文使用分析社会经济现象的有力工具——博弈论及其联盟博弈来解说合作行为发生之原理,把实现社会和谐的条件、基本要素及其作用机制清晰化和精确化,从而增强贯彻执行科学发展、建设和谐社会的自觉性。
博弈论是研究人们合作行为的有力工具,得到了很多发人深省的结论。比如说,人所周知的“囚徒窘境”问题给出了一个启发性的问题:两个小偷为什么不合作(坦白罪行,证据确凿而判刑)放弃了对双方都好的帕累托改进(两人都不坦白,由于证据不足而出狱)?[1]博弈论大师纳什在弗洛德论文的评注上指出重复囚徒窘境博弈中的冷酷触发策略对应该是一个均衡,意指足够长的重复博弈会发生合作行为。[2]弗登伯格和2007年度的诺贝尔经济学奖获得者之一马斯金(1986,1991)在囚徒窘境无限重复博弈中引入折扣因子证明了子博弈完美无名氏定理,也就是表明了合作发生的条件:由于博弈不断地重复,人们可以权衡短期利益和长期利益,可以用自己的行动以交流信息并表示合作愿望、对违约行为实施惩罚并在这个过程中建立信任关系,从而实现合作共赢。[3-4]政治学家埃克斯劳德先后两次组织了很有意思的重复囚徒窘境策略的计算机竞赛,许多经济学家、心理学家和博弈专家积极参与,提交了70余种策略程序,埃克斯劳德发现针锋相对策略或者类似的策略表现最佳。他总结了获胜策略的特点,它们具有:善良的,即有合作愿望;简单的,即便于信息交流让对手容易理解你使得合作发生;可激怒的,即要对违约行为进行惩罚;宽容的,即惩罚后要给违约对手再次合作的机会。[5-6]
联盟博弈不仅要求非合作博弈的完全信息,还要求知晓博弈对手的行动、策略及其是否遵守联合行动和利益分割的协定,即双方的信任水平也是一个已知的知识。这样,把联盟博弈分析与非合作博弈分析加以对比,可以彰显信息交流和相互信任对合作发生的重要性。为了让这个分析简单明了,这里抽象考虑两个人,甲和乙,并且先假设它们之间的关系是对称的,然后再分析不对称的情况。它们各自有两个行动可以采取,合作或者不合作。这样,这场博弈有四个策略组合:(1)甲和乙都采取合作,记作(合作,合作),其中第一个合作是甲的行动,第二个是乙的行动;(2)甲采取合作,乙采取不合作,(合作,不合作);(3)甲采取不合作,乙采取合作,(不合作,合作);(4)甲和乙都采取不合作,(不合作,不合作)。要使双方自觉自愿地采取合作行为,最基本的是双方合作分别得到的好处应该大于采取不合作行为时的收益。这意味着双方合作可以享有更大的地域、人群和市场空间等资源,可以在更大的范围内优化配置资源,减少交易成本,获得规模效益,争取更大的发展。而一方采取合作、另一方采取不合作的情况我们先讨论一念之差的情况,即猎鹿还是逮兔博弈,然后再讨论存在偏离诱惑的情况,即囚徒窘境博弈。最后,讨论一方处于优势地位,比较强大,另一方相对劣势的情况,即大猪小猪博弈。在讨论中通过联盟博弈和非合作博弈的对比,揭示相互交流、彼此尊重和理解、铸造相互信任对产生合作的重要性。
一、合作的条件——联盟博弈的说明
这里使用联盟博弈分析来说明合作的基本条件。联盟博弈分析区别于非合作博弈分析。非合作博弈是指若干参与人,每一个参与人追求自我报酬最大化,但自己的报酬不仅是自己决策的函数也是其他参与人决策的函数。其中最基本的概念是纳什均衡:博弈出现了一个特定的策略组合,该策略组合可以达到一种稳定的状态,即任何一个参与人都没有动机主动地偏离该状态。在非合作博弈中每个参与人独立地做出决策,事前并不知晓其他参与人具体采用了哪一个策略。
而在实际的社会和经济生活中,参与人结盟或者联合行动却是一种经常的情况。博弈论奠基人范·诺依曼和摩根斯坦(1944)认识到不仅要考查参与人独立决策的行为,还要考察参与人之间任何可能的结盟行为,联盟博弈正是在这一点上与非合作博弈分析相区别,这样联盟博弈的概念出现了。[7]联盟博弈均衡指的是博弈处于这样一个独立决策或者联合决策的组合:没有任何参与人或者任何参与人同盟愿意采取独立行动或者联合行动(除了通常的博弈行动和策略外,还包括在同盟成员之间收益分割)以改善自己或者同盟成员的报酬,这种博弈均衡称之为核。[8]一场博弈要出现联盟博弈之核,基本条件一是要存在非空集的核,这是合作和联盟巩固的基础;二是要实现信息的充分交流,这种信息交流首先是指具备非合作博弈的完全信息条件,同时还指在这个基础之上拟联合行动的各方对联合行动的共同收益分配的讨价还价;最后还必须实现联合行动各方之间的完全信任,即实施联合行动方案时其中的每一方都相信其他方也会执行联合行动方案规定的任务。显然,实现联盟博弈均衡有比较高的信息要求。苏比克和夏普利(1959,1967,1971/1972)在埃奇沃斯和范·诺依曼的工作基础之上建立了竞争市场联盟博弈模型,把市场竞争均衡和市场价格的形成放在了众多的买者和卖者单独选择和联盟行为的基础之上。[9-11]
二、合作实现的联盟博弈分析
(一)合作与一念之差——猎鹿还是逮兔?
这里,甲乙双方是精诚合作还是各干各的,可以用猎鹿、逮兔博弈来描述。甲乙两个猎人围猎,围住了一头鹿和若干兔子。他们各自面临的问题是集中精力精诚合作捕获鹿,还是去抓住从自己身边溜逃的兔子。如果其中一人去抓兔子,鹿将乘势逃走,另一人如果仍在捕鹿将一无所得,当然他也可逮兔子则可以得到一只兔子。图1的博弈矩阵描写了这场博弈。
甲的行动对应于行,乙的行动对应于列。框中每一个单元给出的两个数字对应甲和乙的行动组合下每个人的收益,第一个数字是甲的收益,第二个数字是乙的收益。例如,第二行第一个单元,甲逮兔乙捕鹿,甲得2,乙得0。这场非合作博弈均衡有两个,一个是两人合作捕到鹿,另一个是两人都去逮兔各得一只兔。由于每个参与人单独决策,非合作博弈分析到此为止,不能给出两个均衡中哪个更稳定或者更可能发生。现在,允许两人事前充分的交流,互相打气,绝不为瞬间的一念之差所动摇,齐心合力捕捉鹿。这样非合作博弈转化成联盟博弈,允许结盟、联合行动,也就是双方可以充分沟通明晓事理,讨论清楚联合行动(包括如何瓜分胜利果实)是否可以最大化各自收益。在这场博弈中有一个唯一的联盟博弈的核,即双方都捕鹿,这是符合双方各自利益最大化的结果。众所周知的比尔·盖茨及其伙伴创业的故事就是一个典型的捕鹿还是逮兔的故事。1980年以前,软件只不过是由计算机制造商免费附带提供的。而高中时代的盖茨与艾伦在西雅图寄宿制湖滨中学(Lakeside School)相遇。两人都非常喜欢计算机和编程,如果他们单独发展都可以成为优秀的软件专家(兔子),但他俩不顾前景的模糊,合作成立一家小公司,发展成今天著名的微软公司,并由此开创了独立于计算机制造业的巨大的软件产业(鹿)。结论:结盟关系的基础是双方采取合作行为应该能够提升各自的得益,同时,为达到采取联合行动的结果双方应该充分地沟通,锻造相互信任,避免一念之差损害互信。
(二)合作与诱惑——囚徒窘境的联盟博弈分析
现在讨论联合行动固然比分散行动对大家都好,但联合行动的结局却不是稳定的,即不是纳什均衡,存在着诱惑,偏离同盟者而不合作之有利益。这时甲乙双方的关系可以用囚徒窘境博弈来描述。即甲和乙面临的博弈矩阵如下:
这个博弈矩阵的损益除了一个参与人采取合作,另一个参与人采取不合作的结果与上一博弈不同,其余都相同。(合作,不合作)策略组合下之所以不合作者所得较多为5,合作者所得较少为1,可以看成是不合作者享受着对方提供的种种优惠条件而自顾自有损对方利益。这就是一个典型的囚徒窘境,明明双方结盟对大家都好,各得4,但存在着偏离的诱惑5,这个结局不稳定。稳定的结局(纳什均衡)却是双方都采取不合作的行动,各得小的收益2。
囚徒窘境一次博弈只有一个唯一的纳什均衡就是(不合作,不合作),合作行为不会发生。不过,重复囚徒窘境的逻辑分析和实验研究表明,在无限次囚徒窘境博弈中博弈均衡丰富多彩,除了始终(不合作,不合作)仍为一个纳什均衡外,还可以有很多发生合作行为的博弈均衡存在。例如,双方都采取针锋相对的策略是一个实现长期合作的纳什均衡,即每一方都这样做:第一次采取合作行为,以后各次视上一次对手的行动而定,上一次对手合作那么这一次自己就合作;上一次对手背叛(不合作)那么这一次自己也背叛。由于重复囚徒窘境纳什均衡的多样性,那么把非合作博弈的单独决策强化到联盟博弈,可以考虑参与人之间的联合行动,也就是考虑博弈双方可以事前进行充分的交流意见,细致地讨论并明晓各种行动和策略包括联合行动的利弊,建立背叛惩罚机制,提升相互信任水平,抵御不合作诱惑,追求长期利益。那么,双方坚持合作的结果可以出现。进化博弈的研究表明:如果双方的信任水平可以提升到同胞关系,几乎可以抵御任何巨大的诱惑,那么,可以实现稳定的合作关系。[1]国与国之间的贸易关系也是一个典型的囚徒窘境:对进口货物征收高额关税,贸易对手也这样做,双边贸易只能是一个低水平;如果双方增强互信追求长期利益,建立自由贸易区,那么,双边贸易达到高水平,并有力促进双方经济。
重复囚徒窘境联盟博弈分析的启示首先再次肯定了猎鹿博弈讨论的结论:合作关系的基础是双方都采取合作策略应该能够提升各自的得益,同时,为获得采取联合策略的结果双方应该充分地沟通,煅造相互信任,采取联合行动。其次,这个讨论表明在处理双边关系问题中要注意区分短期诱惑和长期利益,以追求长期利益为重。再次,要用自己的行动对背叛者进行实实在在的惩罚,让对手吸取教训,建立起有效的惩罚机制以维护同盟。
(三)主动合作者——大猪
如果两方的地位不对称,劣势方多了一层顾虑:担心合作后受欺负,那么上述讨论的条件即使已经具备,信任仍然难以建立。这时要求优势方采取主动行动,先行示好,锤炼相互信任、实现长期合作。这种情况可以看成是一场大猪小猪博弈,优势方是大猪,劣势方是小猪。
这个博弈是说,一个猪圈里关了两头猪,一大一小。猪圈一端装有一个开关,猪嘴一拱开关启动,猪圈另一端的食槽里注满6个单位猪食。拱开关的猪来回跑动耗费2个单位的劳动,大猪吃得快、小猪吃得慢。谁去拱开关呢?两个都不拱,双方收益都没有改进;小猪去拱,大猪已把猪食吃了许多,自己只能吃到一个单位,扣除拱开关的消耗,净收益是负数。这里把主动示好看成是去拱开关,不主动就是不去拱开关。那么,图3的博弈矩阵描述了这场大猪小猪博弈。
这场博弈只有唯一的纳什均衡,即大猪拱、小猪等待。双方的收益都有改善。当然,小猪改善的多些,大猪的少些。这个解有个毛病,小猪搭便车。生活中经常听到这样的故事:村子修一条路对全体村民都有好处,但凑不出钱,往往是发了财的老板(大猪)出钱把路修起来了,为全村做了好事,也方便了自己。用联盟博弈的思想分析问题,该博弈的核也是大猪拱、小猪不拱。大猪去拱小猪不拱,大猪吃3,扣去来回跑动的损失2还净得1;小猪吃3。本来,一个拱另一个不拱的双方总得益都是4,高于其它状态下的利益总和,双方可以协商各方都愿意接受的一个分配计划。比如说,小猪去拱大猪不拱,小猪吃5,扣去来回跑动的损失2还净得3;大猪吃1,这样也可以调动小猪的积极性。不过,这个结局对于存在着一个诱惑:大猪突破分配份额多吃,小猪担忧自己去拱,大猪不守约。因此,在一次博弈中不可能成为均衡。当然,放到重复博弈中去考察,如果这次大猪多吃了,下次小猪不拱惩罚大猪,形成惩罚机制,同时大猪也建立一个守约的信誉,那么,小猪拱大猪不拱也可以成为一个联盟博弈均衡。
三、合作发展的关键——信任
从上述分析中得知:通过交流实现充分的了解是信任发展和深化的前提条件,而信任则是合作的坚实基础。按照信任的程度可以把信任关系分为,陌生人关系,双方一无所知;知晓关系,了解对方的一些基本情况;同事关系,双方接触较多,对对方的性格也有所了解,可以借小笔钱给对方;一般朋友关系,可以自发地相邀进行娱乐,互相帮助;知己关系,在一定条件下或者一定时期内可以对对方做出一些牺牲;同胞关系或者配偶关系,可以在一起生活、追求幸福,共享荣辱。在这些关系中越靠前者信任水平越低,越靠后者信任水平越高。而信任水平的自发提升在一次交易中难以实现,只有在反复的长期的打交道过程中,双方不断交流信息,增进了解,形成违约惩罚机制,建立信誉,不断提升信任水平。
随着人类社会的发展,人们创造了各种方法或者制度来提升人们之间的信任水平,以促进合作。第三方监督是促进信任程度发展的基本制度。陌生人打交道,信任水平很低,人们担心上当受骗,很难发生广泛的合作。最多就是即时合作,也就是看得见、摸得着,一行动各自的收益马上到手。这样,很多发展共赢的机会失去了。但引入第三方监督机制后,人们对违约的担心大大减少了。两个陌生人交易,订立合同,请一个有权威的第三方监督执行,一旦违约,由第三方强制执行合同或者对违约方进行惩罚。由于交易方相信如果对方违约,第三方将介入干涉,违约带来的损失不会发生,陌生人之间交易也可以发生了。第三方可以是领导、族长、法院、政府等。当然第三方监督也会有成本发生,也应该注意维护自己的信誉。不过,社会层面的第三方监督,比如政府、法院有明显的规模经济优势。对于一次性博弈和非对称博弈来说,第三方监督和惩罚显得尤为重要。由于第三方的介入,弱者对强者违约的担心和猜疑大为降低、甚至消失,一次性交易或者弱者对强者的交易也可以达成了,合作向深度和广度发展了。
人类社会的不断发展,进入了现代法治社会,第三方监督成为普遍的形式。人们之间的相互信任发展为对第三方监督的及时性、公正性和有效性的信任,私人之间的信任发展为社会法治制度保证基础上的信任,原来同胞关系才可以开展的合作,现在陌生人之间也可以开展合作了。这样,人们之间的交易与合作也就发展到了新的高度,社会经济的发展也就获得了更大的动力。由此可见加快法制建设对于现代信用社会建设的重要性。
四、总结
以上分析所得基本结论有:实现社会和谐相处共同发展的基础是博弈结构要存在非空核。这里包含两层意思,其一是指合作的结果应该是合作各方利益的总和大于不合作时各方利益的总和,这是实现共赢的基础,其二是说合作的总利益在各方之间的分割应使任一方所得都大于等于不合作时的报酬,要让合作以后各方的利益都能得到提升。各方应以长期利益为目标,不要为一念之差和一时利益所动,坦诚相待,主动采取合作行为;对于破坏社会和谐、民族团结的行为,要及时地进行惩罚,要让偏离合作的行为变成得不偿失,把合作置于坚实的基础之上。特别重要的是,要克服地理、语言、习俗、文化、宗教信仰等各方面的隔阂,大力利用媒体、人员往来、公平贸易等各种手段实现充分的信息交流沟通,消除猜疑、误解、偏见,加强相互信任。实现充分交流、完全信任不得不付出代价,有时可能是一件长期艰苦的任务。具有优势的一方,在维护社会和谐方面具有采取主动行动、先行示好的责任,只有这样才能实现各方自觉自愿采取合作行为、结成牢固的同盟关系,自觉维护人民团结和社会和谐、追求共同发展。必须进一步建立健全法制,促进社会正义公平,为合作发展、社会和谐创造良好的制度环境。
[1]MARTIN J. Osborme: an introduction to game theory[M].Oxford:oxford university press,2010.
[2]FLOOD,MERRILL M. Some experimental games [J].management siences,1958/1959: 5-26.
[3]FUDENBERG, DREW, ERIC S,etc. The folk theorem in repeated games with discounting or with incomplete information[J]. Economitrica,1986:533-554.
[4]FUDENBERG,DREW, ERIC S,etc. on the dispensability of public randomization in discounted repeated games[J]. Journal of Economic Theory,1991:428-438.
[5]AXELROD,ROBERT. more effective choice in the prisoner's dilemma[J]. Journal of Conflict Resolution,1980:24,379-403.
[6]AXELROD, ROBERT. Evolution of cooperation[M].New York: Basic Books,1984.
[7]VON NEUMANN, JOHN,OSKAR MORGENSTERN. Theory of games and economic behavior [M].Princeton, NJ: Princeton University Press,1944.
[8]GILLIES, DONALD B. Solutions to general non-zero-sum games [J]//AWTUCKER, RDLUCE.Contributions to the theory of games. Annuals of Mathematics Studies. Princeton, NJ: Princeton University Press,1959:47-85.
[9]SHUBIK, MARTIN. Edgeworth market games[J]// AWTUCKER,RDLUCE. Contributions to the theory of games. Annuals of Mathematics Studies. Princeton, NJ: Princeton University Press,1959:267-278.
[10]SHAPLEY L S,MARTIN S. The assignment game Ⅰ: the core [J]. International journal of game theory,1971/1972:111-130.
ACoalitionGameAnalysisofCooperationBehavior:ToDiscussBasicElementsofSocialHarmony
SUN He
(College of Economics and Management, Yunnan Agricultural University, Kunming 650201, China)
Cooperation is a main tune of human society development, and people expect to cooperate for two-win and societies pursue to live in harmony. Alliance games require high information completion, and not only the information in complete information games, but also the information of actions and policies of game partners and if they follow the agreements to united actions and benefits distributions. Therefore, to compare alliance game analyses with non-cooperation games analyses can reveal the importance of full information communication and mutual credibility. This paper explores basic conditions of cooperative behaviors with alliance game analyses. Those basic conditions are summed as follows: Non-empty cores exist in games, and that is, the basis of cooperation should be to carry two-win and any participant in cooperation can get more benefits than not cooperate. There is high information completion, and in other words, each participant can enjoy the openness and full communication of information. To always persist in to pursue long-run interests rather than short-run temptations. It is necessary to penalize default behaviors. Solid mutual credits should be built on full communication and open information. The supervision from the third party is important for cooperation development.
cooperation behavior;social harmony;alliance game;credit;the third party supervision
F 01
A
1004-390X(2012)05-0035-05
[11]周惠中.微观经济学[M].上海:上海三联书店,2003.