实验经济学方法在博弈论研究中的若干技术问题
2012-02-14王凌峰
王凌峰
0 引言
20世纪50年代欧美学界陆续出现一批将实验方法用于个体决策、产业组织乃至博弈论研究的代表性工作,经过近半个多世纪的发展,实验方法在社会科学(经济学、管理学、政治学、法学等)研究中已经得到广泛应用。由于实验方法在经济学领域应用最多、最广泛,因此习惯上将社会科学研究中的实验方法统称为实验经济学方法。2002年诺贝尔经济学奖颁给实验经济学家Vernon Smith教授,标志着实验已经成为社会科学的主流研究方法。
实验经济学作为一种研究方法正在逐渐改变我国社会科学领域的研究范式。自2003年以来,国内一批高校如南开大学、西南交通大学、上海交通大学、中国人民大学、浙江大学、东北财经大学等已成立实验经济学研究机构。2008年5月全国博弈论与实验经济学研究会在北京信息科技大学召开。近年来国内运用实验经济学方法进行的社会科学研究工作较之2005年之前明显增加[1]。
实验研究方法在社会科学尤其是经济管理研究的应用已经是既成事实。今天需要讨论与关注的不应该是实验研究方法在社会科学研究当中的必要性,而是应该讨论技术性问题,思考如何设计实验、如何进行实验研究,以尽可能提高实验经济学方法的预测效度、生态效度。
从技术角度讨论实验经济学方法的国内文章不多见,林嘉永总结了社会科学试验设计常犯错误如未使用完整无偏的讲解、未采用显著的货币报酬、未建立一个明确的比较基准、变量太多、未选择适合所研究问题的实验环境复杂程度等[2]。本文拟就实验经济学方法在博弈论研究中的应用(也即实验博弈)做一些讨论。
1 博弈论实验设计的若干技术性问题
1.1 被试的选择
Kahneman和Tversky在1979年研究中提出“10个被试中有7个人选择以25%的概率损失6000元,而非以50%的概率同等可能地损失4000元或2000元(意即各25%),尽管两种选择的期望值完全相同,而前者有更大的风险”结论。对此,有批评指出:根据一个容量为10的样本所做出的结论可靠性有多大?
这一批评是正确的,但是出现这种情况最大原因是研究经费不足,要进行几百上千个被试的实验需要较大数额经费,并非实验经济学方法本身的不足。当然这也提醒研究者在条件允许情况下,尽可能增加被试数量。
此外,在被试选择上,由于经费限制,大多数实验往往以学生尤其是本科生为被试。早期实验经济学文献中多个经典实验都以学生为被试,因此有人质疑结果是否反映了校园之外的现实。
对此需要区别对待。专业程度很高问题研究、研究专业人士行为的研究,需要尽可能以具有专业知识甚至实践经验的人士为被试,否则以一群中文系在读学生为主体的实验分析电力竞价市场的试验设计所得结果自然难以令人信服。除此之外的情况则不必对被试专业度做出过多要求,因为很多问题并不需要被试一定要有专业背景。条件允许情况下,各类代表性的被试都应该纳入实验当中,以尽可能提高实验结果的生态效度,比如研究股市效率,那么被试当中应该同时有一定比例的专业投资人士与普通股民,否则研究结论不具有足够代表性。
被试招募方式应该尽可能随机化。通常情况下进行的经济学实验被试都是自愿招募或者在课堂上随堂进行的学生群体,并非完全随机抽样。CATHERINEC.ECKEL、PHILIPJ.GROSSMAN发现,通常形式招募的志愿者与课堂时间上的pseudo-volunteer(学生群体)相比,在独裁者实验中psuedo-volunteers整体上更慷慨[3]。当然,在多大程度上做到将非学生群体与学生群体的完全随机抽样主要取决于实验经费多少。
1.2 角色代入
目前进行的大部分实验博弈研究由于经费限制,普遍以在校学生为被试,由于往往货币激励力度不大,当实验决策变量较多、决策心理成本较高时,学生容易出现应付了事,不愿意进行深入思考而作答的情况,必然影响实验效果。可能的两个对策是尽可能提高激励力度、增加被试数量。
此外,不宜人为指定某些被试扮演某个角色或者拥有某些博弈起始资源,最好首先进行某种测试或者某个任务,使被试付出某种劳动之后获得实验当中某个角色或者某些资源,以增强被试对自身角色代入感,激励刺激被试更投入的参与实验。
1.3 非任务变量的控制
Edgar Vinackea将社会科学实验变量分为三类[4]:(1)任务变量;(2)情景变量;(3)个体变量。
现实世界中个体行为的影响变量非常多,特别是个体差异明显,然而在博弈论形式化成数理模型时,一些心理学因素往往被研究者在个体同质性假设下剔除或抽象掉,这是使用数理方法研究博弈论的很多结论与实验结果出现系统性偏离的重要原因。
现有文献总结的影响个体决策的一些代表性个体特质变量大致有:年龄、性别、教育水平、家庭情况、社会地位、文化背景、大学所学专业、行为被他人知悉程度、体育运动强度、宗教信仰、认知层级、风险偏好、智力水平、认知闭合需要、公平价值观、权力与地位需求强度、个人外表与相貌等。研究表明,个体特质变量中相当部分由体内生化物质、基因决定,体内生化物质种类很多,举两例。
例1:催产素水平影响个体亲社会行为。美国Claremont Graduate Universtiy的Paul J.Zak研究表明[5],Zak和同事让被试分别服用催产素和安慰剂,然后进行独裁者博弈实验,服用催产素的人分给他人金钱比例高于接收安慰剂的人平均多出80%之多。
例2:血清素对个体行为的影响。剑桥大学实验心理学系Crockett MJ研究小组2007年以来对血清素(Serotonin,5-HT)水平对个体情绪、行为影响进行了系统研究,以博弈研究为主题的工作是2008年第320期《科学》杂志发表的《Serotonin Modulates Behavioral Reactions to Unfairness》一文,该文对最后通牒博弈中体内血清素水平不同个体对不同公平程度所得的不同反应进行了研究。研究表明,体内血清素水平较低的个体对不公平所得的拒绝率高于血清素水平较高个体,但是对公平所得的拒绝率无差异[6]。
个体生化物质水平等生理指标需要专业物理化学分析设备以及懂得操作,社会科学研究人员通常不熟悉,因此需要跨学科合作。当然,也可以采取变通做法,比如常见做法是通过各种心理学量表来间接确定个体特质变量水平。
再以体育运动强度变量而言,王大成的工作表明,在最后通牒博弈实验中,被试是否是体育爱好者对博弈过程和博弈结果影响显著[7]。体育爱好者扮演分配比例提议者角色时,给对方的分配比例平均比非体育爱好者扮演该角色提供的分配比例低16%。体育爱好者扮演接受者角色时,能接受的最低分配数额与非体育爱好者扮演接受者角色相比平均高出28%。
出现如此现象的原因可能是:个体能力差异在体育运动中体现得非常直观、强烈,而且这种差异的客观度与公平度很高(日常体育运动中使用兴奋剂的情况几乎不存在),因此体育爱好者更容易接受较大的收入分配差距。
1.4 全面采用试验设计方法
王维红、顾庆良指出[8],可控制性与可重复性是统计实验的基本前提。统计实验就是在控制某些变量的前提下,进行大量重复实验,观察实验结果,用样本推断总体。因此从数学上看,经济实验本质上是一种统计实验,从样本选择到用样本推断总体,都应遵循统计实验研究的基本方法和基本规律。
试验设计方法很多,如正交设计、均匀设计、超饱和设计等。从样点取样是否动态角度看,动态设计下一次样点取值的试验设计方法由于序贯、即时地考虑了每次实验的不同信息,实验效率较之传统实验设计方法大有改进,尤其值得关注。当然,动态样点取值的具体方法很多,根据实际情况(如试验设计效率、算法是否有实现程序等)选用[9]。
2 博弈实验结果的理解与应用
二战前后居于主流的传统博弈论研究以数理演绎研究方法为主要方法,基于个体同质性假设,提出不少解概念(就合作博弈而言)、均衡概念(非合作博弈而言),由此自然产生一个问题即数量众多的解概念与均衡概念如何选择?适用情形分别如何?这也就是博弈论研究中的所谓非合作博弈“均衡精炼”问题、合作博弈的解概念精炼问题。
均衡精炼、解概念精炼问题无法在传统博弈论框架内部得到解决,而需要框架之外的检验,这也正是实验博弈发展起来的根本原因。实验博弈研究表明,传统博弈论的个体同质性假设绝大多数情况下不成立,面对同一个决策情景,不同个体的决策不同,对应于合作博弈中的解概念、非合作博弈中的均衡概念可以是多个。
一个具体例子是Abbink,Klaus、Darziv,Ron、Gilula等人[10]采用了非合作博弈的序列理性均衡精炼概念、合作博弈的core解概念、合作博弈的shapley解概念、公平效用模型等4个均衡精炼与解概念对渔夫博弈问题分别求解后,再进行实验博弈,实验结果为:序列理性、core解概念分别正确预测了1种极端情形,而公平效用模型、shapley解正确预测了处于2种极端情形之间的中间水平情形。
由此可知实验博弈研究结果理解应用要注意的第一点是:由于个体异质性的客观存在,除了比较简单的博弈场合外,越复杂、不确定性越大的博弈场合,个体异质性表现就越突出。因此,对于实验博弈结果,往往只能够做出结论诸如对于一个什么样的博弈情景,多大比例个体会以多大概率做出某种决策与行为。
第二点是实验总结规律的性质与应用问题。博弈实验所得规律预测效度是实验博弈研究长期存在争议的一个基本问题。从统计学角度看,根据样本推断总体只有一定程度的信度(可靠性)和效度(有效性),因此实验经济学研究方法的“并行原理”当然存在犯错可能性,实验规律不是百分之百可靠,而是一种统计规律。进一步的,社会科学实验所得结果与规律究其本质是对于统计意义上生理、心理指标处于正常范围内的人口群体对特定情景反应行为的抽样调查与经验总结。
因此,将实验结果应用于现实经济中时,需要明确外推的情景与实验情景的主要变量一致、变量之间作用机制逻辑同构,结论不宜过度外推(比如不宜做超越于国别、宗教的跨文化外推),否则预测效度必然不佳。
[1]唐方方,宗计川.经济学实验室研究方法论述[J].财经问题研究,2009,(10).
[2]林嘉永.论经济学实验的科学设计[J].财经科学,2003,(6).
[3]Catherine C.Eckel,PhiliP J.Grossman.Volunteers and Pseudo-Volun⁃teers:the Effect of Recruitment Method in Dictator Experiments[J].Ex⁃perimental Economics,2000,(3).
[4]Edgar Vinackea.Variables in Experimental Games:toward a Field Theory[J].Psychological Bulletin,1969,(4).
[5]Zak PJ,Stanton AA,Ahmadi S.Oxytocin Increases Generosity in Hu⁃mans[J].PLoSONE,2007,(11).
[6]Molly J.Crockett,Luke Clark,Golnaz Tabibnia,et al.Serotonin Modu⁃lates Behavioral Reactionsto Unfairness[J].Science,2008,(320).
[7]王大成.体育爱好者缘何在就业市场上获胜——基于实验经济学的分析[J].中国成人教育,2006,(11).
[8]王维红,顾庆良.从统计学的视角看实验经济学[J].生产力研究,2008,(15).
[9]张礼兵.基于整数编码遗传算法的均匀设计表构造[J].系统工程理论与实践,2005,(12).
[10]Abbink,Klaus,Darziv,Ron,Gilula,Zohar,et al.The Fisherman's Prob⁃lem:Exploring the Tension between Cooperative and Non-coopera⁃tive Concepts in a Simple Game[J].Journal of Economic Psychology,2003,(24).