一位“走上歧路”的经济学家
2017-04-07卢周来
卢周来
二0一六年十二月十三日,诺贝尔经济学奖得主、著名经济学家、战略学家、美国马里兰大学教授托马斯·谢林(Thomas Schelling)辞世,享年九十五岁。我写作此文时距离谢林辞世已经月余。这一个月中,我留意到,与国际学术界对谢林的高度评价和连篇累牍的文字纪念不同的是,中文世界几乎没有什么反应。包括问及几位圈内人,竟然有人不太清楚这件事;而谢林曾经到过中国讲学这件事,就是从事博弈论研究的国内学者,都一无所知。于是,我觉得我的确有责任写点文字,以图让更多人了解这位学界泰斗级人物,并纪念这位受我和朋友之托、为中美学术交流付出过巨大努力的可敬老人。
打开马里兰大学公共政策学院网页,在其最显著位置,至今仍然是“纪念谢林”专栏,专栏开头是这样一句话:“罕有人能同时对真实世界和公共政策研究领域产生如此深远的影響,而谢林却做到了!”这句话,我认为是对谢林最到位的评价。
由于从事防务经济学研究的原因,我最早了解托马斯·谢林,是其在服务于美国国防部、参谋长联席会议和兰德公司时提出的战略威慑理论。所谓战略威慑,是指冲突中一方采取有效方式影响对方决策,并期望借此影响对方对自身行为预期判断的行为模式。谢林认为,冲突主体之间战略威慑运用的微妙性,类似于著名的“勇敢者游戏”:在一条长长的、笔直的大道上,两辆汽车分别从两头出发,以飞快的速度面对面疾驰而来;此时,每辆车的车主一方面都希望不会发生两车直接碰撞以致车毁人亡的悲剧,但另一方面又都希望对方能首先避让,以使自己获得“勇敢者”名声。然而,有趣的是,在这种“勇敢者游戏”中,车毁人亡式悲剧发生的概率的确很低。而获胜的一方,从来都是有办法让对方明白“在任何情况下我不可能选择避让”的那一方。谢林分析道,一旦有一方通过某种行为率先准确地传递了“任何情况下都不避让”的信息,另一方最后时刻总会选择退让。这是因为,即使成为游戏中的“胆小鬼”,也毕竟略胜于车毁人亡。由此,谢林认为,当实力相当的双方发生利益冲突时,既要保证己方利益,同时又不想将冲突进一步发展为两败俱伤的战争时,双方一般都会运用战略威慑行为,以迫使对方能够让步。而冲突双方谁能通过战略威慑获得更大的相对利益,则取决于给对方的战略威慑的“可置信程度”。一旦对方认为你的威慑是可信的,即在任何情况下你都不会选择退却,那么为了避免更坏的结果出现,对方会选择让步。
由于谢林长期服务于美国军方,因而,他提出的战略威慑运用理论,一直深深地影响着美国的外交政策与军事斗争领域。在冷战时期,美国与苏联长期处于冲突的状态,但却从来没有酿成战争,但并没有妨碍美国国家利益的扩张,实际上就是运用战略威慑的结果。尤其在处理著名的古巴导弹危机过程中,谢林作为危机处理团队成员,直接参与了决策咨询。他和成员们提出,要公开让全世界都知道,要么苏联人撤走部署在古巴的导弹,要么美国将不惜任何代价,包括升级为核战争的代价,也要对这些导弹进行空中打击,舍此之外美国没有其他任何选择。为了使这一“承诺”变得可置信,谢林等人建议,肯尼迪政府必须通过公共广播电视系统和公开声明,把这一“承诺”周知全体美国人、苏联政府以及国际社会。这种公开的做法就是告知对方:“我已经将自己置于一个不可能再有其他选择的地位,否则这届政府在美国和国际社会将失去所有信用。接下来就看你的啦!”于是,为了避免冲突演变为核战争,苏联政府最后时刻选择了退却。这是“可置信威慑”战略应用的一个真实范例。
谢林提出的让对手让步的策略,后来又被称为“边缘政策”:冲突中的双方尽管没有真正同归于尽,但却是以一方将自己摆在“不惜同归于尽”的位置上才化解困境的;在两个国家之间,尽管没有发生全面战争,但却是以处于战争边缘甚至有限战争来化解战争的。谢林提出的这一政策主张,后来被大国广泛用于外交、国家安全、核战略以及军控和裁军等领域,在真实世界中发挥着巨大影响力。在某种意义上,谢林作为学者,与政治家一起,塑造了冷战前后的世界格局。
与政策层面的影响一样,谢林在理论研究层面的贡献同样深远。在其经典著作《冲突的战略》一书中,谢林将其战略威慑理论系统化,首次定义并阐明了互动决策、可置信承诺、战略移动等概念,对讨价还价和冲突管理理论做了非常细致的分析,为后来经济学领域发展起的合作博弈理论奠定了基础。特别是其“不可置信的威胁”启发了德国经济学家舍尔顿(Reinhard Selten),后者提出的“子博弈精练均衡”概念就脱胎于此。仅在这一点上,谢林至少可与纳什比肩。后者的贡献主要是在“非合作博弈”领域。也正因此,二00五年,谢林被授予诺贝尔经济学奖,原因是:“通过博弈论分析改进了我们对冲突和合作的理解。”
但如果仅仅把谢林的贡献定位为发展起博弈论的一个分支,还远远不够。一九八0年,在为《冲突的战略》一书再版作序时,谢林明确写道:我之所以写作此书,主要目的是为了建立起一个跨学科领域,该领域可称为“冲突理论”。足见谢林本人的理论兴趣远超乎博弈理论,而是把目光投向一个更为广阔的领域。
我们都知道,自亚当·斯密以来,西方主流经济学都是关于交易的经济学。从最基本的层面看,交易经济学所告诉我们的,还是斯密在两百四十多年前就已经给出过的理论:在交易过程中,追求自我利益最大化的经济人,通过一只“看不见的手”的引导,不仅增进了自己的福利,而且增进了公共福利。“只要是自愿的交易,肯定能实现由自利到双赢!”人们常将这一理论称为“斯密信条”。主流的交易经济学也因为论证“斯密信条”而给我们勾画出一个没有冲突且还能不断进步的市场社会图景,即“斯密世界”。
谢林的贡献在于,他注意到现实世界中冲突无处不在。与“斯密世界”相反,在冲突的世界中,自利行为并不能增进集体福利。相反,一方在冲突中多得到一份福利,意味着另一方同等份额的丧失,这就是“零和博弈”。而更极端的情况,自利的选择最终将导致“双输”,最典型的案例就是“囚徒困境”。当然,谢林更注意到一种情况:冲突双方的博弈其实往往带有非零和的性质,此时,双方可以通过讨价还价达成协议,无论产生哪种协议,都比没有达成协议要好。因此,管理与处置冲突的战略或艺术就非常重要。而谢林试图通过自己和他人的努力建立起“冲突理论”,其意义也在于避免现实世界利益冲突最终酿成“双输”局面。
谢林本人当然未能完成建立起完整的“冲突理论”这一宏愿。在八十年代他也已意识到,建立“冲突理论”仅靠他本人不够。所以,在《冲突的战略》再版序中他写道:“尽管我致力研究的领域可能不会突飞猛进,但是我相信将会有更多有志之士投入到这一领域的完善和发展之中。”而现实也正如他所预料的一样。八十年代初期,著名的数理与计量经济学家英特里盖特(M. D. Intriligator,《经济学手册》总主编)正式提出应当建立“冲突经济理论”。此说得到经济学家赫什利弗(J. Hirshleifer)响应。后者在八十年代末与九十年代初首次将已有的成果进行综合,提出“冲突经济学”概念与体系。他认为,“冲突经济学”应该与“交易经济学”一起,构成微观经济学的两个平行分支。前者研究基于双方均势基础之上的交易与互利行为,而后者研究基于单边优势基础之上的斗争与互害行为。两个分支都具备相同的标准的经济理论要素,但也存在诸多不同。首先,预设的前提不同。传统的交易经济学关于理性经济人、完全信息以及市场出清假设,在冲突经济学中相应地变成了“机会人”假设、不完全信息假设。所谓“机会人”假设,赫什利弗又称为“马基亚维里定理”,是指冲突背景下局中人不会放过任何有利可图的剥削他人的机会。其次,研究的工具不同,主流的交易经济学使用的是价格理论。而冲突经济学主要使用博弈理论(Game Theorem)。再次,研究的重点不同。主流交易经济学是研究生产的技术。即在生产或消费过程中如何合理配置资源;而冲突经济学研究的是斗争的技术,即研究如何将资源配置于斗争性努力与生产性努力之间,以赢得竞争中的优势。最后,研究的结论不同。主流交易经济学的结果是“瓦尔拉均衡”,即总能找到一组价格使交易双方都满意。冲突经济学的结果则是“纳什均衡”:“在给定条件下,你不动我也不动,你动我也动。”
当然,时至今日,“冲突的理论”或“冲突的经济学”也未能与交易理论一样成熟,而且与谢林建立起跨学科性质的“冲突的理论”这一初衷也不完全合拍。但无论如何,它为我们开拓经济学的新疆域指明了方向。而这一新疆域的首先发现者和开拓者,就是谢林。因此,把谢林的理论贡献仅限于博弈论,的确有些委屈了这位有着更宏伟抱负的思想者。
理解谢林的学术观点,“聚点”(Focus Point)这个概念极其重要。
用非学术语言讲,“聚点”就是利益冲突的各方认为各方可能达成妥协的利益分割点的交集。或者说,在这一点上,一方认为另一方会接受这一解决办法,而另一方也的确会接受。
但如何才能达成“聚点”是个大难题。仍然以“勇敢者游戏”为例。这个游戏之所以能玩下去,一个前提仍然是理性的双方都知道必须避免迎面撞上导致车毁人亡。也就是说,“不直接相撞”是这一游戏的“聚点”。两个冲突中的国家也一样:“不战”是双方最后默认的交集即“聚点”。只有在不撞与不战的情况下,才谈得上谋求利益最大化。但矛盾的是,为了谋求利益最大化,又必须使用“不惜一撞”与“不惜一战”的边缘政策。在这里,“边缘政策”是达成“聚点”的手段。但“边缘政策”的控制本身就成为突出问题。謝林自己承认,边缘政策有时非常难以控制,因为只要稍微过度,就会越过边缘界线,就会导致“同归于尽”的实质性行动。“边缘政策”之所以难以控制,谢林提出的理由又有两点:首先是“错误的感知”。即双方都可能误会对方真正的想法,都认为对方一定会避让,结果车毁人亡。其次是理性未必可靠。“勇敢者游戏”假设的一个前提是,车手都是理性的,认为生存比荣誉更为重要。但在现实中,并非所有人都有这种理性,恰有人就把荣誉看得比生命还重要,其中也包括恐怖主义与宗教激进力量。
为了避免这种局面出现,找到双方能接受的解决方案的交集即“聚点”,谢林提出了两种途径:默式谈判和显式谈判。前者依赖于冲突各方之间事前建立起的“默契”,包括共享经验、文化与认识。在国际关系中,为了避免国家之间利益冲突转化为战争,必须建立起国际法体系。而国际法体系实际上是各方共同遵守的一种规则,也是共享的一种安排。在人际关系中,为了避免利益冲突造成“囚徒困境”式“双输”结局,道德与信任非常重要。而道德与信任也是一种“默契”,是一种“习惯法”。显式谈判的方式则有两种:调解(Mediation)和沟通(Communication)。谢林认为,如果参与人可以相互沟通,那么他们就可以当面进行讨价还价,告诉彼此自己将采取什么行动,行动的边界在何处。并且通过“分级协调”,相互妥协至双方能够接受的解决方案。如果参与人之间无法沟通,则可以由第三方出面进行调解。这个第三方,在国际关系中,可以是联合国,也可以是能够为冲突各方接受的中间调停国。在有利益冲突的私人之间,这个第三方可以是中间组织,也可以是有威望的第三者,促成双方达成互谅。
从谢林关于“聚点”及如何达成“聚点”的论述,我们可以看出其方法论与主流经济学有着很大的不同。
在与谢林的交谈中,我曾专门问及谢林对主流经济学的看法。他似乎对此问题不感兴趣,只是简单地回答说:“我不是经济学家,我是研究个体或集团行为的。”他还建议我看看《冲突的战略》之外他另外两本著作,即分别出版于一九七四年的《微观动机与宏观行为》和一九八四年的《选择与结果》。而如果读完他推荐的两本著作,我们就会发现,谢林几乎没研究过经济问题,而是研究了我们常见的社会问题和国家行为,包括军事战略、军备控制、能源和环境政策、气候变化、恐怖主义、团体犯罪、外交援助和国际贸易、种族隔离和种族融合、军事计划、健康政策、烟草制品、毒品走私、婚姻关系、棒球比赛、排队现象等等。
当然,在经济学界,研究诸如犯罪、婚姻、吸毒、投票等个体行为,并不是谢林的“专利”,恰是长期占据经济学主流地位的新古典经济学家所热衷的事。如加里·贝克尔等人。这种越界行为曾被称为“经济学帝国主义”。但同样是研究行为,谢林与主流经济学家在方法论上最大的区别在于:后者均基于经济学中“理性经济人”假说,即无论是企业(或政治集团)还是个体,其行为都是为了追求自我利益最大化,而且因其足够理性,也知道如何实现自我利益最大化。而谢林不同,他是把自己的研究建立在人的现实社会性基础之上,并明确反对前者的做法。因为在现实生活中,“大量存在标准理性模型并不起作用的地方”。
谢林区分了三个层面讨论“理性”问题。
首先是个体理性。谢林写道:“在经济学中,个体的理性决策是一个被充分讨论的领域。”然而,“个体决策不可能完全根据理性的推测,假如个体指的是活生生的人的话”。原因是,“在单个个体内部,有可能存在一个神经、大脑和身体化学反应的系统,能够交替产生不同的‘个体,哪一个也不是唯一的人或自我”。“两个或者更多的自我交替支配同一个个体,它们有着不同的目标和品位,即使每个自我都积极地看待其他自我,也不得不解释为战略博弈,而不是联合优化。”且与不同个体之间的冲突可以通过沟通与调停达成一个理性方案不同的是,在单一个体内部,“由于不同的自我不能同时到场,所以很难在不同的自我之间进行调停”。因此,“我们不能指望,个体在对那些可以引起不同价值判断的事务进行选择时会表现出理性决策的应有品位来”。
正因为个体内部存在不同“自我”,所以,任何个体的人都有其“人与兽”的两面。而为了解决这一矛盾,谢林明确提出了道德与自律的重要性。道德与自律作为外在的“非正式社会安排”,可以压抑个体内部不同“自我”之间的冲突。也因此,正如著名的博弈论学者拉斯缪森(Eric Rasmusen)所评论的那样,在谢林所研究的合作博弈中,“道德因素是现实的。因为人们经常是道德的,至少假装如此。人们经常按照他们认为代表圣洁的行为准则去做。即使以金钱为代价。在讨价还价的实验中,即使参与人被赋予提出‘接受或放弃方案的权利,但他往往提出大家平分的方案。有可能这是因为他崇尚公平,或许是他害怕自己拿走大部分收入时,对手及社会投来的鄙夷的眼光”。也是从这个意义上讲,在道德与自律框架约束下,“真小人”被迫在行动上不得不“伪装成君子”,不敢放肆干坏事,甚至不得不跟着做一些好事。这本身是一件好事!
其次是集体理性。在主流经济学那里,“阿罗不可能定理”已经揭示,即使个体是理性的,也将因为各自“偏好”的不同,而无法达到决策上的集体理性。对此,谢林认为,个体即使行为符合理性假设,尚且无法达到集体理性,何况个体本身就是矛盾体?所以,那些把企业和其他组织行为都视为“最大化”的观点,在理论上都是靠不住的。如何解决集体“非理性”行为导致的冲突呢?谢林认为需要国家与立法,以“外在权威力量的介入建立起一个管理冲突的系统”。这实际上与“阿罗不可能定理”的现实含义是一致的。
第三个层面就是国际关系的“理性”。当然,国家是“集体”的更高形式。正如前面已经介绍的那样,国家间行为更是不可捉摸,更谈不上“理性”。为了达成“聚点”,谢林认为,国家间更需要沟通。他率先建议,在美国和苏联两国首脑之间设立“热线”以方便沟通,这一建议在一九六三年成为现实。谢林还提出,为方便调停,要维护联合国这样的机构和各方公认的国际法的权威。
总之,尽管当年在维护美国利益中,谢林提出过“战争边缘政策”这一看似强硬派的主张,并且影响了冷战格局,但总体上,在方法论层面,谢林是个“秩序主义”与“和平主义”者。与主流经济学迷信个体自由决策不同,谢林更笃信道德与信任,更强调国家与法律,也更主张沟通与调停。正因如此,谢林曾经称自己是“一个走上歧路的经济学家”(an Errant Economist)。当然,也正如诺贝尔奖对他的评语所言:“谢林,这位自称‘走上歧路的经济学家,被证明是一位非常杰出的、具有开创性的探险者。”
听闻谢林辞世的消息后,我花费了一些时间,从过往的记忆以及过往资料中,找回九年前我与他在湖南长沙交流的一些细节。
二00八年初,我与国防科技大学时任社科系主任曾立教授一起,策划并邀请了谢林的长沙之行。曾立是一个有学术热情同时又有行動能力的学者。我们一起致力于中国防务经济学科的发展,我们都特别强调中国防务经济学科必须能够与国际一流学者对话。他最先提出了邀请谢林来中国访学的想法。我非常支持但却认为可能性不大。原因有三:其一,谢林当时已是八十多岁高龄。按中国民间说法,这个年龄的老人都不应该在外面过夜;其二,当时邀请国外诺贝尔奖得主来中国讲学的论坛不少,但都是主办方出面邀请,且有雄厚的资金支持,而我们以个人名义邀请,以微薄的课题费支撑,这非常困难;其三,谢林本人长期为美国军方服务,即便我们不对他的身份敏感,他个人也未必愿意来中国。
未料,曾立很快把这种个人行为付诸行动。而谢林几乎毫不犹豫就答应了。于是,在谢林到达长沙的当日,我也从北京匆忙赶过去,与这位我一向尊敬的大学者见面。
一开始我们的交流并不十分顺畅。我们仍然只是出于学术的考虑,希望来到中国的谢林讲讲他为之做出了原创性贡献的博弈论领域,讲讲非零和博弈,尤其讲讲防务经济学或冲突经济学。但出乎我们意料的是,在中国的几场演讲,他讲的就一个主题,即核控制与军备控制。而且,谢林还声称:近些年他一直在研究如何达成和平问题。甚至在回答听众询问的一个最为学术性的问题“到底如何理解你提出的‘聚点概念”时,他避开了学术解释,直接回答说:“国家关系中,‘聚点就是和平。”
行程中我们特地在他下榻的长沙五华酒店安排了一个小范围讨论。几天来除了演讲少有言谈的这位高龄老人,竟然滔滔不绝地说了一个半小时。大概是担心我有语言障碍,在这一个半小时中,他反复对我强调的就一个观点:核武器的使用应该成为人类的一个禁忌;对有核国家核武器的有效控制极端重要;而相对于美国在核控制方面自身都做得非常不好,中国在核武器控制与使用原则方面为世界树立了榜样;未来全球核控制有赖于中国,而中国也有能力有责任在其中担负更重要的角色。
在与谢林的交流中,我们还谈到了推动两国国防经济学界的沟通与交流。谢林回国后,就一直积极促成此事。近些年,已有多位国内青年学者前往他所任教的马里兰大学公共政策学院访学,他们如今在国内国防经济学领域均已担当大任,国际防务经济学界开始有中国学者的声音;而谢林的多位同事,包括曾担任过美国国防部副部长的雅克·甘斯勒(Jacqes S. Gansler)教授,也曾多次以学者身份到访中国,参与国防工业政策、武器装备采办、军民融合等领域的学术交流活动,增进了美国有关人士对中国防务政策的理解。
在长沙与谢林告别之后,由于某些原因,我们之间再没有过深入的交流。但这并不妨碍我此后一直在追寻谢林的学术足迹,试图更深刻理解谢林思想对于现实世界尤其是中国的意义。中国正在外部倡导建立一个和平世界。中国领导人申言,中国正致力于“打造人类命运共同体”。但要实现世界和平,中国就需要反对国际范围内广泛存在于冷战时代的“先发制人”、以武力相威胁的做法。因为表面上这可以使自己获得“先动”优势,并可以获得一种“恐怖平衡下的冷和平”,但最终却可能导致更为激进的扩张军备竞赛与更危险的极端行为。中国应该强调谢林提出过的主张,即无论存在多大的利益冲突,多进行沟通与交流,总胜于相互封闭与猜忌。
中国还在内部倡导建设一个和谐社会。在市场经济利益分化背景下,不同人群的利益冲突从来是客观存在的。谢林曾提出:“因为边缘政策所创造的风险是难以控制的,所以强者不要轻易考验弱者的忍耐程度。”因此,在出现利益冲突时,如果社会中占强势的人群,因为自己拥有强大的资源,同时认为弱者总会逆来顺受,就肆无忌惮,社会必然会走向动荡与不稳定,必然会导致“民粹主义”。这提醒我们,政府必须主动充当好利益协调者角色,强者必须懂得适可而止,懂得在必要时让步,中国社会才会真正走向和谐。