博弈论中的理性人假设研究

2016-12-19杜文晟

湖北师范大学学报(哲学社会科学版) 2016年6期

关键词：博弈论最大化效用

杜文晟

(湖北师范大学经济与管理学院，湖北黄石 435002)

博弈论中的理性人假设研究

杜文晟

(湖北师范大学经济与管理学院，湖北黄石 435002)

西方经济学的理性人假设被引入博弈论领域，但是在实际应用中出现了一些疑问。本文探讨了理性人假设在博弈中的试用性，以及理性的边界问题。

博弈论；理性人；效用

现代西方经济学一般认为“经济活动中的人是理性的，理性的人追求自己收益最大化，在任何情况下不会感情用事”为其基本假设。在20世纪上半叶，Von Neumann和Morgenstern的著作《博弈论与经济行为》在开创成体系的博弈论研究的同时，也引入了理性人假设，并且将此作为博弈中各方的共同知识。而随着博弈论作为西方经济学研究的主流方法的发展，一些理性的假设反而成为了获取最大利益的阻碍因素。同时期，诺贝尔经济学奖和计算机图灵奖的获得者Hebert Simon提出“有限理性”理论，试图从人的收益计算能力有限和感情用事不可避免这两方面来解释一系列西方经济学面临的问题。

一、理性和效用

早期经济学研究中，理性被简单看做可货币化收益最大化行为。而在Daniel Bernoulli研究了圣彼得堡悖论并提出效用的概念后，西方经济学便开始使用效用的概念来描述理性行为。据此产生所谓基数效用、序数效用、边际效用等一系列派别，其实质仍然是外部收益到个体需求满足程度的一种函数形式。西方经济学仍然坚持认为“理性就是不感情用事”。

应当说，这一认知是符合当时西方经济环境的。工业革命以后的西方经济以追求生产效率为主，这一诉求在福特发明流水线生产方式时使其达到顶峰。西方企业家普遍对工人实行严格的“科学管理”(来自泰勒斯的贡献)，工人或者劳动力被看做和土地、设备、资金等同的“生产要素”并不加以区分，并声称马克思所指出的剩余价值是由资本本身创造的，这应当是理性假设在西方经济学当中的典型表现。

不论是可货币化收益还是效用，本质上仍然没有将经济活动当中的人当做一个完整的人来看待。这样的效用定义是不完备的。

二、博弈当中出现的理性

博弈论作为现代西方经济学主流研究方法，公认成体系的研究工作开始于Von Neumann和Morgenstern合著的《博弈论与经济行为》，作者提出大部分经济行为可以看做博弈的结果从而西方的主流经济学开始大量使用博弈论，并几乎成为微观经济学的支柱。博弈论中递归地定义了共同知识：命题F1=“所有参与方都是理性的”，命题Fn=“所有参与方都知晓命题Fn-1”，其中n可以无限大。

(一)现实当中的个体理性与集体理性

论及理性假设在博弈论中的应用，最著名的自然是囚徒困境，体现了个体理性。囚徒困境经常在教科书上用来解释为什么追求收益最大化的行为会导致收益下降。但是教科书当中也提到，囚徒困境形成的条件：罪犯不能相互观察到对方的行为(无法通信)，对于背叛没有有效的惩戒手段，以及双方合作的次数有限性(次数可预期性)。因此，在这类博弈中“坚守同盟”或者“讲义气”的行为并不能看做是非理性，而很可能恰恰是(有前提的)理性使然。进一步的数学分析可以证明，当博弈次数可预期而又无有效的惩罚机制时，背叛是最佳选择。

另一个方面，一旦此类博弈进入长期重复状态(合作次数不可预期)，情况会发生变化。因为无法预知博弈次数，按照效用最大化原则计算，“坚守同盟”是最佳选择，此时无需“哥们义气”支撑。这仍然属于个体理性。用中国古话来说就是“生意不成仁义在”或者“做事留一线，日后好见面”。

(二)经济中的集体理性

对集体理性概念的审视可以通过研究合作博弈来做到。合作的达成需要的条件：1、个体参与合作比不参与合作(背叛)将获得更多收益或者个体确信合作收益的分配大于其保留成本。2、所有的合作收益均用于分配，或者每个合作者收益的总和等于合作收益。第二点被称为集体理性，因为无法分配合作之外的收益。

不论是早期西方经济还是现在的全球经济，合作是一直存在的，就像竞争一直存在一样。应当说从人类诞生起，合作和竞争就一直存在。在当下的现实经济中，合作的元素越来越突出，风靡世界的供应链管理就是一个例子。集体理性带来现实的经济收益是毋庸置疑的，维系同供应商、经销商、客户的良好关系，树立正面的企业形象，或者通过返还一部分利润给经销商来紧固彼此的合作关系，都是追求长期经济收益的理性行为。如果按照传统西方经济学的理性假设，这些都是不符合个体理性的，然而却符合集体理性。由此可见，集体理性是来自于长期的利益考量(重复博弈)，遵循的是长期利益最大化原则。短期内个体并未得到最大收益，但是长期收益超过其保留成本。

三、“非理性”行为的理性解释

(一)拒绝收益的行为

在完美信息动态博弈中，Binmore提出的最后通牒博弈(Ultimatum Game)常被用来说明人的非理性状况。参与人1和2共同分100元钱，首先1提出分配方案，如果2接受，那么按照方案分钱；否则游戏结束，谁也拿不到钱。如此反复下去直到分钱成功。按照理性人的假设，即使1要求分配方案是99.99:0.01，2也是应当接受的，这是这个博弈当中多个纳什均衡之一。但是真实实验中从来没有出现这种方案成功的例子，大部分是50:50或者接近。

具体分析，参与人1提出分配方案时候，应当对参与人2的态度有一个大致的估计。那么大多数情况下为什么当参与人1 提出一个显然不公平的分配方案时，参与人2会拒绝？学者一般从威胁的可信性和理性与非理性参与人之间判别来解释。但是我们认为，威胁的可信性应该被直接转化为效用来衡量，但是不能说明参与人的不理性。而且参与人行为的根源不在此，即使真的拒绝了99.99:0.01的分配方案，也不能说明参与人在意气用事。对于这个博弈来说，当拿到100元时候，参与人1和参与人2都会对自己的收益有一个预期(大于0)，按照西方经济学的理性人假设，理性人只要收益稍微大于0就会接受方案。但是同样因为没有考虑到参与人的非经济效用(比如对公平的期望)，这种假设在现实中会遭遇碰壁。

现在我们放下非经济效用，只看经济效用。我们也应该看到，最终受益和预期收益之间的差别会导致参与人效用的变化：预期能拿到50，实际拿到0.01，这个差别是很大的。这种效用的落差足以让理性人做出拒绝分配方案的决策！因为分配方案搁浅，2只会失去0.01的收益，而1会失去99.99，如果用“后悔值”来衡量威胁可信性的效用，1的损失要远大于2。当1考虑到这一点，提出分配方案时候会尽量公平。学者们还认为如果1认为2是极端非理性的，会提出0.01:99.99的分配方案。我认为按照“最大后悔值”方法分析，这个也是不可能的，因为“最大后悔值”就是一个理性的衡量。如果2拒绝了0.01:99.99意外任何方案，比如拒绝0.02:99.98，那么2失去的(后悔值)明显大于1，同理可知0.03：99.97、0.04:99.96……都在此列，而接近平分是最可能的结果(双方后悔值最接近)。

那么如果1真的提出了显失公平的分配，2是不是应该真的拒绝？答案是肯定的，因为在现实世界中，谁都不知道这样的博弈是否还有下一次，应当为自己树立一个“喜欢公平”的声望，从而在今后的博弈中作为参与人2获得更多收益。并且，我们可以认为，在有利害关系的两个参与方之间，和在无利害关系的两个参与方之间进行此种博弈，得到的结果很可能是不同的！这种不同，我认为也可以基于“最大后悔值”方法来分析。比如有直属上下级关系或者权力相差巨大的两个人之间进行最后通牒博弈，结果很可能不会是五五分：处于权力优势地位的参与方会分得更多。《伊索寓言》里狮子、狐狸和驴子分猎物的故事很形象地说明了这一点：驴子因为把猎物平分三份而被狮子杀死，狐狸将大部分分给狮子而获得了剩下的部分(以及自己的性命)，其实这就是一种理性的结果。而在Binmore的最后通牒博弈中，选择的参与方大多无利害关系，从而会得到基本公平的结果。至于为什么不是绝对的公平，应该是有随机因素如参与人经济水平、性格的因素在里面。

(二)个体声望与“感情用事”

如果我们在效用函数当中，加入人的社会需求这一自变量，我们可以解释大部分从西方经济学理性人假设下看起来不合理的行为。其实此类行为一直存在，最明显的就是慈善事业的发展，尤其对于丧失劳动能力者的慈善事业。

对于个体而言，“感情用事”是不符合理性人定义的。但是，如果我们从博弈论当中的声望理论(Reputation Theory)来看，可以得出相反的结论。如果一家企业(个体)在市场竞争中“感情用事”、“莽莽撞撞”，不惜代价地打击行业竞争对手，甚至不惜“杀敌一千自伤八百”，那么企业就会树立一个蛮横和不计后果地竞争的形象。那么，其他企业在与其竞争时，便会理性地考虑代价，很可能对竞争抱非常慎重的态度，从而使得这家企业一直处于一个比较优势的地位。表面上看，这家企业似乎是以非常不理性的“声望”震慑了竞争对手，但这实际上可能是这家企业的一个理性策略：通过计算先期“蛮横”、“鲁莽”的代价和预测后期的收益，来决定是否树立这样一个形象。从这个方面来讲，至少表面上，“不理性”的参与人获得了比“理性”参与人更多的收益，实际上双方都是理性的。

四、博弈中的理性与最优化理论形式

西方经济学和管理学的另一大主流工具是运筹学(Operation Research)或者最优化理论(Optimization Theory)，而我国的学科体系中将博弈论归入到了运筹学。最优化方法的一般形式为

其中f(x)是作为目标函数，需要尽可能大，s.t 指约束条件。两个函数族都可以为线性或者非线性，如果s.t 为空，则为无约束优化问题。显然，无约束是一种理想状态，基本上只具有数学上的意义，而不能强推到经济学当中，最起码决策变量x的取值范围不是无界的。而理性人假设实际上是应当包含这个限定的。如果用这种量化的观点来看待理性，并且自变量(x)引入不可货币化元素(通常使用序数表示)，那么我们可以建立理性的延伸形式，即理性是在约束条件下最大化自己的收益或者效用。西方经济学一般来说将向量x视为可货币化的，但是按照社会人的理论，x当中必须有非货币化的、体现人的社会需求的分量，而且由于社会需求的心理性，这样的分量很难量化表达。现在人工智能当中提出人工情感，即用数学和心理学、社会学方法为情感建模，就是试图在此领域进行的探讨。

通过把博弈论和最优化分析相结合，并且在约束条件中考虑威胁的可信性：一旦采取某种行动，预计会有可信的惩罚实施，那么威胁也会成为一种(概率上的)约束，从而理性的选择成为了一个随机优化问题，而约束条件和目标函数都包含了物质和精神(心理)因素。

五、结论

(一)个体理性是基于对环境的恰当反应

中国古话“没有规矩，不成方圆”早已形象地展示了约束条件的普遍性，这种普遍性当然也在经济领域深刻体现。便如博弈论中的囚徒困境一样，没有约束的理性(或者收益最大化)往往使得所有个体均无法最大化自己的目标，从而在实际上成为非理性的。既然理性来源于约束，而道德情操是社会的公序良俗这样的约束在人心理的体现，我们可以将道德情操归于理性范畴，因为它是客观存在和客观需要的，而不是人心凭空产生的。从经济学意义上看，在良好的社会规范下，遵守道德(商业或者个人的)可以降低监督成本，从而实现货币意义上的收益增加。

经济系统是一个复杂系统，对于复杂系统而言，因为内部各部分之间的非线性结构和总体演化发展的原因，不太可能用精确的数学方法进行描述。对于系统复杂性的成因向来众说纷纭，比较主流的复杂自适应系统理论(Complex Adaptive Systems，CAS)认为系统的复杂性来自于系统要适应其所在环境，而环境是由其他系统组成的。这个观点被人工智能研究者采用，成为现在主流人工智能研究当中的“理性智能体”概念：对环境的辨识和恰当反应，并且通过学习来提高自身水平。这个观点引申到经济学上(其实经济学理论是人工智能的基础之一)，我们可以修正理性的定义：理性是对环境做出恰当的反应，以获取自身利益最大化。而环境是包含了经济、人文、社会、文化风俗、宗教等等因素的，不能完全由经济因素决定，所以对环境做出的反应必须估计非经济因素，主要是社会因素。

(二)表面带有感情色彩的行为并非不理性

如前文所述，感情是个体在成长过程中积累起来的一般感知和反应方法。我们定义理性是对环境的恰当反应，其实包含了感情元素。正如之前所说，社会需求应当被列入个体的效用，而社会需求是应当包含感情色彩的，从而我们可以把(部分)带感情色彩的东西归入理性范畴。

典型的如前文所述的博弈论中的最后通牒博弈和讨价还价博弈，威胁的可信性源自于参与方对博弈对手的认知，而这种认知不但建立在共同知识上，还很可能建立在以前打交道或者博弈的经历上(信号)。所以理性的参与方有可能给出非理性的虚假信号，其目的正是为了利益最大化。从这个意义上说，他并非带有感情色彩，而正是通过分析和对环境、对手的判断，故意发送“我是非理性的”错误信号，这说明他恰恰是理性的！

(三)社会需求、心理效用应当被考虑为理性人的特征

如果得出这个结论，我们必须从前文提到的效用的内涵扩展来分析：感情需求也是一种需求，这种需求的满足也是一种效用。如前文所述，每个个体的效用函数形式不一样，取决于个体成长环境、总体教育背景、成长经历和社会需求等。所以，如果套用西方经济学的效用最大化理论，真正感情用事的人也是理性的，因为其感情效用(或者更确切一些，心理效用)的满足可能弥补了物质效用的损失。

总的来说，博弈论中的理性人假设不应当局限于西方经济学里的理性人假设(追求经济利益最大化)，而应该做一个延伸或者扩展。因为博弈中追求利益最大化的行为是受到环境(经济、社会、道德、法律等)约束的，顺应这些约束，其最优化的目标也应当包含非经济目标，及为实现这个目标而采取的决策。尽管这种决策表面上可能掺杂了感情色彩，但实际上是真正理性的、深谋远虑的思考结果，其目的是为了获得长远的、更大的利益。从这一点看，经济利益和非经济利益从本质上来说并不冲突。

[1]谢识予. 经济博弈论(第三版)[M]. 上海：复旦大学出版社， 2010.

[2]费登伯格. 博弈论[M]. 北京：中国人民大学出版社， 2010.

[3] L Smnuelson. Repeated Games and Reputations. UK：Oxford. 2006.

(责任编辑：胡乔)

Research on the Hypothesis of Rational Man in Game Theory

DU Wen-sheng

(School of Economics and Management, Hubei Normal University , Huangshi ,435002)

The Hypothesis of Rational Man in Western economics is invoked by game theory research, but there were some doubts in the applications.This article discussed the usability of this hypothesis in game theory and the problem of the edge of ration.

Game; Theory; Rational; man; Utility

2016—08—25

杜文晟(1978— )，男，湖北黄石人，副教授，主要研究方向为经营管理。

F22

1009- 4733(2016)06- 0059- 04

10.3969/j.issn.1009-4733.2016.06.014