社会规范引导行为协调：日常行为的拇指准则

2019-12-22朱富强

武汉科技大学学报(社会科学版) 2019年6期

朱富强

(1.河南大学中国经济学研究中心，河南开封 475004；2.中山大学岭南学院，广东广州 510275)

一、前言

现代主流经济学对人性及其行为机理的理解根基于西方社会根深蒂固的自然主义思维：一方面，自然主义思维主张将人与自然以及社会割裂开来，把人类个体视为独立于自然和社会的孤立存在，并把人性视为天赋的和永恒的存在，从而就产生了现代主流经济学的原子论个体主义思维；另一方面，自然主义思维从人对自然的控制中挖掘出工具理性，工具理性和目的论相结合则塑造出了理性经济人概念，进而将理性经济人分析范式拓展到人与人以及人与社会的互动中，由此就形成了现代主流经济学的博弈思维[1]。不过，基于这种主流博弈思维的个体互动所达致的往往不是社会合作，而是囚徒困境；同时，即使主流博弈论也从基于理性策略的重复互动中寻求合作均衡，但其中也潜含了明显的逻辑缺陷，这已经为泽尔腾的连锁店悖论所表明[2]。事实上，按照布坎南和塔洛克的看法，如果两个以上的个人试图对某项决定达成一致意见，那么，其中的每一个人都会努力使其自身的可能收益最大化，这必然会带来讨价还价成本，即决策成本[3]。在这种情况下，虽然从“个体”角度来说，对这种谈判给予某种可观的投入可能是相当理性的，但从“社会”角度来看，讨价还价所引发的时间和资源却不是有成效的，因为这是对既定“馅饼”进行分割的零和博弈。

与此同时，囚徒困境在现实生活中却并不如经济理论所描述的那样普遍。在绝大多数情形中，人们都能够有效地解决他们的冲突，并采取协调一致的行动。因此，主流博弈论所使用的理性概念也就会引起广泛的质疑。那么，现实世界中人们在行为互动中是如何跳出囚徒困境的呢？这就涉及人类理性的演进以及指导日常行为的拇指规则。事实上，人类理性不是静态和普遍的，而是在互动中逐渐演化和成熟的；同时，随着人类理性的逐渐成熟，分立行为间的协调性也得以不断提升，进而就更容易跳出囚徒困境的陷阱而促进社会分工和合作，这已为很多行为实验所“证实”[4-6]。因此，要真正理解现实中的人类理性以及不同的社会合作形态，根本上就必须从演化角度来剖析人类心智，要揭示人类心智-生活世界之间的共生互动关系，这也就是何梦笔(Carsten Herrmann-Pillath)强调的“二重实在论”[7]。在很大程度上，现代主流经济学之所以无法解释大量存在的以及不同形态的社会合作现象，也难以通过对行为协调的促进来实现社会合作，根本上也就在于，它基于自然主义思维而将丰富多样又相互联系的社会人还原为孤立而同质的原子个体，并由此设定了先验而静态的理性经济人分析框架，这不仅忽视了嵌入在人身上的亲社会性，而且忽视了亲社会性的成长以及由此带来的理性的发展[8]。有鉴于此，本文对现实行为的特性和理性基础作一探讨，并在此基础上分析人类行为是如何协调的。

二、习俗是协调行为的基本准则

博弈分析最基本的目的之一是预测，这包括：特定博弈中的博弈方究竟会采取什么行动,最终将会有怎样的结果，等等。但是，作为主流博弈论发展出的如何进行博弈的一致预测基础，纳什均衡却并不一定能对所有博弈的结果都作出准确的预测，究其原因有二：①纳什均衡的一致预测性质本身就不保证各博弈方的预测是相同的，因为不同博弈方的理性程度并不一致；②许多博弈情境也难以基于纳什均衡进行准确预测，因为实际生活中的许多博弈情境都有多个纳什均衡。显然，仅仅是多重均衡的存在，就会产生如下两大后果：①纳什均衡的均衡解并不一定会出现；②即使结果是一个纳什均衡，也不能确定是哪一个纳什均衡。例如，在性别战博弈中，尽管预期出现的是(足球、足球)或(歌舞、歌舞)，但实际出现的可能是(足球、歌舞)，麦琪的礼物博弈就凸显了这一点；进而，我们也不能确定(足球、足球)和(歌舞、歌舞)这两个纳什均衡中究竟哪个将成为现实结果。正因如此，许多学者开始质疑纳什均衡能否成为一般博弈的正解概念，这涉及对“合理的”纳什均衡和“不合理”的纳什均衡之间的区分[9]。

(一)博弈协调的基本路向

迄今为止，主流博弈论探究均衡确定性的基本路径是：基于数理逻辑来不断精炼纳什均衡，逐步发展出了子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯均衡、序贯均衡、颤抖手精炼均衡等一系列均衡概念。但是，这些研究并没有取得根本性突破，因为大量的经验事实和行为实验都与这些理论均衡结果相悖。凯莫勒认为：“随着理论工作者们使用这些博弈来解释诸如教育投资、保修单、罢工等现象，他们很快发现这些博弈具有多重均衡。一些均衡虽然看起来明显不现实，但它们在数学意义上却和已建立的均衡概念一致(甚至如序贯均衡)。回顾一下就很容易发现，诸如纳什均衡等概念实在过于数学化也过于脆弱，以致很难用他们挑选出比较可能的均衡来。这就需要对已建立的概念进行精炼以破译‘不合理’的含义”，“在20世纪80年代，许多理论学者都致力于对精炼的研究。提出这些观点的论文充满了对直觉和合理性的讨论，但缺乏数据支撑。很奇怪的是，这些颇具数学天赋的理论学者们可以花费数年时间讨论在不同博弈中哪些行为是最合理的，却从没有试图将人们置于这些博弈中，将‘合理的’定义为多数人的行为。”[10]

因此，随着主流博弈思维在解释和预测上的遇挫，一些经济学家就开始从社会生活和经验事实中探寻协调博弈的基本机制。弗登博格和梯若尔就指出，当存在多个纳什均衡时，说某个纳什均衡一定会被采用，必须有某种能够导致每个博弈方都预期同一个纳什均衡出现的机制或者程序[11]。确实，现实世界中也存在一系列的协调机制来引导博弈均衡，这主要体现在2005年诺贝尔经济学奖得主托马斯·谢林(Thomas Schelling)提出的聚点均衡(focal point)和奥曼(Aummann)提出的相关均衡概念(correlated equilibrium)中。

首先，奥曼认为，博弈方通过一个大家都能观测到的共同信号来选择行动，从而实现行为的均衡。奥曼还证明，如果每个博弈方根据所收到不同但相关的信号而采取行动，就可以得到更高的预期支付[12]。随后，梅森(Myerson)作了进一步发展而提出机制设计理论，从而将相关均衡转化成为一种实现某种有利均衡的制度安排，也即相关均衡是指通过“相关装置”而使博弈方获得更多的信息，从而协调博弈各方的行动[13]。这种“相关装置”在现实生活中非常普遍，如交通信号灯就是不同方向车辆行走的“相关装置”，法律规章就是人们日常行为的“相关装置”，上课铃声就是学生安排作息时间的“相关装置”，而且“相关装置”的设置也成为促进行为协调和社会合作的重要机制。例如，企业组织中管理者的指挥就是一种协调活动，他有助于引导团队生产者之间的行动协调和分工，龙舟比赛中擂鼓也是设立的一种信号，它有助于协调每位队员的一致行动。同样，在战争中，旌旗金鼓等作为相关装置而起到统一指挥、统一行动的作用。孙武就指出：“夫金鼓旌旗者，所以一人之耳目也。人既专一，则勇者不得独进，怯者不得独退，此用众之法也”(《孙子兵法·军政》)。

其次，谢林提出的聚点均衡说明博弈方能够基于大家长期以来所形成的共识而自发采取行为并由此形成均衡，而这种信息却被策略式矩阵省略掉了。谢林的这一概念建立在如下一系列的实验基础上：①在互不交流的情况下，让人同时选择硬币的正面或反面，如果选择相同则可赢得一笔奖金，结果36个人要正面，6个人要反面。②让互不相识的学生选择在纽约某地相见，结果大多数学生选择了纽约中央火车站的服务台。③在上述实验中要求他们选择约见时间，结果几乎所有人都选择了中午12点。④让互不沟通的学生将100美元分成两份，如果相等则获得这100美元，如果不等则一无所获，结果42个学生中有36人将之分成两份50美元。⑤写一个正数，如果所写的数字相同则赢得奖品，结果有2/5的人通过选择数字1而获得成功。⑥相似地，指定一笔钱，如果指定的钱数量相同则赢得该数量的奖金，结果有12个人选择1000 000美元，而只有3个人选择的数字不是10的幂数。显然，这些实验表明，人们的日常行为往往有惊人的一致性，而这种一致性无法用数学逻辑加以分析。谢林认为，这个聚点“很大程度上取决于双方的直觉而非逻辑思维推理，或许依靠来自双方对相似事物之间的类比经验、先例、偶然巧遇、对称性、审美观或几何原理、诡辩推理，亦即当事人的自身条件和对彼此情况的了解”[14]52。例如，工人的努力水平和企业主支付的工资之间、夫妻俩周末在足球和芭蕾之间的选择，等等，都是聚点均衡的典型例子。

显然，无论是相关均衡还是聚点均衡，很大程度上都体现为一个社会的传统习俗和惯例，这也就表明，真实世界中的人类行为往往遵循某些既定的社会规范而不是基于算计的功利原则，这是社会合作得以形成和扩展的基础，并且也已经为越来越多的学者所认识。事实上，正是由于曾长期被现代主流经济学排除在外的那些不确定性的习惯、心理等因素为越来越多的行为实验所显现和证实，现代经济学也开始转向对这些因素的关注，甚至已开始成为主流经济学教材所讲授的一个重要内容。为了说明这一点，这里引入一个博弈实验作一剖析。

(二)“分水岭”博弈的解说

在“分水岭”博弈中，参与者从1至14选择号码，而其得益依赖于所有人可能选择的中位数。譬如，参与人选择2，而中位数是5，则其得益为65；如果中位数为9，那么其得益为-52。这个实验可以做多轮，而每轮过后，你都知道中位数是几，然后计算从中的得益并进行下一步选择。显然，这一博弈结构具有这样的属性：当你认为其他多数人会选择较小数字时，你也应该选择较小数字；当你认为其他多数人会选择较大数字时，你也应该选择较大数字；而当你认为其他多数人的行为具有不确定性时，可以选择6或者7规避风险。

同时，这一博弈结构具有这样的属性：如果你猜测其中位数略低于7时，你的最佳反应是选择一个比该中位数略小的号码。譬如，如果你认为中位数是7，你的最佳选择是5，这样对该中位数的反应就会将中位数拉得更低直至到达3，而3成为一个均衡的最优反应点。相应地，如果你猜测其中位数为8或以上时，你的最佳反应是选择一个比该中位数略大的号码。譬如，如果你认为中位数是9，你的最佳选择是10或11。这样对该中位数的反应就会将中位数拉得更高直至到达12，而12成为另一个均衡的最优反应点。因此，这个博弈是一个协调博弈，它存在两个纳什均衡：其中7以下的中位数是一个收敛于均衡3的“吸引域”；高于8的中位数是一个收敛于均衡12的“吸引域”，从而被称为“分水岭”博弈。

Huyck等人将受试者分成10组，每组做了15次实验，实验结果证实了两位分离均衡的存在[5]。问题是，在现实世界中，究竟会出现(3,3)均衡还是(12,12)均衡呢？显然，纯粹的逻辑根本无法预测究竟会发生哪种均衡。但是，该实验有两个重要发现：①即使收敛于低收益的参与者只能得到一半的收益，他们也不总是收敛于高收益均衡；②历史性的趋势足够强大，造成了结果对“初始敏感性条件”的依赖。例如，参与者就发现，如果他们当中有两、三个人认为7是他们的幸运号并在第一轮选择7时，结果就会卷入到3的均衡；相反，一、两个中国参与者则往往会给小组带来更高的收益，因为8是中国人的吉祥数，从而引向了12的均衡。

大量的行为实验也表明，行为协调以及均衡的出现往往不是基于理性的计算，而是与特定的社会规范和习惯、风俗有关。人们的日常行为首先是基于以往的习惯，只有遇到新的情势时才会求助推理。即使如此，互动者之间也会努力进行信息沟通，以图实现更佳的均衡结果。所以，谢林强调了博弈研究的这样几个结论：①结果导向的数学结构分析不应成为博弈论的主要研究方法；②研究过程中不应将问题过于抽象化；③当沟通方式具有某种优势，博弈双方对彼此价值观或战略选择缺乏了解，特别是博弈结果依赖于博弈双方的一系列行为和举动时，经验因素往往成为混合博弈研究的关键因素，也是最适应的方法[14]139。谢林甚至说，用纯理论来预测参与者在博弈中如何行为，就像试图不把笑话讲出来就证明它是可笑的一样[15]。

可见，现实世界中的人类行为往往不是基于理性计算的，而是遵循一定的习惯、习俗和社会规范这个拇指原则。事实上，无论是凡勃伦的“集中意识”(focus awareness)的习惯，还是康芒斯的“习俗”以及诺斯的“规则”，他们都认为，只有通过习惯，边际效用才能在现实生活中近似成立。而且，正是由于习惯、习俗等提供了指导共同行动的聚点和相关均衡，从而增进了个体行动的协调性，从而有助于达致合作性均衡。例如，休谟在《人类理智研究》一书中就指出，人的理性不能解决因果的推论问题，唯有非理性的习惯原则才是沟通因果两极的桥梁，因此，“习惯是人生的伟大指南”；而他在《人性论》中则强调，理智是而且只应是感情的奴隶，它除了服务和服从情感之外永远不能自称有任何其他功能。再如，约翰·穆勒在《政治经济学原理》中也强调，市场产品分配是两个决定性力量——竞争和习俗所造成的，从某种意义上说，习俗的支配力有时比竞争更为重要[16]。同样，被视为异端经济学的凡勃伦很早就曾经将欧洲犹太人在知识和科学上的优势归因于他们缺乏当代的见识和他们受到的“公元前”文化的洗礼。因此，要对真实世界中的人类行为及其互动结果有更确切的理解，就必须突破主流博弈理论的工具理性和计算理性的分析框架，而应广泛地剖析心理的、社会的、文化的、制度的诸因素，否则往往会犯削足适履的错误。

三、遵守规范的行为是否理性

上述分析指出，真实世界中的人类行为往往遵循一定的社会规范，有些社会规范还上升为宗教的戒律，成为人们行为必须遵守的道德准则。这就引发了对一个重要问题的思考：遵循规范的行为与追求利益最大化的人类理性之间是否冲突？这涉及对理性概念的理解。一般地，现代主流经济学将一个人所面对的可选项的集合定义为技术或预算可行性集合，一个理性的人就会根据自身偏好以及时空环境而从这些技术或预算可行性集合中进行选择以最大化自身利益。但是，社会规范或规则往往会进一步限制可行的选择集合，这种限制超出了技术上和预算上的可行性，从而导致一个可能提高其效用的可选项被放弃掉。因此，按照主流经济学的理论，理性的经济人会敏锐地把握信息和时机而灵活地调整策略，而不会固守某种一成不变的规则，否则就是不理性的。相应的问题就是：固守规则果真是非理性的吗？在很大程度上，这就要看被社会规范所排除的那些选择项的性质。显然，如果社会规范所排除的选项本身就是被长期的社会实践证明没有效率的，那么，社会规范的引入反而会促成我们的选择更为理性。究其原因，正如施瓦茨指出的，现实世界的人们本身是有限理性的，当选择项增多时，他反而无法确定最佳选择项；同时，过多的选择也会占据本可以用于其他事情的时间和精力，从而危害我们的自由[17]。

巴苏就考察了三类规范：①理性限定规范，即阻止行为者选择某个选项的规范，不管这个选择会给他带来多少收益；②偏好变异规范，即随着时间的推移而成为行为者偏好一部分的规范；③均衡选择规范，即导向的选择完全符合行为者利益的规范。在很大程度上，这三种规范往往都会有利于行为者或整个社会的长期利益。譬如，就理性限定规范而言，无论被抓住以及被惩罚的概率多少，人们通常都不会考虑在拥挤的公交上去拿另一个人的钱包，否则，就会造成每个人都要提防自己的钱包被拿，而这又陷入了极不理性的“野蛮丛林”状态。再如，就偏好变异规范而言，人类效用根本上就是社会性的，因为厌恶说谎或盗窃而在即使没有任何人知道的情况下也不说谎或盗窃，这显然符合个人效用最大化，从而也就是理性的。至于均衡选择规范，这本身就符合现代主流经济学的理性行为原则[18]。既然如此，又如何认定遵循规范和习俗的行为是非理性的呢？

事实上，在现实世界中，人们在日常生活中的行为大多也是基于习惯和传统，而不是基于理性的计算。譬如，在现代企业中，经理人员的努力水平是如何决定的，是基于所谓的激励机制吗？他们的行为会随时根据合同状况或信息状况而进行调整吗？事实上，正因为行为规范在经济生活中的重要性日益凸显，已经有越来越多的学者开始重新审视真实世界中人与人之间的互动所基于的理性之内涵。例如，莱宾斯坦很早就指出，人的理性具有惰性区域，而高度反应的行为是无理性的，最终将会带来比非反应行为更大的压力，为了说明问题，他还发展出了边际理性和棘轮理性等概念。

一般地，对理性内涵的理解应该把握这样两点：①人类理性本身是基于特定的行动目的和偏好而言的，而行为目的和偏好则是内生的，因而理性就不能被视为先验而客观的；②人类理性根本上体现为对长远和全面利益的认知能力和实现能力，而不是局限于每一次行为的功利计算，因而理性不能等同于主流博弈论所界定的理性。事实上，现代主流经济学的经济人范式将人类行为所遵循的拇指规则仅仅视为功利最大化，而且这个功利是基于一次性行为计算的行为功利主义，从这个意义上说，主流经济学所采用的是绝对有限理性，由此导向的往往也就是囚徒困境[8]。与此相反，尽管现代主流经济学往往将人们基于习惯和习俗的日常行为视为一种非理性的选择，但如果考虑到理性计算所需要的时间和精力，那么，“作为应付一个人理性之有限的策略”，采取遵守我们已经形成的习惯或是我们这个文化和社会所提供的惯例的这种“非理性将是绝对理性的”[19]。当然，这种理性不是在行为功利主义意义上的工具理性和短视理性，而是基于规则功利主义意义的社会理性和长远理性。

既然互动理性根本上体现在行为协调上，现实生活中的个体互动又是如何进行为协调的呢？很大程度上，这就需要借助于习惯、习俗等聚点和社会装置。其实，尽管机会主义的策略行为在短期的或一次性的互动中可以获利，至少可以避免最坏的结果，但从长期来看，遵循那些经过不断调适的规范行为反而会带来更高的效率。其实，正是在互动中获得了他人的偏好和行为习惯等信息，这些经验性东西的扩展和提炼就被编码成了社会规范，从而成为人们的共同信念以及行为的依据。很大程度上，社会合作现象大多是源于共同的信念，源于对规范的遵守而非理性的算计。阿马蒂亚·森就写道：“与根据个人自己的目标无休止的最大化相比，只要遵从这种‘习惯性’规则能够产生更好的结果，那么将有一个有利于那种模式的‘自然选择’论据，这将导致它们的持续与稳定。这是一定‘渐进的’影响，是在一个完全不同于如弗里德曼所理解的那种利益最大化者的生存方向上起作用的。”[20]正因如此，人们往往乐于遵循公认的社会规范，这往往不是出于被动的强制，而是认识到遵循规范是必要的、有用的和合意的，从而也就是符合理性的行为。

首先，现实社会中的人类行为本身就源自无数次的理性互动：在不断的近似重复的互动行为中，理性的人们就将过去的经验转化为习惯，并且逐渐在一种拇指规则的规范下展开行动。例如，韦森就举例说：一个人决定购买一辆汽车时，往往会做大量信息收集和理性计算工作，但一旦购买了之后，就会习惯地使用它，而往往不再考虑和理性计算每一次外出的交通成本了[21]。尤其是，在长期的互动中逐渐摸索出了相对有效的合作方式，产生了“为己利他”行为机理，这一行为机理又转化为习惯、习俗和惯例，从而节约了下回达成合作的摸索成本。正因为传统习俗文化往往是全社会优化过程的结果，因此，遵循习惯和习俗也是成本节约的理性方式[22]。例如，Chwe就指出，人类社会中的规范已经凝结了人类社会的共同知识，因而根据规范的行为本身就是高度理性的[23]。同样，H·培顿·杨也写道：即使在这种低度理性的环境中基于互动而形成的“这些制度常常恰恰就是被那些高度理性的理论所预料的结果——纳什讨价还价解、子博弈精炼均衡、帕累托效率协调均衡、严格劣势策略的重复消去法，等等。换言之，当适应性过程有足够长的时间展开的话，演化力量常常替代很高程度的个人理性。”[24]

其次，尽管人类的长远理性是逐渐通过学习和模仿而形成的，但它并不仅仅源自个体的直接经验，而更主要是源自他人或社会的间接经验，具有学习能力的社会人能够经由模仿而将他人经验内化在自身行为之中。正因如此，我们说，人类理性是人们长期互动演化的产物，它深植于社会的文化和习俗之中。譬如，马林诺夫斯基通过对特罗布里恩岛上捐献活动的循环流动就发现，库拉圈是渗透在整个部落的关系网中并形成了一个相互交织的网状结构，这种网状关系把成千上万的个人连接成一种永久性的伙伴关系，这包含了各种相互的义务和优惠；而且，个人既不能影响交易，甚至即使最聪明的土著人也不能理解他们之间庞大的、有组织的关系。事实上，绝大多数社会学家和人类学家都认为，经济是被嵌合在社会之中的，这意味着，人类社会的血缘关系、宗教、礼仪等社会习俗所决定的人类行为本身就潜含着财物的生产、分配等经济功能。例如，粟本慎一郎就认为，“‘经济活动’或‘经济行为’并不是一种始于经济关系的社会行为。‘经济’行为的意识是由习尚、传承、传说、神话所决定的。而对行为的施动者来说，这种行为意识只能在一定的社会联带中才能发生作用。”[25]

最后需要指出，主流博弈论基于理性经济人的分析思路以及分析结论，与探究博弈思维的基本目的也是相悖的。一般地，探究博弈思维主要有两大目的：①揭示人们在行为互动中策略选择的相互依赖性；②探究人们在互动中通过行为协调以实现利益增进的机制。显然，主流博弈论所理解的理性是静态的，博弈方采用一种“以不变应万变”的策略，从而无法应对人类行为的多样性和变动性，无法真正纳入行为的共生性和共促性；同时，主流博弈论所理解的理性是孤立的，博弈方只考虑狭隘的个人利益而忽视其他人的利益诉求，从而采用一种相互提防和对抗的策略，以致最终危害了博弈方的自身利益。正是由于主流博弈论基于理性经济人模式非但没有促进个人利益和社会福利的增加，反而会引导进一步陷入困境之中，因此，我们就必须对主流博弈思维进行反思，需要重新考察社会规范在博弈协调中的作用。事实上，如果一个社会中的人们互不关心，那么，社会就很难形成良性的大规模合作，就很难有效使用社会资源，从而必然是贫困和落后的。班菲尔德在《落后社会的道德基础》一书中就充分证实了这一点[26]。所以，阿马蒂亚·森指出，一个基于个人利益增进而缺乏合作价值观的社会在文化意义上是没有吸引力的，而且这样的社会在经济上也是缺乏效率的。

四、全面理解人类理性的内涵

现实世界中的人类行为往往不是像主流经济学所主张的那样遵守行为功利最大化原则，而往往是遵守既定的社会规范。例如，包括亨利奇等在内的涵盖心理学、人类学、经济学等学科的17位重量级学者历时13年对12个国家中15个小规模社会做了跨文化的实验研究(包括最后通牒实验、公共品投资实验以及独裁实验等)和田野研究，得出的基本结论是：①没有一个社会在实验中的行为符合经典的经济人模型；②在团体之间的偏差比早先研究发现的要大很多；③在经济组织和社会互动结构中的团体水平差异能够为不同社会的行为偏差提供坚实的部分解释：市场一体化水平越高和合作对日常生活带来的收益越高，实验博弈中展示出来的亲社会性水平越大；④经济学上的和统计学上的个人水平变化并不能解释团体内或团体间的博弈行为；⑤很多实验行为都清楚地反映了人们日常生活中能够的互动模式[27]。

当然，我们并不能由此否定人类行为的理性特性，毕竟理性是人类区别于一般动物的根本性特征。所以，阿马蒂亚·森认为，重要的并不是对“人们总是以理性的方式行事”这一假设的批判，而是认识到人们并非完全不服从理性的要求[28]165。既然如此，我们又如何理解真实世界中的人类理性呢？一般地，我们可以从三大维度来理解人类理性的内涵。

首先，人类理性根本上体现为在互动中实现长期收益的最大化。一般地，动物的本能驱动体现在对每一次行为的功利最大化，而人类的理性行为则体现在对长期利益的追求。事实上，在现实生活中，任何个体都不仅是关注一次性行为带来的收益，而且能够考虑行为对未来收益的影响，从而将长期利益考虑进来。当然，长期利益与短期利益之间往往存在冲突，因而要实现长期利益，就必须抵制短期利益的诱惑。在实际生活中，长期利益的实现程度往往依赖于行为者的认知力和意志力。为此，阿马蒂亚·森强调，一个选择只要在经受了批判性思考之后还能成立就可以被视为是理性的。例如，玛丽在进行了认真和明智的思考之后决定，即使自己需要作出重大牺牲也要去追求自己所向往的社会目标，那么，她的行为就不是“非理性”的；同样，即使保罗热衷于个人利益的最大化，只要他的价值、偏好和选择能够经得起自己的严肃审视，那么也很难将“不理性”以此用在他身上[28]183。当然，森强调的理性审视根本上是指对长远目标的通盘考虑，而不是为一时的功利诱惑所驱动，那些事后引起后悔的短期行为就是非理性的，如为一时激情所驱使的性交、赌博、吸毒、犯罪等。

其次，实现长期收益最大化的根本途径在于合作。一般地，如米瑟斯指出的，“人类与动物区别在于，人类可以进行社会合作。”[29]事实上，动物因为缺乏有意识的合作，往往只能维持基本的生存需要；相反，人类通过合作，从而不断地扩大自身的能力，不断增进自己的需求。为此，别尔嘉耶夫强调，人是社会的人，人要获得自由，就得与他人合作，为人着想，摆脱自我中心主义意识。显然，越是追溯早期社会，人类社会的合作半径越小，人类个体的能力和需求满足水平也越低。哈耶克写道：“野蛮人远不是自由的，他也不可能征服世界。除非得到他所属的群体的同意，他几乎什么事都不能做。”[30]这种认知可以追溯到古希腊时期。例如，亚里士多德所倡导的城邦共同体学说就认为，人之所以自然倾向于过城邦生活是因为任何个人都不是自足的，只有通过城邦生活，人类才能获得完全的自给自足；城邦是为满足人类需要的生活在发展中自然长成的，是人类社会团体从家庭、村落历史发展而来的。显然，合作根本上具有互惠的特性。鲍曼就强调，“互惠性行为方式无疑是一种具有最重要意义的经验现象，它们属于所有我们已知的社会实践的根本的和理所当然的‘基本配置’。”[31]

其三，人类理性更主要地体现在交往合理性。一般地，人与人的互动之所以不同于人对物的单向处理，根本点就在于，人处理物时只需要考虑工具合理性，而在与人打交道时则需要考虑交往合理性。事实上，人类正是在社会互动中才衍生出亲社会性，亲社会性使得人类个体不仅追求物质利益最大化，而且也产生某些社会性需求，这主要体现为同情、关怀、尊重、信任等，这也意味着，社会性需求更主要出现在特定社会共同体内部，并依赖于特定的社会文化伦理。亚里士多德就强调，人们之所以加入城邦，不只是因为城邦是满足人类需要的生活共同体，还因为城邦是实现人类本性的道德共同体，而且，人只有参加城邦生活才能成其为人，良善的人生仅在城邦生活中才有可能。为此，亚里士多德提出的影响深远的名言是：人是一个政治动物，人是成为公民而生的。同时，社会性需求本质上又是相互依赖的，从而增大了互动者之间的共同利益，更需要也更容易产生合作。很大程度上，正是在“为己利他”行为机理之上形成了互惠合作关系，并逐渐沉淀和编码而产生了社会规范，它反过来又指导和协调人们的互动行为，从而形成持久和扩展的社会合作。因此，Sunstein等指出，人们通常不会自发地根据最优化决定理论思考，也确实不情愿基于最优化理论来制定法律[32]。

因此，要实现社会广泛存在的互利形态，就要夯实人与人之间的合作关系，这就需要确立为大家共同遵守的社会规范，而不是采取机会主义的策略行为。事实上，就企业的产品生产和销售而言，只有那些提供真正有用的产品的厂商才可能获得持久的发展，究其原因，就像雇主不希望自己的雇员偷窃公司财务以及希望自己的合作伙伴都能够遵守协议一样，消费者把产品买回家打开包装的时候也希望看到商品与广告中所宣传的一致，因而当公司发现自己的产品存在问题时，就应该及时告知消费者，甚至必须回收所有可能有问题的产品。举一个例子：1992年6月，美国的零售业巨人西尔斯·诺布克公司的汽车中心被指控为误导顾客和销售给顾客不必要的汽车维修服务，受来自加利福尼亚、佛罗里达及新泽西州消费者事务官员指控的影响，西尔斯公司的股票下跌了9个百分点，全国汽车中心收入下降了15%。显然，这种现象是西方短视的追逐私利的结果。亨廷顿甚至说：“美国人决策时，没有历史，没有未来，只追逐眼下的利益，所以敌不过东亚的竞争者。”[33]相反，如果能够勇于承担责任，对自己的过错真诚道歉并努力弥补，长期来看就会获得基于持续信任的发展。这里也可以看另外一个例子：1982年8月，美国约翰逊公司制造的特兰诺尔(Tylenol)止痛胶囊导致了3人死于氰化物中毒，在政府还没有要求该公司采取任何针对性措施的情况下，该公司把公众安全放在首位，毅然决定回收占公司利润比例17%～18%的所有特兰诺尔胶囊，并对公众公开了所有相关信息，结果，尽管公司遭受了超过1亿美元的损失，但在18个月内公司重新获得了危机前所占市场份额的96%[34]。

然而，基于狭隘的工具理性，主流博弈论往往倾向于将行为者视为基于完全理性计算而行动的短期利益最大化者，结果就导向了非合作的纳什均衡。尽管如此，主流博弈论却乐于将非合作均衡视为结果理性，其理据是，这种结果可以在“完全理性”的基础上通过“内省和推理”而达致。其实，既然这种行为最终导致了囚徒困境的结局，那么，显然也就是非理性的，究其根本，经济人本身就不是实质意义上的理性人，而是“绝对”的有限理性，是阿马蒂亚·森所指的“理性的傻瓜”[35]。相反，如果考虑人类的理性是根基于社会互动的并受历史文化的影响，那么，通过在长期互动中“外推和学习”所获得的“过程理性”就显得更为合理，以此博弈而形成的均衡就更接近于“结果理性”。在某种意义上，这里对人类理性的阐释也涉及对“应然”和“实然”的理解。

最后，基于上述分析来审视影响深远的休谟铡刀原则：不能从“是”中推出“应该是”。事实上，由人们的社会互动所演化而成的习惯本身就凝结了人类在长期实践中获得的经验知识，在很大程度上也就体现了人类理性的凝结。从这个意义上说，人们遵循当下的应然制度或社会惯例也就是理性的，并且具有扎实的实然基础，也正因如此，基于习惯的“过程理性”行为往往更容易达致“结果理性”结局，尽管习惯也可能滞后于社会情势的发展。与此形成对比的是，尽管工具理性在每个时点遵循了行为功利主义原则，却缺乏对整体的把握而陷入路径锁定，进而也就潜含了“理性的自负”。事实上，哈耶克也强调：“文明的发展之所以有可能，在很大程度上就是因为人类用那些理性不及的习俗约束了自己所具有的先天性动物本能；而且一如我们所知，也正是那些理性不及的习俗，才使得规模日益扩大的有序之群体的形成具有了可能。”[36]哈耶克这里所指的理性也就是工具理性，或者工具式的有限理性。从社会现实看，正是由于数学工具的过度引入而将人类理性计量化，新古典经济学的理论和政策就造成了很多的非理性结果。显然，这已经为越来越多的学者所认识，进而也促进了行为经济学的蓬勃发展，这种新趋向积极将心理学、人类学、社会学的研究引进经济学，强调经济学研究要观察盒子外的因素，因为我们一直以来关注的盒子里面是空的(we’re looking outside the box because the box we’ve been looking inside is empty)[37]。

五、结语

现代主流经济学将严格遵循成本-收益原则的行为视为理性的，但将之运用到互动行为的博弈分析中却存在问题：一方面，经济人中的理性概念源于人对物或自然的单向处理关系，把它拓展到人类互动中就忽视了行为的社会性和演化性，从而导致了工具主义谬误；另一方面，行为互动本身就意味着每个人的行为选择都是针对他人行为的反应，同时自身行为也会引起其他人的行为反应，其中的理性也就不可能是单向的。考虑到互动行为的相互反应，社会中行为选择就不可能基于一个固定不变的规则，而是具有针对性，并在互动中不断演化。大量的经验事实和行为实验也都表明，真实世界中的人类行为与标准理性经济人模型的理论结论相差甚远，以致“理性”假设引起越来越多的反思。阿马蒂亚·森就指出，理性选择模型“将选择的理性仅仅描绘成对于自身利益的最大化。这种方法认为，人们如果没有明智地而只是追求自身的利益，并且不对任何其他事物加以考虑(除非‘其他事物’会直接或间接地推进他们自身的利益)，那就不是理性的。既然人类能够有充分的理由去注意自身利益之外的其他目标，拥有更加广泛的价值观和适当的行为规范，那么理性选择理论确实反映了一种对理智和理性极为狭隘的认识”[28]166。

同时，人类理性要求在社会互动中实现长期利益的最大化，因此，行为者就不能仅仅关注个人利益，也要关注他人或社会的利益，要诉诸于合作的方式。正因如此，互动中的人们往往遵循“为己利他”行为机理，而“为己利他”行为机理的扩展和凝结又形成了具有合作性的社会规范；进而，这种社会规范反过来协调人们的互动行为，从而有利于社会合作的实现和深化，最终又有利于最大化个人的长期利益。事实上，如果像主流博弈论那样每个人都随时基于功利计算而采取策略性行为，那么反而会因功利的短视性而陷入囚徒困境，进而妨碍了长远利益的实现。从这个角度上说，遵守社会规范的行为并没有违背理性的要求，而恰恰体现了人类的理性特质，它不但是理性的，而且在结果上比基于功利计算的行为更为理性。哈耶克指出：“个人之思想本身也是他生活于其间的文明的产物，他可能意识不到形成自己思想的许多经验——这些经验已经融入了风俗、习惯、语言和道德信仰，成为人们思想得以形成的根基及其特性的一个组成部分。”[38]很大程度上，风俗、习惯、语言和道德信仰等社会规范成为互动者的共同知识，这种共同知识不仅协调人们的行为，而且促进行为的合作。

当然，主流经济学人会认为，在一个大型社会中，任何东西成为共同知识几乎都是不可能的。例如，Rubinstein和Binmore等就用电子邮件(email)博弈来证明，理性的博弈者进行协调行动也是难以实现的[39-40]。但实际上，现实世界的交易往往只发生在具有共同知识的人们之间，即使原本没有联系，但在交易之前也会努力去了解交易者的信息，并且必然有一些机制保证共同知识的存在。譬如，顾客去某商场买东西，他必然事先知道这个商场出售的东西是可信的，而商场知道顾客使用的货币和信用卡也是真的。在绝大多数情况下，不是每次交易都需要对商品的质量以及货币的真实性进行验证，而是存在于我们的习惯、习俗这种共同知识之中，而如果缺少这种共同知识，那么就会明显地限制交易。正因为人们的交易往往首先局限在一定的范围之内，这个范围之内的习俗、惯例往往就成为交易圈的共同知识，而当这个交易圈扩展时，共同知识也就在更大范围内得到呈现。显然，共同知识的呈现范围会随着习俗惯例和社会伦理的扩展而扩展，从而促使社会合作的扩展。因此，日常生活行为往往会遵从既定的社会规范而不是基于行为功利原则。