APP下载

“有限理性”的进化论视角

2023-05-30姚斌

证券市场周刊 2023年17期
关键词:有限理性赫伯特进化论

姚斌

赫伯特· 西蒙/著

赫伯特·西蒙是唯一因管理方面的研究获得诺贝尔经济学奖的学者,他还是人工智能研究领域的开创者,他更是纳西姆·塔勒布高度认可的三位大师之一。因为他提出“有限理性”假说。赫伯特·西蒙在他的《人类活动中的理性》序言中说,对于人类理性的性质——其机制、效应及其对人类境况的影响,是他五十年来关注的重点。

赫伯特·西蒙因为发现人们在做选择时并没有将预期价值最大化而获得了诺贝尔经济学奖。他认为,人们并非经济学中描述的那种完全理性的生物,相反,人的理性是有限的。

三种人类理性模型

赫伯特·西蒙列举了三种人类理性模型来说明“有限理性”的原因。

一是主观期望效用模型。

主观期望效用理论是20世纪前半期最引人注目的智力成就之一,被赫伯特·西蒙称为“超凡模型”。该理论假设事件的每一特定状态均被指定为某一效用水平。该模型在概念上美轮美奂,值得在柏拉图的理想国中占据一席之地,但在具体应用中存在巨大的困难,使得我们很难按照字面意义将它应用于人类实际决策。

主观期望效用模型假设决策者能够对他所面临的世间万物无所不知。

主观期望效用模型隐含了价值观的比较。且价值观已把未来可能出现的所有替代性选择组织起来以表示连续性的偏好。主观期望效用模型的机巧貌似一种能够弄清楚世间万物当前与未来状态的机制。不过,充其量只能告诉我们如何对既定的事实和价值观进行推理,但对它们从何而来则什么都没有说。

一旦弄清楚了这些假设,我们就可以明确的认识到主观期望效用理论从来就没有被应用于真实世界,它永远不能够被应用于真实世界,即使借助了超级计算机。然而,我们却可以看到它在数理经济学、统计学和管理学中所谓的广泛应用。实际上,它只是对真实世界一小块且经过高度简化的应用,并且该决策过程所产生决策的好坏更多地取决于近似性假设和支持性数据的充分性,而不是按照主观期望效用的决策规则来计算一个最大值。在评价这类经济模型时,我们不能根据它们是否满足主观期望效用的基本假设来判断其真实性和有效性,而应该重点关注其对效用和未来事件的假设是否足够接近真实世界的实际情形。

二是行为模型。

我们的决策通常关注某些特定的具体事件,并且,我们会假设它们相对独立于其他事项。

当我们进行某一具体决策时,无论它有多么重要,都不可能对它在未来的具体详情了然于心胸:未来的情况不仅包含概率分布,还取决于决策时所做出的选择。

这个实际选择的过程,在某种程度上只不过是“有限理性”。我们有足够的理由做出这样的假设,即生物在进化过程中能够形成一种有限理性的能力。大量的心理學研究表明,人们往往会跟着感觉走,而这正是人类决策时所采用的决策模式。这种选择模式就是行为模型。

事实上,人类甚至所有生物所生活的环境,几乎都可以分解为相互独立的组成部分。有时你很饿,有时你很困,有时你很冷,但幸运的是,通常不会同时碰到这三种情形。即便同时碰上这三种情形,那么在最紧迫的需要解决之前,三者之中的其他两个至少可以推延。

我们生活的世界或许可以称为“寂寥世界”,它有着数百万个变量,它们在理论上可以互相影响,但在现实生活中的绝大多数情形则不会。

对于人类在思考和解决问题时运用的这种行为模型和有限理性,我们能够说的第一点是,目前有大量的证据表明,该理论描述的正是人们进行决策和解决问题的实际方式。该理论是对现实生活中人类行为的描述,这已得到越来越多的经验支持,具有坚实的经验基础。第二,该理论能够解释这样的事实:各种生物不论它们是否聪明、能否思考,也许相对于周围异常复杂的整个世界仅仅拥有有限的计算能力,但它们仍然能够生存甚至兴旺繁盛。它能够解释,在我们这个物种存活的同时,那些计算能力较低的物种何以能够至少存活了数百万年。在世间万物并非彼此紧密相连、各种问题都能够分解为相应组成的寂寥世界里,正是这种理性陪伴我们一路走过。

当然,行为模型描述的理性并不是最优的,它甚至不能保证我们的决策具有一致性。实际上,人类所做的选择通常取决于人们提出的各种替代选择时的顺序。

与前两种理性模型相比,第三种人类理性模型更少被社会科学家提及,但它却在社会公众的脑海中占据更为重要的地位,这就是“直觉模型”。直觉模型认为,大量的人类思维以及人们得到正确决策的原因,主要在于拥有良好的直觉和判断力。

所谓的直觉就是经验。当人们拥有一种经验并据此做出直觉判断时,他们得到的答案往往是正确的。在这一点上,国际象棋大师为我们提供了很好的数据。把一个布局合理的中盘棋局拿给国际象棋大师,他往往在看了短短5秒或10秒后,就能够走出下一步,并且这一步棋往往就是棋局中的最佳走法。与之不同,如果他是与一名强大的对手对阵,那么他就不会立即走出这一步:为了确定他的第一直觉是很正确,他可以坐等三分钟甚至半小时。不过,他的第一冲动实际上有80%-90%的可能性,走出了正确的一步棋。对于国际象棋大师的出色直觉,心理学家已对此做出了很好的解释。

为什么我们应该相信有关识别机制能够解释这种直觉?一个重要的原因是,大多数直觉只能发生在拥有一定知识储备的人的身上。为了达到世界一流水平所需要准备的时间,对于不同领域来说应该是大致相同的。赫伯特·西蒙的同事约翰·海斯收集到的国际象棋大师和作曲家的经验数据以及画家和数学家的不完整数据表明,10年是一个神奇的数字。在这些领域中,如果不能投入10年的密集学习和强化训练,几乎没有人能够达到世界一流水平。

这三种人类理性模型分别代表三种不同的理性概念,也是看待理性选择的三种方式。其中主观期望效用模型假定天地之间有一个进行综合性决策的英雄式人物,这种超凡模式也许是上帝的思考方式,但确实不宜视为人类的思维模式。

行为模型假设人类理性是一种非常有限的理性,深受有关境遇和人类计算能力的限制。大量的经验证据表明,这是一种能够有效描述人类如何决策的理论。

直觉模型更为强调知觉过程。直觉理论实际上是行为理论的一个组成部分,它强调的是一种识别过程:人类的技能是通过经验积累与识别而获得的,而这种识别过程则构成了其背后的基础。直觉理论认识到了人们的思想经常会受到情绪的影响,并解决了情感在将人们的注意力集中于特定问题时究竟扮演了什么角色的问题。对于直觉模型,社会心理学家格尔德·吉仁泽已经将其发展成为了一门科学——直觉科学。

在进化论中审视理性

现代达尔文生物进化论只关心结果 ( 即生存 )。当然它也假设至少存在两种机制的组合:一是变异,它创造生命的新形式;一是选择,它把那些能够很好地适应环境的生命形式保留下来。从最终结果的角度看待理性,是进化论中最为盛行的观点。进化论对事物进行解释的基本方式是:一切为了生存。生物体如何实现良好的适应状态,是一个比较容易引起科学兴趣的问题,但它与生存的基本事实相比,只能是第二位的东西。正因为如此,只要我们关心的只是最终结果,那么这种理性理论与超凡模型、行为模型乃至直觉模型就是相容的。

按照这种观点,鸟在树上筑巢是理性的,因为这有助于保护鸟蛋和幼鸟远离地面上的食肉动物。但是,这并不意味着亲鸟在选择筑巢地点时,经历了一种超凡型、行为型或直觉型的决策过程。筑巢只是一种简单的本能行为,一种在进化过程中从各种行为中挑选出来的、最具适应性的行为。正是在这个意义上,我们可以把进化过程的最终结果,视为理性的一种方式。

按照行为理论,为了寻找适应性反应,理性选择需要进行大量的选择性搜索。最简单、最基本的搜索过程是先产生可能的反应,然后检验其适应性。理性行为理论中的“发生-检验机制”类似于达尔文理论中的“变异-选择机制”。正如在生物进化过程中的新物种的产生会出现变异一样,人类在理性行为中也会产生某种新的替代性选择,即按照新的方式把各种简单思想糅合在一起的某种组合过程。类似地,正如生物进化论中的自然选择机制会把适应性较差的变异淘汰掉一样,人类思维过程中的经验也会把那些无助于解决问题的想法排除掉。

对于达尔文进化论和理性行为理论之间的这种相似性,经济学家理查德·纳尔逊和悉尼·温特对能够解释企业演化和适应性调整的类似机制给予了关注。他们文章中的“基因”是企业在从事生产经营活动时采用的习惯、惯例和标准操作过程。企业会时不时地设计新的操作规程,然后必须证明它们比原有规程更具市场竞争力。由于这套体系并不能保证总是会或接近最优状态,所以这一过程中的理性非常类似行为理性:它是适应性的,但未必是最优的。

对此,赫伯特·西蒙指出,在将进化思想应用于人类社会时,有必要对有关理论的统计假设保持适当的审慎。在我们关于优胜劣汰的抽象模型中,我们假设会产生一系列模式 ( 变异 ),并在一代代之中受到检验,其中的一种会在选择过程中保留下来。不过,如果我们试图把进化思想应用于当前社会,必须追问一下,基于重复实验的统计选择是否具有可行性。

一个人只能活一辈子,基于统计原理的某些试验注定是难以进行的。如果把进化设想成一种试错过程,那么在只有一次试验机会且不允许哪怕出错一次的情形下,这样的理论模型就不会是一种适宜的模型。因此,在把进化模型应用于人类这一物种和人类社会的未来发展时,我们必须保持足够的审慎。或许是来自赫伯特·西蒙的启示,纳西姆·塔勒布生造了“前渐进论”一词。塔勒布将前渐进论表述为,大数定律具备渐进收敛的特征,而肥尾的真实世界收敛很慢,我们可能一辈子都等不到,即我们的人生在收敛以前展开。

缺乏远见的理性

达尔文进化模型的基本机制是,变异会产生新的物种形式,而选择就会对这些新物种形式进行评估,并最终确定哪种形式能够生存下来。其核心理念是,适合度最重要。适合度能够告诉我们,为什么适合度更高的生物一旦出现以后就能生存下来。由复利计算公式可知,即便某种生物与竞争对手的单代适合度优势仅为1.05 : 1.00,那么只需要经过不足14代,其后代数量就会是竞争对手的两倍。假如人类已经进化了数百万年,这就意味着大约经历了10万代,其本身就表明了人类在适合度方面的优势。

生物的进化机制,提供的仅仅是一种缺乏远见的理性:适合度倾向于挑选出那些立即就可以拥有短期优势的生物体;无论从何处开始进化,生物体攀登的适合度之峰总是离它最近的局部峰顶。

在一个非常简单的世界里,短期优势会不断转化为长期优势。如果你是在这样一个世界里爬山,那么你终将登上世界之巅。不过,只有在仅有一座山峰的世界里,才能保证如此结果。如果生物体生活的世界是一个层峦叠嶂、丘壑纵横的世界,那么它就会发现,不论自己身处哪个山顶,除了下山别无选择。因此,任何进化论观点,即认为进化将最大适合度的观点指的都仅仅是局部极大值。除非我们认为地球有着特殊的简单形状,否则我们就不应该指望进化会导致任何可以描述为全局最大值的东西。

达尔文进化论是一种能够产生特定可能性并通过检验以保留适合度更高的物种的过程。只有所有可能的适合度水平的物种均已出现并接受检验的情况下,达尔文进化过程才能保证全局最大化的实现。如果从爬山有关的地形是动态变化的,那么全局最大化的适用性就值得怀疑了。如果生态位是不断演进和进化的,那么我们可以想象的到,进化过程不会导致任何可称为最优均衡甚至稳定均衡的东西。在这样的世界里,进化将不断开启新的可能性、新的组合形式。

从进化论角度审视理性过程,究竟意味着什么?

接受进化论,既不能保证我们拥有全局最大化的想法,也不能保证我们可以有着一切向着某种静态最优状态演进的想法;它能够给予我们的只是这样的信念,即只存在针对当前环境的各种局部适应性,同时向着本身也在不断移动的目标进行持续的变动。

理性进化模型并不能为我们提供一种关于理性过程的具体机制,它表明的只是理性过程可能的变化方向。

基于變异和选择的达尔文进化论,要求我们非常审慎的对待“自私基因”这一概念。即使是在弱肉强食的达尔文世界,我们仍然能够观察到许多被称为利他主义的行为。

在现实世界中,最重要最激烈的竞争过程,也许不是为了占据某个固定生态位而进行的竞争,而是某种生态位精化过程以及生态位的物种的特化过程。因此,没有必要把现实世界视为一个充斥着尖爪利齿的世界。

如果将进化论与人类理性的三种模型进行对比,那么进化论显然非常接近行为模型。其核心的适应机制都是搜索一种更具可能性的生存空间并对搜索结果进行评估。然而,这两种模型中的理性都是缺乏远见的,它们所实现的极大值都是局部极大值。所以,我们最好不要把它们视为一种最优化过程,而是视为一种机制,一种搜索到能够改善原有情形的新可能性的机制。所有知识都是一种假设,是猜测和暂时的,只能被证伪,永远不能被证实。

猜你喜欢

有限理性赫伯特进化论
改变
归乡喜若狂——进化论诞生背后的故事
达尔文与进化论
加9旬夫妇圣诞前被迫分居
地方政府不当干预对产能过剩的影响分析
法律家长主义的合理性及其限度
品牌进化论
Y1—Y6“爵”式造型进化论
物联网环境下基于演化博弈的动态频谱分配算法
智者和愚者