博弈参与者利益最大化策略选择的道义逻辑研究

2018-11-09贵州大学哲学与社会发展学院550000

大众文艺 2018年21期

（贵州大学哲学与社会发展学院 550000）

早期的现代逻辑学家们不注重心理或者情感因素对逻辑思维的影响，以弗雷格为主的逻辑学家甚至期望建立一个完全摒除心理与情感因素的逻辑系统，虽然这种想法对现代逻辑规范发展起到了促进的作用，但却脱离了人的实际生活，因为人的思维并不能完全摒除情感的影响，特别像是道义逻辑这种涉及道义范畴的推理，是不可能回避人的情感因素的。而情感往往体现在人的善恶之中，人的善恶通常又是人们理性活动的结果。研究博弈中受情感影响的理性主体的道义逻辑就很有必要。

博弈中理性主体的利益最大化策略选择的逻辑系统与标准道义逻辑系统并不是完全相同的。这就引起了从事博弈论方面研究的哲学逻辑家们的兴趣。因为道义逻辑中的一些观点非常适合描述博弈中参与者所承担的理性义务和允许范围。

通过对经典博弈解决方案所产生的义务和允许范围的研究，从而提出在博弈中的策略选择，这样将会产生一个特定的不同于标准道义逻辑系统的道义逻辑。为了更加清楚的阐明这个系统，先简要介绍一下有关于博弈论策略选择的相关概念。

一、策略选择的概念性解释

博弈论研究的是理性人活动中的互动行为，这里的理性人是指行动者具有推理能力，且在做出具体的策略选择时有使自己的利益最大化的推理能力。而博弈中涉及多个理性的行动者，这些行动者在如同谢林所称的“相互依存的选择和行为理论”1中起到相互作用。因此，也可以说博弈论是研究理性的行动者或者智能体之间相互作用的形式理论。本文所介绍的博弈属于战略式博弈，战略式博弈定义如下：

战略式博弈是一种相互作用的博弈模型，这种模型假设每个参与人仅选择一次行动或行动策略，且这些选择是同时进行的。

用战略式博弈对博弈问题进行描述只需要说清楚博弈的三个构成要素，即

（1）参与人集合Γ={1，2，…，n}；

（2）每位参与人非空的战略集Si，即∀i∈Γ，∃Si≠∅

（3）每位参与人的效用函数ui（S1，…，Si，…，Sn）

为了更加直观的理解战略式博弈，我们可以用具体例子来分析：有一个游戏叫做“猜2/3的平均数”。游戏规定n名参与者必须选择0到100之间的自然数字。他们需要在不知道其他人选择什么数字的同时做出自己的选择。胜者是选择最接近平均数2/3的人。如果只有一个赢家，那么这个赢家可以拥有所有的奖金，但是如果有一个以上的“赢家”，那么这些赢家需要平分奖金。为了拥有更多的奖金，每个人都想要成为唯一的赢家。

这个博弈最简单的情况就是只有两名参与者，假设这两名参与者为小李和小张，因此参与人i就是{小李，小张}且S 小李={0，1，...，100}，S 小张={0，1，...，100}，收益函数首先定义为小李的选择，然后用一组函数（l，z）代表小李与小张的选择，l表示小李的选择，而z表示小张的选择，γ表示胜率，那么在根据参与者在游戏中选择的数字最终的平均数的2/3可以用a来表示，则a=2/3*（l+z）/2。那么小李的获胜情况就如下所示：

由此公式也可以推出小张的胜率为1-γ小李（l，z）。那么小李和小张在这个博弈中应该做些什么呢？这里应用的标准解决方案是纳什均衡。如果把自己放在小李的位置，考虑小李和小张选择的情况都是100。在这种情况下，小李和小张两个人要平分奖金，因为两个人都等同的接近100的2/3。但是，考虑到如果小张选择了100，那么小李可以通过选择任何较低的数字来取得更好的结果，从而获得奖金。在博弈理论方面，当小张选择100时，同样选择100就不是小李获得利益最大化的最佳选择。实际上，因为其他参与者的存在，最好的选择其实是一个行为，因为在给定其他参与者的选择时，这样会产生一个至少与其他行为产生的结果一样好的结果。

假设小李和小张选不同的数字，每个数字都低于100，但都高于或等于1。如果小李选择最高的数字，那么这不是他最好的选择，他应该选择一个较低的数字，或略高于或略低于小张，这取决于他距离平均分数的2/3。但这样做使得小张也会选择更小的数字。这一动态将继续下去，直到小李和小张都选择了0。他们在那里达到了对双方来说最好的选择，即纳什均衡。既然选择了0，小张就没有选择其他东西的动机。除非在所有情况下，他选择放弃奖金，那么这些奖金将全部小李，对小李来说反之亦然。纳什均衡的定义如下：

在一个n人博弈的标准式G={S1，S2，…，Sn;u1，u2，…，un}，一个策略组合{S1*，S2*，…，Sn*}，若满足ui（s1*，…，si*，…，sn*）≥ui（s1*，…，si，…，sn*）（i=1，…，n），则称这个策略组合{S1*，S2*，…，Sn*}为该博弈G的一个纳什均衡。从实质上说，纳什均衡是一种非合作博弈状态。

纳什均衡是在博弈者共同的一系列连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。但需要注意的是，最优策略不一定达成纳什均衡，严格劣势策略也不可能达成纳什均衡，而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡。

二、合理化建议的逻辑结构

在博弈中，参与者是理性的人是一个公共知识，因此小李和小张不应该在非理性的情况下，做出对彼此都不是最好的结果的行动。理性建议是一种从博弈的解决方案中获得的规范性建议，例如，如果小张不选择100那么小李也不应该选择100。在博弈中，纳什均衡和最优策略不一定是唯一的解决方案。

在博弈中，义务和允许应该分别被看作关于理性的必要条件和充分条件，因此，这两个概念不应该被视为是相互对立的。如果这种观点是正确的，那么这对于这种义务和允许的道义逻辑就具有重要意义。理性是博弈解决方案中的重要概念。正如上文例子所示，博弈的解决方案指出了在博弈中理性是得出解决方案的重要因素，在博弈中理性分析其他参与者的策略或想法，再考虑平均值的2/3做出的选择就是理性主体的选择。在这里，在其他人选择100的时候最好的选择是小李和小张都选择比较小的数字。在博弈中，利用纳什均衡分析是小李和小张对对方正在做的选择的最优策略。

向参与者提出建议同时提供解决方案以及规范的解释。但是这些建议是什么样的？首先要做的就是提供理性的允许范围，不一定是必须要做到的策略。博弈中的理性允许范围应该是指指出合理的权限，不一定是确切的方案。

其次是理性的允许范围为最优策略提供了足够的条件。拿上面的例子来说，考虑到小张选择了100，只要低于100，那么小李选择任何数字都是理性的。在这个博弈中，只要是“低于100”的数字都被理性地允许为可接受的，也就是说都是最优策略。在游戏中如果小张选择了100，那么在这个博弈中选择低于100的任何数字都是小李的最优策略。此外，理性的思考任何一个从逻辑上可以在博弈中更好的取得胜利的数字，也是小李对小张选择100的最优策略。因此，只要选择低于100的数字，或者仅仅只是选择0，这对小张选择100来说都是最好的选择。从最好的期望效用的角度来看，这些选择在这个特定的博弈中也都是最好的选择。因此从理论上来看，从概念上理解理性选择的恰当方法就是理解为理性的允许范围。

如果“低于100”是理性允许的解决方案，那么这个解决方案就为理性提供了充分的条件，从这个角度来说，逻辑上更加有说服力的行为应该也被视为是允许的，而最优策略无法进一步区分它们。这种情况是比较普遍的，因为在博弈中有许多理性的允许范围。从这个角度来说，提供了以下原则：

强理性允许，如果一个行为φ在博弈G中被理性所认同，当且仅当φ行为的策略意味着它是一个理性的策略，

如果强理性允许原则是正确的，那么它将会对理性建议的逻辑分析产生重要的影响，其中最重要的应该是被称为“自由选择权限”

事实上，如果φ∨ѱ被认为是博弈选择φ和ѱ间的非确定性选择，如果任何一种类型的策略都足够理性，那么选择φ的任何类型战略和选择ѱ的任何类型的战略都是足够理性的选择，所以这两个都是理性所允许的。

如果允许范围为理性提供了充分的条件，那么很自然的它的对等者就会将义务视为必要条件。换一种说法：

弱理性义务是指一个类型的行为φ在博弈G中是理性的行动，或符合合理要求的，当且仅当没有选择ѱ类型的策略则意味着不是理性的行动。

我们称这个原则是“弱理性”，因为它暗示了一种在逻辑上较弱的情况下终止义务的形式。如果理性要求选择φ，那么行为φ就是理性的行为选择。但是，这也意味着可以选择任何更弱的策略。所以逻辑上较弱的行为类型将是强制性的。我们在上面的“猜平均值的2/3”这个游戏的分析中也能看到这一点。

接受强理性允许和和弱理性义务这两个原则的重要作用就是义务和允许将不再是相对的。在上面的例子中，对于小李来说，选择高于50的数字也是允许小李作为对他的对手选择100的最佳选择。但是这并不是对于对手选择100的所有最优策略，因为对于他来说这是一种类型的策略行为，这种策略的选择并不是唯一的。对于这种策略来说，不要打高于50的数字与打低于或等于49的数字一样。但是这也并不是强制性的，因为不选择这个数字并不意味着没有最好的选择。所以理性的选择范围和理性的要求在这里不是相对的。

三、理性人的行为选择

一般来说，许多博弈并不是只有唯一的的解决方案，因为有许多博弈是不完全信息博弈，博弈中参与者不知道其他参与者的具体选择，只有利用纳什均衡去考虑对方可能的选择才能做出对应的选择。譬如说在上述游戏中，应该首先考虑到其他参与者选择100，在此基础上再考虑最优策略。应该说从0到99的任何数字都是对对方选择100的最佳的选择。唯一不是最优策略的就是自己选择100。面对这样的多个解决方案，在博弈中无法做到选择所有的数字，这些都是互斥的行为。那么，如果“应该意味着可以”，那么参与者就没有义务去选择每一个解决方案。在博弈中，选择这些解决方案中的任何方案作为自己的行动策略都是理性的。非唯一的解决方案在博弈中无处不在的，因此从理论上来说只要是合理的建议方式都可以作为理性主体的策略选择。

我们把强理性义务，弱理性允许等作为想要在博弈中获胜的核心特征或者说是理性建议，这些原则所限定的允许范围以及义务为取得利益最大化提供了必要和充分的理性条件，而且这些条件并不是相对的。这些原则都是可以被看作是符合博弈中理性建议的逻辑，由此所做的策略选择都是符合理性人特征的行为选择。

注释：

1.谢林1978年在《微观动机与宏观行为》一书中将相互依存的选择和行为理论解释为归类、分析单个人的决定最终导致出乎人们意料的集体行为的现象。这种人们所不情愿的集体行为不仅源于人们的决定对外部资源瓶颈的敏感，还源于人们的决定往往是对其他人的行为所作出的反应。