“利益-规范”双重博弈：一个基础性探讨

2022-08-30刘世定严俊刘玉照

社会观察 2022年7期

文/刘世定严俊刘玉照

引言

在经济社会学有关规范与行为的研究中，一种流行范式的特征是：将社会规范作为外生给定的环境条件，考察被这种规范所约束的主体的行为及后果。这种范式能够解释在稳定的制度环境下的一系列现象，但鲜有对制度变迁机制本身的深入分析。

在制度变迁研究中，则流行着来自经济学的一个范式。该范式假定，当人口、技术乃至观念的变化导致资源的相对价值发生变化，行动者意识到新的制度安排将给他们带来更大收益的时候，变迁的激励便产生了。该范式在运用博弈论分析工具的时候考虑基于资源占有量的利益博弈，但是对于行动者间的规范博弈，则不投放注意力。

本文将考察的是正在经济社会学中发展的与上述两种范式不同的另一种范式。这种新范式在人们的利益和规范双重博弈中考察其利益格局和规范格局的形成与变迁。也就是说，它既关注人们之间的利益互动，也同时关注携带不同规范的人们之间的规范互动。

行为假定与“利益-规范”效用函数

我们假定，互动参与人是既讲利益，又讲规范的人。同时假定，他们在互动中各自携带的规范可能存在差异。这种行为特征可以用效用函数表达如下：

式中，U为主体i的效用，X为i拥有的物质资源，R为i遵循的行为规范。

我们将公式（1）称为主体i的综合效用函数。在某些时候，可以把综合效用函数分解为两个子效用函数：

我们将子效用函数（2）称为主体i的利益子效用函数；将子效用函数（3）称为主体i的规范子效用函数。

有必要指出，本研究对“利益”概念的使用方式与惯常用法有所不同。一般来说，对“利益”的一种使用方式，是将其视为物质资源给人带来的好处。而在另一种使用方式中，则将之等同于当代经济学中的效用概念，即表示人获得的满足感。

将这两种对“利益”的使用方式与公式（1）、（2）、（3）对比，不难发现，后一种使用方式（即将“利益”等同于效用概念）对应着公式（1），即综合效用函数；而前一种对“利益”的使用方式，则对应着公式（2），即本文所谓的利益子效用函数，该函数不能覆盖规范效用函数。作为本研究的一个基本工具性概念，我们将在“物质资源给人带来的好处”这一意义下，即第一种理解方式上使用“利益”用语，对这种使用方式的更精确表述，是公式（2）。

对公式（2），当存在多个资源选择方案，行为主体i对每两个方案都能做出排序，且排序能够满足可传递性，并试图在选择中最大化其效用，即MaxU(X)，我们就称i具有利益理性。

同样，对公式（3），当存在多个规范选择方案，行为主体i对每两个方案都能做出排序，且排序能够满足可传递性，并试图在选择中最大化其效用，即MaxU(R)，我们就称i具有规范理性。

在公式（1）以及公式（3）中，当我们把规范（R）作为影响效用（U）的自变量时，强调其影响是直接的影响，而不是来自对规范如何影响资源获取的考量。在后一种情境下，规范对效用的影响是间接的。这种间接影响可以用公式表示为：

从公式（4）与公式（2）的关系中可以看到，社会规范R是先影响了i拥有的物质资源量X，再通过X影响到i的效用。

相应地，在对效用的间接影响方面还有另一种情况，即：

公式（3）和（5）表示的是，i拥有的物质资源X并未直接影响其效用，而是间接地通过R影响i的效用。

博弈论框架下的利益效用函数与规范效用函数

在博弈论框架下，每一个参与者的预期效用是自己的策略与其他参与者策略组合的函数。我们首先采用一般标准式表述如下。

在一个n人博弈G中，参与者排序为1,2,…,n，其中任一参与者的序号为i。S表示参与者i的可选择策略集合，其中任意一个策略用s表示，s∈S。令（,…,）为每个参与者选定一个策略时形成的策略组合，则参与者i的预期效用为：

在利益和规范双重博弈G中，参与者i的策略集合S中的任何一个策略都存在着两个维度，即利益维度策略s和规范维度策略s，用s=(s,s)表示，s∈S。同时包含了两个维度的策略S称为综合策略。

由于＝(,),…,s＝(s,s)，因此，参与者i的预期效用公式（6）可表示为：

公式（7）表示，i的预期效用是其自身的利益策略和规范策略、其他参与博弈者的利益策略和规范策略的函数。

事实上，公式（7）把博弈参与者的利益策略和规范策略与预期效用结合起来的时候，隐去了中间环节。结合前文的讨论，更严格地说，i预期获取的物质资源与自身达成的行为规范，均是其自身的利益策略和规范策略、其他参与者的利益策略和规范策略的函数；进而，i的预期效用是通过博弈获得的物质资源与行为规范的组合的函数。可以用公式表示如下。

因此，公式（7）可以看作是公式（8）、（9）、（10）的简化表述。需要额外指出的是，公式（8）、（9）、（10）不仅展现了在公式（7）中隐去的“利益-规范”策略与效用的关联，而且展现了利益维度策略和规范维度策略之间的联结性质。

采用博弈论的标准式，我们可以将博弈参与者的双重策略和其预期效用间的关系简化表示如矩阵1。

在矩阵1中，假定存在两个参与者。参与者1有两个综合策略：和；参与者2也有两个综合策略：和。每个参与者的每个策略都有利益和规范两个维度。参与者1和2的一个策略组合对应的各自收益标注在行与列交叉的栏中。

矩阵1 双重博弈的标准式

矩阵1的标准式表示的是静态的双重博弈，其中各个参与者的利益维度策略和规范维度策略是同时提出的，不存在先后的调整。这是一种比较单纯的情况。而动态的双重博弈的情况则更加丰富。从双重策略运用方式的角度，可以将动态的双重博弈分为以下3类：

（1）博弈参与者依次采用综合策略，即同时包含利益维度和规范维度的策略。

（2）博弈参与者将双重博弈分成两个阶段进行，每个阶段只进行单一博弈，在前一阶段的单一博弈获得“解”之后，再进行后一阶段另一单一博弈。

（3）参与者相机采用利益维度策略、规范维度策略或综合策略进行博弈。这一类博弈中包含两个维度不对称博弈子类。一个子类是，参与者一方采用单维策略，另一方采用两维度综合策略。

双重博弈均衡与非均衡

概括地说，“利益-规范”双重博弈均衡是指博弈的任何参与者既没有激励单方面改变其利益维度策略，也没有激励单方面改变其规范维度策略的状态。

我们可以在矩阵1的基础上，对博弈双方诸策略组合的收益具体赋值，来直观地说明双重博弈策略的均衡与非均衡，见矩阵2。

在矩阵2中，参与者1有两个综合策略和，参与者2有两个综合策略和。

矩阵2 双重博弈的策略均衡与非均衡

如果单就利益维度子博弈而言，参与者1和2的均衡策略组合是（,），相应的收益为（5，4）。这是因为不论行动者1选择策略或，行动者2都以为优；而当行动者2这么选择时，行动者1将选择。

式中:λ1和λ2均为阈值,且有λ1=kλ2,0

如果单就规范维度子博弈而言，参与者1和2的均衡策略是（,），相应的收益为（6，4）。

可以看到，对参与者1而言，利益维度子博弈的均衡策略与规范维度子博弈的均衡策略分属两个不同的综合策略中。这意味着，不论是在单纯的利益维度子博弈均衡时，还是单纯的规范维度子博弈均衡时，双重均衡并未实现。在矩阵2中，“利益-规范”博弈的双重均衡要通过综合策略均衡实现，均衡策略组合是（,），相应收益为（11，10）。

矩阵2是通过一个静态博弈的例子来说明“利益-规范”双重博弈均衡同时实现。这是最明快地展现双重博弈实现均衡抑或未实现均衡的方式。不过，现实中的双重博弈均衡大都是经历动态双重博弈过程实现的。从动态角度看，双重博弈有可能贯序实现“利益-规范”双重策略均衡，而不是同时实现。

在上一节中，我们曾将动态双重博弈分成3类。在第1类，即博弈参与者依次采用综合策略的动态博弈中，如果存在均衡解，那么双重均衡将同时实现。而在第2类，即博弈参与者将双重博弈分成两个单一博弈并分两个阶段进行的博弈中，如果存在双重均衡解，则它将序贯实现。在第3类，即博弈参与者相机采用利益策略、规范策略或综合策略进行的博弈中，如果存在双重均衡解，则它既可能序贯实现，也可能同时实现。究竟以何种方式实现，取决于相机采用策略的具体情况。

双重博弈均衡的稳定性：强化与弱化

在真实生活中的博弈论研究中，不仅关注一定条件下的博弈均衡解，而且关注均衡的稳定性。对此，本文关心的是，较之单纯的利益或规范博弈，“利益-规范”双重博弈在均衡稳定性方面可能具有的强化或弱化作用。

这里有关均衡稳定性问题的讨论涉及利益博弈和规范博弈之间的连带关系。我们将其间的关系简化为两类，一类是负向连带关系，另一类是正向连带关系。下面分别加以阐述和讨论。

（A）负向连带关系

所谓负向连带关系是指，在双重均衡形成后，由于某些条件的变化，博弈参与者i发现了比其均衡策略更优的获取利益效用的策略，但采用这一策略会导致其规范效用的缩减；或博弈参与者i发现了比其均衡策略更优的获取规范效用的策略，但采用这一策略会导致其利益效用的缩减。

较之单一博弈，双重博弈间负向连带关系的存在会使博弈参与者做出更多的权衡：当新综合效用大于原均衡策略效用时，他们会打破原有均衡；当新综合效用小于原均衡策略效用时，他们会维持原有的均衡。不论是哪种情况，双重博弈间负向连带关系的存在对原均衡的破坏都起到了迟滞作用，从而强化均衡稳定性。

（B）正向连带关系

所谓正向连带关系是指，在双重均衡形成后，由于某些条件的变化，博弈参与者i发现了比其均衡策略更优的获取利益效用的策略，而这一策略的采用会带来规范效用扩大；或博弈参与者i发现了比其均衡策略更优的获取规范效用的策略，而采用这一策略也会带来利益效用扩大。

与单一的利益博弈或规范博弈相比，具有正向连带关系的双重博弈的参与者一旦发现了比原均衡策略更优的策略，会在利益效用和规范效用的双重推动下加速偏离原来的策略均衡。这意味着，在存在正向连带关系的条件下，“利益-规范”双重博弈较单一博弈具有弱化均衡稳定性的作用。

展望

我们对近期可能的研究前景做一粗略展望：（1）推动经验案例与双重博弈理论模型的对话研究；（2）推动典型领域的经验与理论研究；（3）推动跨文化研究方法的发展；（4）推动对某些既有理论的再思考；（5）推动对经典文献的再研究。

猜你喜欢

效用函数双重效用

自然与成长的双重变奏

效用函数模型在动态三角模糊多属性决策中的应用