演化博弈视角下的区域合作机制研究*

2019-03-27满舰远张可云

区域经济评论 2019年2期

满舰远张可云

随着区域经济的发展及区域一体化程度的提高，中国区域合作实践和区域合作研究也上升到了一个新的高度。然而在已有文献的研究中，有关区域合作的理论研究相对不足，且主要集中于宏观层面，微观层面的分析相对有限，特别是有关博弈论基础上的机制研究不是很全面。

实际上，作为现代经济学的主流方法类学科之一，博弈论在经济学分析范式的继承、突破和发展方面发挥着重要作用。以博弈论分析框架研究区域合作问题能够更好地阐明区域合作背后的发挥机制和作用关系。然而，由于博弈论分析的假设前提过于苛刻，同时考虑到分析方法的复杂性以及分析手段的局限性（难以研究多区域主体合作问题），博弈论分析框架并没有得到区域经济研究者的普遍关注。目前，仅有的少数文章虽不同程度地借用了博弈论的分析思路，但是在框架设计和区域合作的情景构建上仍存在一定短板。例如，谢思全等（2008）通过构建协调博弈分析框架，对区域内参与博弈的地方政府主体的偏好、相互间的策略互动和一致性行为进行了描述。田艳平等（2015）从区域间的合作困境出发，对促进区域合作、利益共享进行了理论分析。但是这些研究或是缺乏对区域协调类型的分析，或是未考虑多区域主体下的情形，或是缺乏“囚徒困境”之外的情形拓展。鉴于此，本文试图运用博弈论方法，在区分区域合作类型的基础上构建能够反映区域合作机制的分析框架。在基本假设方面，为契合演化博弈论分析条件，本文假定区域合作主体为有限理性的参与者，同时在区域合作方面具备一定的“继承性”①。

一、相关理论基础

与经典博弈论一样，演化博弈论也存在一个特定的博弈分析框架。这个博弈分析框架主要是指博弈的结构和规则，两者都内生于特定的技术和制度条件。与经典博弈分析不同的是，演化博弈论假定参与者为有限理性，即参与者并不拥有博弈结构和规则的全部知识，同时在信息传递渠道上演化博弈论假定参与者是通过某种传递机制而非理性选择获得决策，譬如生物学中的基因遗传渠道。在博弈分析中，演化博弈论分析还涵盖了生物进化论中有关演化的两类基本机制——变异机制和选择机制，分别对应演化博弈论的稳定性分析和选择动态分析。由于变异机制主要用于检验演化均衡的稳定性问题，选择机制往往成为演化博弈论分析的重点。因此，也就出现了众多不同的选择机制设计框架，比较流行的包括复制动态演化分析框架、基于随机过程的演化动态分析框架、基于智能优化算法和神经网络学习机制的分析框架等。

其中，经典的复制动态演化分析框架常用于研究数量无限大且混合均匀的单个种群中任意两个个体等可能参与博弈时的情形。虽然该框架能够较好地描述生物演化的选择过程，但是它很难直接运用到社会经济演化的相关研究中。因此，为便于对由有限个策略性互动主体（可以是个人、厂商或者其他社会经济单位）组成的总体进行建模分析，Björnerstedt等人通过引入模仿机制对复制动态演化分析框架进行了拓展，这些机制包括不满意驱动的纯模仿、成功主体的模仿I型和Ⅱ型等。研究发现，引入成功主体的模仿机制（I型）后的模仿动态式在向量场的构造上大致为复制动态式的常数倍。这说明复制动态演化分析框架中的一些主要结论并没有因假定设置的改变而发生明显变化。正是基于上述特点，本文可以直接借用复制动态结果来描述和分析社会经济主体参与下的演化博弈情形。为便于后文分析，我们首先引入收益矩阵为2×2型的对称博弈，并对其做如下变换②：

其中，a1=R-T，a2=P-S；a1，a2≠0。根据 a1、a2符号的不同可以分为以下4类博弈，表1给出了4类博弈的典型代表、纳什均衡集合及复制动态结果。

1.纳什均衡集合

第一类博弈。在这类博弈（a1>0，a2＜0）中，策略1严格优于策略2。因此，这类博弈都是占优可解的：SD=S={1，1}，ΘNE={（e1，e1）}，ΔNE={e1}。这类博弈的典型例子就是共赢博弈。

第二类博弈。这类博弈（a1>0，a2>0）有两个对称的严格纳什均衡，而且容易验证混合策略x=λe1+（1-λ）e2⊂Δ是针对其自身的纳什均衡。因此，这里我们有 SD=S={1，2}，ΘNE={（e1，e1），（e2，e2），（x，x）}，ΔNE={e1，e2，x}。这类博弈的典型代表包括协调博弈、猎鹿博弈。

第三类博弈。这类博弈（a1＜0，a2＜0）没有策略被占优，SD=S，但是对纯策略的最优反应是另一个纯策略。因此，这类博弈有两个不对称的严格纳什均衡和一个对称的混合策略纳什均衡：ΘNE={（e1，e2），（e2，e1），（x，x）}和ΔNE={x}。这类博弈的典型代表包括雪堆博弈、鹰鸽博弈。

第四类博弈。这类博弈（a1＜0，a2>0）都是严格占优可解的：SD={（2，2）}⊂S。从而，ΘNE={（e2，e2）}且ΔNE={e2}。这类博弈的典型例子是囚徒困境。

表1 4种博弈类型的相关情况

2.复制动态结果

第一类博弈和第四类博弈。如果a1a2＜0，那么总体份额x1要么总是上升（a1>0和a2＜0时），要么总是下降（a1＜0和a2>0时）。因此，从任何内点的初始位置出发，总体状态都会收敛到此类博弈唯一的ESS③。

第二类博弈和第三类博弈。如果a1a2>0，那么当a1x1=a2x2时，x1的增长率会改变符号，这会发生在混合纳什均衡值x1=λ=a2/（a1+a2）时。首先，假设两个收益都是正的（第二类博弈）。那么总体份额x1从任何初始值x10＜λ会减小到零；相反，从任何初始值x10>λ会增加到1。换言之，从任何内点初始位置出发，总体状态会收敛到这类博弈中的两个ESS之一。它们的吸收域（Basins of Attraction）会在混合策略纳什均衡点x1=λ处相遇。其次，假设两个收益都是负的（第三类博弈），那么总体份额x1从任何较低的（内点）初始值都会增至λ；从任何较高的（内点）初始值都会降至λ。因此，总体状态从任何内点初始状态开始都会收敛到这类博弈唯一的ESS。

二、原始分析框架：区域合作博弈

在利用博弈论分析区域合作问题之前，区域主体能否作为参与方纳入博弈分析框架中应该是我们首先需要考虑的问题。所幸的是，制度性集体行动（ICA）理论指出，在分散化权威的情况下，由于存在规模经济性、正的或负的外部性以及共有产权等问题，一方的决策会对另一方产生影响，或者一方的决策取决于另一方的行动。换言之，区域作为一类相对独立又互相影响的决策主体，在满足博弈论中有关认知理性和行为理性的基本假定下，可以作为演化博弈分析的研究对象。

本文研究的区域合作仅限国内层面，在区域主体的界定上要求参与者处于同一地域空间。考虑到区域主体收益矩阵的形式差异以及区域主体来源的不同（单一总体还是多个总体），可以将区域合作类型分成单总体型区域合作和双总体型区域合作。前者包括共赢型区域合作、互补型区域合作、共建型区域合作、分配型区域合作等4类，划分的主要依据是收益矩阵的形式差异；后者是指补偿型区域合作，根据总体来源的不同区域，主体可分为补偿类区域主体和被补偿类区域主体两类。需要说明的是，本文关注的对象主要是单总体型区域合作。为了研究方便，假定在各类区域合作的博弈分析中同一总体的区域主体面临着相同的收益矩阵。我们首先考虑存在两个区域主体时的情况，表2直接给出4类单总体型区域合作的博弈描述。

1.共赢型区域合作

共赢型区域合作中收益矩阵的主要特点是R＞S＞T＞P。在两种策略选择中，合作策略属于绝对占优策略，为实现区域收益最大化，博弈双方都是无猜疑地参与合作。现实中，此类区域合作出现的契机为某一标准体系的引入，如碳排放标准、汽车尾气排放标准等。在引入过程中，区域主体会根据彼此对同一标准体系的认可程度来决定各自的策略选择。一般而言，该标准体系的引入能够给区域发展带来新的活力，同时也能给周边区域主体发展带来正外部性。因此，单个区域主体具有较大的积极性加入到该体系中。显然，只有在两区域主体均纳入该项标准体系时，单个区域主体的收益才会达到最大，其收益组成包括加入标准体系后的原始收益b和彼此间的正外部性c。

表2 4类单总体型区域合作的博弈描述

2.互补型区域合作

互补型区域合作中收益矩阵的主要特点是R＞P≥T＞S，其策略组合有（e1，e1）、（e1，e2）、（e2，e1）、（e2，e2）4种形式。在4种策略组合中，严格纳什均衡（e1，e1）帕累托优于严格纳什均衡（e2，e2），然而，这并不意味着理性的区域主体一定会选择合作。考虑猎鹿博弈的情景④，策略组合（e1，e1）比（e2，e2）的风险更高：对手的偏离会造成b单位的损失，而对手的合作只会带来 c单位的收益（b＞c）。根据Harsanyi和Selten（1988）的说法，均衡（e2，e2）风险占优于（e1，e1），然而帕累托占优均衡却是（e1，e1）。在行为不确定性环境下，参与人决策时离不开风险性与收益性之间的权衡。为了实现帕累托占优均衡，参与者往往需要具有更多的信息和信念以减弱行为的不确定性。现实中，此类区域合作现象一般会受区域主体规划战略的影响：具备合作意向的区域主体通过明确战略规划释放合作信号，并利用政府信用背书的方式通过各种手段降低彼此参与区域合作的风险预期，这些手段包括合作区联席会议、区域合作与发展论坛等。

3.共建型区域合作

共建型区域合作中收益矩阵的主要特点是T＞R＞S＞P，该类区域合作往往是为了促进要素的流动或是争取更多的政策资源。在该类合作形式中，一方面，参与方存在通过搭便车减少合作努力程度的正向激励。例如，在区域基础设施合作项目中，受地区财力限制的影响，同一区域范围内经济发展相对落后的地区倾向于降低自身的基础设施建设标准。另一方面，由于此类区域合作博弈在一个项目周期内属于有限次博弈，项目参与方在推行区域合作的过程中往往会利用项目评估、绩效考核等方式，通过施行奖惩办法以改变各自的最终收益形式，进而影响区域合作双方当期的决策行为。

4.分配型区域合作

分配型区域合作中收益矩阵的主要特点是T＞R＞P＞S，相对于共建型区域合作，该类区域合作具有更强的负向激励（S＜0）。该类区域合作主要涉及共有产权资源使用权分配和责任分担等问题。例如中国流域水资源管理中的水量分配、水资源保护和水污染治理⑤、区域大气污染治理中的污染物削减指标分配等。这种区域合作针对的是共有产权情况下的“公共池塘”问题，作为相对复杂的一类公共合作问题，埃莉诺·奥斯特罗姆教授曾对其做过系统性研究。她指出要解决“公共池塘”资源的集体行动问题，需要解决3个问题：新制度的供给问题、可信承诺问题、相互监督问题。鉴于此，合理合序的机制设计、现实有效的法制约束、灵活可控的监督手段是分配型区域合作的主要关注点。

区别于前4类区域合作的主体来源假定，补偿型区域合作的总体来源包括两类，即补偿型总体和被补偿型总体。相应地，区域主体面临的收益矩阵也变为两种：一种反映补偿方的收益情况，另一种反映被补偿方的收益情况⑥。该类区域合作所要解决的是外部性的内部化问题：当存在正的或负的外部性时，如果不能有效实现外部性的内部化，就会引发地方政府之间的矛盾和纠纷，在收益矩阵中表现为c'的增大以及整体收益的减少。例如张家口等北京周边地区开展生态环境修复，关闭污染企业，为首都地区生态环境带来了正的外部性，因此就应该予以补偿。然而，由于其收益矩阵特征（零和博弈）和博弈形式特点（无限次博弈），较难通过经济激励和社会管理的方式从根本上解决外部性问题。一种可行的方案是通过政治激励带动区域合作，将区域影响范围内补偿措施的落实情况作为衡量政绩的其中一类参照。但是这类政治考核改革无疑有一定的操作难度。由于无法准确衡量外部性的区域影响范围，并且根据各地的相关情况确定合理有效的绩效考核权重也存在难度，因此，不可避免地会存在一系列政策漏洞。考虑到现有文献中有关补偿型区域合作的研究相对较多，且涉及生态补偿这一重大研究课题，同时鉴于此类问题分析的复杂性，双总体型区域合作将不作为本文的研究重点，我们仅对单总体型区域合作进行多主体框架下的博弈拓展。

三、多区域主体参与条件模型

区域合作显然不只局限于两个区域主体之间，多数情况属于多个区域主体共同参与合作。在这种情况下，区域主体数量和区域合作环境将成为约束主体参与区域合作的附加因素。此时，数量机制和环境机制如何发挥作用，进而影响单个区域主体的决策过程是一个值得探讨的话题。然而，由于研究方法的局限性，博弈论分析所采用的二维收益矩阵只能用于研究两区域匹配条件下的合作情形。为了考察多区域主体参与区域合作的作用机制，一种折中的算法是通过区域主体两两配对的方式将多区域主体合作情形纳入博弈论分析框架。

假定在同一区域范围内有N个主体，其中参与合作的主体数量占比为x，则1-x的区域主体将选择背离（0＜x＜1）。后续分析将通过N和x来研究多区域主体合作的数量机制和环境机制。现在对区域主体进行两两随机配比，利用二项式定理我们有如下公式：

依据公式（1）、公式（2），很容易推出fCC、fCD、fDC、fDD和PCC、PCD、PDC、PDD的对应关系。结合公式（3）—公式（6），可以实现原始区域合作分析向多区域主体合作分析的框架转换，其收益矩阵变化如下式：

结合公式（8）以及各类单总体型区域合作中的原始收益矩阵形式，可以得到多区域主体参与下的区域合作博弈收益矩阵，见表3。

可以看出，N和x引入后的单总体型区域合作博弈，其类型将变得更为复杂。如果以N表示数量作用，x表示环境作用，数量机制和环境机制的综合作用结果就决定了各类区域合作博弈的形式变动情况。随着区域主体数量的增加，多区域主体研究框架将回归两区域主体参与区域合作博弈情形⑦。对于各类区域合作中机制作用的具体情况，我们将分别进行讨论。

表3 多区域主体参与下的区域合作博弈

1.共赢型区域合作

图1 系数模拟结果

当b、c的参数设置已定时，区域主体数量和区域合作环境都会影响到共赢型区域合作的博弈类型变化：随着N和x值的减少，Γ系数落入右图阴影部分的概率将会增大，即博弈类型为第三类博弈的可能性将会提高。这说明在共赢型区域合作中，某一标准体系能否在区域内复制推广以建立广泛的区域合作联系，除受到该标准体系适用范围的影响（数量机制作用）外，还会受该区域现有合作条件（环境机制作用）的制约。这与我们的直观判断相符：当区域合作条件较差（x较小）且标准体系的进入壁垒较高（N较小）时，共赢型区域合作的开展往往会有较高的不确定性。

综上所述，考虑多区域主体情形，在共赢型区域合作分析框架下，标准体系的外部性特点、区域主体数量及区域合作环境都会不同程度地影响此类区域合作的开展。具体而言，区域合作标准体系中的外部性会阻碍区域合作，而较高的进入壁垒和较差的区域合作条件又会通过数量机制和环境机制提高区域合作的不确定性。因此，降低区域合作中标准体系的外部性⑧和进入壁垒，维护形成良好的区域合作环境是此类区域合作得以推进的关键。

2.互补型区域合作

互补型区域合作的博弈类型在引入多区域主体分析框架后可能发生两种变化：一种是由第二类博弈向第四类博弈转化，主要发生于b′值偏高、φ（1-x）系数偏大时的情形。由于备选策略较具吸引力（b′值偏高），同时受区域合作条件的制约（φ（1-x）系数偏大），合作上的相互猜疑以及普遍存在的机会主义都将影响其未来的合作前景，进而使互补型区域合作陷入囚徒困境。

另一种是第二类博弈类型向自身的转化。考虑到此时的内点均衡发生了一定变化，此类情形在形式分析上相对复杂。为了研究方便，不妨令b′=0，此时的混合纳什均衡值其形式变为：

图2 F系数模拟结果

由表1中的复制动态结果可知：当初始份额x>λ′时，演化博弈结果将向着合作占比较高的ESS收敛；当初始份额x＜λ′时，演化博弈结果将向着合作占比较低的ESS收敛。为保证演化博弈总是向着“好的”方向发展，在初始值x不变的前提下应尽量减少λ′的取值。显然，这里的λ′是F值的减函数。考察函数F（N，x），结合图2的系数模拟结果可知：当初始份额x>0.5时⑨，N值越小，F值越大，λ′越小；当初始份额x＜0.5时，N值越大，F值越大，λ′越小。因此，对于互补型区域合作，在多区域主体分析框架下：当区域合作的现行基础较好时，区域主体数量越少，未来的合作前景相对越好；当区域合作的现行基础较差时，区域主体数量越多，未来的合作前景相对越好，但不会超过现行合作条件较好的区域（F值小于1）⑩。这给我们带来一些启发，对于互补型区域合作，当区域合作的初始条件较差时，区域主体数量的提升在一定时段内能够提高区域合作的发生概率。然而，随着时间的推移，区域合作的基础环境将得到改善，当其达到某一临界值时，这种数量提升效应将会出现逆转——较多的区域主体数量反而成为阻碍区域合作潜力进一步释放的因素。此时，只有通过减少参与主体数量才能实现合作前景的进一步改善和升级。

综上所述，考虑多区域主体情形，在互补型区域合作分析框架下，一方面，备选策略的吸引力和区域合作条件的好坏会直接影响其博弈类型的转换。备选策略吸引力的降低，区域合作条件的改善能够有效避免互补型区域合作陷入囚徒困境。另一方面，区域合作条件的好坏将通过数量机制和环境机制影响互补型区域合作的演进历程。当区域合作的初始条件较差时，区域合作主体数量的增多能够推动互补型区域合作的开展。然而，这种促进作用只是暂时的，随着区域合作条件的改善，这种数量推动作用会被削弱，达到一定程度后甚至会阻碍区域合作进程。

3.共建型区域合作

在引入多区域主体分析框架后，共建型区域合作的博弈类型也发生了一定改变，主要表现为第三类博弈内点均衡的变化。此时，混合纳什均衡值的形式变为：

由表1中的复制动态结果可知：区别于第二类博弈形式，由于内点均衡策略是此类博弈唯一的ESS，第三类博弈中的内点均衡为演化博弈的最终收敛结果。因此，λ″值越大，共建型区域合作的最终收敛结果就越“好”，但其前提是1-x尽可能小（由公式（10）可看出）。换言之，尽可能小意味着区域主体参与合作的积极性很大程度地受区域合作环境的影响。区域内存在较多背离者会给区域主体释放一类信号，表明在现有机制条件下存在较大可能逃避惩罚，因此区域主体有更大动力采取搭便车策略。此外，随着区域主体数量的增加，可以发现N对于上述信号具有明显的稀释作用。

4.分配型区域合作

分配型区域合作可能是所有单总体型区域合作中最难达到“好的”结果的一类区域合作——两种框架中此类区域合作都难以脱离囚徒困境。如前所述，为弥补第4类博弈中存在的先天的收敛缺陷，可以在机制设计、法制约束、监督手段上进行优化，以对整个收敛过程进行不断地反馈和调节。

四、启示与展望

在区域合作博弈分析框架的基础上，本文对多区域主体参与区域合作的情形进行了理论拓展，主要考察4类区域合作的有关机制研究在政策结论方面具有一定的启发性，见表4。值得注意的是，在所有的区域合作类型中，合作环境的改善对于推动区域合作都具有积极作用。

受制于区域合作演化博弈分析的局限性以及现实情况的复杂性，本文的研究仍存在一定的不足之处。一方面，由于博弈论本身的局限性，本文在分析广度和分析深度上有待提高。首先，由于演化博弈论主要研究的是参与者在给定收益矩阵形式下的均衡问题，无法解释博弈形式本身的内生演化现象，因而也就无法考查由区域合作意图和区域合作形式变化导致的影响。其次，由于博弈论分析的主要手段是二维收益矩阵，因此从研究维度上难以突破两区域两方案（合作或不合作）式的主体分析框架。最后，由于博弈论分析没有考虑收益矩阵外的影响因素，即没有考虑域外因素的影响，因此也就无法解释防御型区域合作联盟的形成机制。另一方面，现实情况的复杂性也一定程度地削弱了本文的解释力度。一是区域主体常以不同身份参与到不同区域范围的合作中来。二是同一区域范围内的区域合作主题不尽相同，尽管区域合作参与方相同，但往往会涉及交通、能源、产业、环境等诸多领域，这些领域可能鲜有交叉，所要解决的问题也各不相同。

有鉴于此，未来的研究可以沿着分析广度、分析深度和经验研究等3个方向进行推进。在分析广度上，可以将域外因素纳入进来，同时可以考虑多总体型区域合作情形；在分析深度上可以尝试对收益矩阵进行改进，并且可以使用更先进的数学分析工具，如主观博弈等；在经验研究方面可结合数据收集、整理和分析工作，分领域分问题开展实证分析。