三群体2×2×2非对称演化博弈稳定性分析

2022-02-16马本江蒋学海

运筹与管理 2022年1期

马本江, 蒋学海,2

(1,中南大学商学院,湖南长沙 410083; 2.北部湾海洋发展研究中心(北部湾大学)，广西钦州 535011)

0 引言

演化博弈作为博弈论的一门分支学科因放宽了行为人完全理性假设而在经济与社会领域里得到广泛应用。起先，生物学家为了更好地理解生物进化的过程和预测进化的结果，开始利用演化博弈研究种群冲突和群体演化的规律，其中最具代表性和创造性的研究出自斯密斯和普瑞斯[1]发表在Nature上的论文，文中首次提出了演化稳定策略(Evolutionary stable strategy, ESS)的概念，随后不少学者开始深入研究进化博弈论以及利用这一方法研究生物进化问题[2～6]。弗里德曼[7]研究了ESS和纳什均衡的关系，他指出ESS一定是纳什均衡，而纳什均衡却不一定是ESS。

演化博弈的相关文献大致可分为理论研究和应用研究。理论研究部分，潘峰[8]分别构建了基于不完全信息条件下的两群体2×2非对称演化博弈，并对演化稳定策略的稳定性进行了多情景分析；达庆力[9]构建了两群体3×3对称演化博弈，并利用动力系统理论分析了系统演化稳定策略稳定性情况,完整地给出了该系统的全部动力学行为；魏芳芳[10]构建了三群体2×2×2非对称演化博弈，完整地给出了其定性行为的等价定量分类和各参与主体不同情况下的稳定性策略,并且用三维立体图演示了不同策略组合的渐进趋势；程乐峰[11]针对开放电力市场构建了三群体非对称演化博弈模型，并详细分析了系统的演化稳定性。与理论研究部分相比，演化博弈应用部分的研究文献较多，范围较广。其中，涉及经济与社会领域的主要有三个方面：其一，委托代理问题，如政府机构对寻租腐败问题的监管[12]，公司两权分离下对高管的监督与激励[13]；其二，制度建设和行业监管，如食品、药品、环境等质量安全监管[14～16]，P2P网贷行业政府监管[17,18]，信用保证保险增信机制设计[19]，企业社会责任履行情况监督[20]；其三，其他，如项目组织知识转移与否的竞争[21]，证券投资者的交易行为[22]等等。

然而，当前学界对三方演化博弈的稳定性研究不足，这导致不少学者在在研究时仍然在讨论混合策略纳什均衡是否是ESS的问题，其中也有部分学者根据李雅普诺夫稳定理论通过判断系统雅可比矩阵的特征值关系证明了多数情形下混合策略纳什均衡不是ESS，但就目前为止还未能对所有情形给出证明，这导致学界对纯策略纳什均衡、混合策略纳什均衡与ESS的关系不清，这无论是给演化博弈的理论研究还是其在经济与社会领域里的应用研究都带来了不小的阻碍。

在此背景下，论文建立了三群体2×2×2非对称演化博弈的一般模型，首先分析了单群体策略的演化趋势，接着根据李雅普诺夫稳定性理论分析系统的渐进稳定性，并首次结合单群体策略的演化趋势对三方演化博弈的系统稳定性作了深入研究，并基于完整描述系统演化路径的原则定义了线性策略收敛的概念，重点讨论了一般博弈领域里纳什均衡(包括纯策略纳什均衡与混合策略纳什均衡、严格纳什均衡与不严格纳什均衡)和演化博弈领域里演化稳定策略(包括ESS与线性策略收敛)的关联性。最后，通过设计算例，并结合Matlab软件对算例进行模拟仿真，从而验证本文关于三方演化博弈稳定性研究的相关结论。

1 模型建立及求解

考虑2×2×2三方演化博弈，假设有A、B、C三个群体，策略空间分别是Ω(A1,A2)，Ω(B1,B2)，Ω(C1,C2)，群体A选择策略A1的概率为x，群体B选择策略B1的概率为y，群体C选择策略C1的概率为z。三群体策略组合及相应的支付矩阵见表1。

设群体A选择策略A1时的期望收益为ΓA1，选择策略A2时的期望收益为ΓA2，同理设群体B期望收益分别为ΓB1、ΓB2，群体C期望收益分别为ΓC1、ΓC2。

对于群体A，有

ΓA1=yza1+y(1-z)a2+(1-y)za3+(1-y)(1-z)a4

ΓA2=yza5+y(1-z)a6+(1-y)za7+(1-y)(1-z)a8

对于群体B，有

ΓB1=xzb1+x(1-z)b2+(1-x)zb3+(1-x)(1-z)b4

ΓB2=xzb5+x(1-z)b6+(1-x)zb7+(1-x)(1-z)b8

对于群体C，有

ΓC1=xyc1+x(1-y)c2+(1-x)yc3+(1-x)(1-y)c4

ΓC2=xyc1+x(1-y)c2+(1-x)yc3+(1-x)(1-y)c4

利用复制动态方程构建三维动力系统并化简，于是有

群体A:F(x)=dx/dt=x(1-x)(ΓA1-ΓA2)=x(1-x)(zyw1+zw2-yw3-w4)

(1)

群体B:T(y)=dy/dt=y(1-y)(ΓB1-ΓB2)=y(1-y)(xzm1+xm2-zm3-m4)

(2)

群体C:H(z)=dz/dt=z(1-z)(ΓC1-ΓC2)=z(1-z)(yxn1+yn2-xn3-n4)

(3)

参数wi、mi、ni(i=1,2,3,4)。

类型1三维动力系统恒有8个纯策略点，依次记为E1=(1,1,1)、E2=(1,1,0)、E3=(1,0,1)、E4=(1,0,0)、E5=(0,1,1)、E6=(0,1,0)、E7=(0,0,1)、E8=(0,0,0)。

证明当x,y,z分别任意取0和1时，总有F(x)=0、T(y)=0、H(z)=0三者恒成立，因此三维动力系统必然存在8个纯策略点。

类型2三维动力系统可能存在12类双种群采纳纯策略的混合局势，即“双纯一混”策略，依次记为H1=(1,1,z)、H2=(1,0,z)、H3=(0,1,z)、H4=(0,0,z)、H5=(1,y,1)、H6=(1,y,0)、H7=(0,y,1)、H8=(0,y,0)、H9=(x,1,1)、H10=(x,1,0)、H11=(x,0,1)、H12=(x,0,0)。其中，x,y,z∈(i=1,2,…,12)。

证明对于H1，当x=1,y=1时，有F(x)=0、T(y)=0成立，当n1+n2-n3-n4=0(化简即c1=c2)成立时，对于∀z∈(0,1)，总有H(z)=0成立，所以是一个双种群采纳纯策略的混合平衡状态，同理也能得到其他条件成立时的双种群采纳纯策略的混合局势。另外，考虑到这类策略组合在局势立方体上呈连续的线性分布，为准确、直观地表述，下文称之为线性均衡策略。

类型3三维动力系统可能存在6个单种群采纳纯策略的混合局势，即“一纯二混”策略，依次记为K1=(1,y1,z1)、K2=(0,y2,z2)、K3=(x3,1,z3)、K4=(x4,0,z4)、K5=(x5,y5,1)、K6=(x6,y6,0)。

证明对于K1，当x1=1时，总有F(x)=0恒成立，令ΓB1-ΓB2=0、ΓC1-ΓC2=0，得yi和zi，同理也能得到另外几组单群体采纳纯策略的混合局势。参数xi、yi、zi(i=1,2,…,6)。

类型4三维动力系统可能存在至多2个混合策略纳什均衡L=(x,y,z)。

证明同时令

该方程组共有三个变量，并且方程组的每个方程都是由三个变量两两组成的二元二次方程，故由数学知识易知该方程组至多有两组解，考虑到多数情况下直接计算混合策略解通常要方便许多，因此不再给出相应的解析式。

值得一提的是，尽管上述方程组至多有两解，但系统中通常只有一个混合策略解满足x,y,z∈(0,1)。因此，下文在分析单群体策略演化趋势时，只考虑系统中有且仅有一个混合策略解的情况，这是一个值得注意的地方。

3 模型分析

在分析系统演化稳定策略之前，考虑到系统演化稳定策略是由单群体策略演化趋势所构成，而且在下文证明相关定理时需要用到单群体策略演化趋势，于是先分析单群体策略演化趋势，而后在此基础上分析系统演化稳定策略。

3.1 单方策略演化分析

对于群体A，(1)式复制动态方程对x求导，得

dF(x)/dx=(1-2x)(ΓA1-ΓA2)

=(1-2x)(zyw1+zw2-yw3-w4)

假定yw1+w2≠0，令ΓA1-ΓA2=0，可得z*=(yw1+w4)/(yw1+w2)。又令F(x)=0，有两个确定解x=0、x=1和一个可能解z=z*，其中z*∈R，但只有满足dF(x)/dx<0的解(或者z=z*时)才是演化稳定策略(ESS)，分如下几种情况进行讨论。

1)当z

2)当z=z*时，对于∀x∈[0,1]，都有F(x)≡0，这意味群体A无论选择策略A1和策略A2的比例如何，其策略都是稳定的；

3)当z>z*时，如果yw1+w2>0，易知dF(x)/dx|x=0>0、dF(x)/dx|x=1<0，此时x→1；反之，如果yw1+w2<0，此时x→0。

同理，对群体B和群体C进行类似分析，结果如下：对于群体B，当x0，则y→0，反之y→1；当x>x*时，如果zm1+m2>0，则y→1，反之y→0。对于群体C，当y0，则z→0，反之z→1；当y>y*时，如果xn1+n2>0，则z→1，反之z→0。

3.2 系统演化分析

在上文中，论文利用复制动态方程得到了三维动力系统的平衡点，然而只有具有抗扰动性的平衡点才是系统的ESS。根据李雅普诺夫稳定性理论(间接法)，三维动力系统在平衡点处的渐进稳定性可以通过系统雅可比矩阵的三个特征值来判断。判断原则为：①如果雅可比矩阵的所有特征值都具有负实部，则该均衡点是ESS(汇)；②如果雅可比矩阵的所有特征值都具有正实部，则该均衡点为不稳定点(源)；③如果雅可比矩阵的特征值既有正实部又有负实部，则该均衡点为鞍点；④如果雅可比矩阵的特征值具有零实部且其余特征值都有负实部，则该均衡点处于临界状态，其是否具有抗扰动性取决于高阶导数项。

式(1)、(2)和(3)分别关于x、y、z作偏导，并按照特定的顺序排列成如下三维动力系统的雅可比矩阵:

类型1三维系统中必然存在着8个纯策略局势，系统雅可比矩阵的特征方程是(∂F(x)/∂x-λ)(∂T(y)/∂y-λ)(∂H(z)/∂z-λ)=0(其中，x,y,z=0.1)，得三个特征值λ1=∂F(x)/∂x,λ2=∂T(y)/∂y,λ3=∂H(z)/∂z。

类型2三维系统中可能存在12种“双纯一混”局势，系统雅可比矩阵的特征方程形如(a-λ)(b-λ)(0-λ)=0(注：a,b∈{∂F(x)∂x,∂T(y)/∂y,∂H(z)/∂z}且(a≠b))，得三个特征值λ1=a、λ2=b和λ3=0。

类型4三维系统中可能存在至多两个三方混合策略局势，系统雅可比矩阵的特征方程形如-λ3+αλ+β=0，由于三次代数方程的二次项系数是0，易知特征值。由于三方混合策略算式较复杂，且本文并不需要λ1,2,3的值λ1+λ2+λ3=0，于是不再给出具体值。

至此，本文得到了所有平衡点处系统雅可比矩阵的特征值，详见表2。其中，ξi(i=1,2,...,12)。此外，为了行文方便，根据表1和表2，给出本模型的局势立方体，详见图1。

表2 三维动力系统的演化稳定策略状态及其稳定性判定

为了更好地理解三维动力系统中演化稳定策略的概念，遂将ESS推广至三维空间，作如下定义。

定理1ESS是一个局部范围内严格的纳什均衡，是一个点收敛的概念，线性均衡策略Hi(i=1,2,…,12)均不是ESS。

证明(反证法) 假设线性策略组合是ESS，由于线ESS是由点ESS所构成，所以线性策略组合上任一点必然也是ESS。不妨假设线性均衡策略集Φ⊂Ω(Ω是策略空间)是ESS，其中存在一个策略组合X={X1,X2,X3}∈Φ，于是可推出也是ESS。若突变策略组合Y∈Φ且Y≠X，此时总有一个群体u[X,(1-ε)X+εY]≡u[Y,(1-ε)X+εY]，与ESS的定义矛盾，因此X不是ESS。同理线性策略组合上的其他点也都不是ESS，说明线性均衡策略不是ESS，因此ESS是一个点收敛概念，证毕。

有趣的是，尽管线性均衡策略不是ESS，但这并不代表线性均衡策略上不存在一个局部空间内的帕累托上策均衡，只是不稳定而已。由于线性均衡策略的雅可比矩阵除零特征值外其余特征值均小于零，根据定理1的证明，假设策略组合γ={γ1,γ2,γ3}∈Φ且u[γ,(1-ε)γ+εY]=maxu[X,(1-ε)γ+εX]成立，γ即是这个局部空间内的帕累托上策均衡。但遗憾的是，决定系统效用选优的关键并不在于负特征值群体，而在于零特征值群体的策略选择。例如H1=(1,1,z)，有λ1,2<0，此时在其收敛域内，群体A、B在H1上任意策略总是优于其他策略，但系统效用选优的关键却在于群体C。对于群体C，有u[X,(1-ε)X+εY]≡u[Y,(1-ε)X+εY]，因此它没有任何动力去选择局势γ，这时群体C被看成是一个“搅局者”，它的行动使得帕累托上策均衡γ变得不稳定。

如果线性均衡策略的雅可比矩阵除零特征值外其余特征值均小于零，尽管其不是一个ESS,但考虑到它在一定的侵入边界内依然具有局部收敛性，为了更全面的描述系统演化路径，对线性策略收敛作如下定义。

定义线性策略收敛之后，由定理1可以得到推论1和推论2。

推论1如果线性策略组合Φ是一个线性策略收敛，那么必然存在一个策略组合γ∈Φ是局部空间内的帕累托上策均衡，但因不稳定而不是ESS。

推论2如果线性策略组合Φ是一个线性策略收敛，那么∀ρ={ρ1,ρ2,ρ3}∈Φ必然不是ESS。反之，如果一个策略组合γ={γ1,γ2,γ3}是ESS，那么γ1∉Φ。

对比ESS和线性策略收敛的定义，可知ESS既不是线性策略收敛存在的充分条件，也不是其存在的必要条件，二者是完全不同的概念。与ESS相比，线性策略收敛有两个不足。其一，线性均衡策略存在的条件比较特殊，如H1=(1,1,z)需要c1=c2成立，只需支付的一个极细微的变化就能使线性均衡策略被打破，更不用考虑线性策略收敛是否存在，而相对而言ESS对支付的灵敏度就不那么明显。其二，与ESS的点收敛相比，线收敛比点收敛的稳定性较弱，在描述、反映实际问题上稍显不足，重要性相对弱于ESS。尽管线性策略收敛与ESS相比有不足之处，但也不可否认线性策略收敛与ESS一样也能描述三维动力系统的演化路径，尤其是当系统中不存在ESS时，线性策略收敛能够发挥重要作用。

定理2(零特征值非ESS定理)三维动力系统中若纯策略平衡点的雅可比矩阵存在零特征值，则可直接判定其一定不是ESS。

由定理2可以得到推论3和推论4。

推论3如果一个纯策略平衡点的系统雅可比矩阵除零特征值外其余特征值均为负值，那么必然存在一个包含该点的一端连续的线性策略收敛。

推论4如果一个纯策略平衡点是ESS，那么在局势立方体上与之相邻的三条边都不存在线性策略收敛。

定理3(ESS不共边定理)三维动力系统中若存在任意一个纯策略平衡点是ESS，则在局势立方体上与之共边的三个纯策略平衡点一定不是ESS，反之则不成立。

由定理3可以得到推论5～7。

推论5三维动力系统中若在局势立方体上互为体对角的两个纯策略平衡点都是ESS，则系统中有且仅有这两个纯策略平衡点是ESS，也必然存在混合策略点是系统鞍点，同时系统中也一定不存在线性策略收敛。

推论6三维动力系统中若在局势立方体上与之相邻的三个纯策略平衡点都不是ESS，则其必然是源(发散点)或者汇(聚集点，ESS)其中之一。

推论7三维动力系统中至多只存在4个ESS。

再将ESS不共边定理推广到N维动力系统，得定理3#。

定理4在N维动力系统中，若任意一个纯策略平衡点是ESS，则在N维超立方体上与之共边的N个纯策略平衡点一定都不是ESS，且N维系统中至多只有2N-1个纯策略ESS。

定理5在三维动力系统中，“一纯二混”均衡策略组合一定不是ESS。

定理6在三维动力系统中，三方混和策略纳什均衡一定不是ESS。

以上定理(2,3,4,5,6)，局势稳定性分析辅助图见图2。

上述研究表明，严格纯策略纳什均衡是ESS，不严格纯策略纳什均衡是线性策略收敛，混合策略纳什均衡作为划分ESS吸引域的系统鞍点决定了ESS收敛域的大小，三者共同决定系统的演化路径与演化稳定策略。

4 算例分析及仿真

接下来，为了直观验证相关结论，本文设计了六组经典算例，详见表6。对于算例1，用划线法不难得到4个纯策略纳什均衡，均衡的具体策略可对照表1，不再列出。用划线法同样不难得到算例2有3个纯策略纳什均衡，算例3和算例4都有两个纯策略纳什均衡(策略一样效用不同)，算例5和算例6都各有一个纯策略纳什均衡(策略一样效用不同)。

表6 算例矩阵

根据前文对ESS的讨论，不难得知算例1～5的纯策略纳什均衡都是ESS，而算例6的纯策略纳什均衡(A1，B1，C1)不是一个ESS，而是(1,1,z)线性策略收敛中的一点，其中0.5≤z≤1，验证了弗里德曼关于“ESS一定是纳什均衡，而纳什均衡却不一定是ESS”的结论。根据定理1，ESS是一个点，该点在所属局部空间内要绝对优于其他任意点，是一个严格的纳什均衡。但在算例6中c1=c2，说明(A1，B1，C1)并不是一个严格的纳什均衡，所以它不是一个ESS。再根据定理2和推论3，不难知道必然存在一个包含该点的线性策略收敛(1,1,z)，其中0.5≤z≤1。

为了更直观、清晰地描述三维动力系统的演化路径，接下来将利用Matlab软件对上述六种算例分别进行模拟仿真，结果如图3所示。特别的，算例6没有ESS，但有一个线性策略收敛(1,1,z)，z∈[0.5,1]，仿真结果与理论分析一致。

5 结束语

本文研究了2×2×2三方演化博弈的稳定性问题，创新性地结合单群体策略演化趋势对系统稳定性作了深入研究，所做出的贡献主要在于：

其一，提出了线性策略收敛的概念，这是对完整描述系统演化路径的一个补充。接着分析了ESS与线性策略收敛的性质，得到若干定理，并在相关定理的基础上对二者的区别与联系进行了详细讨论。

其二，首先证明了零特征值非ESS定理，说明只要纯策略局势的系统雅可比矩阵存在零特征值，就可直接判定其一定不是ESS。但若其余特征值均为负数，则可进一步判定系统中一定存在一个包含该点的线性策略收敛。然后证明了ESS不共边定理，这是N群体双策略演化博弈中最重要的一个性质，在此基础上又证明了N维双策略系统中至多只有2N-1个ESS。最后证明了所有类型的混合策略纳什均衡都是系统鞍点，而非ESS。

其三，证明指出严格纯策略纳什均衡是ESS，不严格纯策略纳什均衡是线性策略收敛，即ESS+线性策略收敛=纯策略纳什均衡，所有类型的混合策略纳什均衡均为鞍点，共同划分了ESS的吸引域，指出可以通过改变混合策略纳什均衡在局势立方体的位置来扩大特定ESS的吸引域，调整参数放在实际问题中就是采取何种措施，以及实施这种措施的程度。

然而，需要说明的是本文关于演化博弈稳定性的研究结论目前仅适用于博弈群体双策略空间的情形，相关定理及推论对博弈群体多策略空间情形是否也成立仍有待进一步研究。但可喜的是，论文关于N群体双策略非对称演化博弈，尤其是对三群体2×2×2非对称演化博弈的有关研究取得了一定的进展，这给三方非对称演化博弈在经济与社会领域的实际应用提供了指导与帮助，也给后续N群体多策略空间演化博弈的理论研究提供了借鉴与启发。