新形势下精准扶贫企业、贫困户和地方政府行为博弈分析

2020-10-23刘珍珍

黑龙江工业学院学报(综合版) 2020年8期

刘珍珍

(安徽警官职业学院公共管理系，安徽合肥 230031)

在当前经济增长由快变稳的新形势下，提升我国经济内在动力，实行以政府、企业与贫困户相融合的产业扶贫模式已经变得势在必行。产业扶贫是脱贫攻坚的标杆，目的在于促进贫困个体(家庭)与贫困区域协同发展，激活产业动力基因，激发贫困户发展动力，已达到永久脱贫的目的。新形势下的产业扶贫模式有利于保护区域发展的稳定性和优化国家对贫困地区的管理。但由于产业扶贫尚是一个全新的模式，相应的机制设计仍不完善，所以在产业扶贫中企业、政府、贫困户之间仍有一些需要改善的地方。

在企业精准扶贫的依据和地方政府治理途径方面，我国学者已开展一系列有益研究。王震[1]分析了当前我国精准扶贫企业、政府、贫困户之间的问题，并提出建立具有中国特色的精准扶贫理论体系。唐芳林[2]以云南省为案例，证明了产业扶贫对于地方经济发展的正向影响。近年来，通过演化博弈模型来研究区域利益协调关系的学者较多。黄海棠[3]认为协调精准扶贫中各利益相关者的关系才是精准扶贫能够进步的重要体现，其精准扶贫的模式可以参照我国早期的特区管理模式。虞文美[4]运用演化博弈理论,建立了双方合作的非对称复制动态模型，来分析金融扶贫对于当地经济发展的影响，并得出相关建议。相里静[5]建立政府、企业和贫困户的三方博弈模型，通过动态博弈的方式来测算生产合作社能够多大程度的激励贫困户来参与到种养技能培训中来。

通过相关文献可知，在产业扶贫机制建立和管理过程中，面对扶贫机制多个不同目标的利益相关者的情况下，应建立一个协调不同利益相关者的行为机制，实现产业扶贫的可持续开发与保护的管理目标。本文从利益相关者的角度，运用演化博弈理论，探讨产业扶贫机制相关者的利益诉求，以期更好的促进新形势下产业扶贫机制的良好发展。

一、基于政府—扶贫企业—贫困户的三方演化博弈模型构建

1.问题描述

政府—扶贫企业—贫困户是一个整体，其在产业扶贫背景下的行为博弈，受制于政治环境、企业效益、贫困户意愿等多方面因素影响。随着中央产业扶贫概念的提出，地方政府有了更多的政策因素来督促扶贫企业建设精准扶贫项目，同时，扶贫企业出于对自身经济效益与企业名声的考虑，也有较强的积极性来进行产业扶贫建设，贫困户也更趋向能与企业合作进行脱贫。但这并不能完全使政府—扶贫企业—贫困户之间的利益达到均衡。只有真正将政府监管、扶贫企业建设行为有机结合起来，才能发挥出双方合作后的资源优势吸引贫困户进行参与。基于此，本文构建各方行为选择概率，根据演化博弈理论，三方在博弈时都有合作或者不合作两种选择，具体细化到行为时，政府的策略集为{监管，不监管}，扶贫企业建设的策略集为{建设，不建设}，贫困户的策略集为{参与，不参与}。本文采用演化博弈论构建“政府—扶贫企业—贫困户”动态演化博弈模型,研究该模型得出演化稳定策略并提出建议。

2.三方演化博弈模型

(1)模型的设立

假设1:当政府选择监管扶贫企业的时候，B1为政府的监管补贴成本，L1为政府选择监管带来的政绩提升，Z1为政府不监管损失的政绩。

假设2:扶贫企业选择不进行产业扶贫模式时，P为贫困户购买企业产品的价格，S1为在产业扶贫模式下贫困户获得的收益，S2为不进行产业扶贫模式时贫困户获得的收益，其中S1包括贫困户幸福指数提高、视野扩宽、心情愉悦等，且S1>S2。

假设3:扶贫企业进行精准扶贫模式开发，成本为B2，收益为P，精准产业扶贫为自己带来的后续利益为L2；传统模式经营成本为B3(B2>B3)，收益仍然为P，传统模式经营所带来的信誉损失等为Z2，此时承担政府罚金F，以及损失贫困户的扶贫企业参与H。

由以上三种假设可构建出博弈策略支付矩阵，其主体分别为政府、扶贫企业以及贫困户，如表1所示。

表1 政府、扶贫企业与贫困户的策略支付矩阵

(2)模型的运算

假设扶贫企业采取“产业扶贫”策略的概率为x，采取“传统模式”策略的概率为1-x，贫困户“购买产品”的概率为y，“不购买产品”的概率为1-y；同理可得，政府采取“监管”的概率为z，“不监管”的概率为1-z。设扶贫企业两种策略的期望收益分别为U1,U2，平均收益为UL；贫困户选择两种策略的期望收益分别为U3,U4，平均收益为Ux；政府选择两种策略的期望收益分别为U5,U6，平均收益为Uz。

然后分别演算扶贫企业、贫困户与政府的期望收益及平均收益。

根据演化博弈理论扶贫企业两种策略的期望收益分别为U1,U2，同时得到扶贫企业的平均收益为UL：

U1=(P-B2+L1)yz+(P-B1+L1)y(1-Z)=(P-B2+L1)y2

U2=(P-B3-Z2-F-H)yz+(P-B2-Z2)y(1-Z)=(P-B2-Z2)y-(F+H)yz

UL=xU1+(1-x)U2=(P-B2+Z2)xy+(1-x)[(P-B3-S2)y-(F+H)yz]

同理根据演化博弈公式贫困户选择“购买产品”和“不购买产品”策略的期望收益分别为U3,U4，贫困户的平均收益为Ux：

U3=(S1-P)x+(S2-P)(1-x)+H(1-x)z

U4=0

Ux=yU3+(1-y)U4=(S1-P)xy+(S2-P)(1-x)y+H(1-x)yz

政府选择“严格监管”和“不严格监管”策略的期望收益分别为U5,U6，政府的平均收益为Uz：

U5=F(1-x)+S1-B1

U6=-Z1

Uz=U5z+(1-z)U6=F(1-x)z+(L-B1)z-Z1(1-z)

由上面U1到UL可以得到扶贫企业群体复制动态方程：

F(x)=dy/dt=x(U1-UL)=x(1-x)[(B3-B2+L1+Z2)y+(F+H)yz]

(1)

扶贫企业动态趋势如图1所示。

图1 扶贫企业动态趋势示意图

由上面U3到U4可以得到贫困户群体复制动态方程：

F(y)=dx/dt=y(U3-U)=y(1-y)[(S1-P)x+(S2-P)(1-x)+H(1-x)z]

(2)

贫困户动态趋势如图2所示。

图2 贫困户动态趋势示意图

由上面U5到Uz可以得到政府群体复制动态方程：

F(Z)=dx/dt=x(U5-UL)=Z(1-z)[F(1-X)+L-B1+Z1]

(3)

政府动态趋势如图3所示。

图3 政府动态趋势示意图

上述(1)(2)(3)方程构成了产业扶贫利益三方博弈的动态复制系统，由Friedman假设，来进行演化博弈模型的雅克比(Jacobi)矩阵分析，检验其稳定状态。鉴于此，研究将雅可比矩阵代入方程组可以得到：

J1=∂F/∂X=(1-2x)[(B3-B2+L1+Z2)y+(F+H)yz]

J2=∂F/∂Y=(1-x)[(B3-B2+L1+Z2)x+(F+H)xz]

J3=∂F/∂Z=X(1-X)Y(F+H)

J4=∂G/∂X=Y(1-Y)(S1-S2-H)

J5=∂G/∂Y=(1-2Y)[(S1-P)X+(S2-P)(1-X)+H(1-X)z]

J6=∂G/∂Z=H(1-X)Y(1-Y)

J7=∂H/∂X=-z(1-z)F

J8=∂H/∂Y=0

J0=∂H/∂Z=(1-2Y)[F(1-X)+L-B1+Z1]

(3)模型的分析

由复制动态方程(1)可知，该系统的均衡点为E1(1,1,1)，E2(1,0,0)，E3(0,1,0),E4(0,0,1),E5(1,1,0),E6(1,0,1),E7(0,1,1),E8(0,0,0)及E9(X1,X2,X3)。其中(X1,X2,X3)是下面方程组的解：

即令

(B3-B2+L1+Z2)y+(F+H)yz=0

(S1-P)X+(S2-P)(1-X)+H(1-X)z=0

F(1-X)+L-B1+Z1=0

同时成立的解。

因为复制动态的稳定解的充要条件是严格纳什均衡，所以本文只考虑E1～E8的均衡点。且y=0时，贫困户会选择不购买产品，所以排除点E2,E4,E6,E8。进一步分析E1(1,1,1)如下。

根据李雅普诺夫间接法，得命题1。

命题1：如果-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)都是负数时，均衡点E1(1,1,1)是演化稳定策略：-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)都是正数时，E1是不稳定点；-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)有1个或2个是正数时，E1(1,1,1)是鞍点。

由鞍点可知，当传统模式与产业扶贫模式成本差的绝对值小于扶贫企业产品质量提升所获得的收益时，扶贫企业将会选择产业扶贫模式。如果贫困户在因扶贫企业质量提升所得到的收益小于所付出的产品价格时，贫困户会选择购买产品，同时，如果政府在监管情况下所得到的政绩回报成本大于所处的监管成本时，政府将有更大的积极性参与扶贫工作。

同理可得命题2:(1)当-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)都是负数时，均衡点E3(0,1,0)是复制动态系统的演化稳定策略；(2)当-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)都是正数时，E3(0,1,0)是不稳定点:(3)当-(B3-B2+L1+Z2+F+H)，P-S1，-(L1-B1+Z2)中有1个或2个正数时，E3(0,1,0)是鞍点。

当扶贫企业选择传统模式与产业扶贫模式成本差的绝对值大于扶贫企业产品质量提升所获得的收益时，扶贫企业将会选择传统经营模式。如果贫困户在扶贫企业得到的收益小于其所付出的价值，贫困户将不会选择购买产品，同时，如果政府在监管情况下所得到的政绩回报小于付出成本时，政府将选择不监管(补贴)扶贫企业补贴实施情况。

3.模型结果分析

由上面演化博弈模型可知，从政府来看，政府监管所付出的成本与其所得到的政绩很大程度上影响政府的监管补贴行为，当前者大于后者时，政府将选择不监管模式，反之选择监管模式。对扶贫企业而言，当扶贫企业在选择产业扶贫和传统模式时所付出的成本差值，以及扶贫企业产品质量提升所获得的收益，决定扶贫企业发展模式的选择。当扶贫企业因质量提升所带来的收益大于产业扶贫与传统模式两者所付出成本的差值时，扶贫企业会选择产业扶贫模式；反之，扶贫企业会选择传统发展模式。从贫困户的利益出发，贫困户参与产业扶贫所得到的收益比付出的成本高时，贫困户就会倾向于在参与产业扶贫，即选择产业扶贫模式。

根据以上分析，为了实现新形势下精准扶贫产业的可持续发展，发展产业扶贫模式是必经之路，实现产业扶贫模式涉及到三方利益主体：政府、扶贫企业、贫困户。为达到产业扶贫模式的长久永续发展，需要对以上三方的利益分配方式和行为方式做出一些规制。

二、演化博弈SD模型仿真及分析

1.产业扶贫的系统动力学模型

产业扶贫利益机制系统动力学模型的仿真有助于进一步理清利益博弈背景下三方的行为变化趋势。在系统动力学SD模型中，根据上文中演化博弈模型的微分方程，构建产业扶贫利益博弈SD模型,如图4所示。

图4 产业精准扶贫SD流程图

假设博弈模型中主要由3个流速变量合集、3个流率变量、若干个外部变量构成。流位变量合集分别表示在政府采取“监管”措施、扶贫企业采取“产业扶贫”措施、贫困户采取“购买产品”的概率；3个流率变量表示政府部门采取“监管”策略和扶贫企业采取“产业扶贫”策略和贫困户采取“参与产业扶贫”策略的改变概率变化率，外部变量分别对应博弈收益矩阵中的变量(见表2)。在变量的赋值上，为了进一步分析政府、扶贫企业、贫困户的博弈关系，根据STERMAN J D[5]的赋值方法，对模型涉及的外生变量进行赋值。主要变量赋值如表2所示。

表2 系统动力学模型赋值

2.系统动力学仿真结果及研究

系统动力学模型中，SD系统的初始值是一个关键变量[6]，数值的设置会影响模型的演化幅度与速度，本文的仿真过程从政府监管成本、政府政绩提升、扶贫企业产业扶贫发展的利益和贫困户收益等变量方面来改变参数，用此来观察其对演化结果的影响。

根据系统动力学时间演绎原理及现实中政府、企业与居民的行为博弈时间，X、Y、Z分别代表扶贫企业、贫困户与政府选择产业扶贫、参与、监管(补贴)策略的初始概率。为进一步探究三方在不同因素影响下的行为变化趋势，在假设一方初始概率为0.5的情况下，改变其中两方的初始策略概率进行仿真分析，设扶贫企业进行产业扶贫模式概率X为0.5时，贫困户参与概率设为Y，政府采取措施策略设为Z,Y与Z的值分别为0.3,0.5,0.7(对应图5中1、2、3的三种曲线，之后的模型图中曲线同理),仿真的运行结果如图5所示。

图5 扶贫企业策略行为的演化相图

根据图5可知，在X初始概率为0.5时，扶贫企业执行产业扶贫政策受贫困户与政府行为影响显著，当Y、Z的初始概率较低时，X值的曲线向下延伸直至平滑，当Y、Z初始值较高时，曲线向上收敛直至1，同时初始值概率较大的曲线收敛速度要更快，表明此时扶贫企业、贫困户、政府三方可以更快形成合作，达到演化博弈的最优状态。仿真结果可知在扶贫企业的态度为中立状态时，政府与贫困户的策略对其有重要影响，当政府与贫困户执行补贴(参与)策略的概率较低时，扶贫企业将缺乏发展产业扶贫模式的积极性。反之，政府与贫困户选择补贴(参与)初始策略较高时，扶贫企业将有更多的积极性来开展产业扶贫模式，政府与贫困户实施策略的意愿越积极，三者就越容易达到稳定合作状态。其原因主要是企业因盈利需求，在无法得到政策保证的情况下很难贸然投入时间金钱进行产业扶贫，所以在扶贫产业发展中需要政府给予较大的支持力度。

在假设贫困户参与扶贫概率为0.5的情况下，改变剩余两方的行为概率，分别为0.3，0.5和0.7(对应图6中1、2、3的三种曲线，之后的模型图中曲线同理)，仿真的运行结果如图6所示。

图6 贫困户策略行为的演化相图

根据图6仿真结果可知，在Y初始概率为0.5时，政府与扶贫企业采取措施的概率对于贫困户有着深刻影响。当X、Z的初始值较低时，贫困户选择参与产业扶贫的概率呈现波动状态，此时贫困户行为趋势无法预测，不利于扶贫企业自身建设与地方经济发展。当政府监管与扶贫企业发展产业概率相对较高时，Y值曲线向上收敛，且在政府与扶贫企业初始概率皆为0.7时，贫困户购买产品的概率会向上收敛直至1。仿真结果表明政府与扶贫企业建设产业扶贫的意愿对于贫困户参与产业扶贫的概率起着重要影响，当建设意愿不强烈时，会使贫困户购买产品意向产生波动。反之，当政府扶贫企业有较强积极性协同合作建设产业扶贫时，贫困户购买产品的积极性会升高直至稳定状态，有利于扶贫企业经济效益与当地政府的社会效益[7]，其原因是贫困户作为个体，很难通过自身来改变当地的产业劣势，所以在扶贫产业已经发展到一定阶段时，才有较大意愿投入相关成本。

在假设政府采取概率为0.5的情况下，改变剩余两方的行为概率，分别为0.3，0.5和0.7(对应图7中1、2、3的三种曲线，之后的模型图中曲线同理)，仿真的运行结果如图7所示。

图7 政府策略行为的演化相图

从图7的仿真结果来看，与图5、图6相比，政府采取措施概率受扶贫企业选择产业扶贫模式与贫困户购买产品初始值概率影响显著，当X、Y皆为0.3、0.5的初始值时，政府选择监管的意愿不强，三方很难达成合作。只有当X、Y的初始值为0.7时，Z的曲线才会向上延伸直至1。说明在三方合作中，当政府采取较为强硬的政策措施时，扶贫企业与贫困户有较大概率会选择与政府合作，演化博弈达到帕累托最优效应，政府、扶贫企业、贫困户三方可以相互合作，共同建设产业扶贫。

根据对模型中关键变量值的调整，动态对比政府、扶贫企业、贫困户三者之间行为概率的演化趋势，发现参数值的适当调整会使三方建设产业扶贫行为趋于稳定，提高三方采取正向行为概率时的初始意愿可以促进合作概率，使产业扶贫达成协同治理模式，变为演化博弈中帕累托最优状态。

三、结论与相关对策建议

产业扶贫体制的建立也要兼顾到地方的经济发展。为了实现这一目标,需要妥善处理政府、扶贫企业、贫困户之间的关系，本文通过构建产业扶贫相关利益者之间的三方博弈模型，并与SD模型相结合来探索扶贫中政府、扶贫企业、贫困户的行为内在逻辑。根据演化博弈与系统动力学模型可知，首先，在产业扶贫初始阶段，政府的意愿占据主要因素，直接决定了产业扶贫的建设情况。其次，在产业扶贫中期乃至后期阶段，企业与贫困户的意愿越积极，三方产业扶贫协同情况将会较为乐观。最后，产业扶贫的后期需要政府的持续监督，才能保证三方扶贫机制的建立和管理。

鉴于以上研究，本文得到以下政策建议。第一，扶贫企业积极融入产业扶贫发展战略，扶贫企业应提高自身的经营水平和顾客满意度。从该演化博弈模型中可看出，贫困户参与扶贫企业的意愿与扶贫企业经营及政府相关制度的科学可行性有密切联系。扶贫企业的口碑和建设模式直接影响着贫困户是否会选择该扶贫企业，因此，扶贫企业在发展中需要注意自身的服务建设，并且了解贫困户需求、创造其所需的产品从而提升贫困户参与意愿。

第二，政府充分引入PPP模式为产业扶贫模式增添活力。政府更多通过与社会资本合作的PPP模式来提供公共服务，意味着政府公共服务供给角色发生了变化，政府作为提供者和监督者的角色，对于产业扶贫的发展路径应该做出以下部署：创新产业扶贫的建设及管理模式，需要充分发挥社会资本与社会智力的作用；在产业扶贫的运营管理过程中，积极吸收民间智库的优长，开展产业扶贫建设的民意召集互动，鼓励民间智囊献言献策；在利益分配上，要注重保护社会参与力量的正当利益，维护社会资本正当合理地参与到日常运营与管理。

最后，贫困户应当积极呼吁产业扶贫建设，推进产业扶贫体制机制确立。产业扶贫目前尚未建成，政府应该积极推进产业扶贫机制确立，与贫困户建立保证协议，保证贫困户的利益，这对于促成精准扶贫机制的实施起到推动作用。产业扶贫的专项立法也是为了能够规避产业扶贫建设过程中各类“推诿扯皮”现象的出现，提高行政机构效率，有利于实现产业扶贫公共价值，同时营造利益相关者三方和谐相处的氛围。