APP下载

产业精准扶贫中企业、贫困户和地方政府行为的演化博弈分析

2020-02-06林艳丽杨童舒

关键词:消极收益群体

林艳丽,杨童舒

(东北大学 工商管理学院,辽宁 沈阳 110169)

一、问题的提出

产业扶贫作为一种“造血式”扶贫,因其灵活性、可持续性而被广泛推广。从产业扶贫的微观主体构成看,产业扶贫既不是政府单方面的行为和责任,也不是企业简单的独立的帮扶行动,而是一个涉及政府、企业和贫困户等多元主体相互融合的扶贫模式。但是,由于产业扶贫尚处于探索阶段,相应的机制设计仍不完善,所以在产业扶贫中多元主体会出现偏离可持续减贫的一些行为表现,诸如企业利用项目名义骗取国家的扶贫资金、贫困户群体的主动参与意愿不强、地方政府的越位和缺位等。胡振光等认为当前产业扶贫在实施中出现了目标偏离和实践变形,即多元主体(包括龙头企业、农村合作组织和贫困户)的互动异化为政府主导下的被动参与[1]。孙兆霞通过对贵州产业扶贫的调查,发现政府主导的产业扶贫项目因为缺乏村庄社会性参与及村庄公共平台的承接与运作,往往会导致扶贫目标偏移、贫困差距拉大、加速村庄原子化溃败以及降低农民对政府的政治信任等后果[2]。许汉泽等以华北李村产业扶贫项目为例,发现产业扶贫在实践中存在“精英俘获”“弱者吸纳”、逆向软预算约束带来的“政策性负担”、规模化经营不善以及后续维护缺失等问题,进一步指出产业发展的市场化逻辑与扶贫济困的社会道德逻辑的矛盾将会增加产业扶贫项目失败的风险[3]。黄承伟等指出精准扶贫时期产业扶贫的实践困境,如产业扶贫中的“唯经济效益论”、忽视贫困群体的主体地位、精英俘获现象普遍、技术或能力培训的“有用无效”等[4]。邢成举以广西产业扶贫为例,指出当前产业扶贫最为突出的问题是产业扶贫的相关主体将扶贫资源、资金和项目视为实现个体利益的私人资源,且相对强势的地方政府、农业龙头企业和专业大户等结成了分割扶贫资源的利益联合体[5]。

因而,为使产业扶贫真正做到造血式扶贫以提高扶贫资源的配置效率,如何进行合理的机制设计,以形成三方之间良性互动、合作共赢的局面,是产业精准扶贫的关键环节之一。

事实上,产业扶贫可看做是企业、贫困户群体和政府等多元主体的博弈过程。由于“各参与扶贫的主体行为都是多次发生的,且博弈方往往通过不断获取同行、对方及外界(特别是政府)的信息来改变自己原有的策略”[6],可见,产业精准扶贫是一种典型的演化过程。

通过梳理相关文献发现,已有的大部分研究是针对产业精准扶贫各参与主体的行为进行静态和动态博弈分析的。如张培源等通过构建静态博弈模型,分别分析了产业扶贫中政府与企业、政府与贫困户、企业与贫困户之间的关系[7]。又如,徐龙顺等通过构建上级政府和地方政府、地方政府与贫困群众、上级政府与贫困群众、贫困群众和非贫困群众的静态博弈模型,阐述精准扶贫中存在问题的根源,并提出实现精准扶贫健康发展的建议[8]。近年来,演化博弈理论也在产业扶贫中得到一定的应用,其中,比较有代表性的有:闫东东等借助产业扶贫模式,分别建立龙头企业群体之间以及政府部门和龙头企业之间的演化博弈模型,对龙头企业参与产业扶贫中的行为进行分析[9]。又如,付江月等基于演化博弈视角,对奖惩机制下产业扶贫中的企业和贫困户的行为进行了博弈分析[10]。可见,以往文献中,无论是静态博弈、动态博弈还是演化博弈,大多是基于产业扶贫中两大主体的分析,目前尚没有研究将三方纳入一个统一的模型框架中。因而,以产业精准扶贫中各参与主体的有限理性为基础,运用演化博弈理论,构建“企业-贫困户群体-地方政府”三方的博弈模型,分析三者之间的博弈行为和利益关系,寻找演化稳定策略,以期找到实现可持续减贫的长期演化路径。

与以往的研究相比,本文的边际贡献在于:一是研究视角比较独特,从微观主体的良性互动视角探析产业扶贫实现可持续减贫的路径。已有的研究多是从产业本身出发即中观层面研究产业扶贫的模式。二是较为全面地分析了产业扶贫中企业、贫困户和政府三者之间的关系。即,基于演化博弈理论,将三大扶贫主体融入到一个模型中,构建“企业—贫困户群体—地方政府”的三方博弈模型,以寻求三者之间长期利益均衡机制。

二、博弈主体的行为界定与说明

产业扶贫中的博弈主体主要有三个:参与扶贫的企业、贫困户群体和贫困地区的地方政府①这里,地方政府指最容易了解和掌握贫困户和企业情况和信息的基层政府,如,县、镇(乡)政府和村两委。有时,也称基层政府 或政府。因而,在本文中,中央政府或省级政府会做特别强调说明。,且各主体的目标函数不同。接下来,以一种代表性的产业扶贫模式为例,描述三大主体的策略选择。

首先,企业可供选择的策略为:“积极参与”和“消极参与”。假定企业“积极扶贫”的行为表现为:严格按照项目预算建设生产基地,认真经营管理产业扶贫项目;吸纳一定比例的贫困户到基地务工,并组织相应的技术培训;按照贫困群体既定的投资入股比例进行利润分红。反之,企业“消极扶贫”的表现为:企业实际的投资比名义上的投资少,利用政府的扶贫资金、税收优惠、低息贷款等政策进行扶贫之外的经营活动;吸纳贫困人口到基地务工,但不组织培训活动,且不按贫困户投资入股的资产比例进行分红。

其次,贫困户从自身的利益角度考虑,其纯策略选择为“主动参与”和“被动参与”。假定“主动参与”的行为表现为:脱贫的主动性和热情较高,主动到基地务工,积极参加各种技术培训活动,以政府的扶贫资金或政府的贴息贷款、土地等资产投资入股。反之,“被动参与”的行为表现为:脱贫的主动性和积极性不高,“等靠要”的福利依赖思想严重,尽管贫困户会到基地务工,也以土地等资产投资入股,但工作的热情不高,个人劳动的积极性和主动性没有被充分调动,不参加各项技术培训活动,将更多的时间用来休闲娱乐。

再次,政府的纯策略选择为:“积极监督”和“放松监督”。“积极监督”策略,指地方政府在贯彻中央政府扶贫政策的过程中积极作为,包括对企业和贫困户两方的监督管理。“放松监督”策略,指地方政府在整个扶贫过程中不作为,即,不论企业积极扶贫还是消极扶贫,政府既没有奖励也不进行惩罚,对主动参与的贫困户也没有有效的激励机制。

三、模型假设与参数设置

假设1:参与主体为企业、贫困户群体和地方政府,且均具有有限理性,以追求自身利益最大化为目标。

假设2:如果企业采取“积极扶贫”策略,那么积极扶贫的总投资为I,当贫困户群体主动参与时,项目的总收益记作R1;当贫困户被动参与时,项目的总收益记作R2。如果企业采取“消极扶贫”策略,那么消极扶贫的总投资记作I′,当贫困户群体主动参与时,项目的总收益为R3;当贫困户群体被动参与时,项目的总收益为R4。

假设3:企业积极和消极扶贫时的利润分红比例记作μ/μ′,其中,μ=I/(I+M),μ′=I′/(I′+M)。这里,M为贫困户群体以土地等资产投资的入股额。当企业积极参与扶贫时,无论地方政府是否监督,企业都会按(1-μ)的比例给贫困户群体分红;当企业消极扶贫时,如果地方政府监督,企业会按(1-μ′)比例分红,否则,企业不分红。为简化分析,假定不进行分红的企业全部侵占贫困群体的资产收益,记作N。

假设4:参与产业扶贫项目的企业均会获得来自政府的一定的政策支持,如,配套资金、低息贷款、税收优惠等,记作P。而且,积极扶贫的企业还能获得企业的社会形象提升等额外收益,记作t。

假设5:贫困户到基地务工的基本工资为w②贫困户在基地务工的劳动力成本会在计算中约掉,为简化公式,劳动力成本就不予考虑。。主动参与脱贫的贫困人口除了获得基本工资外,还会获得来自企业和政府的奖金提成的激励。J/J′分别表示企业积极扶贫/消极扶贫时给予贫困户的奖金提成,其中,J>J′。s′表示政府给予的奖励。而且,长期看“主动参与”的贫困人口还可以通过参加企业或政府举办的技术培训活动,个人的技术水平(h1)和劳动力的素质(h2)得到提升,这些额外的正向收益记作h1/h2。这是能够实现可持续减贫的重要变量之一。

假设6:采取“被动参与”策略的贫困户,由于“要我脱贫”思想严重,工作上表现为消极怠工的态度,所以不仅不能获得奖金的激励,而且个人的技术水平和素质也没有改善,因而在基地务工时只能够获得基本工资w。然而,被动参与的贫困户将更多的时间用于休闲娱乐会获得一定的效用水平U1。

假设7:贫困户以土地等资产投资入股。假定所有贫困户投资入股到企业的总股本为M,贫困户是否获得分红取决于企业和地方政府的策略选择。

假设8:政府对企业的扶贫行为进行监督的成本记作C1;C2为政府对贫困户进行管理的成本;s/F表示企业积极/消极扶贫时政府给予的奖励/惩罚。另外,假设企业消极扶贫时被政府发现的概率为λ(0<λ<1)。基层政府放松监督时被上级政府发现的概率为θ(0<θ<1),遭受到上级政府的惩罚记作F′。

假设9:U为政府积极监督所带来的形象提升(如,公信力增强等)。V/K分别表示企业积极和消极扶贫时社会福利的增加/降低。即,若企业积极扶贫会加速全社会脱贫进程,则会给社会带来好的影响,记作V;反之,若企业消极扶贫,尽管短期企业可能获得超额利润,但会对社会产生负效应,诸如扶富不扶贫、精英俘获等现象,则对社会造成的利益损失记作K。

四、演化博弈模型构建与分析

在前文界定的演化博弈中,企业、贫困户和地方政府三者之间的博弈组合共有8种。基于以上假设和参数,可以得出企业、贫困户和地方政府在8种策略组合下的各自收益。如表1所示。

表1 企业、贫困户和政府的三方博弈矩阵表

在多元主体博弈的初始阶段,假设在参与扶 贫的企业群体中采取“积极扶贫”策略的企业所占群体比例为x,则采取“消极扶贫”策略的企业所占群体比例为1-x;在贫困户群体中采取“主动参与”策略贫困户所占群体比例为y,则采取“消极参与”策略的贫困户所占群体比例为1-y;在地方政府群体中采取“监督”策略的政府所占群体比例为z,则采取“放松监督”策略的政府所占群体比例为1-z。这里,0

则,由表1可知企业采取“积极扶贫”和“消极扶贫”策略的期望收益Ex1、Ex2及企业群体混合策略的平均收益Ex分别为:

同理,贫困户选择“主动参与”和“被动参与”策略的期望收益Ey1、Ey2及贫困户群体混合策略的平均收益Ey分别为:

类似地,地方政府选择“监督”和“放松监督”策略时的期望收益Ez1、Ez2及地方政府的混合策略的平均收益Ez分别为:

根据Malthusian方程,企业选择“积极扶贫”策略的数量增长率等于期望收益Ex1与平均收益Ex之差[11]。即,由式(1)~式(3),可以得到企业群体采取“积极扶贫”策略的动态复制方程为:

同理,可得贫困户群体和地方政府的动态复制方程,整理后得:

根据微分方程的稳定性定理[11],如果博弈主体所采取的某一策略为稳定状态,则企业、贫困户群体和地方政府选择该策略的概率x、y、z需要满足以下条件:

在动态复制方程的基础上,分别对参与博弈的三方采取策略的演化路径及稳定性进行分析。

(1)扶贫企业采取策略的演化稳定性分析

则F(x)≡0,即对所有x都为稳定状态,也就是说无论企业选择“积极扶贫”策略还是“消极扶贫”策略的比例如何,其策略都不会随时间发生改变[12]。若

令F(x)=0,得x=0,x=1是x 的两个稳定点。即参与主体扶贫企业如果选择积极扶贫策略或消极扶贫策略,“只要没有出现改选策略的突变体,则其策略就会稳定在积极扶贫或消极扶贫策略上”[12]。

由此可见,企业的演化策略会同时受到企业自身和政府策略的影响,但是与贫困户策略选择关系不大。因而,如果积极参与扶贫的企业的获得的利润额越大及企业形象提升越高,且政府对积极参与扶贫企业的奖励额度s越大,那么,企业会倾向于选择“积极扶贫”策略。与此同时,如果企业消极扶贫时利润额越低,且企业侵占贫困户的资产收益额与政府一旦发现的惩罚额度越接近,即(N-zλF)较小时,企业也会倾向于选择“积极扶贫”策略。这时有0

(2)贫困户采取策略的演化稳定性分析

当G(y)=0时,有稳定点,y=0,y=1,和

若令α=J′+h2+z(1-μ′)(R3-R4),则,x

由以上分析知,若贫困户群体通过闲暇娱乐获得的效用水平U1越低,主动参与脱贫时获得的额外收益J+h1越多,以及当企业采取“积极扶贫”策略时,贫困户主动和被动参与时利润分红差额越大(1-μ)(R1-R2),和政府对主动参与的贫困户的奖励额度s′越高,则会存在0<

(3)地方政府采取策略的演化稳定性分析

由以上分析知,政府是否采取“监督”策略与政府监督成本C1与C2,政府对企业和贫困户的奖惩额度,政府积极作为时的形象提升程度以及政府放松监督时遭受的惩罚θF′等因素有关。当政府积极监督的形象提升越大,监督成本C1和C2越低,对企业的惩罚力度F越大,对企业和贫困户的奖励s和s′越小,以及本级政府放松监督时遭受上级政府的惩罚θF′越高,这时存在0

五、三方共同作用的演化策略稳定性分析

由于演化博弈中的复制动态方程系统反映的是群体的动态,因而,由单个复制动态方程求出的均衡点不一定是系统的演化稳定策略。根据Friedman(1991)的结论,三方共同作用的演化均衡点的稳定性需要进一步分析系统的雅可比(Jacobin)矩阵的局部稳定性。具体来说,可由三方的动态复制方程得到雅可比矩阵,即[6],

由于本文着重阐释产业扶贫中如何通过多元主体的协调配合实现可持续减贫的问题,因此主要分析E8(1,1,1)点的稳定性。

将x=1,y=1,z=1,代入式(13),进一步地,可以得到E8(1,1,1)点所对应的雅可比矩阵。

根据矩阵性质,若假设E8(1,1,1)点为稳定点,则需要同时满足以下条件,即,

这时,企业—贫困户—地方政府倾向于采取{积极扶贫,主动参与,积极监督}策略。而且,上文分析发现,在由多方主体构成的演化博弈中,单个主体的策略选择除了考虑自身的影响因素外,同时还会受到其他两方的共同作用和影响。

(1)企业采取“积极扶贫”策略的影响因素

当(R1-I)+s+t>(R3-I′)+(N-λF),即企业积极扶贫的收益超过消极扶贫的收益时,企业会倾向于选择“积极扶贫”策略。那么影响企业采取“积极扶贫”策略的因素主要有以下几方面。

一是企业自身的获利情况。当企业积极扶贫赚取的利润超过消极扶贫的利润,即(R1-I)>(R3-I′)时,企业倾向于采取“积极扶贫”策略。因而,对于参与产业扶贫项目的企业而言不能把扶贫当做企业单纯的公益行为,而是要将扶贫和企业的长远发展战略结合起来,从而做到社会责任的履行和赚取利润相统一。尽管短期看,企业消极扶贫可能暂时获得较高的利润,但是这种消极扶贫行为不具有长期可持续性的。而且,一旦被政府发现会遭受严厉的惩罚。另外,尽管企业一开始雇佣贫困户的成本较高,但是随着贫困人口掌握技能的不断熟练,企业的长期雇佣成本是下降的。因而,从长期看,如果企业将扶贫和企业的长远战略结合起来,企业积极扶贫获得的长期利润总额将会远远超过企业消极扶贫的短期暴利。

二是政府的监督及奖惩机制。这就要求:一方面加强政府监督,健全扶贫领域的政府监督体系,这里主要指基层政府对参与扶贫企业的监督;另一方面在基层政府严格监督的同时,奖罚机制的设计也应适当。否则,尽管政府有监督,但是奖惩的力度s和(N-λF)非常小时,可能会出现企业消极扶贫的收益超过积极扶贫收益的情况,即有不等式(R1-I)+t+s<(R3-I′)+(N-λF)成立。可见,在政府严格监督的情况下,只有当奖励额度s(包括物质奖励和精神奖励)足够大,或者对消极扶贫的企业惩罚额度很高,一般情况下要超过企业侵占的贫困户的资产收益,即有(NλF)<0时①这里,一旦查处企业有消极扶贫行为,不仅全部没收企业侵占的贫困户的资产收益,而且还要对这类企业的行为进行经济处罚(如,按企业侵占数额的一定比例交纳罚金)和行政处罚(如,不再允许该企业涉足扶贫领域)。,这时才能激励企业遵守承诺采取“积极扶贫”策略。

三是企业积极扶贫获得的企业形象的提升。短期看,企业形象t的提升并不明显,但是,在演化稳定策略的长期博弈中,如果企业采取“积极扶贫”策略,那么t的提升将会非常显著,而且时间越长t会越大。因而这一变量也是影响企业长期策略选择的重要因素。

此外研究还发现,如果政府放松监督,且企业只看重短期的获利情况时,由于t短期不显著,且政府的奖惩缺失,即企业既不会因侵占贫困户资产收益而受到处罚,也不会因积极扶贫而获得政府奖励时,那么大多数企业会选择背弃当初“积极扶贫”的承诺,进而选择“消极扶贫”。这正是对均衡点E1(0,0,0)进行稳定性分析时可能得到的演化稳定策略。

(2)贫困户群体采取“主动参与”策略的影响因素

当[h1+J+(1-μ)(R1-R2)-U1+s′]>0,即贫困户主动脱贫的收益(包括来自企业的奖金提成、企业的利润分红、政府对个人的奖励及个人能力和素质的提升)超过被动参与的收益(诸如企业的利润分红、更多的闲暇娱乐获得的效用水平)时,贫困户会积极主动参与脱贫。具体来看,影响贫困户群体采取“主动参与”策略的因素有以下方面。

一是贫困户自身的因素h1和U1,即贫困户参与企业扶贫个人能力和素质提升程度以及更多的时间用来闲暇娱乐获得的效用水平。若h1越大,U1越小,则贫困户越倾向于采取“主动参与”策略。反之,若贫困户通过闲暇娱乐获得的满意度越高,则他们越倾向于采取“被动参与”策略。

二是企业因素J、(1-μ)R1和(1-μ)R2,即贫困户主动脱贫时获得的奖金提成、利润分红以及被动参与时获得的利润分红。如果主动参与的项目收益超过被动参与时的分红收益,即J+(1-μ)R1>(1-μ)R2时,那么贫困户越倾向于采取“主动参与”策略。而且,项目收益的变化既影响企业的决策又影响贫困户的决策,进而改变演化博弈的结果,特别是当企业积极扶贫同时贫困户主动脱贫的项目收益R1越大时,企业越趋向于采取“积极扶贫”策略,贫困户也越趋向于采取“主动参与”策略,这时双方的积极性都被较好地调动起来。

三是政府的因素,即政府对主动参与的贫困户的奖励额s′。理论上s′越大,激励效果越明显。但考虑到政府的监管成本以及为防止贫困户“搭便车”现象,该奖励可以是象征性的定额补贴,不宜过高。而且在“政府-企业”已经形成良性循环的情况下,贫困户群体会愿意选择主动参与,以获得更多的收入。因此,政府在保证收益的同时可以适当加大对贫困户的奖励,以鼓励贫困户主动参与。

因而,当贫困户主动脱贫的收益(包括来自企业的奖金提成、企业的利润分红、政府对个人的奖励及个人能力和素质的提升)超过被动参与的收益(诸如企业的利润分红、更多的闲暇娱乐获得的效用水平),即,h1+J+(1-μ)R1+s′>(1-μ)R2+U1时,贫困户会积极主动参与脱贫。

(3)地方政府采取“积极监督”策略的影响因素

若政府积极监督管理的收益与政府管理监督成本及奖励补贴之差超过政府放松监督时所遭受的惩罚,即U>C1+C2+s+s′-θF′时,则政府会选择“监督”策略。

一是政府的收益U,诸如政府公信力提升、获得来自于企业的税收、良好的社会风气等。若政府获得的收益U越大,则就越倾向于采取“积极监督”策略。

二是政府对企业和贫困户的监管成本及奖励额度。若政府的监督成本C1+C2越小,政府越倾向于采取“积极监督”策略。在扶贫工作的早期,政府对企业以及贫困户的监督成本较高,但是随着扶贫工作的不断推进,相应体制机制的不断完善,政府的监督成本会不断降低。比如随着精准扶贫的不断推进,贫困户建档立卡,政府对贫困户的管理成本会不断降低。另外,对企业和贫困户的奖励s+s′等也归于成本的范畴,因而,出于成本的考虑,奖励的额度不宜过高,需要地方政府作出综合权衡。

三是上级政府对下级政府的监管及惩罚力度,即θF′。若上级政府对下级政府的监管越严格,且一旦发现“放松监督”惩罚额度越高,甚至超过政府进行监管的收益与成本之差,则下级政府越倾向于采取“积极监督”策略。因而,需要构建政府间的严格的监管体制。这时,下级政府为规避上级政府较高的处罚成本以及树立良好的公众形象,必然会对参与扶贫企业严格把关,而企业为了将损失降到最低,会选择积极参与扶贫,并获得一定的利润,同时,若政府和企业的策略组合是{监督,积极扶贫},则贫困户群体的最优策略是“主动参与”。可见,三方之间既出于自身利益考虑,又出于社会环境考虑,形成闭环良性生态系统。

六、结 论

在产业精准扶贫的演化过程中,影响参与主体策略选择的因素很多,任一个参与主体的策略选择发生变化,都会使其他两个参与主体的损益情况发生改变,从而影响他们的策略选择。因而,在制定策略时,要考虑影响博弈主体收益的主要因素,通过控制这些因素的变化来引导他们选择所期望的策略。

第一,由参与扶贫企业的复制动态方程可知,企业的策略选择主要受自身的利润和政府策略选择的影响,与贫困户的策略选择关系不大。如果积极参与扶贫的企业获得的利润额越大及企业形象提升越高,而消极参与扶贫的企业赚取的利润额越低,并且政府对积极参与扶贫企业的奖励额度s越大,同时对消极扶贫企业的惩罚额度越高,且与企业侵占的贫困户资产收益额越接近,即(N-zλF)很小甚至为负数时,这样能够使x的值趋向于1,即在参与扶贫的企业群体中提高企业选择“积极扶贫”策略的比例。

第二,由贫困户群体的复制动态方程可知,贫困户的策略选择主要考虑自身利益因素和企业的策略选择。如果贫困户群体通过闲暇娱乐获得的效用水平U1越低,主动参与脱贫时获得的额外收益J+h1越多,以及当企业采取“积极扶贫”策略时,贫困户主动和被动参与时利润分红差额(1-μ)(R1-R2)越大,这时会促使y的值趋向于1,即在贫困户群体中提高贫困户选择“主动参与”策略的比例。

第三,由地方政府的复制动态方程可知,政府的策略选择主要受自身的成本和收益的影响,与企业和贫困户的策略选择关系不大。当政府积极监督的形象提升越大,监督成本C1和C2越小,对企业的惩罚力度F越大,对企业和贫困户的奖励s和s′越小,以及本级政府放松监督时遭受上级政府的惩罚θF′越高,这样会促使z的值趋向于1,即在地方政府群体中提高政府选择“监督”策略的比例。

第四,通过对构建的演化博弈模型求解发现,当满足一定条件时所构建的博弈系统收敛于E8(1,1,1),即E8(1,1,1)是系统的演化稳定策略。这表明,在长期的演化博弈中,三方可以达到“企业积极扶贫、贫困户主动参与、政府监督”的理想模式,以实现可持续减贫。

猜你喜欢

消极收益群体
哪些群体容易“返贫”——受灾户、遇困户、边缘户
“群体失语”需要警惕——“为官不言”也是腐败
怎么设定你的年化收益目标
其他综合收益的几个重要逻辑关系解析
让自己发光
家庭教育:你种的是积极树还是消极树?
12
为特殊青少年群体遮风挡雨
不容忽视的校园“小群体”
为何当代艺术很多都是消极的,血腥的?