基于三方博弈的绿色技术创新演化研究
2022-07-15魏仕鹏
苏 屹, 魏仕鹏
(1.哈尔滨工程大学 经济管理学院,黑龙江 哈尔滨 150001; 2.清华大学 经济管理学院,北京 100084)
0 引言
20世纪以来,人类社会飞速发展,随着城市化的不断发展,严重的生态问题也随之而来,绿色技术创新开始成为全世界的重要议题。一般情况下,称能够减少环境污染、降低资源消耗、改善生态环境、促进生态文明建设的技术为绿色技术。近年来,大量学者在相关领域进行研究:迈克尔·波特于20世纪90年代提出“波特假说”,该假说认为适当的环境规制将刺激技术革新。Frondel等认为,环境规制政策越严厉,对绿色技术创新的激励作用越大[1]。李婉红以空间计量经济学为基础,构建省域工业绿色技术创新产出的影响因素理论模型,并提出R&D投入和人均GDP对省域工业绿色技术创新产出具有显著影响效应,环境规制强度对绿色技术创新的影响存在“阈值效应”[2]。Li-yan Sun等采用熵权加权TOPSIS方法建立了评价绿色技术创新对战略性新兴产业生态经济效率的影响的模型,构建了包括积极因素和障碍因素的评价指标体系[3]。Wang等发现,绿色保险能够降低企业的创新风险,正向促进绿色技术创新,但无法提高期望利润[4]。Anne的研究发现政府绿色采购行为能够正向影响绿色技术创新[5]。2018年,王锋正等通过对大量重污染行业上市公司数据进行汇总分析研究,证实环境规制能够正向影响企业绿色技术创新[6]。吴超,杨树旺,唐鹏程等研究发现我国重污染行业当前处于“创新但不绿色”的转型阶段,指出提升绿色技术创新效率的关键是能否进行合理有效的环境规制[7]。2019年,Kerdu Du等在研究中发现,绿色技术创新对于收入水平超过阈值的经济体,有明显的减缓效应[8]。陈晓,李美玲等人研究发现,环境规制与绿色技术创新之间存在一种“U”型关系,政府补助和环境规制可以正向促进绿色技术创新[9]。Yaling Deng等人提出一个企业绿色技术创新的最优水平受政治竞争的直接影响,同时也受环境治理最优投资比例的间接影响[10]。范莉莉,褚媛媛研究发现,在政府严格的环境监管下,企业增加环保支出能够促进绿色技术创新,但由于政治诅咒效应的存在,过于严格的环境监管和环保补助共同作用反而会抑制创新[11]。Yali Zhang, Jun Sun等构建技术-组织-环境框架,从技术就绪性、组织就绪性和环境就绪性等方面研究了企业如何进行绿色创新[12]。2020年,王洪庆,张莹对20多个省市面板数据进行分析,证实贸易结构升级对绿色技术创新的影响与环境规制密切相关[13]。李瑞琴认为,各级政府的环境规制政策与规制强度选择,必须与该地区的市场化进程动态适应[14]。汪明月等对政府市场规制进行研究,发现在任意决策类型下,废弃物排放强度全部呈现下降趋势[15]。郭捷,杨立成通过对我国各省数据的统计整理分析,发现政府对企业提供的研发资助对绿色技术创新具有正向影响[16]。Xiang Cai等也在研究中发现直接的环境监管可以有效地鼓励技术资本密集型产业中的绿色技术创新[17]。
从所检索文献来看,学者从多个维度对绿色技术创新进行研究:(1)环境规制对绿色技术创新具有正向推进作用,且有助于提高绿色技术创新效率。(2)政府的绿色采购行为、政府补助、政府的研发资金、企业的环保支出、绿色保险等均可正向推进绿色技术创新。(3)构建了包含积极因素与障碍因素的绿色技术创新评价体系。与已有文献相比,本文的贡献之处在于:(1)引入公众主体作为博弈的第三方,构建了更为完善的政府、企业、公众三方演化博弈模型。(2)引入惩罚参数。(3)引入了环境破坏的负面影响。
1 演化模型假设与收益矩阵
本文的三大博弈主体,政府、企业、公众在绿色技术创新演化过程中,为追求自身利益最大化,需要根据其他两方的策略的选择来决定自身策略,这种博弈并非传统的静止的一次性的博弈,而是三大博弈群体中每个有限理性的个体依据自身经验,在大环境中对群体中其他个体的行为进行观察学习,并在此基础上调整自身策略,最终趋于稳定的过程。该过程能够动态地反映政府、企业、公众在实际博弈过程中策略的演变,因此本文选择演化博弈方法对绿色技术创新的演化进行相关研究。基于此,进行如下假设构建博弈模型:
表1 三方博弈收益矩阵
假设1绿色技术创新博弈中存在三大博弈主体:政府、企业、公众。三大主体各自有两种策略选择,即政府主动/不主动支持绿色技术创新,其概率分别为x和1-x。企业进行/不进行绿色技术创新,其概率分别为y和1-y。公众认可/不认可绿色技术创新,其概率分别分z和1-z。三个主体中的个体都具有有限的理性,且会采取模仿的策略根据主体所在群体中其他个体的选择来选择自己的策略。
假设2政府选择支持“绿色技术创新”时,需要付出C1作为监管成本。当企业进行绿色技术创新时,会使得政府获得正面收益E1。若企业不进行绿色技术创新,造成的环境污染会使政府获得负面收益F1。政府选择不支持绿色技术创新时,若企业选择进行绿色技术创新,则政府获得正面收益E2。(E1>E2)
假设3企业正常生产的收益为R,若企业进行绿色技术创新,需付出研究成本P进行研究测试推广。此时,若政府支持绿色技术创新,政府会给予企业W1的研发资助。若企业不进行绿色技术创新,造成的环境污染会使自身收到F2的负面收益,且需要支付给政府罚款B。
假设4若公众认可绿色技术创新,便会选择主动监管,此时公众需要付出监管成本H,用于搜集相关证据。当政府支持绿色技术创新时,若公众举报成功,可以获得政府给予的奖励W2。当政府不支持绿色技术创新时,公众会给予政府一个额外的负面收益F。若企业不进行绿色技术创新,造成的环境污染会对公众造成F3的负面收益;若企业进行绿色技术创新,且当公众认可绿色技术创新时,公众会从各项新技术中获得环境收益M。
由政府、企业、公众可供选择的策略可知,三方共有八种博弈策略,由此构建三方的博弈收益矩阵如表1所示。
2 构建复制动态方程
根据表1的收益矩阵,分别计算政府、企业、公众选择“主动支持”和“不主动支持”策略时,其期望收益与“混合策略”下的平均收益,计算三者的复制动态方程分别为(1),(2),(3)。
(1)
z[B]+xz[-B]}
(2)
(3)
通过对系统的雅克比矩阵的局部稳定性分析可以得到系统的演化稳定策略(ESS),由(1)、(2)、(3)三个复制动态方程通过计算可得该系统的雅克比矩阵如式(4)。
(4)
令F(x)=F(y)=F(z)=0,可以得到局部均衡点共有八个,将各均衡点代入矩阵可得各均衡点所对应的雅克比矩阵,各个矩阵特征值如表2所示。
表2 各均衡点的特征值
3 均衡点稳定性分析与数值仿真
3.1 不同条件下的情境分析
依据演化博弈理论,当一个均衡点的雅克比矩阵所有特征值均为负时,该均衡点为系统的演化稳定点。根据实际情况,企业进行绿色技术创新所需要额外付出的成本P相较其不进行绿色技术创新所得到的负面收益F2要更大,即P>F2。公众进行监督所获得的奖励金额W2一定大于其收集证据等所需付出的成本H,即W2>H。因此,E1,E3,E5在任何情况下均不可能为系统的演化稳定点(ESS),故仅针对E2,E4,E6,E7,E8五个均衡点进行讨论。
为了更直观地研究上述模型,应用MATLAB2018a软件,对政府、企业、公众稳定策略的演化轨迹进行分析,根据上述分析设置五种情景,并进行仿真。下述五种情境的基本参数设置见表3。
表3 五种不同情境下的基本参数设置
情境1工厂建在郊区的小城镇。这种情境下,政府监管成本较高,企业进行绿色技术创新所付出的研发宣传成本较高,公众给予政府反馈的能力较低。
其仿真结果如图1。此时,满足-C1+F<0且F2-P+B<0。公众给予政府的负面评价小于政府主动支持时所需支付的监管成本;企业所需缴纳的罚款和环境破坏对其所造成的负面影响之和小于其进行绿色技术创新所需付出的研发宣传成本。企业进行绿色技术创新所需要的研发宣传成本过大,企业宁愿选择缴纳罚款并承受环境带来的负面收益也不愿意进行绿色技术创新,否则便会影响其正常收益。此时仅有公众采取积极态度,政府和企业均采取消极态度,而态度积极的公众给予政府的负反馈不足以平衡政府主动支持时所付出的成本,当地的环境仍会逐渐被破坏,属于一种较为糟糕的平衡状态。
情境2东北重工业基地。这种情境下,政府监管成本较高,企业研发宣传成本较高但不进行绿色技术创新会面临罚款风险,公众对自然环境要求较高。其仿真结果如图2。此时满足E1-E2-W1-C1<0,P-F2-B<0,H-M<0。相较于情境1,增大了政府对未进行绿色技术创新企业的罚款额度B。对政府而言,虽然主动支持绿色技术创新可以得到较多的收益,但最终的净收益要小于不主动支持时的收益。对企业而言,不进行绿色技术创新面临的负面收益大于其研发成本,因此企业更倾向于进行绿色技术创新。企业进行绿色技术创新的意愿先上升再下降最后逐渐上升趋于稳定。不进行绿色技术创新会对企业造成F2的负面影响,使其创新意愿上升,但是高昂的创新费用让企业逐渐降低了创新意愿,考虑到公众对绿色技术的认可和对良好自然环境的渴望,被举报对企业造成的高额罚款会令企业遭受更大的损失,经历波折后企业最终趋于进行绿色技术创新。对公众而言,环境改善使其获得的诸如空气改善、水质改良、气候宜人等环境收益大于公众所需付出的主动监管成本,因此公众仍会坚持认可绿色技术创新,愿意为良好的生活环境买单。这种情境下,企业和公众全部采取积极态度,政府选择消极态度。当地的自然环境因为绿色技术的产生普及,绿色产品的上市而得到了改善,公众的生存生活环境也得到了优化,属于一种较为理想的稳定状态。
情境3有大量难转型企业的城市。这种情境下,公众对政府的决策能够产生较大影响,企业进行绿色技术创新十分困难,即使在优惠政策支持下仍无法进行绿色技术创新。
其仿真结果如图4。此时存在C1-F<0,F2+W1+B-P<0时。与情境1相比,该情境降低了政府对绿色技术创新企业的奖励金W1,增大了公众给予政府的负反馈F。此时公众能够给予政府较大的负面影响,负反馈大过政府选择主动支持所需要付出的成本。企业进行绿色技术创新所需要付出的净研发宣传成本(P-W1)比企业不进行时绿色技术创新时所需缴纳的罚金与企业获得的环境损益之的和更大,原因在于政府虽然有意支持绿色技术创新,但是给予企业的经济奖励过低,而创新产品的开发与宣传需要一笔较大的开销,企业可能宁愿选择缴纳高额的罚款也不愿意进行绿色技术创新。此时政府和公众都采取积极的态度,企业采取消极的态度,生产原产品的过程仍会让自然环境遭到破坏,政府和公众给予企业的反馈力度不够,属于一种较糟糕的稳定状态。
情境4位于山区的粮食产地,该情境下政府积极响应政策,企业在政策扶持下进行绿色技术创新成本降低,公众监管成本高。
其仿真结果如图4。此时存在C1+W1+E2-E1<0,P-F2-W1-B<0,-H+M<0,与情境1相比,增大了企业进行绿色技术创新带给政府的收益E1,增大了政府对未进行绿色技术创新企业的罚金B,提高了公众监管成本H。该情境下,企业进行绿色技术创新会让政府获得一笔高额的财政收益,在支付监管成本、奖励企业后仍为正值,政府会趋向于主动支持。因为罚金的提高,企业进行绿色技术创新所需的净成本P-W1小于其不进行时所需要承受的负面收益,与其承受高额的罚款,不如把资金用来进行绿色技术的研发,收获更好环境的同时避免环境破坏带给自身的环境损益,企业会趋向于进行绿色技术创新。由于大环境对绿色技术创新的认可,公众对其进行监管的成本有所上升,其所获得的环境收益相较高额的监管费用使公众不太愿意买单,公众最终会趋于不认可。这种情境下,政府和企业都采取积极态度,而公众态度消极,政府和企业双方的共同努力会使环境得到改善,政府获得巨大收益,企业也会从中获得一定的收益,公众则会在无形中获益,属于一种良好的稳定状态。
情境5一二线大城市。这种情境下,政府监管成本较低,企业因自身科技积蓄与政策扶持创新成本降低,公众对自然环境有较为强烈的需求。
其仿真结果如图5。此时存在C1+W1+E2-E1<0,P-F2-W1-B<0,-M+H<0时,与情境4相比,降低了公众监管成本。该情境下政府与企业的行为与情境4相同。在监管成本降低后,公众获得的环境收益,让公众愿意付出一定的监管费用来监督企业进行绿色技术创新,维持当地良好的生态环境,公众最终会趋于认可。这种情境下政府、企业和公众都采取积极态度,公众监督政府与企业,政府监督企业,企业的绿色技术创新为政府创造利益,为公众提供良好的自然环境,是博弈各方所共同追求的稳定状态。
3.2 群体策略初始变化对演化结果的影响
由复制动态方程可知,博弈主体的最终演化均衡状态除了受上述模型中各参数的影响外,还受其他博弈主体决策比例的影响,上述情境分析中设定三方博弈主体的初始意愿x=y=z=0.5。为增强结果说服力,通过调整某一群体初始值对演化结果进行检验。情境5是一种博弈各方共同追求的稳定状态,选取情境5的参数,令三方博弈的初始值改变,探究其对结果的影响。
图6和图7共同体现了三方博弈主体的策略初始值变化对政府最终决策的影响。从图6可知,政府的决策最终也会趋于1,选择主动支持绿色技术创新的初始意愿越强烈,x趋于1的速度越快。如图7所示,政府具有较强的领导作用,其最终决策受到企业和公众初始意愿的影响较小,无论企业开始时的进行意愿多强多弱,或者公众有多么认可或者不认可绿色技术创新,政府最终的决策都不会改变,甚至路径也不会发生变化。
图8和图9共同体现了三方博弈主体的策略初始值变化对企业最终决策的影响。从图8可知,企业的决策最终也会趋于1,选择进行绿色技术创新的初始意愿越强烈,y最终趋于1的速度越快。在整个过程中会有一个不算太明显的先下降再回升的过程,主要原因是企业纠结于研发成本和惩罚之间的选择。如图9所示,企业最终决策不受政府和公众初始意愿的影响,但是政府和公众初始意愿会影响其演化速度,政府具有较强的领导作用,若政府初始意愿较高,则企业最终趋于1的速度越快。
图10和图11共同体现了三方博弈主体的策略初始值变化对公众最终决策的影响。从图10可知,公众的决策最终也会趋于1,初始选择认可绿色技术创新的初始意愿越强烈,z最终趋于1的速度越快。当公众初始意愿很低时,会表现出先缓慢后快速,最后缓慢的演化过程,这是因为最开始认可的人较少,随着认可所得到的生态环境改善的特点不断显现,越来越多的人选择认可,直到达到一个峰值后,仅有少数人因为种种原因不认可。如图11所示,政府和企业的初始意愿大小并不会影响到公众最终的决策。
综上所述,在满足稳定条件时,政府、企业、公众三方的最终决策都不受到其他两方初始意愿的影响。对其他四个稳定点的仿真分析后得到相同结论。因篇幅所限,本文并未列出。由此可以说明,前文中的情境拥有较高的可信度。
4 结论与建议
在绿色技术创新的推广过程中,涉及到的政府、企业、公众三个博弈方,如何通过协作与互相监督的方式共同促进绿色技术创新,建立起健康的合作监督方式是问题的关键之处。本文通过matlab2018a对博弈模型的仿真得出以下结论:第一,政府、企业、公众三方在不同的条件下,最终的决策结果不同。政府支持绿色技术创新能够获得的收益、政府给予企业奖励与罚金的高低、公众参与监督所需付出的成本、公众给予政府的负反馈程度,都会直接影响博弈方最终的策略选择。第二,政府、企业、公众三方中的任意一方初始意愿的改变都不会影响该群体最终的策略选择。第三,政府、企业、公众三方最终的策略选择也不受其他两方初始意愿高低的影响,但政府和公众会对企业最终趋于稳定的速度产生影响。
基于本论文的研究结论,为推动区域绿色技术创新发展,可以从以下几方面入手:
第一,政府积极制定相关推广政策,降低公众监管成本。对比均衡点E3和E5可以发现,在仿真过程中通过加大政府给予未进行绿色技术创新企业的惩罚B,可以产生不同的演化结果。对比E3的(支持,不进行,认可)这种耗费大量监管成本但无法对环境进行保护的结果,E5的(支持,进行,认可)显然是一种企业在政府和公众双重监督下进行绿色技术创新的更为和谐的状态。加大对未进行绿色技术创新企业的惩罚力度,通过罚款、税收等政策对企业施加经济压力,可以促进其进行绿色技术创新。同时对积极进行绿色技术创新的龙头企业给予经济以及政策上的奖励,可以是技术支持、税收减免、经济奖励等。公众作为受到环境影响最大的群体,本身存在配合监督的意愿,但是E4(支持,进行,不认可)的监管成本过高,则会降低公众监管意愿,进而影响人民生活幸福感。因此,政府可以采取建设举报平台、设环境保护窗口等方措施,降低公众监管成本,积极与公众配合推广绿色技术创新。
第二,企业积极进行顺应政策的绿色技术创新,通过绿色技术方面的积累减少在绿色技术创新研发途中所需要的成本。在E4(支持,进行,不认可)和E5(支持,进行,认可)两个稳定点上,进行绿色技术创新所需要付出的净研发宣传成本(P-W1)都是较小的数值,而在E3这一较差的稳定点上,净研发宣传成本则较大。在企业持续发展过程中进行绿色技术的大量积累,增强自身品牌影响力,有助于降低绿色产品的研究和宣传成本P。积极响应政府政策,努力推进绿色技术创新发展,积极争取研发资助W1,促进博弈向着更好的方向演化。
第三,公众营造良好的环保氛围,与政府形成一种良性的监督关系,增强公众的环境保护意识。公众的环境收益M的小大在对博弈中公众群体行为有至关重要的影响,良好的环境在公众心中越重要,其收益M越大。提升公众对绿色技术创新的主动认可,优先选购绿色产品,使其对良好的生态环境需求度增高。公众给予政府的负反馈F,能够影响政府的最终决策。对比均衡点E2(不支持,进行,认可)和均衡点E5(支持,进行,认可)可以发现,只有公众的要求足够强烈,政府才会对公众的要求做出相应反馈。公众可以通过建议信、新媒体等方式对政府进行监督,让政府听到来自百姓的声音,增强自身价值,提高给予政府反馈的能力。