APP下载

政府监管与闭环供应链环保投资策略演化博弈分析

2019-10-18王建华黄贤凤马汉武刘旭

物流科技 2019年9期
关键词:政府监管演化博弈

王建华 黄贤凤 马汉武 刘旭

摘要:针对闭环供应链在经济可持续发展中具有重要地位而当前其环保投资不足的现状,构建包含政府监管策略与供应链环保投资策略的博弈模型,进行策略演化动态稳定性分析,采用数值仿真分析决策参数和初始条件对演化结果的影响及其演化路径。结果表明,政府监管成本、政府奖惩力度、投资收益等是影响监管和环保投资策略动态演化的关键因素;环保投资收益较高时,无论政府是否选择监管策略,闭环供应链都会选择环保投资策略;环保投资收益较低时,政府进行监管政策设计需要在调整奖惩力度,同时采取激励措施促进环保技术的发展来降低供应链环保投资的投入成本,以实现闭环供应链向环保运作状态的演化。

关键词:政府监管;闭环供应链;环保投资;演化稳定策略;演化博弈

中图分类号:F273文献标识码:A

O引言

随着科技和生产力的快速发展,产品开发、生产、使用和更新换代的速度越来越快,废弃产品越来越多,资源消耗和环境恶化问题日益凸显,尤其在经济处于快速增长时期的中国。为了充分利用这些废旧产品的残值,减少其对环境的危害,世界各国陆续出台相关的政策和法律法规加强对企业可持续发展的引导和规制,促进闭环供应链的发展。

政府引导闭环供应链发展通常采取两类方式:奖惩制度和回收补贴。奖惩制度一般规定特定的回收率,如果生产者废旧品回收达到特定回收率给予奖励,如果生产者废旧品回收低于特定回收率则给予惩罚。易余胤等(2014)研究奖惩制度对混合回收渠道下闭环供应链节点企业最优定价和渠道选择的影响。王文宾等(2016)比较政府奖惩机制和税收一补贴机制对于提高逆向供应链回收率的有效性。王文宾等(2019)研究政府奖惩机制下闭环供应链的成本共担一利润共享契约,研究发现随着政府奖惩力度的提高,产品的零售价降低,回购价、回收率和回收商的利润均提高,但制造商的利润与目标回收率有关。石纯来等(2019)研究规模不经济下奖惩机制对闭环供应链制造商合作策略影響。

奖惩制度涉及主体主要是企业,为了进一步调动消费者参与到闭环供应链中来,政府推出一系列回收补贴政策。回收补贴政策在执行过程中虽然是政府根据回收量给予回收企业补贴,但是企业可以根据补贴政策采取不同的市场活动,例如以旧换新补贴或二手回收现金券等,这些活动会提高消费者参与闭环供应链的积极性。林杰等(2014)研究在家电以旧换新背景下政府补贴对闭环供应链成员利润分配的影响。李新然等(2015)研究政府“以旧换再”补贴下的差别定价对闭环供应链回收量和利润的影响。李新然等(2017)研究再造品销售困难环境下政府补贴和销售努力对闭环供应链运作效益的影响,并提出了相应对策。Liu等(2016)基于回收品质量视角研究政府补贴对定价的影响。韩小花等(2019)针对两阶段闭环供应链系统,研究了古诺竞争型闭环供应链中的“以旧换再”策略选择问题。

上述研究的政策主要基于供应链回收数量而进行的设计,没有考虑供应链回收再制造过程中的环保性。而现实闭环供应链中存在很多无拆解资质或环保设备和技术不过关的企业,这些企业在进行废旧品的回收、拆解与再制造过程中容易形成资源利用率低而二次污染严重的结果。有鉴于此,本文综合考虑经济性和环保性指标,利用演化博弈方法研究政府监管策略和闭环供应链环保投资策略的演化路径,重点分析政府奖惩力度和监管成本、供应链环保投资成本与收益等参数对政府和供应链群体策略演化的影响规律,以期为闭环供应链环保投资策略选择提供客观有效的理论指导,为政府制定可持续发展政策提供理论依据。

1问题描述及模型构建

1.1问题描述。考虑闭环供应链从市场上回收废旧产品并进行再造和再循环,由于理性行为人追求经济效益的特点使得很多闭环供应链不具备正规的再造流程或再处理设备,其在再造过程中一方面提高了废旧产品的回收再利用数量,另一方面又导致对环境产生了较大的污染.但是在现行的技术水平和市场需求条件下,闭环供应链的存在整体上具有较大的社会效应,从而使得政府监管力度和处置措施不是非常的完备和严厉。但是为了促进闭环供应链逐步向环保运营方向发展,发挥很好的资源再利用和环境保护作用,政府需要采取一定的力度对闭环供应链进行监管,促进其进行环保投资,增强其再处理过程的技术水平和污染处置能力。

在该博弈中,参与主体主要是政府和闭环供应链群体,每一群体成员都有两个纯策略选择。闭环供应链可以选择进行环保投资或不进行环保投资,政府可以选择监管或不监管。政府按照一定的随机比例a对闭环供应链进行监管和查处,如果发现闭环供应链没有进行环保系统的投资,则进行处罚P,如果发现闭环供应链进行了环保系统的投资,则给予奖励A,其中实施监管活动需要支付成本Cg。闭环供应链对资源再利用的社会收益为R,环保运行可以获得经济收益E1,正常运行可以获得经济利益E2,其中:有卢比例的成员采取了环保系统的投资策略,投资需要成本为Cj,运作过程对环境的污染效应为h;有1-B的成员不采取环保投资,环境污染效应为H。

为了限定问题应用场景和后续表述方便性,进行如下假设和定义:(1)环保投资供应链的污染效应要比没采取环保投资供应链的低,即h1>E2。(3)令E1-Ci为供应链环保收益、E2为供应链正常收益、E=E1-Ci-E2为供应链环保溢价收益。

1.2模型构建。根据鹰鸽博弈的思想建立政府监管与闭环供应链环保投资策略博弈收益矩阵如表1所示。

2演化均衡分析

从表3可以看出,在政府监管成本较低而闭环供应链具有中等环保溢价收益的前提下不存在演化稳定策略,可以看出政府和闭环供应链将都选择混合策略。当政府因为监管成本较低而选择较高比例的监管策略时,闭环供应链如果不进行环保投资将受到政府的罚款,于是闭环供应链中有一定比例的成员会选择采取环保投资;但是随着采取环保投资的比例提高,政府实施监管策略不仅需要投入监管成本还需要给予采取环保投资的供应链以奖励,政府将逐步缩小监管的比例;继而因为政府监管力度减弱而不能获得足够的政府奖励来弥补环保溢价收益为负值的损失,使得供应链选择不进行环保投资的比例增加。如此反复,演化博弈的结果就是政府和闭环供应链均选择混合策略。

2.3P>Cg,E>0。政府对不采取环保投资的闭环供应链罚款要高于政府监管成本,渠道环保溢价收益能够产生正向收益,即低政府监管支付与高环保溢价收益环境。此时,演化博弈动态方程存在4个均衡点:D(0,0),A(1,0),B(0,1),C(1,1),对这4个均衡点进行稳定性分析如表4所示。

从表4可以看出,在政府监管成本较低而闭环供应链环保溢价收益高的前提下,演化博弈的稳定策略为B(O,1)。此种情形下,由于采取环保投资可以实现正向的环保溢价收益,不论政府是否进行补贴,闭环供应链都会自发地选择环保投资策略,在提高收益的同时也能降低运营对环境的危害;因政府奖励对于闭环供应链环保投资来说起到了锦上添花的作用,不论政府是否进行监管都不会影响闭环供应链的策略,从而导致政府监管积极性降低;同时不采取监管措施又能节约政府运作成本,更进一步促使政府采取不监管策略。

2.4Pg,E+A+P<0。政府对不采取环保投资的闭环供应链罚款要低于政府监管成本,渠道环保溢价收益加上政府对采取环保投资渠道的奖励与没有采取环保投资渠道的惩罚之和都不能产生正向收益,即高政府监管支付与低环保溢价收益环境。此时,演化博弈动态方程存在4个均衡点:0(0,0),A(1,0),B(0,1),C(1,1),对这4个均衡点进行稳定性分析如表5所示。

从表5可以看出,在政府监管成本较高而闭环供应链环保溢价收益降低的环境下,演化博弈的稳定策略为0(0,0)。此种情形下,政府因为监管成本过高,而对不进行环保投资的闭环供应链惩罚又过低,在长期演化过程中,政府趋向于不进行监管。闭环供应链由于环保溢价收益为负值,即使考虑到政府的奖励和惩罚也不能实现正向的环保投资收益,作为市场独立的经济人,渠道会选择不进行环保投资。

2.5Pg,0

从表6可以看出,在政府监管成本较高而闭环供应链具有中等环保溢价收益的环境下,演化博弈的稳定策略为0(0,0)。政府因为监管成本较高而宁愿放弃对不进行环保投资的渠道采取监管和惩罚的策略;而政府不采取监管措施,采取环保投资策略的供应链就无法获得政府的奖励,不采取环保投资的闭环供应链也不用担心政府的惩罚,同时考虑采取环保投资不能获得正向环保溢价收益,所谓独立经济行为人的供应链将最终选择不采取环保投资策略。

2.6Pg,E>0。政府对不采取环保投资的闭环供应链罚款要低于政府监管成本,渠道环保溢价收益能够产生正向收益,即高政府监管支付与高环保溢价收益环境。此时,演化博弈动态方程存在4个均衡点:O(0,0),A(1,0),B(O,1),C(1,1),对这4个均衡点进行稳定性分析如表7所示。

从表7可以看出,在政府监管成本较高而闭环供应链环保溢价收益高的前提下,演化稳定策略为B(0,1)。此种情形下,由于采取环保投资可以实现正向的环保溢价收益,不论政府是否进行补贴,闭环供应链都会自发地选择环保投资策略,在提高供应链收益的同时也能降低渠道运营对环境的危害;初始状态下政府基于促进环保回收和绿色发展的观念而采取一定比率的监管,但是因为监管成本较高而惩罚力度较低,以及不论政府是否采取监管措施时供应链都会采取环保投资策略,政府最终只会采取不监管的策略。

3数值仿真分析

下面运用Matlab软件进行数值仿真,一方面证实上述6种环境下的均衡点分析结论,另一方面分析政府监管和闭环供应链进行环保投资比例初始值向均衡点演化的轨迹。a和β的初始值分别取[0.1,0.9]、[0.3,0.7][0.5,0.5][0.7,0.3][0.9,0.1],这5种初始值下的实验分别命名为Z1-Z5,时间周期为[O,100],每种实验场景中均相同的参数P、A、R、h、H分别设置为3、4、20、5和8,其他实验参数标注于仿真演化图形下方,其中仿真演化圖中横轴和纵轴分别代表政府选择监管策略比例α和闭环供应链选择环保投资策略比例β。

图1显示在低政府监管支付与低环保溢价收益环境下[α,β]不同初始值向最终的演化稳定策略A(1,0)的演化路径,其中:当初始值卢较大时,如Z1~Z4,先迅速降低β值,直至β值降至0,在此期间,α值甚至有少许的降低,然后再不断增加α值,使得α值增加到1,从而达到稳定均衡点A(1,0);当初始值β较小时,如Z5,也是先迅速降低β值,在此同时α值也会逐步增加,然后α值快速增加到1,从而达到稳定均衡点A(1,0)。在实验的5种初始策略组合下,开始有一定的闭环供应链采取环保投资策略,但是由于环保投资的溢价收益要明显低于不进行环保投资的收益,闭环供应链宁愿放弃政府给予的奖励并且冒着被惩罚的风险而迅速选择不进行环保投资策略,而当闭环供应链群体采取环保投资策略的比例低于10%左右时,激发了政府迅速加大监管力度,直至全面监管。

图2显示在低政府监管支付以及闭环供应链具有中等环保溢价收益环境下整个系统不存在演化稳定策略,根据前述演化均衡分析可知系统最终只得到中心点D,即最终两个群体将采取混合策略(0.57,0.14),说明这种环境下博弈双方策略选择具有相互依赖性,并呈现为一种周期行为模式。两群体策略比例不同初始值[α,β]下的动态演化路径为:当β高于0.14时,α值朝着0的方向演化;当β低于0.14时,α值朝着1的方向演化;当α高于0.57时,β值朝着1的方向演化;当α低于0.57时,β值朝着0的方向演化。这种情形表示现实经济环境中,当闭环供应链采取环保投资策略的比例β较高时,则政府将逐步降低监管策略实施的比例,而当该比例β低于0.14时政府则逐步提高监管策略实施的比例;当政府采取监管策略的比例α较高时,则闭环供应链采取环保投资策略的比例将增加,而当该比例α低于0.57时闭环供应链选择环保投资策略的积极性将降低。

图3显示在低政府监管支付与高环保溢价收益环境下[α,β]不同初始值向最终的演化稳定策略β(0,1)的演化路徑,其中:当初始值β较小时,如Z4和Z5,先迅速提高β值,然后在提升β的同时降低α值,从而达到稳定均衡点β(0,1);当初始值β较大时,如Z1~Z3,β值提升的同时降低α值,从而达到稳定均衡点β(0,1)。在实验的5种初始策略组合下,开始闭环供应链群体有一定比例不采取环保投资策略,但是由于环保投资的溢价收益要明显高于不进行环保投资的收益,在利益驱动下,闭环供应链群体会迅速选择环保投资策略,从而促使政府选择不监管策略以节约监管和奖励成本,达到“无为而治”的系统状态。

图4显示在高政府监管支付与低环保溢价收益环境下[α,β]不同初始值向最终的演化稳定策略0(0,0)的演化路径,其中:当初始值β较大时,如Z1,先共同降低α和卢值,然后迅速降低β值,然后α和β值共同降低至0,从而达到稳定均衡点O(0,0);当初始值β较小时,如Z2-Z5,先共同降低α和β值,直至β值降至0,然后再降低α,从而在达到稳定均衡点O(0,0)。在实验的5种初始策略组合下,开始政府群体有一定比例采取监管策略,但是由于监管费用过高,则逐步选择不采取监管策略,宁愿选择“污染后再治理”策略,这样则引导闭环供应链选择不进行环保投资策略,以获得较高的收益。

图5显示在高政府监管支付与中环保溢价收益环境下[α,β]不同初始值向最终的演化稳定策略0(0,0)的演化路径,其中:当初始值α较大时,如Z4-Z5,,起初在快速降低α的同时,β值有一定的增加,但是当α降低到一定程度时,β值也开始快速降低,从而达到稳定均衡点O(0,0);当初始值α较小时,如Z1~Z2,先共同降低α和卢值,α降低到一定程度时β值开始快速降低,从而达到稳定均衡点O(0,0)。该种情形下的演化结果同图4,只是演化过程中闭环供应链的中间演化过程稍有不同。

图6显示在高政府监管支付与高环保溢价收益环境下(α,β)不同初始值向最终的演化稳定策略B(0,1)的演化路径,其中:当初始值α较大时,如Z5,起初在快速提高卢的同时α值有一定的降低,但是当β值增加到一定程度时,α值开始快速降低,从而达到稳定均衡点B(0,1);当初始值α较小时,如Z1~Z4,α值在降低的同时β值增加,直至达到稳定均衡点B(0,1)。该种情形下的演化结果同图3,最后都得到闭环供应链采取环保投资策略而政府采取不监管的策略。

4结论与建议

本文利用演化博弈方法研究政府监管与闭环供应链环保投资策略选择和演进规律,给出了政策设计和企业决策的参考方法。主要结论和建议如下:

(1)从政府角度看,当监管支付较高时,不论闭环供应链是否采取环保投资策略,政府最终都将采取不监管策略。此种情况下,政府如果希望能够对闭环供应链的绿色运营发挥一定的监管和引导作用,则需要采取措施降低监管过程所耗费的人力、信息收集、监管检测等方面的成本,或者提高对不采取环保投资渠道的惩罚额度。

(2)从闭环供应链来看,当采取环保投资策略能够获得较高的环保溢价收益时,不论政府是否选择监管策略,闭环供应链最终都会采取环保投资策略。但是也要注意,由于闭环供应链之间的彼此竞争性,采取环保投资策略的闭环供应链所获得的效益不一定优于不采取回收投资策略的供应链,这将影响闭环供应链采取环保投资的内在驱动力。此种情况下,政府可以积极调研和公布不同闭环供应链运作成本和收益数据,引导闭环供应链积极采取环保投资策略,而最后政府可以完全不用对闭环供应链进行监管,将监管职能转变为行业研究与指导。

(3)当环保投资策略不能获得高环保溢价收益时,闭环供应链没有采取环保投资的积极性,或者不采取环保投资,或者根据政府监管的严厉程度动态调整环保投资。此种情况下,要想闭环供应链能够积极采取环保投资策略,从而提高废旧产品回收再利用效率或降低废旧产品回收处理的环境污染水平,则需要通过激励相关研发创新活动,以提高环保处理系统软硬件技术水平及其市场应用规模,从而降低其导人成本,或者通过市场引导和绿色意识宣传使得采用环保系统后的闭环供应链回收规模效应远高于不采用环保系统的闭环供应链,达成高环保溢价收益。

(4)政府与闭环供应链策略博弈的短期演化规律同两类群体初始策略比例具有较强的关联性,而长期的演化稳定策略则同两类群体支付参数具有较强的关联性。因此,在动态的市场环境中,如果希望达成短期市场效应,政府部门间可以通过协同运作调控短期的监管力度来引导闭环供应链群体策略行为;而希望系统达成长期的、环保的稳定状态,则需要政府监管运作成本、监管政策以及供应链环保投资技术和收益等一系列因素的协同提升。

猜你喜欢

政府监管演化博弈
农民工转户行为的演化博弈分析
电子商务中客户评价策略选择的演化博弈分析
公平关切下处理商与回收商博弈模型研究
地方政府不当干预对产能过剩的影响分析
公共服务外包该“放”什么,“管”什么
关于资产证券化中信用评级行为的分析
环保投入、政府监管与大气污染防治
政府在网络订餐食品安全监管的研究