APP下载

城市垃圾回收一体化系统三方演化博弈研究
——基于政府主导背景

2022-09-23张克勇郭雨欣

河南科学 2022年8期
关键词:均衡点收运垃圾处理

张克勇, 郭雨欣

(中北大学经济与管理学院,太原 030051)

21 世纪,我国每年的城市生活垃圾清运量都在亿吨以上,并呈现上涨态势[1]. 据统计,2005 年我国垃圾清运量约为1.56 亿t,到2020 年,垃圾清运量增加至2.4 亿t[2]. 但同时,每年仍有近三分之一垃圾并未清运,垃圾回收利用率低. 垃圾分类作为垃圾治理的源头,是破解这一难题的关键. 为此,国家和地方政府出台各类政策助推垃圾分类处理的发展. 2018年,宿迁市提出“宿迁方案”,试图解决垃圾分类试点的最大痛点——分类收集、混装转运,将垃圾分类从“分类收集”走向“收运处”一体化[3]. 2019 年,垃圾分类强制时代到来,广州市和温岭市等地相继启动生活垃圾分类、收运、处置一体化工作,努力实现生活垃圾前中末端闭环管理[4].

垃圾处理一体化是解决目前垃圾分类难题的办法之一,但由于缺乏规范性管理,很多地区一体化处理模式难以推行. 生活垃圾“收处运”一体化处理根本在于提高垃圾处理链的效率,垃圾分类下的垃圾处理链主要分为三个环节:源头分类投放、中端运输、末端处理再生[5],每一个环节都离不开居民,企业和政府的参与[6]. 但在这过程中,往往存在源头分类积极性低下,中末端回收过程垃圾混装、违规填埋、垃圾回收物流信息平台建设缺乏[7-8]等负面因素. 为此,对垃圾处理链中的某些主体行为进行研究,对提高垃圾处理链的效率有着一定意义.

国内外对于提高垃圾处理链效率的研究主要集中在以居民为主体的提高源头分类效率上. Luo[9]通过即时反馈的数字分类游戏类比居民垃圾分类行为,得出即时反馈可以成为一个有效吸引和教育公众提高回收率的工具. Tabata[10]、MENGetal[11]综合运用各种理论和方法研究居民垃圾处理行为,提出了相应地提高垃圾分类干预政策和机制. 在国内,不少学者借助博弈理论对此研究,研究既有侧重静态[12]、动态演化[13]等,也包含不同视角下的博弈,如信息不对称[14]、逆向物流[15]等. 王伟等[16]通过构建垃圾回收体系模型,理清了由居民、垃圾处理企业和地方政府组成的三方博弈中各主体间的利益关系,并界定了不同主体的差别责任;许振晓和李家辉[17]认为三方组成有机整体,任何一方盈亏都受到其他主体战略选择的影响;在两两博弈的研究中,周叶等[18]对居民垃圾分类行为与政府监管行为进行演化博弈分析,得出居民垃圾分类行为与政府监管行为是相互影响的结论,明确科学合理的监管政策可以有效推进垃圾分类;而高明和吴雨瑶[19]建立分类源头主体——居民和收运企业的两方博弈,得出只有在政府奖惩双管齐下,社企联动分类的演化均衡策略下,两方能更快更好地实现垃圾分类的.

综上所述,以往研究多以解决垃圾分类源头上的问题,却忽视了垃圾处理链中的中末端回收主体——垃圾收运与处理企业,对提高垃圾分类最终效率的影响. 本论文基于现实背景下,研究垃圾处理链中的中末端回收系统稳定性,并构建一体化的垃圾回收产业链,将系统相关方垃圾收运、垃圾处理企业和政府作为主体,通过建立三方演化博弈模型去分析系统内部稳定性和主体演化趋势,并探寻政府行为对理想化下系统演化的影响,以期得到一些有价值的结果.

1 模型构建

1.1 模型假设

1)博弈三方为政府、垃圾收运企业、垃圾处理企业,三方均为有限理性,各主体之间存在信息不对称,博弈行为随机且互相有影响.

2)地方政府策略集g(g={g1,g2})表示地方政府是否积极推进垃圾一体化回收政策,g1表示积极推进,g2相反. 垃圾收运企业策略集c(c={c1,c2})表示是否同意加入垃圾一体化“收运”体系,c1表示同意,c2相反.垃圾处理企业策略集p(p={p1,p2})表示是否同意加入垃圾一体化“收运”体系,p1表示同意,p2相反.

3)博弈主体有一定概率选择自己的行动. 假设在初始状态,垃圾收运和垃圾处理企业选择合作的概率分别为m1和n1,选择不合作的概率为m2和n2(m1+m2=1,n1+n2=1);政府积极推进的概率为q1,消极推进的概率为q2(q1+q2=1).

4)收运企业为方便工作,节省运输和人力成本Kc1,将已分类垃圾进行混装运输,若被政府部门发现需支付罚款Fc1,且此行为造成处理企业额外支付分类费用Ep1;处理企业为节约成本Kp1选择将可回收垃圾填埋,若被政府部门发现需支付罚款Fp1;政府在积极推进与消极推进政策时,其付出成本Cg1>Cg2.

5)所有参数均大于零.

1.2 符号说明

1.2.1 企业

Cc1、Cp1为收运企业、处理企业不合作时的收运和处置成本;Kc1、Kp1为收运企业和处理企业不合作时因违规操作节约的费用;Ep1为处理企业因收运企业垃圾混装,而额外支付垃圾分类的费用;Ic1、Ip1为收运企业、处理企业不合作时的收益;Fc1、Fp1为收运企业、处理企业违规时,政府部门对其进行的行政罚款;Cc2、Cp2为收运、处理企业进行合作时的收运和处置成本;Ic2、Ip2为收运、处理企业进行合作时的收益;Sc2、Sp2为收运、处理企业合作时建设一体化垃圾处理平台时的额外费用;V为收运、处理企业合作进行合作时给政府带来的社会效益.

1.2.2 地方政府

Cg1为地方政府选择积极推进一体化回收政策时的成本;Cg2为地方政府选择消极推进一体化回收政策时的成本;Fg2为地方政府选择消极推行政策时因形象降低造成的损失;Ig1为地方政府选择积极推行政策策略时国家给予地方政府的奖励;β为表示地方政府对垃圾收运和垃圾处理企业的监管力度.

1.2.3 地方政府与企业

Mc2、Mp2为地方政府积极推行时给予选择合作的企业的补贴,包括设施建设,技术引进;Qc2、Qp2为地方政府消极推行时,选择合作的企业建设物流平台等设施的费用;W为地方政府积极推进政策时,不合作的企业因考评不合格而造成的损失.

1.3 收益矩阵

结合问题描述,得一体化回收系统三方博弈的收益矩阵,如表1所示.

表1 一体化回收系统三方博弈的收益矩阵Tab.1 Income matrix of integrated recycling system tripartite game

2 演化博弈模型分析

2.1 演化复制动态方程

在一体化回收系统中,根据收益矩阵,构建地方政府、垃圾收运企业和处理企业三方博弈主体的复制动态方程,掌握各主体在不同策略下的动态变化速度.

2.1.1 垃圾收运企业期望函数与复制动态方程

通过表1得,收运企业选择合作和不合作的期望收益分别为Ec1、Ec2,求解如下:

根据Malthusian动态方程得收运企业的复制动态方程F(g)为:

2.1.2 垃圾处理企业期望函数与复制动态方程

同理,处理企业选择合作和不合作的期望收益分别为Ep1、Ep2,求解如下:

根据Malthusian动态方程得处理企业的复制动态方程为:

2.1.3 地方政府期望函数与复制动态方程

同理,地方政府选择积极推进和消极推进的期望收益分别为Eg1、Eg2,求解如下:

根据Malthusian动态方程,得地方政府的复制动态方程为:

2.2 稳定性分析

根据文献[20-21]中演化博弈均衡点的求解方法,步骤如下:

首先,求解一体化“收处”系统中的平衡点. 令系统中三个主体的动态复制方程公式,联立后结果为0.

其次,讨论均衡点. 求解公式13得:(0,0,0)、(1,0,0)、(0,1,0)、(0,0,1)、(1,1,0)、(1,0,1)、(0,1,1)、(1,1,1)共8个特殊均衡点. 对于其余均衡点,因均为非渐进稳定状态[15],只需讨论特殊均衡点,即可研究一体化回收三方博弈系统的稳定性.

接着,根据Lyapunov稳定性理论,通过对系统中三方主体的动态复制方程(公式(4)、(8)、(12))求偏导,得到Jacobi矩阵如下:

然后,根据矩阵特征值算法,将8 个特殊均衡点带入Jacobi 矩阵中,得到相应的特征值如表2 所示. 由Lyapunov判别法可知,当矩阵中所有特征值λ>0时,该均衡点不稳定;当所有特征值λ<0,均衡点才为渐进稳定点. 由表2可得,所有均衡点特征值都存在可正可负的情况. 因此,需讨论均衡点稳定性条件,具体情况如表3所示. 所以,在满足表3条件的情况下,这8个特殊均衡点可能是进化稳定策略.

表2 各特殊均衡点的特征Tab.2 Characteristics of each special equilibrium point

表3 各特殊均衡点的稳定性条件Tab.3 Stability conditions of each special equilibrium point

3 数值仿真

根据表3分析得,8个均衡点稳定条件并不相同. 本文研究目的是使系统达到(1,1,1)的理想状态,故只需满足稳定性条件8. 因此,在此条件下,在参考文献[21]中的参数假设基础上,将参数取值为:Cc1=3,Cc2=2,Cp1=4,Cp1=3,Cg1=1.5,Cg1=1,Ic1=4,Ic2=5,Ip1=5,Ip2=6,Ig1=5,Mc2=1,Mp2=2,Sc2=2,Sp2=3,β=0.5,Fc1=2,Fp1=2,Fg2=2,Kc1=1.5,Kp1=1,W=2. 为更直观地观察模型稳定性条件和探究系统内部,利用MATLABR2020b软件对模型进行数值仿真分析.

3.1 理想状态中两方意愿对第三方演化结果的影响

已知在复制动态方程中,系统内各主体原始意愿会影响其他主体的演化路径及结局. 假设初始意愿都为中间值0.5,高意愿为0.9,低意愿为0.1. 根据变化m1,n1,p1的参数值,研究原始意愿对系统内演化结局的影响.

3.1.1 初始意愿对企业演化影响

将处理企业和政府的最初意愿设为(0.1,0.1)、(0.1,0.9)、(0.9,0.1)、(0.9,0.9),分别对应图1 中红、蓝、绿、黑四种颜色线条;将收运企业和政府的最初意愿设为(0.1,0.1)、(0.1,0.9)、(0.9,0.1)、(0.9,0.9),分别对应图2中红、蓝、绿、黑四种颜色线条. 用前四个组合研究对收运企业的演化影响,后四个组合研究对处理企业的演化影响. 由图1和图2可得,当地方政府意愿低时,短期内企业的选择合作的概率和演化速度会下降,而企业意愿高低只对另一企业达到最后演化结果的速度有影响. 总体来看,不同的组合,对两企业最终演化结果没有影响,四组影响程度从大到小分别(0.9,0.9)、(0.1,0.9)、(0.9,0.1)、(0.1,0.1).

图1 n1,p1对m1的演化影响Fig.1 Evolution influence of n1 and p1 on the m1

图2 m1,p1对n1的演化影响Fig.2 Evolution influence of of m1 and p1 on the of n1

3.1.2 初始意愿对地方政府的演化影响

将收运企业和处理企业的最初意愿设置为(0.1,0.1)、(0.1,0.9)、(0.9,0.1)、(0.9,0.9)四个组合方式,分别对应图3中红、蓝、绿、黑四种颜色线条. 由图3可得,不同的组合,对于地方政府最终演化结果没有影响,四组影响程度从大到小分别(0.9,0.9)、(0.1,0.9)、(0.9,0.1)、(0.1,0.1).

图3 m1,n1对p1的演化影响Fig.3 Evolution influence of m1 and n1 on the p1

3.2 政府政策对企业的影响

由上述仿真结果可知,我国地方政府对于推行垃圾回收一体化属于支持态度. 在以政府为主导的我国,如何实行政策,使垃圾收运和处理企业能更快投入垃圾一体化回收中,显得格外重要,因此,在前文参数的基础上,再次对理想策略(1,1,1)进行仿真分析. 本次分析设计四种政策:高激励高惩罚、低激励低惩罚、低激励高惩罚、高激励低惩罚,并设置每次演化中企业对于构建系统的初始意愿值都从0.1到1递增(具体见下文演化曲线起始时间对应的数值),根据演化曲线的趋势,探索何种政策类型更为有效.

3.2.1 高激励高惩罚

令Mc2=2,Mp2=3,β=0.8,Fc1=3,Fp1=3,W=4,表示政府采取高激励高惩罚政策,演化结果如图4所示.

图4 高激励高惩罚政策下的两企业演化仿真结果Fig.4 Evolution simulation results of two enterprises under high incentive and high punishment policy

在此政策下,两企业演化结果均为一条趋于概率1的上升曲线. 纵向分析得到,随着初始意愿的上升,两企业对应达到稳定状态的时刻也在提前. 横向分析得到,当两企业初始意愿为0.1时,垃圾收运企业在1.4时刻达到稳定状态1,垃圾处理企业在1.3时刻达到稳定状态1. 总结来看,在此政策下,两企业最终的博弈演化稳定策略都是合作,理想策略在1.5时刻达到稳定.

3.2.2 低激励低惩罚

令Mc2=0.5,Mp2=1,β=0.4,Fc1=2,Fp1=2,W=1,表示政府采取低激励低惩罚政策,演化结果如图5所示.

图5 低激励低惩罚政策下的垃圾两企业演化仿真结果Fig.5 Evolution simulation results of two enterprises under low incentive and low punishment policy

在此政策下,当初始意愿≤0.8时,两企业演化结果为一条趋于概率0的下凹曲线;当初始意愿≥0.9时,为一条趋于概率1的上凹曲线. 纵向分析得到,在初始意愿≤0.8时,随着初始意愿的上升,两企业对应达到稳定状态0的时刻在推迟;当初始意愿≥0.9时,结果恰好相反. 横向分析得到,当两企业初始意愿相同时,垃圾收运企业和垃圾处理企业稳定状态的时刻差别不大. 总结来看,在此政策下,两企业的演化博弈结果更偏向于不合作,并在10以后才会达到稳定.

3.2.3 低激励高惩罚

令Mc2=0.5,Mp2=1,β=0.8,Fc1=3,Fp1=3,W=4,表示政府对待采取低激励高惩罚政策,演化结果如图6所示.图4结论相同,均为一条趋于概率1 的上升曲线. 纵向分析来看,与图4 相比,两者到达稳定状态的速率更低. 例如,从同一起点0.1出发,高激励高惩罚下的垃圾收运企业在1.4时刻达到稳定,垃圾处理企业在1.3时刻达到稳定;在低激励高惩罚下,垃圾收运和垃圾处理则分别到1.8和1.7时刻达到稳定. 总结来看,高激励政策下,会使两企业更快达到稳定状态1.

图6 低激励高惩罚政策下的两企业演化仿真结果Fig.6 Evolution simulation results of two enterprises under low incentive and high punishment policy

3.2.4 高激励低惩罚

令Mc2=2,Mp2=3,β=0.4,Fc1=2,Fp1=2,W=1,表示政府采取低激励高惩罚政策,演化结果如图7所示.

图7 高激励低惩罚政策下的两企业演化仿真结果Fig.7 Evolution simulation results of two enterprises under high incentive and low punishment policy

在高激励低惩罚政策下,两企业选择合作策略的演化结果均为一条趋于概率1 的上凹曲线. 纵向分析得到,除去与图4相同的特征,在0到0.5时刻,图像出现凹点,0.5时刻开始逐步上升. 横向分析得到,当两企业初始意愿均为0.1时,收运企业和处理企业分别在4.5和4.0时刻达到稳定状态1. 总结来看,在此政策下,虽然低惩罚会导致两企业向不合作演化,但最终仍会选择合作作为最后演化结果.

4 结论与建议

通过以上演化仿真分析,可得到以下结论:

1)收运企业与处理企业合作与否不受彼此合作意愿变化的影响,但会被政府消极的态度影响,导致演化前期偏向不合作,到后期才会走向合作;政府的推进态度会被民众心中的政府形象和国家政策变化影响.

2)地方政府采取消极政策(低惩罚低奖励)外,其余三种政策均使得两方企业采取合作的理想策略. 其中,政府实行高激励高惩罚政策对构建一体化的回收系统最为有效.

3)通过对比总结,政府对两企业的惩罚政策比激励政策的影响更大,惩罚政策越严格,两企业合作构建垃圾一体化回收平台的意愿更强;

4)增强垃圾一体化处理回收的奖励机制,对于垃圾处理企业的态度更为强烈,反之,增加惩罚机制,则对垃圾回收企业的态度影响要更强烈.

基于以上结论,本文提出以下建议:

1)政府应加快推进垃圾收运与处理企业的合作. 不同地区的企业顾虑不同,要因地制宜制定政策,在源头分类良好的地区,要加强对收运和处理企业的监督,严禁垃圾混装,消极工作;在源头分类需要改进的地区,要加强居民的分类意识,和对企业的补贴政策,此外要努力促进居民企业合作发展,减少源头分类成本.

2)加强财政力度和加快人才引进,助推物流信息平台建设. 想要实现一体化的垃圾回收系统,需要利用信息技术作为支持去建立垃圾回收管理平台,监督垃圾是否出现混装或不合理利用的情况,并对垃圾运输和处理过程实时把控,全面规划生活垃圾物流网络中手收集和处理设施的相对位置和作业范畴,降低在各个节点的时间成本,从而实现提高垃圾回收系统效率,实现一体化回收进程.

3)激励惩罚双管齐下. 政府在整个垃圾处理链中起主导地位,积极的态度有利于政策的实施. 对于正向的补贴政策,要对症下药,如对于缺乏资金的企业进行适当的物质鼓励,对于需要技术的企业,则适当进行人才与技术引进的办法. 同时,可制定“1带1”制度,更快地促进垃圾一体化回收进程. 同时,要有相应具体到细则的惩罚政策,减少企业再回收过程中的投机行为.

猜你喜欢

均衡点收运垃圾处理
基于厨余垃圾处理实践活动开展生态环保教育的探究
基于北斗的农村生活垃圾分类收运管理研究
——以信阳市平桥区为例
2025年山西垃圾收运覆盖90%以上自然村
建筑垃圾处理现状及优化措施的研究
生活垃圾处理方法以及大气污染治理技术分析
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
循环经济产业园,解码垃圾处理的“园区模式”
城市生活垃圾收运作业 跟踪调查分析
三级供应链投资模型的评价管理
合肥:首试餐厨垃圾统一收运