APP下载

演化博弈下煤矿污染治理行为的数值仿真

2024-01-08刘海涛倪东滟

黑龙江科技大学学报 2023年6期
关键词:经济收益消极煤矿

刘海涛, 倪东滟, 朱 腾

(黑龙江科技大学 矿业工程学院, 哈尔滨 150022)

0 引 言

煤矿资源从上世纪50年代开始就成为我国经济发展的重要支柱能源,在生产和消费中占据主导地位[1],为我国现代化建设提供保障。由于煤矿开采过程中产生的废水[2]、废气[3]、重金属[4]等污染问题严重影响到生态环境发展,近年来,中央大力推进环境治理政策,并出台了相关法律条例,提出要坚持生态优先、绿色发展,协同推进经济高质量发展和生态环境高水平保护[5],另外,党的二十大报告还重点提到“深入推进能源革命,加强煤炭清洁高效利用”。但仍然存在煤矿企业消极执行、各地政府监管宽松的行为,易对环境造成不可逆的损害,因此,如何促进煤矿企业与政府双方主体协作治污,形成“政府监督—企业实施”的理想化博弈,推进煤矿周边环境生态保护和高质量发展具有重要意义。

目前,国内外专家学者已针对煤矿污染治理问题进行了深入研究。张沛沛等[6]基于熵权和障碍度模型,以煤矿区居民满意度为标准,分析生态破坏治理和环境污染治理,构建绩效评价指标,为我国煤矿区生态环境建设提供参考。Wang等[7]选用数据包络分析(DEA)模型构建评价指标体系,针对煤矿开采与环境治理效率问题,提供科学决策。郭江等[8]结合CVM的理论基础发现,基于WTA的测算结果能够充分反映煤炭开采带来的矿区生态环境外部成本,对矿区环境治理成本规划提供建议。基于以上研究结果发现,针对我国煤矿污染治理问题分析过程中多采用有影响的第三方为视角,并未从承担煤矿环境治理责任的主体(政府、煤矿企业)角度出发,导致分析不够全面。为强调责任主体,本文提出了基于演化博弈下的政、企治污选择模型,其相关理论已在煤矿应急救援[9]、经济[10]、新能源[11]、社会科学[12]等方面得到广泛应用。由于煤矿污染治理中政府和煤矿企业都可作为有限理性的博弈主体,并且双方会根据影响参数的改变而选择动态平衡下的利益最大化策略,最终收敛于稳定的理想状态,因此,运用演化博弈方法构建模型来探究政、企双方在煤矿污染治理过程中的策略选择切实可行。

已有文献对煤矿污染治理中各主体间的博弈行为分析尚不多见,且多是把政府和煤矿企业之间的战略选择概括为监管或不监管、执行或不执行,但在当今中央实施的治理政策背景下,政、企已极少出现绝对不监管、不执行的现象了。为此,笔者拟以煤矿企业和政府为双方博弈的主体,采用演化博弈方法来探讨煤矿污染治理协作行为的影响因素并优化关键参数,利用数值仿真软件验证其优化结果,此外,模型改变了固有的主体理性程度,有利于提高模型构建精度,实现双方协作的理想演化策略。

1 模型假设

煤矿污染治理的有效推进,需要构建以政府为监管主导、地方煤矿企业为实施主体的规范治理系统。政府和煤矿企业两者共同作为有限理性的博弈参与方,在整个演化过程中,各自都存在两种可选策略,并采取随机配对模式,在非对称信息条件下反复博弈[13]。鉴于近些年国家大力弘扬“绿水青山就是金山银山”的治理口号,并针对煤矿开采颁布了各项规定和章程,煤矿企业与政府极少出现绝对不执行、不监管行为,因此,将政府“监管”和“不监管”的可选择策略调整为“严格监管”和“宽松监管”;煤矿企业“执行”和“不执行”的可选择策略调整为 “积极执行”和“消极执行”,极大提高了模型的理性程度。

政府严格监管与否很大程度上影响了煤矿周边生态环境是否能够良好发展,虽然政府采取严格监管政策时需要支付惩罚煤矿企业排污不规范等行为的人力成本,但其目的是以最低的成本获取最高的收益,并从源头出发,降低后续治理环境的难度。对于煤矿企业而言,积极执行合法排污策略会增加开采成本,影响煤矿开采利益,若选择消极执行,长此以往则会对生态环境造成不可逆的损害,间接影响整个城市的市容形象。双方主体变量相关参数及定义分别为:CA1表示煤矿企业积极执行污染治理任务付出的成本;CA2表示煤矿企业消极执行污染治理任务付出的成本;CB1表示政府严格监管煤矿企业所付出的成本(人力等监管成本);CB2表示煤矿企业消极治污时政府付出的补救治理成本;SA1表示煤矿企业积极执行污染治理任务时的经济收益;SA2表示煤矿企业消极执行污染治理任务时的经济收益;SB1表示政府严格监管时的经济收益;SB2表示政府宽松监管时的经济收益;SB3表示政府严格监管时产生的间接效益(公信力提高,市容市貌改善等);SB4表示政府宽松监管时,公众因不满而产生的负效益(声誉受损,公信力降低);B表示煤矿企业积极治污时政府的补贴额度;F表示煤矿企业消极治污时政府对其实施的罚款。

针对上述内容并结合煤矿污染治理的实际情况,提出以下模型假设。

假设1煤矿企业的策略选择用x∈(0,1)表示,当x=0时,表示煤矿企业选择“消极执行”行为;当x=1时,表示煤矿企业选择“积极执行”行为。政府的策略选择用y∈(0,1)表示,当y=0时,表示政府选择“宽松监管”行为;当y=1时,表示政府选择“严格监管”行为。

假设2当政府选择宽松监管策略、煤矿企业选择消极治污策略时,政府对煤矿企业行为不实施处罚,即不产生罚金,且政府无后续补救的治理成本;当政府选择宽松监督策略时,煤矿企业即使积极执行治污策略也无补贴。

假设3煤矿企业消极治污时,政府对其实施的罚款小于其正常开采中产生的经济收益,即F

假设4考虑到煤矿企业消极执行治污政策的实际情况存在,煤矿企业在选择积极治污策略时,获得的收益是小于消极治污策略,且获得的收益略大于成本。

2 构建收益矩阵

为验证政府、煤矿企业双方主体选择策略组合的稳定性,依据上述假设条件,文中采用Friedman提出的方法,利用雅可比矩阵求解并判断模型的稳定性,并根据其结果分析出双方主体各策略的影响。政府、煤矿企业的双方博弈收益矩阵,如表1所示。

表1 政府、煤矿企业的双方博弈收益矩阵

根据表1,计算双方主体的期望收益与平均收益,并构建两者的复杂动态方程。其中煤矿企业采取“积极执行”策略的期望收益UA1为

UA1=y[(SA1-CA1)+B]+(1-y)(SA1-CA1)。

(1)

采取“消极执行”策略的期望收益UA2为

UA2=y[(SA2-CA2)-F]+(1-y)(SA2-CA2)。

(2)

平均收益UA为

UA=xUA1+(1-x)UA2。

(3)

政府采取“严格监管”策略的期望收益UB1为

UB1=x[(SB1-CB1)+SB3-B]+(1-x)[(SB1-CB1-CB2)+SB3+F]。

(4)

采取“宽松监管”策略的期望收益UB2为

UB2=x(SB2-SB4)+(1-x)(SB2-SB4)。

(5)

平均收益UB为

UB=yUB1+(1-y)UB2。

(6)

经分析,可得到煤矿企业和政府双方主体的复制动态方程分别为

(7)

(8)

令F(x)=0、F(y)=0,可求得模型的均衡点分别为A(0,0)、B(0,1)、C(1,0)、D(1,1)以及E[(SB1-CB1-CB2-SB2+SB3+F+SB4)/(B+F),(CA1-SA1-CA2+SA2)/(B+F)]。下文将用α=(SB1-CB1-CB2-SB2+SB3+F+SB4)/(B+F),β=(CA1-CA2-SA1+SA2)/(B+F)表示E点坐标,即E(α,β)。雅可比矩阵J为

根据以上特征值,分别对5个均衡点进行分析。记矩阵的行列式为detJ,detJ=ad-bc,矩阵的迹为trJ,trJ=a+d,并按公式计算各均衡点对应的值。各均衡点的稳定数值表达式,如表2所示。

3 模型分析

根据复制动态方程稳定性原理,煤矿企业选择稳定策略时需满足F(x)=0,且F′(x)<0。

图1 煤矿企业策略选择动态趋势

图2 政府策略选择动态趋势

李雅普诺夫第一法则表明,当均衡点的所有特征值均为正(λ>0)时,表示该点为不稳定点。所有特征值有正有负时,表示该点为鞍点。所有特征值均为负(λ<0)时,该点才为稳定点。由于文中讨论的是非对称博弈的策略选择,根据Ritzberger的研究[14],只需讨论纯策略均衡的渐近稳定性即可,所以不考虑均衡点E(α,β)的稳定情况。双方主体的演化稳定性分析,如表3所示。记A点的特征值λA1=SA1-CA1-SA2+CA2,λA2=SB1-CB1-CB2-SB2+SB3+F+SB4;B点的特征值λB1=B+F+λA1,λB2=-λA2;C点的特征值λC1=-λA1,λC2=λC2-B-F;D点的特征值λD1=-B-F-λA1,λD2=-λA2+B-F。

表3 双方主体的演化稳定性分析

以表3分析的D(1,1)为例,当x∈(0,1),y∈(0,1)时,对双方博弈主体选择策略的演化稳定性进行仿真模拟。根据《环境影响评价报告公示》文件,以井田面积约占17.451 km2为例,考虑到煤矿企业附近的直接或间接影响区域,并结合采煤沉陷影响最大范围,确定将井田边界向外延伸500 m作为生态评价范围,面积约为29.02 km2,积极投入生态治理成本占总成本的23.43%,实际经济收益占135.08%。此外,由2021年煤炭行业最新税收政策显示,增值税一般为13% ,企业所得税为25%,另有消费税、资源税。因此,按照企业支付成本与经济收益的占比、政府税收收入比例以及模型构建的要求,将各参数赋值为CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=25、SB2=20、SB3=14、SB4=14、F=3、B=2满足表中约束条件。

根据各点的演化路径图,可得出当双方主体的选择策略最终趋向于D点时演化为帕累托最优解,即此时煤矿企业选择“积极执行”政策,政府选择“严格监管”政策。

其余三种情况同理可得,下文赋值参数的条件及演化趋势不做赘述。D点的双方主体演化路径图如图3所示。

图3 D点的双方主体演化路径

4 数值仿真

4.1 模型均衡点稳定分析

为验证构建双方主体博弈模型的稳定性,可通过调整其中一方博弈主体的初始值进行检验[13]。已知x、y定义在(0,1)区域内,将两者按照影响概率划分为三个标准,从低到高分别设为0.3、0.5、0.7,并探究每级标准下煤矿企业和政府的选择动态演化过程。因此,本文将选取处于标准值之间的四个参数,即煤矿企业的初始值分别赋值为0.2、0.4、0.6、0.8,政府的初始值y分别赋值为0.8、0.6、0.4、0.2。在不考虑均衡点E(α,β)的情况下,煤矿污染治理过程按照其余均衡点可分为4种情形。

情形1煤矿企业选择“消极执行”策略、政府选择“宽松监管”策略为满足SA1-CA1-SA2+CA2<0,且SB1-CB1-CB2-SB2+SB3+F+SB4<0,将式中的未知参数赋值为CA1=20、CA2=10、CB1=10、CB2=15、SA1=30、SA2=40、SB1=20、SB2=25、SB3=5、SB4=5、F=2、B=2。此时,双方主体选择的策略组合稳定,即A(0,0)为ESS。该情形表示,煤矿企业在积极治污获得的利润小于消极治污;政府严格监管下的利润与罚金之和小于政府宽松监管的收益,煤矿企业选择“消极执行”策略;政府选择“宽松监管”策略。情形1如图4a所示。

图4 情形1~4动态演化过程

情形2煤矿企业选择“消极执行”策略、政府选择“严格监管”策略为满足B+F+SA1-CA1-SA2+CA2<0,且-SB1+CB1+CB2+SB2-SB3-F-SB4<0,将式中的未知参数赋值为CA1=20、CA2=10、CB1=8、CB2=10、SA1=30、SA2=40、SB1=23、SB2=15、SB3=8、SB4=10、F=2、B=2。此时,双方主体选择的策略组合稳定,即B(0,1)为ESS。该情形表示,煤矿企业在积极治污时产生的经济收益加上治污补贴后仍小于消极治污状态下企业被扣除罚金后的经济收益;政府严格监管下的经济收益与缴获的罚金之和高于宽松监管时,煤矿企业选择“消极执行”策略;政府选择“严格监管”策略。情形2如图4b所示。

情形3煤矿企业选择“积极执行”策略、政府选择“宽松监管”策略为满足-SA1+CA1+SA2-CA2<0,且SB1-B-CB1-CB2-SB2+SB3+SB4<0,将式中的未知参数赋值为CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=20、SB2=25、SB3=5、SB4=5、F=2、B=2。此时,双方主体选择的策略组合稳定,即C(1,0)为ESS。该情形表示,煤矿企业在消极治污时获得的总利润小于积极治污;政府严格监管时除去需支付的补贴后获得的收益小于宽松监管下扣除负效益之外的收益,煤矿企业选择“积极执行”策略;政府选择“宽松监管”策略。情形3如图4c所示。

情形4煤矿企业选择“积极执行”策略、政府选择“严格监管”策略为满足-B-F-SA1+CA1+SA2-CA2<0,且-SB1+B+CB1+CB2+SB2-SB3-SB4<0,将式中的未知参数赋值为CA1=23、CA2=28、CB1=10、CB2=15、SA1=35、SA2=36、SB1=25、SB2=20、SB3=14、SB4=14、F=3、B=2。此时,双方主体选择的策略组合稳定,即D(1,1)为ESS。该情形表示,煤矿企业在消极治污时的经济收益在扣除罚金后小于积极治污时的收益与补贴之和;政府宽松监管时的经济收益小于严格监管下扣除补贴之外的总收益,煤矿企业选择“积极执行”策略;政府选择“严格监管”策略。情形4如图4d所示。

4.2 参数优化的演化策略

基于上述4种情形的演化过程,为使模型趋于最优解,将改变有限理性的参数赋值,并研究其变化的影响。其中,CA1、CB1、CB2分别为煤矿企业、政府积极治污时国家政策规定付出的理性成本,故不予考虑;SA1、SA2、SB1、SB2分别为煤矿企业、政府积极或消极治污时所获收益,该收益与煤矿产量相关,不构成有限理性标准,亦不考虑。因此,在各参数处于定义域内的情况下,对CA2、SB3、SB4、B、F进行优化并做详细分析。各参数优化见图5。

图5 各参数优化曲线

图5a表示煤矿企业消极治污时自主投入成本CA2大小对模型本身的影响。当煤矿企业消极治理时投入的成本越低,主体转变策略选择积极治污的概率P越小,且收敛的速度越快,表示企业已定决策的坚定程度越高。随着企业自行选择投入的治理成本CA2由15升至18时,图中曲线可以明显看出企业的选择收敛速度放缓,虽然最终的策略结果没变,但是决定者在选择时摇摆的可能性不断加大。当进一步增大CA2,企业的消极治理成本攀升,很大程度上影响了整个矿山的经济收益,所以企业在越过一个成本阈值后,最终选择积极治污策略的概率也从0逐渐上升至均衡解1。当给CA2赋值的参数过大时,煤矿企业选择积极治污策略的概率会稳定在均衡解1,并且做出选择的时间越短,速度越快。

图5b表示当政府严格监管产生对自身有积极影响的间接效益SB3时,如政府公信力提高,市容市貌改善等对模型的影响。图5b中曲线显示,产生无论大小的间接效益时,政府都会在短时间内大概率选择严格监管煤矿企业的策略来获取该收益,这就证明公众对政府的口碑评价、整体城市环境指标等现实因素都是影响政府决策的重要组成部分。然而,当间接收益的整体效益远远达不到政府所需要的现实成本时,政府最终还是会选择宽松监管来维持环境与收益,以此达到双方的动态平衡。若民众对政府的严格监管行为给出热烈的支持和反响,那么这些间接收益将会进一步转化成长期宣传效益,比如带动城市旅游经济、高质量人才引进以及企业投资等,最终促使政府坚定选择严格监管政策。

图5c表示政府宽松监管时因公众不满而产生的负效益SB4,如声誉受损,公信力降低等等,对政府选择治理策略的影响。从图中曲线可以看出,当负效益产生时,无论大小,政府都会在短时间内快速选择严格监管策略,第一时间对涉事煤矿企业采取措施进行调查,尽量将自身损失降到最低。在给参数赋值的过程中,为探究负效益的影响设置了相对较高和较低的两种参数,但所得结果仍然相同,由此也反映出信息社会公众影响力的深远,政府做出的一切选择都要以人民为宗旨。

图5d表示煤矿企业积极治污时政府的补贴额度大小B对模型的影响。政府的补贴是针对企业积极治理环境而实施的鼓励政策,一般来说,补贴额度不会完全覆盖煤矿企业所需的全部治理成本,所以企业会衡量积极治理成本与补贴金额对整个煤矿收益的影响,最终决定选择的治理策略。图中曲线表示,当补贴金额远小于企业需支付的积极治理成本时,煤矿企业选择积极执行政策的概率为0;当政府不断加大投入的补贴金额,企业单位开始松动,做出选择的时间逐渐增加;当政府投入的补贴达到一定额度时,企业大概率会选择积极治污,然而一旦政府投入金额超出上限,是否所有主体都愿意支出余下的治理成本,愿意支付的企业能否按照规定合理使用补贴还存疑,因此,图中会出现概率波动。基于分析可知,政府采取的补贴政策在一定程度上对煤矿企业的选择策略有积极影响,但是只能作为辅助手段来帮助减少政府付出的严格监督成本。

图5e表示煤矿企业消极治污时政府对其实施罚金F的影响。与政府采取的补贴手段一样,针对煤矿企业消极治污的行为,政府也会采取惩罚策略来监督企业。当所处罚金远小于企业消极治污所获得的经济收益时,煤矿企业会在极短时间内支付罚金,而选择积极执行治污政策的概率为0;当政府提高罚金标准时,曲线收敛速度明显放缓,虽然主体仍选择了消极执行行为,但结果表明罚款影响了企业的判断;继续提高罚金标准直至显著影响企业收益时,主体选择积极治污策略的概率从0逐渐上升至均衡解1,在此基础上每提高一次罚金标准,煤矿企业做出选择的收敛速度就增快一次,直到在短时间内坚定选择积极执行策略为止。因此,政府在处理煤矿企业环境治理问题上,可以适当提高罚金金额,依据国家法律条例约束规范煤矿企业行为,达到最终目的。

5 结 论

基于煤矿企业治污现状和当前治理环境的现实问题,本文通过构建“煤矿企业—政府”双方博弈模型,分析了双方主体在煤矿污染治理过程中的演化策略,并利用数值仿真软件对构建的演化博弈模型进行验证。得出以下主要研究结论。

(1)双方主体在政府选择严格监管、煤矿企业选择积极执行污染治理规程的情形下,可达到理想的稳定演化策略。各方主体在某些情况下可以形成另外三种不同的相对稳定策略,但是从保护生态环境建设、构建绿色社会的角度出发,考虑政府支付的成本以及公众信誉等现实因素的影响,双方主体最终会选择理想稳定的演化策略。因此,政府可对消极执行治污策略的煤矿企业实行高额罚金,并在一定范围内合理增加积极治污主体的补贴,促使煤矿企业积极执行治污策略。此外,政府监管下产生的间接效益或负效益可通过网络信息快速传播,利用群众力量敦促政府严格监管煤矿企业。

(2)政府、煤矿企业作为演化策略的双方主体,同时选择理想策略的概率与罚金、补贴及间接收益在一定范围内呈正相关,而与投入的治理成本成反比。增加治理成本可以有效构建绿色生态环境,但当需要投入的成本过大时,整体经济收益减少,导致双方选择理想稳定策略的意愿降低。通过制定弹性环境治理标准促使双方主体在初期坚定选择理想策略,才能达到模型的动态平衡。

为使煤矿企业与政府共同选择良性的环境治理策略,促进博弈双方达成友好合作,分别对各方主体提出如下建议。

(1)完善政府对煤矿企业污染治理的奖惩机制。根据上述研究可知,政府对煤矿企业在治理过程中实施的奖惩措施可促使煤矿企业选择积极执行策略,因此,严格划分奖惩标准有利于政府高效监管煤矿企业。例如,根据煤矿企业周边环境建立等级指标Ⅰ至Ⅴ级,当煤矿环境评估等级为Ⅰ、Ⅱ、Ⅲ级时给予适当补贴;当等级评估为Ⅳ或Ⅴ级时给予相应惩罚,并根据每层治理等级不同,确定最终的补贴和惩罚金额。除此之外,政府可以适当降低积极治污企业的税收要求,积极引导主体选择。

(2)落实煤矿企业积极治污的主体责任。研究表明,煤矿企业选择消极执行治污策略的主要原因是需要投入的资金成本过大,并且治理工作耗时耗力。对此,企业与政府可以通过建立合作、投资等方式对现有治污设备进行升级改造,从根源降低企业长期投入的经济成本,提高治理效率;另一方面,煤矿企业作为社会经济的重要组成部分,主动承担责任,履行必要义务,以积极的行为获取社会荣誉,从而达成与政府的长期合作,有助于吸引更多高质量人才,保持企业健康发展。

(3)提出“对症下药”的治理措施。现阶段煤矿污染主要包括大气、固体废弃物以及废水等,针对不同的污染问题,提出相应的治理政策。例如,应用煤矿地下汽化技术将煤炭转化为煤气,从而减少井下有害气体的排放;将煤矸石、粉煤灰等固体废弃材料投入公路工程、建筑等行业进行二次利用,降低原材料成本的同时处理大量固体废弃物;采取过滤、除杂等技术手段净化矿井废水,最终应用于矿区生活水循环中。除此之外,植树造林、退耕还林等手段对净化矿区空气、降低施工噪声以及过滤粉尘都有辅助治理作用。

猜你喜欢

经济收益消极煤矿
浅析乡村振兴背景下以党员为中心搭建“城乡客户结对帮扶”的意义
职业体育俱乐部体育竞争与经济效益之间的关系分析
企业财务风险控制研究
大型煤矿自动化控制系统的设计与应用
让自己发光
上半年确定关闭煤矿名单513处
去年95.6%煤矿实现“零死亡”
家庭教育:你种的是积极树还是消极树?
“消极保护”不如“积极改变”
瞬变电磁法在煤矿防治水中的应用