基于前景理论的煤矿工人安全行为演化博弈

2023-12-13杨晓娟何耀宇

华北科技学院学报 2023年6期

杨晓娟,何耀宇

(太原理工大学,山西晋中 030600)

0 引言

2022年煤炭消耗总量占能源消耗总量的56.2%,煤炭在能源供应中占较高比重[1],煤炭在我国经济发展中发挥着重要的作用。安全是煤矿发展的主要主题。然而,煤炭行业作为高危行业,安全生产事故频发,2022年煤矿事故死亡人数达到245人,煤炭百万吨死亡率达到5.4%[2],安全生产形势严峻。因此,对煤炭企业安全行为进行研究意义重大。

现有的研究表明,煤矿工人的不安全操作是导致煤矿安全事故发生的直接原因[3]。刘喜军[4]通过分析2011—2018年的煤矿事故发生原因,发现人为原因是造成煤矿工程安全事故的主要原因。因此减低煤矿工人的不安全操作,可以有效减少煤矿安全事故的发生。安检员作为煤矿工人安全的监管者,其监管力度对煤矿工人安全行为有显著影响。刘全龙[5]构建了国家监管机构、地方监管机构和煤矿企业三个种群组成的演化博弈模型,发现在动态奖惩机制情形下,监管群体严格监管时可以显著提高员工选择安全操作行为的动机,监管群体不严格监管时煤矿工人更容易出现不安全行为。

影响煤矿工人安全操作的因素有很多,除了安检员的监管力度外[6],煤矿工人安全操作的心理安全意识和价值感知也至关重要。李乃文[7]从认知心理学角度分析了情绪耗竭、工作注意力与工作不安全感的关系,发现工作不安全感会影响到员工的安全行为。韩帅[8]通过建立矿工群体和监管群体的双方演化博弈模型,发现成本感知和效价感知是影响矿工和安检员安全行为的主要因素。基于此,本文除了考虑到矿工安全操作的成本感知和基本工资价值感知,还要考虑到所获得的奖励和处罚感知的影响。

演化博弈论在安全行为研究方面应用广泛,如建筑工程安全施工监管[9]、药品质量安全监管[10]、煤矿工人安全行为监管[8]。然而传统演化博弈论的收益支付矩阵是基于期望效用理论中的期望效用组成,与现实中决策者的实际效用存在偏差,Kahneman、Tversky通过研究博弈主体的决策行为,提出前景理论来解释期望效用和实际效用的偏差。之后前景理论广泛的应用于人的行为研究中,如周国华基于前景理论对施工人员安全管理行为进行研究[9]。

基于上述研究,第一,本文考虑到博弈主体有限理性的特点,在传统演化博弈理论的基础上引入前景理论,将参与方的感知价值纳入到支付—收益矩阵中,构建支付—收益感知矩阵,使博弈主体的策略选择更贴近现实。第二,基于奖惩机制构建煤矿工人—安检员双方博弈模型,并通过数值仿真实验对参与者策略选择的影响因素进行分析,最后为煤矿工人安全行为管理提供相关的建议。

1 博弈模型构建

1.1 模型假设

煤矿企业安全系统与多种因素密切相关,为研究方便,煤矿企业安全事故是否发生,看作是安检员与煤矿工人双方博弈的结果,本文中的安检员主要是指负责煤矿安全生产的监督和检查工作,负责排查安全隐患的工作人员,煤矿工人主要是指直接负责煤矿生产的一线操作工人,两类人员的职责和岗位不同。基于此,本文提出如下假设:

假设1:煤矿工人安全行为博弈主体为安检员和煤矿工人,双方均为有限理性,本文根据前景理论来衡量博弈主体之间的收益损失值。

前景理论认为决策者是有限理性的,现实中决策者的实际效用感知与期望效用感知之间存在偏差。前景理论将决策者的感知收益纳入到博弈支付矩阵中,解释了决策者实际效用感知和期望效用感知上的偏差,弥补了传统博弈中的不足。前景理论主要包含价值函数和决策权重函数,决策者对策略的感知收益称为前景价值V,V包括权重函数ω(pi)和价值函数v(Δxi)两部分,如下:

(1)

式中,pi表示事件发生的概率,Δxi表示参与方实际收益与参照点的差额,即Δxi=xi-x0,x0为参照点的价值。ω(pi)表示决策者的对事件i的决策权重,v(Δxi)表示决策者感受到的价值。

(2)

式中α、β为风险态度系数,值越大决策者对风险敏感度越高,α、β∈(0,1)。λ为损失规避系数,若λ>1表示参与方对损失更加敏感。

(3)

式中,ε表示决策权重函数的曲率,ε越小函数图像越弯曲,ε∈(0,1)。

假设2:煤矿工人的策略空间为α=(α1,α2)=(安全操作,不安全操作),选择策略α1的概率为x,选择策略α2的概率为1-x;安检员的策略空间为β=(β1,β2)=(严格监管,不严格监管),选择策略β1的概率为y,选择β2的概率为1-y。x,y∈[0,1]。当煤矿工人选择安全操作、安检员选择严格监管时,表示煤矿工人和安检员实施安全行为。

假设3:煤矿工人和安检员的策略选择存在互补效应。当安检员不严格监管或煤矿工人不安全操作时会产生整体性风险。整体性风险具有传递性的特点,当安检员严格监管煤矿工人不安全操作时,煤矿工人不安全操作产生的整体性风险会传递给安检员,本文以风险传递系数描述风险的传递情况。

1.2 模型构建

根据假设条件,构建支付—收益感知矩阵见表1,收益支付矩阵的参数设定见表2。

表1 支付—收益感知矩阵

表2 模型参数定义

2 博弈模型分析

2.1 策略稳定性分析

2.1.1 煤矿工人策略稳定性分析

煤矿工人安全操作的价值感知V11、不安全操作价值感知V12、安全操作和不安全操作的平均价值感知V1分别如下:

(4)

煤矿工人策略选择的复制动态方程:

(5)

式中,M表示安检员不严格监管时,煤矿工人安全操作和不安全操作的价值感知的差值;N表示安检员严格监管时,煤矿工人安全操作和不安全操作的价值感知的差值。

2.1.2 安检员策略稳定性分析

安检员严格监管的价值感知V21、不严格监管的价值感知V22、严格监管和不严格监管的平均价值感知V2如下:

(6)

安检员策略选择的复制动态方程:

(7)

式中,U表示煤矿工人不安全操作时,安检员严格监管和不严格监管的价值感知的差值;Q表示煤矿工人安全操作时,安检员严格监管和不严格监管的价值感知的差值。

2.2 策略组合稳定性分析

(8)

计算Jacobian矩阵的秩和迹,通过秩(detJ)和迹(trJ)的正负性判断煤矿工人和安检员策略选择的稳定性,见表3。

表3 煤矿工人和安检员策略稳定性分析

通过表2均衡点稳定性分析可得,影响系统演化至稳定点的主要因素为煤矿工人和安检员的价值感知。当M<0,U<0时,(0,0)为稳定点,此时煤矿工人安全操作的价值感知小于不安全操作的价值感知;安检员严格监管的价值感知小于不严格监管时的价值感知。当N>0,Q>0时,(1,1)点为稳定点,此时煤矿工人安全操作的价值感知大于不安全操作的价值感知;安检员严格监管价值感知大于不严格监管的价值感知。

为防止系演化至(0,0)点,促进系统演化至(1,1)点,应该增加煤矿工人安全操作和安检员严格监管的效益感知,降低成本感知。煤矿企业应该发挥管理作用,增加煤矿工人和安检员的奖励和处罚。由此可见,煤矿企业通过设计合理的奖惩机制可以促进安全行为的发生,使煤矿安全系统达到稳定状态。

3 仿真分析

为了更直观的展示博弈双方的策略演化轨迹及关键参数对演化轨迹的影响,借助MATLAB软件进行数值仿真实验。为使策略演化至(1,1)点,在满足N>0,Q>0且M>0,U>0的条件下,通过对煤炭企业管理人员和相关领域的专家进行访谈并结合相关参考文献[8,11]对参数进行赋值,以确保参数设置的合理性。根据海因里希理论1:29:300的原则,设定事故发生的概率为q=0.1,风险传递系数D=0.2。根据煤矿安全管理的现实情况,参与主体对安全行为成本感知大于不安全行为成本感知。其余参数设定要保证博弈模型的演化稳定,改变其中一个参数的大小,能有效的观察到博弈主体策略选择的变化。各参数初始值设定为:C1=3、C2=2.5、C3=3、C4=2.5、R1=6、R2=6、L1=6.5、L2=6.7、H1=2、H2=2、q=0.1、L=5、t1=0.5、t2=0.5、D=0.2。假定模型的初始时间为0,时间步长为0.2,主要分析关键参数L1、L2、H1、H2、C1、C3对演化轨迹的影响。

3.1 初始概率的影响

分析不同的初始概率取值对策略演化结果的影响,x,y初始概率的取值分别取x=(0.1,0.3,0.5,0.7,0.9)、y=(0.1,0.3,0.5,0.7,0.9)。煤矿工人策略选择的初始状态如图1所示,由图1可知,当煤矿工人安全操作的初始概率越高,x收敛于1的速度越快。安检员策略选择的初始状态如图2所示。由图2可知,当安检员严格监管的初始概率越高,y收敛于1的速度越快。仿真结果显示初始概率的增加有利于博弈策略组合朝着理想状态(1,1)点演化。

图1 煤矿工人策略选择的初始状态图

图2 安检员策略选择的初始状态图

3.2 煤矿工人和安检员奖励感知的影响

分析煤矿工人和安检员奖励感知变化对演化结果的影响,在其他参数保持不变的情况下,改变H1、H2的取值,H1、H2的取值分别为H1=(1,2,3,4,5)、H2=(1,2,3,4,5)。煤矿工人的奖励感知对策略演化的影响如图3所示,由图3可知,随着煤矿工人所获奖励感知的增加,煤矿工人选择安全操作策略的速度明显提升,说明煤炭企业设置合理的激励额度可以有效的促进安全行为的发生。同理,安检员的奖励感知对策略演化的影响如图4所示,由图4可知,随着安检员所获奖励感知的增加,安检员选择严格监管的速度明显提升。仿真结果显示矿工和安检员奖励感知的增加有利于安全行为的提升。

图3 H1对煤矿工人策略演化的影响

图4 H2对安检员策略演化的影响

3.3 煤矿工人和安检员处罚感知的影响

分析煤矿工人和安检员处罚感知变化对演化结果的影响,在其他参数保持不变的情况下,改变L1、L2的取值,L1、L2的取值分别为L1=(4,6,8,9,11)、L2=(4.7,6.7,8.7,12.7)。煤矿工人的处罚感知对策略演化的影响如图5所示,由图5可知,随着煤矿工人所获处罚感知的增加,煤矿工人选择安全操作策略的速度明显提升,可见煤炭企业设置合理的处罚额度可以有效的避免不安全行为的发生。同理,安检员的处罚感知对策略演化的影响如图6所示,由图6可知,随着安检员所获处罚感知的增加,安检员选择严格监管的速度明显提升。仿真结果显示矿工和安检员不安全行为处罚感知的增加有利于降低不安全行为的发生。

图5 煤矿工人处罚感知对策略演化的影响

图6 安检员处罚感知对策略演化的影响

3.4 煤矿工人和安检员劳动和精神成本感知的影响

分析煤矿工人和安检员劳动和精神成本感知变化对演化结果的影响,在其他参数保持不变的情况下,改变C1、C3的取值,C1、C3的取值分别为C1=(2,3,4,5,6)、C3=(2,3,4,5,6)。煤矿工人安全操作的成本感知对策略演化的影响如图7所示,安检员严格监管的成本感知对策略演化的影响如图8所示。由图7可知,随着煤矿工人安全操作成本感知的增加,煤矿工人选择安全操作策略的速度明显降低。由图8可知,随着安检员严格监管成本感知的增加,安检员选择严格监管的速度明显降低。仿真结果显示矿工安全操作和安检员严格监管行为成本感知的降低有利于博弈策略组合朝着理想状态(1,1)点演化。

图7 煤矿工人安全操作的成本感知对策略演化的影响

图8安检员严格监管的成本感知对策略演化的影响

4 结论

(1) 将煤矿企业安全系统看作是煤矿工人是否安全操作与安检员是否严格监管的动态博弈,基于前景理论对煤矿工人和安检员的行为策略选择进行博弈分析,博弈结果显示:当煤矿工人安全操作和安检员严格监管的效益感知大于成本感知时,即N>0,Q>0且M>0,U>0,系统演化至理想状态,参与主体更倾向于选择能够带来更多效益的策略。

(2) 根据博弈结果仿真分析劳动和精神成本感知、奖励感知、处罚感知对煤矿工人和安检员行为策略选择的影响,博弈结果显示:①参与主体往往期望通付出较低的成本获得相同的效价,通过降低煤矿工人和安检员安全操作的劳动和精神成本感知来促进安全行为的发生。煤矿企业可以适当的降低煤矿工人和安检员的劳动强度、不安全感等精神感知,改善作业环境,提升自动化水平构建智能矿山,以此降低安全操作成本。②根据期望理论,当主观个体获得的额外收益较高和处罚较低时,安全操作的动机就会更强,通过增强安全行为的效价可以激励行为的发生,煤矿企业通过提高奖励和处罚感知促进煤矿工人和安检员的安全行为。煤矿企业应发挥奖惩机制作用,对于实施安全行为的工人给予升职加薪的奖励,对于实施不安全行为的工人给予降职罚款的处罚,并通过设置合理的奖惩额度,实现激励的有效性。

(3) 本文基于前景理论构建煤矿工人和安检员的博弈模型,分析双方的收益损失感知对各自安全行为的影响,为煤炭企业安全管理提供了建议,也为其他行业的安全管理提供借鉴价值。但本文存在的局限在于仅考虑到了煤矿工人和安检员的双方博弈,未考虑到政府监管、企业管理者等多元主体的策略选择,在后续研究中进一步建立三方博弈模型,更加准确的描述相关主体策略的演化路径。