APP下载

基于Moran过程的矿工安全行为随机演化动态

2022-08-16杨富强倪景峰

煤矿安全 2022年8期
关键词:矿工力度收益

杨富强,董 冉,王 丹,倪景峰

(1.鄂尔多斯市昊华精煤有限责任公司,内蒙古 鄂尔多斯 017000;2.辽宁工程技术大学 工商管理学院,辽宁 葫芦岛 125105;3.辽宁工程技术大学 安全科学与工程学院,辽宁 葫芦岛 125105)

煤炭行业快速发展有效促进我国经济发展与社会进步,安全生产形势趋于平稳,但重大安全事故仍时有发生,危害矿工人身安全并造成经济损失。事故分析表明,矿工的不安全行为是导致煤矿生产事故发生的直接原因[1]。矿工是否选择安全行为作为一种行为决策,运用演化博弈方法从行为的“成本-收益”角度可以直观地分析矿工安全行为的演化状况。陈洋等[2]将煤矿企业内不同的矿工作为博弈主体,构建双方演化博弈模型,研究表明从众心理、法不责众等因素促进了不安全行为羊群效应的形成;韩帅等[3]构建了基于前景理论的矿工群体与安全监管群体的演化博弈模型,剖析了矿工实施不安全行为的内在机理。演化博弈论是以复制动态方程和ESS 为基础来描述无限总体下有限理性个体的策略演化过程。而现实生活中个体行为决策通常是在有限总体中进行演化,并且会受到外界干扰因素影响,因此基于有限总体的随机演化博弈理论被提出。Moran 过程作为随机演化博弈中主要的随机过程受到学者们的青睐。Taylor 等[4]于2004 年首次提出基于Moran 过程的随机演化博弈模型;杨丰梅等[5]借助Moran 过程研究了电商平台共享策略的演化动态,得出了推动电商平台共享策略的有利条件;王天日等[6]分析了PPP 项目承包商策略的演化动态,借助Moran 过程得出承包商不采取机会主义行为策略占优的条件。为此,基于演化博弈理论,构建基于Moran 过程的安全行为策略博弈模型,分别对强、弱选择因子条件下矿工采取安全行为策略占优的条件进行分析,并考虑矿工生理收益和心理收益、监管力度、风险成本等影响因素,通过数值仿真分析模拟各因素对矿工采取安全行为占优的影响,为矿工安全行为管理与干预提出更为精准的对策与建议。

1 模型假设

假设在一个矿工群体中有N 个无差异的矿工,每个矿工有2 种生产策略可以选择。策略P:矿工采取安全行为;策略NP:矿工采取不安全行为。假设矿工采取安全行为作业可以获得净收益R1。处于省事省力的目的,矿工会采取不安全行为策略获得净收益R2。其中,R2>R1>0。当群体中存在2 种策略的矿工,采取安全行为策略P 的矿工往往会受到采取不安全行为策略NP 矿工的冷落、排挤,造成心理收益损失D,D>0。矿工采取不安全行为被监管的概率为α,α∈[0,1]。当矿工A 和矿工B 有一方采取不安全行为,监管人员对采取不安全行为的矿工进行处罚S1,当矿工A 和矿工B 都采取不安全行为,他们都会受到监管人员的处罚S2。同时,相较于个人的不安全行为,人数较多的群体性不安全行为往往受到监管处罚的程度较小,即S1>S2,体现了安全监管时“法不责众”的心理思维。αS1和αS2为监管力度。矿工采取不安全行为致使安全事故的发生概率为β,β ∈[0,1],事故对自身造成损失L,L>0,βL 为风险成本。矿工博弈收益矩阵见表1。

表1 矿工A 与矿工B 的博弈收益矩阵Table 1 Game payoff matrix of miner A and miner B

2 频率相依Moran 过程

随机演化博弈Moran 过程是一个研究有限总体中个体更新的过程。在有限矿工群体的每一阶段策略选择过程中,依据适应度随机选择矿工行为策略进行复制,复制产生的个体随机替换群体内剩余N-1 个个体中的任何一个,总体数量N 在这个过程中保持不变。假设群体矿工总人数为N,选择采取安全行为策略P 的人数为i,则采取不安全行为策略NP的人数为N-i。那么,矿工采取安全行为策略P 与采取不安全行为策略NP 的期望收益EP(i)、ENP(i)分别为:

式中:ω 为选择强度,ω∈[0,1]。

此时矿工的策略只与期望收益有关,而与其他外部随机干扰因素无关。当ω→0 时,称为弱选择,期望收益对效用的影响并不大,效用几乎完全由外部随机干扰因素决定。

式中:i=0,i=N 是上述Moran 过程的2 个稳定状态。

即所有矿工都采取不安全行为策略NP 或都采取安全行为P。如果总体达到这2 种状态之一,演化停止且保持这种状态不变。令xi为从初始状态有i个矿工采取P 策略,演化到N 个矿工全部采取P 策略的终点状态的概率。由全概率公式可得:

当ρNP/ρP<1 时,即ρNP/ρP,采取安全行为策略P更可能成为演化稳定策略。由ρNP/ρP<1,可得ω[N(2R1-D-2R2+αS1+αS2+2βL)/2-R1+R2-αS2-βL]>0,当外部随机干扰性越小(ω→1)时,采取安全行为策略净收益R1越大,监管力度S1和S2越大,风险成本βL 越大,采取不安全行为策略净收益R2越小,采取安全行为策略心理损失D 越小,矿工采取安全行为策略P 的固定概率越大。同样可得,当ρNP/ρP>1,即ρNP>ρP,采取不安全行为策略NP 更有可能成为演化稳定策略。

3 结果分析

3.1 排除随机干扰因素的强选择分析

在强选择条件下。即ω=1,效应函数取值大小只与期望收益有关,与其他外部干扰因素无关。此时,

3.2 随机干扰因素主导作用下的弱选择分析

矿工在弱选择条件下,期望收益并不是影响矿工效用函数的唯一因素,还会受到外部随机干扰因素如:环境恶劣程度、自身情绪等因素影响。在弱选择条件下,ω→0。将式(11)、式(12)在ω→0 根据泰勒展开式展开[8],可得:

根据Taylor 理论,以中性漂变固定概率1/N 为基准来研究矿工行为策略的演化动态。当ρP>1/N时,在有限群体中,矿工行为策略选择有利于采取安全行为策略P 取代采取不安全行为策略NP;当ρP<1/N 时,在有限群体中,矿工行为策略选择有利于不采取安全行为策略NP 取代采取不安全行为策略P。命题2:在弱选择条件下,当ρP>1/N 成立时,即3(N-1)(R1+βL)+2(N-2)αS2+(N+1)αS1>3(N-1)R2+(2N-1)D,可知采取安全行为策略净收益R1越大,监管力度αS1和αS2越大,风险成本βL 越大,采取不安全行为策略净收益R2越小,采取安全行为受到心理损失D 越小,矿工采取安全行为策略P 将成为演化稳定策略。

4 数值分析

采用MATLAB 对随机演化博弈模型进行数值仿真实验,检验上述结论的正确性,并定量考察不同因素对矿工采取安全行为策略演化的影响[9-10],包括采取安全行为受到同事排挤的心理损失D、和“法不责众”下监管人员对群体性不安全行为的监管力度αS2。首先,不失一般性,考虑不同的选择强度ω 下采取安全行为策略演化率r=NρP与矿工总数N 的关系。为描述方便,将博弈收益简记为:a=R1,b=R1-D,c=R2-αS1-βL,d=R2-αS1-βL。不同选择强度下矿工总数与采取安全行为演化率关系如图1(取a=4.8,b=1.9,c=2.2,d=2.4),可知演化率r 是矿工总数N的单峰函数。当N 值很小时,有NρP<1,即矿工采取不安全行为策略NP 会成为稳定状态;当N 值增大到一定范围内,无论选择强度ω 值大小,均有NρP>1,即矿工采取安全行为策略P 会成为稳定状态;对于N→∞,若要保持NρP>1,选择强度ω 要小于一定的阈值,才能保证矿工采取安全行为策略P 成为稳定状态。

图1 不同选择强度下矿工总数与采取行为演化率关系Fig.1 Relationship between the total number of miners and the evolution rate of adopting behavior under different selection intensities

前面对ω→0 的情形,进行了理论分析。现用数值算例考虑ω=1 的情形下,确定不同因素对最终稳定状态的影响情况。

1)在其他参数不变的条件下,考虑参数D 即心理损失对最终稳定状态的影响。不同心理损失下矿工总数N 与采取安全行为演化率rD关系如图2,逐渐降低心理损失分别得到曲线r1(取a=7,b=2,c=3,d=5),r2(取a=7,b=3,c=3,d=5),r3(取a=7,b=4,c=3,d=5),r4(取a=7,b=5,c=3,d=5),r5(取a=7,b=6,c=3,d=5)。从图2 中不同曲线的变化趋势可以看出,降低矿工的心理损失,会使采取安全行为策略P逐渐演化为最终稳定状态。

图2 不同心理损失下矿工总数与采取行为演化率关系Fig.2 Relationship between the total number of miners and the evolution rate of adopting behavior under different psychological losses

2)在其他参数不变的条件下,考虑监管处罚力度S1和S2对最终稳定状态的影响。不同监管处罚力度下矿工总数N 与采取安全行为演化率rS关系如图3,逐渐增加监管处罚力度分别得到曲线r1(取a=10,b=4,c=6,d=7),r2(取a=10,b=4,c=5,d=6),r3(取a =10,b =4,c =4.5,d =5),r4(取a =10,b =4,c =4,d =4.5),r5(取a=10,b=4,c=3.5,d=3.5)。从不同曲线的变化趋势可以看出,当监管处罚力度较小时,采取不安全行为策略NP 不占优;当监管处罚力度逐渐增大到一定范围内,且矿工总体数量N 较小时,采取安全行为策略P 占优;当监管处罚力度较大,且逐渐缩小S1和S2的差距时,无论矿工总体的数量大小,采取安全行为策略均会成为最终稳定状态。

图3 不同处罚力度下矿工总数与采取行为演化率关系Fig.3 Relationship between the total number of miners and the evolution rate of adopting behavior under different levels of supervision and punishment

5 结 语

煤矿企业应提高矿工安全生产净收益,通过内部评比产生“安全生产标兵”人选,并对其给予适当物质奖励。提高监查力度和处罚程度,杜绝“法不责众”现象的发生,让每个采取不安全行为的矿工付出沉重代价。完善安全培训机制,树立正确的安全生产价值观,加强群体凝聚力,避免群体内部存在抱团,排挤等行为,降低矿工心理损失。

猜你喜欢

矿工力度收益
加大建设推进力度 确保按时建成达效
金牌挖矿工
李克强:对排污违法行为要加大处罚力度
螃蟹爬上“网” 收益落进兜
加大授权力度中科院先行一步
老矿工的家国情怀
兼具力度与美感 Bowers & Wilkins 702 S2/707 S2/HTM71 S2/ASW10CM S2
矿工老李
2015年理财“6宗最”谁能给你稳稳的收益
东芝惊爆会计丑闻 凭空捏造1518亿日元收益