APP下载

基于前景理论的核电厂作业行为监管演化博弈研究

2023-10-09陈甲华王平平倪素素

南华大学学报(社会科学版) 2023年3期
关键词:营运核电收益

陈甲华,王平平,倪素素

(南华大学 经济管理与法学学院,湖南 衡阳 421001)

核电厂预防和减少人因事件是减少核事故风险的重要途径。研究表明:全球核电厂中由人因失误导致的事件数占运行事件总数的58%。张力等认为核电厂人因事件的根本原因分为基本操作能力较差、理论知识欠缺、违章、组织管理缺陷及其他原因等21种,其中由操纵员违章引发的事件占事件总数的12.6%[1]。国际上切尔诺贝利核电厂事故就是由于操纵员多次违背操作规章和安全准则导致反应性失控引发的灾难性事故[2]。国家核安全局2016年通报的核电厂人员行为导致的16起运行事件中,人员违反程序误操作占6起[3]。国家核安全局2021年发布核电运行事件共19起,其中违反“核动力厂运行限值和条件规定的操作或者状况”准则的事件共6起[4],核电厂人员操作行为是导致人因事件的重要因素之一。

操纵员的行为与操作失误之间的关系是当下的热门研究领域。传统的主控室操纵员的主要任务是监视和操作系统,而随着计算机智能化规程系统的引入,数字化主控室成为常见的主控室操作平台,数字化主控室的信息提供能力和信息处理能力有极大的优越性[5]。数字化主控室的操纵员主要涉及两类任务,即第一类任务和界面管理任务[6]。数字化主操控室的操纵员需要执行的主要任务有监视和发觉、状态评价、响应计划和响应执行,并通过人机交互系统监视和控制系统[7-8]。监视行为是从主控室获取系统运行信息的行为[9]。从传统的手动控制者变为监视者、控制者和决策者集一身的角色[10],在紧急情况下,操纵员需要处理的信息更繁琐,操纵员的任务负荷会随之增加[11]。邹衍华以这四个作业行为单元为研究对象,探究数字化主控室操纵员的作业行为特征及失误机理,揭示操纵员作业行为的逻辑动态演化机制[12]。操纵员需要处理的操作任务变得复杂,执行操作任务的事件窗口减小,使得操纵员的认知、心理和体力负荷都发生变化。刘雪阳从认知行为的角度出发,通过分析主控室操纵员的认知行为特征和失误机理之间的关系,构建了失误因果模型[13],为操纵员的失误机理提供模型支持。何旭洪等在核电厂事故状态的情况下,将操纵员的认知行为过程分为5个阶段,并采用认知行为模型分析操纵员认知过程中的失误情况,最后得到操纵员发生认知失误的阶段和根源[14]。孙倩琳等从认知可靠性与人因失误分析方法入手,提出了认知可靠性与人因失误分析方法(CREAM)中共同绩效条件(CPC)定义比较模糊而且还有重合,针对预测事件时的不确定性,提出CPC的改进方法以及建立人因失误概率计算模型[15],对优化操纵员的行为形成因子有重要意义。数字化主控室操纵员的界面管理任务支持和保障第一类任务的完成,如信息导航、信息调用、数据搜索以及页面配置和管理等[6]。Embrey发现界面管理任务会消耗操纵员的注意力,对第一类任务的绩效有影响[16]。在Embrey研究的基础上,O’hara J M等指出界面管理任务对操纵员的具体影响是降低了操纵员第一类任务的绩效[17]。戴立操等从监视和发觉、状态评价、响应计划、响应执行的四个作业单元中探究界面管理任务对操纵员的影响,为操纵员影响因子体系研究提供基础[18]。

除了对操纵员的行为与失误机理之间关系的研究,现有的部分文献还将风险、情绪等主观心理因素加入对核电厂人员行为的研究中。王盛引入道德风险的概念,分析了核电安全管理中道德风险的产生是由核电企业的经理人和普通员工引发的[19]。Huang Q S等采用博弈分析方法,建立核电企业和政府之间道德风险监管的博弈模型,分析了静态混合策略均衡和有限次动态博弈,认为政府加大对违反安全规则的处罚力度,降低监管成本,就可以降低道德风险[20]。Rao L L等则从安全行为和差错两个方面考察核电厂操纵员的感知风险对其工作质量的影响,利用中国两座核电厂的349名操纵员的数据进行研究,结果发现感知风险与安全行为呈负向线性关系,与差错呈二次关系,此外领导支持在感知风险、安全行为和差错之间的关系中起调节作用[21]。Kim K N等以博弈论的方法考察了内部威胁影响的定量框架[22]。Ni S S等将依赖期望效用理论引入核电厂内部威胁事件中,探究情绪因素对内部敌手和核安保部门策略的影响,结果发现不同情绪状态和情绪强度的组合对博弈均衡结果有影响,还会影响博弈的速度[23]。

在现有的研究中很少有学者从利益相关者的角度出发探究操纵员违章行为的监管问题,核电营运单位如何管控操纵员的违章行为,监管机构如何监管核电营运单位的质量控制和操纵员的作业行为,避免核事故风险的隐患,都是待解决的问题。在学术研究中,博弈论被大量应用于不同利益主体的复杂经济行为[24]和质量管理体系的内在机理问题[25],而主体在做决策时并不总是完全理性的,主观心理因素会影响主体的行为和决策[26]。相对于传统的期望效用理论,前景理论认为决策主体在面对收益和损失时的风险偏好不同,在面对收益时会变得风险厌恶,面对损失时会变得风险追求,因此,本文基于前景理论构建监管机构、操纵员和核电营运单位三方的操作行为监管演化博弈模型,探讨三方策略选择。

一 前景理论

Kahneman D和Tversky A在1979年正式提出了关于风险决策的前景理论[27]:个人对价值的感知并不是价值本身这个绝对值,而是相较于参考点的相对值来衡量主体的收益或者损失,将主体对收益或者损失的感知界定为前景价值V,用权重函数π(pi)和主观价值函数v(Δwi)两个变量描述。

(1)

(2)

其中,pi代表事件发生的概率,权重函数π(pi)描述了个人对事件发生可能的判断,满足π(0)=0,π(1)=1;Δwi=wi-w0表示发生事件i时,主体相较于参考点w0的价值之差,主观价值函数v(Δwi)反映主体根据价值之差形成的感知,公式(2)中参数α表示风险敏感系数(0<α<1),数值越大代表主体对于该收益或者损失价值的敏感度越弱,越不容易影响价值主体的决策。参数β(β>1)表示损失规避系数,数值越大表明主体相对于收益而言,对事件的损失更敏感。

在前景理论中,个人面对收益和损失的敏感程度不同,面对同等的收益和损失时,对损失往往会更敏感。

二 基于前景理论的演化博弈模型

(一)模型主体关系

操纵员是在主控室操纵控制系统的运行人员,操纵员违章行为是指违背有关程序规则进行操作的行为,在实际操作过程中操纵员可能会习惯性坚持不恰当做法以及为了走捷径而违章操作。核安全监管机构(简称监管机构)会定期对核电营运单位设施进行检查,并对操纵员进行监督和考核。核电营运单位负责核设施的质量控制和操纵员的行为管理控制,核电营运单位发现操纵员违章操作时,按要求要第一时间上报监管机构,例如2020年11月5日,生态环境部部务会议通过的政策文件[28]中要求在核电厂运行阶段,发生包括“违反核动力厂运行限值和条件规定的操作或者状况”等12类事件时,在事件发生24小时内,核电营运单位必须口头通告国家核安全局和所在地区监督站;在事件发生后三天内,核电营运单位必须向国家核安全局和所在地区监督站递交书面通告。世界上有核电的国家普遍都建立了经验反馈系统,一旦发生有共性的事件,会及时进行信息公开,告知其他核电厂,所以监管机构核实之后会按照规则发布事件信息,对核电营运单位通报批评。博弈主体之间的关系见图1。

图1 三方博弈主体关系

(二)模型假设

假设1:前景理论中的收益或者损失价值参考点为0。

假设2:监管机构、操纵员和核电营运单位为博弈的参与方,三方都是有限理性的。监管机构的策略空间是{严格监管,不严格监管},监管机构严格监管的概率是x,不严格监管的概率是1-x;操纵员的策略空间是{违章操作,合规操作},操纵员违章操作的概率为y,合规操作的概率则为1-y;核电营运单位的策略空间是{积极管控,消极管控},积极管控的概率是z,消极管控的概率则为1-z。x,y,z分别为博弈三方严格监管、违章操作、积极管控的概率,且满足x>0,y<1,z<1。

假设3:监管机构严格监管时需要付出的成本C1,监管机构监管使得其公信力提升,获得收益为G1,则感知收益V(G1),监管机构不严格监管时需要付出的成本C2,而监管机构不严格监管、操纵员违章、核电营运单位消极管控时,可能会使得核电营运单位有发生更大事故的风险,增加整个社会遭受事故风险的概率,同时使得监管机构公信力降低,监管机构造成的损失为G2,则感知损失为V(-G2)。

假设4:操纵员违章操作时,需要承担事故风险的成本为P1,则感知成本为V(-P1),监管机构严格监管或者核电营运单位积极管控时,操纵员需要承担相应处罚甚至被吊销执照的损失为S1。操纵员合规操作时需要改变自己之前的习惯性不恰当行为,严格按照程序操作,需要付出的成本为P3,感知成本为V(-P3),当操纵员合规操作、核电营运单位积极管控或者监管机构严格监管时,操纵员对其安全操作行为获得的收益为P2,则感知收益为V(P2)。

假设5:核电营运单位积极管控付出的成本为C3,操纵员违章操作对核电营运单位造成的经济损失是S2,核电营运单位积极管控或者监管机构严格监管时,核电营运单位就会被通报,造成的损失为N1,则感知损失为V(-N1)。当操纵员违章操作、核电营运单位积极管控时,核电营运单位发现操纵员违章操作,会避免更大事故的发生,获得收益N2,则感知收益为V(N2),当操纵员违章操作、核电营运单位消极管控,核安全监管机构严格监管时,对核电营运单位进行处罚F1。当操纵员合规操作、核电营运单位积极管控时,核电营运单位对质量控制的满足度增加,获得收益N3,则感知收益为V(N3)。

假设6:核安全监管机构、操纵员和核电营运单位三方有不同的感知价值,各个主体的感知价值对感知收益和感知损失的敏感度不同,设三方对于感知收益的敏感程度分别为α1、α2、α3,对感知损失的敏感程度分别β1、β2、β3。

(三)模型构建

基于以上假设,若监管机构实施严监管的策略,核电营运单位积极管控以及操纵员违章操作时,监管机构采取严格监管策略付出的成本为C1,公信力提升的收益为V(G1),则监管机构的收益感知为-C1+V(G1),同理,可构建监管机构、操纵员和核电营运单位三方的收益支付感知矩阵,见表1。

表1 收益支付感知矩阵

由价值函数可得,监管机构严格监管的概率为1时,监管机构公信力提升G1,监管机构不严格监管时,若违章行为没有被发现,监管机构损失G2,监管机构的感知收益为:

V(-G1)=π(1)v(G1)+π(0)v(-G2)=G1α1

(3)

监管机构不严格监管的概率为1时,若违章行为没有被发现,监管机构损失G2,监管机构严格监管时,公信力提升G1,监管机构的感知损失为:

V(-G2)=π(1)v(-G2)+π(0)v(G1)=-β1G2α1

(4)

同理可得:

V(-P1)=-β2P1α2,V(P2)=P2α2,

V(-P3)=-β2P3α2,V(N2)=N2α3,

V(N3)=N3α3

由上述收益支付感知矩阵可知,监管机构严格监管的预期收益E11、不严格监管的预期收益E12和预期平均收益E1分别为:

E11=-C1+G1α1+y(1-z)F1

(5)

E12=-C2-y(1-z)β1G2α1

(6)

E1=xE11+(1-x)E12

(7)

则监管机构的复制动态方程为:

β1G2α1)]

(8)

其中,ΔC=C1-C2

则操纵员的复制动态方程为:

S1)-x(1-z)(P2α2+S1)]

(9)

核电营运单位的复制动态方程为:

xy(F1+N2α3)+(1-y)N3α3]

(10)

令F(x)=0(x)=0,F(y)=0,F(z)=0V(-N1)=-β3N1α3,求出(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)8个特殊均衡点和(x*,y*,z*)1个混合策略均衡点,其中(x*,y*,z*)是下列方程组的解。因为多种群演化博弈的稳定均衡点是严格的纯策略纳什均衡,所以(x*,y*,z*)不是稳定均衡策略点。

(11)

用雅可比矩阵J对其余的均衡点进行稳定性分析。令

L=-β2P1α2+β2P3α2-z(P2α2+S1)-

x(1-z)(P2α2+S1)

M=-C3-(1-x)yβ3N1α3+xy(F1+N2α3)+

(1-y)N3α3,

则雅可比矩阵为:

若均衡点满足其对应的雅克比矩阵的特征根小于0,则该均衡点是演化博弈模型的局部渐进稳定点,对应的策略为模型的演化稳定策略(ESS)。均衡点的特征值取值见表2。

表2 均衡点的特征值取值情况

(四)演化博弈均衡点分析

由均衡点的取值情况可知,(0,1,1)的特征值中有大于0的取值,所以其余7个均衡点都有可能是演化稳定策略。

当监管机构、操纵员和核电营运单位三方博弈的演化稳定策略为(1,0,1)时,监管机构在操纵员操作行为中履行监督管理的职责,核电营运单位在操纵员操作行为中履行管理控制的职责,操纵员合规操作的利益大于违章操作的损失,倾向于合规操作,此时的策略选择是最优的,因此本文选择研究分析在(1,0,1)的策略选择下三方风险敏感度系数和损失规避系数对演化路径的影响。

当ΔCβ2P3α2,C3

三方博弈均衡点是否稳定除了和获得的实际收益、付出的实际成本有关,还和各自的风险感知收益和成本有关,因此考虑风险感知如何影响主体策略选择,对于分析系统最终演化稳定均衡策略是必要的。

三 演化博弈数值仿真

Python是一种开源的程序设计语言,具有简洁、易读、可扩展性强的特点,并且具有丰富的科学计算扩展库,十分适合工程技术、科研人员处理实验数据。故本文采用Python对上述三方博弈的演化过程进行数值仿真。

(一)稳定策略仿真分析

满足博弈稳定点1,0,1的稳定条件是:ΔCβ2P3α2,C3

图2 均衡点(1,0,1)的数值仿真

(二)风险敏感度系数和损失规避系数分析

1.监管机构风险敏感度系数和损失规避系数分析

在演化博弈的初始参数值和操纵员与核电营运单位的风险敏感度系数和损失规避系数不变的情况下,取α1=0.22,β1=1.25,将三方的策略概率初始值仍然分别设置为x=y=z=0.5和x=0.3,y=0.9,z=0.6,仿真结果见图3(a)和图3(b)。

图3 α1=0.22,β1=1.25的演化稳定均衡

由仿真结果可知,减小监管机构的风险敏感系数和损失规避系数使得三方的最优策略不再稳定,监管机构选择严格监管的策略最终概率大概稳定在0.6。此时β1保持不变,将α1改变为之前的值,即α1=0.88,演化稳定策略又变回(1,0,1),见图4(a)和图4(b)。这说明影响最优稳定策略的因素之一为监管机构的风险敏感系数。

图4 α1=0.88,β1=1.25的演化稳定均衡

2.操纵员风险敏感系数和损失规避系数分析

在演化博弈的初始参数值和监管机构与核电营运单位的风险敏感度系数和损失规避系数不变的情况下,取α2=0.22,β2=1.25,将三方的策略概率初始值仍然分别设置为x=y=z=0.5和x=0.3,y=0.9,z=0.6进行仿真,仿真结果见图5(a)和图5(b)。

图5 α2=0.22,β2=1.25的演化稳定均衡

由仿真结果可知,减小操纵员的风险敏感系数和损失规避系数使得三方的稳定策略不变,依然稳定在最优策略上,但是操纵员的策略演化速度减慢。

3.核电营运单位风险敏感系数和损失规避系数分析

在演化博弈的初始参数值和监管机构与操纵员的风险敏感度系数和损失规避系数不变的情况下,取α3=0.22,β3=1.25,将三方的策略概率初始值仍然分别设置为x=y=z=0.5和x=0.3,y=0.9,z=0.6进行仿真,仿真结果见图6(a)和图6(b)。

图6 α3=0.22,β3=1.25的演化稳定均衡

由仿真结果可知,减小核电营运单位的风险敏感系数和损失规避系数使得三方的稳定策略变为(1,0,0),核电营运单位对价值的敏感性减弱,即比起损失更在乎收益。此时β3保持不变,将α3改变为之前的值,即α3=0.88,β3=1.25,演化稳定策略又变回(1,0,1),仿真结果见图7(a)和图7(b)。这说明影响最优稳定策略的因素之一为核电营运单位的风险敏感系数。

图7 α3=0.88,β3=1.25 的演化稳定均衡

四 结 语

本文构建了核安全监管机构、操纵员和核电营运单位三方之间操作行为监管的演化博弈模型,并通过数值仿真进行演化稳定性分析,探讨了影响三方稳定策略的条件和因素。

(一)影响三方演化稳定策略的因素有:监管机构严格监管和不严格监管的成本之差ΔC、监管机构严格监管的公信力提升带来的感知收益G1α1、操纵员违章操作的风险感知成本β2P1α2、操纵员违章需要承担的损失S1、核电营运单位积极管控或者监管机构严格监管时,操纵员对其安全操作行为付出的成本的感知收益P2α2、操纵员合规操作遵守程序付出的感知成本β2P3α2、核电营运单位积极管控的成本C3、核电营运单位对质量控制的满意度的感知收益N3α3。

当监管机构严格监管和不严格监管的成本之差小于其监管的公信力提升带来的感知收益;操纵员违章操作的风险感知成本、操纵员违章需要承担的损失与核电营运单位积极管控或者监管机构严格监管时,操纵员对其安全操作行为付出的成本的感知收益之和大于合规操作的感知成本;核电营运单位积极管控的成本小于在核电营运单位对质量控制的满意度的感知收益,此时能达到最优策略(1,0,1),即监管机构选择严格监管、操纵员选择合规操作以及核电营运单位选择积极管控。

(二)监管机构和核电营运单位的风险敏感系数是影响最优稳定策略的因素。监管机构风险敏感系数的减小,会使得监管机构最终选择严格监管策略的概率稳定在0.6左右;核电营运单位的风险敏感系数的减小,会使得核电营运单位消极管控时造成的损失敏感度减弱,三方博弈最终不能稳定在最优策略上,说明监管机构和核电营运单位的风险态度对策略选择有较大影响。但是数值仿真结果显示,操纵员的风险敏感系数和损失规避系数对最终策略的选择没有影响,只对操纵员的策略演化速度有抑制作用,即选择合规操作的操纵员不会因为风险敏感度、损失规避程度而改变其严格按照规章程序操作的策略。

猜你喜欢

营运核电收益
第四代核电 高温气冷堆
百年初心精神 点亮核电未来
螃蟹爬上“网” 收益落进兜
2020年核电活动安排
VRT在高速公路营运管理中的应用
大考已至:撤站后的三大营运管理痛点及应对
怎么设定你的年化收益目标
核电链接
2015年理财“6宗最”谁能给你稳稳的收益
动画短片的营运模式研究