基于PT-MA理论的装配式建筑施工安全管理行为演化博弈分析

2021-05-10马婷婷刘兰梅

工业工程 2021年2期

庄丽，马婷婷，刘硕，刘兰梅

(青岛理工大学管理工程学院，山东青岛 266520)

装配式建筑是一种利用将预制好的构配件运输到施工现场，通过现场组合而形成的建筑结构。装配式建筑推动了传统施工工艺向现代建筑工业化道路的转变，有利于促进建筑行业可持续健康发展。2016年9月，国务院办公厅印发的《关于大力发展装配式建筑的指导意见》要求用10年左右的时间，使装配式建筑占新建建筑面积的比例达到30%[1]。装配式建筑施工过程主要划分为构件预制、构件运输、吊装作业以及现场安装4个工序。与传统现浇建筑施工过程相比，装配式建筑施工过程存在较多的高空吊装作业，而现场人员数量相对减少，对施工环境以及作业人员机械化水平都有着极大的考验，施工现场非安全风险影响因素存在复杂性，导致施工现场存在严重安全隐患。在现阶段安全技术与施工管理措施储备不足的情况下，工程安全形势不容乐观，施工安全管理问题亟待解决。

近年来，多数学者就此展开了研究。陈伟等[2]、李皓燃等[3]分别采用系统动力学、结构方程模型对装配式建筑施工安全事故关键风险诱发因素进行筛选分析；桑培东等[4]运用结构方程模型分析调查问卷数据，对装配式建筑项目施工阶段风险进行评价并提出风险控制措施；王志强等[5]运用FTA(事故树)−SPA(集对分析法)−灰色聚类法评估了装配式建筑施工过程中的危险因子。由于装配式建筑施工过程中垂直机械化程度高、预制构件连接精准度要求高、施工工序复杂且难度高，施工人员素质将直接影响施工安全。Heinrich[6]和Reason[7]提出的事故致因理论中指出“人”是导致事故发生的重要因素之一；李艳庆等[8]通过对某市辖区内2001～2010年间100起建筑施工安全事故深度分析，揭示了人因占安全事故因素的60.94%；严小丽等[9]也指出人的不安全行为是导致事故发生的首要因素。可见，有效控制人的行为，能够在极大程度上减少安全事故的发生。但是，施工人员通常无法正确衡量既得利益与保障自身安全之间的冲突关系，所以对“不安全行为的控制”往往难以实施，除对行为进行控制外，施工人员与监管人员的行为动机也至关重要[10]。在装配式建筑施工安全管理过程中，施工人员和监管人员利益诉求存在互异性，监管人员的行为与施工人员违章作业策略的选择存在着博弈关系[11]，站在“成本−收益”的立场上，运用演化博弈方法能够更加清晰地了解决策过程。

演化博弈理论已经逐渐在施工安全管理研究中运用。程敏等[12]运用演化博弈理论对政府监管人员和建筑企业互动行为进行分析；梅强等[13]运用演化博弈理论对安全生产管制路径进行仿真演化。文献中运用的演化博弈理论，假设群体具备有限理性和有限知识且通过不断地调整追求自身利益最大化，因其更贴近现实而得到较广泛的应用。但由于装配式建筑涉及利益主体多、工程系统繁复，导致监管人员在面对复杂多变的环境时难以做出正确决策，存在主观判断偏差和价值感知偏好等现象。Kahneman等[14]为更进一步探索施工安全管理群体决策行为的真实性，引入前景理论。周国华等[15]基于前景理论对工程项目中施工人员和安全管理人员的行为进行演化博弈分析；高建伟等[16]优化后的前景理论模型罕有地将群体损益敏感因素介入价值函数，并认可主观决策受到情绪的影响，更贴合该文研究的目的。与此同时，为了与人的有限理性更加契合，Thaler[17]提出心理账户概念，旨在揭示人们真实的决策行为；韩帅等[18]借助前景理论−心理账户理论构建了效价−成本前景价值感知矩阵，对煤矿安全群体动态行为进行科学性分析。

综上所述，在演化博弈理论中，融合前景理论与心理账户理论可以有效对人们行为决策的科学性、真实性作出解释。但鲜有借此理论方法来探究装配式建筑施工安全管理的文献。本文基于心理账户的收益和支付账户，运用前景理论中的前景价值函数，构建前景收益−支付价值感知矩阵，探究装配式建筑施工人员和安全监管人员真实博弈行为，最后构建Matlab算法，进行演化博弈模拟仿真，验证各参数对行为演化路径的影响，增强结果的客观性，为相关安全管理行为研究提供参考。

1 理论依据

1.1 前景理论

前景理论(prospect theory)是用来描述人在前景不确定条件下，根据风险偏好所作出决策价值与传统期望值不一致的行为理论。有限理性假设下，研究发现人在面临得失时的风险偏好不一致，在面临收益时表现出风险规避，在面临支付时却表现出风险倾向。人在面临决策时通常会预先设定好参考点，并依据参考点来衡量收益或支付。参考点偏差极易导致决策者的情绪波动，并进而影响决策者的行为。

在前景理论中，前景感知价值通常运用 V来衡量，由项目损益状态的感知价值函数T (Δx)和决策权重函数 w (ε)决定。前景的期望价值形式为V=T(Δx)·w(ε)。其中，V 表示人对事件整体的价值感知；T(Δx)表示人对事件中实际收益与参考点的偏差 Δx产生的主观价值感知；w (ε)为人对事件发生比例 ε的主观决策权重函数。当 Δx ＞0和 Δx ＜0时， T(Δx)表示价值函数在收益感知区间和支付感知区间的凹凸程度，分别具有凹函数和凸函数的特征，且 Δx＜0时，函数的灵敏度更高。决策权重w (ε)具有如下特征：w(0)=0， w(1)=1；当 ε趋向于0时， w(ε)＞ ε；当 ε趋向于1时，w (ε)＜ ε。

1.2 心理账户

心理账户(mental accounts)是一个行为经济学理论，是指人在心理基础上将财富划分到不同的账户进行管理，由于人并非绝对理性，所以其行为决策常会违背最简单的理性经济法则。本文将参考人的得失感受差异，结合心理账户理论将T函数进一步划分为收益账户(获取收益)和支付账户(支付成本)，且收益账户和支付账户均存在自身感知参考点和感知价值函数，即个体或群体面对收益(或支付)时，如果收益值(或支付值)大于感知参考点，决策者的相对收益(或支付)便是正值(负值)，即获得相对收益(或支付)感知；如果收益值(或支付值)小于感知参考点，决策者的相对收益(或支付)便是负值(正值)，即获得相对支付(或收益)感知。具体各参数如下。

P(x)为收益账户的感知价值函数； λ为收益损失规避灵敏系数； U0为收益参考点； x为价值变量；β 、 θ 为收益相对获得−付出时风险偏好系数；C(x)为支付账户的感知价值函数； δ为支付损失规避灵敏系数用； U1为支付参考点； υ 、 σ为支付相对付出−获得时风险偏好系数，其中风险偏好系数越大，对风险感知也就越敏感。

心理账户理论相关的决策权重函数是决策者根据事件比例对损益作出客观判断，得出的决策权重值。具体各参数为

其中， w+(ε)为收益决策权重函数； w−(ε)为支付决策权重函数； γ为决策灵敏系数， γ值越大，决策权重函数曲线越弯曲。感知价值函数和决策权重函数实质上取决于客观决策环境且受决策者风险偏好影响，因此相关参数取值具有可变性，在不同环境下取值具有差异性。如Gurevich等[19]在经济不确定性条件下提出β、θ、 υ，σ取值0.98，λ、δ取值1.12；Tversky等[20]通过随机实验数据提出β、θ、 υ，σ取值0.88，λ、δ取值2.5。为了方便后续公式验算，统一用 w(ε)表示决策权重函数，参数为 γ，其取值约为0.75。

2 博弈模型

2.1 基本假设与定义

不考虑系统外部因素影响的条件下，在装配式建筑施工过程中是否会出现不安全行为，可以当成项目施工人员与监管人员博弈过程中风险决策行为导致的结果，其中监管人员指亲临现场或远程监控现场施工安全、对施工人员进行直接管理的一线管理人员，可以是属于业主、监理、施工等任何一方，但不包括间接管理人员。

本文依据风险决策中的期望值准则作出如下假设。

假设1博弈双方主要为施工群体与安全监管群体，在博弈过程中仅具有有限理性，且符合基于前景理论与心理账户结合所构建的价值感知函数V ，即具有V =T(Δx)w(ε)形式。

假设2博弈双方安全行为策略选择均基于自身价值感知而非实际效用结果，即项目施工人员与监管人员行为安全程度具有离散性。施工人员在施工过程中有{重视、忽视}2种策略选择；监管人员在监管过程中同样有{监管、不监管}2种策略选择；此外，本文中添加了从施工人员、监管人员中抽调人员组成的第三方监察群体，对不履职人员实施监督，以确保施工安全。

假设3博弈双方安全行为策略的选择具有互补效应。博弈双方只有同时采取积极行为，即施工人员重视安全施工和监管人员履责监管时，才会保证施工过程处于安全状态，不然将会出现风险。不同风险之间相互关联和影响，根据风险分担原则，风险损失会从一方根据风险传递系数转嫁到另一方，风险传递系数为大于0的一切实数。

假设4感知价值函数中所有参数均为大于0的固定值。

2.2 模型构建

从博弈双方行为选择策略的立场上出发，对行为引起收益与支付进行细化。选择重视与监管行为都会得到一定的收益(报酬、赏识等)，同时也需要支付一定的成本(体力、时间、精力等)；而选择忽视与不监管行为则需要支付相应的违规成本(精神成本、经济成本等)，但相应的效价(报酬、人情等)仍存在。具体的收益−支付函数相关参数含义如下。

a1为施工人员应得工资报酬；a2为施工人员选择重视安全行为策略得到上级的赏识；b1为监管人员应得工资报酬；b2为监管人员选择监管行为策略得到上下级的认可；c1为施工人员选择重视安全行为策略的劳动感知；c2为施工人员选择重视安全行为策略的精神感知；c3为施工人员违规选择忽视安全行为策略的精神感知；d1为监管人员选择监管行为策略的劳动感知；d2为监管人员选择监管行为策略的精神感知；d3为监管人员违规选择不监管行为策略的精神感知；R为监管人员违规选择不监管行为策略得到的黑色收入；i为受贿人员在监管人员中所占比例；T为监管人员(含第三方)对选择忽视安全行为策略的施工人员进行罚款；S为监管人员渎职(受贿、不履职)被举报所支付的损失；α为单方或双方渎职被处罚的比例；f1为仅有施工人员重视安全行为产生的安全风险系数；f2为仅有监管人员实施监管行为产生的安全风险系数；L为事故发生后责任方需承担安全风险成本；q为事故发生比例；h为风险传递系数；g为监管人员罚款指标与自身奖励相关系数；y为施工人员重视安全行为的概率；z为监管人员实施监管行为的概率。

根据上述分析，结合前景理论−心理账户中收益账户价值函数 P(x)和支付账户价值函数 C (x)，构建装配式建筑施工人员与监管人员的演化博弈安全收益感知矩阵，如表1所示。

表1 前景收益−支付价值感知矩阵Table 1 Prospect income-value perception payment matrix

3 模型分析

3.1 模型均衡解分析

博弈双方在演化过程中依据自我能力、风险偏好与价值感知，不断学习、优化策略。依据基于前景理论与心里账户的演化博弈复制动态方程分析方法，由表1可得T1y与T2y以及平均价值感知 Ty，如式(1)所示。

同理，可求得监管人员“监管”安全行为的价值感知T1z与“不监管”安全行为的价值感知T2z以及平均价值感知，如式(2)所示。

依据非对称复制动态方程演化方式，可求得施工人员重视安全行为比例y和监管人员实施监管行为比例z的复制动态方程，见式(3)。

为了简化计算，用N表示确定监管人员选择监管行为策略而不知施工人员是否实施安全行为感知价值函数；M表示确定监管人员选择不监管策略而不知施工人员是否实施安全行为感知价值函数。可得

为了简化计算，用K表示施工人员重视安全行为时监管人员监管−不监管安全行为的感知函数；用U表示施工人员忽视安全行为时监管人员选择监管−不监管安全行为感知价值函数。可得

由式(4)可求得，当且仅当 y=0， y=1或 y=(M/时，施工人员选择重视安全行为策略可以达到局部稳定状态(ESS)。

此时，可形成5个局部均衡点：O(0,0)，A(0,1)，B(1,0)，C(1,1)以及点依据Freidman[21]提到的系统演化稳定策略运算方法，得知该系统的雅可比矩阵的局部稳定性分析可得到微分方程的演化局部稳定策略(ESS)。其系统雅克比矩阵行列式为

根据雅可比矩阵行列式，得式(7)和式(8)以及表2演化均衡点状态。

由于传统的雅克比矩阵稳定性分析无法判定均衡点E，在此采用微分分析法来判断。对式(4)与(6)分别求关于z、y的偏导数并将点D坐标代入得

表2 演化均衡点状态判断Table 2 State judgement of evolutionary equilibrium point

由于 y , z ∈[0,1]，若使均衡点D有意义，则必有那么式(9)和式(10)均为正值，即D为不稳定点。由此得系统行为均衡点演化稳定相图，如图1所示。

图1 均衡点演化稳定相图Figure 1 Equilibrium evolution stable phase diagram

3.2 结果讨论

通过上述分析可知，当且仅当同时满足N＞0、M＞0、K＞0、U＞0条件时，即价值感知收益偏差呈同化正向收敛时系统行为演化稳定性最强，为最佳理想状态，此时施工人员重视安全行为价值感知与监管人员监管安全行为价值感知占据理性主导地位，施工人员有100%的概率选择重视安全行为策略，监管人员同样拥有100%的概率选择监管安全行为策略。然而，装配式建筑施工过程中，施工人员与监管人员仅具备有限理性，加上前景理论中面对“得”时风险规避和面对“失”时风险追求的风险偏好导致其在决策过程中难以作出正确判断，进而使行为存在系统性偏差，难以达到最理想状态，收敛于最佳均衡点(1,1)。具体表现如下。

1) 收益−支付感知偏差。施工人员与监管人员实施安全行为收益感知往往低于对立行为收益感知。同理，施工人员与监管人员实施安全行为支付感知往往高于对立行为支付感知。我国现阶段装配式建筑施工工艺对人员素质要求极高，而在现有施工人员基础上，若严格按照施工现场冗杂的规章制度办事需要支付较高的安全成本c1、c2；二是当违规行为被监管人员检查到时除支付精神成本c3外，还要支付一定的罚款T。监管人员的监管成本也受诸多因素影响。一是施工区域大，监管人员往往是流动式的监督，增加了时间成本d1。二是监管难度大，施工现场环境导致管理群体难以进行全方位、全天候的监督。然而对监管人员来说，在工资b1不占优势的情况下，实施监管安全行为后的收益也缺少保障，选择监管安全行为的比例大大降低。此外，罚款指标i与收益没有线性相关，实施不监管行为却能获得人情关系等黑色收入R。

2) 乐观偏见。装配式建筑施工过程由于吊装运送、安装构件等需要，不能搭设传统工程所适用的内外脚手架，而外墙又基本采用预制构件拼接，施工人员需进行高空临边作业，极易产生高空坠落风险，而施工人员与监管人员普遍存在过度自信的现象，在对行为策略选择进行感知时，极易产生侥幸心理与乐观偏见，从而使人们对于风险认知的敏感度与行为价值感知降低，减少了规避风险的意愿，导致施工人员与监管人员在明知实施消极安全管理行为会发生支付的情况下，仍然幻想低比例事件不会发生、不会造成事故及损失，最终因低估消极管理安全行为后果导致风险事故发生。即w(q)＜q，w(α)＜α，q表示事故发生比例，α表示处罚比例。

3) 风险偏好。前景理论反射效应中指出，决策者在面临收益与支付时风险偏好不一致，在面临前景支付感知时，有明显风险追求倾向[19]。施工人员与监管人员选择实施安全行为策略是典型的支付决策。由于施工人员选择重视安全行为需支付确定性成本c，而选择不安全行为决策仅存在一定比例会发生事故支付q及罚款α，导致施工人员有极大可能性选择不安全行为；监管决策需支付确定性成本d，而选择不监管行为决策仅存在一定比例会发生事故支付q及举报α。施工人员与监管人员在面临收益感知时，常表现出风险厌恶，此时 β 、 θ 较大， λ较小。对选择安全行为决策收益感知敏感度不高，但在面临支付感知时，往往表现出明显的风险追求，而此时 υ 和 σ较大， δ较小。由于决策主体存在明显的风险偏好，会更倾向于选择消极风险管理策略，使系统存在不确定的风险事故损失和处罚，难以收敛于最佳均衡点(1,1)。

4) 价值感知参考点。施工人员与监管人员对于收益价值感知账户与支付价值感知账户有不同的参考点，往往存在想通过低支付获取高收益的侥幸心理，从而极易形成高收益参考点和低支付参考点，这也是目前建筑行业普遍存在的现象。高收益参考点不利于决策群体对安全行为的选择，比如收益感知参考点U0为5，安全收益感知为4，不安全收益感知也为4，决策群体对收益差 Δx感知灵敏，从而不利于对安全行为选择倾向。低支付参考点同样不利于决策群体对安全行为的选择，比如支付感知参考点U1为5，安全支付感知为5，不安全支付感知为4，显然决策群体会倾向于选择不安全行为策略。

4 数值模拟与仿真

装配式建筑施工过程中极易由于人员技术低下、素质不达标以及管理失效、不良施工环境等引起不安全行为进而引发安全事故。同时施工人员与监管人员组成的复制动态系统较为复杂，影响施工人员与监管人员安全行为价值感知的因素较多，当某一因素变化时，会影响一方的价值感知，从而促使双方安全行为策略选择不断优化调整。为了更直观地分析不同因素对施工人员与监管人员安全行为价值感知的影响，运用Matlab软件进行重复博弈仿真模拟。

本文依据Tversky等[20]和Van Schie等[22]得出的数据对风险偏好系数进行赋值，可设 β 、 θ初始值为0.88， λ 、 δ初始值为2。由前景理论可知决策者在面对支付时风险偏好表现为风险追求，可设υ 、 σ初始值为0.98。基于前景理论−心理账户理论与有限理性角度考虑，决策群体对安全收益价值感知要小于不安全行为收益价值感知、对安全行为支付价值感知要大于不安全行为支付价值感知，故可设a1、a2、b1、b2初始值为2；R为3；c1、c2、d1、d2初始值为3；c3、d3初始值为2；T、S初始值为3。根据海因里希理论1:300原则，可设q为0.03；同时，博弈双方行为策略选择时不断学习优化的，不失一般性，可设施工人员和监管人员实施安全行为策略的比例y和z的初始值均为0.5；管理责任制中规定出现事故时监管人员要承担连带责任，因此将风险传递系数h的初始值设为1。此外，相较于被动监管施工人员主动实施安全行为得到的效果更佳，即施工人员实施安全行为风险系数f1应小于仅监管人员实施安全行为f2，故可设f1为0.4，f2为0.6。依据实际情况对参数取值：α = 0.8，i = 0.1，g = 0.1，L = 100，U0= U1=1。运用Matlab软件进行重复博弈仿真，仿真分析过程中，被分析关键因素参数可变，其他参数不变。基于以上初始值，得到具体结果分析如下。

1) 决策者选择实施安全行为策略初始比例y、z对演化结果的影响如图2(a)所示，设施工人员选择实施安全行为策略初始比例y = 0.5，依次调整监管人员选择安全行为策略初始比例为0.1～0.9进行演化仿真。可以看出，随着监管人员选择安全行为策略初始比例z的增加，演化系统收敛于1的趋势变得平缓，即监管人员选择安全行为策略初始比例越高，施工安全管理系统向最佳理想状态方向选择的速度越快。同理可知，如图2(b)所示，设监管人员选择安全行为策略初始比例z = 0.5，施工人员策略随着初始比例y的增加，向最佳理想状态演化的速度越快。

图2 y、z对演化结果的影响Figure 2 The effect of y and z on evolution

2) 改变支付成本c1值，观察施工人员安全行为演化结果，如图3所示，纵坐标表示施工人员重视安全行为的概率，横坐标表示时间。可以看出，随着支付成本c1增加，施工人员策略选择逐渐向y = 0(即选择不安全策略)演化。这说明通过增加安全行为支付成本，会增加施工人员对支付风险逃避倾向，导致选择不安全行为策略，不利于施工人员向最佳理想稳定状态演化。

图3 c1值对演化结果的影响Figure 3 The effect of c1 on evolution

3) 改变α 值，观察施工人员安全行为演化结果，如图4所示，纵坐标表示施工人员重视安全行为的概率，横坐标表示时间。可以看出，随着罚款比例α的增加斜率变大，施工人员策略选择逐渐向y =1(即选择安全行为策略)演化，说明通过提高罚款比例，施工人员对于支付价值感知灵敏度变高，能够有效促使施工人员向实施安全行为演化。同理，通过增加举报比例α 能促使监管人员行为向积极方向演化。

图4 α值对演化结果的影响Figure 4 The effect of α on evolution

4) 改变风险偏好系数β值，观察施工人员安全行为演化结果，如图5所示，纵坐标表示施工人员重视安全行为的概率，横坐标表示时间。可以看出，随着风险偏好系数值β增加(β值变化区间为0.1～0.9)，施工人员策略选择逐渐向y = 0(即选择不安全策略)演化，前景理论中提到，在面对风险时群体决策者有明显的追求倾向。因此，风险偏好系数β值增加不利于决策者行为向积极方向稳定演化。

图5 β值对演化结果的影响Figure 5 The effect of β on evolution

5) 改变支付价值感知参考点U1，观察监管人员安全行为演化结果，如图(6)所示，纵坐标起点z =0.5，横坐标表示时间。可以看出，随着支付价值感知参考点U1值增加(U1值变化区间为0.1～0.9)，监管人员策略选择向z = 1(即选择监管策略)迅速演化，说明提高支付价值感应参考点能够促使监管人员监管行为向积极方向稳定演进。

图6 U1值对演化结果的影响Figure 6 The effect of U1 on evolution

5 结论

装配式建筑施工系统复杂性与风险不确定性导致施工人员与监管人员在安全认识、风险偏好等方面存在明显差异，传统的演化博弈模型难以描述不同因素对博弈双方安全行为策略选择的影响。因此，本文在传统演化博弈理论基础上引入前景理论与心理账户理论，应用价值感知函数与决策权重函数对传统收益矩阵参数进行优化，理论分析了收益−支付感知偏差、乐观偏见、风险偏好与价值感知参考点4个关键因素对安全行为和监管行为策略选择的影响，并通过仿真模拟不同因素对施工人员与监管人员安全管理策略选择和行为演化结果的影响。研究表明，当且仅当施工人员重视安全行为且监管人员实行监管时，即M＞0、N＞0、U＞0、K＞0时，施工安全管理系统演化达到最佳理想状态。若要达到这种最佳状态，具体可以通过以下途径来实现。

1) 对施工人员与监管人员进行施工安全管理培训，将“安全”上升到意识层面；

2) 提高施工人员与监管人员工资报酬a1、b1，进行精神激励a2、b2，降低实现安全管理行为支付的劳动成本c1、d1，精神成本c2、d2；

3) 适当提高对于违反施工安全管理规定群体的惩罚力度T、S，违规所承担的精神成本c3、d3以及第三方监管力度α；

4) 适当调整施工人员与监管人员风险偏好，包括提高对风险事故发生比例q及忽视−不监管施工安全管理行为的支付价值感知，降低风险追求 β 、 θ、υ 、 σ；

5) 适当调整价值感知参考点，包括降低收益价值感知参考点U0，提高支付价值感知参考点U1。

本文的主要贡献是基于人的有限理性假设，运用PT−MA理论构建前景收益−支付价值感知演化博弈矩阵，复刻施工人员与监管人员施工安全管理系统中的收益−支付感知偏差、乐观偏见、风险偏好与价值感知参考点4个关键因素对安全行为和监管行为策略选择的影响。然而，本研究也存在着缺陷。一方面是该研究在理想状态下进行；另一方面是在研究过程中发现价值感知涉及到复杂的心理因素。对这两方面进行客观分析将是下一步的研究重点。