基于前景理论的绿色行为决策演化博弈模型

2020-01-07杨苏蔡乐

安徽建筑大学学报 2019年5期

杨苏，蔡乐

(1.安徽建筑大学经济与管理学院，安徽合肥 230601；2.安徽省建筑经济与房地产管理研究中心，安徽合肥 230601)

0 引言

在工业化进程中，环境问题成为全球性问题，在资源和环境限制下的绿色行为也日益重要。企业的绿色行为是指为了在资源环境约束下提高自身竞争优势，为获得社会、经济和环保的最大收益行为，采用绿色创新与管理，将资源消耗降到最低且将环境污染减到最少[1]。在绿色行为决策过程中，企业追求的是自身的利润最大化，而政府作为监管方，受到一些不确定因素的影响，也无法时刻都做出完全理性的决策行为，因此风险决策行为可以看做是在不确定情形下有限理性决策主体所做的绿色行为决策的这一行为，符合演化博弈的有限理性假设。

已有研究证实绝大多数的环境污染问题产生的原因是企业未采取绿色行为或政府未能进行及时有效的监管[2-5]，而运用演化博弈分析绿色行为的现有研究成果中对企业不采取绿色行为、政府不积极监管的决策行为背后的形成机理并未给出有说服力的解释[6-7]。那么究竟如何利用演化博弈研究绿色行为决策过程中的形成机理？

演化博弈理论[8-10]摒弃了经典博弈论完全理性假设的局限，从人的有限理性出发来分析和预测群体行为，真实反映决策主体行为的多样性和复杂性。一些学者已运用演化博弈的方法对绿色行为决策进行了研究，这些研究成果[11-14]改进了原有完全理性的假设局限，但在分析过程中仍采用的是基于传统期望效用理论的客观收益矩阵来表达支付矩阵，无法准确刻画决策行为人的心理感知，所得出的结论常与现实矛盾甚至相悖。因为前景理论与传统的期望效用理论相比较，增加了决策者的理性不足和偏好两方面的考虑，衡量的是动态不确定条件下的前景价值，所以其在分析企业行为方式行为变化时更加客观，也更符合在真实情况下人们的决策行为[15-16]。

因此，本文将前景理论引入演化博弈分析框架，遵循有限理性的假设前提，用前景理论中的前景价值函数替代传统期望效用理论中的收益矩阵，构建演化博弈模型并通过仿真分析探讨政府不同环境规制强度下的企业行为策略。

1 基于前景理论的绿色行为决策演化博弈模型

建立基于前景理论绿色行为的企业前景价值感知函数，并构建主体绿色决策的演化博弈模型，运用演化动态中的复制动态来刻画政府和企业的策略选择与演化路径。

1.1 模型假设

在不考虑外部环境和其他决策主体影响的情况下，绿色行为决策过程可以视为一种不确定情形下政府和企业的风险决策行为。基于此，提出以下假设：

假设1：在绿色行为决策中，存在着政府和企业博弈双方，其各自对策略价值的感知从而进行决策，并且政府和企业这种感知价值的特征符合前景理论，前景价值(V)即博弈主体对策略得失值的心理感受，其分为价值函数v(x)和权重函数π(p)。

其中，我们将pi作为决策事件所发生的概率，π( pi)代表决策者的主观判断事件所发生的概率，其权重函数形状为倒“S”型，γ 值越小，函数曲线越弯曲，满足π(0)= 0，π(1)= 1；Δxi为事件发生后博弈主体所得的实际收益与参照点的差值，Δx =x - x0，x0为参照点。

α、β ∈(0,1)为博弈主体的风险偏好系数，当α = β = 1 时此时的博弈主体是风险中等偏好。损失规避系数为λ(λ ≥1)，它的值越大则表示主体对损失的敏感性强于收益。

假设2：企业和政府的策略选择分别有两种：{采取绿色创新行为I1，不采取绿色创新行为I2}与{积极监管S1，消极监管S2}。

若政府为投入积极监管而产生的费用为c，相对应的前景价值感知为C；企业的进行的绿色创新行为采取包括劳动、时间、精力等付出的实际成本为t，前景价值感知相应为T。f1为政府实际处罚企业造成的环境污染问题，相应的前景价值感知为F1。

假设3：政府在决策时的主要关注问题是社会效益最大化，企业既追求利润最大化也会考虑社会效益。社会理性更加决定了个体利益，行为如果只考虑到个体利益无法绝对保证个体的最大化利益[17]。

企业与政府在日常生产生活中所存在的博弈过程是动态可重复的过程，根据对方的相关变化来调整自身策略，改变的策略会形成演化稳定均衡。

企业采取绿色行为的概率为x，不采取绿色行为的概率为1 - x 政府积极监管的概率为y，消极监管的概率为1 - y，其中。

文中各变量设置与符号约定参见表1。

表1 变量设置与符号约定

1.2 模型构建

通过上述三个假设，构建基于前景理论的绿色行为决策主体间的演化博弈模型、收益感知矩阵，如下表2 所示。

表2 绿色行为决策主体的收益感知矩阵

(3)当博弈双方采取{ }S1,I2策略时，假设企业不采取绿色行为被发现的实际概率为q，若未被发现则可逃脱处罚。

1.3 模型求解

基于复制动态的演化博弈分析方法[18]，由表2可知，企业在采纳绿色行为和不采纳绿色行为两种情形下的期望收益感知及平均收益感知分别为：

同理，政府在积极监管和消极监管两种情形下的期望收益感知及平均收益感知分别为：

根据非对称复制动态演化方式，得到x 和y 的复制动态方程分别为：

绿色行为决策主体的演化均衡结果可通过式(10)和(11)联立的微分方程组系统求解得到。

使(F(x),F(y))=(0,0)，从而得到了五个点，分别是：E1(0,0),E2(0,1),E3(1,0),E4(1,1) 与E5(x0,y0)，其中，y0)=。

再根据每个均衡点的detJ 和trJ 的正负情况进行判定，将雅克比矩阵记为 J，J =，雅克比矩阵存在局部稳定性相应判定准则[19]，当且仅当detJ ＞0 且trJ ＜0 时可能均衡点为演化稳定均衡点其对应的局部稳定性分析为下表3。

表3 局部稳定性分析结果

1.4 结果分析

根据前景理论可知，绿色行为主体的决策是由其收益心理感知决定的，只有同时满足(13)中的所有条件，政府才会选择积极监管，企业才会选择采用绿色行为的策略，此时达到帕累托最优。

由于x,y ∈[ 0,1 ]，而要使得点E5(x0,y0)有意义则需要满足：

即企业采取绿色行为的所付出的费用的前景价值感知小于政府对企业进行污染行为的处罚风险、声誉及损失的风险贴现值之和，且也小于由此带来的额外外部收益，企业才可能自发采取绿色行为。

2 模型仿真分析

2.1 模型条件设置和相应参数

通过采用MATLAB 软件仿真模拟企业绿色行为决策演化构建博弈模型中的参数变化对系统演化的影响。

假设初始值为x=0.2，y=0.2，k=1，m=0.4，n=0.6，F1=0.5，F2=1，C=1，T=1，通过上述的初始值设置，再进行MATLAB 软件50 次的重复博弈仿真。

2.2 模型的仿真及分析

2.2.1 政府对企业行为的监管成本C 值得改变对结果的影响

由图1 知，关于监管成本C 的临界值在0.9 值附近，当临界值小于C 时，y 收敛于0，然而C 的减少一定程度降低y 收敛于0 速度；当临界值大于C时，y 收敛于1，此时C 的减少一定程度加快y 收敛于1。由此我们发现，经过C 的降低，政府积极监管的概率会的到提升。

图1 政府的监管成本C的变化对演化结果的影响

2.2.2 企业污染行为被政府处罚的损失其F1的变化对演化结果的影响

由图2 可得，F1在1.0-1.5 之间存在某个临界值，当F1小于该临界值时x 收敛于0，而F1增加会减慢x 收敛于0 的速度；当F1大于其时，x 则会收敛于1。可见，通过增加企业污染行为被政府处罚所损失的F1使企业在绿色生产方面更加重视。

2.2.3 企业的风险损失的前景价值感知F2的变化对演化结果的影响

图2 企业受到政府处罚的损失的前景价值感知F1变化对演化结果的影响

由图3 可知，临界值存在于1.6-1.8 之间，当临界值大于F2，x 收敛于0，增大F2减慢x 的收敛；当临界值小于F2时，x 收敛于1，这使得增大F2反而加快了x 的收敛。从而，增加企业的风险损失的前景价值感知F2，可促进企业更多的采纳绿色生产行为。

图3 企业的风险损失的前景价值感知F2变化对演化结果的影响

2.2.4 绿色行为的采取所付出成本T 其变化对演化结果的影响

从图4 可得，在0.6 的附近存在一个相应的临界值，当T 比其小时，x 收敛于1，此时T 的减少能够更快的促使x 收敛于1。当T 比此临界值大时，x 会收敛于0，但T 减少时能降低x 收敛于0 的速度；所以，帮助企业降低绿色行为成本T 帮助绿色行为采纳。

2.2.5 风险传递系数k 的变化对演化结果的影响

图4 绿色行为的采取所付出成本T其变化对演化结果的影响

由图5 可知，在1.2-1.4 之间存在某个临界值，临界值小于k 时，y 收敛于1，此时增加k 一定程度令y 加速收敛于1。所以，政府在通过加大经济惩罚的力度和制定更加严厉的环境规范政策会相应增加企业对于绿色行为的拒绝产生的环境危害所递送到政府的成本，企业在种种措施下会更加倾向于绿色行为。

图5 风险传递系数k变化对演化结果的影响

2.2.6 y 改变对演化结果的影响

从图6 得知，F2= 1.6 时，临界值存在0.8 附近，临界值大于y 时，x 收敛于0，并且增加y 一定程度减缓x 收敛于0 的速率，反之。所以提升政府积极监管的概率y 比例能够促进企业采纳绿色行为。

综上，由以上绿色行为决策的演化博弈模型和仿真结果可知，企业采纳绿色行为与否在于对其收益和成本的前景价值感知的衡量。基于前景理论和有限理性假设，可从以下方面促进企业的绿色行为：

(1)强化企业的心理预期价值感知

图6 y变化对演化结果的影响

企业的绿色行为是不确定性的风险决策行为，决策者的风险偏好和有限理性会影响决策行为。根据前景理论，决策者面对收益的反应是风险规避，面对损失的反应是风险偏好，并且对损失的感知比对收益的感知更为敏感；决策者往往还会低估事件发生的风险。因此可在一定范围内变动惩罚的大小，通过增加声誉损失、提高准入门槛等方式，增加企业对损失的风险价值感知，或者采取不定期和随机抽查的方式，加大企业对惩罚的心理威慑作用，促进企业的绿色行为。

(2)采取差异化的环境监管政策

考虑到环境监管政策对不同企业绿色行为决策的影响，政府应根据不同性质企业不同阶段需求不同的特点，选择不同的监管强度进行监管。对有违规生产、排放记录的企业，应增加检查频率加大监管力度，对采取绿色行为、声誉良好的企业，可降低监管力度减少监管成本。

(3)建立更为有效的激励和监督机制

有效的激励机制和监督机制可以正向促进企业绿色行为。可更多的激励企业的绿色行为，能够使得绿色行为在激励中不断地改革创新，同时，其采用的科学技术也会越来越丰富，那些选择绿色行为的企业也能够更轻松地获得更大的竞争力，除了常规的税收优惠、环保补贴、财政支持等激励措施，还应当创新激励方式，采取一些增加企业声誉、认证等形式的激励，为企业提供可获得长期竞争优势的愿景。政府的监管不可能做到时刻有效，因此，可考虑多种监管方式的协同，如引入第三方监管，充分发挥环境非政府组织的监管作用。

3 结语

本文创新性地构建了前景理论框架下的绿色行为决策演化博弈模型，更为真实地展现了博弈主体从感知到决策过程中的有限理性，运用前景理论中的价值函数来表示决策主体的得失的心理感知，用决策权重函数来表示决策主体对各自不同策略选择的概率的认知，推导了促进绿色行为发生的四个条件，探讨博弈双方具体何时做出“趋利”的选择，何一时间点选择“避害”的策略，并利用MATLAB 软件仿真模拟了各个参数对演化结果的影响，所得结论更为贴近现实中绿色行为决策主体的行为。