APP下载

PPP项目政府激励与社会资本努力的演化博弈与仿真

2021-05-10刘珈琪刘继才雷晓莹

工业工程 2021年2期
关键词:均衡点决策资本

刘珈琪,刘继才,雷晓莹

(1.西南交通大学 经济管理学院,四川 成都,610031;2.成都理工大学工程技术学院资源勘查与土木工程系, 四川 乐山, 614000)

在公共基础设施领域推广和运用PPP(publicprivate-partnership)项目融资模式对快速推进城镇化建设、完善国家治理体系和治理能力的现代化建设等具有重要的意义。在公共基础设施建设中运用PPP模式引入私人资本,使社会资本和政府部门共同参与项目的融资、建设和运营等活动,不仅能优化项目的融资结构,还能缓解政府的财政压力。同时,私人资本具有的专业技能和独特的管理体系能够提高项目的绩效。然而,随着PPP项目的不断发展,产生了社会资本进入项目公司不努力的投机行为。在实践中,存在诸多社会资本以入股项目公司为契机来获取工程合同款或运营服务合同款的现象,他们在项目操作过程中并不会付出相应的努力水平[1]。当社会资本出现以私利为目标的不努力的投机行为时,项目在运营和维护阶段的成本会扩大,导致项目的整体绩效下降[2]。因此,在项目公司中建立适当的惩罚或监管机制对降低投资者的投机行为风险是重要的。

与传统融资项目相比,政府是PPP项目的发起者、监管者以及主要参与者。在项目采购招标阶段,政府方需要与中标的社会资本签订项目合同。在合同中,各利益主体需要对项目的股权、风险和监管机制等内容进行约定。政府方给予的激励作为监管或促进社会资本付出努力的有效策略之一,是项目合同中的重要条款。由于政府激励的程度和社会资本的努力程度之间存在不对称性(如激励不能满足努力付出的成本或过高的激励导致的超额成本等),为实现各自的效益最大化,两利益群体在订立合同或实践中存在互相博弈的情形。在该博弈过程中,处于非对称信息条件下的政府群体与社会资本群体均为有限理性的决策者[3]。在PPP项目中政府群体以提高公共服务质量为目标,而社会资本主要以实现投资收益最大化为目标,双方在群体决策过程中存在目标导向不一致的现象。在决策过程中,政府与社会资本为实现自己决策效用最大化,会不断学习和改进自己的策略以达到稳定均衡的状态。例如,政府群体在项目开始倾向于给予激励,则社会资本可以选择付出努力以争取更高的激励或奖励;也可以选择不努力,则政府可能会停止激励等措施,也可能会进一步加强激励措施使社会资本认为其可以获得努力后的收益进而转变最初的行为策略。因此,需要研究构建政府激励策略与社会资本努力行为互动的支付矩阵及动态演化博弈模型,分析双方在决策互动中的复制动态和进化稳定性,以探讨政府博弈方与社会资本博弈方的动态选择过程及进化稳定性。研究为合理地建立PPP项目激励机制提供建议。

1 文献分析

PPP项目中激励机制具有加强政府与社会资本合作、促进社会资本付出努力、降低项目风险等效用。王颖林等[2]建立政府激励条件下的效用模型,认为政府采取激励行为可以防范投资者的投机行为,且奖励与惩罚对投资方努力行为的影响有限。在PPP模式下,银行通常作为纯投资者参与项目的融资活动,政府对银行的激励行为不仅可以提高其融资的积极性,减少财政支出,还可以增加项目的产值,以实现双赢博弈[4]。同样地,通过有效的激励和监管也可以缓解项目经理的投机行为[5]。项目经理的博弈策略行为分为短期努力、正常努力和长期努力。在不同行为情境下,不同的报酬激励机制对经理努力水平选择的影响具有显著的差异[6]。同时,基于不完全信息条件下的政府的激励方式还取决于投资方行为的成本函数[7]。除了努力程度和成本外,具有声誉效应的隐性激励机制不仅能够增加政府部门在PPP项目中的收益分享比例,还能够加强投资方的努力行为[8]。虽然,以上研究对影响政府激励方式的因素进行探讨,并通过模型说明政府激励对社会资本努力的正向作用,但均未考虑主体决策的动态特征。

在PPP项目实际决策过程中,政府的激励策略与社会资本的努力水平是非对称信息下的演化博弈过程,诸多学者在研究中并没有对最终决策形成的动态过程作出研究。基于政府与社会资本的委托代理关系,不同观测力度下的代理方的努力水平会随监管力度的上升而变大[9],且政府激励机制涉及的社会资本的努力水平、监督关系、契约关系具有动态性[10]。虽然,王颖林等[11]认为政府与社会资本的决策过程并非静态,并构建基于互惠偏好的动态讨价还价模型,通过模型对比得出只有当政府的互惠偏好程度高于一定值时,政府的激励效用才会产生。但在相关的动态研究模型中,诸多学者只将努力水平作为研究模型的单一变量进行分析,而将政府激励与社会资本努力水平单独划分进行的研究还较缺乏。同时,对政府行为决策的演化博弈分析较多集中在政府的监管与不监管,而对政府激励与不激励的演化博弈分析较缺乏。如浦徐进等[12]分析官员监管与不监管策略和企业生产高低两种产品策略之间的互动过程;于涛等[13]探讨政府和企业之间对产品质量监管过程中的策略选择问题;何雪锋等[14]讨论在项目运营与政府监管的相互作用下,博弈方所选择的不同的非对称演化博弈策略。

为了健全PPP项目中政府方的激励机制,本文基于有限理性下的演化博弈模型,探讨政府方激励策略与社会资本方努力策略之间的复制动态和进化稳定策略,并结合Matlab数值仿真分析直观地反映出不同决策系统下的演化状态。研究结果可揭示个体策略选择对群体策略的动态作用过程。

2 模型构建

群体是个体的集合,同时个体也可以作为群体。在本文中以政府群体和社会资本群体作为博弈双方,将PPP项目中的每一个政府代表看作一个政府群体,每一个社会资本看作一个社会资本群体。政府的策略集合为(激励,不激励);社会资本的策略集合为(努力,不努力)。研究模型以政府方或社会资本方增加的收益为效用函数。对模型参数作如下假设。

政府方对社会资本的激励需要付出激励成本c;只有当社会资本在项目操作中付出努力后才可以节约项目的成本和提高项目的收益。因此,令s代表社会资本付出努力后项目增加的效用(包括节约的成本和提高的收益)。在PPP项目中,政府方不以盈利为目标,而以提高项目绩效和公共服务质量为目标,因此政府方的收益体现在项目质量提高、工期缩短、成本降低,可直接用项目节约的成本或提高的收益来衡量,即政府方增加的收益为s。

社会资本的努力需要付出努力成本为m,获得的收益按项目收益的θ比例分红。当社会资本不努力时,项目出现的损失为l。此时社会资本应对项目的损失负一定的责任,按损失的θ比例进行赔付,并接受项目公司的惩罚,令惩罚为e。假设该惩罚费用用于项目建设等活动,则将该惩罚看作项目的增益。在政府方不给予激励的情况下,社会资本仍付出努力以提高项目绩效时,政府方应对该积极行为给予奖励w,并假设该奖励从项目增益中扣除。并假设当政府给予社会资本激励后才付出努力时,社会资本不会获得奖励。赵明等[15]对激励和奖励的本质作出分析。认为激励与奖励是有区别的,激励是因,在行为发生之前,即为事前约定并兑现;奖励是果,是行为结果导向,即奖励在行为发生后并与行为者的贡献直接挂钩。因此本文基于文献[15]的观点将激励与奖励进行区别,将激励作为事前激励进行探讨,以研究分析政府在决策过程中的激励和奖励的效用差异。

根据演化博弈理论,假设PPP项目中选择给予社会资本激励的政府群体比例为x,不给予激励的比例则为1−x;选择在PPP项目操作过程中付出努力的社会资本群体的比为y,选择不付出努力的比例则为1−y。

基于以上假设,构建双方演化博弈的收益矩阵见表1。

表1 政府和社会资本演化博弈得益矩阵Table 1 Benefit matrix of game between government and social capital evolution

由得益矩阵可得政府博弈方在“激励”与“不激励”策略下的期望得益G1、G2和群体的平均得益 G分别为

社会资本在“努力”与“不努力”策略下的期望得益 P1、 P2和群体的平均得益分别为

根据复制动态的基本原理,基于有限理性博弈方组成的群体中,结果比平均水平好的策略会逐步被更多博弈方采用,则群体中采用该策略的博弈方的比例会发生变化。这种决策者策略的转变是一个渐进的过程,策略的调整速度用生物的进化动态方程表示。因此政府和社会资本非对称博弈进化的复制动态方程分别为

令式(8)中 θs+θl+e−m= f ,则F(y)=y(1−y)(f+w−xw)。

观察 f值,可以发现其为社会资本在非对称信息下努力的净收益(θ s−m)和不努力的期望损失(θ l+e)之和。由于社会资本作为有限理性决策者,在非对称信息下并不知道政府方是否会采取激励策略,且并不知自己是否会获取奖金。因此,θ s−m体现了社会资本在决策中对努力收益的悲观估计,同时基于监管体系下的社会资本方知道当自己不努力时必然会受到惩罚e ,故 θl+e体现了社会资本的对不努力带来的损失的悲观估计。 f值表明,在PPP项目决策中,决策者并不仅仅以单一的投资收益为决策依据,还会以策略带来的价值增值为决策依据。因此 f在该模型中代表了社会资本的努力行为给自己带来的净价值增量。

例如,当社会资本付出努力成本m=150,努力增加的收益为 θs= 100,不努力的损失为 θl+e=70,则努力行为增加的净价值为正20。此时若只按照努力增加的净收益进行决策,则社会资本因为努力成本高于收益而选择不努力。但是,实际决策情形则为社会资本虽努力后亏损50,而不努力则亏损70,因为努力可以节省的成本为20,即此时努力给社会资本带来正20的价值增量。通过以上分析可知,当基于非对称信息下的 f值大于社会资本的努力成本m时,社会资本会选择努力,否则会选择不努力。

3 模型讨论

3.1 稳定性分析

对社会资本的复制动态方程进行分析。若x=(f+w)/w, 那么始终为零,这意味着所有的y 都是稳定状态:如果 x>(f+w)/w, 则 y∗=0是ESS;若x<(f+w)/w, 则y∗=1是ESS。

现对双方的演化系统进行分析。令复制动态方程 F(x)=0 , F(y)=0, 即得系统的5个均衡点分别为(0,0)、(0,1)、(1,0)、(1,1)、5个均衡点均不一定是系统的稳定策略。通过系统雅克比矩阵行列式的值和迹值来精炼系统的稳定策略。令系统的雅克比矩阵为

其中,a11=(1−2x)(yw−c) ; a12=wx(1−x); a21=−wy(1−y) ;a22=(1−2y)(f+w−xw)。

根据5个均衡点可得到雅克比矩阵各元素的取值见表2。其中,p和q表示当均衡点取值为(x0, y0)时雅克比矩阵各元素的取值,

表2 各状态下的元素取值Table 2 Value of elements in each state

系统稳定策略的状态需满足雅克比式的2个条件:行列式的值d et J=a11a22−a12a21>0 ; 迹值trJ=a11+a22<0。 对均衡点(x0, y0),因为 a11+a22=0,故该点不是ESS。由表2中各元素的取值,对参数w、c、f的大小进行如下讨论,并在数值仿真分析中给定初始值x = y = 0.2、0.4、0.5、0.6、0.8。

3.2 参数讨论和数值仿真

1) 当社会资本期望的努力价值增值为正,即通过努力认为自己可以获得收益时,进行如下讨论。

(1) c>w>0, f =θs+θl+e−m>0时,4个均衡点的状态分析见表3。

表3 4个均衡点的状态(c>w>0, f>0)Table 3 The state of 4 equilibrium points (c>w>0, f>0)

用Matlab得到该系统下双方决策的演化趋势见图1。

图1 c = 5, w = 2, f = 3时双方决策的演化趋势Figure 1 The evolution trend of two sides' decision making when c = 5, w = 2, f = 3

从表3和图1可知,当政府事前激励成本高于事后奖励,且社会资本努力行为的增长价值为正时,政府群体倾向于不给予激励,而社会资本倾向于付出努力对项目进行操作。由于事前激励属于静态的激励方式,不具有灵活性,而动态的事后奖励可以依据社会资本的努力程度和工作绩效进行调整,弹性较大,有利于政府或项目公司对社会资本进行动态的监管。这表明政府方更偏好于事后奖励。由于在诸多研究中,如马君[16]、Malik等[17]、Gerrish[18]将奖励作为激励的一种方式进行激励机制的研究,因此政府方更加偏好于事后奖励的动态激励方式。

(2) w>c>0, f =θs+θl+e−m>0时,4个均衡点的状态分析见表4。

表4 4个均衡点的状态(w>c>0, f>0)Table 4 The state of 4 equilibrium points(w>c>0, f>0)

在此系统下双方决策的演化趋势见图2。

图2 w = 5, c = 2, f = 3时双方决策的演化趋势Figure 2 The evolution trend of two sides' decision making when w = 5, c = 2, f = 3

从表4和图2可以得出,当政府给予的事后奖励大于事前激励,且社会资本努力行为的增长价值为正时,政府群体倾向于激励,社会资本群体的选择均倾向于付出努力。在此系统中,政府给予社会资本一定激励,期望并促使社会资本付出努力,并保证在社会资本付出努力后给予其相应的奖励。该演化过程为良性的循环过程,可以保证PPP项目高绩效、高质量的完成,且处于该状态的双方群体的收益都将达到最大。

2) 当社会资本认为自己努力的价值f =θs+θl+e−m<0时 ,若 c>w>0,政府方初始决策的激励成本高于奖励,由情景(1)和(2)可知,政府方会更加偏向于给予结果导向的奖励措施来激励社会资本的努力行为。在该情形中,由表2可知 f+w值无法确定,导致雅克比行列式的值和迹均不确定,此时社会资本在努力决策过程中会犹豫不决。因此该情景下不存在稳定策略点ESS。

3) 若社会资本在决策过程中认为政府给予的事后奖励能够弥补自己付出努力后的亏损,即 f<0,且f+w=θs+θl+e−m+w>0。此时对不同参数大小进行讨论。

(1) c>w>0, f<0, 且 f+w>0时,4个均衡点的状态分析见表5。

表5 4个均衡点的状态(c>w>0, f<0, f + w>0)Table 5 The state of 4 equilibrium points(c>w>0, f<0, f + w>0)

根据初始值对演化过程进行仿真,见图3。

图3 c = 5, w = 3, f = −2时双方决策的演化趋势Figure 3 The evolution trend of two sides' decision making when c = 5, w = 3, f = −2

在该系统中政府群体最终会选择不给予激励,社会资本会选择付出努力。由于政府事前激励成本较高,促使社会资本愿意付出努力以争取不确定的奖金。在后续决策中,由于政府方偏好于采用绩效奖金的方式来维持社会资本的努力行为。因此当社会资本得到的事后奖励能够弥补自己付出努力后的亏损时,会持续付出努力,而政府方则会放弃不具有弹性的事前激励方式。

(2) 当w >c>0, f<0 且f+w=θs+θl+e−m+w>0时。4个均衡点的状态分析见表6。

表6 4个均衡点的状态(w>c>0, f<0, f + w>0)Table 6 The state of 4 equilibrium points(w>c>0, f<0, f + w>0)

此时为了清晰反映系统趋势图,只选取x=y=0.2、0.5、0.8,绘制仿真图4。

图4 w = 5, c = 3, f = −4时双方决策的演化趋势Figure 4 The evolution trend of two sides' decision making when w = 5, c = 3, f = −4

在此系统中政府方给予社会资本奖金高于激励,且社会资本初始的努力价值增值为负,故社会资本会选择不努力的行为。由于社会资本不努力,使得政府方认为事前激励的效用为负,而转变激励方式,决定给予社会资本奖励。若社会资本在分析中认为该事后激励能给自己带来收益,则会转变态度选择付出努力。若政府方了解社会资本的动机是获取足额收益后又不愿意给予太多事后激励,且社会资本并不是主动付出努力,又会导致政府放弃激励,则整个系统将处于波动的状态。由图4可以看出激励的政府群体比例与努力的社会资本群体比例的变化趋势基本一致。该过程的所有决策均是以博弈对方的决策和态度为参考依据,若社会资本从开始将目标倾向于公共产品服务的质量,则其会主动付出努力,而政府方也会为该表现给予事后激励,这将是双赢的局面。同时,这也反映了在选择合作方式时,应该综合考虑合作者在以往工作中的态度,目标导向和信用等问题。

4) 当社会资本认为政府不给予其奖励或认为奖励不足以弥补付出努力后的亏损。即 f+w<0,作如下讨论。

(1) 当 c>w>0, f+w<0,4个均衡点的状态分析见表7。系统下双方决策的演化趋势见图5。

表7 4个均衡点的状态(c>w>0, f + w<0)Table 7 The state of 4 equilibrium points (c>w>0, f + w<0)

图5 c = 5, w = 2, f = −4时双方决策的演化趋势Figure 5 The evolution trend of two sides' decision making when c = 5, w = 2, f = −4

(2) 当 w>c>0, f+w<0时,4个均衡点的状态分析见表8。系统下双方决策的演化趋势见图6。

以上2种情形的稳定状态均为政府群体倾向不激励,社会资本群体不努力。这种状态属于恶性循环,将导致双方的利益受损。由于社会资本在决策选择过程中发现,即使政府方给予了奖励,还是不能弥补努力行为付出的成本,因此其会选择不努力。此时政府也因为社会资本的不努力而不给予激励。为了避免该情况的发生,政府群体应在给予低的事前激励并向社会资本保证,根据其努力水平给予的事后奖励激励能够弥补其努力成本,这样使决策状态向情景(2)靠近,以形成双赢的局面。

表8 4个均衡点的状态(w>c>0, f + w<0)Table 8 The state of 4 equilibrium points(w>c>0, f + w<0)

图6 w = 5, c = 2, f = −6时双方决策的演化趋势Figure 6 The evolution trend of two sides' decision making when w = 5, c = 2, f = −6

综合对以上各参数状态分析,发现当社会资本的奖金与努力的价值增量 f+w一直小于0时,系统稳定状态为(0,0);当政府的激励成本高于奖励(c >w>0) ,且社会资本通过努力能够获取收益(f+w>0)时,系统稳定状态为(0,1);当政府事后奖励成本大于事前激励成本(w >c>0)时,且社会资本努力的价值增值( f>0)时,系统的稳定状态为(1,1);当政府事后奖励成本大于事前激励成本(w >c>0),社会资本努力的价值增值( f<0)且事后给予的奖励能够弥补努力成本( f+w>0)时,系统处于振荡状态,无稳定策略。

4 总结

本文通过演化博弈模型,探讨政府方和社会资本方在不同初始策略下的复制动态和进化稳定策略。研究发现,政府方的激励方式可以分为事前激励和事后奖励2种激励方式,并认为激励与奖励既有策略效用上的差异,同时奖励又属于事后激励。研究结合数值仿真分析,直观地反映了个体决策对群体决策的影响过程,并对政府和社会资本间的演化状态给予了直观的解释。

研究结果表明,当社会资本不付出努力行为时,政府方一定不会给予激励。相比于事前激励的方式,政府方更加偏好于事后奖励的激励方式。动态的具有弹性的事后奖励能够防止社会资本的投机行为,约束社会资本的消极行为,且该方式更能够显示出政府的激励效用。研究发现和完善了关于PPP项目中政府与社会资本之间的博弈关系,并从浦徐进等[12]、于涛等[13]以及何雪锋等[14]对政府监管的策略选择转移到对政府激励的策略分析。与王颖林等[2]、孔峰等[5]以及Kong等[6]静态的考虑投资者不努力的变量的分析相比,本文考虑了决策者行为选择的动态性,并发现政府事前激励与事后奖励的差异。在PPP项目运作过程中,政府方在行为发生前应该给予社会资本适当的激励,促使社会资本愿意付出努力,随后在决策过程中,政府应根据社会资本的努力水平和工作绩效采取事后奖励的激励方式对社会资本进行监督。目前社会企业的事后奖金制度就是一种促使员工努力工作的更有效激励方式。研究结论为政府方设置合理的PPP项目激励机制提供建议,并为政府和社会资本策略的演化提供指导方向。

猜你喜欢

均衡点决策资本
为可持续决策提供依据
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
决策为什么失误了
资本策局变
三级供应链投资模型的评价管理
第一资本观
VR 资本之路
均衡点移动的直观图示及其例析
“零资本”下的资本维持原则
不确定条件下n人非合作博弈均衡点集的通有稳定性