多主体协同社会治理的随机微分博弈模型
2023-01-02张垚婷张成科朱怀念
张垚婷,张成科,朱怀念
(1.广东轻工职业技术学院,广东 广州 510300;2.广东工业大学 经济与贸易学院,广东广州 510520)
一、引言
2017年10月,党的十九大报告的第八部分再次用一个完整的大篇幅明确提出要“提高保障和改善民生水平,加强和创新社会治理”,并就如何“打造共建共治共享的社会治理格局”指明了战略方向,即:加强社会治理体系建设,推动社会治理重心向基层下移,发挥社会组织作用,实现政府治理和社会调节、居民自治良性互动[1]。如何在中国共产党领导下完善政府负责、社会协同、公众参与、法治保障的社会治理体制?是一个具有重大现实意义的学术问题。本文将社会治理当中政府、社会组织和公众这三大主体视为博弈参与人,通过建立随机微分博弈模型,分析三方协同共建共治共享的社会治理机理。
事实上,如何创新社会治理一直是学术界广泛讨论和研究的问题。王浦劬基于中国共产党治国理政理论和现实国情,分析解释了国家治理、政府治理和社会治理的基本含义[2]。张振波认为多元协同社会治理正逐渐由理论构化变为一种现实可能,分析了多元协同社会治理的生成逻辑及构建路径,强调需要通过制度规约与政府引导最大限度地发挥协同治理的社会治理效能[3]。邓建高等对社会治理协同创新系统的内涵、框架和结构进行了系统研究,丰富了社会治理协同创新的基本理论[4]。张康之通过比较分析,认为在社会治理体系中,多元主体共同担负着社会治理的职责,政府则为多元治理主体所构成的社会治理体系中的一部分[5]。胡万进和童星指出社会治理过程中社会工作发展的方向是社会治理主体的分工协作,应强化政府的社会治理与公共服务职能,形成多元协作的良性社会治理运行模式[6]。史传林分析了社会治理中政府与社会组织的合作绩效问题,发现合作治理对政府、社会组织,乃至社会治理的绩效改善均有积极影响[7]。Brookes和Grint认为政府绩效的取得既决定于组织的科学管理,也取决于利益相关者的通力合作[8]。Reddel借鉴网络治理的概念,提出了重构国家—社区关系和改善社区成果的框架,并就如何执行这个框架提出了可行的社会治理方法建议[9]。Folke等探讨了社会生态系统的适应性治理问题,认为这种适应性社会生态系统是作为社会网络自组织的一个有弹性的社会生态系统,可能会把危机当作一个机会转化为一个更为理想的状态[10]。张红方等指出,我国正处于社会主义市场经济和信息网络化时代,个体、组织互相联系,社会的交际网趋于复杂化,公共危机事件频发。在这样的背景下,单一的社会治理主体难以有效进行全面治理,而是需要社会多方主体共同参与,在长短效应机制的配合下达到标本兼治的效果[11]。周红云结合中国社会治理理论与实践,系统研究了社会治理理论、创新实践与评估三大主题[12]。张乾友指出,社会治理主体的多元化发展需要政府主动作为,政府要促进社会组织参与到社会治理中去,要以服务的意识履行社会治理职能,要与其他社会治理主体谋求合作[13]。刘英基指出,在大数据时代背景下,要综合运用复杂系统理论和协同学原理研究我国社会冲突治理问题,形成协同治理合力、构建“整体型政府”、实现多元治理主体等社会治理模式的新路径[14]。
以上学者大多数通过传统社会科学的研究方法对社会治理问题进行定性研究,定量研究还不多见,而通过数理化建模的定量研究已在社会科学领域广泛使用。为此,范如国在复杂网络结构范型下,综合运用多学科理论和方法对中国社会治理的主要问题及其协同创新机制展开了详尽分析。特别是,该研究通过构建一个确定型微分博弈模型,对政府、社会组织和公众三方共同参与的社会治理协同创新问题进行了分析,发现多主体的协同合作对社会治理具有积极的影响[15]。但该博弈模型没有考虑由于环境和社会事务的复杂性和不确定性带来的随机波动。而社会系统主要由具有目的性与主动性的适应性主体构成,这些适应性主体的决策过程会受到各种随机干扰。这些干扰会导致博弈均衡结果的不确定性,因而考虑随机干扰下的博弈问题可能更具有理论意义和现实价值。
此外,协同社会治理强调多元主体协同合作,改变政府主导的单一中心模式,谋求与其他社会主体的协同合作[5]。博弈论作为分析决策主体策略互动的有效工具,利用其分析社会治理中多主体间的互动合作,可以为减少政策失误,优化政策参量,提供有说服力的依据[16]。
基于上述分析,本文在范如国[15]研究的基础上,综合运用随机微分博弈理论研究多主体协同社会治理问题,探讨现代社会治理中的三大主体——政府、社会组织和公众在动态不确定环境下的行为决策,以期能丰富现代社会治理的基本理论,为创新社会治理方式提供理论参考。
二、模型建立
社会的产生和演化由社会主体之间的博弈行为驱动,社会治理研究本质上是分析社会主体之间的博弈问题。在现代社会治理协同体系中,治理主体呈现出多元化的特征,政府职能部门、社会组织和公众群体都可以是社会治理的主体,各主体在治理过程中的职能和作用也不尽相同。其中,政府作为主体,确保协同社会治理的高水平与高效率;社会组织是公益型主体,是社会自我管理的重要力量;公众群体作为社会治理的最基本单位,是社会治理的参与型主体。下面,我们将结合博弈理论,分别从非合作博弈与合作博弈两个视角,对政府、社会组织和公众三方的社会治理协同作进一步分析。
(一)模型基本假定
本节给出博弈模型中各个变量和相应参数的具体含义,在不改变模型经济意义的前提下,本文做出以下假设:
1.博弈开始的时间为t0,结束时间为T,在整个博弈持续期内[t0,T],政府、社会组织和公众三方作为博弈的三类主体,为了提高其社会存在状态水平,持续地进行资源投入。如政府可持续加大购买服务等方面的资金投入;社会组织吸纳慈善资源、社会资源或是志愿性资源,可进行持续的慈善捐赠;公众则可以将其参与社会治理的公共数据进行共享。
2.在博弈持续期内[t0,T],政府、社会组织和公众三方的收益均可用货币来衡量,因而后文所讨论的问题为支付可转移的博弈问题。
3.在博弈持续期内[t0,T],政府、社会组织和公众三方按无风险利率折现其收益。
(二)状态变量
假设主体i∈{1,2,3}在时间点sÎ[t0,T]投入资源u1(s)⊂R+,以提升其社会存在状态水平xi(s)ÌR+,因而xi(s)随时间的动态变化可以表示为
其中zi(·)为标准的维纳过程,为便于分析,假设对任意的i≠j,zi(·)和zj(·)相互独立。αi[ui(s)xi(s)]1/2表示由于主体i投入资源ui(s)对xi(s)变化所产生的正面影响,
δi>0表示主体i的社会存在状态水平的衰减程度,σixi(s)dzi(s)为噪声项,表示主体i的社会存在状态水平xi(s)在变化过程中所受的随机干扰。
(三)目标函数
主体i∈{1,2,3}的控制变量是其资源投入ui(s),目标是最大化其期望收益。在整个博弈过程[t0,T]中,主体i的期望收益为
其中Et0为时间点t0时的期望值,Pi、ci和qi都是正常数,r为给定的无风险利率。Pi[xi(s)]1/2-ciui(s)表示主体i在时间点sÎ[t0,T]的瞬时收益,其中Pi[xi(s)]1/2表示净收益,ciui(s)表示投资成本。qi[xi(T)]1/2表示终端收益,收益的大小取决于当时的社会存在状态水平,常数qi表示主体i的资源投入结束时,其社会存在水平对于未来的潜在收益的边际影响。
式(1)—(2)定义了以ui(·)∈R+为控制变量,xi(·)∈R+为状态变量,Ji(·,·,·),i∈{1,2,3}为目标函数的三人随机微分博弈。本模型中,我们希望博弈人的控制策略能够根据系统状态的变化进行调整,尤其当干扰出现时,控制策略能够削弱干扰,因而本文研究模型的反馈控制策略,也称闭环控制,该策略被越来越多地用来分析经济模型[17]。下文中我们将研究非合作博弈与合作博弈两种情形下的博弈均衡解,进行以上博弈分析的目的是为了比较三方在各自为政与协同合作两种情形下的行为决策,从而为三方的理性决策提供参考。
三、博弈均衡
(一)非合作博弈
本部分将在非合作框架下讨论博弈的均衡解,参考Zhang等[18],博弈问题(1)—(2)的反馈Nash均衡解可以表述为:
对式(3)右边最大化,解得
将式(4)代入式(3),化简整理得
参照范如国[15]对解形式的假设,我们在随机情形下求解式(5)可得如下结论。
命题1:若式(5)存在下述形式的解
其中
则博弈问题(1)-(2)的反馈Nash均衡为
根据式(8)可得如下性质:
1.主体i∈{1,2,3}的资源投入与Ai(t)的值呈正相关关系,随着Ai(t)值的增加而资源投入增加,反之亦然。
2.主体i∈{1,2,3}的收益也受到Ai(t)的直接影响,二者呈正相关关系。
为了得到i∈{1,2,3}主体的最优状态轨迹,将式(8)代入式(1),得主体i∈{1,2,3}的最优状态可以表示为
令yi(t)=[xi(t)]1/2,i∈{1,2,3},使用Itô引理可将式(9)重新表示为
式(10)是三个独立的线性随机微分方程,可以利用标准方法进行求解。将式(10)的解记为{(t),(t)},再令xi=yI2i,则得到最优的状态轨迹为
由式(11)即可确定博弈系统的最优状态轨迹随时间的演化情况。
(二)合作博弈
当政府、社会组织和公众三方协同合作时,三方都为提升社会存在状态水平投入资源,资源的共同投入产生了协同效应,因而主体i∈{1,2,3}的社会存在状态水平xi(s)的动态变化可以表示为
三方协同合作将形成一个整体,以合作的整体收益最大化为目标共同确定的最优值,合作的整体收益可表示为
应用Fleming[19]中所述的随机控制方法求解上述合作博弈问题(12)—(13),反馈策略集{ui**(t)=ψi(t,x1,x2,x3),i∈{1,2,3}}构成博弈问题(12)—(13)的反馈Nash均衡解,如果存在连续可微的函数W(t1,x2,x3):[t0,T]×R+×R+×R+→R,满足下述偏微分方程
对式(14)右边最大化,解得
将式(15)代入式(14),化简整理得
求解式(16)可以得到下述结论。
命题2:若式(16)存在下述形式的解
其中
则博弈问题(12)—(13)的反馈Nash均衡为
将式(19)代入式(12),得主体i∈{1,2,3}的状态轨迹的动态系统可以表示为
令yi(t)=[xi(t)]1/2,i∈{1,2,3},则可将式(20)表示为
式(21)是一个标准的线性随机微分方程组,可以使用标准的求解方法进行求解。将式(21)的解记为{y*1(t),y*2(t),y*3(t)},再令xi=y2i,则得到最优的状态轨迹为
在合作情况下,三类主体按照非合作模式下的收益比例,对整体收益进行分配。令Wi代表合作博弈中主体i∈{1,2,3}的收益,则有
四、均衡结果的比较分析
前文已得到政府、社会组织和公众三方在合作博弈与非合作博弈下最优解的解析表达式,囿于其复杂的形式,本节采用数值模拟的方法,分析政府、社会组织和公众三方在合作博弈与非合作博弈两种模式下最优解的特征。为简化分析过程,模型中各参数赋值情况如下表1所示。
表1 数值模拟参数取值表
(一)影子价格的比较
“影子价格”是指在其他条件不变的情况下,单位资源变化所引起的目标函数最优值的变化,因而本文中影子价格描述了社会存在状态水平为博弈人带来的边际收益,具体取值可用博弈人的收益函数对“状态变量”求一阶偏导数表示。
由前面的分析可知,Ai(t)和A*i(t)分别代表t时刻主体i∈{1,2,3}在非合作博弈与合作博弈两种情形下其社会存在状态水平的影子价格。将表1中的参数代入式(7)和式(16),利用Matlab进行数值模拟,得到了两种不同博弈模式下,Ai(t)和A*i(t),i∈{1,2,3}随时间的取值变化,如下图1所示。
图1 不同博弈模式下和的比较
(二)资源投入和社会存在状态水平的比较
在博弈均衡状态下,三类主体的资源投入和社会存在状态水平随时间的变化趋势,如下图2和图3所示。
图2 不同博弈模式下资源投入的比较
图3 不同博弈模式下社会存在状态水平的比较
从图2和图3的数值模拟结果可以看出,当三类主体协同合作时,每一类主体的资源投入和社会存在状态水平均高于非合作时的情形。这是由于在三类主体协同合作时,政府、社会组织和公众同时参与到社会治理中,三者相互协同合作,促使各类主体投入更多的资源,进而提高了社会存在状态水平,三者都获益。
管理启示1:在面对纷繁复杂的社会信息环境下,各自为政追求自身利益最大化的社会治理主体的“理性”博弈人的“最优”选择并非是最优的(源于其信息是不完全的,但却错误地当作完全信息模式进行选择),只有三者相互协同合作,加强各主体之间的信息共享,加速各主体之间资源的相互流动速度,才能实现共建共治共享的社会治理格局。
(三)总收益的比较
图4为三类主体总收益示意图,每个子图中两条曲线,上面的曲线代表合作博弈下主体的总收益,下面的曲线代表非合作博弈下主体的总收益。在合作博弈下,各类主体获得的收益比非合作博弈下的收益都大,而且随着时间的演进,两者之间的差距会越来越大,说明三类主体都有协同合作的动机。
图4 不同博弈模式下总收益的比较
管理启示2:在面对纷繁复杂的社会信息环境下,社会治理当中的各个理性主体博弈人都有协同合作的利益驱动动机。
五、结语
本文利用随机微分博弈理论研究了多主体协同社会治理问题,建立了一个随机微分博弈模型,运用动态规划原理,分别在非合作博弈和合作博弈框架下,得到了社会治理主体最优博弈策略的显式表达,并借助数值模拟仿真对两种博弈模式下的均衡结果进行了比较。研究发现,在协同合作博弈下,三类治理主体对社会治理所投入的资源、获得的收益及社会存在状态水平均高于非合作博弈情形,且随着时间的推移,两者之间的差距会越来越大,这也进一步说明社会治理主体在参与社会治理的过程中采取协同合作的重要性。在非合作模式下,社会治理主体各自为政,“理性”的博弈人在各自的信息集内,选择“最优”的策略,然而,由于社会信息的纷繁复杂,博弈人之间常常出现信息不对称的情况,又或者博弈人所获得的信息是不完整的,且错误地把不完整信息当作完整信息模式进行处理,此时,其选择的策略往往偏离了“最优”。为了促进社会治理中多主体的协同,可通过采取一定的行政约束手段,加强各主体之间的信息共享,加速各主体之间资源的相互流动速度,并努力将各主体分散的利益诉求整合为一个群体的共同利益诉求,通过多元主体之间的利益博弈,实现各主体的利益均衡以提高社会治理的效率。