公众合作与人类卫生健康共同体建设的演化博弈分析

2023-02-16姜雪晴

西安交通大学学报（社会科学版） 2023年1期

李婧，姜雪晴

首都经济贸易大学经济学院，北京 100070

新冠肺炎疫情的暴发是第二次世界大战结束以来最严重的全球公共卫生突发事件之一，对人类健康和经济增长造成前所未有的损害，共克时艰成为恢复生产和生活秩序的关键。2020年5月18日，习近平总书记在第73届世界卫生大会开幕式上呼吁各国共同构建人类卫生健康共同体，反映了全球抗击公共卫生危机的强烈愿望和对人类命运共同体的基本诉求。

然而，各国政府和公众对公共卫生危机的认知和反应是不同的。牛津大学对新冠肺炎疫情期间政策响应的追踪结果显示，自2020年以来，中国各省一直保持着轻级措施和指导方针的基线，例如核酸检测、佩戴口罩和检测体温等要求[1]；美国各地区的抗疫严格程度和政治差异一直存在，东北部和民主党领导的州采取了比中西部和共和党领导的州更严格的防疫政策，且自2021年初以来，对新冠肺炎疫情的政策反应程度降低[2]。舆观(YouGov)调查网对疫情下的行为追踪结果显示，2020年7月之前，英国人戴口罩的比例尚不到40%；意大利在2020年3月9日宣布“封城”之后，公共场所戴口罩的人数快速增加，之后一直保持不低于80%的戴口罩率(1)Personal measures taken to avoid COVID-19[EB/OL]. (2021-03-07) [2021-09-08]. https://yougov.co.uk/topics/international/articles-reports/2020/03/17/personal-measures-taken-avoid-covid-19.。由此可见，政府的权威性、规章制度的明确统一性、监督的力度和个人习惯等因素可以影响公众对公共卫生管理的认知和行为选择。

应对公共卫生危机需要庞大的公共服务支出，包括增加医疗卫生投入、保障居民的基本生活需求和为企业提供融资。许多发达国家开始实施全民基本收入式的经济救助政策(2)全民基本收入是由政府直接平等发放给所有公民财政补助的一项制度安排，帮助维持其基本生活，人人有份。。如2020年3月27日，特朗普签署2万亿美元经济救助法案，其中年收入低于7.5万美元的每个单身成年人均可获得1 200美元的援助[3]。研究表明，经济合作与发展组织(OECD)为抗击疫情将产生至少17万亿美元的额外负担[3]，其后果是发展中的重债国经济陷入严重的衰退，疫情的疤痕效应(scarring effect)可能持续存在(3)疤痕效应形容低迷的宏观经济环境对劳动力市场产生长期的负面影响，这里指疫情下失业的增加使未来失业的可能性增加或后续工资减少。。国际货币基金组织2021年10月发布的《世界经济展望》显示，2022年全球实际GDP增速预测值显著低于疫情前水平，发展中国家尤甚。然而，病毒的顽固和变异使抗疫异常艰难。当前，新冠病毒变异毒株迅速在全球传播，全球经济和生活秩序恢复需要更长的时间。因此，提高公众防控意识、支持政府防疫措施、确保公众合作参与是实现疫情成本最小化的关键。

达成合作和集体行动是经济学研究的重要问题。奥尔森[4]62-67指出，大多数情况下，小集团比大集团更有凝聚力，更具有效性。在国际社会这个“大集团”内部，虽然各国和地区具有共同的利益追求，但并不一定会自愿和自动地组织起来采取集体行动。应对新冠肺炎疫情作为一项集体选择，起先是权宜之计，而后成为惯例，最后成为决定经济绩效的制度安排[5]118-123。中国取得的抗疫成果来之不易，得益于中国自上而下的统一行动。首先是有法可依。《中华人民共和国传染病防治法》《突发公共卫生事件应急条例》等为疫情治理提供了可靠的法律法规依据，政府可依法应对突发公共卫生事件，对不主动及时如实报备、不按照规定居家健康监测或集中隔离、不配合防控措施和不配合调查等妨碍疫情防控工作的行为依法予以严惩。公民能够自觉做到不聚集扎堆、配合体温检测、出门戴口罩等防控措施就是守法遵规。可以说，法治正在成为中国全民战“疫”的公约数以及同心抗疫的关键词(4)在战“疫”大考中不断进步：中国抗疫治理能力的生动实践[EB/OL]. (2020-04-28)[2021-04-26]. http://politics.people.com.cn/n1/2020/0428/c1001-31690423.html.。其次是公众积极合作。公民能够自觉做好防护、保持社交距离，这些要求起初都是社会倡导，随后成为疫情期间的行为准则和公民习惯。政府号召力作为一种柔性力量，凝聚、动员并引导各个阶层、各类群体和各方力量参与到疫情防控工作中。中国正是以这种刚柔并济的方式较早形成了稳定且有效的全民抗疫模式。政府依法治理、社会正面倡导、公民积极响应是中国战胜疫情的“三重奏”。2020年10月国际货币基金组织发布的《世界经济展望》指出，较早采取积极抗疫措施的国家承担较小的疫情成本，较快地恢复了社会经济秩序，实现复工复产。中国也因此取得了2020年全球唯一经济正增长和2021年经济复苏企稳的成就。

当前，世界各国抗击疫情基本上还是以自救为主，将中国抗疫的举国体制，特别是将公众合作的经验分享给全世界，是实现国际间守望相助、取得抗疫胜利的关键。为此，本文将新冠肺炎疫情作为公共卫生事件的典型案例，基于演化博弈模型，探讨在零约束和惩罚机制下的不同演化稳定策略，研究公众在疫情期间行为选择的不同场景，提出建立全球卫生健康共同体的合作机制。

一、问题描述和研究假设

(一)问题描述

新冠肺炎病毒传染率高、隐蔽性强、影响范围广，新冠肺炎疫情是一场具有典型特征的公共卫生危机。公共卫生事件中的公众合作博弈适用于新冠肺炎疫情下公众选择的场景。在社会倡导下，个人有自主权选择合作策略(共同参与防护，如戴口罩、测体温、居家隔离等)或非合作策略。非合作情况下公众感染病毒的风险增加，地区的疫情防控局势持续紧张，社会成本增加。但某些人也会采用非合作策略，即利用“搭便车”享受疫情风险降低的好处。

演化博弈模型最初是为了解决进化生物学中的实质性问题产生的[6]。在生物学中，模型自然地假设动物短视、随机匹配和遗传传播[7]。演化博弈论的优势体现在三个方面。一是突破了传统经济人假设。传统博弈理论认为经济人是完全理性的，而演化博弈对行为人理性的要求较低，即有限理性，如自然界的动物群体，有能力学习或模仿，这一假设符合当前社会现实。在该模型中，行为人总是缺少确定或完备的信息，缺少预见、优化分析与决策能力，但是他们会通过对上一期的学习和模仿决定本期的选择，个体的选择过程受周围环境影响，最后差异化的个体趋向于选择同一个策略，实现系统均衡。二是关注重复博弈，即动态过程。静态博弈是一场所有博弈方同时或可看作同时选择策略的博弈，是类似田忌赛马的一次性博弈，而演化博弈是一场重复博弈，用动态的框架来分析系统均衡及达到均衡的过程，从而更准确地描述系统的发展变化。三是可呈现动态调整过程和路径依赖。传统博弈强调行为主体达到的是瞬间均衡，而演化博弈下的均衡是在多次博弈后实现的，整个过程不断地进行动态调整，且存在路径依赖。因此，演化博弈在模拟实际经济问题方面有相当大的潜在优势，会比传统博弈模型提出更丰富的预测[7]。

此外，演化博弈还具有适用于研究群体行为特征的其他优势。教育心理学认为，行为人在“处群”中才能学习和模仿，即“相观而善”。同时，大规模行为人的参与可以容纳个别参与者的突变行为。正如在生物进化中，只有一种基因的突变在种群中流行时才会持续存在。本文选择演化博弈模型来分析公众合作，正是基于其在行为人假设、动态模拟等方面的优势。在研究一国的公众合作时，个体的自我防疫活动会形成行为的自动化序列，最后演化发展成集体行为，而集体的行为不会突然发生变化。可见，演化博弈模型恰好适应本文分析的场景。

演化博弈论应用范围广泛，特别适用于研究不同场景下的社会合作。例如，Zhang等[8]曾运用该假说研究绿色发展中的合作问题，证明了若要保证地方政府间合作治霾的稳定性，上级政府的监管和行政处罚是必须的。也有研究将该模型应用于国际合作领域，如李鹏[9]基于合作意愿差异化的视角，利用该模型判断中国与中亚各国家能源合作的可能性，得出需要重点加强中国与哈萨克斯坦合作的结论。此外，演化博弈模型还可用于讨论企业决策，如孔令夷[10]应用演化博弈工具研究了非对称内外资方专利权交易和商业化应用的合作行为，以及不同成本、不同资助等条件对双方互惠交易的影响。基于以上研究，本文将继续发挥演化博弈模型的优势，将合作场景拓展到一国之内的公共卫生合作，并从单个民众的选择出发，探索微观行为特征及导致的宏观结果。

(二)研究假设

基于以上分析，本研究有以下前提假设：

假设1：一国之内存在两个群体的博弈。

异质性是演化模型中的重要因素。个体虽然众多，但只有合作或不合作两种选择，该研究可简化为两个群体之间的双方博弈。两个群体的划分是随机的，但最终形成的两个群体肯定存在差别。正如同样的居家隔离场景对不同的人意味着不同的成本和收益，这是将现实中的个体差异凝聚为两个群体的异质性。这样既考虑了公众间的差异，又能简化模型使二维演化博弈模型适用于合作场景，满足研究需要。

假设2：个体通过“搭便车”获得的收益比例是相同的。

在“搭便车”的假设基础上，本文继续假设“搭便车”收益占社会总收益的份额不变。首先，在一个复杂的群体系统中，社会很难监测到每个人的行为，社会公众是一个共同体，疫情的蔓延干扰每一个人的正常生活，产生不必要成本，控制疫情自然是群体诉求。然而，抗疫成功后的整体收益是公共可分的，人人有份，因此总有些未严格自我防护的“投机者”幸运地享受到疫情管制放松后自由出入和经济复苏的社会收益。“搭便车”问题威胁群体联盟的稳定性[11]205-221。本文在此基础上假设“搭便车”获得的收益比例不变，这说明社会整体收益越高，“搭便车”收益也越高。两者的线性关系简化了“搭便车”收益的函数形式，方便支付矩阵的计算，且这种函数形式的变化不影响整体分析的逻辑。

假设3：研究区域是一个封闭的系统。

本文排除系统外部因素的影响，只讨论一国内部博弈，假设境外输入可控。事实上，严防境外输入本就是现实中的防疫要求。自2020年2月起，由于国际旅行通道限制，跨国人员流动有限，防疫重点是本土疫情，这一假设符合中国的抗疫实际。

假设4：个体之间不存在惩罚或奖励机制。

强调参与者受到的惩罚或者激励只来自第三方，包括不限于政府、社区对不合作者的惩罚，不考虑参与者之间的互相评价机制。合作方不会对非合作方进行道德评判、施加舆论压力等。首先，由于个人隐私信息受到保护，因此人与人之间互相不了解具体行程及健康情况。其次，在公共场合，通常相关单位或部门会安排专门的工作人员对佩戴口罩和测量体温进行监督和管理，如地铁和公交车的执勤人员。当前，有很多场合还会免费发放口罩，体现防护第一的理念与规则。部门管理表现得比个人之间的互相监督及评价更加突出，是防疫强调的重点。诚然，在防疫过程中，其他人的负面评价能一定程度约束不合作者，增加其拒绝合作的成本，但从中国的防疫经验来看，普通民众相互评价总是出现在疫情暴发后，如埋怨感染者出行时间不合适、不该聚会等。

假设5：个体感染病毒的可能性相同。

设定每个人感染新冠肺炎病毒的概率是一样的，不考虑个体间年龄、健康状况等差异。假设疫情传播速度很快，每个人几乎都会被感染，且被感染的概率趋于一致。

(三)变量设定

本文所有变量的定义和取值范围见表1。

表1 变量设定

首先，因两个群体之间存在异质性，疫情防控的态度、采取的措施、社会角色都不相同，所以从整体收益中获得的比例也不一样。若整体收益为1，将获得较高收益的群体记为A，其异质性程度为m，合作时获得的收益为m；将获得较低收益的群体记为B，其异质性为1-m，合作时获得的收益为1-m。数量关系上，0.5≤m<1，0<1-m≤0.5。

然后，考察某一群体内部决定合作或非合作的概率。设群体A选择进行自我防护的概率为x，群体B的合作概率为y。变量x、y的数值会随着博弈过程的动态演进发生变化。当两个群体合作时，该国会获得疫情控制下社会的净收益，设为r。而当两个群体均拒绝合作，都不参与疫情防控工作，自然带来社会的冲突成本，设为c1。例如，双方均不自我防护，社会陷入防控无序状态，政府和有关部门需要投入更多的防控成本。一旦个体受到感染，必须尽快隔离治疗，由此产生治疗成本c2。不进行自我隔离等行为无疑会增加感染的概率，设为δ。由此，公众拒绝自我隔离时的社会总成本为冲突成本和感染成本之和，表示为c1+δc2。考虑到不合作行为的严重影响，均不合作时的总体成本大于合作时的净效益，即c1+δc2>r。

此外，“搭便车”获得的收益会随着净收益的增加而增加，本文将“搭便车”收益占总净收益的比例设为λ。通过“搭便车”获得的收益应该小于合作策略下任一方的收益，因此，λ的取值满足0<λ<1-m。在存在惩罚机制的演化模型中，将政府对拒绝参与防疫的群体进行的惩罚设为K，该值大于0。

二、疫情防控下的演化博弈模型

(一)零约束条件下的演化博弈模型

1. 演化稳定策略的求解

假设无外力干扰，两个群体的成本收益将按照双方的异质性程度进行分摊。本文将零约束条件下的演化博弈模型称为模型一，此时的支付矩阵见表2。

表2 模型一的支付矩阵

公众相信疫情和自然灾害一样是一次性的，但必须考量社会损失。学理上，经济人总是通过衡量预期成本和收益选择最优策略。同样地，疫情下的公众通过权衡自己能在疫情更快控制后获得的净收益做出选择。表2展示了公众在不同场合下能获得的净收益分布。已知两个群体将按照各自的异质性程度，即m和1-m的比例共享社会总预期净收益。若一方合作，而另一方拒绝合作，“搭便车”会使合作方受损，此时选择自我防护的群体的净收益减少了λr，为mr-λr，λr是“搭便车”一方获取的额外收益。因此，非合作方获得的净收益则为(1-m+λ)r。最坏的情况是双方都拒绝合作，那么疫情传播就会产生“多米诺骨牌”效应，导致更高的社会损失，群体A和B根据异质性程度承担各自的损失。

(1)

(2)

当群体A以x的概率选择合作策略，则以1-x的概率选择非合作策略时，其获得的平均预期收益(UA)为

(3)

将式(1)～(3)代入群体A的复制动态方程(replicator dynamics equation)，得到式(4)。其中，复制动态方程是演化博弈模型的核心，表现了在长期动态变化过程中某一群体采取合作策略的人数比例的动态变化速度，或该群体在动态演化过程中选择具体演化策略的概率变化。

x(1-x)[(1-y)m(c1+δc2)-λr]

(4)

(5)

(6)

当群体B以y的概率选择合作策略，以1-y的概率选择非合作策略时，其获得的平均收益(UB)为

(7)

将式(5)～(7)代入群体B的复制动态方程，得到

y(1-y)[(1-x)(1-m)(c1+δc2)-λr]

(8)

均衡状态下，群体A和B选择结果局部稳定，即合作概率x，y不再随着时间的变化而变化，表示为F(x)=F(y)=0。

当F(x)=dx/dt=0时，x=0,x=1,y*=1-λr/[m(c1+δc2)]。

当F(y)=dy/dt=0时，y=0,y=1,x*=1-λr/[(1-m)(c1+δc2)]。

由方程解可知，模型一的均衡点共有5个，即(0，0)、(1，0)、(0，1)、(1，1)和(x*，y*)，分别对应群体A和群体B的合作概率，前4个均衡点依次代表(不合作，不合作)、(合作，不合作)、(不合作，合作)和(合作，合作)的策略组合，(x*，y*)表明群体A选择合作概率为x*，群体B选择合作的概率为y*的选择组合。本文将通过雅可比矩阵(Jacobi matrix)判断演进过程中动态系统均衡点的局部稳定性，最终确定演化稳定策略(evolutionary stable strategy，ESS)。

雅可比矩阵是将一阶偏导数以一定方式排列形成的矩阵，模型一对应的雅可比矩阵为

(9)

该矩阵的行列式值为

DetJ=(1-2x)[(1-y)m(c1+δc2)-λr](1-2y)[(1-x)(1-m)(c1+δc2)-λr]-

x(1-x)m(c1+δc2)y(1-y)(1-m)(c1+δc2)

(10)

该矩阵的迹为

trJ=(1-2x)[(1-y)m(c1+δc2)-λr]+(1-2y)[(1-x)(1-m)(c1+δc2)-λr]

(11)

模型一的演化稳定结果见表3。

表3 模型一中均衡点的演化稳定结果

将均衡点依次代入式(10)(11)，结果显示当(x，y)等于(1，0)或(0，1)时，符合雅可比矩阵行列式值大于0且迹小于0的要求，这是该点为ESS的充分条件。(0，1)和(1，0)均为零约束条件下的演化稳定策略解，这意味着在零约束条件下，最终演化结果为群体A和群体B总有一方选择合作，积极参与疫情防护，而另一方拒绝合作，不愿约束自我行为，同时总有部分公众存在“搭便车”行为。模型一对应的相图如图1所示。

图1 模型一的相图：混合策略

横轴为x(t)，是群体A选择合作策略的概率；纵轴为y(t)，是群体B选择合作策略的概率。O(0，0)、A(1，0)、B(1，1)、C(0，1)、D(x*，y*)(5)D(x*，y*)的位置是不确定的，但其肯定位于封闭区域OABC内。本文只是近似选择了中心一点，以便绘制的相图较为直观。是该模型的5个局部均衡点，其中O(0，0)代表双方都不选择合作，B(1，1)代表双方都选择合作。OABC围成的区域是该模型的混合策略空间。当初始状态点落入OABD区域内时，最终系统会演化至A(1，0)的稳定状态；当初始状态点落入OCBD区域内时，系统最终会演化至C(0，1)的稳定状态。在没有第三方介入的情况下，两个群体的选择策略并没有向B(1，1)移动，表明两方均不选择合作抗疫。双方都不合作的点O(0，0)意味着高昂的社会成本，该情景不会发生。在寻优的过程中，博弈系统最终向一方选择合作策略而另一方选择非合作策略的方向发展，双方合作策略没有形成。

虽然疫情防控利国利民，符合个人和群体利益要求，但自我防护带来的集团收益是公共可分的，国民共同享有，不管其之前是否有效参与了防控。个体行为的利益最大化并不能保证集体行动利益的最大化。国家作为“大集团”，集团规模越大，分享收益的人越多，为实现集体利益而自我努力的人就会越少，以至于最终无法形成稳定的合作策略。只有将所有人置于“无知之幕”(6)“无知之幕”由约翰·罗尔斯提出，指只有当每一个人都忘记自己的社会角色，才能保证每个人都受到无社会差异的对待，正义才会出现。，不对合作方案预设立场，才能使集体利益成为利益标准的自然选择[11]。

2. 零约束下的系统仿真分析

为了直观观察零约束下的演化博弈过程，本文利用Matlab软件，对群体A的复制动态方程式(4)和群体B的复制动态方程式(8)进行数值仿真，观察系统的演化路径。在满足数值取值范围的前提下，本文设定演化系统中群体A和B初始选择合作概率均为0.5，其他参数值设为r=10、λ=0.2、c1=8、δ=0.8、c2=5、m=0.6，故“搭便车”收益设定为λr=2(7)因参数λ和r均通过正向影响“搭便车”收益，进而影响两个群体的博弈概率，其作用路径一致，故在后续分析中不单独考虑λ或r的变动，而是选择其乘积“搭便车”收益展开研究。，不合作抗疫下的社会总成本为c1+δc2=12。分别讨论以下情形：

情形一：x(0)=0.5,y(0)=0.5,m=0.6,其余变量不变，如图2所示。

图2 情形一的ESS分析

情形二：x(0)=0.5,y(0)=0.5,m=0.75,其余变量不变，如图3所示。

图3 情形二的ESS分析

情形三：x(0)=0.5,y(0)=0.5,λr=5,其余变量不变，如图4所示。

图4 情形三的ESS分析

情形四：x(0)=0.5,y(0)=0.5,c1+δc2=15,其余变量不变，如图5所示。

图5 情形四的ESS分析

情形五：x(0)=0.3,y(0)=0.7,m=0.6,其余变量不变，如图6所示。

图6 情形五的ESS分析

情形六：x(0)=0.7,y(0)=0.3,m=0.6,其余变量不变，如图7所示。

图7 情形六的ESS分析

仿真图中横轴表示时间，纵轴是群体选择合作的概率。取值为1，代表该群体的民众都选择合作，即合作概率为100%；取值为0表示该群体选择合作可能性为0，即拒绝合作。两条线分别描绘群体A和群体B选择合作概率的变化路径。曲线的陡峭程度表示系统向演化稳定策略演化的速度，曲线越陡峭，速度越快。

将图2表示的情形一视为对照组，采用控制变量法，依次改变某一参数值，观察情形二～情形五的仿真结果，如图3～6所示。将图3～6与图2对照，可以得出如下结论：第一，不同情形下的系统发展方向都是一方倾向合作策略，最终合作概率为100%，另一方选择非合作策略，最终合作概率为0，与上述模型分析结果一致。第二，模型中参数值r、λ、c1、δ、c2、m的变化并不会影响最优演化博弈策略的最终结果，仍为(0，1)或(1，0)，即总有一方合作，而另一方不合作，但会影响系统达到稳定的速度。

首先，由图2和图3可知，短时间内两条线距离迅速拉大，博弈的利益结构决定博弈方行为取向。异质性更高，即m更大的情况下，实力较强的一方会更快地推动对自身有益的博弈进程。其次，“搭便车”收益rλ越小，社会成本c1+δc2越大，参与者会权衡合作利弊(如戴口罩的成本收益)更快做出决策，系统也就更快地实现稳定。再次，图2和图4的差别在于“搭便车”收益由2增加至5，两图对比结果表明，“搭便车”收益的增加不仅延缓演化稳定策略的实现，还会短暂地降低群体A的合作意愿，使群体A合作抗疫的概率下降。同样地，图2和图5体现了双方拒绝合作时社会成本的增加，由12增加至15，会在短期推升群体B合作的概率。但双方长期决策并没有改变，系统演化稳定策略仍然是一方合作，而另一方不合作。最后，对照图6和图7的仿真结果发现，在零约束下，群体最初的选择意愿会不断增强，初始意愿就是最终选择，演化博弈中群体A和B的选择都具有路径依赖的特点。

(二)惩罚机制下的演化博弈模型

1. 演化稳定策略的求解

由上述分析可知，在没有第三方干预的情况下，异质性群体之间不会形成稳定的双方合作策略，现引入来自第三方的惩罚机制，如政府、社区等部门对拒绝戴口罩、拒绝自我隔离等不合作行为的“惩罚”，这种惩罚包括罚金、道德谴责等，这一场景下的模型称为模型二。任何个人都会对其面临的激励做出反应，这种社会激励加上个人偏好影响个人选择和行为。结果可能或者不可能与公共利益冲突[11]。该部分将研究激励下的个人选择是否与公共利益有冲突，模型二的支付矩阵见表4。

表4 模型二的支付矩阵

其中，“惩罚”的对象仅针对拒绝合作的参与者，若将惩罚的力度用“罚金”K表示，则拒绝合作的一方获得的净收益将减少K。

模型二中群体A的复制动态方程为

x(1-x)[(1-y)m(c1+δc2)-λr+K]

(12)

群体B的复制动态方程式为

y(1-y)[(1-x)(1-m)(c1+δc2)-λr+K]

(13)

均衡时，双方的选择概率不再随时间而变化，即G(x)和G(y)的值都等于0。当G(x)=dx/dt=0时，方程解为x=0,x=1,y*=1-(λr-K)/[m(c1+δc2)]。

当G(y)=dy/dt=0时，方程解为y=0,y=1,x*=1-(λr-K)/[(1-m)(c1+δc2)]。

其中，λr-K表示权衡“搭便车”与惩罚成本的净收益。当存在惩罚机制时，上述均衡解共有5个，即(0，0)、(1，0)、(0，1)、(1，1)、(x*，y*)。下文将再次使用雅可比矩阵判断稳态，寻找ESS点，模型二5个均衡点的演化稳定结果见表5。

表5 模型二中均衡点的演化稳定结果

最终结果显示，只有均衡点(1，1)能够成为演化均衡策略解，且只有满足惩罚成本大于“搭便车”收益，即K>λr的条件时，演化稳定策略点才会出现，双方合作才得以实现。这意味着，只有当对拒绝自我防护的公众处以的罚金大于“搭便车”获得的收益时，演化系统的稳定均衡解为(合作，合作)，最终公众全体合作抗疫。

满足条件K>λr时模型二对应的相图如图8所示，横轴为群体A选择合作策略的概率，纵轴为群体B选择合作策略的概率。O(0，0)、A(1，0)、B(1，1)、C(0，1)、D(x*，y*)是该模型的5个局部均衡点，B(1，1)是双方合作的均衡点，在存在严厉惩罚机制的情况下，无论初始状态点落在OABC区域内的任意位置，选择组合策略会逐渐向B点移动，最终演化至B(1，1)的稳定状态，且该稳定状态唯一，这正是公众合作的理想结果。

图8 模型二的相图(K>λr)：合作策略

奥尔森[4]70-77设计出一种动力机制，为“有选择性的激励”，即“赏罚分明”，可以解决集体及个人之间的利益相关问题。惩罚机制便是这样一种反向激励，正是这种强制引导大集团的成员为实现公共利益而行事，否则自我防护作为一种公共物品，面临供给困难。模型二的最终稳定策略证明在惩罚机制下公众才可能合力提供公共物品，实现公共利益，类似于“污染者付费”的原则[11]。

2. 惩罚机制下的系统仿真分析

本文把上述引入惩罚机制下的模型进行系统仿真分析，只讨论惩罚成本大于“搭便车”收益，即K>λr时，稳定策略存在的情况。各参数与模型一中情形一的设定值一致，在满足K>λr的前提下，本文仅讨论以下两种情形(8)其他参数值变化对模型二的影响与对模型一的影响是相同的，只是两个模型本身达到的稳定状态不同，故在此不再赘述，只讨论新引入参数K的变化。：

情形七：K=3，其余变量为设定值，如图9所示。

图9 情形七的ESS分析

情形八：K=7，其余变量为设定值，如图10所示。

图10 情形八的ESS分析

从图9和图10可知，惩罚机制下，群体A和B均朝着合作概率为100%的方向演化。合作意愿不断增强的结果是两个群体均选择合作，演化稳定策略实现时的均衡点是(1，1)，与表5中的理论结果一致。同时，K的大小，即惩罚力度的大小会影响该系统趋向稳定策略的速度。惩罚力度越大，群体A和B达到演化稳定策略的速度越快，自我防护越快，越能尽早形成全民抗疫的场景。

三、结论及启示

新冠肺炎疫情是典型的公共卫生危机，本文以此为场景，在群体异质性、“搭便车”和冲突成本等假设前提下，建立新冠肺炎疫情期间公众合作行为的二维演化博弈模型。演化博弈模型是一场在有限理性假设下的重复博弈，比传统博弈下的完全理性经济人更贴近现实，更能反映动态演变过程并克服静态博弈的局限。此外，该模型适用于研究群体行为，可以容纳个别参与者的行为突变及选择时形成的路径依赖。因此，演化博弈模型更适用于研究公共危机事件下的公众合作问题。

在5个基本假设的前提下，本文建立了国内社会环境零约束下和存在第三方惩罚机制的演化博弈模型。结果显示，零约束时，博弈系统向一方选择合作策略，另一方选择非合作策略的方向发展。非合作方通过“搭便车”获得额外收益。群体异质性程度、社会成本和“搭便车”收益等参数不会影响最终稳定策略结果，但会影响该博弈系统实现稳定的速度。异质性越强，系统就会越快实现稳定；成本越高，“搭便车”收益越高，初期的选择概率越会发生轻微反向波动。

引入第三方惩罚机制(如城市治理和社区治理中的惩罚机制)后，有可能使博弈系统朝着双方共同选择合作的方向发展，但必要条件是政府的惩罚应大于公众通过“搭便车”获得的额外收益，并且惩罚力度的加大会促使系统更快达到稳态。虽然“搭便车”没有根除，但它降低了群体选择非合作策略的可能性。在严厉的处罚机制下，合作策略是博弈双方的最佳选择，稳定的举国合作防疫模式由此形成，这是政府引导公众合作抗疫的一种有效途径。抗疫的良好效果发送的积极信号强化了公众自觉采取防护措施，社会各界的倡导增强了公众对合作策略的偏好，中国的抗疫过程和成果足以说明合作抗疫的有效性。

作为一场公共卫生危机，新冠肺炎疫情不仅增加了人们对病毒的认知，更推动了相关制度的建构和演化，提高了政府和民众应对危机的能力，进而对社会产生深远影响[5]118-123。公众行为选择是一个动态变化的过程，是否合作共同抗疫涉及公共秩序的恢复和重建。从个别选择的权衡到集体行动的过程与面临的场景直接相关，作为管理者需要关注个体行为变化的过程。在集体选择理论中，任何经济人的行动，只要实现了任一公共目标或满足了任一公共利益，就已经代表他向该系统提供了一件公共物品[4]15。事实再次证明，“自愿行动尚未在任何领域成功地解决过公共产品供给不足的问题”[11]。本文据此得出以下政策启示：

第一，公众合作是构建人类卫生健康共同体的微观基础，可以通过设计合作机制促进全民抗疫。社区、小区治理的成功经验再次证明了“集体行动的逻辑”。社区作为“小集团”，具有较强的组织集体行动的能力。特别在疫情防控的关键时期，中国充分调动社区力量，守住了疫情联防联控的第一线。此外，集团越大，越不可能增进其共同利益。因此，对于一个国家，意识形态引领、共同文化维系和法律法规制度是维护共同利益之必需。获得公众的持续支持和配合体现了中国的国家治理能力，最终克服了复杂外部经济和政治环境带来的冲击，促进各种正式和非正式的制度安排的结合，恢复正常生产和生活秩序。2020年，中国是世界上唯一有效控制疫情并实现经济正增长的国家，国内生产总值比上年增长2.3%(9)突破100万亿！11个数看懂2020年中国经济[EB/OL]. (2021-01-28)[2021-04-26]. http://www.gov.cn/xinwen/2021-01/18/content_5580880.htm.。

第二，中国抗疫的举国体制模式和效果具有国际示范效应。截至2022年3月17日，全球累计新冠肺炎确诊人数已高达4.59亿人，突破了公众心理防线，多国开始反思抗疫过程。中国抗疫的结果给世界人民带来了信心。事实证明，社区治理下的联防联控机制值得推广，其可以超越国情限制，适应不同国家、民族的文化特征、价值理念和人际交往关系，形成同质但不同形式的“小集团”。中国公众每个人的防疫行为就是一种公共物品，利我利他，利国利民。中国国内如此，国际亦是如此。每一个国家为疫情防控做出努力和成效便是为国际社会提供了一份公共物品，最终产生公共收益。当人们能在疫情防控成功的国家之间流动时，经济交往就会被激活，有益于促进双边或多边合作。这种事后收益会成为各国合作抗击疫情的正向激励，从而为抗疫不力的国家提供示范效应。

第三，在国际公共卫生合作中需要引入第三方机制。新冠肺炎疫情再次给人类社会敲响“警钟”，人类已形成“一荣俱荣，一损俱损”的局面，公共利益是人类生存的基础。中国国内第三方机制的有效介入说明，在全球性公共物品的提供上，为实现公共利益，国际社会的合作同样需要第三方机制的参与。虽然世界上并不存在一个超越主权国家的权威机构，但是可以设想以下两种方案减少“搭便车”行为。方案一：签订国际协定。受到疫情困扰的国家和地区可通过协商签订有约束力的国际卫生协议。为避免空洞的承诺，协议应尊重各国实情，明确各国义务和制定奖惩机制等。方案二：加强现有国际组织对国际事务的管理，间接促进抗疫合作。国际卫生组织是对国际公共卫生事件最直接的管理和执行部门，中国始终坚定地支持联合国及世界卫生组织在完善全球公共卫生治理中发挥核心作用。《国际卫生条例》是当发现疾病事件和应对公共卫生事件时，为国际社会更好管理集体防护措施而制定的法律框架[12]。受疫情影响的国家和地区应及时通报和共享疾病信息，听取世界卫生组织的建议和应对指南[13]。世界卫生组织应对国家的公共卫生绩效进行评估，向世界卫生大会提交关于《国际卫生条例》实施情况的年度报告并相应地报告其调查结果[12]，公开为人类卫生健康共同体做出重大贡献的国家名单。在当前世界经济体系下，各国都重视对外贸易和援助，对因控制疫情而较快恢复经济的国家，世界贸易组织可倡导其成员适当降低对该国产品的进口关税，国际货币基金组织可考虑减轻其债务负担或者放松贷款条件。这一机制的设立可以给控制疫情得力的国家带来连带收益，以此形成正向激励。在整个过程中，国际组织应保持其客观和公正。

第四，倡导大国责任、担当和主动作为，补充全球公共物品。在国际合作中，大国作为集团内的“大成员”[4]，更需负担集体物品，向医疗人员、物资缺乏的国家和地区提供人道主义救助，配合世界卫生组织的行动。大国的责任、担当和主动作为，就是公共物品。在新冠肺炎疫情蔓延最严峻的时刻，中国提供医疗物资和经验，派遣专家团队，向世界卫生组织捐款，援助对象遍布亚非国家和欧美国家。据统计，2021年中国已向154个国家和国际组织提供抗疫物资，向120多个国家和国际组织提供超过21亿剂新冠病毒疫苗，并将继续向非洲国家无偿援助6亿剂疫苗，向东盟国家提供1.5亿剂疫苗(10)中国有力开展国际抗疫合作[EB/OL]. (2022-02-22)[2022-03-17]. http://m.ce.cn/yw/gd/202202/22/t20220222_37347019.shtml.。此外，中欧班列在2021年累计开行15 183列，其中累计运送防疫物资1 362万件，共计10.5万吨(11)2021年中欧班列开行再创佳绩成为畅通亚欧供应链的一条大通道[EB/OL]. (2022-02-21)[2022-03-17]. https://www.ndrc.gov.cn/fzggw/jgsj/zys/sjdt/202202/t20220221_1316067.html?code=& state=123.。中国一直务实有力地开展国际抗疫合作，克服“免疫鸿沟”，积极兑现将新冠病毒疫苗作为全球公共产品的承诺，肩负起“大成员”的担当，中国倡议、中国方案和中国实践都在表明中国对人类命运共同体的深刻理解和执行。

同应对气候风险一样，应对全球公共卫生危机事件也是为人类共同利益服务，需要公众之间、国家之间团结合作，使集体利益成为参与者行为的标准。“人类卫生健康共同体”是所有人的健康利益诉求，是构建人类命运共同体的基础。促进合作，传播中国经验，尽快帮助其他国家恢复生活秩序和生产秩序，将是中国为人类卫生健康共同体建设做出的重要贡献。