基于演化博弈的国防科技工业军民融合边界研究
2023-11-06李仁传张轩豪
高 原, 李仁传, 张轩豪
(1.国防大学 联合勤务学院,北京 100858; 2.陕西省军区,陕西 西安 710061; 3.国防大学 办公室,北京 100039)
0 引言
国防科技工业走军民融合发展之路是我国强军兴军、努力建设世界一流军队的必经之路。为了加快推进军民融合发展进程,我国正进行新一轮的板块重组调整,旨在形成一体化的战略发展格局。然而,摆在此次调整改革面前的一个首要问题是国防科技工业军民融合边界到底如何确定?科学合理地划清融合边界有利于维护和保障军事核心能力、充分挖掘和利用社会资源、集中优势实现国防实力和经济实力的同步提升,并且将国防科技工业融合边界制度化已经成为世界各国保障部队战斗力、提高社会整体效益的通用做法[1]。
随着科学技术的发展,军民资源日益趋同。然而,将所有的军地技术资源毫无保留地开放共享显然既不符合军队保密性原则,又不符合市场效率要求。美军使用合同商进行装备维修保障过程中出现的“钟摆现象”就是典型的国防科技工业融合边界问题[2]。从本质上看,“钟摆现象”出现的根源是因为美军在决定“公私合作”(PublicPrivatePartnering,PPP)前未划清合作边界。谢玉科和卢周来[1]运用交易成本理论,以交易不确定性和资产专用性为依据从定性的角度划分了国防工业基础军民融合边界,开创了理论界探讨军民融合边界问题的先河。魏慧源等[3]界定了国防科技工业军民融合资源效率风险的核心概念和引致因素,并通过探究资源效率风险的形成机理制定了相应的风险规避对策。黄毓森等[4]从系统论的角度,分析了中国特色国防科技工业体系的组成要素和实现路径,提出了大力推动国防科技工业军民融合发展创新、加快产业调整布局和军工企业改革的对策建议。从上述研究可以看出,鲜有学者有针对性地探讨国防科技工业军民融合边界问题,并且有关国防科技工业军民融合发展的研究也多停留于定性层面。因此,运用定性定量相结合的方法,以国防科技工业军民融合各参与主体的核心能力为基础,以共享效率为标准,科学系统地划分融合边界就显得尤为重要。
国防科技工业军民融合的各参与主体之间既存在共同利益,又存在利益冲突。因此,确定融合边界的关键在于找到能够满足各主体需求的博弈均衡。并且由于国防科技工业军民融合边界确定是受内外部随机因素影响的重复博弈的动态过程,各个参与主体符合有限理性假设,将会通过反复试错、学习改进,做出满意的决策行为,故适用演化博弈理论进行研究。SMITH和PRICE[5]提出演化稳定策略概念标志着演化博弈理论的正式诞生。近年来,演化博弈理论广泛运用于互联网租车市场分析[6]、闭环供应链管理[7]、公共交通补贴机制设计[8]等领域。
鉴于此,本文运用演化博弈理论,以军地科研机构共享国防科技工业信息资源为例,通过分析各参与主体的博弈行为和演化规律,确定国防科技工业军民融合边界条件,并对影响边界条件的各类因素加以分析,以期为国防科技工业军民融合创新发展提供理论支撑和决策依据。
1 国防科技工业军民融合资源共享演化博弈模型
1.1 模型假设
假设1军队科研机构(M)、地方科研机构(E)为利益相关者,双方以自身利益最大化为目标,均具备有限理性,需要通过学习调整,在重复动态博弈中选择最优策略。双方的行为策略集为{合作,不合作},军地科研机构选择合作策略的概率分别为x,y,则选择不合作策略的概率分别为1-x,1-y。
假设2军地双方若均不合作,仅凭借自身原有资源将获取基本收益:WM,WE。
假设3军地双方合作共享资源的总额分别为TM,TE,其中包括国防科技工业相关产品、技术、信息资源等,各方愿意提供给对方的资源共享比例分别为αM,αE。令各方资源的互补性水平为εM,εE,军地资源转化利用水平为θM,θE。综上,军地合作共享给军队科研机构带来的合作收益为TEαEεEθM,给地方科研机构带来的合作收益为TMαMεMθE。
假设4军地双方通过共享互补性资源不仅会产生合作收益,还会因为溢出效应和杠杆效应而产生协同收益。令τM为军队科研机构对地方科研机构的协同性影响水平,τE为地方科研机构对军队科研机构的协同性影响水平,则军地双方的协同收益为TEαEεEτE,TMαMεMτM。
假设5实现国防科技工业军民融合资源共享需要付出诸如获取、处理、加工和利用共享资源的时间成本、经济成本、人力成本等,不同机构所付出的成本各有不同,令σM,σE分别为军地合作成本系数,则军地双方的合作成本为TEαEεEσM,TMαMεMσE。
假设6在国防科技工业军民融合资源共享的过程中,存在着诸如损害核心竞争力、泄露国家机密等各类风险,这些风险将严重降低各主体参与合作的积极性、减少合作收益、破坏合作组织的稳定性,令rM,rE分别为军地双方参与合作的风险系数,当双方分享的资源越多,则承担的风险越大,军地双方的风险成本可表示为TMαMεMrM,TEαEεErE。
1.2 模型建立
根据上述分析,可得国防科技工业军民融合资源共享博弈收益矩阵如表1所示。
表1 国防科技工业军民融合资源共享博弈收益矩阵
综上,军队科研机构采取合作策略时的期望收益为:
TMαMεMrM)+(1-y)(WM-TMαMεMrM)
(1)
军队科研机构采取不合作策略时的期望收益为:
TEαEεEσM)+(1-y)WM
(2)
军队科研机构采取混合策略时的平均期望收益为:
(3)
则军队科研机构的复制动态方程为:
=x(1-x)(yTEαEεEτE-TMαMεMrM)
(4)
同理,地方科研机构的复制动态方程为:
=y(1-y)(xTMαMεMτM-TEαEεErE)
(5)
1.3 模型求解
因此,该博弈存在5个均衡点,分别是:
根据FRIDMAN[9]的方法,分析判断军队科研机构(M)和地方科研机构(E)复制方程组成系统的稳定性,可得其雅克比矩阵为:
(6)
雅克比矩阵行列式的值为:
detJ=(1-2x)(1-2y)(yTEαEεEτE-TMαMεMrM)·
(xTMαMεMτM-TEαEεErE)-xy(1-x)(1-y)TEαEεEτETMαMεMτM
(7)
雅克比矩阵的迹为:
trJ=(1-2x)(yTEαEεEτE-TMαMεMrM)+(1-2y)(xTMαMεMτM-TEαEεErE)
(8)
当detJ>0,trJ<0时,均衡点所处的状态是局部稳定的,下面分以下四种情况进行讨论:
(1)当TEαEεEτE>TMαMεMrM且TMαMεMτM>TEαEεErE,此时系统稳定状态如表2所示。
表2 系统稳定状态1
(2)当TEαEεEτE>TMαMεMrM且TMαMεMτM 表3 系统稳定状态2 (3)当TEαEεEτE 表4 系统稳定状态3 (4)当TEαEεEτE 表5 系统稳定状态4 通过上述分析可以得出,影响系统稳定性的关键因素是军地共享资源时的协同收益和风险成本,军地只要存在一方的协同收益小于风险成本,则系统的稳定均衡只存在于O(0,0),即(不合作,不合作)。当且仅当军地双方的协同收益均大于风险成本时,双方才有合作的可能性,即该条件为国防科技工业军民融合资源共享的边界条件之一。如图1所示,从国防科技工业军民融合资源共享系统动态演化相图中也可分析得出系统稳定均衡的演化趋势,从而进一步确定融合边界。当TEαEεEτE>TMαMεMrM,TMαMεMτM>TEαEεErE且初始状态处在OADB区域,则系统将收敛于O(0,0)点,即军地双方虽然获得的协同收益大于风险成本,但总收益仍不足以弥补付出的合作成本和遭受的损失,故军地双方都会选择不合作。当TEαEεEτE>TMαMεMrM,TMαMεMτM>TEαEεErE且初始状态处在ADBC区域,则系统将收敛于C(1,1)点,此时军地双方都会选择合作。 图1 国防科技工业军民融合资源共享动态演化相图 图2 考虑补贴惩罚机制的国防科技工业军民融合资源共享动态演化相图 令Q为ADBC区域的面积, Q越大,表示当军地双方的协同收益均大于风险成本时,系统收敛于C(1,1)的概率越大,反之亦然。 综上,国防科技工业军民融合资源共享的边界条件为:(1)军地双方的协同收益均大于风险成本;(2)初始状态处在ADBC区域。若不满足上述任一条件,军地将不会合作共享资源。 为了营造国防科技工业军民融合健康发展的良好环境,政府作为军民融合的重要参与主体会通过政策性补贴和惩罚的方式,降低风险成本,减少机会主义行为,鼓励双方积极开展合作创新。政府(G)作为第三方将对参与合作的博弈主体进行风险补贴(S),同时惩罚(P)没有契约精神的主体。当其他条件保持不变,可得到考虑补贴惩罚机制的国防科技工业军民融合资源共享博弈收益矩阵(表6)。 表6 考虑补贴惩罚机制的国防科技工业军民融合资源共享博弈收益矩阵 此时,军队科研机构的复制动态方程为: F*(x)=x(1-x)(yTEαEεEτE+P-TMαMεMrM+S) (9) 同理可得地方科研机构的复制动态方程为: F*(y)=y(1-y)(xTMαMεMτM+P-TEαEεErE+S) (10) 令F*(x)=0,得 令F*(y)=0,得 因此,该博弈存在5个均衡点,分别是: 根据FRIDMAN[9]的方法,分析判断存在补贴惩罚机制时,军队科研机构(M)和地方科研机构(E)复制方程组成系统的稳定性,可得其雅克比矩阵为: (11) 雅克比矩阵行列式的值为: detJ*=(1-2x)(1-2y)(yTEαEεEτE+P-TMαMεMrM+S)(xTMαMεMτM+P-TEαEεErE+S)- xy(1-x)(1-y)TEαEεEτETMαMεMτM (12) 雅克比矩阵的迹为: trJ*=(1-2x)(yTEαEεEτE+P-TMαMεMrM+S)+(1-2y)(xTMαMεMτM+P-TEαEεErE+S) (13) 若要C1(1,1)为系统均衡点,则需满足detJ*>0,trJ*<0,即S+P>max{TMαMεMrM-TEαEεEτE,TEαEεErE-TMαMεMτM}。也就是当政府对军地双方补贴和惩罚的总和能够弥补风险成本对协同收益的抵减作用时,双方才有可能合作。 同时若B1(0,1)也为系统均衡点,则需满足 detJ*=(TMαMεMrM-TEαEεEτE-P-S)(P-TEαEεErE+S)>0,trJ*=(TEαEεEτE+P-TMαMεMrM+S)+(TEαEεErE-S-P)<0,由于当C1(1,1)为系统均衡点时,S+P>max{TMαMεMrM-TEαEεEτE,TEαEεErE-TMαMεMτM},故要使得detJ*>0,只需TEαEεErE>S+P。然而当TEαEεErE>S+P时,trJ*>0,因此当C1(1,1)为系统均衡点时,B1(0,1)不会为系统均衡点。同理当C1(1,1)为系统均衡点时,A1(1,0)也不会为系统均衡点。当C1(1,1)为系统均衡点时,要使O1(0,0)为系统均衡点,则detJ*=(P-TMαMεMrM+S)(P-TEαEεErE+S)>0,trJ*=(P-TMαMεMrM+S)+(P-TEαEεErE+S)<0,即需满足S+P 综上,考虑补贴惩罚机制的国防科技工业军民融合资源共享的边界条件为:(1)政府补贴和惩罚的总和能够弥补风险成本对协同收益的抵减作用;(2)风险成本大于补贴和惩罚的总和;(3)初始状态处在A1D1B1C1区域。若不满足上述任一条件,军地将不会合作共享资源。 对比图1和2,可以明显地发现,加入补贴惩罚机制后,A1D1B1C1区域的面积明显大于ADBC,即政府的补贴惩罚机制能够增大军地合作的概率,有效推动军民融合。 由于不考虑补贴惩罚机制与考虑补贴惩罚机制的各类因素影响趋势相似,且后者更为复杂,故本节主要分析考虑补贴惩罚机制的国防科技工业军民融合资源共享的各类影响因素。 命题2当TEαEεErE>S+P时,军地双方合作的可能性随军队科研机构协同性影响水平τM的增大而增大,反之亦然。当TMαMεMrM>S+P时,军地双方合作的可能性随地方科研机构协同性影响水平τE的增大而增大,反之亦然。 命题3军地双方合作的可能性随合作风险系数rM,rE的增大而减小,反之亦然。 命题4军地双方合作的可能性随政府补贴(S)和惩罚(P)的增大而增大,反之亦然。 命题5军地双方合作的可能性不受资源转化利用水平θM,θE和合作成本系数σM,σE的影响。 图3模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.6,τM=τE=0.1,P=S=10,起始点横纵坐标处于[1,2]时,军队科研机构和地方科研机构的策略演化轨迹。在上述参数下,有S+P 图3 不满足条件(1)时的动态演化过程 图4模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.1,τM=τE=0.5,S=P=100,起始点横纵坐标处于[0,1]时,军队科研机构和地方科研机构的策略演化轨迹。在上述参数下,有S+P>max{TMαMεMrM-TEαEεEτE,TEαEεErE-TMαMεMτM},S+P>TMαMεMrM,S+P>TEαEεErE,即满足考虑补贴惩罚机制时的第一个和第三个边界条件,不满足第二个边界条件。此时,军队科研机构和地方科研机构的演化稳定策略为(0,0)和(1,1),故双方合作不是唯一的演化稳定状态。 图4 不满足条件(2)时的动态演化过程 图5模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.6,τM=τE=0.5,S=P=10,起始点横纵坐标处于[0,0.7]时,军队科研机构和地方科研机构的策略演化轨迹。在上述参数下,有S+P>max{TMαMεMrM-TEαEεEτE,TEαEεErE-TMαMεMτM},S+P 图5 不满足条件(3)时的动态演化过程 综上,当不满足考虑补贴惩罚机制的国防科技工业军民融合资源共享的任一一个边界条件时,军地科研机构的演化稳定策略将发生改变,双方都可能采取不合作策略,即边界条件得以验证。同理可验证不考虑补贴惩罚机制的国防科技工业军民融合资源共享边界条件的有效性和合理性。 (1)互补性可分享资源总量对军地合作可能性的影响 图6模拟了在参数τM=τE=0.5,rM=rE=0.4,S+P=35,TEαEεE=400,(x,y)初始值为(0.65,0.65),TMαMεM分别为265,280,295,310,325时,军队科研机构和地方科研机构的策略演化轨迹。在上述参数下,有 图6 互补性可分享资源总量对军地合作可能性的影响 (2)协同性影响水平对军地合作可能性的影响 图7模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.2,S+P=15,(x,y)初始值为(0.5,0.5),τM,τE分别为0.1,0.2,0.3,0.4,0.5时,军队科研机构和地方科研机构的策略演化轨迹。在上述参数下,有TEαEεErE>S+P,TMαMεMrM>S+P。从图中可以发现,随着协同性影响水平的增加,军地科研机构的协同收益逐渐增大,合作总收益也逐步增加,双方的演化稳定策略也从(0,0)逐步演化为(1,1),即当TEαEεErE>S+P时,军地双方合作的可能性随军队科研机构协同性影响水平τM的增大而增大,反之亦然。同理,当TMαMεMrM>S+P时,军地双方合作的可能性随地方科研机构协同性影响水平τE的增大而增大,反之亦然。 图7 协同性影响水平对军地合作可能性的影响 (3)合作风险系数对军地合作可能性的影响 图8模拟了在参数TMαMεM=TEαEεE=100,τM=τE=0.5,S+P=5,(x,y)初始值为(0.5,0.5),rM、rE分别为0.1,0.2,0.3,0.4,0.5时,军队科研机构和地方科研机构的策略演化轨迹。从图中可以发现,随着合作风险系数的增加,军地科研机构的风险成本逐渐增大,合作总收益随之减少,双方的演化稳定策略也从(1,1)逐步演化为(0,0),即军地双方合作的可能性随合作风险系数rM,rE的增大而减小。 图8 合作风险系数对军地合作可能性的影响 (4)政府补贴和惩罚对军地合作可能性的影响 图9模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.3,τM=τE=0.5,(x,y)初始值为(0.5,0.5),S+P分别为10,20,30,40,50时,军队科研机构和地方科研机构的策略演化轨迹。从图中可以发现,随着补贴和惩罚的增加,两者的总和越容易弥补风险成本对协同收益的抵减作用,双方演化稳定策略也从(0,0)逐步演化为(1,1),即军地双方合作的可能性随政府补贴(S)和惩罚(P)的增大而增大。 图9 政府补贴和惩罚对军地合作可能性的影响 图10模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.4,τM=τE=0.5时,军地科研机构的策略演化轨迹。图11模拟了在参数TMαMεM=TEαEεE=100,rM=rE=0.4,τM=τE=0.5,S=P=15时,军地科研机构的策略演化轨迹。通过对比,可明显地发现在其他参数保持不变以及不考虑起始点位置时,补贴惩罚机制对军地合作有正向激励作用,军地双方均选择合作策略的概率得到了显著提升。 图10 未考虑补贴惩罚机制的动态演化过程 图11 考虑补贴惩罚机制的动态演化过程 本文基于演化博弈理论,以国防科技工业军民融合资源共享为例,建立了考虑补贴惩罚机制和不考虑补贴惩罚机制的两种融合边界博弈模型,分析了军队科研机构与地方科研机构之间的相互演化规律,探寻了军民有效合作的边界条件,以期通过定性和定量相结合的方法回应国防科技工业改革调整中遇到的矛盾困难,解决军民融合理论界关注的热点问题。通过分析发现:(1)不考虑补贴惩罚机制的融合边界条件由风险成本对协同收益的抵减作用与初始状态决定;(2)考虑补贴惩罚机制的融合边界条件由政府补贴和惩罚的总和是否介于风险成本和风险成本与协同收益的差值之间以及初始状态决定;(3)在特定条件下,互补性可分享资源总量和协同性影响水平对军地合作有正向促进作用;(4)合作风险系数对军地合作有负向阻碍作用;(5)补贴惩罚机制对军地合作有正向促进作用;(6)资源转化利用水平和合作成本系数只与参与主体的自身能力素质有关,不影响演化趋势。2 加入补贴惩罚机制的演化博弈分析
3 因素分析
4 算例分析
4.1 边界条件验证
4.2 影响因素验证
4.3 未考虑补贴惩罚机制与考虑补贴惩罚机制的演化轨迹对比分析
5 结语