科技成果转化主体行为策略演化博弈研究
2023-01-15陈艺丹
陈艺丹,洪 帅,2
(1.河北经贸大学 经济研究所;2.河北经贸大学 京津冀协同发展河北省协同创新中心,河北 石家庄 050061)
0 引言
加快科技成果转化是推动我国经济发展转型升级的重要推手。作为科技创新的“先锋官”,以高校为代表的科研单位是科技成果的重要输出地,与科技成果主要输入地——企业,共同在国家科技创新体系中发挥重要作用。由于科技成果转化是一项多系统、多组织、多链条交叉配合的工程,具有较强的系统性和复杂性,在当前科学与技术之间日益交叉融合的趋势下,科技成果转化愈加需要科研单位之间、科研单位与市场之间的协同配合。因此运用博弈论分析科技成果转化过程中主体间的行为选择及利益关系十分必要。
1 文献回顾
科技成果转化相关研究受到学术界的广泛关注。当前我国科技成果仍存在转化率低、转化难等一系列问题,面临人才短缺、经费不足、周期较长等制约因素[1]。通过测算区域科技成果转化效率,分析其时空演进特征,构建“互联网+”背景下区域协调机制解决地区间成果转化效率不平衡问题[2]。开放式创新对科技成果转化效率具有积极影响,同时CEO经历、吸收能力与集成能力平衡度在其中具有调节作用[3]。在科技成果转化政策量化评价方面,史童等[4]基于国内外学者研究成果并结合科技成果转化政策的特点,计算各项政策的PMC指数并绘制PMC曲面图。立足整合视角框架,综合运用CFA和fsQCA方法,检验政策供给、政策协调、技术来源、机构实力、身份自洽5个条件及不同条件组态对转化成效的效应[5]。整体来说,现有研究强调促进部门统筹协同及政策宣传、完善科研人才考核激励政策、优化供给方政策、加强需求方政策、强化服务方政策、完善资金保障者政策[6],以达到推动实现依靠创新驱动的内涵式发展的目的。
高校科技成果转化路径研究方面,基于界面理论探讨多重并发因素和复杂因果机制下高校科技成果转化的现实路径[7]。因此,应在深入了解我国高校科技成果转化现状基础上,进一步分析我国高校科技成果转化存在的问题及深层次原因,以推动我国高校科技成果转化应用[8]。以高校科技成果为研究载体,研究知识扩散和科技成果转化的相关机制[9],打造以创新综合体为核心的创新集群并完善创新环境,发挥科技成果转化从原来的偶然零星事件质变为批量转化的“雨林效应”[10],提高科研人促进科技成果转化的积极性[11],成为推动我国创新驱动发展战略落实落地的重要路径。
当前对于科技成果转化的相关研究主要集中在政策、机制、影响因素等方面,而对科技成果转化主体之间关系的研究相对较少[12]。研发单位是科技成果的主要提供者,企业具有较强的商业转化能力,二者合作开展成果转移转化成为当前重要的科技成果转化方式之一。通过构建演化博弈模型,探讨达成并巩固合作联盟的条件,反映各主体在科技成果转化中的行为演化路径以及稳定策略的形成,对加快推进科技成果转化具有一定的参考意义。
2 模型构建与研究假设
在科技成果转化过程中,高校及科研院所拥有较强的知识和技术优势,相对来说企业凭借较强的商业转化能力与高校及科研院所形成互补。基于此,提出如下假设。
(1)科技成果转化过程中有两个参与者高校(A)和企业(B)。参与者的策略集合为K={k1,k2}。其中k1表示选择“合作”策略,k2表示选择“不合作”策略。
(2)高校(A)和企业(B)在博弈初始阶段选择k1,即“合作”策略的概率分别为x和y,则选择k2“不合作”策略的概率为1-x,1-y,存在x,y∈[0,1]。
(3)科技成果转化成功率为α。科技成果转化的结果具有不确定性,存在转化失败的可能,因此用α表示高校和企业合作科技成果转化的成功率。
(4)科技成果创新价值为V。科技成果创新价值直接影响高校和企业合作进行成果转化的意愿,用V表示高校研发专利的创新价值。两者合作时,高校根据价值V进行技术入股。该价值由高校研发过程中产生的人力、物力等资源的消耗来衡量。假设高校消耗的资源越多,该成果的创新价值越高。
(5)商业化收益。科技成果转化成功后会带来一定的收益,假定转化成功后的商业化收益为M。
(6)收益分摊比例。高校和企业在合作之前会签订相关协议,商定好各自获得的利益分摊比例。假定协议中签订高校获得的成果转化利益分摊比例为β,那么企业获得的分摊比例为1-β。
(7)成本。科技成果转化后的商业化运营需要付出一定的成本,假定高校和企业科技成果商业化运营成本为C。
(8)合作激励与惩罚。高校和企业合作进行科技成果转化时,为了激励双方的合作行为,保障合作的顺利进行,政府制定了激励和惩罚机制,选择合作的一方将会得到P的奖励,同样违约的一方将会得到P的惩罚。
基于此,双主体演化博弈相关符号及参数含义如表1所示。
表1 双主体演化博弈相关参数含义
基于以上假设,高校和企业如果都选择和对方合作进行科技成果转化时,那么高校除获得一定比例(β)的商业化收益外,还将获得政府给予P的奖励,最终将会得到Mαβ+P-V的总收益,企业在双方合作中得到的总收益为Mα(1-β)+P-C;如果两者均选择不合作,那么高校和企业收益均为0;如果高校选择与企业合作进行科技成果转化,但是企业选择不合作,此时高校获得的收益为P-V,企业由于不合作将受到P的惩罚,因此收益为-P;如果高校选择不合作,但是企业选择合作,那么高校将获得P的惩罚,企业获得P-C的收益。这种情况下博弈双方的支付矩阵如表2所示。
表2 高校与企业合作科技成果转化博弈支付
3 高校与企业合作稳定性分析
当制定的双方合作违约罚金或奖励P大于高校研发的科技成果创新价值V和科技成果商业化运营成本C时,即:P>C,P>V。
当合作违约罚金或奖励大于成果创新价值或商业化运营成本时,该动力系统中在0≤x,y≤1区域内存在四个局部均衡点(0,0),(0,1),(1,0),(1,1)。根据雅可比矩阵均衡结果可知,(1,1)为策略演化均衡点。由于该条件下,高校和企业选择合作所获得的收益要高于选择不合作获得的收益,因此双方均会选择“合作”的策略。此时,博弈系统演化相位如图1所示。
图1 P>C,P>V条件下高校和企业博弈系统相位图
当高校和企业选择与对方合作的奖励或选择“不合作”时的违约罚金小于高校提供的科技成果创新价值V和科技成果商业化运营中的成本C时,即P 当奖励或罚金P小于科技成果创新价值或商业化运营成本时,(0,0)和(1,1)都是演化稳定点,分别代表高校与企业选择(不合作,不合作);(合作、合作)的策略。 图2 P 根据图2可知,当博弈初始状态落在区域ACBD中时,高校和企业博弈系统向(1,1)即(合作,合作)的状态收敛,最终高校与企业均选择“合作”的策略将会成为博弈的唯一演化稳定策略。当博弈初始状态落在区域AOBC内时,博弈系统向(0,0)即(不合作,不合作)的状态收敛,最终高校与企业均选择“不合作”的策略将会成为博弈的唯一演化稳定策略。因此,为了使该博弈系统沿着CD的路线向(合作,合作)演化的概率更大,应该增大ACBD的面积,即使鞍点向O点靠近。高校与企业博弈系统内各参数变化对系统演化结果的影响如表3所示。 表3 参数变化对博弈系统演化结果的影响情况 探索高校与企业共同选择合作的理想状态,寻找系统中趋近于(1,1)点的博弈策略。为了更加直观地说明高校与企业科技成果转化中博弈策略达成过程,验证建立的演化博弈模型,运用Matlab软件对高校和企业的相关行为数值进行仿真分析。 通过上文分析了解到,高校或企业是否选择合作进行科技成果转化与对方的策略选择密切相关。以高校为例,改变企业选择“合作”策略的概率y,进行仿真分析,验证对方不同的概率选择对高校策略的影响。首先设定各参数值M=100,V=30,P=10,α=0.5,β=0.5。 图3 企业策略选择概率y对高校策略选择的影响 因此可以证明无论高校还是企业,在做出是否合作的决策之前都会参考对方的合作意愿,不断调整自己的策略选择。一方合作意愿(选择“合作”的概率)的高低直接影响另一方的最终策略选择。并非只有当一方选择“合作”的概率等于1时,双方才能达成合作协议。只要一方初始合作意愿高于某个特定值,双方经过模仿和调整,最终将会达到(合作,合作)的稳定状态。 P的取值范围不同,稳定策略的演化方向也就不同。设M=100,V=10,P=30,C=10,α=0.5,β=0.5,分别给x和y设定不同的初始值,通过图4可以发现,在满足约束条件P>C,P>V时,不管x和y的值变大还是变小,高校和企业都能够通过不断地调整最终演化到(1,1)的稳定状态,即最终都会选择“合作”的策略。即使V和C值发生改变,但是只要小于P,二者通过演化最终仍会达到(合作,合作)状态,“合作”为其唯一的演化稳定策略。 图4 P>C,P>V时双方稳定策略演化 将P的取值范围改为P 图5 初始意愿x,y变化的演化结果 在P 改变合作奖励与惩罚P的取值大小,分别取P=9、P=9.5、P=10、P=25仿真4次,高校与企业策略选择的演化路径仿真结果如图6所示。该仿真系统中P的临界值在9和9.5之间。当P=25时,高校和企业选择“合作”的概率向1收敛的速度最快,这说明在奖励和惩罚小于科技成果创新价值和商业化运营成本的时候,合作获得的奖励或者不合作遭受的惩罚越大,高校和企业选择“合作”的积极性越高。随着P值的降低,二者选择“合作”策略收敛于1的速度会减慢,低于一定值后“合作”策略的概率将会向0趋近,双方将会选择“不合作”的稳定策略。这说明当提高合作奖励或者惩罚时,高校或企业会因为奖励或者惩罚的增大而更加积极地倾向于选择与对方合作。 图6 P值的变化对演化结果的影响 改变高校付出的科技成果创新价值V,分别取值25、30、31、35,共仿真4次,二者策略选择演化路径的仿真结果如图7所示。在保持其他参数不变的条件下,科技成果创新价值V的临界值大约在31左右,由支付矩阵可知,科技成果创新价值越高,高校获得的支付越少,即高校的期望收益越低,所以当该值高于临界值时,高校选择“合作”策略的概率会向0收敛,并且V值越高,向0点收敛的速度越快。科技成果创新价值低于该临界值时,由于高校的收益相对增大,加之存在合作奖励和违约惩罚,尽管企业与高校合作的意愿不强,但稳定点仍会向1收敛,企业最终也会选择“合作”策略。仿真结果表明,科技成果创新价值越大,高校和企业合作可能性反而越小。 图7 V值变化对演化结果的影响 当其他参数保持不变条件下,转化成功率α的临界值大约为0.5。当科技成果转化成功率低于该临界值时,均衡点向0趋近,α值越小,向0收敛的速度越快。当α大于该临界值时,均衡点向1的方向收敛,值越大,收敛的速度越快,高校和企业达成(合作,合作)演化稳定策略的时间也就越短,如图8所示。可见,随着α值的不断增大,高校与企业合作意愿也会逐渐从“不合作”转化成“合作”。随着转化成功率的增大,双方合作的收益逐渐提高,合作意愿也愈加强烈。 图8 转化成功率α的变化对演化结果的影响 在科技成果转化过程中,企业产生的商业化运营成本C取值为31时,系统不会向0或者1收敛,即无法达到稳定状态,如图9所示。 图9 转化成本C的变化对演化结果的影响 当C小于31时,企业选择“合作”的概率向1收敛,并最终达到合作的稳定状态,成本的减少促使“合作”策略的概率向1演化的速度加快。当C大于31时,企业策略选择概率向0收敛,即“合作”的概率为0,“不合作”成为稳定策略,成本越大“合作”概率向0收敛的速度越快。随着科技成果转化成本的增大,高校和企业的收益逐渐降低,仿真结果显示,一旦转化成本高于临界值,经过多次博弈,高校与企业最终选择“合作”的概率将会为0。 通过建立演化博弈模型,以高校和企业为博弈主体,分析了两者在科技成果转化合作中的博弈过程以及最终演化稳定策略的发展情况。研究表明:第一,当政府制定的合作奖励或者不合作产生的违约惩罚大于科技成果创新价值和成果转化运营成本时,高校与企业会达到(合作,合作)的理想状态。第二,当政府制定的合作奖励或者不合作产生的违约惩罚小于科技成果创新价值和成果转化运营成本时,受奖励和惩罚、成果创新价值、运营成本、成果转化成功率等多种因素的影响,高校与企业有(合作,合作);(不合作,不合作)2种稳定策略。第三,高校提供的科技成果创新价值越高,其获得的期望收益越小,合作意愿也随之逐渐减弱。第四,科技成果商业化运营成本逐渐增大至超过特定值时,由于企业面临的转化成本较高,最终将放弃与高校合作进行科技成果转化。商业化运营成本小于临界值时,成本越小,双方越容易形成合作关系。第五,科技成果转化成功率越高,高校和企业获得的收益也就越多,二者更加倾向于选择与对方合作进行科技成果转化。4 科技成果转移转化双主体行为策略演化博弈模拟仿真
4.1 对方概率选择对自身策略影响的仿真
4.2 奖励和惩罚P大于价值和成本时演化稳定策略数值仿真
4.3 奖励和惩罚P小于价值和成本时演化稳定策略数值仿真
4.4 参数改变对演化稳定策略影响的数值仿真
5 结语