新文科背景下政产学研协同育人演化博弈研究
2023-08-04徐茗臻
胡 奇,徐茗臻
(1.江西理工大学 经济管理学院;2.赣南科技学院 资源与建筑工程学院,江西 赣州 341000)
0 引言
近年来,“新文科”人才的培育在我国高等教育中的地位迅速提升,是我国高等教育顶层设计中关于文科专业建设的重要任务[1-2]。对于新文科人才的培育需要做到:①对企业进行升级改造;②增设更能符合社会发展需求的新专业;③构建社会人才培育体系以及提供充足的培育经费。在培育过程中,多主体分工合作是新文科人才培育的主要手段[3],以学校、企业、政府为主体的政产学研分别在技术、资金、政策方面给予支持和帮助[4]。但由于政府缺乏刚性的监管机制、企业缺乏合作的动力以及新文科人才培育机制还不完善,协同育人项目难以形成长期稳定的合作。因此,如何调节合作主体之间的关系对于新文科人才培育以及维持联盟关系尤为重要。通过博弈论创立各主体利益分配模型[5-6],对主体进行合作博弈问题分析,从而了解各主体行为对合作关系的影响。
演化博弈模型对政产学研稳定性的研究表明演化过程受到初始状态影响,与利益分配、奖惩金额也密切相关[7],而在市场机制下采取适当的奖惩机制可以维持合作稳定[8-9]。因此,在演化博弈研究中,需要给定初始合作状态、建立奖惩机制,并考虑市场机制和政府调控对合作各方博弈的影响。
本文基于演化博弈论建立了市场机制和政府调控下协同培育新文科人才的模型,分析了在不同情况下企业与学研机构做出的决策以及联盟稳定性的影响因素。研究表明,初始条件的设置会对联盟的稳定性产生影响,且稳定的联盟会提高新文科人才培养带来的收益;同时,政府采取协同育人的管控机制可以增强联盟的稳定性。
1 市场机制下政产学研协同育人博弈模型
学研机构、企业、政府均是利益相关者:学研机构主要负责协同育人创新,企业主要负责投入和技术转化,政府负责激励行为主体参与合作。所以在协同育人过程中,需考虑每个主体参与协同育人的投入与收益,以及其行为决策对合作的影响。各合作者间的演化博弈分析及各主体关系如图1所示。
图1 新文科协同育人各主体间关系
1.1 模型假设
对本文涉及的博弈理论模型,作出以下假设:①假设参与各方掌握的信息具有不对称性,且追求利益的最大化;②博弈的双方都处在博弈初始阶段,各主体会通过多次博弈来获取最优策略。
1.1.1 企业行为假设
企业在博弈过程中的策略选择为“参与合作”与“不参与合作”,对应的初始概率分别为x1和1-x1,x1范围为0至1。“参与合作”是指企业在遵循政府制定的奖惩机制下,选择与学研机构共同培育新文科人才的策略;“不参与合作”是指企业不选择与学研机构共同培育新文科人才的策略。
1.1.2 学研机构行为假设
学研机构在博弈过程中的策略选择为“参与合作”与“不参与合作”,对应的初始概率分别为y1和1-y1,y1的范围是0至1。“参与合作”是指学研机构在遵循政府制定的奖惩机制下,选择与企业共同培育新文科人才的策略;“不参与合作”是指学研机构不选择与企业共同培育新文科人才的策略。
1.2 其他变量设置
1.2.1 企业
假设L1为企业参与协同育人项目前的初始收益;R1为企业选择“参与合作”策略后的收益;C1为企业选择“参与合作”策略后的成本;G1为企业选择“参与合作”策略时政府给予的补贴;当政府提供政产学研协同育人优惠政策时,企业可降成本,β为政策支持力度,故βC1则为企业降低成本。
1.2.2 学研机构
假设L2为学研机构参与协同育人之前的初始收益;R2为学研机构选择“参与合作”策略后的收益;α为企业与学研方合作收益的分摊比例系数,则企业的收益为α(R1+R2),学研机构对应的收益为(1-α)(R1+R2);C2为企业选择“参与合作”策略后的成本;G2为企业选择“参与合作”策略时政府给予的补贴;故学研机构降低成本为βC2。
1.2.3 惩罚
若企业与学研机构中途退出,W为退出方支付的罚金,π为退出方在协同育人合作过程中获得的溢出收益。
以上所有参数均大于0,且α和β均为0至1范围内的实数。学研机构和企业选择合作或不合作策略时,双方所取得的收益矩阵如表1。
表1 市场机制下政产学研协同育人策略矩阵
1.3 企业与学研机构的复制动态方程
1.3.1 企业
企业选择“参与合作”或“不参与合作”的期望收益,如式(1)和(2)。
U1=y1[L1+α(R1+R2)+G1+βC1-C1]+(1-y1)(L1+W+G1+βC1-C1)=y1[α(R1+R2)-W]+L1+W+G1+βC1-C1
(1)
(2)
由式(1)和(2)可以得到企业的平均期望收益,如式(3)。
(3)
根据平均期望收益,可以得到企业选择“参与合作”策略概率的复制动态方程,如式(4)。
F1(x)=x1(1-x1)
{[α(R1+R2)-π]y1+W+G1+βC1-C1}
(4)
1.3.2 学研机构
学研机构选择“参与合作”或“不参与合作”的期望收益,如式(5)和(6)。
V1=x1[L2+(1-α)(R1+R2)+G2+βC2-C2]+(1-x1)(L2+W+G2+βC2-C2)=x1[(1-α)
(R1+R2)-W]+L2+W+G2+βC2-C2
(5)
(6)
根据式(5)和(6),得到学研机构平均期望收益,如式(7)。
(7)
由上式可以得到学研机构选择“参与合作”策略概率的复制动态方程,如式(8)。
F1(y)=y1(1-y1)[(1-α)(R1+R2)-π]x1+W+G2+βC2-C2
(8)
1.4 市场机制下政产学研协同育人策略均衡点稳定性分析
(9)
将企业与学研机构的复制动态方程如式(9),得到系统 Jacobi 矩阵如下:
(0≤a≤1,0≤b≤1),E5(a,b)为鞍点,属于不稳定状态,故演化稳定状态为E1(0,0),E2(0,1),E3(1,0),E4(1,1),分析如下:
结论一:当W+G1+βC1-C1与W+G2+βC2-C2小于0时,企业和学研机构在市场监管机制下相互博弈、相互制约,最后均不参与协同育人项目,此时(0,0)为博弈的演化稳定点,即企业需要做出自身利益最大化的决策。然而企业与学研机构在政府支持下参与协同育人项目的育人成本大于政府的补贴与对方退出所得到的罚金,即企业与学研机构的总收益均小于成本。在此条件下,协同育人项目承担的风险较大,因此企业与学研机构选择“不参加合作”策略。
结论二:当α(R1+R2)-π+W+G1+βC1-C1小于0而W+G2+βC2-C2大于0时,演化博弈稳定点为(0,1),此时学研机构会参与协同育人项目,但是企业会退出协同育人项目。原因是:α(R1+R2)-π+W+G1+βC1-C1可以转化为α(R1+R2)+G1+βC1-C1小于π-W,即企业参加协同育人的经济收益小于中途退出的收益。故在多次博弈后,企业会选择退出协同育人项目;对于学研机构,得到的政府补贴与企业的罚金大于合作初成本,不会造成经济损失。最终,协同育人项目由学研机构单独进行。
结论三:当W+G1+βC1-C1大于0而(1-α)(R1+R2)-π+W+G2+βC2-C2小于0时,演化博弈点为(1,0)。此时,企业会参与协同育人项目,但学研机构会选择退出与协同育人项目。具体来说:(1-α)(R1+R2)-π+W+G2+βC2-C2小于0可以转化为(1-α)(R1+R2)+G2+βC2-C2小于π-W,即企业得到学研机构退出的罚金与政府补贴之和大于合作的成本;学研机构退出合作的收益要大于参与协同育人项目时的收益。故在经过多次博弈后,与结论二相似,协同育人项目最终仅有企业参与。
结论四:α(R1+R2)-π+W+G1+βC1-C1与(1-α)(R1+R2)-π+W+G2+βC2-C2均大于0时,演化博弈稳定点为(1,1),此时企业与学研机构均会坚持新文科协同育人项目。这一现象解释为:α(R1+R2)-π+W+G1+βC1-C1大于0可转变为α(R1+R2)+G1+βC1-C1大于π-W,此时企业参与协同育人项目的收益大于退出合作时的收益,所以企业会选择继续协同育人项目。同理,(1-α)(R1+R2)-π+W+G2+βC2-C2大于0,可转变为(1-α)(R1+R2)+G2+βC2-C2大于π-W,则学研机构参与协同育人项目的收益大于不参与协同育人项目的收益,同样会选择继续参与协同育人项目。因此,双方均会选择“参与合作”策略。
2 政府调控下政产学研协同育人博弈模型
2.1 模型假设
2.1.1 企业与学研机构行为假设
企业在博弈过程中的策略选择为“参与合作”与“不参与合作”,对应的初始概率分别为x2和1-x2,x2范围为0至1。
2.1.2 政府行为假设
政府在博弈过程中的策略选择为“参与调控”与“不参与调控”,对应的初始概率分别为y2和1-y2,y2的范围是0至1。
2.2 其他变量设置
2.2.1 企业与学研机构
假设:L为企业和学研机构在参与协同育人前的收益;R为企业和学研机构选择“参与合作”策略后的收益;R'仅一方参与项目后获得的收益;C为企业和学研机构选择“参与合作”策略后的成本;G为企业和学研机构选择“参与合作”策略时政府给予的补贴。
2.2.2 政府
假设S为政府调控时企业和学研机构参与合作产生的社会收益,δS为政府不调控时企业和学研机构参与合作时政府获得的社会收益;S'为政府参与调控时仅一方参与合作产生的社会收益,εS'为政府不参与调控且仅一方参与合作产生的社会收益;F为政府选择“参与调控”策略时的成本。
以上所有参数均大于0,且δ和ε均为0至1范围内的实数,根据以上假设得出企业和学研机构与政府的收益矩阵如表2。
表2 政府调控下政产学研协同育人策略矩阵
2.3 企业和学研机构与政府的复制动态方程
基于表2博弈支付矩阵,遵循上述计算博弈主体的期望收益、平均期望收益与复制动态方程的步骤,得到政府参与调控下博弈主体相应的复制动态方程组,如式(10)、(11):
F2(x2)=x2(1-x2)(Gy2+R-R'-C)
(10)
F2(y2)=y2(1-y2){[(1-δ)S-(1-ε)S'-G-F]x2+(1-ε)S'}
(11)
2.4 政府调控下政产学研协同育人均衡点稳定性分析
与市场机制分析步骤相同,政府调控下的 Jacobi 矩阵为,见式(12):
(12)
结论五:当R-R'-C小于0且(1-ε)S'小于0时,此时(0,0)为系统演化稳定点,企业和学研机构、政府经过反复博弈,最终形成不合作、不调控的局面。原因是企业和学研机构合作产生的收益小于单方参与的收益,而政府的调控收益小于不调控产生的收益。最终导致企业和学研机构均放弃参与合作,且政府也会采取“不调控”策略。
结论六:当G+R-R'-C小于0且(1-ε)S'大于0时,此时(0,1)为系统演化稳定点,企业和学研机构合作的收益与政府的补贴之和小于仅一方参与协同育人的收益,最终采取“不合作”策略;而政府参与调控新文科人才的培育收益大于不参与调控的收益,会采取继续“调控”策略。
结论七:当R-R'-C大于0且(1-δ)S-G-F小于0,此时博弈的稳定点为(1,0),对于企业和学研机构而言,双方参与合作的收益大于仅一方参与协同育人带来的经济收益,故会选择“合作”策略;(1-δ)S-G-F小于0可转变为S-G-F小于δS,说明政府调控的收益减去补贴与成本之和小于不调控新文科协同育人带来的收益,故经过多次博弈后,最终选择“不调控”策略。
结论八:当G+R-R'-C与(1-δ)S-G-F大于0时,稳定点为(1,1),表明企业和学研机构会参与协同育人,且政府会参与调控,监督联盟。G+R-R'-C大于0转变为G+R-C大于R',说明企业和学研机构参与协同育人带来的收益与政府补贴之和大于仅一方参与的收益,此时选择“合作”策略;(1-δ)S-G-F大于0转化为S-G-F大于δS,说明政府获得的收益大于调控投入的成本和补贴的成本之和,最终会选择“调控”策略。
3 结论与启示
3.1 研究结论
本文基于演化博弈理论,探究新文科背景下,政府、学研机构和企业如何在市场机制与政策调控下进一步开展政产学研协同育人项目,并得出以下结论:
(1)市场机制下企业与学研机构协同育人的稳定程度与设置的罚金、政府的补贴、收益分摊系数以及政府支持力度有关,政府在资金、政策上给予的支持力度越大,越容易促成企业与学研机构的合作。
(2)政府采取的调控措施影响管理过程中的稳定性,政府应在新文科人才培养过程中适当增加监督成本等以提高合作的稳定性,从而获得稳固收益。
(3)本文运用博弈论,通过分析新文科人才培养主体决策的相互影响,丰富了政产学研协同培育新文科人才的理论体系,为我国新文科人才的培养提供了一定思路与方向,具有一定的现实意义。
由于我国新文科建设的时间较短,实践较少,本文无法较为准确地设置演化博弈过程中的具体参数。在今后的研究中需不断细化演化过程中的具体参数,通过仿真分析研究不同初始条件下政产学研合作稳定性的影响因素。
3.2 管理启示
(1)政府调控是新文科人才培养项目增收、提质的关键。政府应积极加强对政产学研协同育人项目的政策支持,通过协调、调控各主体间的收支平衡,建立适当的奖惩机制来推动新文科人才培养事业的发展。
(2)各主体应适当增加对学研机构的帮助与支持。学研机构不同于企业,其主要收入来源是新文科人才培养项目收益。当学研机构出现项目亏损时,相对于企业来说,由于缺少足够的财政支撑,其往往更容易中止项目。因此政府与企业应该在资源上为其提供适当的帮助,推动和增强学研机构参与合作的意愿。
(3)应加强对新文科人才培养项目的政策宣传和设备支持。政府应积极宣传新文科人才培养的现实意义,努力调动新文科人才培养主体的积极性,以实现政产学研深度融合。