合作研发策略选择问题的动态演化分析
2022-03-29刘敬伟黄成节蒲勇健
刘敬伟,黄成节,蒲勇健
(1.茅台学院,贵州 仁怀 564500;2.重庆大学 经济与工商管理学院,重庆 400040)
一、引言与文献综述
创新是引领发展的第一动力,合作研发是国家创新战略的核心内容之一。合作研发作为一种互惠型合作关系,是以资源优势互补为前提,以合作方的共同利益为基础,以合作创新为目的,通过彼此之间的契约等实现协同行动而自愿形成的组织[1]。它具有实现资源优势互补、降低研发风险、提高研发效率和成功可能性的优势。
针对合作研发问题,国内外学者从不同角度开展了一系列富有成效的研究。在合作研发的合作机制方面,郑月龙(2015)针对以企业为主体的共性技术合作研发形成机制,以演化博弈为理论基础进行了研究[2]。朱晨、杨晔(2018)基于交易成本理论和演化博弈理论,以成本视角为出发点探究本土企业与跨国公司合作研发的诱发机制[3]。Sara Amoroso(2017)的研究表明:合作研发中的知识溢出、风险与成本的合理分摊、企业规模以及创新活动类型等与企业参与不同类型研发联盟的决策有关[4]。
在合作研发的合作模式方面,陆玉梅等(2019)运用博弈论方法研究了资金和知识投入对产业技术创新战略联盟合作研发模式的影响,分析了独立研发模式、资金分担模式、共同研发模式下的产业技术创新战略联盟的知识和资金投入决策问题[5]。
在合作研发的激励与绩效方面,耿智琳、张耀峰(2012)基于多代理人的模拟仿真方法分析了自主创新企业合作研发中企业平均收益的影响因素,建立了考虑补贴激励的纵向合作研发利润分配的演化博弈模型,以解决自主创新企业中新产品合作研发的利润分配问题[6]。RenéBelderbos等(2004)实证分析了竞争对手、供应商、客户、高校及研究机构四类合作研发伙伴之间不同的研发合作组合形式对企业绩效的影响[7]。
以合作研发中的机会主义行为研究方向,易余胤等(2005)运用演化博弈理论对企业间合作研发过程中的机会主义行为进行演化分析,以及监督机制对防范机会主义行为的有效性[8]。苏中锋(2019)通过构建博弈模型,着重分析了合作研发的控制机制与机会主义行为的关系,丰富了对机会主义行为研究[9]。
另外,Nisvan&Daniel(2009)在允许自由进入研发竞争和产品市场的条件下,分析了随机型研发产出溢出模型中合作研发协议的效果[10]。René等(2004)探讨了创新企业进行合作研发决策的决定因素的异质性[11]。Mário&Silva(2018)建立了一个理论框架来研究采用专有技术交易策略对研发合作程度的影响,证明了非合作企业向行业披露其专有技术的预先承诺可以有效地引导参与者进行合作研发投资[12]。Deming等(2017)通过区分两种不同类型的合作伙伴,研究了非对称溢出在研发合作稳定性中的作用,并运用博弈论方法揭示了横向和纵向合作研发中非对称溢出与研发投资的关系[13]。
通过梳理相关文献可以发现,国内外学者对合作研发的多个方面都进行了一些富有价值的研究,不管是研究内容还是研究方法都取得了一定的成效。在企业之间合作研发的策略选择问题上,一部分研究侧重于运用经典非合作博弈方法,在完全理性的假设下分析合作者之间的策略选择问题[14],另一部分研究是运用合作博弈的思路,对合作研发策略进行分析。基于有限理性的动态演化分析方法在合作研发的策略选择问题上的研究多数集中在诸如机会主义或搭便车等合作研发的风险分析[8,9]。文章基于有限理性假设,以演化博弈的视角,运用动态演化的理论和方法,对合作研发的策略选择问题进行分析。
二、模型构建
1.演化博弈
演化稳定策略(Evolutionary Stable Strategy,ESS)和复制动态(Replicator Dynamics)是演化博弈最核心的概念,它们分别描述了演化博弈的稳定状态和向这种稳定状态收敛的动态过程。其中,演化稳定策略主要描述了系统在动态演化过程中的稳定状态,单群体情形下,演化稳定策略(ESS)的定义如下:
定义(Maynard Smith)[15]:如果策略s*∈S满足以下两个条件,则称s*是演化稳定策略(ESS)。
条件1:对任意的s∈S且s≠s*,有u(s*,s*)≥u(s*,s);
条件2:即使u(s*,s*)=u(s*,s),也有u(s*,s)>u(s,s)。
演化稳定策略是:在自然选择的作用下,如果整个种群中的每一个成员都采取这个策略,那么,不存在一个具有突变特征的策略(即突变策略)能够侵入这个种群[15]。
而复制动态是演化博弈论中运用最为广泛的选择机制动态方程,它刻画了一个群体中采用某种策略的个体所占比例的变化过程。单群体情形下复制动态方程可以用以下微分方程给出(Taylor&Jonker)[16]:
式中,xi表示在某时刻t选择纯策略si的个体在群体中所占的比例;
u(si,s)表示群体中选择纯策略si的个体的适应度或期望支付;
u(s,s)=∑xi·u(si,s)表示群体平均期望支付或适应度。
当dx/dt为x的单元函数时,上述复制动态方程可简记为:若x*满足F(x*)=0且F(x*)<0,则x*即为演化稳定策略(ESS)。
在演化博弈中,博弈双方的策略选择收敛至均衡状态的过程是一个动态过程,通过复制动态方程分析这个动态过程的稳定性,可以确定系统的均衡性复制动态方程是描述某一特定策略在一个群体中被采用的频数或频度的动态微分方程。以“演化稳定策略”和“复制动态方程”为建模基础,通过构建合作研发策略选择问题的演化博弈模型,可以分析其动态演化的内在机制。
2.模型假设与支付矩阵
为简单起见,不妨假定进行合作研发的行为主体有两个:企业A和企业B,他们的策略集均为(合作研发、独立研发)。“合作研发”策略下,双方按照达成的协议进行合作研发;“独立研发”策略表示双方不进行合作,各自进行独立研发,也表示在合作过程中有一方单方面违约,终止合作关系而进行独立研发。
第一,若两个企业都选择“独立研发”策略,假设在这种不合作状态下各自进行独立研发获得的正常收益分别为π1、π2,且π1≠π2,π1,π2>0;
第二,若两个企业都选择“合作研发”策略,则假设在正常收益基础上由双方合作研发而获得的超额收益为Δπ,且有Δπ>0;假设超额收益在双方之间的分配系数为k,0≤k≤1。
第三,若两个企业中有一方选择“合作研发”策略,另一方选择“独立研发”策略,这种情况描述的是双方合作关系达成后,一方由于反悔或者机会主义行为等原因背叛合作约定而造成违约,从而使得双方的合作关系被迫终止。此时,违约方由于在合作过程中的信息、资源共享等原因,能够依靠自身学习能力,通过知识溢出等途径获得额外收益,记为R,R>0,但同时需支付一定的违约成本C,C>0,即违约方支付给履约方的罚金等。为着眼于系统动态演化机理的分析,避免复杂的数学讨论,又不失合理性,这里假设C>R。
基于上述对问题的描述和假设条件,可以构建双方博弈策略的支付矩阵,如表1所示。
表1 博弈策略支付矩阵
三、模型求解与分析
1.复制动态方程
演化博弈论中的复制动态方程源于群体概念,当其用于研究个体之间的博弈时,可以把个体选择某个纯策略的概率视为群体中选择该纯策略的个体所占的比例。因此,假设企业A选择“合作研发”策略的概率为x,选择“独立研发”策略的概率为1-x;假设企业B选择“合作研发”策略的概率为y,选择“独立研发”策略的概率为1-y。在有限理性和信息不对称的前提下,上述支付矩阵不存在纯策略纳什均衡,但存在混合策略纳什均衡,并且博弈双方策略选择的概率x和y存在动态调整,这种动态调整表现为双方策略在博弈的动态复制中的演化[3]。根据演化博弈复制动态的分析方法,进行如下计算:
企业A选择“合作研发”策略的期望收益:
企业A选择“独立研发”策略的期望收益:
企业A的平均期望收益为:
企业B选择“合作研发”策略的期望收益:
企业B选择“独立研发”策略的期望收益:
企业B的平均期望收益为:
根据以上计算结果,可以分别建立企业A和企业B的复制动态方程。
企业A的复制动态方程为:
企业B的复制动态方程为:
显然,当F(x)=0、F(y)=0时,博弈达到一种相对稳定状态,此时可以得到该动态演化系统的五个局部均衡点:(x,y)={(0,0),(0,1),(1,0),(1,1),(x*,y*)},其中当且仅当0≤x*,y*≤1时,均衡点(x*,y*)存在。
2.演化稳定性分析
根据Friedman提出的利用雅克比矩阵(Jacobi Matrix)分析动态系统局部稳定性的方法,进行演化稳定性分析并求解演化稳定策略[17]。复制动态方程式(7)、式(8)分别对x和y求偏导数,可得该博弈系统的雅克比矩阵(Jacobi Matrix,J),并计算该矩阵的行列式Det(J)和迹Tr(J)如下:
根据雅克比矩阵的行列式的符号和迹的符号,可以判定系统局部均衡点的稳定性,即当Det(J)>0、Tr(J)<0时,系统处于演化稳定状态[18]。据此,对上述五个局部均衡点进行稳定性分析。先计算各均衡点处雅克比矩阵的行列式和迹的表达式,结果如表2所示。
表2 各均衡点处雅克比矩阵的行列式及迹的表达式
根据表2中矩阵行列式和矩阵的迹的表达式,结合上文假设C>R,及x*与y*的解的表达式,可以分以下几种情况进行讨论:
第一,当kΔπ-R>0,(1-kΔπ)-R>0时,即双方通过合作研发获得的超额收益大于终止合作而因知识外溢等获得的额外收益;第二,当kΔπ-R<0,(1-kΔπ)-R<0时,即双方通过合作研发获得的超额收益小于终止合作而因知识外溢等获得的额外收益;第三,当kΔπ-R>0,(1-kΔπ)-R<0时,或当kΔπ-R<0,(1-kΔπ)-R>0时,即一方通过合作研发获得的超额收益大于终止合作而因知识外溢等获得的额外收益,而另一方则相反。分析结果如表3所示。
表3 各均衡点稳定性分析结果
四、数值模拟
根据以上局部均衡点的稳定性分析及演化稳定策略的求解结果,可以利用matlab绘制四种不同情况下的动态演化相位图(左图)和动态演化路径(右图),如图1-4所示。
图1 kΔπ-R>0,(1-k)Δπ-R>0,取k=0.6,Δπ=3,R=1,C=1.5
从相位图上看,四种情况下系统均收敛于(1,1),证实了E4(1,1)是演化稳定策略(ESS),也就是说在模型假设条件下,博弈双方的动态演化策略均为“合作研发”;从演化路径来看,无论博弈双方初始状态如何,随着时间的推移,最终也都会收敛于“合作研发”策略,同样印证了E4(1,1)是演化稳定策略[19]。
图2 kΔπ-R<0,(1-k)Δπ-R<0,取k=0.4,Δπ=1.5,R=1,C=1.5
图3 kΔπ-R>0,(1-k)Δπ-R<0,取k=0.6,Δπ=2,R=1,C=1.5
图4 kΔπ-R<0,(1-k)Δπ-R>0,取k=0.4,Δπ=2,R=1,C=1.5
五、结论与政策启示
1.研究结论
文章基于有限理性假设,建立动态演化博弈模型,分析企业之间合作研发策略选择问题的演化路径及演化稳定策略,并通过数值模拟与仿真,得到:首先,企业之间合作研发的策略选择问题可以看作是一个动态演化过程,在违约成本严格大于因违约而获得的额外收益这一关键假设条件下,无论初始状态如何,博弈双方的策略选择最终会收敛于合作研发而不是独立研发,从该动态演化系统的相位图中可以清晰地观察到。其次,合作研发获得的超额收益的分配系数并不是关键变量,仅影响博弈双方的收敛速度,而不影响收敛结果,从该动态演化系统的演化路径图中可以得到直观的认识。最后,数值模拟显示,合作研发产生的额外收益越大,双方的收敛速度越快。
2.政策启示
合作研发对于企业技术创新无疑有着重要的意义,合作研发的优势也是有目共睹的,但合作研发面临的最大风险是机会主义行为的存在,在一定的条件下,需要采取有针对性的措施来克服机会主义行为对合作研发带来的不良影响。根据以上模型分析的结论,文章得到如下促进合作研发的政策启示。
一是加大对机会主义行为的惩罚力度,降低其机会主义行为的收益。可以在合作契约中赋予双方较大的违约成本作为惩罚因子。数值模拟表明:违约成本越高,合作研发的双方越趋于演化稳定策略。具体措施包括,在政府或者产业协会的指导下,建立企业声誉机制,通过声誉机制,增强企业之间合作研发的信任度,进而能够使合作企业更方便地选择合适的合作研发伙伴;合作研发双方之间建立良好的、顺畅的信息沟通机制,使合作双方的合作信息公开化、透明化[20]。
二是降低合作研发成本,提高合作收益。通过数值模拟,合作研发产生的额外收益越高,合作双方的策略选择越趋于模型中的演化稳定策略。降低合作研发成本的途径包括建立合作研发过程中的知识共享、信息共享、设备共享、人才共享等合作共享机制。在降低直接成本的同时,可以在合作研发过程中适当增加监督成本,加大监督力度,其目的也是为了防范合作研发过程中机会主义行为的产生。
三是建立合理的收益分配机制。合理的收益分配机制能够增强双方的合作意愿,收益分配机制的建立不一定按照双方的资金成本分摊比例来分配,也不一定按照双方投入的人、财、物等资源的比例来进行分配,而是需要建立一套科学、合理、公平的分配机制来保证双方的合作能够进行下去,不至于中途因反悔或者机会主义行为而背叛合作,以保证合作关系的稳定性。一个可行的方法是利用合作博弈的Shapley值来解决双方合作收益的分配问题。
3.进一步讨论
以上研究仅讨论了两方对称博弈的情形,对于非对称博弈和多方演化博弈未做考虑;同时,为了简化分析,对合作研发的风险未做考虑,有些情况下,合作研发可能不成功,存在一定的合作风险,这可以通过在模型中增加风险系数予以适当处理。在后续研究中,可以从合作博弈的角度分析合作研发的收益分配关系从而建立稳定的合作机制,也可以从机制设计的角度阐述合作研发的机制演化,又可以从产业内以及不同产业之间的多方演化博弈机制来研究合作研发的群体动态演化路径和演化机制。