APP下载

考虑参照依赖的企业合作创新演化博弈分析

2020-03-03方易新杜少甫

中国管理科学 2020年1期
关键词:稳定性收益矩阵

杨 剑,方易新,杜少甫

(1.安徽大学管理学院,安徽 合肥 230039;2.新泽西理工学院,美国新泽西 纽瓦克;3.中国科学技术大学管理学院,安徽 合肥 230026)

1 引言

随着产业结构变化、社会分工的细化以及经济区域一体化趋势的发展,合作创新逐渐成为主要的技术创新组织形式,也成为创新管理领域的研究热点之一,许多学者从不同角度对合作创新进行了研究。目前国内外关于合作创新的研究内容涉及到多个方面,包括合作创新的组织管理模式[1-3],合作创新绩效及其影响因素[4-6],合作创新的动因等[7-8]。

合作创新不是一个时点上的静态问题,应当用动态的思维去分析其在不同阶段的特点,注重创新主体之间的持续协调问题。因此,合作创新的一个重要研究方向是针对合作主体之间的行为以及由此形成的相互关系的研究,从动态的角度分析合作创新的演化特征及其稳定性,目的是探讨合作创新主体之间的演化机理,减少合作中的机会主义行为,保持合作创新的持续性。这些研究按照研究方法大体可以分为两类:

一类是社会网络分析方法,如张瑜等[9]通过优化Shapley值,研究了创新主体在合作创新过程中的利益协调问题;Ahrweiler等[10]运用基于agent的创新网络知识动态仿真方法研究知识经济背景下的产学研合作连接;刘丹和闫长乐[11]基于复杂网络与生态系统的理论,分析了协同创新网络的结构和运行机理。另一类是博弈分析方法,如Baglieri等[12]建立了不对称研发联盟的合作博弈模型;易余胤等[13]运用演化博弈理论分析了企业间合作创新中的机会主义行为;张洪潮和何任[14]对非对称企业间的合作创新关系进行了演化博弈分析;刁丽琳[15]对合作创新中的知识窃取和保护进行了演化博弈研究,认为只有惩罚机制和对未来收益的制约才能杜绝机会主义行为。

现有的研究大多是建立在创新主体完全理性的假设之上的,然而,由于创新主体自身条件、认知能力、社会环境和资源等各方面的限制,创新主体并非是完全理性的,其行为潜在地受到认知和情绪的影响[16]。目前在创新管理领域引入有限理性假设的研究成果尚不多见,如浦徐进和诸葛瑞杰[17]从过度自信和公平关切角度对装备制造业等合作研发绩效进行研究。Pisano等[18]认为行为因素对于研发的延迟有影响,包括计划编制失误、不切实际和过度自负等。赵骅和姚韵[19]基于有限理性视角探讨了政府研发补贴对研发绩效的影响。

有限理性假设涉及的行为倾向理论比较丰富,其中之一是参照依赖,最早由Kahneman和Tversky在前景理论中提出,认为决策者的效用并不是由决策结果的绝对效用水平决定的,而是以某个参照点为基准,由结果相对于参照点的损益变化决定的。参照点可以是个体当前财富水平、绩效水平等现状,也可以是目标绩效、期望等对未来的预期。参照依赖效应是不随情境的改变而消失的, 具有普遍性和稳定性,因此,参照依赖效应在行为决策[20]、供应链管理[21]等领域得到了一定的应用,但是在创新管理领域,目前考虑参照依赖效应的研究成果比较鲜见,如吕雯雯等[22]基于参考点理论探讨了家族期望、创新投入和创业坚持之间的关系。

综合上述分析,本文试图以有限理性为假设前提,改变传统的期望效用理论,引入参照依赖分析创新主体的效用,进而分析合作创新主体之间的关系特征,构建合作创新博弈收益感知矩阵,并基于该矩阵对合作创新博弈双方的行为进行演化博弈分析,使有限理性假设贯穿于博弈双方在收益感知和博弈决策的全过程中,从而更加符合合作创新的现实。

2 企业合作创新动态博弈

2.1 企业合作创新博弈关系分析

企业的合作创新行为实质上是企业之间的博弈过程,由于在理性意识、分析推理能力、识别判断能力和准确行为能力等多方面具有局限性,企业具有有限理性,在进行合作创新博弈的过程中, 企业往往不会一开始就找到最优策略,而是会在博弈过程中学习博弈,根据其他博弈方的策略和自身的适应性,通过不断调整寻找较好的策略,最大化自身收益。合作创新是一个动态变化过程,而演化博弈正是针对有限理性的博弈方,将博弈分析与动态演化过程相结合的分析方法,博弈方的均衡策略是不断调整和改进的,而不是一次性选择的结果,因此,本文运用演化博弈理论来对企业合作创新行为进行分析。

2.2 模型假设

假设1:企业A和B是产业集群内的两家企业,两者在合理的利润分配和成本分担的基础上实现研发合作。但是企业为了自身的利益,可能会采取机会主义行为。

假设2:企业A和B是在不确定性情况下选择策略时,博弈双方都是有限理性个体,不能通过一次博弈就找到获取最佳收益的策略,而是必须经过重复博弈来实现。

假设3:博弈双方进行策略选择的依据是前景理论中的价值函数。根据参照依赖理论,企业对合作创新收益进行评价时,有一定的参照基准,企业以实际收益相对于参照点的损益变化为依据作出策略选择,以Δπi表示事件i发生后,博弈方的实际收益与参照点相比的损益离差,Δπi=πi-π0,其中,参照点为博弈方在各种策略下的预期收益。运用前景理论的价值函数形式V=∑iω(pi)v(Δπi)来表示博弈方的收益,其中ω(pi)是决策权重函数,表示对事件i发生的客观概率pi的主观认知,v(Δπi)是博弈双方基于参照依赖效应的感知效用。

假设4:企业A和B可以选择“合作”与“不合作”的策略,其中“不合作”策略是指双方未达成合作意向,或者是指合作未能坚持下去,一方由于机会主义原因选择背叛合作关系。如果双方都选择“合作”策略,则双方采取积极合作的态度,共享必要的创新资源。如果双方都选择“不合作”策略,则不存在合作行为。如果双方中一方选择“合作”,一方选择“不合作”,则“合作”策略的一方坚持合作,提供了必要的资源,而“不合作”策略一方则选择中途违约,利用对方的知识外溢,独立开展研发以获得收益。

2.3 收益感知矩阵的构建

假设企业A和B都选择“合作”,企业A的感知收益为V1-hI,其中V1表示合作成功后企业A对收益的感知效用,I为合作创新的成本,h为企业A分摊的成本比例,相应的,企业B的感知收益为V2-(1-h)I,其中V2表示合作成功后企业B对收益的感知效用。

假设企业B选择“合作”策略,而企业A选择“不合作”策略,则企业A的感知收益为V3+θ1R-C,其中V3表示企业A终止合作而独立创新后对收益的感知效用。因为企业A先于对方背叛合作而具有一定的先行优势,所以θ1R是指企业A由于自身学习能力θ1以及合作中的共享资源R,通过知识溢出等途径获得的额外收益。C是博弈方在终止合作关系后的违约成本。而企业B的收益为C-(1-h)I,是获得的企业A赔偿的违约成本与自身在合作中投入的差值。

相反,假设企业A选择“合作”策略,而企业B选择“不合作”策略,则企业A收益为C-hI,企业B的感知收益为V4+θ2R-C,其中V4表示企业B终止合作而独立创新后对收益的感知效用,θ2是企业B对学习能力。

假设企业A和B都选择“不合作”策略,则双方合作关系不存在,双方收益各为0。

基于以上假设,构建合作创新的博弈收益感知矩阵如下:

表1 合作创新的博弈收益感知矩阵

在上述收益感知矩阵中,V1,V2,V3,V4为博弈双方的感知效用。

当博弈双方都采用“合作”策略时,合作创新的成功概率为p,总收益为π,企业A和B的收益分配比例分别为k和(1-k)。此时,博弈双方以没有建立合作关系时的收益,即0作为感知价值参照点,v(0)=0。感知价值V1,V2分别为:

V1=ω(p)·v(kπ-0)+ω(1-p)·v(0)=ω(p)·v(kπ)

(1)

V2=ω(p)·v((1-k)π-0)+ω(1-p)·v(0)=ω(p)·v(π-kπ)

(2)

当博弈双方中一方采用“合作”策略,另一方采用“不合作”策略时,企业A和B在采用“不合作”策略时独自创新成功概率分别为p1和p2,独自创新成功后收益分别为π1和π2,并且分别以合作创新成功的收益kπ和(1-k)π作为感知价值参照点,感知价值V3,V4分别为:

V3=ω(p1)·v(π1-kπ)+ω(1-p1)·v(0-kπ)=ω(p1)·v(π1-kπ)+ω(1-p1)·v(-kπ)

(3)

V4=ω(p2)·v(π2-(1-k)π)+ω(1-p2)·v(0-(1-k)π)=ω(p2)·v(π2-(1-k)π)+ω(1-p2)·v(kπ-π)

(4)

3 演化博弈模型构建

假设企业A选择“合作”策略的概率为x,选择“不合作”的概率为1-x,假设企业B选择“合作”策略的概率为y,选择“不合作”的概率为1-y。由于博弈双方信息不对称,上述收益感知支付矩阵不存在纯策略纳什均衡,但具有混合策略纳什均衡,博弈双方通过过去信息推测对方的策略,策略选择的概率x和y存在动态调整,其表现是双方策略在博弈的动态复制中的演化。根据演化博弈理论中的复制动态分析方法,企业A选择“合作”策略期望收益为:

U11=y(V1-hI)+(1-y)(C-hI)

(5)

企业A选择“不合作”策略期望收益为:

U12=y(V3+θ1R-C)+(1-y)·0

(6)

企业A的平均期望收益为:

(7)

企业B选择“合作”策略期望收益为:

U21=x[V2-(1-h)I]+(1-x)[C-(1-h)I]

(8)

企业B选择“不合作”策略期望收益为:

U22=x(V4+θ2R-C)+(1-x)·0

(9)

企业B的平均期望收益为:

(10)

根据公式(5)-(10),构建企业A和B的复制动态方程:

(11)

(12)

4 策略的进化稳定性分析

根据Friedman[23]提出的利用雅克比矩阵局部稳定性分析方法,求解博弈系统的进化稳定策略。利用J代表雅克比矩阵,Det(J)为该矩阵的行列式,Tr(J)为该矩阵的迹。可得到由式(11)、(12)构成的微分方程组的雅克比矩阵如下:

该矩阵行列式为:

Det(J)=(1-2x)[y(V1-V3+θ1R)-C-hI](1-2y)[x(V2-V4-θ2R)+C-(1-h)I]-(x-x2)(V1-V3-θ1R)(y-y2)(V2-V4-θ2R)

该矩阵的迹为:

Tr(J)=(1-2x)[y(V1-V3-θ1R)+C-hI]+(1-2y)[x(V2-V4-θ2R)+C-(1-h)I]

根据雅克比矩阵局部稳定性的进化稳定策略(ESS)判定方法,当Det(J)>0,且Tr(J)<0时,该系统的状态为进化稳定状态,据此条件对平衡点进行稳定性分析。对复制动态方程的推论分以下几种情况:

推论1:当C-hI<0,且C-(1-h)I<0时,即在企业合作博弈中,背叛合作关系的企业提供的赔偿难以弥补合作企业所投入的成本时,根据系统的雅克比矩阵稳定性分析可知,系统的进化稳定均衡点为(0,0)和(1,1)。具体结果如表2。

表2 局部均衡点稳定性分析结果1

推论2:当C-hI≥0,且C-(1-h)I≥0时,即在企业合作博弈中,背叛合作关系的企业提供的赔偿可以弥补合作企业所投入的成本时,则出现类似于鹰鸽博弈的局势,根据系统的雅克比矩阵稳定性分析可知,系统的进化稳定均衡点为(0,1)和(1,0),无论博弈企业双方会根据一定的概率选择“合作”与“不合作”的策略,最终都会出现一方选择“合作”,另一方选择“不合作”。具体结果如表3。

表3 局部均衡点稳定性分析结果2

推论3:当C-hI≥0,且C-(1-h)I<0时,即如果企业B背叛合作关系后提供的赔偿可以弥补企业A所投入的成本,而如果企业A背叛合作关系后提供的赔偿不能弥补企业B所投入的成本时,根据系统的雅克比矩阵稳定性分析可知,系统没有进化稳定均衡点,将围绕E5(x*,y*)进行螺旋运动。当C-hI≤0,且C-(1-h)I>0时,结果相同。具体结果如表4。

表4 局部均衡点稳定性分析结果3

5 模型结果分析

因为该演化系统的目的是使得参与博弈的企业双方能够都选择“合作”策略,保持合作创新的稳定性,所以使系统收敛于进化稳定均衡解E4(1,1),可以杜绝机会主义行为发生,保持稳定的合作创新是最优选择。而且在实践中,坚持合作的企业在被对方背叛后,获得的补偿一般难以弥补自身投入的成本。根据对策略进化稳定性的分析,推论1符合上述要求,可以使系统收敛于E4(1,1)。因此,本文接下来着重探讨推论1的情况,分析影响合作关系稳定性的相关参数。

5.1 复制动态方程分析

图1 合作创新博弈双方复制动态和稳定性

从图1中可以看出,(0,0)和(1,1)是这个博弈的进化稳定策略,在此复制动态进化博弈中,当初始情况落在区域Ⅰ时会收敛到(0,0),当初始情况落在区域Ⅲ时会收敛到(1,1),当初始情况落在区域Ⅱ和Ⅳ时,则要看演进情况,如果区域Ⅲ的面积SⅢ大于区域Ⅰ的面积SⅠ,则会有更大的可能收敛于(1,1)。因为本博弈的目的是使博弈双方通过长期的学习和策略调整,能够都选择“合作”策略,使系统收敛于进化稳定均衡解(1,1),所以SⅢ越大,相对应的SⅠ越小,系统收敛于(1,1)的可能性越大,可以通过分析影响SⅠ大小的因素,来分析相关因素对企业合作创新策略选择的影响。

可知系统演化路径主要与博弈双方的感知价值V1,V2,V3,V4,以及I,R,C,h,θ等项参数相关,下面分别对其予以讨论。

5.2 感知价值参数分析

由于上述使得系统收敛于E4(1,1)的条件中,涉及到博弈双方的感知价值V1,V2,V3,V4,在现实中的博弈各方是有限理性的,导致其在策略选择过程中可能产生认知和价值判断的偏差,从而使得系统难以达到最优点。因此,本文引入前景理论对其加以分析。

结论1:参考终止合作后独自创新,企业对合作创新感知的效用越大,即V1-V3和V2-V4越大,企业保持合作创新的可能性越大。

证明:

随着企业合作创新与终止合作后独自创新的感知价值差距越大,区域Ⅰ的面积SⅠ递减,相应的,区域Ⅲ的面积SⅢ递增,说明对比终止合作后独自创新,企业合作创新获得更大的感知价值时,企业保持合作的可能性越大。

根据V1、V2的表达式,可知其大小受到收益的价值函数和关于创新成功率的感知函数的影响,所以如果要增加企业合作创新成功的感知价值,除了要增加实际收益外,一个重要的方面是考虑提高对创新成功率的感知,企业如果对合作创新失败的风险感知越高,ω(1-p)越大,则V1、V2越小,越有可能导致合作创新的失败。

此外,影响企业收益感知的因素还包括权重函数ω(p1)、ω(p2),即博弈双方主观判断事件发生的概率。前景理论认为,有限理性的主体具有过度自信的行为倾向,趋向于过高地估计自身知识或信息的准确性,对自己信息赋予的权重大于事实上的权重。因此,企业在获得一定的合作伙伴知识资源后,倾向于高估终止合作而独自开发的成功概率,对自身创新能力的评价越高,ω(p1)>p1,ω(p2)>p2,导致感知的V3和V4大于实际中的价值,而V3、V4越大,则企业保持合作创新的可能性越小,影响合作关系的稳定性,合作关系越容易破裂。

结论2:合作成功的收益分配系数k过大或者过小,即如果合作企业在地位、规模等方面不对称,合作双方收益分配不均衡,会导致合作关系稳定性下降。

证明:根据式(1)—(4)的定义,以及前景理论价值函数的定义:

其中,γ为边际递减敏感性程度系数,λ为损失厌恶程度系数。可得到:

因此,对于企业A,合作成功的收益分配系数k越大,感知价值V1越大,区域Ⅲ的面积SⅢ递增;对于企业B则正相反,合作成功的收益分配系数k越大,则(1-k)越小,感知价值V2越小,区域Ⅲ的面积SⅢ递减。所以对于博弈双方的企业来说,都希望从合作成功的收益中分配更多的利益,合作成功的收益分配系数k过大或者过小,即如果收益分配不均衡,博弈中的一方会选择背叛合作关系,导致合作关系可持续性不高。由于在实践中分配系数大多是由合作双方的地位、规模等因素决定的,这也说明当合作企业的地位、规模等方面不对称时,机会主义发生的可能性较大。

结论3:企业合作创新的违约成本C越高,企业保持合作创新的可能性越大。

证明:

随着违约成本C的增加,区域Ⅰ的面积SⅠ递减,区域Ⅲ的面积SⅢ递增,可见违约成本对于合作关系的稳定具有重要作用,合作违约成本的提高,可以有效减少企业的机会主义行为,提高合作稳定性,降低合作的风险。

结论4:企业的合作创新成本I越小,企业保持合作创新的可能性越大。

证明:

随着合作创新成本I的减小,区域Ⅰ的面积SⅠ递减,区域Ⅲ的面积SⅢ递增,合作创新的概率越大。因此,合作创新过程中,应尽量压低合作的成本,这不仅是研发的资金投入,还包括由于相互之间沟通的低效率、信息传输不畅等因素造成的成本增加。

结论5:企业从合作中吸收转化的共享资源越多,即合作中企业对共享资源的吸收转化率θ越大,则合作的稳定性越低。

证明:

·(V1-V3-θ1R)-2>0

·(V2-V4-θ2R)-2>0

随着企业从合作的共享资源中吸收转化的资源越多,θ1R和θ2R越大,区域Ⅰ的面积SⅠ递增,区域Ⅲ的面积SⅢ递减,企业保持合作的可能性越小。这里的共享资源主要指的是知识产权方面的资源。在合作创新中,虽然知识产权方面有协议的保护,但在实践中仍然难以杜绝知识外溢、关键技术泄漏流失、逆向开发的风险。因此,企业对共享资源吸收转化的效率越高,企业的机会主义行为倾向越强,双方的合作关系越不稳定,这也解释了实践中企业合作创新的对象大多是上下游纵向企业、科研院所等不同性质的合作方,少有与同质竞争对手的合作。

6 企业合作创新的数值分析与验证

为了更好地分析考虑参照依赖的企业合作创新行为演化规律,本文运用Matlab进行数值模拟仿真,通过调整参数和观察仿真过程,探讨合作创新过程中的最优稳定策略。根据模型基本假设,设定参数取值:C=5,I=12,R=4,θ1=0.7,θ2=0.8,h=0.5,系统演化的初始点(x0,y0)为(0.2,0.8)。基于以上初始值,通过20次重复博弈仿真,分析如下:

6.1 合作创新与终止合作后独自创新的感知价值差距的敏感性分析

从图2(a)和(b)可知,合作创新与终止合作后独自创新的感知价值差距存在临界值,当大于这一临界值时,企业选择合作的概率收敛于1,相反则收敛于0,随着感知价值差距的增大,收敛于1的速度加快,即相对于终止合作,企业对合作创新感知的效用越大,合作的稳定性越高。

图2(a) 感知价值差距对x的演化影响

图2(b) 感知价值差距对y的演化影响

6.2 收益感知影响因素的敏感性分析

根据V1、V2、V3、V4的表达式,可知其大小受到收益的价值函数和关于创新成功率的感知函数的影响,因此,本文进一步对价值函数中的边际递减敏感性程度系数γ,损失厌恶程度系数λ,以及对自主创新能力认知的权重函数ω(p1)和ω(p2)进行敏感性分析。

从图3和图4可知,当边际递减敏感性程度系数或者损失厌恶程度系数大于某一临界值时,企业选择合作的概率收敛于1,相反则收敛于0,随着系数的增大,收敛于1的速度加快。从图5可知,企业对自身创新能力的评价越高,企业选择不合作行为的概率越大。

图3(a) 边际敏感性系数对x的演化影响

6.3 合作收益分配系数敏感性分析

图6表示合作创新收益分配系数k分别赋予不同数值时系统的演化情况,可见只有当收益分配较为均等时,企业才会趋向于选择合作的策略,而收益分配不均衡时,博弈中的一方会选择背叛合作关系。

6.4 其他参数的敏感性分析

图7表示的是不同合作创新的违约成本下,企业合作策略选择的演化情况,可见只有当违约成本达到一定程度时,才能保持合作的稳定性,随着违约成本的降低,企业选择合作的概率越快地收敛于0。

图3(b) 边际敏感性系数对y的演化影响

图4(a) 损失厌恶系数对x的演化影响

图4(b) 损失厌恶系数对y的演化影响

图5(a) 自身能力认知对x的演化影响

图5(b) 自身能力认知对y的演化影响

图6(a) 收益分配对x的演化影响

图6(b) 收益分配对y的演化影响

图8表示的是不同合作创新成本下,企业合作策略选择的演化情况,只有当企业合作创新的成本低于某一临界值时,合作创新才能保持稳定,随着合作创新成本不断升高,企业选择合作的概率收敛于0的速度越快。

图9表示的是企业对共享资源的学习能力对企业合作策略选择的影响,当企业对合作创新的共享资源具有越强的学习能力时,即可以有效地将共享资源转化为自身资源时,合作创新稳定性下降。

图7(a) 违约成本对x的演化影响

图7(b) 违约成本对y的演化影响

图8(a) 合作创新成本对x的演化影响

图8(b) 合作创新成本对y的演化影响

图9(a) 共享资源转化率对x的演化影响

图9(b) 共享资源转化率对y的演化影响

7 结语

合作创新是由不同价值感知的博弈方互动博弈的动态过程,企业对收益的感知、合作创新成本及其分担、共享资源、企业学习能力、违约成本等都是影响合作创新的重要因素。为了实现合作创新稳定性,需要根据不同的目标采取针对性的策略。

第一,通过政策引导、建立信用机制等方式,增强企业对长期的战略性合作创新收益的感知,也可以采用逐步推进的方式,从小型的合作开始,不断增加合作内容和强度,这也与实践中有关企业合作创新的经验相契合[24]。

第二,引导企业对自身创新能力合理的感知,防止企业在合作过程中产生过度自信,过高地估计已获取的知识或信息等创新资源的作用,过高地估计自身的独立创新能力。

第三,控制合作创新的交易成本。合作企业之间应建立完善的协调沟通平台,降低合作企业之间的沟通成本;建立有效的合作创新治理模式和运作机制,提升信任度,降低监督成本;政府要加强科技成果转化、科技中介服务、创新风险投融资等平台建设,降低谈判成本。

第四,选取合适的合作创新对象。一方面,在选择合作对象时要考虑能够优势互补的企业;另一方面,应考虑合作双方在地位、规模等方面不能相差过大,否则在收益分配和成本分担中必然出现差距较大的情况,这也将导致合作关系的不稳定。

本文中博弈双方博弈机制设定还比较简单,策略空间也有一定程度简化,未进行更为细致深入的建构,对其背后复杂的互动机制还没有进行深入的研究,这也是今后进一步的工作。

猜你喜欢

稳定性收益矩阵
结构设计稳定性保障策略研究
PEG6000修饰的流感疫苗脂质体的制备和稳定性
抬升角对食蚜蝇飞行动稳定性的影响
纳米级稳定性三型复合肥
多项式理论在矩阵求逆中的应用
其他综合收益的几个重要逻辑关系解析
矩阵
矩阵
矩阵
建设银行利增6.1% 日赚6.2亿