产学研合作导向的创新生态系统
2019-07-15李小妹谢昀雅付龑钰
李小妹 谢昀雅 付龑钰
摘 要:伴随国际竞争的日益加剧,依托于单个企业的简单的个体创新已经不能支撑企业的长期发展,企业的生存更多地依赖于彼此合作的创新生态系统的发展。由此,以产学研合作导向的创新生态系统为研究对象,利用多agent仿真技术结合演化博弈理论,以大、中、小三类不同企业与学研机构的合作行为为研究对象,通过设计个体的微观演化机制,有助于观察个体策略的微观演化过程及生态系统中合作行为的宏观涌现规律。研究进一步明确了系统合作比例随演化博弈的变化过程,利用斑图演化分析了系统中个体间合作产生和维持的机制,给出了罚金对系统合作行为的促进方式,对比了学研机构和企业在不同罚金下的收益情况,为促进产学研生态合作创新行为的发展提供理论参考。
关键词:产学研生态系统;产学研合作;演化博弈;多agent仿真
中图分类号:C939 文献标志码:A
DOI:10.3969/j.issn.1008-4355.2019.03.13 开放科学(资源服务)标识码(OSID):
一、引言 随着企业所处的竞争环境不断发生变化,一些先驱性的管理实践与学术研究纷纷利用“生态系统”来刻画竞争。2014年,阿里巴巴发起可谓全世界最大规模的IPO,其在招股说明书中“生态系统”一词出现了不少于160次。此后,生态系统不仅被用于科技型企业、互联网企业,也逐渐拓展至服务业、制造业等传统领域。所谓“创新生态系统”,是聚焦特定创新以及支撑该创新的上下游互补品,“整合不同主体的独立产品,从而为顾客提供具有内在一致性的解决方案的合作安排”[1]。创新生态系统是以创新为导向的资源编排新方式,它通过接入多种类型参与者进行价值共创,依靠参与者间匹配的价值主张而非终端产品增强对顾客的锁定效果。围绕创新生态系统的研究重点在于,探究相互依赖的创新参与者如何互动,以推动有利于终端顾客的创新实现商业化,这意味着生态系统内的协调与合作制约着创新的成败[2]。
大多数关于创新生态系统的研究主要以企业为研究对象,强调企业作为创新主体的重要作用。然而,由于创新所蕴含的高技术含量、高研究属性的特征,使得掌握技术所依托之基础研究前沿的高校与科研院所在创新生态系统中扮演着关键角色,但却被已有研究所忽视。同时,拥有大量研究型人才、尖端实验设备、前期研究基础与前沿科研成果的高校与科研院所,却局限于对研究的关注而缺乏市场敏感度与商业化思维,忽略了研究成果的市场应用,阻碍了高价值研究成果的市场转化。因此,构成“学研”组合的高校与科研院所,在创新生态系统中理应实现创新驱动作用与低度嵌入创新生态系统的现实形成悖论,亟待通过生态系统内合作关系的建立以诱发产业主体与学研组合的价值共创。
理论上对创新生态系统的探讨虽然刚刚起步,但已呈现快速增长的态势。特别是针对创新生态系统中产学研个体间的合作博弈问题,有不少学者运用演化博弈理论探究了产学研合作过程的动态演化、均衡稳定性及其影響因素等。如李守伟等人构造了产学研合作创新博弈,在有限理性条件下推演出演化博弈的动态复制方程,对演化博弈的渐进稳定性进行了分析和模拟[3]。陈劲等人将协同创新概念引入创新生态系统的产学研合作演化博弈中,在构建三维动态系统下建立协同创新与简单合作的复制动态方程,并利用数值模拟方法对解析进行了直观说明[4]。罗小芳等人则分析了原始创新产学研合作模式的博弈关系,构建了相应的选择博弈复制动态方程,并进行了演化稳定性分析[5]。从这些文献可以看出,目前学者对创新生态系统中产学研合作博弈的研究主要集中于利用演化博弈方法研究演化博弈的动态过程,给出相应的复制动态方程,再利用数值模拟进行参数分析。然而,此类研究方法存在以下两方面局限:一是忽略了个体间的实际连接情况,不能明确个体的策略转变规则,无法确切地描绘复杂创新生态系统中的产学研合作问题;二是数值模拟结果较为单一,未体现不同参数连续变化对合作行为的直接影响,以及系统中个体在不同演化时刻的状态;三是对产学研个体间合作行为的研究仅仅集中在定性或简单定量分析影响合作要素的层次,忽略了创新生态系统不同个体间的相互作用及影响。这就需要我们在更为复杂而贴合实际的情况下,对创新生态系统中产学研的合作行为模式进行考量验证。
然而,对于如此复杂并不断演化的创新生态系统,我们是无法通过基于方程式的标准经济学去刻画的。而基于agent的计算机仿真技术[6],可以更为精细地研究此类问题,并直观地给出系统变量的时空演化过程。基于此,本文利用基于 agent的计算机仿真技术[7]模拟产学研合作的演化博弈过程,并针对网络外部性下创新生态系统中产学研的合作演化问题进行研究。区别于一般的基于agent的仿真,我们利用网络联结代表产学研个体间的交互关系,并让个体在博弈的视角下相互作用并进行策略演化。在赋予产学研个体充分的博弈演化时间的同时,构造出产学研合作导向的创新生态系统。本文展示了产学研个体在有限理性行为下微观的合作策略选择规律,挖掘了创新生态系统宏观上的合作创新演化规律,为揭示创新生态系统中产学研动态合作机制提供了一个新的分析角度,为提高产学研合作创新持久性提供违约成本影响的详尽分析,同时也为促进创新合作的政策制定提供理论依据。
二、创新生态系统的演化博弈属性与基本假设 企业往往要通过与具有相关科学研究能力与技术研发实力的外部科研机构建立合作来推动技术创新[8]。而对于高校及科研院所而言,参与企业的技术创新过程不仅可以带来一定的收益,从而激励科研工作者的创新热情,也可以弥补科研内容空泛的问题。不同的创新主体为了推动技术创新的实现,创造并获取更高的价值而展开紧密合作,既依托于彼此间的相互联系与适配,又取决于双方的利益分配。有鉴于此,企业与学研机构的互补属性恰好体现出了创新生态系统多主体价值主张匹配的本质属性[9]。
(一)创新生态系统的演化博弈属性
创新生态系统中每个个体与其相互熟识的其他个体产生可能的合作关系,但这种关系并非永久,而在利益面前随时可能被打破,或产生新的合作关系。也就是说,对合作或不合作(即本文中的背叛)行为的选择具有实时性,是一个演化的过程。在此创新生态系统中,企业个体与学研个体因相互间地理位置相近或研究方向相似而形成连接,又因利益的分配而相互博弈,在彼此交互中确定自身今后的博弈策略,呈现出演化博弈特征。这样一群有机组合,为了追求更高利益而实时变换自身策略的个体,共同构成了产学研导向的创新生态系统,而系统中的微观个体相互作用从而影响整个宏观系统的合作状态。因此,本文的研究重点将聚焦于创新生态系统中个体相互作用对整个生态的影响,以及合作行为产生并保留的微观机制问题。
创新生态系统中的个体在初始阶段为了追求技术上的转化或创新,尝试与其邻居中不同的互补个体以一定的概率开展合作,并在合作过程中产生超额收益。产、学、研个体决策上的改变本质上源于对更高利益的追求,因此对超额收益的分配问题不仅是产学研机构相互合作的内在动力,也是其放弃合作的主要诱因。在这个创新生态系统中,产、学、研三方不断改变自己的行动策略,以期能够更长久地生存下来。个体这一追求更高收益的策略转变过程不可能做到完全理性,因此可以通过一个策略不断调整的有限理性条件下的演化博弈来描述。 在博弈过程中,双方通过事先确定的收益矩阵来明确采取不同策略时的收益。个体通过与邻居比较收益来确定自己是否维持原有策略不变。可以想象,当个体i决定在某一轮中选择合作策略时,一旦与其进行博弈的邻居j选择不合作,则个体i的收益势必小于j的收益(只有获得更高收益才能引诱个体选择背叛)。在下一轮中,他将以更高的可能性选择不合作的行为。合作策略成为创新生态系统中的弱势策略,必将在长期的演化过程中消失。由此,整个创新生态的合作属性被系统中行为主体微观上的背叛趋向而逐步改变。然而现实世界的创新生态系统中却存在着大量的合作现象,这些合作行为通过什么得以维持?又受到哪些因素的影响?这些问题使得创新生态系统中的合作行为变得复杂而有趣。
(二)演化博弈的基本假设
为了便于仿真实验,在符合客观规律的基础上,本文设计产学研合作导向的创新生态系统时,提出如下4点假设:
1.考虑到企业所具的经济属性,以及学校和研究所具有的研究属性,我们单独考虑企业,而把学校和研究所归为一类,统称学研机构。
2. 利用简单的格子网络代表两类群体间的联结关系。其中格点代表企业或学研机构,网络连边代表二者间具有可能的博弈关系。对于一个企业或学研机构,与其相连的格点代表该个体的邻居。个体间的邻居往往具有固定性,很难在较短时间内产生大的变化。现实中,企业与学研机构间相互联系,但能够保持长期联系的单位总是固定的少数几个。鉴于此,我们假设格子网络中每个节点的联结度都为4。也就是说,企业或学研单位长期与4个“邻居”企业或机构保持联系。这类格子网络也被广泛地应用于研究生物或生态系统中种群间的竞争合作關系[10][11]。当然,现实中产学研机构存在更为复杂的联结情况——呈现出无标度或小世界属性。不同的网络联结类型势必会对创新生态系统的合作演化产生不一样的影响,这可以成为我们今后研究的一个有价值的方向。
3.不考虑企业或学研单位在规模或科研实力上的区别,认为产学研生态中每一类的个体都具有相同的属性和策略变换方式。产学研生态中,个体的生存方式传承了生物系统中物竞天择的思想。个体往往通过向其他个体学习并调整自身的策略来追求自身利益的最大化,即便是不同类型的个体,这种选择的过程也具有相似性。
4.个体非完全理性。这种非完全理性主要体现在两个方面:一方面是选择模仿对象的非理性,个体往往在众多邻居中选择一个作为模仿对象,但这个模仿对象或许并不是邻居中收益最高的;另一方面是策略变化的非理性,个体在做出策略转变时并非完全照搬模仿者的策略,而是会根据自身与模仿对象的收益差来确定一个模仿概率。虽然试图在比较中选取收益最大化的策略,但存在进行非最优选择的可能性。
基于此,我们通过充分考虑个体间的相互联系,并赋予个体在有限理性情况下追求利益最大化的权利,构建了一个具有策略自我优化属性的产学研合作导向的创新生态系统。通过多agent仿真技术,在微观上进行行为机制设计,并从微观及宏观两个维度上考察系统中合作行为的演进规律。
三、演化博弈模型构建
(一)模拟参数设定
首先,我们对机构收益进行单位化处理,设其独立运行收益SO=1。企业往往较机构具备更强的独立收益能力,二者盈利能力的差别无非可分为三种情况:1.企业规模较小,自身盈利能力有限,企业和机构盈利能力相差较小,此时设SE=10*SO;2.当企业为中等规模企业时,具备一定的研发能力,本身收益可观,较学研机构有明显的盈利优势,此时设SE=100*SO;3.对于规模庞大,已经具有良好收益能力的大型企业,较学研机构其盈利明显,则收益记为SE=1000*SO。基于此设定,我们即可对不同产学研生态下的合作行为进行全面的研究。
其次,由合作产生的超额利润DS不可能无限大,其大小应与双方各自的收益能力相关, 本文我们设定DS=b(SO+SE),其中b为收益翻倍系数。由于双方在人才、仪器、知识、营销途径等方面的储备有限,故设b=2。
第三,由于企业在合作中为学研机构提供了研究思路和成品的收益途径,而学研机构在合作中承担着主要的研究工作,二者的重要性难分伯仲,故本文设定双方的收益分配系数为a=0.5,即双方会平均分配合作产生的超额利润。
第四,如果在企业和学研机构全力合作,实现各类资源协调高效利用的情况下,双方合作的超额利润为DS,则其中某一方选择违约时,由于所有可用资源未被完全利用,其产生的额外收益S会高于双方分配的收益0.5*DS,但小于DS。这里我们取中间值,设定S=0.75*DS。
第五,从收益矩阵表1不难看出,罚金w的大小是决定个体是否选择违约的背叛行为的关键因素。故本文将主要针对不同w值下,产学研生态中合作行为的涌现及维持进行模拟研究。
(二)多agent模拟结果分析
首先,我们从整体上考察针对不同规模的企业,产学研生态下合作者比例随博弈时间步的变化情况。如前文所述,取SE=10*SO,SE=100*SO和SE=1000*SO分别代表企业和机构盈利能力区别的三种可能。在我国现有情况下,对产学研合作违约方的惩罚力度并不高,这也是导致产学研合作失败的原因之一。由此,设罚金w与额外收益成正比例关系,且惩罚较温和,取比例系数为0.3,即w=0.3*S。
如图1所示,初始状态下,设产学研系统中合作者比例为50%,企业和学研机构个体根据前文所述的策略变换规则改变自身在下一轮中的策略。博弈初始阶段,三种情况下合作者的比例皆有大幅度提高,说明即便只是温和的惩罚,也能从整体上促进系统中合作行为的产生和维持。这是由于在合作开始阶段,一些潜在的合作困难还未展现,产学研各方都对合作结果具有较高的预期。且初始阶段合作双方投入较低而回报大,本身倾向于合作行为,再加之背叛行为会产生一定的惩罚成本,使得合作行为更具诱惑。随着博弈步数的增加,合作难度逐渐加大,一些潜在的困难开始展现,合作阻力加大。但由于合作双方在前期已有投入,故未出现合作行为的大幅减少,只是合作者比例快速趋于平缓,整体上看合作保持在85%左右。原有的合作行为得到保持,而新加入的合作大幅度减少。在合作者比例rC由快速增长到趋于平缓的转换过程中,双方收益差较小时(见图1中最上方圆点),这种转变更为迅速。而当企业和机构收益能力相差较大时,这种变化却相对平缓。可以想象,学研机构的收益能力往往相差无几,企业和学研机构的收益差往往体现在企业的规模上。小型企业轻装上阵,在进行策略转变时往往更为方便。
系统中合作策略比例如何得以提高并保持在较高水平?为了回答这一问题,我们在图2中给出了博弈时间步分别为step=0,30,300时个体策略分布斑图。 此处我们依旧考察温和惩罚即w=0.3的情況。图中每一个斑块代表一个个体,斑块颜色的不同深度代表其不同的身份和策略。其中,黑色和深灰色斑块分别代表机构和企业的合作者;浅灰色和白色的斑块则分别代表机构和企业的背叛者(指选择违约的个体)。对于企业和学研机构收益能力具有大、中、小差距的情况,其策略演化斑图具有类似的演化趋势。如图2所示,在博弈开始阶段(step=0),机构及企业的合作和背叛者均匀的分布在系统中。当演化博弈进行30步后,可以看到系统中合作者的比例明显增大。不仅如此,机构和企业中的合作者联合在一起形成了合作者团簇,共同抵御外部背叛者的入侵。这相当于,合作者会聚拢成一个个小的生态系统,在良好的合作氛围中,大家会选择并保持合作策略。当博弈进行到300时间步时,聚拢的合作者团簇得到扩张,只有零星的个体保持背叛策略。如图2所示,在step=300时,系统中的合作者比例趋于定值,整个生态系统达到平衡状态。
从收益角度考虑,提高罚金会降低背叛者的收益,进而促使个体在策略转化过程中选择合作行为,故而罚金是促进合作的主导因素。我们由图3考察当罚金由零提高到额外收益S的过程中,系统中合作水平的变化趋势。依旧从企业和学研机构收益能力具有大、中、小三种差距的情况开始考虑。对比发现,当罚金较小时,三类情况下合作者比例都较低,系统中仅有10%左右的个体选择合作行为。当罚金逐渐加大,企业和机构收益能力差距较小的生态系统(图3中左1点线,对应小型企业)中,合作比例会迅速增加。当罚金w=10左右时,系统趋于完全合作的状态。当二者的收益差距加大,即对应一般情况下的中型企业(图3中间图的实叉),较小的罚金由于占其盈利比例也较小,并不能促进企业和机构的合作维持。试想当合作的一方对罚金重视程度不高时,其合作行为往往比较敷衍,双方的合作可能被各种细微的矛盾打破。当企业和机构收益差距很大时(图3中右1的实线),进一步验证了较小的罚金对于规模较大的企业和学研机构合作产生较弱的促进作用的论断。当罚金接近300时,合作比例依旧不足30%。但值得注意的是,对于小型企业,罚金的影响曲线是较为平滑的。但对中、大型企业,合作曲线会出现明显的阶跃现象。也就是说,在某些罚金额度下,提升罚金时系统的合作水平不能得到提升。系统中合作水平似乎触及到了合作的天花板,增加的罚金对企业和学研机构合作行为的刺激不再明显。但当罚金继续加大,合作的天花板会被刺破,系统的整体合作水平迅速增加。系统在两次明显的阶跃突破后,整个系统实现完全合作。这种阶跃现象对于收益差距大的企业和机构会更为明显。所以,在现实生活中对于大型企业,当增加罚金不能很好地促进双方合作时,我们或许该思考一下是否罚金水平依旧过低。
上文中我们重点考察了产学研系统合作水平的变化规律及影响因素。如图3所示,系统中的合作比例会随罚金的提高而显著提高。较高的合作水平是否会带来较高的平均收益呢?我们在图4中进一步给出了系统中不同类个体平均收益随罚金w的变化关系。鉴于不同收益差下,系统合作水平宏观上呈现类似的变化趋势,此处,我们取企业与学研机构收益能力具有中等差距(即SE=100*SO)的情况作为代表进行研究。当罚金提高时,系统的合作水平显著提高。在现实生活中,产学研合作的实现往往能够给合作双方带来更高的收益。 而罚金的增加又会从另一个角度减少系统中个体的总收入。究竟哪种影响更为显著?如图4所示,系统的平均收益并未随罚金w的增加呈现显著的正相关性或负相关性,而是展现出了类似能级分布的特性。对于学研机构(图4中左图圆点所示),其平均收益主要分布在0、100、200、300、400共5个收益级别上。并且呈现出明显的两极分布特性,即主要平均收益水平为0和400。当罚金小于80或罚金大于120时,可以观察到明显的由低收益向高收益跃迁的现象。说明对于学研机构,提高罚金往往能给其带来更高的收益。对于企业(图4中右图圆点所示),虽然企业的平均收益为零或收益较低的状态较多,但相较学研机构,其收益分级的现象相对弱化,且企业的收益上限达到学研机构收益上限的两倍左右。由于假设企业本身具有学研机构100倍的收益能力,所以平均来看在产学研系统中学研机构的收益增幅相较企业更为明显。
四、结语 本文尝试从演化博弈视角利用多agent仿真技术探索创新生态系统中企业和学研机构的合作模式。利用网络联结刻画产学研个体间的交互关系,并将个体间的相互作用描述为相邻个体间博弈和策略变换交替进行的演化过程,从而构造出产学研合作导向的创新生态系统。通过从宏观到微观全角度观察这一创新生态系统中个体合作行为的动态演化过程,本文挖掘出了合作行为的演化规律以及合作行为产生和维持的内部机制,明确了罚金在产学研合作中的地位。本文的主要研究结论如下:
第一,宏观上来看,即便只是温和的惩罚,也能从整体上促进创新生态系统中合作行为的产生和维持。系统中合作比例经历快速增长到逐步趋于稳定的过程,且在此过程中小型企业依赖于较小的转型成本,其策略转变更为迅速。
第二,本文揭示了创新生态系统中合作比例得以提高并保持在较高水平的原因。本文利用斑图演化分析了系统中合作产生和维持的机制,发现合作个体通过形成合作者团簇来共同抵御外部背叛者的入侵,更好地维持并扩张合作行为。这相当于合作者聚拢成一个个小的生态系统,在良好的合作氛围中,大家会选择并保持合作策略。
第三,结合大、中、小型企业的实际情况,本文发现了罚金对创新生态系统合作行为的促进方式,对比了学研机构和企业在不同罚金下的收益情况。研究发现当罚金较小时,三类情况下合作者比例都较低;随着罚金逐渐加大,企业和机构收益能力差距较小的生态系统合作比例会迅速增加。当二者的收益差距加大,即对应一般情况下的中型企业,较小的罚金由于占其盈利比例也较小,并不能促进企业和机构的合作维持。值得注意的是,对中、大型企业而言,合作曲线会出现明显的阶跃现象,且对于收益差距大的企业和机构更为明显。系统在演化过程中似乎出现合作的天花板,但当罚金继续加大,合作的天花板会被刺破,系统的整体合作水平迅速增加。由于现实中,在结果不可控的条件下,无限加大惩罚力度具有不可操作性。这种通过模拟的方式得到的结果,为大型企业间的合作研究提供了一条新的思路。
第四,本文進一步观察了创新生态系统中不同类型个体的平均收益随罚金的变化情况。研究发现,无论对企业还是学研机构,其平均收益皆呈现出明显的两极分布特性。对于学研机构,提高罚金往往能给其带来更高的收益。虽然企业收益分级的现象相对弱化,但其收益上限达到学研机构收益上限的两倍左右。平均来看,在创新生态系统中学研机构的收益增幅相较企业更为明显。
根据以上结论,本文得到的相关结论可以为政府制定促进不同类型创新生态系统产学研合作行为的政策提供理论依据。
参考文献:
[1] Adner R. Match your innovation strategy to your innovation ecosystem[J]. Harvard business review, 2006, 84(4): 98-107.
[2] Adner R, Kapoor R. Value creation in innovation ecosystems: How the structure of technological interdependence affects firm performance in new technology generations[J]. Strategic Management Journal, 2010, 31 (3): 306-333.
[3] 李守伟,杨玉波,李备友.产学研合作博弈演化渐进稳定性分析与计算实验研究——基于动态复制系统[J].东岳论丛,2013 (4): 120-125.
[4] 陈劲,殷辉,谢芳.协同创新情景下产学研合作行为的演化博弈仿真分析[J].科技进步与对策,2014,31(5):1-6.
[5] 罗小芳,李柏洲.企业原始创新产学研合作模式的选择——两种模式选择的演化博弈分析[J].软科学,2014, 28(8):1-6.
[6] 鲜于波,梅琳.经济复杂性系统主体学习算法理论综述[J].复杂系统与复杂性科学, 2007,4(2):77-92.
[7] Xie Y Y, Chang S H, Yan M, Zhang Z P, Wang X Y. Environmental influences on cooperation in social dilemmas on networks[J].Physica A: Statistical Mechanics and its Applications,2018,492:2027-2033.
[8]李守伟,陈永泰,司春林,彭本红.基于 KIBS 的企业技术创新能力形成与演化[J].系统管理学报,2011,20(4):421-427.
[9] Arthur W B. Complexity and the Economy[M]. Oxford University Press, 2014.
[10] Kessler D A, Levine H.Pattern formation in Dictyostelium via the dynamics of cooperative biological entities[J]. Physical Review E,1993,48:4801-4804.
[11] Iwasa Y, Nakamaru M, Levin S A. Allelopathy of bacteria in a lattice population: competition between colicin sensitive and colicin-producing strains[J]. Evolutionary Ecology,1998,12:785-802.
[12] Szabó G, Tke C. Evolutionary prisoners dilemma game on a square lattice[J]. Physical Review E, 1998, 58(1): 69.
[13] Blume L E. The statistical mechanics of strategic interaction[J]. Games and economic behavior, 1993, 5(3): 387-424.
Abstract:With the increasing international competition, simple individual innovation based on a single enterprise can no longer support the longterm development of the enterprise. The survival of enterprises depends more on the development of innovative ecosystems that cooperate with each other. Therefore, this paper takes industryuniversityresearch cooperationoriented innovation ecosystem as the research object. The results are given by using multiagent simulation technology combined with evolutionary game theory, and by taking the cooperative behaviors of different scale enterprises and academic institutions as the research objects. By designing the mechanism of individuals, we can study the microevolution process of individual strategies and the macroscopic emergence of cooperative behaviors in ecosystems. The changing of the proportion of system cooperation with the evolutionary game is clarified. The mechanism of cooperation and maintenance among individuals in the system is analyzed by using the evolution of pattern. The promotion of fines on system cooperation is given, and the payoff of academic institutions and enterprises in different fines is compared. This paper provides a theoretical reference for promoting the development of ecological cooperation among industry, university and research institute.
Key Words: industryuniversity research ecosystem; industryuniversityresearch cooperation; evolutionary game; multiagent simulation