基于专利知识流网络的技术融合分析
2021-06-07李慧孟玮徐存真
李慧 孟玮 徐存真
关键词:专利;知识流;技术融合;生长曲线;社会网络分析;马尔可夫模型;石墨烯
随着经济全球化和科学技术的不断发展,一项技术的性能开始满足消费者在多个市场领域的需求.这些领域之间的差异逐渐变得模糊,导致企业的竞争地位发生根本变化。作为当前创新趋势的一个重要特征,技术融合不仅可以改善技术功能和提高产品竞争力,还为应对挑战和获得竞争优势带来了新的机遇,相关企业和研究机构需要理解技术融合对于追求创新和经济增长的作用。
鉴于技术融合在工业和经济发展中的重要作用,系统和广泛地理解是什么推动了技术融合至关重要,而专利记录了技术信息最详细的发展历程。因此,本文首先使用历年累计专利数量拟合Logistic生长曲线识别出目标领域所处的生命周期,并将数据划分到不同的阶段,然后在每个阶段构建知识流网络.最后分别从微观层面和宏观层面分析了石墨烯领域在不同生命周期的关键技术融合成分和产业融合规律。
1相关研究工作
技术融合的概念由Rosenberg N在20世纪60年代提出,80年代引起了学者们的广泛关注。Schnaars S等认为技术融合是两种或两种以上不同技术的结合,这种结合可以创造新产品甚至新产业.Choi J Y等将技术融合定义为不同应用领域的技术转化为新的技术单元的过程.汤文仙认为技术融合的过程实质上就是技术在不同产业之间扩散的结果,Stieglitz N从产业发展视角将技术融合分为技术替代和技术整合,Kim J等将技术融合分为相互关联的融合和中间融合,前者的所有技术彼此密切相关,并广泛交流知识,而后者意味着有一种特定的技术可以调节技术的融合。技术融合在微观层面体现于不同技术之间的知识流动,本文中技术融合是指由知识的流动导致的技术变化.若构成一项技术的多种知识元与其他技术之间发生了知识流入或流出关系,就形成了技术融合。
在用于监测技术融合的众多数据源中,专利数据蕴含着可靠且新颖的信息和技术创新知识.因此被广泛使用。现有的基于专利的技术融合研究主要有两类。一是专利引文分析,Kim J等基于引用矩阵和DSM排序算法研究了信息技术和生物技术的融合:翟东升等将专利引文网路扩展为技术类别之间的引用网络并分析其中的知识流,从而识别出技术融合创新的轨道和强度:Park I等根据引用关系预测了生物技术和信息技术之间潜在的技术知识流动,提出了融合的技术机会,使R&D的决策者能够规划新的R&D技术融合项目。这类方法的局限性在于仅有少数几个数据库提供专利引文数据,而且专利引文并没有提供额外的技术信息,因此得到的技术之间的融合关系并不全面。二是专利共类分析,苗红等通过LDA模型和SVM分类算法找出智能手机专利数据中融合特征较强的专利子集并使用德温特手工代码构建技术共类矩阵.然后通过融合度指标和中介中心性测算技术融合程度和融合过程中的关键技术:Choi J Y等根据IPC共现分析将专利映射到技术类别,然后对技术的收敛程度做实证分析并估计了总体扩散趋势:慎金花等在IPC共现网络上应用Louvain算法划分不同技术社群,并挖掘出各社群的技术主题,通过定义指标找出融合价值较高的技术融合关系进而发掘未来的技术机会:王宏起等综合考虑了多技术领域之间的相互作用对技术融合的影响.提出基于Katz指标的技术融合方向预测方法并对中国电动汽车产业做实证分析。这类方法没有考虑到主分类号和副分类号之间的区别。
综上所述,目前的相关研究中,要么仅仅考虑了专利内部的IPC分类码代表的技术知识之间的关系,要么只考虑了专利引用造成的技術知识的流动,本文以IPC分类码为纽带,综合考虑专利内部的主副分类号以及专利的引用关系构建技术知识流网络.并在此基础上进行技术融合分析研究。
2相关理论与研究方法
本研究的整体流程主要包括选择目标技术领域和数据库、数据获取与预处理、专利知识流网络构建、基于SNA指标识别关键融合成分、基于马尔可夫模型的产业融合预测分析5个步骤,逻辑关系如图1所示。
前两步的主要目的是收集可靠的数据并使用Logistic生长曲线判断目标领域的生命周期并将数据划分到不同阶段,第三步是构建专利知识流网络.第四步和第五步分别从微观和宏观层面分析技术融合规律。
2.1专利知识流网络构建方法
专利数据的两个显著特征使其成为研究技术融合的有效来源,即清晰的IPC代码层次结构和代表知识流的引用信息。目前很多专利分析相关的研究都使用IPC4代码进行研究,其提供了一个相对均衡的技术知识体系.可以较好地反映融合过程中的多样性。因此,本文将专利视作技术的体现,并使用IPC4分类码表示专利中蕴含的技术知识。这样专利数据中的知识流动就可以分为两类,示意图如图2所示。
对于节点对,记S为始点,T为终点,且S≠T,视为技术知识从S向T流动。一方面,每个专利通常都有不止一个IPC号,在所有IPC号中主IPC号最能代表技术创新.其与其他副IPC号之间的关系可以视为知识流动的方向,即主IPC号生产知识而副IPC号接受知识,如图中、和;另一方面,专利引文同样可以反映技术创新和知识的流动,即被引专利的IPC号代表的技术知识流向了施引专利的IPC号,如图中、等。
2.2微观:基于SNA指标识别关键融合成分
社会网络分析(Social Network Analysis,SNA)的相关研究者提出了很多网络指标用以分析节点的特性以及节点之间的关系。本文使用中介中心性和接近中心性指标分别从“控制”和“参与”两个角度量化知识流网络中IPC节点的性质,进而识别出其中的关键融合成分。
2.2.1中介中心性
中介中心性是衡量节点全局重要性的著名指标之一.中介中心性高的节点有更多的机会控制资源的流动。节点的中介中心性越高,则该节点越具有联系性,在知识流动中越有效。中介中心性的定义如式(1)所示。
2.2.2接近中心性
不同于中介中心性,另一个指标接近中心性计算的是某个点到其他所有点的距离的综合,这个综合越小就说明这个点距离其他所有点越近,是网络中的“社交达人”。接近中心性的定义如式(2)所示。
2.3宏观:基于马尔可夫模型的产业融合预测分析
2.3.1构建产业融合网络
上文构建的专利知识流网络是基于专利IPC号的微观层面的分析,为了进行宏观层面的分析,相关研究大多采用WIPO提出的IPC技术索引表或Eurostat提出的IPC-ISIC标准将专利的IPC号与不同的工业领域进行映射。由于专利的IPC号在不断地增加,因此本文选择时间上最近的2015年10月发布的第二版IPC-ISIC标准,利用该标准可以将IPCv8与NACE代码对应起来,其中3位数NACE代码版本的映射表共涉及66个不同的工业领域。
利用这种映射机制将专利知识流网络转化为产业融合网络,产业融合网络的节点为不同NACE代码所代表的产业,节点之间的连边为有向边,权重为专利知识流网络中对应流向的边的权重之和,具体的转化过程示例如图3所示。
2.3.2基于马尔可夫的产业融合分析
马尔可夫模型常被用来研究事物发展过程中,不同状态变化时的关联性特征。研究流程的Step2中根据生命周期理论将目标领域划分为不同的发展阶段,对于处在同一发展阶段的不同年份,产业融合的转移概率变化较小,因此可以将该阶段的产业融合网络的矩阵形式作为该阶段各年份的状态转移矩阵,由于该矩阵中的元素是计数变量,因此需要做横向标准化处理,将产业融合网络的矩阵形式表示为式(3),则横向标准化处理方法见式(4),处理后得到状态转移概率矩阵如式(5)。
其中m表示产业融合网络中的节点数量,Na表示节点i到节点,的有向边的权重。
这样就可以基于马尔可夫过程对产业之间的融合进行预测,从预测起始点开始,可以得到多步转移概率见式(6)。
3实证分析——以石墨烯领域为例
3.1数据介绍与生命周期分析
本文在检索和收集数据时使用著名的DII(Derwent Innovation Index)国际专利数据平台,确定检索式为“T1=(Graphene 0r Graphenes)”,截至2020年7月11日共得到53 869条数据。使用专利的申请日期作为相关时间点,绘制历年专利数量、累积量以及拟合的Logistic生长曲线如图4所示。
由于专利从申请到公开的周期通常为18个月左右_2引.因此检索到的2019年和2020年的数量并不准确.所以在拟合S曲线时只考虑2018年及以前的数据,图中黄线为“数量可信线”,黄线右侧的点不参与Logistic曲线拟合。
从图4中可以看出.检索到的最早的石墨烯专利在1999年,自2010年起专利数量迅速增加,2012年、2016年和2018年是数量曲线上的极大值点。而根据生命周期理论,一项技术的发展应该经历萌芽期、成长期、成熟期和衰退期,拟合Logis.tic曲线的饱和值K为79000,借鉴文献[29]中计算各成长阶段的方法.定义萌芽期为专利开始出现到10%饱和点,成长期为10%饱和点到曲线拐点,成熟期为拐点到90%饱和点,衰退期为成熟期结束之后,计算得到10%饱和点、拐点、90%饱和点的横坐标分别为2013.252、2017.478、2021.703,由于90%饱和点超过了2020年,因此石墨烯的发展尚未度过成熟期,图中用虚线表示了不同生命周期的界限。此外,按照2.1节中的描述,本文将施引专利和具有不止一个4位IPC号的专利视为融合专利.其他专利为非融合专利.分别统计了每一年份的融合專利和非融合专利的数量.发现除2000年没有数据外,其他年份的融合专利占比均在55%以上,这也进一步说明了技术融合对于技术创新的重要性。
3.2构建专利知识流网络
根据图4的结果,将数据按照技术生命周期分为3个阶段,每个阶段构建有向网络,由于构建技术网络时使用了引用信息,而划分时间段会造成引用关系的割裂.本文的处理方式是若一条引用关系的被引专利和施引专利分属不同的时间段,则将该引用关系涉及的专利间技术流动完全归于施引专利所属的时间段,这是因为“引用”这一过程产生的知识流动事实上发生在施引专利进行引用的时刻。最终得到生命周期各阶段的相关信息如表1所示。
从表1中的数据可以看出,相比于单个的内部知识流网络或引用知识流网络,融合后的网络具有了更多的节点和边.侧面说明了本文构建的知识流网络更加完备。此外,由3.1节的分析可知,石墨烯发展的成熟期尚未结束,只看萌芽期与成长期可知.网络的节点数和边数都在增加,而且当前成熟期的节点和边已经与成长期较为接近,预计成熟期结束后会反超,这也符合技术的发展特点。3个阶段网络的图密度很小.并且还在随时间不断减小,而平均路径长度的变化正好相反,这说明虽然节点和边在增加,但是网络却越来越稀疏。3个阶段的连接组件参数很小,说明虽然网络在不断扩大,但网络的连通性并没有因此变弱。最后使用Gephi软件分别可视化3个阶段的知识流网络如图5所示。
3.3关键融合成分分析
为了识别石墨烯领域核心的技术融合知识单元.分别计算3个阶段的中心性指标并做归一化处理.每个阶段均取中介中心性Top15和接近中心性Top15的节点的并集作为分析对象,并使用两种中心性指标的平均值作为分割线绘制坐标图进行分析。
1)Period1(萌芽期)
在图6(萌芽期)展示出的节点中,C01B(非金属元素)、H01L(半导体器件或电固体器件)和B82Y(纳米结构的制造、测量或应用)的中介中心性非常高,但是接近中心性却比较低,说明它们在这一阶段的石墨烯领域的整体发展中发挥了重要作用。G21G(化学元素的转变)、G08C(测量值、控制信号或类似信号的传输系统)和E21D(竖井;隧道;平硐;地下室)则正好相反,这些节点的接近中心性较高.但是中介中心性却比较低.说明它们是相对多技术融合的参与者,是这一阶段石墨烯的具体应用。此外还可以发现节点的中介中心性的分布比接近中心性的分布更加均匀。
2)Period2(成长期)
图7展示了石墨烯领域成长期的重要技术节点的网络指标测度结果,可以看出C01B(非金属元素)和C08L(高分子化合物的组合物)具有较高的中介中心性,接近中心性比较高的节点有很多,如F16M(非专门用于其他类目所包含的发动机或其他机器或设备的框架、外壳或底座)、F27D(一种以上的炉通用的炉、窑、烘烤炉或蒸馏炉的零部件或附件)、B25D(冲击工具)、B30B(一般压力机)、F27B(一般馏炉、窑、烘烤炉或蒸馏炉,开式烧结设备或类似设备)、G10D(弦乐器,管乐器,手风琴或六角手风琴,打击乐器)和G21D(核发电厂),说明这一阶段开拓了很多石墨烯的应用场景。
3)Period3(成熟期)
图8展示了第3阶段的重要技术的节点重要性测度结果,可以看出C01B和C08L仍然有很高的中介中心性,此外,B32B(层状产品,即由扁平的或非扁平的薄层)的中介中心性超过了C08L,说明石墨烯的技术方向发生了转变。接近中心性较高的节点变化很大,只有F04F(通过与其他流体直接接触或通过利用被泵送流体的惯性泵送流体)和H03F(放大器)占据了很高的接近中心性,说明这一阶段又开拓新的应用领域,值得注意的是,成熟期尚未结束,后续还会有其他的技术发展和变化。
3.4产业融合分析
由于IPC-ISIC标准共有66个不同的产业,为了使研究更具有针对性,同时保证各阶段涉及产业的连贯性,根据具体情况将3个阶段的产业融合网络中边权重大于100的节点的并集作为分析的重点,满足条件的产业共有37个。由3.1中的分析可知,当前石墨烯领域处于成熟期,因此本文对石墨烯的成熟期最终产业占比进行预测,将37个产业在第3阶段产业融合网络转化为矩阵形式.并做横向标准化,部分结果如表2所示。
将第2阶段的最后一年2017年的产业占比作为初始状态,统计2017年所有专利涉及的分类号对应的产业占比,得到初始状态向量为π(0)=0.02089,0.00632,0.00630,0.00027,0.37893,0.00391,0.07272,0.01367,0.02530,0.01399,0.00637,0.00602,0.02614,0.00271,0.01885,0.01494,0.00533,0.00346,0.10252,0.00500,0.00590,0.02173,0.00187,0.09777,0.02213,0.00682,0.01305,0.00256,0.02828,0.00112,0.00224,0.03901,0.001889,0.00271,0.01327,0.00279,0.00319,按照生命周期分析的結果,石墨烯领域结束成熟期的时间点在2021年与2022年之间.因此2018-2021年的产业融合概率矩阵均可用表2所代表的矩阵表示。因此成熟期结束时的产业占比可近似计算为π(4)=π(0)P=0.01A.A4.,0.00249,0.00228,0.00109,0.47576,0.00744,0.02378,0.00701,0.01914,0.01586,0.00941,0.01279,0.01469,0.00441,0.00884,0.02055,0.01224,0.0049,0.12723,0.00465,0.00354,0.02264,0.00318,0.04081,0.02417,0.00624,0.00709,0.00204,0.01958,0.00123,0.00204,0.05376,0.00221,0.00321,0.00991,0.00247,0.00686。
分别统计3个时间段的产业占比,将其与预测出的成熟期结束时的产业占比可视化为曲面图,如图9所示。
从图9可以看出,11(焦炭和精炼石油产品制造)、13(农药及其他农药的生产)、35(其他金属制品的制造)和44(电动机的制造;变压器及配电控制装置)等产业的变化较为明显。限于篇幅,下文仅对产业44的产业占比变化以及变化过程中涉及的产业融合进行详细分析,首先取各阶段中产业44与其他36个产业之间的流人和流出数据,共有6列数据,然后分别取每一列数据中权值大于该列权值均值的节点和边,最终将融合过程可视化为图10。
从图10可以看出,产业44一直都有技术流出的产业有11(焦炭和精炼石油产品制造)、45(电池和蓄电池的制造)、53(金属成型机械及机床制造),一直都有技术流人的产业有13(农药及其他农药的生产)、31(武器弹药制造)、32(锻造;金属冲压和滚压成型;粉末冶金)、39(消费电子产品制造)、50(通用机械制造)。此外,17(人造纤维的制造)、52(农林机械制造业)等产业主要在第1阶段,21(其他非金属矿产的制造)、60(医疗和牙科器械及用品的制造)等产业主要在第2阶段,36(电子元件和电路板的制造)等产业主要在第3阶段与产业44发生技术融合。
4总结与展望
知识的流动产生了技术融合,技术融合可以造就新的产业机会,专利作为一种高创新性资源,蕴含了技术融合的过程。本文根据前人的研究提出一种考虑更全面的技术网络构建方法,然后使用社会网络分析的方法对关键融合成分进行识别,并从宏观角度分析技术融合所引起的产业融合过程。以石墨烯领域为例进行实证分析.发现石墨烯领域当前处于生命周期的成熟期阶段,从各个阶段的关键融合成分来看,当前石墨烯领域的发展侧重于在不同产业的具体应用上;另一方面,通过马尔可夫模型预测了成熟期结束时与石墨烯有关的各产业的占比,并详细分析了产业44在整个生命周期内的融合规律。
由于技术和方法的限制.本文尚存在一些可以改进的地方。一方面,专利主副IPC之间和专利引用过程中的知识流动的权重应该是有区别的,但是在本文的研究中没有体现出来,具体的量化方法还需要深入研究;另一方面,知识流动不仅发生在专利文献一种资源中,还有专利与其引用的科技论文之间的知识流动,也可以进一步做相关研究。