基于专利IPC的技术知识流网络挖掘
2016-02-15磊杨
周 磊杨 威
(1.武汉纺织大学会计学院,湖北武汉430200;2.武汉东湖新技术开发区管委会,湖北武汉430079)
基于专利IPC的技术知识流网络挖掘
周 磊1杨 威2
(1.武汉纺织大学会计学院,湖北武汉430200;2.武汉东湖新技术开发区管委会,湖北武汉430079)
本文将专利共类关系界定为生产知识(主分类号)和接收知识(副分类号)。在此基础上,引入IPC技术索引表将共类矩阵转换为技术知识流网络。基于德温特创新索引(DII)收录的4G技术专利,利用块模型方法挖掘4G技术知识流网络,发现了兼具内聚性和外联性的关键技术子群。
技术知识流网络;专利挖掘;国际专利分类;块模型;4G
科学技术是第一生产力。习近平总书记要求我们“不能做其他国家的技术附庸”,要“着力攻克一批关键核心技术”,实现产业技术“从跟随到并行再到领跑”。知识管理流派提出,企业核心竞争力的来源正是其特有的、不易外泄的专有知识和信息[1];这一复杂的知识体系能为企业带来持续性的竞争优势[2]。开放创新理论要求企业整合外部研发资源、科学知识和技术成果,冲破封闭创新模式的“技术必须源于自我发明的陷阱”,构建开放的技术创新价值链[3]。在开放创新模式下,企业、行业、地区、国家之间的技术知识交流更加频繁,异源知识之间的充分碰撞不仅有利于提升规模经济效应和范围经济效应,还将通过协同创新效应催生重大技术领域的突破性创新。本研究以复杂的技术知识流网络对研究对象,利用社会网络分析方法观察知识交流活动,以期发现技术知识流动的规律和核心技术群。
1 相关研究综述
知识流的本质是知识在不同主体之间的传统及知识处理的机制[4]。知识从位势高的主体流向位势低的主体,主体的知识存量、主体间的知识流量和流向、知识自身的属性特征均会对企业的动态能力产生影响[5]。知识资源在组织内部的重组与再造是企业创新活力的重要来源,组织间的知识流运动对提升高技术企业技术创新能力有显著的正效应[6]。产业集群中,主导者通过与境外企业、科研单位、跟随者、群外企业等进行知识交流,由最初的“知识接收者”转变为“知识获取者”,最后成长为“知识创造者”和“知识输出者”,从而影响产业结构的演进与合理化[7]。那么,应当如何测度技术知识流呢?这个问题是技术创新领域的研究热点和难点。Krugman认为知识流动是无形的,因而不能被测度[8]。然而,Jaffe等人指出知识流动的踪迹常以专利的形式存在,因而可以利用专利来测度[9]。经济学研究常用的知识流的经验测度方法分为4类:技术流量法、成本函数法、生产函数法、文献追踪法。技术流量法基于投入——产出关系建立技术流动矩阵,从而研究技术知识在企业或行业间的溢出模式。实际运用过程中,技术流的测度变量包括就业数量[10]、技术距离[11]、专利引用[12]、地理距离的倒数[13]等。不过,该方法也存在忽略技术研发的时空作用、重视垂直溢出而忽略水平溢出等不足。技术溢出的一大效益在于降低成本,成本函数法正是基于这一思想以投入产出的相对价格为变量,分析知识溢出的成本削减效应。生产函数法运用计量模型估计技术溢出对全要素生产率或创新的影响。文献追踪法基于专利或专利引用测度知识外溢的效果,因而被视为直接测度了知识流;有研究建议将专利与其他知识流指标组合运用,如出版物、技术许可等[14]。
情报学研究中亦采用专利引用关系来测量知识流活动,企业通过专利引用获得的知识净流入量对增强组织技术实力有正向影响[15]。从专利引用的效度考虑,企业整体的专利引用情况较单件专利引用更能准确揭示技术知识的流动[16]。然而,专利引用分析法的不足之处亦较显著。一是专利引用存在滞后性,只能作为历史经验总结,对预测性研究的指导作用较弱。二是在许多国家和地区,如中、日、韩等,专利引用是非强制性的,从而加剧了数据获取的难度。正是由于这些限制,越来越多的研究将专利共类网络作为研究技术知识流的载体。目前,形成了基于国际专利分类号(International Patent Classification,IPC)、美国专利分类号(United States Patent Classification,USPC)、德温特专利分类号(Derwent Classification,DC)等分类体系的专利共类网络研究范式,用于发现技术主题间的知识交流特征[17]、科学技术之间的知识溢出作用等[18]。
综上所述,技术知识流已成为经济学、技术创新、情报学等多学科关注的焦点问题之一,专利共类分析为深入认识技术知识流网络的结构特征提供了便利。然而,基于专利共类的研究方法仍存在亟待提升的空间。其一,技术知识流是知识流动的过程,必然存在知识输出方和知识接收方。主流的专利共类方法只考虑了技术知识间的关联强度,而忽略了知识流的方向性。这一局限性极大地限制了对技术知识流活动规律的探索。其二,Griliches指出,专利分类体系和产品、产业类别存在不一致,造成了专利归类和使用的不便[19]。IPC等专利分类标准是一套技术工程师的交流语言,如何才能让高级管理人员和行业规划制定者理解和掌握晦涩的专利知识呢?这是提升技术知识流网络挖掘结果可读性和决策支持力度的关键。针对以上问题,本研究根据研究专利主分类号、副分类号间的差异性,在传统的共类矩阵的基础上建立了非对称的技术知识流网络;通过建立IPC和产业技术主题间的映射机制,将工程语言转化为通识语言,从而揭示和阐述行业发展的关键技术群。
2 技术知识流网络挖掘的研究框架
2.1 技术知识流的方向性与定量测度
OECD手册中将专利共类作为衡量技术链接的潜在指标之一[20]。为了尽可能地锁定较广泛的权利范围,一件专利通常被赋予多个IPC号,每个IPC号对应一个特定的技术领域。尽管,专利的各IPC号通常被等同对待,但主分类号与专利技术创新的相关性最高,它与其他副分类号间的关系可以视为知识流动的方向[21-22]。由此,将专利分类号分为两类:一是专有的知识,即发明信息;另一类是非专有的知识,即附加信息[23]。一件专利中,发明的专有知识被分配给单一的技术号,其他相关知识则被分配给多个副分类号。也就是说,专利共类的实质是主分类号生产知识而副分类号接收知识[24]。
基于此,将技术知识流的测度分为3个步骤:(1)确定研究的技术主题和专利数据库,检索、下载并清洗专利数据;(2)以IPC体系为例,分析每一件专利的IPC号,将第一个专利分类号标记为主分类号,其余的分类号标记为副分类号;(3)以主分类号为行、副分类号为列,建立矩阵,各元素的取值为该位置对应的主分类号与副分类号共类的次数。
2.2 专利IPC与技术领域的映射机制
目前,多数研究使用Verspagen等提出的IPC-ISIC分类标准(第二版)来判断专利自身归属的行业类别。IPCISIC将欧洲专利局使用的IPC号码和联合国规定的经济活动国际工业分类标准关联起来。国内也有研究《国民经济行业分类与代码》、《高技术产业统计分类目录》等体系,但研究的规范性和操作的便利性都低于IPC-ISIC标准。总体来看,上述标准体系适合对涉及多个产业经济部门的大型、复杂技术系统进行分析。相比之下,IPC技术索引表(IPC-Technology Concordance Table)更适于研究高度专业化的技术系统,它将IPC小类(前4位)和电子工程、仪器、化工、机械工程、其他5个部门(Sector)、35个技术领域(Field)对应起来,能够较好地反映技术及其领域划分[25]。
2.3 技术知识流网络构建与分析
基于此,将技术知识流网络的构建与挖掘过程分为3个步骤:(1)针对技术群自身的特征,选择适合的专利——技术方向映射标准。如研究全局专利或多工业部门协同创新群时,可以选择IPC-ISIC等标准;如研究专业化和内聚性较高的创新群时,必须寻找中观尺度的技术领域划分标准。(2)建立计算机可读的专利IPC和技术领域间的叙词表,即将单件专利的IPC号映射为技术领域,从而将IPC共类矩阵转换为技术知识流网络。(3)由于技术知识流网络属于非对称结构,因而不能采用聚类分析进行分析。有研究使用过结构洞分析[26-27]、块模型分析[28]、MDS的ALSCAL分析[12]等方法进行处理非对称矩阵,本文可借鉴之。
3 实证研究——以4G技术为例
4G是指第四代移动通信技术及通信标准,是相对于3G的下一代通信网络。国际电信联盟(ITU)将数据传输速度达到100Mbits/s的通信技术定义为4G技术。4G通信技术以传统通信技术为基础,通过融入新的通信技术来不断提高无线通信的网络效率和功能。4G通信将为用户提供一种超高速无线网络,其最明显的优势在于通话质量及数据通信速度。4G通信技术包括TD-LTE和FDD-LTE两种制式。长期演进技术(Long Term Evolution,LTE)是由第三代合作伙伴计划组织制定的通用移动通信系统技术标准的长期演进。LTE预计将成为第一个真正的全球通信的无线通讯标准。LTE被外界视为4G无线的事实标准,升级版的LTE-Advanced满足国际电信联盟对4G的要求。下文将以LTE标准技术专利为例,探索4G技术知识流的运动特征,为国内企业抢占该领域技术高地提供战略支持。
3.1 数据源与分析工具
本文选择DII为数据源,它将德温特世界专利索引(Derwent World Patents Index,WPI)和专利引文索引(Patents Citation Index,PCI)有机地整合在一起,数据可以回溯到1963年,是目前最为权威的全球专利数据库。为了更加直观地反映领域技术的创新情况及企业的创新活力,DII将属于同一专利族的相关专利整合成一条记录,因而检索结果数量通常低于国家知识产权局检索系统的命中数目。以LTE为关键词,在DII中检索此类专利的申请情况,命中记录11 073项。
本文使用的数据分析工具包括Thomson Data Analyzer(TDA)、EditPlus和社会网络分析软件UCINET。TDA是汤森公司推出的一款适用于结构化数据分析与文本挖掘的综合分析软件,其强大的权利人清洗功能是研究跨国公司全球技术布局的得力助手。本研究利用TDA对4G技术领域的专利进行清洗、建立专利分类号与技术产业类别间的关联关系。本研究利用EditPlus建立权利人间的叙词表,用以指导跨国企业子机构间的合并;建立IPC小类和技术领域间的叙词表,用以指导技术创新领域的识别。本研究使用UCINET的块模型(Blockmodels)处理非对称矩阵。块模型从网络整体结构考虑,将一个网络中的各个行动者分成若干个离散的子集,即“块”。同一个块中的各个行动者具有结构对等性(structural Equivalence)[29]。本文中将知识输出和知识接收对象皆相同的技术领域定义为结构对等。在此基础上,分3个步骤进行技术知识流网络挖掘:(1)采用CONCOR方法对行动者分区,即把各个行动者分配到各个块;(2)基于α-密度标准,确定每一块是取0还是取1;(3)画出0~1块的相矩阵(Image Matrix)和简化图,直观地揭示出技术知识流网络中各技术领域间的互动关系。
3.2 4G技术知识流网络挖掘
3.2.1 4G专利的共类矩阵构建
针对每一件专利,将第一个IPC号作为主分类号,其余的IPC号作为副分类号,取IPC号小类(前4位)建立共类矩阵。横行为主分类号,即知识生产者,纵列为副分类号,即知识接收者,矩阵的取值为IPC号共类次数,如表1所示。3.2.2 4G专利IPC的技术领域映射
表1 4G专利共类矩阵(部分)
考虑到IPC-ISIC更适合于研究跨经济部门的协同创新;而4G技术的专业化程度高,因而,选择IPC技术索引表作为技术领域划分标准。如出现IPC效率隶属于多个技术领域的情况时,统一归入隶属度最高的技术领域。统计4G专利的IPC小类,将其映射到电气工程(A)、仪器(B)、化工(C)、机械工程(D)、其他(E)5个部门,共涉及29个技术领域,如表2所示。
表2 4G 技术领域一览表
由表2可知,数字通信4G技术行业创新的首要方向,近6成的专利旨在实现数字化信息传输功能或应用于此领域。电信技术是现代通信技术的基础,也是4G技术创新的重要方向,超过3成的专利的功能和应用领域与其有关。此外,计算机技术、基础通信进程、测量、视听技术、IT管理方法、控制等领域也是4G技术研发的重要战场。
3.2.3 4G技术知识流网络的块模型分析
根据29个技术领域间的知识生产和知识接收关系建立4G技术知识流矩阵。对原矩阵进行二值操作,将共类次数大于0的格值统一赋值为1,其余为0。采用UCINET的CONCOR方法,根据技术领域间的结构对等性将29个技术领域分为4个区,结果如图1所示。
图1 4G技术知识流网络分区
计算整体网络密度、各块和块间密度,结果如图2(a)所示。由该图可知,4G技术知识流网络的链接水平较低(密度=0.1626),块1的内部互动频繁(密度=0.4083),其次为块4,块2和块3结构松散。接下来,采用α密度指标确定各个块的取值以生成相矩阵。其计算公式为:
其中α是临界密度值,取整个网络的密度值0.1626。aij和bij分别为图2(a)和图2(b)对应位置的取值,由此可生成0~1块的相矩阵。
最后,根据表图绘制出具有高度概括性的简化图,以揭示各个块的块内知识流动与块间知识互动的规律,如图2(c)所示。
图2 4G技术知识流网络挖掘过程
首先来看每个块自身的技术知识流特征。块1的技术知识综合化程度最高,包括8个电气工程技术领域、3个技术领域与仪器有关、另有3个技术领域属于其他类。块1是惟一拥有自链接结构的子群,说明该块具有较强的内聚性,群体内知识交流活动频繁。笔者认为,这是因为块1囊括了4G专利所涉及的主要技术领域,如数字通信、电信、计算机技术等。这些技术均属于电气工程这一技术部门,领域间的关联性较强,可以互为补充和支撑。块4包含的技术领域多属于化工这一技术部门。这些技术主题间具有一定的相关性,但并非4G专利的核心技术领域,因而块内的知识流动较弱。块2和块3均为孤立技术领域的集合,子群内缺乏技术交流。
接下来,考虑块间的技术知识交流活动。严格意义上来看,图2(c)中的4个块都是相互独立的,块间缺乏足够的知识互动与交流。将临界密度值α水平降低到0.1,那么块间会出现如图2(c)中所示的虚线关系,表现出非典型的集中趋势。块1兼具内聚性和对外交流性,是4G技术知识流网络的信息发出的集中块。块1创造的技术知识不仅能够促进内部知识交流和协同创新,还向块3和块4输出技术知识,同时接收来自块2的异构知识。也就是说,块1是网络系统知识循环的保障,是4G技术知识的生产者、吸收者和传递者。因而,应高度重视块1在技术发展中的关键作用,围绕电气工程技术部门构建4G技术知识的核心网络。
4 结 语
目前,我国专利申请量已跃居世界第一,但“大而不强、快而不优”。在一些重点产业领域,由于核心技术知识受制于人,国内企业不得不徘徊于产业价值链的低端位置。近年来,党和政府高度重视科技知识在引导产业创新中的战略作用。党的十八大及十八届三中全会明确提出,“实施创新驱动发展战略”,“抢占科技发展战略制高点”。然而,产业技术创新是一项极其复杂的工作,需要整合和重组大量异源异构知识。那么,怎样才能有效管理这些技术知识呢?本研究通过研究专利IPC的主分类号与副分类号的特性以及二者间的互动关系,引入IPC技术索引表对IPC小类和技术领域进行映射,构建了非对称的技术知识流网络。在此基础上,利用社会网络的块模型分析方法对该网络进行挖掘,以期发现网络中技术知识流的运动特征和行业技术的互动规律。
基于4G技术的实证研究结果可供国内4G技术研发企业及相关行业参考。首先,4G产业的技术集中化程度高,主要隶属于信号传输和电信方向。其次,4G产业的技术主题具有多元化特征,以电气工程部门为主,涵盖五大部门的29个技术领域。第三,根据技术主题的结构对等性,可将4G技术知识流网络分为4个块,块1是产业技术核心子群,是4G技术知识的生产者、吸收者和传递者。国内4G领先型企业,如中兴、华为、大唐、HTC等应高度重视块1子群在产业技术协同创新中的关键作用,坚持数字通信、电信两大主题技术双管齐下的研发方向,同时优化在计算机技术、基础通信进程、视听技术、IT管理方法等重要技术领域的布局,彻底破除专利零布局的技术短板。
[1]姜军.企业专利战略与核心竞争力的关联研究[D].武汉:武汉理工大学,2005.
[2]巴顿.知识与创新[M].孟庆国,侯世昌,译.北京:新华出版社,2000.
[3]刘细文,马费成.技术竞争情报服务的理论框架构建[J].图书情报工作,2014,58(13):5-10.
[4]Zhuge E.A knowledge flow model for peer-to-peer team knowledge sharing and management[J].Expert Systems with Applications,2002,23(1):23-30.
[5]王建刚,吴洁,张青,等.知识流管理与动态能力的关系机理研究[J].图书与情报,2011,(6):33-37.
[6]王向阳,赵英鑫,刘成明.知识溢出和技术创新能力关系:有中介的调节变量模型[J].图书情报工作,2012,56(16):127-131.
[7]孙元媛,胡汉辉.产业集群升级中主导企业的作用——基于四种知识流的视角[J].中国科技论坛,2010,(2):82-87.
[8]Krugman P.Increasing returns and economic geography[J].Journal of Political Economy,1991,99:484-499.
[9]Jaffe AB,Trajtengerg M,Henderson R.Geographic localization of knowledge spillovers as evidenced by patent citations[J].Quarterly Journal of Economics,1993,108(3):577-598.
[10]Koo J.Agglomeration and spillovers in a simultaneous framework[R].Annals of Regional Science,2005,39:35-47.
[11]Kaiser U.Measuring knowledge spillovers in manufacturing and servicing:an empirical assessment of alternative approaches[J].Research Policy,2002,31:125-144.
[12]胡健,印玺.基于专利引用的技术流矩阵的分析——对石油天然气产业技术溢出效应的测度[J].科学学研究,2010,28(12):1843-1847,1860.
[13]段会娟.知识溢出的测度方法综述[J].科技进步与对策,2010,27(5):154-157.
[14]Nelson A J.Measuring knowledge spillovers:what patterns,licenses and publications reveal about innovation diffusion[J].Research Policy,2009,38(6):994-1005.
[15]周磊,杨威.基于专利引用的企业技术竞争研究[J].科学学与科学技术管理,2014,35(3):42-48.
[16]Duguet E,Macgarvie M,How well do patent citations measure flows of technologies?Evidence from French innovative surveys[J].Economics of Innovation and New technology,2005,14(5):375-393.
[17]Joo S H,Kim Y.Measuring relatedness between technological fields[J].Scientometrics,2010,83(2):435-454.
[18]Moura D M,Caregnoto S E.Co-classification between articles and patents:a study of the interaction between S&T on Brazilian biotech[J].Informacao&Sociedade-Estudos,2010,20(2):119-132.
[19]Griliches Z.Patent statistics as economic indicators:a survey[J].Journal of Economic Literature,1990,28:1661-1707.
[20]Leydesdorff L.Patent classifications as indicators of intellectual organization[J].Journal of the American Society for Information Science and Technology,2008,59(10):1582-1597.
[21]Lim H,Park Y.Identification of technological knowledge intermediaries[J].Scientometrics,2010,84(3):543-561.
[22]Breschi S,Lissoni F,Malerba F.Knowledge-relatedness in firm technological diversification[J].Research Policy,2003,32(1):69-87.
[23]Verspagen,B.Measuring inter-sectoral technology spillovers estimates from the European and US patent office databases.Economic Systems Research,1997,9(1):47-65.
[24]Park H,Yoon J.Assessing coreness and intermediary of technology sectors using patent co-classification analysis:the case of Korean national R&D[J].Scientometrics,2014,98:853-890.
[25]World Intellectual Property Organization(WIPO).IPC-Technology Concordance Table[EB/OL].http:∥www.wipo.int/ipstats/en/statistics/technology_concordance.html,2014-01-04.
[26]肖宇峰,江洪,董克.专利权人引用网络中的媒介角色研究[J].现代图书情报技术,2011,27(11):60-66.
[27]黄斌,黄鲁成,吴菲菲,等.基于专利共类的技术关联特征识别[J].情报杂志,2015,34(1):44-48.
[28]周磊,张玉峰.基于专利情报分析的企业合作竞争模式研究[J].情报学报,2013,32(6):593-600.
[29]White H C,Boorman S A,Breiger R L.Social structure from multiple networks:blockmodels of roles and positions[J].Journal of Sociology,1976,81:730-799.
(本文责任编辑:孙国雷)
Mining on Technological Knowledge Flow Network by Patent IPC
Zhou Lei1Yang Wei2
(1.Accounting College,Wuhan Textile University,Wuhan 430200,China;2.Wuhan East Lake High-tech Development Zone Administrative Committee,Wuhan 430079,China)
Co-classification was decomposed into knowledge producer(main IPC)and knowledge receiver(auxiliary IPC)in this study.Then,co-classification matrix was transformed into technological knowledge(TKF)network according to IPC-Technology Concordance Table.4G patents were collected from Derwent Innovation Index(DII)to construct a technological knowledge flow network.Key technology cluster with high cohesion and external connectionwas revealed from 4G TKF network by blockmodels analysis.
technological knowledge flow network;patent mining;international patent classification(IPC);blockmodels;4G
10.3969/j.issn.1008-0821.2016.01.009
G255.53
A
1008-0821(2016)01-0045-06
2015-11-30
教育部人文社会科学研究青年项目“基于专利挖掘的突破性创新识别方法研究”(项目编号:14YJC870027)、国家社科基金青年项目“基于大数据的产业竞争态势动态预警机制研究”(项目编号:13CTQ033)研究成果之一。
周 磊(1986-),女,讲师,博士,研究方向:专利情报与数据挖掘。