基于专利权人—分类号多重共现分析的全球专利布局研究
2017-05-18温芳芳
〔摘要〕以太阳能汽车技术领域为例,从德温特数据库中下载专利文献的专利权人与分类号信息作为样本,构建2-模异质多重共现网络,将两类特征项及其3种共现关系在同一图谱中进行集中展示,从中寻找该技术领域的主要研发力量和热门技术主题,并对二者之间的交叉关联进行量化分析。证实了多重共现分析能够克服一重共现分析揭示维度单一的不足,尤其适合于潜在关系的发掘。研究发现,在太阳能汽车领域日本的技术优势非常明显,日本企业继续保持全球领先水平。中国的整体技术实力居于世界前列,但中国企业个体的技术力量却相对单薄,在市场竞争中将处于劣势地位。
〔关键词〕多重共现分析;共现分析;专利计量;社会网络分析;太阳能汽车
DOI:10.3969/j.issn.1008-0821.2017.04.026
〔中图分类号〕G255.53〔文献标识码〕A〔文章编号〕1008-0821(2017)04-0165-05
Study on the Global Patent Layout Based on the Multiple Co-occurrence
Analysis with Patent Assignees and Classification Codes
——In the Case of Solar Vehicles TechnologyWen Fangfang
(College of Management,Henan University of Science and Technology,Luoyang 471023,China)
〔Abstract〕Taking the Derwent patent literatures in the technical field of solar vehicles as the sample,a 2-mode heterogeneous multiple co-occurrence network has been constructed based on the co-occurrence relations of patent assignees and classification codes,with two terms and three kinds of co-occurrence relations centralized displaying in the same visualization map.Powerful research firms and hot technical themes have been identified through the quantitative analysis,as well as the practical and potential collaboration relations have been detected and compared.It confirmed that the method of multiple co-occurrence analysis offering more findings with multiple dimensions that can overcome the shortcomings of single dimension co-occurrence analysis.It is especially suitable for exploring potential relations.The results revealed that Japan possessing obvious advantage in the field of solar vehicles,with Japanese companies maintaining world leading level.Chinas overall technical strength living in the forefront of the world,but the individual strength of Chinese enterprise is relatively weak,resulted in the disadvantage of market competition.
〔Key words〕multiple co-occurrence;co-occurrence analysis;patent bibliometrics;social network analysis;solar vehicles
共現分析是常用的文献计量方法,共现现象可以转化为网络矩阵进行形式化表示和定量测度。在社会网络分析及可视化方法的辅助下,共现分析以其方法的简明性和分析结果的可靠性,成为支撑信息内容分析的重要手段和工具,文献计量学领域涌现出一大批针对论文或专利文献开展共现分析的研究成果。共词分析、合作分析、引文分析、共类分析等方法,被广泛地应用于探测学科研究热点与发展前沿[1]、追踪学科知识的演变历程与扩散规律[2]、揭示作者(机构或国家)之间的合作与竞争关系[3]、测度不同学科之间的知识与技术关联[4]、改进语义检索效果以及深度挖掘情报价值[5]。共词分析、合作研究、共类分析、引文分析等,本质上都是共现分析。
但是,以往的共现分析多为一重共现分析,所构建的共现网络为同质网络,如合著网络、共词网络、共类网络等,仅从单一维度出发,能够揭示的知识广度与深度毕竟有限。事实上,作者、关键词、分类号等不同特征项之间存在着千丝万缕的关联,所形成的交叉共现关系无法通过一重共现分析来揭示,而需要进行多重共现分析。为了反映不同特征项之间的交叉关联,文献计量学家提出了多重共现的概念和方法。Morris等从论文和专利文献中提取有效信息,基于两个共现矩阵相同特征项之间的关联,开发出交叉图和时间线技术,同时将两种特征项之间的关联性在一张二维图中予以展示,有助于领域专家更好地进行技术预测[6]。Leydesdorff把异质网络思想引入网络可视化分析,构建了作者-关键词-期刊三重共现异质网络,将3类特征项之间的交叉共现关系在同一网络图谱中进行集中展示[7]。
国内学者庞弘遷等人对Morris的交叉图技术进行改进,开发了多重共现的可视化分析工具,并将其应用于实证研究,对机构-期刊-关键词[8]、高校图书馆-核心期刊-关键词[9]、年份-关键词-机构以及年份-关键词-发表期刊[10]等多类特征项之间的多重共现关系进行计量分析和可视化展示。冷伏海等人提出基于位向量的三元共词分析算法和基于坐标图的三元共词结果分析方法,并以期刊论文关键词为对象進行实证研究[11]。魏绪秋等人构建作者-年份-关键词多元合作网络,以探寻作者科研合作主题行为特征[12],构建作者-关键词-期刊三模网络,以展示作者分布、期刊分布、主要研究内容以及三者之间的关联[13]。李长玲等人构建作者-作者-关键词2模异质网络,测度作者开展潜在合作的可能性及识别作者潜在合作空间[14]。
迄今为止,多重共现分析仍然是一个新兴的研究主题,国内外学者进行了一定的探索,并初步证实了多重共现分析的可行性,与以往计量学惯用的单一维度的共现分析相比,多重共现分析揭示的信息更为全面、系统和深入,尤其适合用来发掘多元、交叉、潜在的关系。但是,目前国内外相关研究成果相对较少,且大多以论文作为样本数据,围绕专利开展的多重共现分析亟待加强。若将技术创新视为新产品或新工艺从设想产生到市场应用的完整过程,专利文献则是技术创新活动的完整记录。专利文献是集技术、法律、经济信息于一体的复合型信息源[15]。全球80%可得技术信息都会出现在专利文献中并且通常不会在其他地方再现。此外,专利文献具有内容规范、样本规模大、代表性强、便于获取、易于计量等优良属性[16]。因此,专利文献为技术创新问题研究提供了重要的数据支持。
鉴于以上情况,本文对面向专利文献的多重共现分析方法进行积极的探索和检验。以太阳能汽车技术为例,从德温特专利数据库(Derwent Innovations Index,DII)中获取专利文献,提取专利权人和分类号信息,基于两类特征项之间的交叉关联构建多重共现网络,将专利权人和专利分类号两类特征项,专利权人-专利权人共现(合作)、分类号-分类号共现(共类)、专利权人-分类号共现(隶属)3种共现关系,在同一网络中集中呈现和综合分析,揭示该技术领域的主要研发力量、研究主题、竞争态势等方面的信息。不仅有助于理清太阳能汽车领域的技术创新现状以及主要创新主体的活动轨迹,也是对文献计量学中共现分析方法体系的进一步丰富与拓展。
1样本数据
从DII中检索太阳能汽车技术领域近五年的专利文献,选择高级检索功能进行主题检索,检索算式为:TS=solar AND TS=(vehicle OR auto OR car),索引=(CDerwent,EDerwent,MDerwent),时间跨度=2012-2016。由于DII收录时滞,导致2016年收录的数据并不完全。检索时间为2016年12月14日,检索结果为12 287条专利记录。下载每个专利(族)的专利权人和德温特分类号信息,导入Excel中进行分类汇总。
德温特分类号(Derwent Class Code,DC):德温特自创的分类体系,每件专利被分配一个或多个DC,直接表征该件专利的研究内容和技术主题。样本中64.71%的专利同时包含两个及以上DC,形成较为普遍的分类号共现现象。
专利权人名称及代码(Assignee Name+Code,AE):DII对专利权人名称进行了规范化处理,以“-C”结尾的标准代码分配给拥有千件以上专利的标准公司;以“-Non-standard”结尾的非标准化代码分配给标准公司以外专利申请量不大的非标准公司;个人专利权人代码以“-Individual”结尾[17]。
个人代码重名现象较多,无法对专利权人身份进行准确区分,而且仅凭自然人姓名无法透露更多的有效信息。另外,相对于自然人而言,对于企业专利的研究更具商业情报价值。因此,本文仅对专利权人为企业(含企业、高校、科研机构及其他社会组织,本文将其统称为企业)的情况进行计量分析,选择专利权人代码为-C和-Non-standard的数据作为初始样本。经初步统计,样本中共有企业3 042个,其中,标准公司1 024个,非标准公司2 018个。
2研究过程及结果
2.1构建多重共现关系网络
本文构建专利权人-德温特分类号共现关系网络矩阵,如图1所示,该网络矩阵同时包含两类特征项和3种共现关系,为2-模、无向、异质网络。两类特征项:专利权人代码(AC)、德温特分类号(DC)。3种共现关系:①专利权人共现(合作)关系,为同质无向网络,反映不同专利权人之间以专利文献联合署名为标识的合作现象;②专利权人-分类号共现关系,为异质无向网络,反映各个专利权人所从事的技术主题;③分类号共现(共类)关系,为同质无向网络,反映各个分类号所代表的不同技术主题之间的交叉关联性。
多重共现矩阵实际上由3类矩阵组成,初始矩阵中每个值Cij代表着共现频次,由于3类矩阵的节点类型及共现关系类型各不相同,为消除量纲影响,本文采用极值化方法分别对3类初始矩阵进行处理,将其转化为标准化矩阵。
C′ij=Cij-CminCmax-Cmin(0≤C′ij≤1)(1)
其中,Cij为初始值,Cmax和Cmin为初始矩阵的最大值和最小值,C′ij为标准值。最后将3个标准化矩阵整合为一个邻接矩阵,即专利权人-分类号多重共现网络。样本中3 042个企业和257个德温特分类号,组成了一个3299*3299的多重共现网络。
2.2多重共现网络可视化
将多重共现网络标准化矩阵导入Ucinet和NetDraw,绘制多重共现网络图谱。由于页面限制,为实现更为清晰的可视化效果,本文选择样本数据中高频节点(频次≧20)予以展示,并且将阈值设定为C′ij0.1,以剔除低强度的共现关系。如图2所示,红色圆形节点为专利权人,蓝色方形节点为德温特分类号,节点大小代表着专利权人或分类号在样本中出现的频次,节点之间的连线表征共现关系,连线粗细代表着共现强度大小。此外,以不同的颜色区分3种共现关系,黄色连线为专利权人-分类号共现关系,绿色为共类关系,红色为合作关系。
2.2.1专利权人与分类号频次分析
红色节点大小显示出每个专利权人(企业)拥有的专利数量多少,代表其研发力量强弱,节点越大则该企业技术力量越强。蓝色节点大小显示出每个德温特分类号在样本数据中的出现频次,反映出各个分类号所代表的技术主题的冷热程度,节点越大则该技术主题越热门。68个企业的技术力量和125个技术主题的热门程度在图2中进行集中展示和直接比较,全球主要技术力量和研究主题分布情况便可一目了然。
排名前十的企业分别为:日本丰田汽车公司(TOYT-C)、德国博世集团(BOSC-C)、韩国三星集团(SMSU-C)、德国贺利氏控股集团(HERA-C)、日本电装公司(NPDE-C)、美国杜邦公司(DUPO-C)、日本旭硝子公司(ASAG-C)、日本住友电气工业公司(SUMM-C)、中国国家电网公司(SGCC-C)、日本三菱化学公司(MITU-C)。
排名前十的技术主题分别为:X15-Non-Fossil Fuel Power Generating Systems(非化石燃料发电系统)、X22-Automotive Electrics(汽车电子)、X21-Electric Vehicles(电动汽车)、X16-Electrochemical Storage(电化学存储)、T01-Digital Computers(数字计算机)、U12-Discrete Devices,e.g.LEDs,photovoltaic cells(分立器件,例如发光二极管、光伏电池)、L03-Electro-(in)organic,chemical features of electrical devices(电气设备的电化学特性)、U11-Semiconductor Materials and Processes(半导体材料和工艺)、X26-Lighting-Discharge,incandescent and electric arc lamps(照明-放电,白炽灯和电弧灯)、A85-Electrical applications(电气设备)。
2.2.2专利分类号共现关系网络分析
作为技术主题的符号化表征形式,德温特分类号反映出太阳能汽车技术领域的研究内容和知识结构。共类网络则展示了各个分类号所代表的技术主题的分布情况及其相互之间的技术关联性,以及各个技术主题的热门程度及其在整个技术领域知识结构中的地位和影响力。结合样本统计数据可知,太阳能汽车涉及的技术领域非常广泛,包含了257个德温特分类号,涵盖了20个类别。少数节点(分类号)居于网络核心位置,而更多的节点(分类号)则处于网络边缘,该网络结构特征显示出太阳能汽车研究领域的知识结构特征,虽然涉猎的技术领域非常广泛,但研究重心始终围绕部分关鍵技术主题展开。X15、X22、X21、X16、T01、U12、U11、L03等高频分类号位于共现网络的核心位置且相互之间存在较强的共类关系,说明这些技术主题既是研究热点与技术前沿,又代表着整个研究领域的主流知识与关键技术。
2.2.3专利权人-分类号隶属关系网络分析
专利权人-分类号共现分析用于测度专利权人与技术主题之间的量化关系,其共现网络能够显示出每个专利权人(企业)所从事的主要技术主题,及其在各个技术主题的研发力量分布情况(由红色和蓝色节点之间连线的粗细表征)。例如,样本中德国博世集团(BOSC-C)拥有的专利数量居于世界前列,该企业的研究范围十分广泛,主要涉及45个技术主题,涵盖了图2中125个技术主题的1/3以上。其中,博世集团在太阳能汽车领域的主要研发力量集中在以下几个技术主题:X21(电动汽车)、X16(电化学存储)、X15(非化石燃料发电系统)、X12(配电/元件/转换器)、U24(放大器及电源供应器)。
另外,图2还显示出每个技术主题主要由哪些企业参与,各个企业在各个技术主题的研发实力也可进行横向的比较(由红色和蓝色节点之间连线的粗细表征)。例如,X15(非化石燃料发电系统)为太阳能汽车领域最热门的技术主题,图2中68个专利权人,其中64个都拥有该技术主题的专利,其中,日本丰田汽车公司(TOYT-C)、日本三菱化学公司(MITU-C)、日本夏普公司(SHAF-C)、日本东丽工业公司(TORA-C)、美国杜邦公司(DUPO-C)、日本松下电器公司(MATU-C)等在该技术主题具有明显优势。
2.2.4专利权人潜在合作关系的发掘
专利权人之间的合作关系分为现实合作与潜在合作两种形式,前者以专利权人共现(联合署名、共同持有)为标识,后者是指专利权人因其研究内容的相似性有可能产生但并未真正建立的隐藏关系。潜在的合作关系可以借助于专利权人-分类号共现网络进行探测。现实中较高强度的现实合作关系实际上很少,图2中仅有3组合作伙伴:德国贺利氏控股集团(HERA-C)和美国福禄公司(FECO-C)、日本丰田汽车公司(TOYT-C)和日本电装公司(NPED-C)、日本住友电器工业公司(SUME-C)和日本东海橡胶工业公司(TOKG-C)。但是,由于研究主题相似或相关,不同专利权人之间存在潜在的合作机会,图2中节点之间的共现强度及其聚类现象,显示出不同专利权人所从事的研发领域的关联性与相似性,据此可以发掘潜在合作关系、寻找潜在合作伙伴。
3研究结论与讨论
3.1中国太阳能汽车企业的技术实力有待提升
参与太阳能汽车研发的企业数量众多,但研究实力参差不齐。样本中逾3 000个企业拥有相关专利,但专利数量在10件及以上的企业不足5%。排名前10的企业拥有专利数量均在百件以上,作为全球知名的大型集团公司,历史久、规模大、实力强,在汽车制造、电气工程、工程技术等领域处于全球领先地位。这些企业积极投入太阳能汽车研发,并且在该技术领域居于主导性地位。从其国别信息来看,日本的技术优势十分显著,排名前10的企业有5个来自日本,另外,排名前20名的企业也有一半来自日本,包括松下、索尼、三洋、夏普、富士等。
太阳能汽车技术领域,中国拥有的专利总量能够比肩日、美、韩等国而居于世界前列,但单个中国企业的技术实力却无法与之相较。样本中大多数中国企业拥有的专利数量都在10件以下,参与者数量众多,但各自拥有的专利数量很少,个体力量较弱。中国国家电网公司排名跻身全球前十,拥有相关专利百余件,但这些专利分别由国家电网在全国各地的分支机构持有,因其共用同一专利权人代码,统计时将其统一计入国家电网名下,实际上各个分支机构拥有的相关专利数量多为个位数。此外,就该技术领域专利权人类型来看,中国的企业作为最主要的创新主体却并未发挥应有的主导性作用,其表现反而不及中国高校和自然人。尤其是中国的汽车企业在此次专利数量统计结果中可见度非常低,仅有吉利、比亚迪、奇瑞、上汽等少数中国汽车企业进入前100名。
新能源汽车浪潮席卷全球,以太阳能汽车为代表的新能源汽车大战一触即发,各个国家和企业都在积极应对。中国企业的情况并不乐观,国家总体的优势与企业个体的劣势并存。虽然中国的专利总量跻身世界前列,证明了中国整体的研究实力和技术水平并不落后,但是这种依靠众多小规模专利权人累计形成的数量优势,在商业竞争当中难以转化为市场竞争力。在全球太阳能汽车市场上,中国企业一时难以与丰田等巨头抗衡,尽管吉利、比亚迪、奇瑞等汽车企业已经觉醒并积极谋划,也拥有了一定数量的相关专利,但其研发实力与丰田、三菱、现代、本田等国外汽车企业相比尚存在明显差距。
3.2多重共现分析有助于发掘潜在合作关系
专利权人之间的现实合作并不普遍,尤其是高强度的合作关系更为少见。在大科学时代,即便合作已经成为科学研究的主流,但专利的特殊性,使其表现出与一般科研成果不同的特征,既是富有创造性的智力成果,也是一种无形财产权[18]。现实的合作关系以“联合署名、共同持有”作为基本判定标准,即现实的合作意味着权利共享。专利与生俱来的垄断性特质,垄断意味着专利是独占和独享的,所以专利权天然具有排他性,排斥合作、拒绝分享,尤其是对于那些彼此之间存在直接竞争的企业来说,除非能够实现共赢或者利益最大化,否则轻易不会开展合作研究并共同持有专利。因此,专利权人之间难以建立起广泛而紧密的现实合作关系。
寥寥无几的现实合作关系,使得单纯的专利权人共现(合作)网络无法透露出太多的有效信息。但是,基于专利权人-分类号共现而存在的潜在合作关系却构成了一个密集的网络。专利是各个国家和企业参与市场竞争的的利器,技术主题的相似性也代表着专利权人之间可能存在的竞争。共性研究内容越多的机构,相似度越大,距离越近,除去那些有着较多实质合作关系的机构,其余机构显然有着良好的合作前景,但成为竞争对手的几率也越大[19]。因此,专利权人-分类号共现同时蕴含着合作与竞争两种潜在的关系,借助于专利权人-分类号多重共现关系网络,既可以寻找潜在的合作伙伴,又能够识别可能的竞争对手。这种合作与竞争并存的复杂而微妙的关系,存在于专利文献这种特殊的科研成果当中,且通过以往的一重共现分析无法获知,这也在一定程度上证明了多重共现分析的必要性和优越性。
3.3多重共现分析的优势与不足
与以往常见的一重共现分析相比,多重共现包含的内容更为丰富,分析角度也更为多元化。本文基于专利权人-分类号共现所构建的多重共现网络,同时包含了两类特征项和3种共现关系,能够发现单纯的合作分析或共类分析无法透露的有效信息。例如,专利权人之间潜在的合作与竞争关系、不同专利权人之间现实合作关系与潜在合作关系的直接对比、各个专利权人所从事的技术主题及其在各个技术主题的力量分布、各个技术主题的参与者及其研究实力的比较等,这些研究发现难以通过一重共现分析获得,从而证实了多重共现分析确实能够弥补一重共现分析揭示维度有限的不足。
尽管如此,多重共现分析在实现过程当中也存在明显的不足。当前文献计量领域主流的可视化技术大多以二维平面形式呈现,由于页面限制,当共现网络中节点数量较大、关系较为密集的情况下,无法清晰展示各个节点之间复杂而多样的共现关系,可视化效果大打折扣。例如,本文仅选择了少部分高频节点进行可视化展示,并且过滤了低强度的共现关系,但是可视化效果仍然不太理想,尤其是网络图谱中节点较为集中的核心位置,许多共现关系被密集的节点和线条层层覆盖。在后续研究中应该重点对可视化工具的呈现形式进行改进,将三维可视化技术引入其中,以提升多重共现分析的可视化效果。
参考文献
[1]高继平,丁,潘云涛,等.多词共现分析方法的实现及其在研究热点识别中的应用[J].图书情报工作,2014,(24):80-85,98.
[2]王林,冷伏海.学术论文的关键词与引文共现关系分析及实证研究[J].情报理论与实践,2012,(2):82-86.
[3]温芳芳.基于社会网络分析的中外图书馆学合作模式比较研究[J].国家图书馆学刊,2014,(1):76-83.
[4]乔杨.专利计量方法在技术预见中的应用——以国内冶金领域为例[J].情报杂志,2013,(4):34-37,27.
[5]王曰芬,宋爽,苗露.共现分析在知识服务中的应用研究[J].现代图书情报技术,2006,(4):29-34.
[6]Yemenu D,Yong CD,Salman S,Morris S.DIVA:a visualizing system for exploring document database for technology forecasting[J].Computers & Industrial Engineering,2002,(4):841-862.
[7]Leydesdorf L.What Can Heterogeneity Add to the Scientometric Map?Steps towards algorithmic historiography[EB/OL].http:∥leydesdorff.net/mcallon/mcallon.pdf,2016-01-22.
[8]庞弘,方曙.基于多重共现的可视化分析工具设计及其知识发现方法研究[J].图书情报知识,2012,(2):100-107.
[9]庞弘遷.基于多重共现揭示高校图书馆与核心期刊间的发文关联关系研究[J].图书馆,2012,(2):75-78.
[10]庞弘遷,方曙,杨志刚,等.研究领域的主题发展趋势分析方法研究——基于多重共现的视角[J].情报理论与实践,2012,(8):44-47,73.
[11]冷伏海,王林,李勇.基于文献关键词的三元共词分析方法——以知識发现领域为例[J].情报学报,2011,(10):1072-1077.
[12]魏绪秋,李长玲.基于作者-年份-关键词网络的科研合作行为研究——以图书情报学为例[J].情报杂志,2014,(11):117-123.
[13]魏绪秋,李长玲,刘非凡.3-模数据网络构建及其可视化探讨——以图书情报领域的知识管理研究文献为例[J].情报理论与实践,2014,(8):74-78,89.
[14]李长玲,魏绪秋,冯志刚,等.基于2-模异质网络的作者潜在合作空间测度与识别——以图书情报学为例[J].图书情报工作,2015,(12):93-99.
[15]袁晓东,陈静.专利信息分析在技术创新合作伙伴选择中的应用[J].情报杂志,2011,(8):22-27.
[16]温芳芳.我国专利技术转移的时间与空间分布规律研究[J].情报理论与实践,2014,(4):32-36.
[17]刘秋宏.德温特专利权人代码编制研究及检索应用[J].科技创新导报,2013,(4):5-11.
[18]温芳芳.专利计量与专利合作[M].北京:中国社会科学出版社,2015:81.
[19]钱俐娟,张新民,郑彦宁.国外图书情报学领域主要科研机构“共现”现象研究[J].图书情报工作,2008,(11):49-52.