h指数及其衍生指标评估兽用疫苗领域单篇专利的适用性探索
2020-06-15刘志斋左文革
刘志斋,左文革
(中国农业大学图书馆,北京 100194)
1 引言
专利数量和专利被引次数是两个评估专利的传统指标。专利数量虽然是一个直观易获取的指标,但由于对创新性的考虑较少,一些学者认为它并不能很好的评估专利价值[1-2]。在众多评估专利价值的指标中,除了专利数量,专利被引次数也是一个基本的指标[3],赵蓉英等[4]认为被引用次数高的专利包含了重要的技术,在该技术领域中处于基础性位置。但部分学者也提出不能仅使用专利被引数一个指标来评估专利价值,还需要考虑施引专利的技术类型和专利权范围等相关因素[5-6]。
我国兽用疫苗的研发始于1918年的青岛商品检验局血清所,迄今已有百年历史,进入21世纪后,全球经济一体化进程不断加快,面对国际兽用疫苗领域日益激烈的竞争和挑战,国内市场较国外还有很大的上升空间[7]。同时,SARS、禽流感、非洲猪瘟等疾病相继出现,对我国畜牧业发展产生了负面的影响。尤其是非洲猪瘟,从2018年8月在我国首次发现,截至2019年7月3日,全国共发生非洲猪瘟疫情143起,扑杀生猪116万余头[8]。因此,提高我国兽用疫苗企业的整体水平和研发竞争力,以保障我国畜牧业发展,就必须加强对兽用疫苗领域专利质量和专利保护的重视。
本文以兽用疫苗领域专利为研究对象,探讨计量学中的h指数及7个主要的衍生指标在评估单篇专利价值中的适用性,将它们同传统的专利评估指标如专利数、专利被引数进行比较,从而筛选能够评估兽用疫苗领域高价值专利的指标。
2 研究概述及相关指标
2005年,Hirsch[9]首次提出了h指数这一指标,来测度学者的学术影响力,它的定义为:在一个科学家的N篇论文中,如果有h篇论文至少被引用了h次,而剩下的(N-h)篇论文每篇的被引次数都少于 h次,则该科学家的h指数就等于h。2008年,Guan等[10]将h指数引入到了专利评估中,对世界 500强中通讯领域的部分公司进行了专利评估,认为专利h指数将专利数量和专利被引数结合在一起,比单独使用这两个指标更加准确。随后,一些学者从技术领域、国家、企业、专利权人等不同主体对h指数的实证研究进行了探索[11-13]。部分学者对其衍生指标在评估专利的应用也进行了研究,发现部分衍生指标对评估专利技术和质量有良好的作用[14-16]。
这些研究都是从专利组合的角度来进行的,在宏观层面对专利价值进行评估,很少有从单篇专利的角度进行。2018年,郝桂荣等[17]对中药领域的单篇专利进行分析,采用单篇专利的专利迹与h指数作为评价指标,通过相关性分析,来评价h核中单篇专利的技术绩效,从而筛选高价值专利。
(1)h指数:本文使用郝桂荣等[17]提出的单篇专利h指数概念,即在一篇专利中,如果有h篇施引专利至少被引用了h次,而剩下的施引专利每篇的被引次数都少于 h次,则该专利的h指数等于h。
(2)g指数:g指数是由Egghe[18]在2006年提出的一个衍生指标,在实证中验证了g指数相较于h指数更能够区分高被引论文。将其应用在单篇专利中定义为:在一篇专利的施引专利中,有 g 篇施引专利至少总被引用了g2次,而其他施引专利的被引用次数之和少于g2,则称该专利的g指数为g。
(3)hg指数:Alonso[19]基于h指数和g指数,提出了hg指数,该指数弱化了高被引论文对g指数的影响。应用到单篇专利中,其计算公式为:,其中h和g分别为单篇专利的h指数和g指数。
(4)w指数:Wu[20]在2008年提出了w指数,该指标同样关注于高被引论文,同时计算量相较于g指数更少。将其概念引入到单篇专利中为:在一篇专利中,如果有w篇施引专利至少被引用了w次,而剩下的施引专利每篇的被引次数都少于10(w+1)次,则该专利的w指数等于w。
(5)h(2)指数:h(2)指数是Kosmulski[21]在2006年提出的指标,给了高被引论文更大的权重。本文将单篇专利h(2)指数定义为:某篇专利的施引专利中,若有h(2)篇专利的被引次数大于或等于[h(2)]2次,其他施引专利被引次数小于[h(2)]2次,则该专利的h(2)指数为h(2)。
(6)A指数:Jin等[22]在2007年引入“h核”概念时提出了A指数,改善了h指数敏感性不足的问题。单篇专利A指数定义为:某专利“h核”内被引用次数的平均值。此处施引专利被引次数排名前h的专利 集合称为“h核”,其计算公式为:i,其中c为“h核”中每篇专利的被引次数。
(7)A+指数:王凌峰[23]将学者的最高被引论文考虑在内,提出了A+指数,对A指数进行了完善。单篇专利A+指数的计算公式为:),即“h核”内总被引次数与最高被引数的和同h指数的比值。
(8)R指数:Jin等[22]在2007年提出了R指数的概念,以克服h指数区分度不大的问题。单篇专利R指数定义为:“h核”内专利的总被引数的平方根。计算公式为:。
3 结果与分析
本文以Innography专利数据库作为统计信息源,选择兽用疫苗(veterinar* vaccine*、animal* vaccine*)为检索词,限定于摘要、权利要求、题名3个字段进行检索,检索时间为2019年7月17日和18日。使用检索出的57 344条专利分析兽用疫苗领域专利发展态势,同时将这些专利按照被引次数降序排列,取“h核”中的132篇专利作为研究对象。然后计算这些专利的h指数及7个衍生指标,同时对每个专利的施引专利数(Pt)、施引专利总被引次数(Ct)、“h核”总被引次数(ht)、施引专利最高被引次数(Ch)、专利强度(Ps)进行统计。
3.1 兽用疫苗领域专利发展态势分析
(1)全球兽用疫苗领域专利申请和授权变化趋势
专利申请量体现了该领域技术的活跃程度和发展趋势,专利授权量则体现了该领域技术发明活动水平和创新能力。将1999年后的专利申请量和授权量按照年份进行统计,结果如图1所示。其中横坐标为申请年份,纵坐标为专利申请量,时间跨度为1999年至2019年。兽用疫苗领域专利申请量在1999-2003年处于整体上升阶段,2003年-2008年趋于稳定发展,2008年至今整体呈现下降趋势。授权量在1999年后处于稳步上升的趋势,相对比专利申请量,授权量更直接地反映技术积累程度,体现技术的发展质量[24]。
图1 1999年后全球兽用疫苗领域专利申请变化趋势
(2)兽用疫苗领域主要技术来源国专利申请年度变化趋势
技术的来源国家能够反映该领域技术研发创新的产出地信息。根据专利发明人的国别信息,将1999年后的专利按照国家进行统计,得到专利数量排名全球前5的兽用疫苗领域专利来源国家。中国、美国等专利数量排名全球前5的国家专利申请年度变化趋势如图2所示。从图中可以看出,该领域主要技术来源国专利申请量除中国外,均呈现出整体下降趋势。中国在2008年的专利申请量已经成为世界第二,2017年超越美国,成为申请量第一的国家,随后虽然趋于下降趋势,但申请量一直保持在世界第一。
图2 1999年后兽用疫苗领域主要技术来源国专利申请年度变化趋势
(3)兽用疫苗领域主要IPC分类号年度变化趋势
通过研究兽用疫苗领域的IPC分布,可以发现该领域的研究方向的变化。根据国际专利分类法对兽用疫苗领域的各分支研究领域的含义解释,按照IPC大组分类,统计了1999年后该领域内主要IPC分类号的排名,如表1所示。
表1 1999年后兽用疫苗领域主要研究方向分布
兽用疫苗领域的主要研发方向属于不同的专利技术领域,利用这些技术的年度分布数据,得到该领域专利技术的时间变化趋势,如图3所示。总体排名前五的IPC分类号为A61K、C12N、G01N、C07K、C12Q。1999-2003年,A61K一直处于快速上升阶段,其他技术趋于稳定。2003-2013年,C07K逐渐超过了G01N,A61K有所下降,其他技术趋于稳定。2013年之后,所有技术的专利数量整体均处于下降状态。
图3 1999年后兽用疫苗领域主要IPC分类号年度变化趋势
3.2 施引专利数和8个指标的关系
按照施引专利数降序排序,对排名前20的专利进行分析。US5324519 A和US5112614 A的8个指标值均排在前3名,但施引专利数排名分别为第5名和第19名。在该专利集中,仅有US6248363 B1、US5763192 A、US5324519 A、US5702717 A、US20030009235 A1、US5409703 A等6个专利的施引专利数排名同8个指标值的排序结果相差在7左右,其他专利的差异值多数都大于10,最多的达到了87。从8个指标之间的排名来看,多数专利也有较大的差异,例如施引专利数排名第2的专利WO9014837 A1,其h(2)指数数值为46,A+指数数值为73,两者排名相差27。
使用统计软件SPSS 23.0对数据集中132篇专利的施引专利数和8个指标值进行相关性分析,结果如表2所示。由表2可知,施引专利数和8个指标均有一定的相关性,与h指数的相关性是8个指标中最大的,为0.421;与A+指数的相关性是8个指标中最小的,为0.203。
表2 施引专利数和8个指标的相关性
3.3 施引专利总被引次数和8个指标的关系
施引专利总被引次数,即所有引用该单篇专利施引专利的专利数量。按照施引专利总被引次数降序进行排序,取排名前20的专利进行分析。施引专利总被引次数排名同8个指标值的排名结果多数相差在5左右,仅有US5747058 A、US6004573 A两个专利的施引专利总被引次数排名同A和A+两个指标值的排序结果有较大差异。从8个指标之间的排名来看,专利之间的差异值很小,多数都集中在0-5之间,仅有施引专利总被引次数排名17位的US5747058 A,其h指数数值为23,A+指数数值为50,两者排名相差27,属于排名差异较大的专利。
使用统计软件SPSS 23.0对数据集中132篇专利的施引专利总被引次数和8个指标值进行相关性分析,结果如表3所示。由表3可知,施引专利总被引次数和8个指标的Pearson相关性均较大,其中同g指数的相关性最大,为0.946。
3.4 8个指标之间的关系
使用统计软件SPSS 23.0对h指数、g指数等8个指标进行相关性分析,结果如表4所示。由表4可知,8个指标之间的Pearson相关性均较大。最高的是g指数和R指数,二者之间的Pearson相关性为0.998,最低的是h指数和A+指数,为0.617。相比较而言,R指数同其他7个指数的相关性最大,多集中在0.9-1.0;A+指数同其他7个指数的相关性最小,多集中在0.6-0.8。
3.5 专利强度和8个指标的关系
Innography专利强度受专利分类、同族专利数量、权利要求数量、引用与被引用次数、专利年龄等指标影响,强度的高低可以代表该专利价值的大 小[25]。专利强度和8个指标的相关性如表5所示,各指标同专利强度的相关性均较低,因为同h指数这类引文类指标不同,专利强度是一个复合指标,引文类指标只是它的一个组成部分。
为了更客观的表现专利强度与8个指标的关系,选择指数值排名在前50%的专利进行分析,即66个(有些指标的数值并列,因此部分专利数量会多于66),将专利强度在70以上的定义为高价值专利。通过表6可知,在高指数值的专利中,专利强度在70以上专利所占比例在60%左右浮动,且均高于所有数据集中的57.58%。鉴于之前所解释的专利强度是一个复合指标,可以判断作为单一的引文类指标,h指数及其衍生指标在评估兽用疫苗领域专利价值方面有一定的作用。
表3 施引专利总被引次数和8个指标的相关性
表4 8个指标之间的相关性(N=132)
表5 专利强度和8个指标的相关性
表6 专利强度70以上专利的占比
通过上述实证分析可知,在兽用疫苗领域单篇专利评估中,h指数及其7个衍生指标与传统专利评估指标相关性较强,能够较好反映单篇专利的价值和影响,任意两个指数之间也有很强的相关性。且这8个指标与专利强度也有密切的联系,在评估专利价值中有一定的科学性。
同时,这8个指标评估单篇专利时也存在一些不足。A指数、A+指数和R指数的计算过程十分烦琐,容易产生计算错误;W指数和h(2)指数虽然计算过程方便,但很多专利的这两个数值差异较小,不能准确地做出评估。因此,结合上述实证可知,h指数、g指数和hg指数这三个指标,可以作为评估单篇专利的指标,能够比较快速准确地对兽用疫苗领域专利价值进行预估。
4 总结
兽用疫苗领域的单篇专利h指数及衍生指标,既结合了施引专利数Pt这一数量指标,体现了该专利的科技产出,又结合了施引专利的被引次数Ct这一引文指标,体现出对后续专利的影响力,不失为传统指标的改善。本文探讨了计量学中的h指数及其衍生指标对兽用疫苗领域专利的评估效果,以期为评估人员带来一种相对于传统指标更加准确的指标。此外,由于兽用疫苗领域专利“h核”内的样本数量较少,在后期的研究中,可以考虑百分位等相关方法选取更多的数据量来进行研究。