APP下载

h相关指数改进比较与实证分析*

2015-07-22孟德泉马广芹哈尔滨师范大学图书馆黑龙江哈尔滨150025

图书馆 2015年5期
关键词:科研人员贡献次数

孟德泉 董 颖 马广芹(哈尔滨师范大学图书馆 黑龙江哈尔滨 150025)

·实证研究·

h相关指数改进比较与实证分析*

孟德泉董颖马广芹
(哈尔滨师范大学图书馆黑龙江哈尔滨150025)

〔摘要〕h指数的改进研究主要有两个视角:一是根据作者排名仅提取作为主要贡献的论文成果作为来源数据,提取被引次数形成降序排列进而计算h指数;二是提取作者全部论文成果以及被引证次数,根据作者署名区分贡献,被引次数加权后重新形成降序排列进而计算h指数。研究成果有g指数、e指数和h变形指数,对这些h相关指数进行实证分析与比较,认为改进研究在客观性、公正性上有很大提升,但是计算复杂性也相应提升。

〔关键词〕h指数g指数加权

1 引言

近十年以来,随着科学计量学与文献计量学的融合发展,文献计量学的许多指标被用于科学学领域的评价和研究,也正逐渐被用于科研人员论文、专利等科研成果影响力的评价。其中,所使用的文献计量指标也由论文数量、引文次数等量化指标逐渐过渡到高影响因子(impact factor)论文数量、h指数等兼顾成果数量和质量的指标。

论文数量是对科研人员评价的最简单的指标,但却没能考虑成果质量因素。引文次数在数量的基础上,在一定程度上考虑成果的质量,论文质量越高,引用次数则越高,用于单篇论文的质量评价更为合适,如果用来评价一个人的整体影响力则存在片面的问题。2005年,美国加州大学圣地亚哥分校物理系J.E.Hirsch教授针对论文数量和质量的综合衡量提出h指数,主张在评价科学家个人绩效时应对产出论文的质量和论文数量作综合考虑,评价指标既要体现质量,又要体现数量,以便提高评价结果的客观性和公正性。h指数的计算表述如下:将某科研工作者发表的N篇论文按照被引频次降序排列,被引频次最高的论文序号为1,被引频次最低的论文序号为N;当且仅当第h篇论文至少获得了h次的引文数,其余的N-h篇论文的引文数都小于等于h时,此h值就是该科研工作者的h指数。根据Hirsch对h指数的描述,有相似h指数的人,即使他们的论文总数相差悬殊,但他们在整体科学影响力方面是可比的。

h指数自提出以来,作为个人科研成就评价手段被广泛接受,优于总引文数量和高影响因子论文数量等文献计量指标。虽然陆续有很多学者就h指数的缺点进行修正研究,但至今没有提出一个明确优于h指数的单一的、数字的文献计量指标。

目前,国外学者的h指数的获取和计算主要基于Web of Science平台的创建引文报告功能,也可按照被引频次排序检索结果后通过顺序浏览的方式间接获得,不需要复杂的计算手段和过程。由于该平台提供的h指数数据都是当前的,所以大多数利用该指数对科研人员绩效进行评价都是对当前科研产出的评价。国内学者的h指数主要基于CNKI和CSSCI数据平台计算和提取,步骤与国外学者的h指数提取过程一致。

2 h指数相关改进研究

h指数在2005年被提出之初,其原创者Hirsch就已经考虑到该指数没有区分作者贡献和作者数量的问题,[1]2006年开始很多研究人员也都陆续指出h指数最突出的缺点就是没有考虑到科研人员论文成果中合作者的数量。[2]独立作者对论文的投入或者贡献虽然很大,但他们的h指数与合作发表论文较多的作者相比没有优势。不排除有一部分研究人员的论文数量和h指数都较高,但非第一作者或通讯作者的论文数量占较大的比例,这种现象在规模较大的项目团队中表现会比较突出。而且,当前的科技评价工作往往采用论文数量和被引次数作为指标,这在一定程度上推动了这一现象的产生,一些项目团队的研究人员在论文发表环节往往会把那些贡献较少甚至没有贡献的其它项目团队成员进行署名,甚至有些团队只要发表论文就把所有研究人员署名在作者项。这种情况目前还没有被纳入科研诚信标准,属于灰色地带。

针对以上问题,2006年Batista提出根据h核内论文的作者数量的均值平分h指数,但由于每个作者对于论文的投入和贡献都是不均衡的,平分的做法有欠公平,也会在某种程度上妨碍科研人员之间的合作。[3]Egghe在2008年提出根据作者排名来计算论文的引文数量再提取h指数,2009年Schreiber提出修正h指数的研究也都是基于类似的想法,根据合作作者数量重新计算论文的被引次数再提取h指数。[4-5]

Hirsch也在2010年提出了文献计量指标h-bar,给独立署名或较少合作发表论文的作者加分,不鼓励名义上的署名,同时又不妨碍真正的合作。他提出在h指数基础上,将以下情况的论文计入h-bar核:独立作者;h指数高于其合作者的论文;h指数低于其合作者,但论文被引频次高于合作者的h指数。 再考虑将h核外符合条件的少数论文纳入到h-bar核。hbar指数相比较h指数具有一定的优势,考虑了作者的贡献,同时在一定程度上能避免虚假或不必要的署名现象等。但是hbar也有缺点:①计算比h指数略为复杂。利用文献数据库计算hbar指数时,需要获得每篇论文被引次数以及每篇论文合作者的h指数数据,包括h核外的论文也要计算在内,会花费一定的时间。②hbar指数与h指数一样,对于某些研究人员同样不适用,比如成果平平的研究人员以及少而精的人员。③获得认可和推广可能会有障碍。[6]

3 h指数相关改进研究视角与存在的问题

3.1现有h指数改进研究视角

基于作者贡献的h指数改进研究主要有两种视角。一种视角是根据作者署名顺序和署名规则仅提取作为主要贡献人的署名成果,并纳入h指数计算范畴。通常有两种情况,一是将第一作者和通讯作者纳入研究范畴;二是将署名排在前三的成果纳入研究范畴,根据作者署名次序,仅计算排名在前1、2或3位的论文被引次数后计算h指数。另一种视角是根据作者署名顺序计算权重,将成果的被引次数加权后再重新计算序列提取h指数。也就是说,根据每篇论文的作者数量平分引用次数或根据作者排序加权后计算引文次数再提取h指数。

3.2现有研究成果存在的问题

自2005年h指数提出以来,3年内就产生了数百篇改进h指数的研究成果,其中既有g-indice,r-indice等新指数的提出,也有h-indice改进指数。[7]其中,g指数是2006年Egghe提出的:论文按被引次数排序后相对排前的累积被引至少g2次的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数将小于(g+1)2。从定义可以看出,g≥h,而按被引量排序靠前的文章的被引次数越大,g指数越大。这些改进研究的目的主要是通过改进h相关指数,提高评价的科学性,评价的对象包括学科、机构、国家和科研人员个体。在这些成果研究过程中,主要是通过Web of Science等平台获取研究对象的引文数据,通过识别作为主要贡献人的成果或对主要贡献人的引文次数进行加权后重新计算和提取评价其影响力和水平的h指数信息。这些研究成果可能存在或忽视的问题:①方法的复杂性问题。h指数被提出以来,以其计算简单这一优势被快速用于评价科研人员成果水平,如果想获取某位研究人员的h指数只需登陆Web of Science等数据库平台,通过其引文分析功能获得h指数,也可通过降序排列被引次数通过浏览获得h指数数据。科研管理部门、图书情报部门甚至科研人员自身都能够快速获取h指数信息。后续针对h指数的改进研究无论是公正性还是客观性都有了很大的提升,但是随之带来的却是数据检索和处理问题以及计算方法的复杂性大大提升等问题。本来只需动动鼠标简单的点击几次即可完成的工作,现在则需要计算每篇论文的作者数量及其排序信息,根据数量和权重计算被引次数后重新对论文进行排序,进而提取h指数,需要excel等其他数据处理和分析工具的辅助才能完成。计算一个人的改进h指数所投入的时间从原来的几分钟变成可能需要几小时。科技评价工作往往需要计算大量科研人员的h指数,需要的时间就更难以估计了,这也是为什么后续改进指标没能得以推广的原因。②目的性问题。由于计算方法复杂,研究h指数的角度要从评价转移到分析和预测。基于作者贡献的h指数可用于分析研究人员科研经历特征,如果能够对科研人员过去一段时间h指数逐年或根据时间窗进行分别计算的话可用于提取科研人员成长模式,预测其未来成就。Hirsch2010年提出应该研究科研人员h指数随时间演变规律。金碧辉在2007年以10 年期为观测窗口提取了某一科学家A的h 指数,考核的是不同时期其h指数变化率。并与张晓阳对科学家在研究生涯内h指数线性成长规律进行了研究,对h核内论文对h指数贡献情况进行分析,发现当高被引科学家不再发表论文后,h指数仍在5 - 8年期呈现对数型成长。[8-9]

4 实证分析

选择“图书情报与数字图书馆”学科的h指数数量排在前10的研究人员作为研究对象,利用CNKI数据库平台的期刊网络出版总库中“图书情报与档案管理”学科中的文献作者分组功能,找出h指数排名前10的研究对象的论文数量和引证数据(见表1)。

表1 研究对象发表论文数据

从表1可以看出,10位研究人员的h指数从16-30,其中,文献数量占较大优势的几位研究对象,包括邱均平、王知津等人在h指数方面并没有明显的优势。这也综合说明了我国图书情报学科研究成果在内容上较为分散,缺乏主题集中,导致互相引证率不高。论文数量指标的单纯提升,并不能对h指数起到较大的影响。

表2 研究对象h相关指数改进结果

进一步,通过计算作为第一作者的主要贡献成果的h指数以及根据论文作者数量平分被引次数后提取h指数,列出结果(见表2)。可以看出范并思、黄宗忠经常独立发表论文的两位研究人员h指数、作为主要贡献者的h指数以及根据作者数量加权后的h指数基本持平,并没有明显的变化。郑建明由于第一作者论文与总的论文数差距较大,导致其作为主要贡献者的h指数从17降到8,其他人作为主要贡献者的h指数则没有明显变化。但是,除了范并思、黄宗忠外,根据作者数量加权后的h指数都有较大幅度的变化。

5 结语

h指数自2005年提出,已有近千篇的中外文文献围绕如何改进以及实证的角度进行研究,由于h指数计算简单、快捷,所以相关的改进研究越客观、公正,其计算复杂度就越高。通过对第一作者贡献和根据作者数量平分被引次数的加权两个角度进行h指数的实证分析可以发现,独立研究较多的研究人员h指数都没有明显的变化;而合作研究论文为主的研究人员h指数变化会较大,平均合作者数量越多加权后的h指数差距就会越大。合作论文虽然能快速提升h指数,但是如果从加权和考虑主要贡献的角度来说则会拉低h指数。建议个人科学研究还是要考虑个人独立和合作两个角度来开展。

(来稿时间:2015年1月)

参考文献:

1.Hirsch JE. An index to quantify an individual’s scientific research output. Proceedings of the National Academy of Sciences of the United Stateds of America, 2005,102(46):16569-16572

2,4.Schreiber,M. A case study of the modified Hirsch hmaccounting for multiple coauthors. Journal of the American Society for Information Science and Technology, 2009,60(6):1274-1282

3. Batista,P.D.et al. Is it possible to compare researchers with different scientific interests?. Scientometrics, 2006,68(1):179-189

5.Egghe,L. Mathematical theory of the h- and g-index in case of fractional counting of authorship. Journal of the American Society for Information Science and Technology, 2008(59):1608-1616

6.J.E.Hirsch. An index to quantify an individual’s scientific research output that takes into account the effect of multiple coauthorship. Scientomerics,2010,85(3):741-754

7.杜建,张玢.作者合作视角下的h指数计量方法:比较与归纳.图书情报工作,2011,55(24):52-55,136

8.金碧辉,Rousseau Ronald.R指数、AR 指数:h 指数功能扩展的补充指标.科学观察,2007,2(3):1-8

9.Jin,B.H.,Liang,L.M.,Rousseau,R.,Eeehe,L..The R- and AR-indices:Complementing the h-index. Chinese Science Bulletin, 2007(52):855-863

〔分类号〕G350

〔作者简介〕孟德泉(1974-),男,硕士,哈尔滨师范大学图书馆副研究馆员,副馆长,研究方向:信息资源管理;董颖,女,哈尔滨师范大学图书馆研究馆员,研究方向:数字图书馆;马广芹(1974-),女,硕士,哈尔滨师范大学图书馆馆员,研究方向:图书馆学。

*本文系国家社会科学基金项目(14BTQ017)、教育部人文社会科学研究规划基金项目(12YJA870003)、黑龙江省高校图工委基金项目(2013-B-061)的研究成果。

Comparison and Analysis of H-related Indices

Meng DequanDong YingMa Guangqin
( Library of Harbin Normal University )

〔Abstract 〕There are two ways to improve h-index: extraction of thethesis scores according to ranking of authors as source data and extraction of citation frequency forms descending sort that computes to indentify h-index; the citation scores of all papers are weighed by the ranking of the author. In this study, the advantage and disadvantage of h related index is research by examples. With the improvement of objectivity and justice, the computing complexity is increasing apparently.

〔Keyw ords 〕H-indexG-indexWeighting

猜你喜欢

科研人员贡献次数
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
机场航站楼年雷击次数计算
中国共产党百年伟大贡献
科研人员破译黑猪肉特征风味物质
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
俄罗斯是全球阅兵次数最多的国家吗?
2020:为打赢脱贫攻坚战贡献人大力量
基于切削次数的FANUC刀具寿命管理
企业科研人员激励问题及对策研究