考虑载文量影响的h指数优化研究
2020-08-14俞立平韩亚茹张再杰
俞立平 韩亚茹 张再杰
摘 要:[目的/意义]针对h指数受载文量影响大、区分度低等问题,本文提出了hq2指数,其原理是用h指数除以开平方后的载文量。[方法/过程]基于中国知网(CNKI)引文数据库,以46种综合社科期刊为例进行实证研究,首先分析hq2指数与其他期刊评价指标的相关性,其次对hq2指数进行独立样本T检验,最后采用回归分析分别分析h指数、影响因子与hq2指数的拟合优度。[结果/结论]研究结果表明:hq2指数相比于h指数能够降低载文量对期刊评价的影响,对于h指数相同的期刊也具有较好的区分能力,同时hq2指数与h指数、影响因子呈现正相关关系,是一个具有可行性的期刊评价指标;hq2指数具有识别优秀期刊的能力。
关键词:h指数;载文量;区分度;hq2指数;期刊评价
DOI:10.3969/j.issn.1008-0821.2020.02.013
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2020)02-0114-08
Research on h-index Optimization Considering the Amount of Papers
——hq2-index
Yu Liping1,3 Han Yaru2 Zhang Zaijie3
(1.School of Statistics and Mathematics,Zhejiang Gongshang University,Hangzhou 310018,China;
2.School of Management and E-business,Zhejiang Gongshang University,Hangzhou 310018,China;
3.Institute of Green Development Strategy in Western China,Guizhou University of finance and Economics,
Guiyang 550025,China)
Abstract:[Purpose/Significance]The h-index is regarded as a new generation of journal evaluation index after the impact factor because of its simple definition,simple calculation and robust results.However,the shortcomings of h-index are obvious,such as large impact of the amount of papers loaded and low discrimination.In view of the above two shortcomings of the h-index,this paper proposes the hq2- index,which is based on the h-index divided by the amount of paper-loaded after square rooting.[Method/Process]Based on the China Knowledge Network(CNKI)citation database,this paper conducted empirical research on 46 comprehensive social science journals.First,it analyzed the correlation between hq2-index and other journal evaluation indicators.Secondly,it conducted independent sample T-test on hq2-index,and finally adopted regression.The analysis analyzed the goodness of fit of the h-index,the impact factor and the hq2 index.[Result/Conclusion]The results showed that the hq2-index can reduce the impact of the paper load on the journal evaluation compared with the h-index.It also had a good discriminating ability for the journals with the same h index,and the hq2-index had a positive correlation with the h index and the impact factor.It is a viable journal evaluation index;the hq2-index has the ability to identify excellent journals.
Key words:h-index;amount of papers;discrimination;hq2-index;journal evaluation
2005年,Hirsch J E[1]提出一個新的计量指标——h指数,该指标主要用于评价科研工作者的个人学术成就。由于计算的科学性和简便性,h指数在其他领域也得到了广泛的推广应用。2006年,Braun T等[2]将h指数应用到期刊评价中,定义了期刊h指数。同年,van Raan A F J[3]将h指数原理推广到机构评价中。Guan J C等[4]以半导体技术领域的数据为例,将h指数应用到专利分析中。孙宇等[5]认为h指数可以作为评价出版社学术影响力的指标。除此之外,h指数还在馆藏图书借阅、大学和医院等领域得到拓展应用。
h指数也有不足之处,主要表现在:载文量高的期刊往往会出现h指数也高的现象,而且对于创刊时间早的期刊,即使其每年的载文量不大,但随着期刊的不断发行,期刊所发表的文章也会逐渐地增多,此时h指数也随着载文量的增加而提高;h指数对排名靠前的期刊区分度较高,但是就大多数普通期刊而言,容易出现结果相同的现象,这时区分度就较差。对h指数进行优化改进,一定程度上可以弥补载文量对h指数影响较大以及h指数在期刊评价中区分度差的缺陷,完善h指数,丰富学术期刊评价指标。
关于h指数和载文量之间的关系,不少学者都认为这两者之间是存在明显的正相关关系。Rousseau R[6]提出用h指数除以期刊的载文量,得到相对h指数,以此来补偿载文量少的期刊。Hirsch J E等[7]本人对h指数的缺陷给予了积极回应,要想提高h指数,关键的是要提高论文质量,但是另一方面也要依赖提高载文量。安静等[8]认为h指数的大小受到载文量的限制,学术质量高但载文量偏低的期刊,h指数也不会高,提出用h指数的平方除以载文量,得到K指数。丁楠等[9]对h指数的优缺点进行了总结,其中根据定义,h指数是不能超越论文数量的界限,所以这对那些论文数量少而被引频次高的科学家是非常不利的。周玉芹[10]认为载文量是将h指数用于法学期刊评价的一种限制,因为载文量小的期刊,h指数也不会高。刘银华等[11]以化学类期刊为例,发现同领域的期刊,年刊载量多的期刊比年刊载量少的期刊更容易获得高h指数,并采用h指数和相对h指数评价期刊,在h指数相同的情况下,相对h指数更能表现期刊的学术水平。张垒等[12]利用灰色关联分析法计算h指数和载文量之间的关联度,尽管期刊h指数是通过论文被引频次计算出来的,但载文数量是期刊引用的基础,载文数量和期刊h指数之间是存在关联度的,提高h指数不能单纯依靠载文量。
学术界对h指数的区分度问题基本上也都持一致态度,普遍认为h指数的区分度较低。Kosmulski[13]在h指数基础上,提出h(2)指数,其定义为至少h篇论文被引次数为h平方,在一定程度上提高了h指数的区分能力。Egghe L[14]将论文按被引频次高低排序,然后对被引频次进行累加,并且将每篇文章对应的序号平方,得到G指数,G指数很好地改善了h指数区分度。Prathap G[15]定义hm=(被引次数*平均被引率)1/3,不仅延续了h指数的简洁计算的优点,而且当由于h指数值相同而使得很多评价案例无法区分时,hm能更合理地进行排名。王凌峰[16]认为h指数对于评价少数优秀学者具有较高的区分度,而对于大多数的普通学者来说,他们的h指数要么相同,要么差距很小,区分能力差。张雪梅[17]也认为h指数不能细分拥有相同h指数而作品总被引频次相差悬殊的作者,并且使用修正因子对h指数进行了修正,这对众多普通科研工作者可以做一个很好的区分。刘雪梅[18]选取兰州大学的30位研究人员作为评价对象,定义新指标zpc指数,zpc指数对h指数相同的學者评价区分度达到100%。俞立平等[19]认为基于h指数的新指标的提出需要保持区分度原则,尽量避免两个评价对象评价结果相等的情况出现。
从已有的研究来看,关于h指数与载文量的关系,学者们普遍都认为载文量对h指数有正向影响,载文量大h指数相对就高,载文量小h指数就偏低。对于h指数的区分度,国内外的学者也做了大量的研究,总体结论是一致的,认为h指数的区分能力差,并提出了一系列的类h指数进行优化和完善。总体上来看,学术界对h指数的修正研究是从单一角度进行考虑的,很少从多个方面优化h指数。因此本文将从以下几个方面对h指数开展研究:
1)某些期刊h指数和载文量呈现正比例关系,在采用h指数评价期刊时应该考虑到载文量对h指数的影响,避免有的期刊为了提高h指数,刻意增加载文量。
2)h指数适用于评价非常优秀的期刊,而对于大多数普通期刊来说不敏感,常常出现多个期刊h指数相同的现象,因此有必要完善h指数,解决h指数区分度低的问题。
本文旨在解决h指数受载文量正向影响和区分度差的问题,对h指数改进,提出一项新指标——hq2指数,并基于中国知网(CNKI)引文数据库,以46种综合社科期刊为例对hq2指数评价期刊的功效进行论证分析。
1 hq指数原理
Rousseu所提出的相对h指数,采用h指数直接除以载文量的计算方法,在很大程度上排除了载文量的影响。但是载文量作为学术期刊主要特征指标之一,起着举足轻重的作用,韦青侠[20]认为载文量具有衡量期刊吸收和传递信息的能力,应该考虑载文量的正常增长。袁泽轶等[21]对《海洋通报》的载文量进行统计,认为某一期刊刊载的论文数量,反映了期刊信息量的多寡,期刊载文量多,一定程度上信息相对丰富。如果对载文量处理力度过大,信息量势必会减少,这是不利于信息传播和期刊长久发展的。综合h指数不够重视载文量以及相对h指数惩罚载文量力度较大的不足之处,需要对载文量做新的考虑,因此本文采用对h指数开方处理的方式,提出一个新的指数评价期刊,即hq指数:
式(1)中h指期刊的h指数,q指期刊载文量,s是对载文量开方的次数,取值定义为自然数1,2,3,4……,直至hq指数的分母为1或者最接近于1。当s为1时,hq指数就是相对h指数。用h指数除以开不同方根的载文量,可以改变载文量对h指数的正向作用,同时也规避了相对h指数对载文量过度惩罚的缺陷,适当地保证论文数量,提供较为丰富的信息。
至于s的确切取值,我们可以从提高h指数区分度的视角作为切入点,俞立平等[22]曾对光学类期刊各个指标的辨识度做研究,在此借鉴辨识度计算的原理,筛选出s不同时所得到的期刊区分度最高的hq指数。区分度计算原理如图1所示:
假设有4种期刊,根据式(1)计算这4种期刊的载文量分别开t次和k次时的hq指数,然后将结果按照降序排列,并对期刊编上序号,画出hq指数结果和期刊编号的二维坐标图,其横坐标表示期刊编号,纵坐标表示hq指数值。由于是对载文量开不同的方根,期刊hq指数的数值也会随着不同的s变化且差距较大,但是期刊编号是不发生变化的,多种计算方式之间没有统一的标准,结果不具有可比性,因此必须对数据做标准化处理,其中每个期刊的hq指数都除以同种计算方式下的极大值,编号则除以期刊的个数,标准化后的hq指数值及期刊编号的范围都将处在0~1之间。这时将标准化后的指标呈现在二维坐标图中,就如图1所示。可以看出,曲线段Lt的总长度大于Lk的总长度。也就是说,总长度越长,点与点之间就越分散,区分度就越高。计算区分度的公式可以表达如下:
式(2)中,D表示期刊的区分度,G和N分别表示标准化后的期刊hq指数和编号,m表示期刊的个数,其中1im。
2 数据来源
从评价指标的普适性而言,本文研究方法没有学科依赖、数据依赖等问题,具有更好的普适性。因此选取47种CSSCI综合社科期刊为例进行研究。其中由于《福建论坛》(人文社科版)数据检索不到,所以实际选取的期刊为46种。46种期刊当中,有9种期刊的办刊时间历史比较悠久,是在改革开放之前创刊的,而更多的期刊是在改革開放后创办的,为了消除创刊时间对h指数评价期刊造成的偏差,本文选取数据的时间窗口皆与计算2年影响因子的时间保持一致,即以2015-2016年作为出版年,2017年为被引年来计算期刊的载文量、总被引频次、h指数和影响因子(IF)。本文原始数据全部来自中国知网CNKI的引文数据,后续相关指标的计算也是基于原始数据。
3 实证结果
3.1 hq2指数的计算
根据hq指数的原理,s的取值范围很广泛,没有必要开过高的方根,本文计算s为1~9时的hq指数的区分度D,观察它们的变化规律,进而确定最佳s。具体数据如图2所示,随着对载文量开方次数的加大,hq指数的区分度总体上呈现波动下降的趋势,s等于5和9时,区分度有小幅度的上升,而当s等于1时,hq指数也就是相对h指数的区分度最高,为1.6566,但是根据hq指数的原理,载文量大同时也说明了期刊信息丰富,因此要对载文量适当地处理,避免信息匮乏影响期刊的长久发展,有必要将s等于1时的hq指数(相对h指数)排除掉。对比其它的计算结果,发现s为2时,期刊区分度是最高的,说明对载文量开平方时,期刊可以拥有一个良好的区分度,同时hq2指数是h指数和开平方后的载文量共同计算的结果,克服了载文量对h指数的影响,同时与相对h指数相比,hq2指数对载文量惩罚力度有所缓和。因此本文将选取hq2指数作为一个新指标对期刊进行评价。
期刊的hq2指数计算结果在表1中显示,根据这个结果,可以看到《中国社会科学》、《人民论坛·学术前沿》、《学海》等学术界认可的优秀期刊排在前列;一些因为载文量大,h指数高的期刊,hq2指数平衡了其h指数与载文量的关系;还有一些由于载文量少,h指数较低的期刊,在hq2指数排名中有了明显的提升,比如《中国高校社会科学》、《开放时代》;另外我们还可以清晰地看到,以h指数为10的《开放时代》、《广东社会科学》、《社会科学研究》等8个期刊,它们的hq2指数都存在差异,其他h指数相同的期刊也都具有同样的结果,不难看出因h指数相同而难以区分的期刊,hq2指数有较好的区分度。
3.2 hq2指数统计学特征
hq2指数的描述统计特征如图3所示,其均值为0.426,标准差为0.194,离散系数为0.455,偏度为3.120,峰度为16.958,Jarque-Bera值为448.076,p值为0.000。显然hq2指数呈现明显的右偏态分布,说明只有少数几个高质量期刊在剔除了载文量的误差后,依然维持着较高的成绩,这从另一方面为其他期刊做了表率,提高期刊影响力,关键是做好刊发论文的质量把关。
3.3 hq2指数与其他计量指标的相关性检验
hq2指数的描述统计结果显示,hq2指数不服从正太分布,因此采用Spearman相关系数分析hq2指数与h指数、IF和载文量的相关性。指标之间的相关系数如表2所示。hq2指数与h指数的相关系数为0.738,并且通过了统计检验,hq2指数与IF的相关系数为0.898,同样通过了统计检验,与期刊载文量的相关系数为-0.356,其相关性也是显著的,之所以呈现负相关关系,这与hq2指数的计算方式有关,而且与h指数不同的是,增加载文量并不会提高hq2指数。
注:***、**分别表示在置信度(双侧)为0.01、0.05时,相关性是显著的。
3.4 独立样本T检验
根据hq2指数是否大于其均值0.426进行分组,将46种期刊分为2组,分组1表示hq2指数大于其均值,共有15种期刊,小于均值的期刊有31种,然后对hq2指数、h指数、IF和载文量进行独立样本T检验。检验结果如表3所示。结果显示分组1的hq2指数、h指数和IF的均值均大于分组2的均值,而分组1的载文量小于分组2的。从载文量的显著性差异,我们不难看出,hq2指数突出了对载文量的重视,这对那些因高载文量具有高h指数的期刊也可以做出相对合理的评价。最后观察T检验值,hq2指数、h指数、IF和载文量均通过了统计检验,且效果良好,表明这两个分组具有显著差异。总体上看,分组1的期刊质量是高于分组2的,即高hq2指数的期刊其质量是优于低hq2指数期刊的,并且以hq2指数作为分组标准,h指数和IF的两个分组呈现出与hq2指数相同的趋势,也就是高h指数和高影响因子的期刊质量优于对应的低h指数和低影响因子的期刊,因此hq2指数作为期刊评价指标是具有一定的可行性。
3.5 回归分析
3.5.1 h指数与hq2指数的回归分析
h指数与hq2指数的回归分析结果如下:
式(3)中h指数的弹性系数为0.853,说明h指数每增加1%,hq2指数就增加0.853%。两者的拟合优度为0.639,而h指数也在1%的水平上通过了统计检验,说明这两者存在显著的相关关系,但是同样也可以看出h指数并不能完全解释hq2指数,两者之间的差异表明hq2指数考虑到了载文量对评价期刊的影响。
3.5.2 IF与hq2指数的回归分析
IF与hq2指数之间的关系可以表述为:
相较于h指数与hq2指数的拟合优度,IF与hq2指数的拟合优度有所提升,这可能与两者的计算方式都涉及载文量相关。IF的弹性系数为0.694,即IF每增加1%,hq2指数就增加0.694%。
从h指数、IF与hq2指数回归结果来看,hq2指数与两者的拟合度都呈现一个比较良好的效果,同时也可以看出hq2指数具有自身独特的优势。其优于h指数是在于它考虑到了载文量对h指数的影响,排除掉载文量对h指数的正向作用;影响因子是单方面考虑载文量,实践证明,载文量对影响因子的反向影响大于正向影响,即增加载文量会降低影响因子,而hq2指数从两个方向考虑到载文量的影响,hq2指数计算公式的分子是h指数,增加载文量,h指数也会相应地增加,但是公式的分母也是关于载文量的,所以hq2指数更具有全面性。
4 结论与讨论
4.1 hq2指数是一个具有可行性的期刊評价指标
hq2指数的实证分析中,为了避免期刊创刊时间不同造成的误差,所选取的数据都进行了时间的界定,这规避了历史悠久的期刊在计算h指数时所占据的时间优势。本文将h指数与开平方后的载文量结合起来,一方面解决了因载文量大而造成h指数高的问题,缓和了相对h指数惩罚载文量力度较大的缺陷,可以更客观合理地进行期刊评价;另一方面也克服了因h指数相同而无法准确评价期刊的缺点。从hq2指数与其他计量指标的相关性分析结果可以看出,hq2指数与hq2指数的相关系数为0.738,与IF的相关系数为0.898,且都通过了统计检验。从h指数、IF与hq2指数的回归分析结果可以看出,hq2指数会随着两者的增加而提高,因此hq2指数与h指数、IF呈现正相关关系。综上所述,hq2指数作为一个新的期刊评价指标,具有可行性。
4.2 hq2指数具有识别优秀期刊的能力
《中国社会科学》是学术界公认的综合社科类期刊的权威期刊,无论是按照h指数排名还是根据hq2指数排名,均排在第一位。除《中国社会科学外》,h指数无法评价的期刊,hq2指数也对优秀期刊做了区分,比如影响因子较高的《开放时代》,相较于h指数在hq2指数排名中有了突破。另一方面从独立样本T检验的结果也可以看出,根据hq2指数均值确定的两组期刊,高hq2指数的期刊其影响因子和h指数同样较高;低hq2指数的期刊其影响因子和h指数则较低。综合以上两点,可以说hq2指数具有一定识别优秀期刊的能力。
hq2指数针对h指数受载文量影响较大、区分度过低的问题做了修正,并在实证分析中取得了良好的效果,但是本文也仅以46种CSSCI综合社科期刊做了实证分析,至于在其他学科的推广应用还需要进一步研究。
参考文献
[1]Hirsch J E.An Index to Quantify an Individuals Scientific Research Output[J].Proceedings of the National Academy of Sciences of the United States of America,2005,102(46):16569-16572.
[2]Braun T,Glnzel W,Schubert A.A Hirsch-type Index for Journals[J].Scientometrics,2006,69(1):169-173.
[3]van Raan A F J.Comparison of the Hirsch-index with Standard Bibliometric Indicators and with Peer Judgement for 147 Chemistry Research Groups[J].Scientometrics,2006,67(3):491-502.
[4]Guan J C,Gao X.Exploring the h-index at Patent Level[J].Journal of the American Society for Information and Technology,2008,59(13):1-61.
[5]孙宇,武士华.应用h指数科学地评价出版社的学术影响力[J].科技与出版,2008,(9):61-63.
[6]Rousseau R.A Case Study:Evolution of JASISs Hirsch Index[J].Science Focus(in Chinese),2006,1(1):16-17.
[7]Hirsch J E,Buela-Casal G.The Meaning of the h-index[J].International Journal of Clinical and Health Psychology,2014,14(2):161-164.
[8]安静,夏旭,李海燕,等.类h指数:K指数的修正机理及实证分析[J].科技管理研究,2009,(6):382-384.
[9]丁楠,周英博,叶鹰.h指数和h型指数研究进展[J].图书情报知识,2008,(1):72-77.
[10]周玉芹.H指数评价法学期刊实证研究——基于《中国学术期刊综合引证报告(2008版)》的数据分析[J].四川文理学院学报,2011,(2):142-146.
[11]刘银华,陶蕾.试用 h 指数评价科技期刊[J].大学图书情报学刊,2008,26(2):94-96.
[12]张垒,唐恒.影响h指数、g指数、影响因子因素的相关性研究[J].图书情报工作,2009,53(20):139-143.
[13]Kosmulskim.A New Hirsch-type Index Saves Time and Works Equally Well as the Original h-index[J].ISSI Newsletter,2006,(3):4-6.
[14]Egghe L.An Improvement of the H-index:The G-index[J].Quarterly E-zine of International Society for Scientometrics and Informetrics,2006,2(1):8-9.
[15]Prathap G.Is There a Place for a Mock h-index?[J].Scientometrics,2010,84(1):153-165.
[16]王凌峰.一个新的h-type指标——A+指数[J].情报杂志,2013,(1):55-58.
[17]张学梅.hm指数——对h指数的修正[J].图书情报工作,2007,51(10):116-118.
[18]刘雪梅.作者合作与期刊影响因素视角下的学者评价研究[J].情报理论与实践,2018,(11):113-116
[19]俞立平,王作功,张再杰.h指数的综合修正研究:htop指数——以学术期刊为例[J].情报学报,2018,37(12):1188-1192
[20]韦青侠.10年来我国科学、科学研究类核心期刊载文量与学术影响力评价分析[J].中国科技期刊研究,2014,(1):35-38.
[21]袁泽轶,杨瑞,张潇娴,等.基于中国知网(CNKI)《海洋通报》期刊学术影响力的统计分析[J].天津科技,2010,37(6):131-133.
[22]俞立平,姜春林.科技评价指标与评价方法辨识度的测度研究[J].图书情报工作,2013,57(3):38-41.
(责任编辑:郭沫含)