学者学术生命视角下评价指标的实证研究
2021-08-30傅俊逸
傅俊逸 庄 倩
(1.南京农业大学信息管理学院 南京 210095;2.江苏第二师范学院图书馆 南京 211200)
随着科技创新重要程度的不断提升,科研院所与高校亟需大量优秀的科研人员的加入,科研人才之间的竞争也就越来越激烈。科学的使用评价指标来评价人才,能够为高校和科研机构录用、提拔、激励人才提供一定的理论依据,从而能够促使人才产出更多高质量的科研成果。
当前的定量评价指标可以分为传统指标(出版物数量、被引次数、影响因子)、相对指标、h指数、基于网络的评价指标以及替代计量学指标[1-2]。传统指标包括出版物数量[3]、被引次数[4]、影响因子[5]。出版物数量能够反映学者的学术生产力,但是不能够反映学者研究的质量[6];被引次数能够反映学者的学术影响力,但是无法区分学者的贡献度[2];影响因子多适用于期刊的评价,不适合用来评价学者[7]。为了克服不同学科领域引文习惯的差异,有人提出了相对指标,包括相对被引率[8]、皇冠指数[9]等指标,然而这些指标只被证明可运用于机构的评价[10-11]。以往的指标无法兼顾论文的数量和质量,Hirsch提出的h指数很好的解决了这一问题[12]。然而h指数也存在着一些问题,包括:只升不降、区分度不高、不适合跨学科评价、不适合比较职业生涯不同的学者、很难评价团队的影响力以及个人在团队中的影响力、缺乏灵敏度[13-16]。因此,就有人提出了一些衍生指标来解决这些问题。包括PQI指数、h bar指数、锥形h指数、g指数、R指数和AR指数、p指数、EM指数和EM’指数[17-24]。
除了以上的指标,还有基于学术网络的评价指标。Abbasi发现了归一化中心度、归一化特征向量中心度、平均关联强度和效率这四个社会网络指标和科研表现(g指数)之间呈正相关[25]。陈云伟等人在2013年提出了复合合作强度指数(CCS),这一指数既考虑了作者合作网络,也考虑到了合作者和合作机构的影响[26]。Christian等人提出了s指数。s指数对个人网络位置相对于所有其他作者的被引用潜力进行排序,对学者的被引次数进行排名[27]。还有一类指标是基于PageRank算法设计出来的,包括AuthorRank算法[28]、不同阻尼因子的PageRank算法[29]、考虑引用和共同网络拓扑的加权PageRank算法[30]、TH Rank指标[31]等。这些指标能自动生成被引权重、可从基于知识流通的角度来评价、能促进分类评价。然而,这种评价大多只能从学科或期刊领域来构建学术网络,难以从整个科学界的范围来评价[2]。
随着社交媒体的不断发展,替代计量学(altmetrics)指标逐渐被应用于学者评价中。该指标最早由J.Priem提出[32],可以分为五大类,包括:被使用情况、被获取情况、被提及情况、社交媒介和引用情况[33]。替代计量学指标有着:获取数据快速且便利、评价对象广泛、影响力测度全面等优点,但是也有定义模糊、研究对象和研究方法待开拓、缺乏理论基础、行为层面的研究较少等缺点[34]。
以上的常用的评价方法大多从出版物数量、被引次数、学术网络合作情况以及社交网络的角度来评价学者,鲜有人从学者的学术生命和学者学术成果的老化角度来评价学者。在科学研究中学者是否能保持长久的学术生命是衡量其成功的一个重要标准[35]。然而在此标准之下,描述学者学术生命长短的指标一直未有人提及,因此本文提出了从学者学术生命长短的角度来评价学者的学术生命期。就文献老化的角度而言,半衰期是文献计量领域中测度文献老化情况的一个重要指标,有着丰富的理论研究基础[36],但是近些年将半衰期用于学者评价的实证研究较少[37-40]。因此,本文在以往半衰期理论研究的基础上,结合了学者的学术生命期,提出了学者的学术生命半衰期以及学者的学术影响力半衰期两个评价指标。笔者将学术生命期、学术生命半衰期、学术影响力半衰期统一定义为学术生命视角下的评价指标。
1 学者学术生命视角下的评价指标
传统的评价指标不能够从学者职业生涯长短的角度以及学者文献老化的角度来评价学者,因此,这里引入了学者学术生命视角下的学术影响力评价指标,包括学者的学术生命期、学者的学术生命半衰期、学者的学术影响力半衰期。
1.1学者的学术生命期学者的学术生命期在这里被定义为学者最早和最晚发文年份的时间差,学者学术生命期的长短反映了学者学术生涯的长短。假设某位学者最早发文年份为t1,最晚发文年份为t2,学术生命期为T。那么,T= t1-t2。
1.2学者的学术生命半衰期学者的学术生命半衰期指的是学者发文数达到总发文数一半所需要的时间,学者的学术生命半衰期能够反映学者在学术生命期中文献产出的老化情况。学者的学术生命半衰期越长,学者在学术生命的后期发文就越频繁,学者近些年文献产出的老化速度越慢,学术影响力就越大。
这里以学者Tachibana为例,阐述学者学术生命半衰期的计算方法。
表1中展示了学者Tachibana在美国物理学会期刊上各年的发文数。接下来,计算累加值和累计百分比。其中,累加值是指某一年累加到最新出版年份的发文数,而每个年份的累加值除以总发文的累加值就得到了每年的累计百分比。累计百分比为50%的出版年份和最早出版年份作差就可以得到学者的学术生命半衰期。学者学术生命半衰期的公式为HL= b+(b-c)*(50%-bp) /(cp-bp)-a。其中:a为最早发文年份,b为小于50%累计百分比中的最大值所对应的年份,c为大于50%累计百分比中的最小值所对应的年份,bp和cp分别的表示的是b、c所对应的百分比。学者Tachibana的学术生命半衰期HL=1992+(1993-1992)*(50%-44.4%)/(77.8%-44.4%)-1991≈1.83。这里的1.83指的是学者Tachibana在学术生命期内用了1.83年就达到了总发文数的一半。
表1 学者Tachibana在美国物理学会的期刊上发表文章情况
1.3学者的学术影响力半衰期学者的学术影响力半衰期是文献半衰期的一种。它指的是某学者被引的全部文献中较新发表的一半是在最近(以最终被引年份开始统计)多长一段时间内发表的。学者的学术影响力半衰期能够反映学者截至某个统计年份的文献影响力的老化情况。学者的学术影响力半衰期越长,被引文献的出版年份就越久远,学者文献的老化速度就越慢,学者的持续影响力就越大。
这里以学者Tachibana为例,阐述学者的学术影响力半衰期的计算方法。
表2中展示了学者Tachibana在美国物理学会期刊上发表的文章累计至2013年的被引次数。接下来,计算累加值和累计百分比。其中,累加值是指某一年累加到最新出版年份的被引次数,而每个年份的累加值除以总被引的累加值就得到了每年的累计百分比。统计年份和累计百分比为50%的年份作差就可以得到学者学术影响力半衰期。学者学术影响力半衰期的公式为HC=a-b+(b-c)*(50%-bp) /(cp-bp)。其中:a为统计年份,b为小于50%累计百分比中的最大值所对应的年份,c为大于50%累计百分比中的最小值所对应的年份,bp和cp分别的表示的是b、c所对应的百分比。学者Tachibana的学术影响力半衰期HC=2013-1993+(1993-1992)*(50%-34.6%)/(80.2%-34.6%)≈20.34。这里的20.34指的是学者Tachibana截至2013年被引的文献中较新发表的一半是最近20.34年内发表的。
表2 学者Tachibana在美国物理学会的期刊上文章被引情况
2 学者学术生命视角下的评价指标的实证研究
2.1数据来源及数据清洗数据源自美国物理学会的期刊。其中有Physical Review1(1894-1969, Physical Review(Series I)发表于1894至1912年, Physical Review发表于1913至1969年)。Reviews of Modern Physics(1929),Physical Review L (1958),Physical Review A,B,C,D(1970),Physical Review E(1993), Physical Review Special Topics -Accelerators and Beams(1998), Physical Review Special Topics - Physics Education Research(2005)。本文选取了这些期刊中的236 884位学者来进行研究。这些学者最早的一篇文章是在1893年发表的,而最晚的一篇文章是在2009年发表的。若是一篇文章属于多个学者,这些文章以及文章的被引次数同时纳入学者评价指标的统计中去。除此之外,本文的引用数据是闭合的,只统计了美国物理学会期刊内部的文献引用。虽然本文的数据比较久远,但是,本文的研究目的仅仅是为了探寻指标的评价效果,因此,数据的时效性对本文的研究结果是没有太大影响的。
表3中统计了各个期刊上面发表文章的学者数量(期刊名以缩写表示),我们可以看到:PhysRevB(1970)以及PhysRevLett(1958)的学者数量最多,接近半数。这说明学者更加倾向于在这两种期刊上面发表文章。而PhysRevSeriesI(1894-1912)以及PhysRevSTPER(2005)的学者数量较少,只有数百人,这是因为PhysRevSeriesI的发行年份限定在16年以内,而PhysRevSTPER首次发行的日期最晚。
表3 期刊学者数量表
数据集提供了美国物理学会的学者发表的所有的文章dio号以及文章相应的年份和文章在2013年的被引次数。对应的“学者——文章”数据中一共有236884位学者,但是笔者发现114条名字有重复的情况。接下来,人工核对了这些作者的身份,就对这些重复的姓名进行重命名。例如:'D. B. Tran Thoai'出现了2次,它们分别被命名为'D. B. Tran Thoai1'和'D. B. Tran Thoai2'。 其中科研团队'Asdex Upgrade Team'对应的文献数据被笔者合并了,除此之外,部分学者文章发布的年份差过大,最高甚至达到了100年,因此将这部分学者从数据集中剔除。所以最后一共是236 666位学者。
2.2学者学术生命视角下评价指标的分布规律将学者数量的频次以及学术生命视角下的评价指标分别取以10为底的对数之后得到图1。
图1 学术生命视角下评价指标的拟合情况
通过Python使用最小二乘法计算后得到学术生命期的拟合结果为:y=-1.629x+5.090,r=0.894,R2=0.799,分布公式:Y=105.090X-1.629;学术生命半衰期的拟合结果为:y=-2.584x+5.775,R2=0.778,分布公式:Y=105.775X-2.584;学术影响力半衰期的拟合结果为:y=-2.758x+6.818,r=0.890,R2=0.793,分布公式为:Y=106.818X-2.758。我们可以发现学术生命视角下的评价指标的拟合优度都比较好,因此,学术生命期、学术生命半衰期、学术影响力半衰期都基本符合幂律分布。
2.3学术生命视角下评价指标的相关分析为进一步探索学术生命视角下的评价指标和传统计量指标之间的相关性以及学术生命视角下的评价指标之间的相关性,本小节对它们进行了相关分析。通过上一小节的研究,我们发现:学术生命视角下的评价指标呈幂律分布,不呈正态分布。因此本小节使用了Spearman相关系数法来研究指标间的相关性。
学术生命期视角下评价指标的相关性如表4所示。
表4 学术生命视角下评价指标的相关性
a.从学术生命视角下的评价指标来看。首先,学术生命期和传统指标相关性较强。这是因为学术生命期评价学者时强调了学者的学术生涯长短,学术生涯越长就越有可能发表更多的文章,就越有可能获得更多的被引。学术生命期能够从某种意义上反映学者的发文和被引情况,更能够弥补传统指标不能够从学术生涯长短的角度来评价学者的缺陷。其次,学术生命半衰期和传统指标相关性较强。这是因为学术生命半衰期反映了学者在学术生命后期的发文情况。在学术生命后期的发文越多,总体的发文数就越多,就越有可能获得更多的被引。该指标和传统指标的最大不同在于其能够强调学者在学术生命期中文献产出的老化情况。最后,学术影响力半衰期和传统指标为中等强度相关,和学术生命期为中等强度相关。这是因为该指标在统计时考虑了发文、被引以及学者的学术生命期,所以和这些指标存在一定程度的相关。该指标和传统指标的最大不同在于其能够反映学者影响力老化的情况。
b.从传统评价指标来看。发文数和学术生命期、学术生命半衰期的相关性强于被引次数和学术生命期、学术生命半衰期的相关性。这是因为学者的学术生涯越长就越有可能发表更多的文章,但是这些文章未必都会获得更多的被引;学者在学术生命期中文献产出的老化情况越低就越有可能发表更多的文章,但是这些文章未必都会获得更多的被引。
2.4学者学术生命视角下评价指标的评价效果
2.4.1 诺贝尔奖获得者的排名百分段 为探讨当前指标的评价效果,笔者分年份选取了126位获得诺贝尔奖的学者,并把他们放在所有学者集合中来排名,排名的百分段情况如表5所示。
表5 学术生命视角下诺贝尔奖获得者的指标排名百分段人数
学术生命视角下的评价指标可以反映学者学术生涯长短的角度、学者文献产出的老化情况以及学者文献成果影响力的老化情况。根据表5,学术生命期的评价效果较好,前1%百分段的学者数量达到了50人,前5%百分段的学者数量达到了77人,略低于被引次数但是超过了发文数。学术生命半衰期和学术影响力半衰期的评价效果良好,学术生命半衰期在前20%的百分段有105位学者,学术影响力半衰期在前20%的百分段有98位学者,都远远超过了半数。
2.4.2 部分诺贝尔奖获得者排名变化分析 表6给出了一部分发文数、被引次数相对较少的诺贝尔奖获得者的排名百分比情况。
表6 部分诺贝尔奖获得者排名百分比情况 (%)
从表6中可以看到,在发文数、被引次数相对较少的前提下,学术生命视角下的评价指标存在以下几种情况:第一,学者的学术生命期、学术生命半衰期以及学术影响力半衰期排名百分比都较为靠前,有学者4和学者12。第二,学者的学术生命期、学术影响力半衰期排名百分比都较为靠前,学者的学术生命半衰期排名百分比较为靠后,有学者10和学者11。第三,学术生命期、学术生命半衰期排名百分比都较为靠前,学者的学术影响力半衰期排名百分比靠后,有学者3。第四,学者的学术生命期以及学术生命半衰期排名百分比靠后,学术影响力半衰期排名百分比较为靠前,有学者1、学者2、学者5、学者6、学者7、学者8、学者9。因此,对一些发文数和被引次数相对较少的诺贝尔奖获得者而言,用学术生命视角下的评价指标来评价他们,能够比较好的反映其学术影响力。
3 结 语
本文以美国物理学会期刊上发文的学者为研究对象,研究了学者学术生命期视角下的评价指标,解决了如下几个问题:其一,详细解释并具体阐述了学者学术生命期视角下评价指标的定义和计算方法。其二,研究了学者学术生命期视角下评价指标的分布规律,发现学术生命视角下的评价指标是符合幂律分布的。其三,对学术生命视角下的评价指标进行了相关分析。学术生命视角下的评价指标和传统指标(发文数、被引次数)之间存在一定的相关性。其中,学术生命期、学术生命半衰期和传统指标之间为强相关;学术影响力半衰期和传统指标之间为中等强度相关。学术生命视角下的评价指标中,学术生命期和学术生命半衰期之间为强相关,而这两个指标和学术影响力半衰期之间为中等强度相关。其四,发现学术生命视角下的评价指标的评价效果良好,且能够比较契合的反映发文数、被引次数较少的诺贝尔奖获得者的学术影响力。
然而,在用学术生命视角下的评价指标来评价的时候,还可能遇到一些问题。
其一,使用学术生命视角下的评价指标来评价学者的时候可能存在着适用性的问题。就学术生命期而言,该指标能够从学者学术生涯长短的角度来评价。然而,对部分年轻的学者来说,他们的学术生涯还没有结束,把他们和学术生涯已经过了一部分或是接近尾声的学者放在一起评价似乎有些不公平;此外,学术生命期只考虑了学者的发文时间,难以合理评价发文少且发文间隔年份长的学者以及发文多且发文间隔年份短的学者。就学术生命半衰期而言,它能够反映学者在学术生命期中文献产出的老化情况,但是该指标和学术生命期高度相关,也可能会受到学术生涯长短的影响。就学术影响力半衰期而言,该指标能够从学者文献影响力老化的角度来评价,但是学者的学术生命期、学者的发文年份以及学者的集中分散发文情况都会影响到此指标的适用性。其二,学术生命视角下的评价指标中的两个半衰期指标在评价学者学术影响力的时候还缺少一点区分度。首先,这两个指标的统计没有区分学者在学术成果中的贡献度,第一作者或通讯作者与挂名作者没有被区分。其次,文献发表的期刊质量以及引用该文献的文献质量无法被考虑到。就学术生命半衰期而言,比如,某位学者的发文集中于核心期刊,某位学者的发文集中于非核心期刊,他们的学术生命半衰期相同,但是他们的学术影响力却未必相同。就学术影响力半衰期而言,比如,某位学者的文献多是由核心期刊文献所引证的,某位学者的文献多是由非核心期刊文献所引证的,他们的学术影响力半衰期相同,但是他们的学术影响力却未必相同。其三,学者评价难免会遇到重名的问题,这对数据的统计会造成一定的影响。
针对适用性的问题,一是在实际评价的时候应考虑同时使用学术生命视角下的评价指标和传统指标来评价学者,二是可以尝试在本文指标的基础上和传统指标结合提出一些衍生指标来评价学者,三是划分一个学者群来评价学者。针对区分度的问题,为了更好的体现区分度,在实际评价的时候,可以同时结合使用基于学术网络的评价指标来评价学者。针对重名的问题,可以使用ORCID来区分重名的学者。