基于洛特卡定律和影响因子、g指数的核心作者遴选
2018-11-09
(浙江旅游职业学院,浙江 杭州 311231)
0 引 言
在科技文献计量学的三大定律中,洛特卡定律是一个揭示某一学科领域的核心作者与该领域总作者所占比的定律。在洛特卡(Lotke,Alfred James,1880-1949)所处的那个时代,他所给出的定律还能比较准确的计量出核心作者的占比,但随着20世纪中期以后科技信息爆炸时代的到来,特别是进入21世纪后媒体的多样化,单纯以写作论文的数量来遴选核心作者显然是严重背离了科学讲理的真实性。这是因为一个人也许写的论文的数量很大,但影响力却很小,或者影响力虽然也很高,但所影响的作者的层次相对很低,这都不能说明该作者可以进入核心作者群,所以必须对洛特卡定律进行修正。
1 洛特卡定律及其拓展
洛特卡定律揭示的是某一领域是作为核心作者所占总作者数的比例[1]。
其具体表述为:
F(x)=c/xnx:1,2,3,…,k
(1)
(1)式中,F(x)为写了x篇论文的作者数。C为写一篇论文的作者数,即C=F(1)。在科技领域的论文中,n通常取值为2。则上式为:
F(x)=C/x2
(2)
既:
把发表k~k′篇论文的作者数记为F(k,k′),则有:
把每人都发表了k篇论文的作者所发表论文的总数记作P(k),则有:
P(k)=kF(k)
把发表了k~k′篇论文的作者所发表论文总数记作P(k,k′),则有:
(3)
普赖斯对洛特卡定律进行拓展得到如下结论,某领域中论文作者总数开平方乘以0.749所得的数为写作该领域一半论文的作者数[2]。具体表述为:
(4)
从上式可以更直接地确定某一领域的核心作者人数M。如某领域共有10000名作者,则写作其中5000篇论文的核心作者只有75人。
进一步的计算如下:
(5)
(6)
将(4)代入(6)有:
(7)
上式为发m到xmax篇的核心作者的总数。但这个公式并无法体现具体哪些作者能进入核心作者群。下面引入影响因子和h,g指数来实现这一目的。
2 科技期刊影响因子的评价模型
期刊影响因子(Impact Factor)是美国科学情报所SCI创办人加菲尔德(Eugene Garfield)提出了一个表征期刊影响大小的计量指标,鉴于文献计量学家普赖斯认为科学论文一般在其发表的一二年后即可达到被引用的峰值,因此,加氏提出的期刊影响因子的计算方法为:一种期刊在某年的影响因子等于全部源刊物在某年引证该期刊前两年发表论文的次数,与两年间该刊所发表的全部源论文数之比。
其计算公式为:
IF(k)= (nk-1+nk-2)/(Nk-1+Nk-2)
(8)
上式中IF(k)为某年(k)的影响因子,Nk-1+Nk-2为该刊在k年的前2年发表的论文数量,nk-1+nk-2为该刊在k年的前2年被引用数量。即某刊在2018年的影响因子是其2016和2017两年刊载的论文的被引总数除该刊在这两年的所载论文的总数。
IF(k)能较准确地反映一个刊物的影响力,但并不能因些准确地反映其作者的影响力。为此,2005年J.E.Hisrhc提出一种新的科学计量评价指标即h指数(highly cited index)。
3 h指数
Hisrhc提出的h指数的定义是: 将作者发表的所有N篇论文按引频的大小递减排序,当且仅当排序前h篇论文每篇论文的引频至少为h,同时排序第h+ 1篇论文的引频小于h+ 1时,则这个h值被定义为该作者的h指数[3]。其数学表达式为:
h=gmax(i):ci≥1
( 9)
上式中ci为第i篇文章的引频,绘成图像则为:
考虑到引文的影响力的不同,Egghet等提出了根据引文影响力调整权重的hw指数, 即连续引文权变h指数 (the continuous citation-weighted h-index) 。其数学表达式为:
(9)
上式中ui为第j篇文章被引频次,r0是指数j的最大行,且:rw≤yj
图1 作者的h指数与作者所发表的论文数及被引数的关系
图2 核心作者计算程序图
4 g指数
g指数是Eggle提出的反映高引频论文的指标,这对找出精英作者更有意义[4]。
g指数是h指数的衍生指数,g指数定义为:论文按被引次数排序后相对排前的累积被引至少g2次的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数将小于(g+1)2。
g= max(i):∑cici≥i2
5 基于IF(k)、h指数、g指数和洛特卡定律的核心作者确定
某一领域的核心作者可以借助洛特卡定律确定,其中的精英作者则可以借助普赖斯定律确定,但具体哪些作者可以成为核心或精英作者则不是单纯靠其写作论文的数量可以确定的,还需要考核其论文的质量,其客观的评价指标就是所刊发的期刊的影响因子,作者每篇论文的g指数的和来进行综合考评。
设U={u1,u1,u1,…,un},un为刊载某作者所发表的第n篇论文的刊物的影响因子与该篇论文的g指数的乘积,即:un=gn*IF(kn)
实现以上意图的程序框图如图2。
6 结 语
将洛特卡定律与g指数相结合并借助数据库检索技术,可以准确而迅速地遴选出某一学科的精英作者,这对指导图书馆藏书建设和读者阅读,有着重大的意义。