APP下载

面向期刊评价的s指数构造及实例研究

2019-02-21■朱

中国科技期刊研究 2019年2期
关键词:社会科学论文期刊

■朱 雯 陈 荣 刘 颖

华东理工大学科技信息研究所,上海市梅陇路130号 200237

期刊评价是文献计量学研究的重要内容之一,而用于期刊评价的指标和方法是期刊评价的基石[1]。有学者提出下载频次可以成为一个新的、有用的、基于“利用”的、考量科学论文传播和影响的工具和指标[2],可以避免一些人为因素(例如引用动机)对被引频次的干扰,能够更加直接地显示期刊使用的情况,快速反映期刊价值[3-4]。目前基于下载频次和被引频次关系的研究主要是探讨是否可以利用下载频次预测被引频次,以及被引频次是否可以成为期刊影响力的评价指标之一[5-8],统计数据主要集中于多学科期刊或论文的篇均被引频次和篇均下载频次,以及多学科期刊或论文的总被引频次和篇均被引频次。这些研究的计算方法、期刊选择以及统计年限等具有差异性,导致研究结果大相径庭,例如有学者认为期刊高下载频次与被引频次间不存在相关关系[9],但是有学者认为期刊高下载频次与被引频次间存在相关关系[10]。这给期刊评价带来了非常不利的影响,并且仅利用下载频次和被引频次简单平均的方法,容易出现数据稳定性差、结果认同度低等问题。因此,期刊评价亟需一些新兴数据与发展视角,创新定量分析方法。

21世纪以来,h指数成为期刊评价定量分析方法研究中最为著名和成功的创新成果之一[11]。h指数作为既能反映论文质量又能反映论文数量的计量学指标,凭借计算简单、结果稳健等优点[12],很快由最初的评价学者影响力扩展到评价期刊影响力[13],并且在期刊评价中具有良好的应用价值[14-16]。由于h指数存在不能很好地区分h指数相同但被引频次相差大等问题[17],学者们对其进行了完善,相继出现了g指数、r指数、p指数等衍生h指数。这些衍生h指数各有优势和不足:g指数弥补了h指数不能反映高被引论文的不足[18],但g指数忽略了g核以外的期刊论文的数量和质量[19];r指数虽然解决了h指数不关心h核内论文的问题[20],但其计算公式复杂;p指数虽然计算方便,但不能体现期刊的被引分布情况[21]。g指数和r指数作为h指数的衍生指数,不仅操作方便,还可以弥补h指数的缺点;r指数有小数位数值,在相同h指数和g指数的情况下,r指数提高了h指数和g指数的区分度。鉴于衍生h指数与h指数相结合可以更好地描述研究产出[22-23],本研究遵循一般的计量指标规则[24],将三者进行融合,构造s指数,即基于下载频次的sd指数和基于被引频次的sc指数,以提高h指数、g指数、r指数的区分度,弥补各个指数的不足。

本研究在比较2011—2015年理、工、农、医、社会科学等学科s指数和h指数关系的基础上,分析sd指数、sc指数的相关系数变化情况以及sd指数、sc指数与其他期刊评价指标之间的关系,实例探析sd指数和sc指数在多学科期刊评价中的不同应用价值,对于全面合理地评价期刊学术影响力,弥补仅基于引文分析的不足,区分h指数、g指数和r指数相同的期刊,兼顾论文的数量和质量(包括少量高被引论文对期刊的影响),拓展s指数的应用领域,探析期刊下载频次和被引频次的关系具有重要意义。

1 sd、sc指数的构造及其相关指数

s指数是根据期刊下载频次和被引频次的权重值计算所得的综合得分指数,目的是提高h指数、g指数、r指数的区分度,兼顾期刊论文的数量和质量,其中sd指数是基于下载频次的s指数,sc指数是基于被引频次的s指数。

1.1 期刊hd、gd、rd指数

期刊hd指数是指期刊当年发表的n篇论文中,有h篇论文至少被下载了h次,剩下的n-h篇论文的下载频次都小于h次,则h为该刊当年的hd指数[11]。

期刊gd指数是指期刊当年发表的n篇论文中[25],论文按照下载频次降序排列,并按照降序将每篇论文的序号平方,同时按照同样的顺序将每篇论文的下载频次逐一累加,当前g篇论文累计下载频次大于或者等于第g篇论文的序号平方,前g+1篇论文累计下载频次小于第g+1篇论文序号平方时,g则为该刊当年的gd指数。

期刊rd指数是指期刊当年发表的n篇论文中[26],有h篇论文至少被下载了h次,剩下的n-h篇论文的下载频次均小于h次,则h篇论文的下载频次总和的平方根为该刊当年的rd指数。

1.2 期刊hc、gc、rc指数

期刊hc指数是指在期刊当年发表的n篇论文中[11],有h篇论文至少被引用了h次,剩下的n-h篇论文的被引频次均小于h次,则h为该刊当年的hc指数。

期刊gc指数是指期刊当年发表的n篇论文中[25],论文按被引频次降序排列,并按照降序将每篇论文的序号平方,同时按照同样的顺序将每篇论文被引频次逐一累加,当前g篇论文累计被引频次大于或者等于第g篇论文的序号平方,前g+1篇论文累计被引频次小于第g+1篇论文序号平方时,g则为该刊当年的gc指数。

期刊rc指数是指期刊当年发表的n篇论文中[26],有h篇论文至少被引了h次,剩下的n-h篇论文的被引频次都小于h次,则h篇论文的被引频次总和的平方根为该刊当年的rc指数。

1.3 期刊sd、sc指数

融合hd指数、gd指数和rd指数,构造期刊的sd指数。期刊sd指数是指所有样本期刊中某样本期刊当年的hd指数/所有样本期刊当年hd指数的总和+所有样本期刊中某样本期刊当年的gd指数/所有样本期刊当年gd指数的总和+所有样本期刊中某样本期刊当年的rd指数/所有样本期刊当年rd指数的总和。sd指数的计算公式可表示为

(1)

融合hc指数、gc指数和rc指数,构造期刊的sc指数。期刊sc指数是指所有样本期刊中某样本期刊当年的hc指数/所有样本期刊当年hc指数的总和+所有样本期刊中某样本期刊当年的gc指数/所有样本期刊当年的gc指数的总和+所有样本期刊中某样本期刊当年的rc指数/所有样本期刊当年的rc指数的总和。sc指数的计算公式可表示为

(2)

g指数和r指数是h指数的衍生指数,在稳定性上有所欠缺;s指数融合了h指数、g指数和r指数的优点,能够对期刊的下载和被引情况进行综合测评,可以弥补h指数不关注h核内论文以及不反映高被引论文的缺点,避免了极少数超高被引论文左右期刊评价的问题。因此,s指数具有一定的稳定性,可为期刊评价和信息计量分析提供新的视角。

2 实例研究

中国知网(China National Knowledge Infrastructure, CNKI)的中国学术期刊(网络版)具有文献收录量大、内容全、范围广、更新迅速等特点,而中国引文数据库收录了CNKI所有源数据库的参考文献,不仅揭示各文献之间的相互引证关系,还显示期刊下载频次,可以作为期刊影响力评价的有力工具。利用上述数据库,以核心期刊为例,从理、工、农、医、社会科学5个学科中各随机选取30种期刊,共选取150种期刊,收集每种期刊2011—2015年每篇论文的下载频次和被引频次,检索时间为2017年8月1日。本研究将题名、下载频次和被引频次作为每种期刊记录的3个特征项,将3个特征项汇总到Excel中,运用Excel以及SPSS软件进行相关筛选、分析等。

2.1 各学科数据统计与分析

理、工、农、医、社会科学期刊发表的共计270503篇文献纳入统计分析(表1)。可以看出,2011—2015年各学科期刊发表文献的数量相差较大,其中工程与技术科学期刊每年的发文数量位居第1,医药科学、自然科学分列第2、3位,社会科学期刊发表的文献数量在5个学科中位居第4,而农业科学期刊的发文数量最低。

表1 2011—2015年各学科期刊发表文献数量统计

注:自然科学属于理科,工程与技术科学属于工科,农业科学属于农科,医药科学属于医科。

通过统计得到2011—2015年每个学科样本期刊的篇均被引频次和篇均下载频次(表2)。从表2可以看出:(1)2011—2015年每个学科样本期刊的篇均被引频次和篇均下载频次基本处于动态变化中,变化趋势可能处于同一状态;(2)社会科学样本期刊的篇均下载频次和篇均被引频次均高于其他学科,而自然科学样本期刊的篇均下载频次和篇均被引频次普遍低于其他学科。

表2 2011—2015年各学科样本期刊的篇均被引频次、篇均下载频次的统计情况

计算2011—2015年各学科样本期刊的sd指数与sc指数的方差,结果如表3所示。从表3可以看出:(1)各学科样本期刊的sd指数与sc指数的数据波动较小,比较稳定,其中农业科学和社会科学样本期刊的数据稳定性高于其他3个学科;(2)工程与技术科学样本期刊的sd指数的稳定性高于sc指数。

表3 2011—2015年各学科样本期刊sd指数与sc指数的方差

2.2 s指数与h指数比较分析

2.2.1 各学科hd指数、gd指数、rd指数、sd指数、hc指数、gc指数、rc指数、sc指数的分析

由于篇幅原因,仅以2011年自然科学的10种期刊数据为例,比较分析结果见表4。从表4可以看出:s指数可显著提高h指数的区分度,可通过s指数很好地区分相同的h指数、g指数和r指数。

表4 2011年自然科学样本期刊的各指数情况

2011年自然科学样本期刊的hd指数、sd指数、hc指数、sc指数排名情况见表5。从表5可以看出:s指数的综合排名较h指数有所提高,这主要是因为s指数同时兼顾了论文的数量和质量(包括少量高被引论文对期刊的影响),一些期刊由于核心区内具有少量高被引频次的论文,其s指数的综合排名较h指数排名有所提高。

表5 2011年自然科学样本期刊的hd指数、sd指数、hc指数、sc指数排名概况

2.2.2 sd指数、sc指数相关系数与hd指数、hc指数相关系数比较

利用SPSS 22.0软件对样本数据进行了K-S检验,结果显示:并非所有的sd指数、sc指数、hd指数、hc指数均符合正态分布,因此选取Spearman系数计算指标间的相关系数,得出的结果见表6。从表6可以看出:(1)从总体来看,各学科用s指数与h指数计算得出的相关系数相差不大;(2)与其他学科相比,社会科学样本期刊s指数之间相关系数与h指数之间相关系数相差较大。这可能是因为:(1)r指数、g指数为衍生h指数,而s指数是结合h指数、g指数和r指数计算所得,所以用s指数与h指数计算得出的相关系数相差不大;(2)对期刊篇均下载频次、篇均被引频次、发表文献数量进行分析,发现社会科学样本期刊的总下载频次和总被引频次较高,h指数不受高被引论文的影响,而g指数考虑了期刊论文的累积贡献和论文的被引频次或下载频次,r指数解决了h指数不关注h核内论文被引频次或下载频次的问题,所以用s指数计算得到的下载频次与被引频次的相关系数和用h指数计算得到的相关系数相差较大。

2.3 sd指数与sc指数相关性比较分析

分析各学科样本期刊的sd指数与sc指数相关性及其变化情况,为探索sd指数与sc指数在不同学科中的应用价值提供理论参考,绘制2011—2015年各学科sd指数与sc指数相关系数折线图(图1)。

表6 2011—2015年样本期刊sd指数、sc指数相关系数及hd指数、hc指数相关系数

(1) 自然科学样本期刊总体保持高度相关,2011年相关系数最高,2015年相关系数最低,除2013—2014年相关系数上升以外,2011—2015年自然科学样本期刊的sd指数与sc指数相关性呈下降趋势。

(2) 工程与技术科学样本期刊总体相关性处于中等相关与高度相关之间,2014年相关系数最高,2015年相关系数最低,近3~6年工程与技术科学样本期刊的sd指数与sc指数相关性波动较小。

(3) 农业科学样本期刊总体相关性处于中等相关与高度相关之间,2015年相关系数最高,2014年相关系数最低,2011—2015年农业科学样本期刊的sd指数与sc指数相关性波动较大。

(4) 医药科学样本期刊总体相关性保持在中等相关,2011年相关系数最高,2014年相关系数最低, 2011—2015年医药科学样本期刊的sd指数与sc指数相关性呈下降趋势。

(5) 社会科学样本期刊总体相关性保持在低度相关,2015年相关系数最高,2011年以及2014年相关系数最低,2011—2015年社会科学样本期刊的sd指数与sc指数相关性呈上升趋势。

(6) 社会科学样本期刊的sd指数与sc指数相关性低于理、工、农、医学科,医药科学样本期刊的相关性低于理、工、农三大学科;除农业科学和社会科学样本期刊以外,其他3个学科样本期刊的sd指数与sc指数2011年相关性高于2015年相关性。

上述情况的成因主要包括以下几个方面。(1)学科之间存在很大差异,导致理、工、农、医、社会科学样本期刊的相关系数差异较大。理、工、农、医学科样本期刊的论文被下载后得到了有效引用,导致其sd指数与sc指数相关性高。(2)一般情况下,期刊论文被数据库收录后,从被关注到被引用的时间跨度一般为2年甚至更多[27],而下载频次具有即时性,期刊论文在进入数据库的初期即可被大量下载,所以对于近期发表论文的期刊,其下载频次偏高,被引频次偏低,而早期期刊有更多的时间获得引用和下载,从而充分发挥其价值,因此五大学科样本期刊的sd指数与sc指数相关系数大小关系会在2013年或2014年发生变化。(3)进一步分析医药科学和社会科学样本期刊发现:从参考文献来看,医药科学样本期刊的外文参考文献的数量高于理、工、农三大学科,中国学者习惯引用外文文献来佐证自己的观点;从统计数据来看,2014年社会科学样本期刊的发文数量最低,篇均被引频次相较于前几年下降,而篇均下载频次相较于前几年却上升,因此2014年社会科学样本期刊的sd指数与sc指数的相关性较差;从参考文献的时间来看,学者一般喜欢引用近2~3年发表的论文,近2~3年的论文下载后得到有效利用,因此2015年社会科学样本期刊sd指数与sc指数的相关性高于2011年。

图1 2011—2015年各学科样本期刊的sd指数与sc指数 相关系数变化

2.4 s指数与其他评价指标相关性比较分析

为了探讨sd指数与sc指数作为多学科期刊评价指标的合理性,本研究将s指数与发文数量、总下载频次、篇均下载频次,以及单篇最高下载频次进行相关性分析。使用SPSS 22.0软件对样本数据进行K-S检验,结果显示并非所有数据符合正态分布,因此选取Spearman系数计算指标间的相关系数,分析结果如表7和表8所示。可以发现:(1)除社会科学样本期刊外,2011—2015年其余学科样本期刊sd指数、sc指数与各评价指标之间相关性相差不大;(2)各学科样本期刊sd指数与发文数量的相关性高于sc指数与发文数量的相关性;(3)各学科样本期刊sd指数与总下载频次的相关性高于sd指数与篇均下载频次的相关性,而sc指数与总被引频次、篇均被引频次的相关性较弱;(4)各学科样本期刊sd指数与总下载频次的相关性低于sc指数与总被引频次的相关性,sd指数与篇均下载频次的相关性低于sc指数与篇均被引频次的相关性;(5)各学科样本期刊sd指数与单篇最高下载频次的相关性小于sc指数与单篇最高被引频次的相关性;除社会科学样本期刊以外,其余学科样本期刊的sd指数、sc指数与单篇最高下载频次、单篇最高被引频次的相关性基本保持在中等相关和高度相关之间。

表7 sd指数与其他评价指标的相关系数

表8 sc指数与其他评价指标相关系数

通过上述分析发现:(1)期刊sd指数和sc指数与其他评价指标具有相关性,表明sd指数和sc指数作为期刊的评价指标具有一定的合理性和有效性。

(2) sd指数与发文数量之间的相关性高于sc指数与发文数量的相关性,这可能是因为发文数量大的期刊越容易吸引更多的关注,更多的关注使期刊论文的下载频次提升,sd指数上升,但是引用的产生并不是仅仅依靠关注就能够达到,因此对于基于引文数据的sc指数而言,发文数量的作用并不显著。

(3) 总下载频次和篇均下载频次是两种评价指标,所以sd指数、sc指数与总下载频次、篇均下载频次的相关系数不同;sd指数与总下载频次的相关性高于sd指数与篇均下载频次的相关性,说明sd指数综合考虑了发文数量以及下载总量;sd指数与总下载频次的相关性低于sc指数与总被引频次的相关性,可能是因为下载行为中包含大量“恶意”下载文献的行为,而sd指数结合了论文数量以及对期刊中具有较高下载频次的论文集合的评价,总下载频次并不能完全影响sd指数。

(4) sd指数、sc指数与单篇最高下载频次、单篇最高被引频次之间存在较高的相关性,表明sd指数、sc指数能够表征期刊中高品质论文(即高被引论文、高下载论文)的影响力。

(5) 进一步研究分析发现,2012—2014年社会科学样本期刊的sd指数与篇均下载频次呈现负相关,这可能是因为2012—2014年期刊论文数量呈现下降趋势。

3 结论

本研究融合h指数、g指数和r指数,构造了面向期刊评价的s指数,以理、工、农、医、社会科学2011—2015年期刊论文的下载频次和被引频次为基础,对构造的sd指数和sc指数进行实例研究,探讨2011—2015年不同学科中的s指数与h指数的关系,sd指数与sc指数相关性变化情况以及sd指数、sc指数与其他期刊评价指标之间的关系,得出如下结论。

(1) 通过比较各个样本之间的h指数、g指数、r指数、s指数发现,s指数弥补了h指数不关心h核内期刊论文以及不能反映高被引论文的问题,并且大大提高了h指数、g指数、r指数的区分度;通过比较各个样本之间hd指数、hc指数相关系数和sd指数、sc指数相关系数发现,社会科学样本期刊中利用s指数比利用h指数计算得到的下载频次和被引频次的相关系数更为精确。

(2) 通过比较2011—2015年不同学科样本期刊sd指数、sc指数的相关系数变化情况发现,在期刊评价中需要将期刊论文发表时间列入评价指标。例如:自然科学、工程与技术科学评价近2~3年的期刊时需要综合考虑下载频次和被引频次;农业科学、医药科学评价近4~6年的期刊时需要综合考虑下载频次和被引频次;社会科学进行期刊评价时需要相互参照并且综合考虑下载频次和被引频次,才可以得到更加合理的结果。

(3) 通过比较与其他评价指标的相关性发现,sd指数和sc指数作为期刊的评价指标具有一定的合理性和有效性,但是sd指数和sc指数存在一些异同点。相同点是sd指数和sc指数均能够表征期刊中高品质论文的影响力;不同点是sd指数受发文数量的影响高于sc指数,sc指数受总被引频次的影响高于sd指数受总下载频次的影响,除社会科学样本期刊以外,2011—2015年其余学科样本期刊的sd指数、sc指数与各评价指标之间相关性相差不大。

需要特别指出的是,本研究仅以核心期刊为例,并未深入探讨非核心期刊中s指数的合理性和有效性,并且在多学科期刊比较中,社会科学样本期刊sd指数和sc指数之间的相关性偏低,数据源是导致相关性偏低的一种原因,笔者下一步将深入研究非核心期刊样本中s指数的合理性,社会科学的学科特色,以及下载被引行为、研究主题对sd指数和sc指数的影响。

作者贡献声明:

朱雯:搜集数据,撰写论文;

陈荣:修改论文;

刘颖:构建模型。

猜你喜欢

社会科学论文期刊
期刊更名启事
期刊简介
《北京科技大学学报》(社会科学版)
《河北农业大学(社会科学版)》2021年喜报
我刊获评四川省社会科学优秀学术期刊
期刊问答
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文