期刊影响因子与被引半衰期关系之比较研究——以图书情报学期刊为例
2016-01-04
期刊影响因子与被引半衰期关系之比较研究——以图书情报学期刊为例
何文叶继元
摘要影响因子和被引半衰期是期刊评价的两个重要指标,论文利用《中国期刊引证报告(扩刊版)》和Journal Citation Reports(JCR)的数据,以SPSS和Excel为统计分析工具,探讨图书情报领域的影响因子和被引半衰期的关系,并简单分析了产生该关系的原因,认为在构建期刊评价指标体系时应将二者的关系考虑在内。
关键词影响因子被引半衰期图书情报学相关分析SPSS
分类号G250.1
A Comparative Study of the Relationship between Impact Factor and Cited Half-life:Taking the Library and Information Science Journal as an Example
He Wen,Ye Jiyuan
Abstract The journal impact factor and cited half-life are two important indicators of journal evaluation. This paper uses data from Journal Citation Reports at home and abroad, selects SPSS and Excel as statistical analysis tools, explores the relationship between the two indicators in Library and Information journals, and briefly analyses the reasons. At last, it advises that the relationship should be taken into consideration during the construction of journal evaluation index system.
Keywords Impact factor. Cited half-life. Library and information science. Correlation analysis. SPSS.
影响因子(Impact Factor)是Garfield等在20世纪60年代初在《科学引文索引》选取来源期刊时提出的,是“一种简单的、不受期刊大小和被引次数影响的对期刊进行比较的方法”[1]。该指标是一个相对统计平均值,可克服期刊由于历史长短、刊期不同及载文量多少所带来的偏差。期刊发表学术成果的被引用率与时间之间存在着反比例关系,被引半衰期就是对二者这种关系的具体体现,它是测度期刊老化速度的一个指标。
本文利用《中国期刊引证报告(扩刊版)》和Web of Science的Journal Citation Report(JCR)的数据,通过SPSS和Excel数据统计分析工具进行多重比较和回归分析,定性分析和定量分析相结合,探讨图书情报领域期刊的影响因子和被引半衰期的关系,以期为中国的期刊评价提供参考。
1 文献综述
1.1国外文献综述
Tsay, Ming-Yueh利用皮尔逊相关等分析方法,以物理、化学、工程类期刊为研究对象,比较被引量、影响因子、引用半衰期、被引半衰期等科学计量指标之间的关系,发现被引半衰期与其他指标之间并不存在显著相关[2]。T Markpin,N Premkamolnetr和Sombatsompop将影响因子和被引半衰期相结合,提出了一种新的计算影响因子的方法:Cited Half-Life Impact Factor(CHAL)[3]。
Chen Yi-ling和Tsay Ming-yueh通过对内外科医学期刊的研究分析发现影响因子和即年指标都与被引次数显著相关,影响因子和即年指标之间也存在显著相关,但是被引半衰期和除引用半衰期以外的引用指标之间都不存在相关关系[4]。
1.2国内文献综述
张志转、朱永和以农业综合性学术期刊为例,分析发现影响因子与5年影响因子、Web即年下载率、即年指标、总被引频次、基金论文比等指标存在正相关关系等,且相关系数都较大[5]。白云在实际考察社会、人文几个代表学科后发现期刊被引半衰期与期刊在学科中的影响度及学术地位没有明显的关联,并通过分析大量统计数据,得出结论:半衰期较长的,影响因子相对较小;而影响因子较大的,则半衰期较短,但是两者之间并不存在明显的负相关[6]。王文兵等通过对1999—2007年SCI和SSCI按学科影响因子排名前50的期刊共735种的实证研究,发现被引次数、是否英文与之正相关,而载文量、自引次数、自引比例、半衰期与之负相关,且不同学科的期刊影响因子差异很大[7]。董敏红以中文核心期刊要目总览(北京大学2008年版)刊登的19种图书情报类核心期刊的排序为对象,利用科学技术文献出版社2009年版中国期刊引证报告进行相关数据的统计分析,得出总被引频次与引用刊数和学科扩散指标显著负相关,影响因子与即年指标、H指数和被引半衰期正相关、即年指标与被引半衰期、H指数正相关,引用刊数与学科扩散指标呈极显著正相关[8]。
以上评价指标相关关系的研究中,涉及到影响因子和被引半衰期的相关性,但是得出的结论相去甚远甚至相反。白云认为半衰期较长的,影响因子相对较小;而影响因子较大的,则半衰期较短,但是两者之间并不存在明显的负相关。王文兵等认为影响因子与半衰期负相关。董敏红认为影响因子与半衰期正相关。为什么影响因子和半衰期这两个评价指标在经不同的研究后呈现出的关系如此复杂,让人不解呢?也许是影响因子和半衰期在不同学科间的差异造成的,或许是因为统计样本过小、统计方法不当等,以下就以图书情报学期刊为研究对象,探讨影响因子和半衰期之间的相关性。
表1 2005年图书情报类期刊影响因子和被引半衰期
2 数据来源与方法
2.1数据来源:《中国期刊引证报告(扩刊版)》[9]
《中国期刊引证报告(扩刊版)》依托中国科学技术信息研究所国家工程技术数字图书馆“知识服务”系统,在“万方数据—数字化期刊群”基础上,结合中国科技论文与引文数据库(CSTPCD),以我国正式出版的各学科6217种中英文期刊为统计源期刊。本文以图书情报期刊为研究对象,取总被引频次、影响因子、被引半衰期三个指标,分析影响因子和被引半衰期的相关性。
2.2方法和工具:SPSS20
SPSS(Statistical Package for the Social Sciences)是一款在调查统计行业、市场研究行业、医学统计、政府和企业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件。SPSS20是一种用于分析数据的综合系统,它可以从几乎任何类型的文件中获取数据,然后用这些数据生成分布和趋势、描述统计以及复杂统计分析的表格式报告、图表和图,且有简单友好的操作界面。本文选择SPSS20对《中国期刊引证报告(扩刊版)》的图书情报期刊的影响因子和半衰期进行相关性分析。
3 具体实施
3.1关于数据的处理
《中国期刊引证报告(扩刊版)》按照学科对期刊进行分类,将统计源期刊分为8个大类,124个小类。其中,本文研究对象的载体便是教科文艺大类下属的G25图书情报类。
关于数据时间跨度的选择:中国科学技术作息研究所国家工程技术数字馆网站(http://www.istic.ac. cn)上2006—2011年①的年度报告。
关于期刊数量的确定:由于期刊的合并、分化和新增是客观情况,所以在2006到2012年之间被报告收录的期刊数量难免会不同,经过筛选之后的数据是2005—2011年38种期刊的总被引频次、影响因子和被引半衰期。
3.2运用SPSS20具体分析
3.2.1以2005年的数据为例进行相关分析
首先,表1是2006年《中国期刊引证报告(扩刊版)》上2005年图书情报类各期刊的名称、影响因子和被引半衰期。
用SPSS的图表功能绘制出二者的散点图。它可以给人以直观的关于影响因子和被引半衰期二者关系的印象和判断。从散点图可以看出,影响因子和被引半衰期存在着一定的相关性,在一定程度上,随着影响因子的增加,被引半衰期缩短,但二者的负相关并不明显。
然后再对影响因子和被引半衰期进行双变量的相关分析。2005年图书情报类期刊的影响因子均值为1.054 53,被引半衰期的平均水平为3.191 8年。但是从相关性分析的指标看到,二者的相关系数为-0.089,说明二者负相关,但相关性很低;显著性(双侧)系数为0.593,远远高出于0.01,说明相关程度很低。由此得出,二者并没有明显的相关性。
3.2.2对其他年度的分析
用同样的方法得到2006—2011年度图书情报类期刊影响因子与半衰期二者关系的散点图以及描述性统计量和相关性数据,可以看出,在不同的年度,影响因子与半衰期之间的关系并不确定,2006年度二者的相关系数为-0.142,显著性(双侧)系数为0.396;2007年度二者的相关系数为-0.062,显著性(双侧)系数为0.711;2008年度相关系数为0.000,显著性(双侧)系数为0.999;2009年度相关系数为0.033,显著性(双侧)系数为0.843;2010年度是-0.016和0.925;2011年度-0.031和0.856.也就是说,各年度显示影响因子和被引半衰期的两个系数均很低,在各个年度二者的相关性很低,或者说没有明显的相关性。
3.2.3分析整合数据
我们可以对以上的分析结果提出假设,是否各年度的数据量偏少,导致二者关系趋势不明显?基于此,笔者将2005—2011年的数据整合起来,加大其样本量,以供我们进一步观察分析和研究。将7个年度共有的38种(去除《文献》)图书情报学期刊的影响因子和被引半衰期整合得出的266个数据组合。将以上数据重新进行相关性分析,与前面步骤一样,首先看影响因子和被引半衰期的散点图,但从相关性分析的指标结果来看,二者依然不显著相关,观察散点图,发现这些期刊的半衰期绝大部分集中在2~5年之间,只有25个散点在此之外,于是考虑将这些被引半衰期超过5年的期刊去掉,然后对其他数据进行分析。见图1。
从表2二者的相关性分析可以看出,影响因子和被引半衰期之间的相关性系数为0.210,且二者在0.01水平(双侧)上显著相关,说明二者通过了相关性检验,存在着较明显的相关性,但是相关程度偏低。
3.3对JCR中图书馆学类期刊影响因子和被引半衰期的分析
前面提到,有学者研究发现语言会对影响因子产生影响,例如,作为国际语言的英语类期刊由于被更多人引用研究而导致影响因子大于小语种期刊。下面就以JCR收录的图书情报学类期刊为例,研究期刊的影响因子和被引半衰期之间的关系。
表2 241组数据的相关性分析结果
图1 去除25个散点之后的241组数据的散点图
JCR(Journal Citation Reports),期刊引用指标报告,是Web of Knowledge的期刊评价工具,提供了一套客观、系统的方法,对全球顶尖的学术期刊进行严格评价。利用JCR对图书情报类期刊的影响因子和被引半衰期的关系进行研究分析。在JCR中该类对应的是Information Science & Library Science,以2012年的数据为研究样本,该类共有84种期刊,除去Cited Half-life缺省和大于10的情况,共有59组数据。用同样的方法对这59组数据进行相关性分析。得出相关系数为-0.063,显著性系数为0.635,未通过相关性检验,因而可以得出结论JCR中收录的Information Science & Library Science类期刊的Impact Factor和Cited Half-Life两个因素之间不存在相关性。
4 结果分析
4.1我国图书情报类期刊近7年的影响因子水平不一,且与同类学科相比,影响因子相对较高
(1)各期刊的影响因子水平相去甚远。以2010年为例,《古籍整理研究学刊》的影响因子只有0.127,而《中国图书馆学报》的影响因子高达3.451。由影响因子的计算公式可知,影响因子不仅与期刊的规模和载文量相关,期刊的论文被引用的次数也是一个重要因素。从更加基本的层次来看,影响因子可能会受到出版周期和出版时滞、学科分类、论文类型、参考文献、马太效应和专业特点的影响[10]。
(2)与其他学科相比,图书期刊类的影响因子偏高。有学者之前通过分析相关数据发现:图书馆、情报与文献学在整个社会科学、人文科学的排名中,在前10位所占比例为60%,而整个社会科学共有26个学科,并提出质疑,一个学科的比重如此之大是不合情理的。这种排名主要是以影响因子为依据的。我们都清楚,图书馆学和情报学虽然在我国经过很长时间的发展,取得了一定的研究成果,但必须清醒地认识到,它们并不是我国发展最突出最成熟的学科。那么是什么因素造成这种局面呢?当然,专业特点、引文峰值出现的时间都是很重要的影响因素。另外,引文著录质量也在一定程度上促成了图书情报类期刊的高影响因子。因为文献著录和标引本就是图书情报学科内容的一部分,其规则、方法都是由该学科人士提出的,所以,本学科的著者在发表文章时,非常重视参考文献,因而引文数量较多,标注较为规范,被统计率也相对较高。
4.2我国图书情报类期刊的被引半衰期相差较大,在整个社会科学中被引半衰期偏短
(1)在选作样本的图书情报学期刊中,被引半衰期变化较大。2009年《古籍整理研究学刊》的被引半衰期为7.55年,《情报探索》为2.71年。通过分析可发现我国图书情报类期刊的被引半衰期集中分布在3~5年,且均值有逐年上升的趋势。说明引文峰值出现的时间有些后移。
(2)与同类其他学科相比,图书情报学期刊的被引半衰期较短。除了新闻出版类,图书情报类期刊的被引半衰期在中国期刊引证报告(扩刊版)》统计源期刊划分的图书情报类所属的8大类之一的教科文艺下的10个小类目中最短,这说明相对其他社会科学类学科而言,该类期刊的老化速度快,被利用的时间短。被引半衰期与学科特点紧密相关,例如,考古学、历史学类期刊的半衰期就较长,而新闻出版类由于其社会时效性而被引半衰期较短。
4.3与中文期刊相比,图书情报类的英文期刊影响因子的均值偏大,被引半衰期偏长
图书情报类的英文期刊2011年影响因子的均值为1.235,被引半衰期为7.1年;而图书情报类的中文期刊的相应指标分别为0.8886和4.417年。
4.4期刊的影响因子和被引半衰期关系之探讨
通过利用SPSS20的相关分析,发现我国图书情报类期刊的影响因子和被引半衰期之间存在着显著的相关关系,但相关程度偏低。
通过分析不难发现,期刊的影响因子和被引半衰期在理论上都与引文峰值的出现时间有一定关系,在实际应用中都有鲜明的学科特色,作为期刊文献计量评价指标体系之中的两个指标,这些都在一定程度上促成了二者的相关性。在进行期刊评价时要注意评价指标的学科属性和适用范围,并将影响因子和被引半衰期的相关性关系考虑在内。袁培国等在多种探索基础上,对高校文科综合性学报,采用他引因子、期刊影响广度和被引半衰期分别乘以0.85、0.1和0.05的加权处理,以改善多学科期刊由于刊载各学科论文比重不同造成影响因子的变异给期刊比较工作带来的困难局面,就是综合考虑将被引半衰期纳入影响因子计算的尝试[1]。
5 结语
在期刊评价中,要将定性评价和定量评价相结合。其中,定量评价要构建良好的评价指标体系,评价指标的选择要考虑到各指标的内涵以及适用范围,还要考虑到指标之间的关系。影响因子是定量评价期刊的重要指标之一,但不是唯一的指标,在使用时要注意影响因子的学科属性和相对性,被引半衰期作为反映期刊老化和被利用速度的指标,也有鲜明的学科属性,与各学科的引用行为有密切关系。影响因子和被引半衰期分别从学术影响力和被利用速度方面衡量和测度期刊,二者有着一定的相关性,在指标体系的构建中应有所反映。
参考文献:
[1]袁培国,吴向东,马晓军.多指标加仅值对多学科学术期刊排序初探[J].重庆大学学报:社会科学版,2009 (4):74-82.
[2]Tsay Mingyueh. An Analysis and Comparison of Scientometric Data between Journals of Physics,Chemistry and Engineering [J].Scientometrics,2009,78(2):279-293.
[3]Markpin T,Premkamolnetr N,Sombatsomop,et al. A modified method for calculating the impact factors of journals in ISI Journal Citation Reports: Polymer Science Category in 1997-2001[J]. Scientometrics,2004,60(2):217-235.
[4]Tsay Mingyueh, Chen Yiling. Journals of general & internal medicine and surgery:An analysis and comparison of citation[J].Scientometrics,2005,64(1):17-30.
[5]张志转,朱永和.学术期刊引证指标间的相关性研究:以农业综合性学术期刊为例[J].安徽农业科学,2010(2):封2,封3.
[6]白云.中国人文社会科学期刊被引半衰期分析研究[J].云南师范大学学报:哲学社会科学版,2006(4):127-130.
[7]王文兵,王学斌,谭鸿益,等.影响因子的局限性:基于SCI和SSCI期刊1999—2007年面板数据的实证研究[J].图书与情报,2009(4):28-32.
[8]董敏红.基于主成分分析的图书情报类核心期刊评价指标有效性研究[J].情报科学,2010(11):1670-1672.
[9]中国科学技术信息研究所,万方数据股份有限公司.中国期刊引证报告(扩刊版)[M].北京:科学技术文献出版社,2012:1.
[10]魏彬,侯汉清.社会科学期刊影响因子的“影响因子”:从图书馆学情报学期刊排名谈起[J].南京农业大学学报:社会科学版,2002(2):81-87.
何文南京大学信息管理学院硕士研究生。江苏南京,210093。
叶继元南京大学信息管理学院教授。江苏南京,210093。
收稿日期:(2014-06-10编校:邹婉芬)