不同学科期刊CiteScore与影响因子的比较研究
2017-03-26刘雪立任胜利程维红郑成铭
■刘雪立 任胜利 程维红 郑成铭
1) 新乡医学院期刊社,河南省科技期刊研究中心,河南省新乡市金穗大道601号 4530032) 国家自然科学基金委员会科学基金杂志社,北京市海淀区双清路83号 1000853) 中国农业科学院作物科学研究所《作物学报》编辑部,北京市中关村南大街12号 100081
2004年11月,全球著名的Elsevier出版集团在全文数据库的基础上,推出了Scopus引文数据库[1]。该数据库迅速崛起,成为全球最大的引文数据库[2],打破了Web of Science(WoS)在引文数据库建设领域的垄断地位。近年来,关于Scopus数据库的研究[3-5]和以Scopus数据库为数据来源的文献计量学[6-8]、科学计量学研究[9-10]越来越普遍。2016年12月8日,Elsevier依托Journal Metrics(JM)平台公布了衡量期刊影响力的重要指标CiteScore(CS),涵盖期刊数量为22256种,是《期刊引证报告》(JCR)中有影响因子期刊的2倍[11],受到学术界的广泛关注,部分杂志已经开始撰文报告其CS[12]。JCR的核心指标是期刊影响因子(IF)[13],然而Scopus数据库的核心指标是CS。CS定义为:某期刊前3年发表文献在统计当年的被引用次数除以该刊前3年发表的文献数[14],CS的计算见图1:
(1)
式中y为统计当年,Cy-1为某期刊y-1年的文献在y年的被引频次,Cy-2、Cy-3以此类推;Dy-1为某期刊在第y-1年的所有文献数量,Dy-2、Dy-3以此类推。
CS和IF为同类指标,都是某期刊一定引证时间窗口内论文的篇均被引频次。二者的主要区别有3个方面[11]:(1)引证数据来源不同,计算IF所用的被引频次来源于WoS,而计算CS所用被引频次来源于Scopus;(2)引证时间窗口不同,IF的引证时间窗口为2年[15],而CS为3年;(3)IF和CS的计算公式中分子和分母所包含的文献类型不同,IF分子为期刊所有类型文献被引频次,分母仅包含可被引文献,即论文和综述[16-17],而CS分母为期刊所有类型文献。
图1 CS计算示意图
因为CS发布的时间较短,WoS和中国知网(CNKI)数据库尚未检索到相关研究。本研究全方位比较了不同学科期刊的CS和IF,探讨CS的文献计量学特征以及在期刊评价中的作用。
1 研究对象和方法
1.1 研究对象
(1) 学科选择
依据JCR数据库中的学科分类,选取自然科学和社会科学各4个学科,选择标准包括:第一,集合半衰期差异明显;第二,学科规模较大,期刊数量较多,最终确定的4个自然科学学科为纳米与纳米技术、能源与燃料、统计与概率论、地球化学与地球物理学,4个社会科学学科为伦理学、传播学、政治学、历史学。此外,本研究还选取了2个特殊学科,即发表非可被引文献(观点、消息、动态等文章)较多的学科,主要包括医学(以综合性医学为代表)和多学科。
(2) 期刊选择
期刊选择的标准包括:第一,JCR和JM均收录期刊,保证期刊既有IF又有CS;第二,JCR数据库中期刊自引率小于10%。
1.2 研究方法
(1) 获取IF和CS
从JCR下载2015年选定学科期刊的IF,从JM下载所有期刊的CS,并整理成电子表格;剔除JCR数据库中自引率大于10%的期刊,将各期刊国际标准连续出版物编号(ISSN)在整理的JM电子表格中进行比对,获取相应期刊的CS。
(2) 数据处理
采用Excel 2003进行一般的数据运算和处理,采用SPSS18进行统计学处理。采用非参数检验中的2个相关样本秩检验(Wilcoxon检验)比较各学科期刊的CS与IF,采用Spearman等级相关检验确定二者相关度。检验水准α=0.05。
2 结果和分析
2.1 CS与IF总体比较
纳入研究对象的8个学科期刊总数为380种,CS和IF的平均值分别为2.080和1.894,标准差分别为3.003和3.217;最大值分别为23.85和35.27,中位数分别为1.200和1.066。这些数据表明,IF离散程度较大。Wilcoxon检验结果表明274种期刊的CS大于IF,104种期刊的CS小于IF,2种期刊的CS等于IF,Z=8.821,P=0.000,说明380种期刊总体上CS大于IF,差异有统计学意义。Spearman相关检验结果中,相关系数r=0.922,P=0.000,二者呈现高度正相关。
2.2 比较不同学科期刊的CS与IF
选取的4个自然科学学科中,纳米与纳米技术、能源与燃料2个学科集合被引半衰期较短,属于老化速度较快的学科;统计与概率论、地球化学与地球物理学2个学科集合被引半衰期均大于10年,属于老化速度较慢的学科。社会科学学科集合被引半衰期普遍较长,伦理学集合被引半衰期相对较短,在社会科学中属于老化较快的学科,历史学科老化速度较慢。
各学科期刊CS中位数均大于IF,Wilcoxon检验结果显示,8个学科中均为CS大于IF的期刊居多,总体趋势为学科老化速度越慢,CS大于IF表现越突出,比如统计学与概率、传播学、政治学、历史学,CS和IF的差异有统计学意义(表1)。8个学科中CS和IF均表现为高度正相关,纳米与纳米技术相关系数最高,达到了0.982,伦理学相关系数最低,但是也达到了0.767。因此,无论CS和IF绝对值大小,二者用于评价期刊影响力呈现高度一致性。
由于CS采用3年引证时间窗口,多数期刊被引频次在更长的时间窗口内得到充分释放,因此多数期刊CS大于IF,尤其是被引高峰较为缓慢的学科表现更加明显,而被引高峰较为缓慢的学科称为长半衰期学科[18-19],即老化速度较慢的学科。与IF相比,CS更加有利于评价较长半衰期的学科期刊。
2.3 比较多学科和综合性医学期刊的CS与IF
笔者研究了科学引文索引(SCI)来源期刊非可被引文献对IF的贡献,结果显示,发表非可被引文献较多的,且非可被引文献对IF贡献较大的期刊多集中于多学科和医学学科[16]。由于非可被引文献在计算IF时不计入分母,导致IF不同程度膨胀。所以,这2个学科多数期刊表现为CS小于IF(表2)。
表1 8个学科期刊CS与IF的比较
表2 多学科和综合性医学期刊CS和IF的比较
WoS和JCR学科分类中的多学科期刊是指涵盖所有学科(也包括社会科学)内容的高度综合性期刊,这些期刊往往被SCI和SSCI同时收录。进一步研究多学科和综合性医学期刊发现,在多学科领域,7种期刊的IF是CS的2倍以上,其中Scientist的IF比CS大17倍以上,Nature和Science这2种国际权威期刊的IF比CS大1.6倍。在综合医学学科,IF是CS 2倍以上的期刊共13种,多数为全球著名的医学期刊,《加拿大医学会杂志》(CMAJ)、《柳叶刀》(Lancet)、《美国医学会杂志》(JAMA)和《新英格兰杂志》(NEJM)4种医学期刊分列前4位,见表3。这些期刊都是发表非可被引文献较多的期刊。值得注意的是,多学科和综合性医学期刊中,IF过度膨胀的期刊绝大多数来自美国和英国。其实,早在1999年,著名科学计量学家Moed等[20]已经研究了Nature、Science和Lancet等期刊IF的膨胀问题。Liu等[21]提出应当矫正医学期刊和多学科期刊IF的分子和分母,将IF的分子设定为可被引文献(研究论文和综述)在统计当年的被引频次,分母为可被引文献数量。
表3 多学科和综合性医学中CS和IF差异较大的期刊
注:差异幅度为2015年IF与CS的差值除以2015年的CS。
3 结论
3.1 CS和IF具有高度相关性
不区分学科的情况下,380种期刊整体的CS和IF的相关系数为0.922;区分学科的情况下,分别分析8个学科期刊的CS和IF,相关系数多数大于0.900。由于CS和IF分母计数不同,多学科和综合性医学多数期刊的IF大于CS,但是二者的相关系数依然达到了0.871。因此,无论CS和IF绝对值高低,二者在期刊影响力评价和排序方面呈现极高的相关度。
尽管CS和IF所用引证时间窗口不同,同一期刊CS和IF差异明显,但是由于二者属性相同,均为某期刊一定时间段内论文在统计年度的篇均被引频次,因此,CS和IF在期刊影响力评价和排序的高度相关是正常现象。
3.2 在社会科学和老化速度较慢的学科,CS表现出一定优越性
在选取的8个学科中,大多数期刊均表现为CS大于IF,长半衰期学科尤其突出,如社会科学中的传播学、政治学和历史学,自然科学中的统计与概率论,以上学科集合被引半衰期均大于10年。94种期刊中CS大于IF的期刊共65种,CS小于IF的期刊仅27种,另外2种期刊CS与IF相等。由于CS采用3年引证时间窗口,论文被引频次在较长的时间段内得到充分释放,因此,CS非常适合于评价老化速度较慢的学科,尤其是多数社会科学学科期刊。
3.3 多学科和综合性医学期刊CS和IF差异较大
多学科期刊和综合性医学(不排除还有个别学科)期刊多数表现为IF大于CS,个别期刊,如著名的综合性期刊Science、Nature,综合性医学期刊CanadianMedicalAssociationJournal、Lancet、JournaloftheAmericanMedicalAssociation、NewEnglandJournalofMedicine等CS和IF差异极为显著。差异的主要原因是,CS的计算公式中分母采用的是各期刊发表的所有类型的文献数,而IF的分母仅为研究论文和综述2类可被引文献数。
总之,CS和IF是基于2个不同的数据库建立的相同属性的期刊影响力评价指标,二者存在明显差异,主要原因是数据来源、引证时间窗口不同,文献类型基数不统一等。由于CS发布时间太短,对其认识还不够深入,本研究还存在一定的局限性,如对Scopus和WoS数据库以及基于二者建立的CS和IF两个指标中的文献类型的认识还远远不够,有待于今后进一步研究。
[1] de Moya-Anegon F,Chinchilla-Rodriguez Z,Vargas-Quesada B,etal. Coverage analysis of Scopus: A journal metric approach[J].Scientometrics,2007,73(1):53-78.
[2] Andalia R C,Labrada R R,Castells M M. Scopus: The largest database of peer-reviewed scientific literature available to underdeveloped countries[J].RevistaCubanadeACIMED,2010,21(3):270-282.
[3] Vendemiale G. Indexed in Embase,excerpta medica database and Scopus Elsevier database[J].GiornalediGerontologia,2016,64(1):1.
[4] Moed H F,Bar-Ilan J,Halevi G. A new methodology for comparing Google scholar and Scopus[J].JournalofInformetrics,2016,10(2):533-551.
[5] Noblejas C J,Rodríguez A P. Information retrieval and visualization in Web of Science and Scopus: A practical approach[J].InvestigaciónBibliotecológica,2014,28:15-31.
[6] Sánchez A D,Del Río M C,García J. Bibliometric analysis of publications on wine tourism in the databases Scopus and WoS[J].EuropeanResearchonManagementandBusinessEconomics,2017,23(1):8-15.
[7] Muthumari S,Raja S. Bibliometric analysis of defence science journal during 2005—2014: A study based on Scopus database[J].CollnetJournalofScientometricsandInformationManagement,2016,10(2):273-287.
[8] Moed H F. Comprehensive indicator comparisons intelligible to non-experts: The case of two SNIP versions[J].Scientometrics,2016,106(1):51-65.
[9] Dissanayake H N K. Medicinal plant research in Sri Lanka : A scientometric study based on Scopus database[J].CollnetJournalofScientometricsandInformationManagement,2015,9(2):225-234.
[10] Cruz-Ramirez M,Escalona-Reyes M,Cabrera-Garcia S,etal. Scientometric analysis of Cuban educational publications in WoS and Scopus (2003—2012)[J].RevistaEspanoladeDocumentacionCientifica,2014;37(3):e058.
[11] da Silva J A T,Memon A R. CiteScore: A cite for sore eyes,or a valuable,transparent metric?[J].Scientometrics,2017,111(1):553-556.
[12] Poljak M. Coverage of acta dermatovenerologica Alpina,pannonica et Adriatica in Elsevier′s CiteScore index: A new tool for measuring the citation impact of academic journals[J].ActaDermatovenerologicaAlpinaPannonicaetAdriatica,2017,26(1):1-2.
[13] Garfield E. No-growth libraries and citation analysis; or publishing weeds with ISI′s journal citation reports[J].CurrentContents,1975,2(26):300-303.
[14] Elseview. Journal Metrics[EB/OL]. [2017-05-06]. https:∥journalmetrics.scopus.com.
[15] 刘雪立,盖双双,张诗乐,等. 不同引证时间窗口影响因子的比较研究——以SCI数据库眼科学期刊为例[J]. 中国科技期刊研究,2014,25(12):1509-1512.
[16] 刘雪立,盖双双,张诗乐,等. “非可被引文献”的引证特征及其对科技期刊影响因子的贡献[J]. 编辑学报,2015,27(5):495-499.
[17] 刘雪立,盖双双,周晶. 基于文献类型矫正的影响因子及其实证研究[J]. 中国科技期刊研究,2016,27(3):309-315.
[18] Sundaram M,Hodler J,Rosenthal D I. On the relevance of the impact factor and other factors[J].Skeletalradiology,2012,41(2):125-126.
[19] Haddad F S. The impact factor: Yesterday′s metric?[J].Bone&JointJournal,2014,96B(3):289-290.
[20] Moed H F,van Leeuwen T N,Reedijk J. Towards appropriate indicators of journal impact[J].Scientometrics,1999,46(3):575-589.
[21] Liu X L,Gai S S,Zhou J. Journal impact factor: Do the numerator and denominator need correction?[J].PLoSOne,2016,11(3): e0151414.