采用自被引率与2年自被引率检测学术期刊过度自引的比较与分析
2016-03-26金铁成
■金铁成
河南工业大学学报编辑部,郑州市高新技术产业开发区莲花街100号 450001
1 引言
学术期刊的影响因子是衡量期刊学术质量的一个重要的指标,在全球性的SCI现象和影响因子崇拜的背景下,期刊的影响因子不仅受到了学术期刊自身的高度重视,而且还受到科研人员的极大关注[1]。一方面,学术期刊期望提高自身影响因子来吸引更多高质量的稿件,另一方面,科研人员希望自己的成果发表在高影响因子的期刊上,以达到岗位晋升等目的。但是,有些学术期刊不是采取正当的途径与方法来提高期刊的影响因子,而是强迫或者诱导作者引用该刊以前发表的论文,这种通过期刊过度自引来操纵影响因子的现象国内外普遍存在[2-4]。与此同时,有些作者认为多引用拟投期刊以前发表的论文,能够提高稿件的评审通过率,因而,加大了对所投期刊的引用[4]。来自期刊的强迫引用与来自作者的献媚引用共同构成了期刊的不正当自引,是期刊过度自引的主要来源。
由于正确区分期刊正当自引与过度自引比较困难,研究人员采用了定量指标自被引率来评判期刊自引合理与否,即自被引率超过一定的标准,便认为是期刊过度自引。刘雪立等[5]确定了我国医学期刊2005—2007年的过度自引标准,3个年份的期刊自被引率高限分别为0.316、0.260、0.238。徐自超[6]确定了我国自然科学类期刊2005—2007年的过度自引标准,3个年份的期刊自被引率高限分别为0.323、0.299、0.285。 文献[5-6]均采用了自被引率这一定量指标来检测期刊的过度自引,并给出了各自的标准,为进一步研究期刊过度自引提供了有益的参考。
自被引率是指某刊自创刊以来发表的论文在统计当年自被引的次数与总被引的次数之比。从自被引率的定义可知,某刊所有年份发表的论文的自被引次数都会影响到期刊的自被引率,但只有前2年发表的论文的自被引次数才会影响到期刊的影响因子。因此,学术期刊用自引来操纵影响因子主要是依靠自引期刊前2年发表的论文,自引其他年份发表的论文对影响因子没有贡献,但对自被引率有贡献。这表明:影响因子与自被引率在研究时长上是不同的,前者是2年,后者是若干年(至少为3年);自被引率与影响因子理论上并没有直接的相关性,就某一期刊而言,自被引率增大,影响因子不一定增大。由此看来,用自被引率作为衡量期刊过度自引的指标显得美中不足。
鉴于此,笔者拟采用自被引率与2年自被引率作为评价指标来检测期刊过度自引,并以2014年版Journal Citation Reports收录的食品科技期刊为例,分析2年自被引率作为检测学术期刊过度自引定量指标的优势,旨在为有效地检测期刊过度自引、更好地遏制操纵影响因子提供参考。
2 数据来源与方法
样本的选取遵循同类相比的原则,即选取Journal Citation Reports数据库中的同一学科类目期刊进行比较。汤森路透集团公司发布的期刊自引报告[7]表明:高自被引率(大于20%)期刊分布于所有学科类目,且每个学科类目中期刊的自被引率变化范围都非常大,学科类目大小与各学科类目的期刊平均自被引率相关性很弱(R2=0.1)。国内科技期刊的情况也是如此[8]。由此可见,自被引率与学科类目、大小均没有较大关系,过度自引每个学科都存在。鉴于此,笔者仅以119种食品科技SCI来源期刊为样本进行研究。
数据采自汤森路透集团的2014年的Journal Citation Reports Science Edition[9]。
首先,进入Journal Citation Reports数据库,分别选择JCR Science Edition 2014和学科类目进行检索,然后,选择具体学科类目 FOOD SCIENCE&TECHNOLOGY进行检索,最后,分别打开每种期刊进行相关数据采集。采集的数据包括:总被引频次(Total cites)、自引频次(Self cites)、2 年被引频次(Cites to Years Used in Impact Factor Calculation)、2年自引频次(Self Cites to Years Used in Impact Factor Calculation)。
本文中自被引率与2年自被引率的定义为:自被引率=自引频次/总被引频次,2年自被引率=2年自引频次/2年被引频次。将采集到的数据录入到Excel表格中,分别按各自的定义用Excel自动计算出自被引率与2年自被引率。
分别以自被引率与2年自被引率作为期刊过度自引的定量评价指标,用SPSS16.0作箱形图,将处于内限(Q3+1.5IQR)以外位置的点表示的数据视为异常值[10],将数据异常的期刊视为过度自引期刊,即数值大于Q3+1.5IQR的期刊为过度自引期刊。
3 结果与分析
3.1 两种评价指标的过度自引的界定
2014年版JCR收录的119种食品科技来源期刊的自被引率与2年自被引率的Q3+1.5IQR(标准参照值)分别为0.317和0.426。以自被引率为评判指标,其值大于0.317的期刊为过度自引期刊,过度自引的期刊有10种,占全部期刊(119种)的8.40%;以2年自被引率为评判指标,其值大于0.426的期刊为过度自引期刊,过度自引的期刊有7种,占比达5.88%。
3.2 两种评价指标的离散程度的比较
离散程度,即观测变量各个取值之间的差异程度。在统计分析推断中通常用极差、标准差、四分位距等指标来表示数据的分散程度,极差、标准差、四分位距越大,数据分布的离散程度越大。图1是2014年版JCR收录的119种食品科技来源期刊的自被引率与2年自被引率的箱形图。
图1 自被引率与2年自被引率的箱线图
由图1可以看出,2年自被引率的极差(最大值为0.867、最小值为0)大于自被引率的极差(最大值为0.629、最小值为0),2年自被引率的四分位距(0.143)大于自被引率的四分位距(0.111)。经SPSS16.0软件分析,2年自被引率的标准差为0.147,自被引率的标准差为0.115。这些都说明2年自被引率的离散程度明显大于自被引率的离散程度。
3.3 两种评价指标的反应速度的比较
以2年自被引率为指标,过度自引的期刊有7种;以自被引率为指标,过度自引的期刊有10种。两者重合的期刊有6种,不重合的期刊有5种。这5种不重合的期刊如表1所示。
以自被引率为评判期刊过度自引的指标,表1中期刊FLEISCHWIRTSCHAFT为正常自引,但是它的2年自被引率高达50.0%,而自被引率只有9.8%,前者是后者的5倍多,显然有操纵影响因子的嫌疑,属于过度自引。如果用2年自被引率来评判,就可以在第一时间内发现这种情况。
表1 不重合的5种期刊的2年自被引率与自被引率
表1中期刊J FUNCT FOODS与期刊FOOD SCITECH-BRAZIL的2年自被引率与自被引率相差不大,按两个指标的各自标准来评判,结果都是正确的。其理由是,从理论上讲,如果没有人为的操纵,2年自被引率与自被引率应当大致相等,具体到某种期刊,由于受多种因素影响,会有一定的偏差,但只要两者相差不大,都可以认为是正常的。
表1中期刊RIV ITAL SOSTANZE GR和期刊J FOOD SCITECH MYS的2年自被引率均远小于各自的自被引率,这一事实表明这两种期刊在统计当年并没有用期刊自引来操纵影响因子,用2年自被引率来评判,自引是合理的,不属于过度自引。但是,由于这两种期刊前2年以前的年份的自被引率太高,用自被引率来评判,属于过度自引。由此可见,以自被引率作为评判期刊过度自引的指标,具有滞后性。
4 讨论
4.1 理论上2年自被引率优于自被引率
2年自被引率的完整定义为:2年自被引率=某期刊前2年发表的所有文献在统计年被该刊引用的次数/某期刊前2年发表的所有文献在统计年被所有统计源期刊引用的总次数。简单地讲,2年自被引率=2年自引频次/2年被引频次。
从2年自被引率的定义可以看出,2年自被引率与影响因子的计算时间窗口相同,都是2年,研究的对象也相同,均是前2年发表的论文。由此看来,2年自被引率与影响因子的紧密程度要大于自被引率与影响因子的紧密程度,2年自被引率与影响因子理论上有一定的相关性,对某一期刊而言,2年自被引率增大,影响因子也相应增大。学术期刊增加期刊自引的主要目的是提高期刊的影响因子,采取的方式是增加前2年发表的论文的自引,直接的表现是期刊2年自被引率的升高。因此,从理论上讲,与自被引率相比,2年自被引率的时间窗口更短,对期刊过度自引更加敏感,更适合作为检测学术期刊过度自引的定量指标。
4.2 实践上2年自被引率具有更多优势
从119种食品科技SCI来源期刊的自被引率与2年自被引率的比较分析可以看出,与自被引率相比,2年自被引率具有离散程度大、反应速度快的优势。离散程度越大,过度自引越易被察觉。从实践上再次证明:2年自被引率对过度自引更加敏感、反应速度更快,能够在第一时间内检测到过度自引的期刊。
[1] 刘雪立.全球性SCI现象和影响因子崇拜[J].中国科技期刊研究,2012,23(2):185-190.
[2] 王凌峰,叶涯剑.期刊影响因子操纵行为及抑制策略[J].编辑学报,2012,24(6):567-570.
[3] Wilhite A W,Fong E A.Coercive citation in academ ic publishing[J].Science,2012, 335(6068): 542-543.
[4] Chorus C G.The practice of strategic journal self-citation:It exists, and should stop (A note from the editor-in-chief)[J].European Journal of Transport and Infrastructure Research(EJTIR), 2015,15 (3):274-281.
[5] 刘雪立,周志新,方红玲,等.2005—2007年我国医学期刊自引率与过度自引的界定[J].中国科技期刊研究,2009,20(4):624-626.
[6] 徐自超.2005—2007年我国自然科学类期刊自引率统计分析[J].中国科技期刊研究,2010,21(6):794-796.
[7] McVeigh ME.Journal self-citation in the journal citation reports:science edition (2002) [R/OL].[2015-12-25].http://wokinfo.com/essays/journal-self-citation-jcr/.
[8] 莫京,任胜利.国内外科技期刊的期刊自引对比分析[J].中国科技期刊研究,2005,16(5):655-657.
[9] Thomson Reuters.Journal Citation Reports[R/OL].[2015-12-25].http://admin-apps.webofknow ledge.com/JCR/JCR?RQ=HOME.
[10] 向蓉美,王青华.统计学[M].成都:西南财经大学出版社,2011:63-64.