我国科技期刊评价存在问题及对策

2017-06-02陈锐锋

科技传播 2017年8期

摘要目的：探讨我国科技期刊评价存在问题，为我国科技期刊评价及研究提供有益参考。方法：从被引频次定义入手，分析被引频次作为科技期刊评价指标及其评价方法的存在问题，提出改进评价方法的思路。结果：以被引频次作为评价指标，会导致评价无可比性、评价悖论、评价失真、评价不具代表性；同时，两年为周期的评价可能存在一定局限性；评价作用被异化；评价方法缺乏大样品、多中心研究，研究队伍庞杂分散，编辑部人员跟风研究，研究水平高低不一，不利于资源的整合利用。结论：呼吁回归编辑本位，淡化评价指标；建立大样品多中心的科技期刊评价研究体系。采用模糊数学方法进行全文比对分析、科学直观显示被检索科技论文的创新点，以此来评价科技期刊的质量。

关键词科技期刊评价；综合评指；科技期刊大数据网络；模糊数学方法；科技创新

中图分类号 G2 文献标识码 A 文章编号 1674-6708（2017）185-0017-03

我国科技期刊的评价目前采用引文分析+其他评价指标来进行综合评价。但其科学性、可行性一直引起人们的深思。本文从被引频次入手，探讨科技期刊评价存在问题，籍此提出改进评价方法的思路，以期能为我国科技期刊评价提供有益参考。

1 引文分析法存在的问题

1.1 从被引内容分析

引文分析法发端于1955年加尔菲尔德（GARFIELD.E）所提出的影响因子。其计算公式为：某特定年度（一般为两年）期刊论文被引频次/该特定年度（一般为两年）内该期刊所刊登的论文篇数[ 1 ]。在影响因子的定义中，作为影响因子算式中的分子，被引频次指特定年度（一般为两年）期刊论文被引引用的次数[ 1 ]。到底“被引”的内容是什么？是片言只语还是某被引文章的主要观点，被引数量是多少？加氏未作出限定。因此，文献中任何内容被引用都可计入。这样，被引用内容可能掺杂无效成分，由此可能产生以下一系列的问题。

1.1.1 评价无可比性

根据“被引频次”定义，任何内容只要被引用1次就计算1次。这样，每篇文章被引用的内容及数量可能不尽相同。引文分析法中所比较对象的条件不一致，这就存在引用内容的不确定性和无可比性。比如，一篇农学文章中关于转基因技术的某一个观点被引用，与另一篇医学干细胞移植技术某一个观点被引用，如何据此评价两者质量的差异？又如，有第三篇物理学文章中某3个普通观点被引用，那么又如何评价这三篇文章质量的差异呢？按照“被引频次”定义来计算影响因子的话，第三篇被引用次数较多，其影响因子自然高，这种算法显然是不合理的。因为它没有考虑到不同学科的无可比性问题。即使同一学科，不同内容的文章也不具备可比性，再如，同属于化学学科的2篇文章中，1篇普通化学原理的反应式被引用8次，而另1篇关于新技术改进的化学分析法被引用1次，或者甚至是零被引（后述），这种无可比性的内容也不能简单地按被引用的次数去评价其文章质量的？既然被引实质内容无可比性，那么又如何能客观地评价科技期刊质量之间的差异呢？评价自然失去真正的意义。

1.1.2 评价悖论

也由于“被引频次”内容没有质的规定性，因此被引用内容可能掺杂假的成分。譬如反引问题，反引表示引用者对被引用的观点提出质疑或批驳，从反面来证明引用者立论的正确。严格来说，这种引用应属于无效引用。但按加氏的算法，是可以计算被引频次的，由此推断受质疑、批驳、甚至是有错误观点的文章质量高。这显然是有悖常理的。有争议的文章往往被引频次也會高，但反引频次高不一定能代表被引文章的质量高[ 2 ]。

1.2 从被引用的量来分析

从被引用的量来分析，也可看出文献分析法也存在一些弊端。

1.2.1 评价不具代表性

1）按《著作权法》分析。《著作权法》对引用的量是有限制的：引文不能成为新文章的主要组成成分。由此可知，被引用的也只是占原被引文章一小部分而已，以小部分代表其全部，引文分析法存在以偏概全的错误[ 2 ]。

2）从统计学角度看。一篇洋洋几千字的文章，仅从其某一观点的一次或多次被引用来评判其质量和影响力，似乎有抽样误差（以偏概全），缺乏代表性之嫌[ 2 ]。因此，这种以管窥豹式的评价，不可能全面评价科技期刊内容质量。

1.2.2 评价期限的局限性

被引频次以2年为限，存在很大的局限性。由于人们认识的局限性，有些具有创见的论说，可能一时不会被人们所接受而没有被引用。如爱因斯坦相对论、哥白尼的日心说，从产生到被人们认可、引用，却经历了二三百年，超过了规定的两年期。能说未被引用的文章，质量就不好吗？再说，随着科学技术的发展，人们认识的提高，两年以后，原来被认为正确的观点，经过实践的检验，也可能是错误的。因此，两年为期的评价法值得斟酌。

1.2.3 人为因素导致评价失真

由于被引内容掺杂了“虚”的成分，导致评价失真。

1）过度自引。对作者来说，其稿件发表后被更多的引用对其本身的晋升、提干，评奖评等级有很大的裨益。因而，他们也会尽可能多地引用自己发表过的文章[ 2 ]。这会人为地使评价指标值出现虚高，导致评价失真。

2）诱引。正是文章发表后被更多的引用对原作者有益，该作者也会暗示其学生、下属、好友写文章时多引用其已发表的文章[ 2 ]。也会导致评价失真。

3）窃引。为了获取更高的被引频次，有的作者不惜将别人的观点经过消化后以与原文不同的表述方式在其某篇文章在中发表（引而不注），而在以后自己的文章中将其列为自己的文献引用[ 2 ]。这种窃取他人劳动成果的不道德行为也会人为地提高被引频次数值，导致评价失真。

4）滥引。笔者曾经处理过一篇文章，其作者在提出某一观点后面标注3～4个文献，但查阅所标注文献的相关内容，却与作者所提出的观点无关。笔者于是去电咨询该作者，称标注的目的是为了使该观点有文献支持，提高可信度；笔者甚至也见过一篇文章，在引用某一观点时，其作者在提出某一观点后面标注10个文献，其中有8个外文文献，作者是否全部看过这8篇外文文献？令人生疑。这种盲目的引用，如果编辑把关不严，也会人为地提高被引频次数值，从而导致评价失真。

1.2.4 客观因素造成评价失真

1）数字化期刊评价问题。有学者主张采用“网页点击量、浏览量、下载量”来作为数字化科技期刊评价指标[ 3 ]。但点击、浏览及下载的目的因人而异，但并不一定有引用。再说，OA期刊，由于可以免费使用，引用上较为便捷，被引频次可能提高，但是，因其“公开发表”前没有经过同行评价评议，难于剔除粗制滥造成分，易使被引频次数值出现虚高。影响评价的准确性。

2）零被引。客观上导致评价失真的极端例子就是零被引问题。诸如1.2.2中所举的两个具有创见论说的例子，按照影响因子的概念，诸如相对论和日心说这样有创见的论文，在最初发表时，肯定是不会被人们引用的，因而出现“零被引”。事实上这种零被引的现象时有发生。真正优秀的高质量的文章未被引用，未列入影响因子的计算范畴，这就客观上导致评价失真。由此看来，作为影响因子分子的被引频次的原定义，是一个不是很严格的、比较粗糙的概念，不能真实反映期刊被引用的有效内容。

过分强调被引用，会导致抄袭与重复出版，不但影响期刊的发展，还会阻碍科技的进步，而科技创新是社会进步的根本。因此，笔者认为科技期刊评价，应从科技期刊内容有无科技创新点着手，而不是深陷于“被引用”这种舍本逐末的窠臼。

2 评价方法研究中存在的问题

影响因子作为科技期刊评价指标存在诸多不合理甚至产生负面影响，已成为不争的事实。因此，为改变这种现状，许多研究者试图从不同角度来改进科技期刊的评价方法。纷纷通过减少影响因子的权重增加其他评价指标（如载文量、总被引频次、他引率、影响因子、即年指标、被引半衰期、篇均参考文献量和基金论文比等等），以期更全面地评价期刊的被引情况[5]。于是h指数法，主成分分析法，层次分析法应用于科技期刊评价的方法便应运而生[4-6]。相比较而言，这些方法更加科学、合理，也易为人们所接受。但实际上，这些研究也存在一些问题。

2.1 方法本身存在局限

h指数法，因子分析法，主要成分分析法，层次分析法用于评价科技期刊，都是研究者提出某一计算公式，然后在某一数据库抽取一定量的样品进行比较排序，以显示该方法优点，从而认为可行。但实际上，这些方法都缺乏大样品多中心研究，能否推广至全国乃至全世界？其科学性可行性也值得深究。何况，有学者认为，基金论文比不能作为评价指标[7]。

2.2 评价作用被异化

科技期刊评价的结果可以衡量刊物水平。因此，能够在“高水平”刊物上发表论文，自然地被认为学术水平高。因而一时被充当评判作者晋升晋职的硬性指标。这是我国科技期刊评价中存在的较大的问题。但随着人们认识的提高，如今已成为学界的诟病。

2.3 研究机构参差不齐，研究人员良莠不齐

评价方法的局限性，大家都了然于胸，如何研究出一种客观科学的评价方法？成为科技期刊研究的迫切课题。尤其是一些方法刊出后，更激发大家的研究热情。因此，科技期刊评价方法的研究，自然成为一场广场舞，一发不可收拾。纵观研究者所属的机构，有信息研究所、情报研究所、图书馆、各大院校学报、甚至是期刊编辑部。而且往往是国家科研基金支持下所进行的研究，总费用相当可观（一个国家自然科学基金动辄几十万）。

一方面，队伍庞杂分散，研究水平高低不一（中信所有影响因子报告，知网也有，搞得报表时无可适从），不利于资源的整合利用。

另一方面，科技期刊编辑部一般编辑人员跟风加盟这场广场舞。“术业有专攻”（韩愈《师说》），这种研究的任务理应由科技期刊管理部门和研究部门包括科技期刊编辑专家来完成。一般科技期刊编辑人员如加盟这一场广场舞，由于其学力、视界所限，科研力量相对薄弱，所掌握的材料有限，成果也寥寥无几，研究结果令人生疑。

3 对策

笔者认为，要解决我国科技期刊评价中存在的问题，必须做到以下几方面。

3.1 建立大样品多中心的科技期刊评价研究体系

建议各专业学（协）会、研究所设立本专业的数据库，收集本专业国内科技期刊数据；建议国家所有大数据库包括中国科学信息研究所、国家图书馆、万方数据库、中国知网（CNKI）中的科技期刊数据库等进行并网，组建国家科技期刊数据总库，并与国际专业数据库联网。国内各专业学（协）会、研究所科技期刊数据库与国家科技期刊数据总库联网，以此构建大样品多中心的科技期刊评价网络研究体系。

3.2 精简研究机构与人员

组建国家科技期刊大数据网络配套的国家科技期刊评价专业队伍。这些专家由信息研究专家、数据库专家、统计学专家和行业研究学（协）会专家（包括编辑专家）构成，专门负责科技期刊评价研究及评价工作，同时应重视国家科技期刊评价专业人才的培养。

3.3 淡化评价指标，重视科技创新

科技期刊评价，应转变观念，从“被引频次”“影响因子”的藩篱中突围出来，采用科技手段从科技創新入手来进行评价。受《西游记》如来佛照妖镜判辨真假美猴王故事的启示，建议在大样品多中心的科技期刊评价研究体系中，采用模糊数学方法，将要评价的科技期刊在科技期刊大数据网络上进行全文检索与比对分析，科学直观显示被检索科技论文的创新点（如用红色显示）及否重复发表（如用蓝色表示），以此来评价科技期刊的质量。同时，建议人事部门选人用人时不应将科技期刊评价指标作为唯一指标，而应淡化这种评价指标（比如减少其权重），从各方面进行综合考量。

参考文献

[1]GARFIELD E. Citation indexes to science： a new dimension in documentation through

association of ideas[J].Science，1955，122：108111.

[2]陈锐锋，何以平，吴球玲.影响因子作为科技期刊评价指标负面影响分析[J]，编辑学报，2009，21（5）：463-465.

[3]何星星，武夷山.基于文献利用数据的期刊论文定量评价研究[J].情报研究，2012，31（8）：98-102.

[4]赵波，周传敬.评价学术期刊的新文献计量指标——h指数及其发展[J].中国科技期刊研究，2007，18（5）：775-777.

[5]黄健.核心期刊计量学评价的数学分析[J].中国科技期刊研究，2012，23（6）：1017-1019.

[6]黄万武，金新政.层次分析法在科技期刊评价中的应用[J].中国科技期刊研究，1996，7

（2）：28-31.

[7]顾冠华，严燕.“基金论文比”不宜作为学术期刊的评价指标[C]//北京：第八届中国科期刊发展论坛论文集，2012.