学术不端文献的发表追溯及防范对策
——基于185篇疑似学术不端文献的实证分析
2016-03-24张辉玲白雪娜崔建勋黄修杰
■张辉玲 白雪娜 崔建勋 黄修杰
《广东农业科学》编辑部,广东省农科院农业经济与农村发展研究所,广东省广州市天河区五山金颖路31号 510640
近年来,学术不端现象在学术期刊中频频发生,社会各界纷纷对此现象把脉问诊,大多将学术不端事件泛滥成灾的因素归结为制度的缺失、评价体系的不合理、法规的缺位、道德的失范等。学术不端行为的严重性也引起了我国政府、高等院校和科研机构的高度重视。2015年11~12月,中国科协、教育部等多部门联合发布《关于准确把握科技期刊在学术评价中作用的若干意见》[1]《发表学术论文“五不准”》[2],2016 年1 月13 日,国务院办公厅发布《关于优化学术环境的指导意见(国办发〔2015〕94 号)》[3],均提出要严惩学术不端行为,构建防控学术不端行为的责任体系和诚信制度,以维护风清气正的良好学术生态环境。不可否认的是,学术不端现象在学术期刊频繁出现,学术期刊本身也负有不可推卸的责任[4]。中国知网、万方数据、重庆维普三大数据库检测系统的投入使用,为学术期刊编辑初审稿件的创新性和筛查学术不端行为提供了便利条件。然而采用检测系统后,仍有个别学术不端稿件发表出来,学术不端行为已不是简单地表现为复制和拼凑,而是已经演化为隐式的深层次学术不端,因学术不端行为而撤稿的例子也屡屡发生,这给期刊带来了一定的负面影响。在防范学术不端行为方面,除了作者的文责自负外,很多人认为编辑需要承担更多的责任,在刊发前应严格控制稿件的处理流程,责任人需要分工合作、沟通协调,共同承担起相应的防范学术不端的职责,将学术不端行为最小化[5]。而这方面的研究大多是基于作者经验从理论上进行分析[6-9],或只是粗略分析某刊在统计年限内疑似自抄、一稿多发、疑似抄袭等3类文献的数量或不端文献的重合度[10-11],鲜有研究从实证分析的角度深入调查不端文献的重合度、疑似源文献及重合内容、作者所在机构及身份等综合信息,进而提出更加行之有效的针对性措施。鉴于此,本文通过对《广东农业科学》(以下简称《广东农科》)2007—2013年刊发的疑似学术不端文献进行统计与分析,结合编辑日常工作中发现的各种学术不端进行剖析,旨在为广大学术期刊编辑及时、准确地辨别各种学术不端行为提供现实依据,充分发挥学术期刊编辑在防范和打击学术不端行为工作中的作用。
1 研究对象与方法
2015年3~6月,根据《中国学术期刊影响因子年报》个刊影响力统计分析数据库数据(截至2014年11月25日),以“稿件质量分析”为评价内容,首先,导出《广东农科》2007—2013年已刊发的学术不端文献明细表,保存为Excel数据,逐篇排查,将重复统计文献删除并最终按1篇统计,调查该刊疑似学术不端文献的实际篇数、类型、年际变化和疑似源文献(指发表在先的文献)特征。然后,逐篇下载2012—2013年疑似学术不端文献,调查重合度、疑似源文献及重合内容、作者所在机构及身份等,分析这些学术不端文献的产生历程以及作者特征。在此基础上,深入剖析使用科技期刊学术不端文献检测系统(AMLC)以来仍发表在库的10篇疑似学术不端文献,比较疑似源文献和本刊文献投稿日期和刊发期数,同时对这10篇文献的原稿及其重合度、专家审稿意见、已刊发样稿及其重合度进行溯源比对,分析以上文献的“漏网”原因。
依据《<中国学术期刊影响因子年报(自然科学与工程技术)>引证数据统计规范》[12],“疑似学术不端文献”指全文文字重合度大于40%且发表在后的文献,包括下列三种情况:(1)一稿多发,指同一作者发表2篇文献全文重合度90%以上;(2)疑似自抄,指同一作者发表2篇文献全文重合度为40%~90%;(3)疑似抄袭,指不同作者发表2篇文献全文重合度40%以上[13]。
2 结果与分析
2.1 2007-2013年《广东农科》疑似学术不端文献发表情况
2.1.1 疑似学术不端文献数量变化分析
从表1可以看出,2007—2013年《广东农科》刊登的疑似学术不端文献共185篇,占7年总发文量的1.96%,其中一稿多发2篇(分别出现在2010、2011年),疑似自抄90篇,疑似抄袭93篇。在2012年未使用AMLC前,每年刊登学术不端文献数量均占当年总发文量的1.7%以上,2010年达到顶峰60篇、占全年发文量的4.0%。使用该系统后,本刊疑似学术不端文献的发表数量逐年下降。
表1 2007-2013年《广东农业科学》疑似学术不端文献发表数量统计
2.1.2 疑似源文献特征分析
对185篇疑似学术不端文献分析发现,这类文章抄袭的疑似源文献数量从最初的1篇到后来的2~3篇甚至6~7篇以上,具体表现形式有:(1)同一作者以基本相同(重合度60%以上)的内容发表在2个以上期刊。例如,某作者于2011年在本刊发表《******果胶的研究》,此前他已将相似内容(重合度在60%~70%)于2010年发表在《山西化工》《河南化工》等7个期刊。(2)不同作者抄袭基本相同(重合度60%以上)的内容发表在多个期刊。例如,某作者于2007年在本刊发表《******防护中的应用》,此前这些基本相同(60% ~77%)的内容已于1998—2006年间被8个不同作者发表在8个不同期刊,其中5篇文题完全相同。
表1显示,近年来疑似源文献的类型越来越多样化,在本刊发表的疑似学术不端文献中,2010年之前仅表现为引用、抄袭期刊,2011年开始出现抄袭学位论文及会议论文的情况,2012年的28篇疑似学术不端文献中有1篇抄袭博士学位论文、2篇抄袭硕士学位论文、1篇抄袭会议论文。这可能与中国知网对期刊的收集较为全面、引用期刊的文献更容易被AMLC检测出来有关,部分作者开始寻找其它捷径,或者是个别作者(尤其是在读研究生)过度引用导师其他学生的学位论文[10]。
2.2 2012-2013年《广东农科》疑似学术不端文献产生原因分析
从理论上来说,AMLC的采用应该能基本上杜绝学术不端文献的对外传播,但事实并非如此,《广东农科》自2012年2月10日采用该系统后仍刊登了多篇学术不端文献(表2),下面将对这些文献的具体情况进行深入分析。
表2 2012-2013年《广东农业科学》学术不端文献发表情况分析
2.2.1 重合度、疑似源文献作者及作者主观意愿分析
从表2可以看出,32篇不端文献中,重合度在40%~49%的18篇,50% ~59%的 6篇,60% ~79%的5篇,80%以上的3篇;与作者本人论文重合的12篇,与同一团队成员重合的8篇,与他人重合的12篇。根据重合度和重合内容,可在一定程度上推断作者抄袭的主观意愿。我们将重合度在60%以上的8篇文献以及个别特殊文献与疑似源文献比对,发现主要有以下4种情况:
(1)主体内容相同,实属一稿一人两发。据了解,目前一些作者为尽快得到录用答复往往会一稿同时多投,但有些期刊在未通知作者情况下抢先发表,导致作者又接受另一期刊的录用发表。文献8中81%的主体内容与作者本人之前发表文章重合,甚至文题都完全相同,应归入“一稿多发”的范畴。然而,这两篇文章发表时间很接近,作者可能不是有意为之。文献30则是隐蔽的一稿一人两发,虽然重合度仅40%,但该文的数据图与同一作者发表于2011年《吉林农业》的《******变化规律研究》完全相同,但供试茶树品种却不相同。
(2)主体内容相同,同一团队,实属一稿两人多发。文献10的作者将通讯作者团队另一成员4年前已发表论文的文题、试验年份、参考文献进行了修改,将折线图改成柱形图,其他内容几乎一字不改。文献13的作者在同一团队成员已发表论文的基础上,修改了摘要,增加了“根径”指标,其他内容完全照搬。进一步挖掘发现,文献13和文献30作者所在研究团队近年来在国内期刊甚至国家一级学报发表了很多篇论文。比对发现,仅仅一稿一人两发、一稿两人两发情况就至少有3对共6篇文章,有些甚至一稿三人三发。经过分析可知,这两个团队逃避学术不端检测的伎俩如下:一个实验结束后,以同样的几组数据为基础,经过不同人员或者同一人员采用不同表达方式撰写,以不同的第一作者在短期内分别投往不同期刊,由于投稿时间相近,大多能逃避检测。
(3)主体内容相同,不同团队,实属将他人论文窃为己有重复发表。文献25的文题和主体内容与《乡镇经济》2008年某期发表论文完全相同,前者只是将统计数据更新到2010年,其他内容完全照搬。文献22的作者甚至直接将他人硕士学位论文据为己有。
(4)主体内容不同,但表述完全参照本人或他人论文。文献6重合度高达85%,原来是作者照搬本人已发表的同研究系列论文的表述,包括材料与方法、结果与分析等,但实际上这是同一系列的两个不同研究,有其客观原因:对于“材料与方法”部分,由于有些测定指标是常用指标,很多试验方法也是成型的规范化的常用方法,有些作者未采用参考文献标注的方式,容易导致高重合度;对于“结果与分析”部分,很多作者都有其固定的表达习惯,再次发表类似题材文章时更倾向于引用本人或他人已发表文献,而不愿重新组织文字。文献9、11、15、16、17、19、24、31 都属于品种选育及栽培技术类文章,因为这类文章通常都有其固定表述,且同一种类农作物不同品种间的栽培要点大同小异,作者大多倾向于“拿来主义”,但由于报道的是新品种,编辑部对这类文章的重合度放得较宽。
2.2.2 作者所在机构及身份
由表2可知,在32篇学术不端文献中,来自学院或地市级科研机构的18篇,普通大学或省级科研机构8篇,211/985大学或中科院6篇。可见,来自于学院或地市级科研机构以下的科研人员,由于单位科研力量较薄弱、学术资源有限,其做出高水平研究和写出高水平论文的概率较低,但迫于职称晋升和考核所需,不顾学术道德铤而走险的概率相对较大。
以作者职称或身份而言,这些学术不端文献中有2篇出自研究员(均为品种选育及栽培技术类文章),3篇出自副教授,20篇出自讲师或助理研究员,2篇在读博士生或博士,6篇在读硕士生或本科生。可见,本刊疑似学术不端文献的作者不少是中级科研人员或在读研究生,他们对著作权的意识较为淡薄,加上迫于科研考核、职称评定、毕业就业等压力,所在单位或导师也没有对此进行规范管理,使得部分青年科研人员或在读研究生引用过度的现象较多。
2.3 使用AM LC后学术不端文献产生原因分析
本刊编辑部使用AMLC后,仍有一些稿件成为“漏网之鱼”顺利发表,包括文献14~17、27~32共10篇,本文进一步剖析了《广东农科》编辑部工作上的漏洞,这些学术不端文献之所以能够发表,可能存在以下一种或几种情况。
(1)检测方法有误。在采用检测系统一年内,未能充分理解掌握AMLC的检测方法,检测稿件为整篇上传,包括中英文摘要、关键词、参考文献和正文等所有内容,而中国知网对已刊发论文学术不端的检测仅仅是对正文文字重合度的对比情况,因此前者的检测结果势必低于后者而被判定为通过第一关,这是本刊已刊发论文被检测出学术不端的一个重要原因,如文献14。还有一种情况是,有些作者未严格按照本刊投稿模板格式规范全文,责任编辑后期加工稿件时会删除一些不相关内容,导致收稿重合度低于发表后重合度。
(2)未进行出版前二次检测。有些作者在稿件录用后还会做较大幅度修改,或补充内容、调整原文表达时引用已报道文献,或大量精简原文冗余文字;在编修过程中,责任编辑也会按照本刊格式规范进行编辑加工或删减。这些操作都可能造成修改后稿件重合度的增加,但编辑部在论文出版前未进行二次检测,导致中国知网对已刊发论文检测时重合度大幅升高,如文献31和32。
(3)检测标准尺度未把握好。统计发现,有些文献在收稿时重合度较高,可以判定为疑似学术不端,但却仍被发表出来,这与本刊使用该系统时间较短、尺度把握不准有关。本刊在刚开始使用AMLC时审稿尺度放得较宽,尤其是在疑似自抄文献中,认为引用、摘抄本人及其团队的部分研究成果或文字表述是被允许的。从表2也可以看出,在使用AMLC后仍出现学术不端的10篇文献中,有7篇与本人或其团队成果重合度较高。
(4)发表时间与上网时间存在一定的时间差。目前国内多数期刊发表周期都在6个月以上,而本刊2012—2013年为半月刊,发表周期多在4~6个月。有些研究团队将属于同一系列研究内容的稿件同时或不同时投出,但当进行学术不端检测时,疑似源文献仍未上传至中国知网,即文章在纸质版发表和上网之间存在一定的时间差,如文献29。2013年后,本刊严格按照中国知网的规定只对正文进行检测,文献29在收稿时的重合度为23.2%,但发表后却与同一团队成员论文的重合达58%。追踪两篇文章发现,疑似源文献于2012年3月16日被投出、同年12月5日纸质发表、2013年1月17日上网,而本刊作者于2013年1月8日投稿,此时疑似源文献已发表但还未被上传至中国知网,避开了检测。还有一种情况是,作者为得到快速审稿回复往往一稿多投,但其中一刊在未通知作者情况下抢先发表,导致作者又接受另一个期刊的录用发表。
(5)编辑未能深入研究比对。文献30其实是一稿多发,这在2.2.1(1)部分已有详述,但是收稿检测时发现是不同茶树品种,重合度并未超过40%就没再深究,而系统对图片的重合暂不能比对,编辑没有一查到底,并未下载疑似源文献仔细比对,否则一定能查出端倪。
3 对策建议
学术不端现象是一个社会问题,涉及主体众多,包括政府部门、体制机制、社会环境、作者、学术共同体、出版机构等。作为学术期刊编辑,应认真履行好科学“守门人”的职责,严厉惩治和防范科技期刊中的各种学术不端行为。根据《广东农科》近年刊发的疑似学术不端文献的表现情况,我们仅从编辑的角度提出以下防范措施:
3.1 严格规范审稿流程,提高录用前查重标准
低重合度是稿件录用最基本的底线,因此编辑部应严格规范审稿流程,杜绝不经三审就发表的论文,即便是特约稿件也需进行初始检测。初始检测文字重合度的控制应更严格,视刊物来稿情况可以控制在15%甚至更低,有些稿件在送审前就存在一定的文字重复问题,虽未达到不予接收的程度但已很接近,一旦返修稿中再增加一些重复文字,那么其重复率将超过规定数值[14],对于这类稿件一定不能“带病提拔”。稿件经三审通过后,每个期刊刊发论文前都应知会作者并得到其授权和允许后方能发表,不能抢先发表,以避免作者在不知情的情况下“被一稿多发”。
3.2 强化责任编辑的学术把关职责
目前大部分学术期刊都在“投稿须知”中告知作者“文责自负”,但“文责自负”只是强调作者需严谨科研、认真书写校对文稿、对发表内容和观点负责,并没有否定责任编辑和审稿专家在论文发表过程中所持有的编辑权和审阅权,尤其是责任编辑需要审查作品的独创性和真实性、对论文进行编辑加工、规范内容和格式[4]。因此,作为责任编辑,一方面,对一些重合度较高的论文不搞“一刀切”,应深入分析疑似源文献以及重合内容,有些作者将本人学位论文整理后发表导致重合度很高,笔者认为这不属于学术不端行为;另外对与作者本人会议论文重合的文章是否纳入学术不端行为目前也未有定论,对于这些稿件,责任编辑都应耐心地向作者了解情况。再如,一篇稿件重合度超过30%,但如果大部分重合都出现在引言或试验方法中,且标注了参考文献,那么对于这种稿件还是应该谨慎对待。另一方面,对一些重合度低于查重标准的稿件,也不能掉以轻心,随着检测系统的普及,作者容易提前进行检测修改,这对责任编辑的识别能力提出了更高要求。一些论文的造假手段非常隐蔽,如刻意修改供试材料数量、修改试验地点、调换文字表达、方法不同而部分数据相同等情况,查重时难以察觉,需要责任编辑认真核对结果及数据后才能发现[15]。因此,责任编辑应转变“文责自负”的观念,承担文责共负之责。
另外,在编辑加工中,如遇作者提出添加或删除作者、更改作者顺序等要求,责任编辑除应请作者阐明原因并提交一份新的作者承诺书外,还应对初审查重结果进行重新评估,判断其是否符合著作权法的规定。
3.3 执行收稿时查重+发表前二次检测以及双系统检测
大多数学术期刊编辑部认可AMLC对稿件的初审效果,只有文字重合度符合编辑部的规定才予以接收,但较少编辑部对录用稿进行刊前检测,这是采用检测系统后仍出现重合度较高文献的主要原因。因此,除了初审检测外,编辑部有必要对修回稿件进行刊前的二次检测,如果重合度仍超过标准,那么必须退回作者重新修改。但不能将查重报告发给作者,以免作者为了逃避查重进行反复修改,而不管语句是否通顺,最终却被录用。在不影响及时出版的情况下,查重日期距出版日期越近,越有可能防范不端文献的发表。
为了垄断数据资源,近年来中国知网、万方数据两大数据库纷纷与学术期刊出版单位签署“独家协议”,目前以上两大数据库已经分别与1000多家出版单位签署了“独家协议”[7],这种商业竞争人为地造成数据库资源的割裂和不完整。鉴于此,建议编辑部进行中国知网 AMLC和万方数据论文相似性系统两大系统的双向检测,将双系统检测结果进行科学分析后再决定是否送审。
3.4 建立学术不端问题共享数据库,联合抵制学术不端行为
目前,我国各期刊出版机构合作甚少,一个期刊对学术不端论文退稿后,缺乏有效的资源共享,难以防范“问题”稿件再次投向其他期刊。建议根据学科方向,建成全国性的学术不端问题共享数据库,并在同类期刊编辑同行中共享,或者通过qq群、微信APP等平台发布相关信息。如有编辑发现此类问题,将其放入各专业问题数据库,并说明其问题所在,以供其他编辑部参考,避免重复劳动。例如,某作者有多次“造假嫌疑”,但都不能自证其清白,即使作者单位没有最终给出学术造假的定论,但期刊社或编辑部也可推断,这些“造假嫌疑”应可以认定为“学术造假”,并在其之后投稿时格外注意,以更好地防范学术不端行为。
此外,由于国内论文代写代发的现象非常严重,而代写代发的论文数据大多为虚构、杜撰,导致很多科研人员因此上当受骗。对于这类中介组织,同类编辑部更应共享信息,联合抵制封杀,严厉打击这种不正之风,让投机者无机可乘。
3.5 注重刊后学术不端文献的撤销处理
抄袭、剽窃他人研究成果等均是损害他人著作权的行为,如果没有撤稿声明,即使作者以非法手段获取他人研究成果作为自己的成果发表而获得荣誉,其仍享有著作权,这是对原作者著作权的极大侵犯[16]。国际上通行的做法是登载撤销该文的声明,而在我国,被撤销的问题论文仅占学术不端论文总量的一小部分。因此,作为学术期刊配合打假的重要手段的撤稿声明,需得到期刊编辑的进一步重视,编辑部应在搜集齐全不端证据并警告作者后,坚决在期刊上针对该文发布正式撤销声明,同时在各大数据库撤销该文献,以免作者凭借不端文献获取相关利益,严格防范这类研究被作为有价值成果而被继续引用。
[1]中国科学技术协会,教育部,国家新闻出版广电总局,中国科学院,中国工程院.关于准确把握科技期刊在学术评价中作用的若干意见(科协发学字〔2015〕83号)[EB/OL].[2015-11-04].http://www.cast.org.cn/n35081/n35488/16753578.htm l.
[2]中国科协,教育部,科技部,卫生计生委,中科院,工程院,自然科学基金会.发表学术论文“五不准”(科协发组字〔2015〕98号)[EB/OL].[2015-11-23].http://www.tww tn.com/Policy/60_297489.htm l.
[3]国务院办公厅.关于优化学术环境的指导意见(国办发〔2015〕94 号)[EB/OL].[2016-01-13].http://www.gov.cn/zhengce/content/2016-01/13/content_10591.htm.
[4]任艳青,陈培颖,欧彦,等.《自动化学报》防范学术不端行为的策略[J].中国科技期刊研究,2012,23(3):373-376.
[5]朱银周.期刊主体人员防范深度学术不端行为的职责分析[J].中国科技期刊研究,2014,25(11):1373-1378.
[6]王福军,谭秀荣,冷怀明.科技期刊中常见学术不端现象分析与思考[J].编辑学报,2014,26(5):452-455.
[7]倪爱香.学术期刊编辑对学术不端行为的防范策略[J].中国科技期刊研究,2013,24(3):586-588.
[8]魏秀菊,王柳,赵光磊.学术期刊办刊中防范学术不端行为的实践及启示——以《农业工程学报》为例[J].中国科技期刊研究,2008,19(4):632-636.
[9]吴艳妮,周春兰.科技期刊编辑对学术不端论文的识别——以《护理学报》为例[J].编辑学报,2015,27(4):361-363.
[10]管珊红,付英,黄荣华,等.学术不端文献的现实表现与防范对策——基于对《江西农业学报》2010-2012年学术不端文献的分析与思考[J].江西农业学报,2014,26(12):95-98.
[11]孙丰成,崔护社.学术不端特征分析及学术期刊编辑防治学术不端的措施[J].编辑学报,2013,25(S1):34-37.
[12]《中国学术期刊影响因子年报(自然科学与工程技术)》引证数据统计规范[EB/OL].[2015-03-24].http://www.jif.cnki.net/Core/Login.aspx.
[13]王曼.医学期刊修回稿再次学术不端文献检测的必要性分析[J].编辑学报,2013,25(2):146-147.
[14]陈志贤.编辑应重视“修改后发表”的返修稿[J].编辑学报,2014, 26(2): 173-174.
[15]刘清海.科技期刊编辑在防范学术造假论文中的作用[J].编辑学报,2014,26(3):258-261.
[16]张晴,姚长青,潘云涛,等.中文学术期刊撤销论文研究[J].中国科技期刊研究,2014,25(5):611-615.