利用AMLC提高稿件初审质量的实践与启示
2018-11-14屈李纯霍振响
屈李纯,霍振响
(西北农林科技大学学报(自然科学版)编辑部,陕西 杨凌 712100)
中国知网的科技期刊学术不端文献检测系统(AMLC) 以《中国学术文献网络出版总库》为全文比对数据库,可检测涉嫌抄袭与剽窃、伪造、篡改、不当署名、一稿多投等问题的学术不端文献,供期刊编辑部检测来稿和已发表的文献。采用AMLC进行论文初审检测和出版前再次检测的学术期刊越来越多,这在一定程度上减少了学术不端行为的发生,期刊应用AMLC检测的高重复率(重复率>30%)稿件数量所占比例呈逐年下降趋势[1]。不同期刊同仁针对应用学术不端文献检测系统过程中的问题进行了探讨,提出了防范学术不端行为发生的措施或者建议[2-5]。孙雷心对《中国农业科学》2009—2013 年初审稿件AMLC检测结果的分析发现,农业相关领域学术论文低重复率具有普遍性,并依据其刊物容量需求将重复率>30%的稿件做退稿处理[6]。秦小川根据《中医学报》新来稿件的检测结果,从重复文献类型、重复位置以及高重复率学位论文等方面进行了探讨[1]。刘冬梅以《环境卫生工程》原稿AMLC 检测结果为基础,分析了科技期刊中学术不端行为发生的原因,并提出了相应的对策建议[7]。王育花以勤云远程稿件处理系统中的来稿数据和AMLC检测为例,阐述如何鉴别论文的学术不端问题,最大限度地阻止了学术不端文献的公开发表,并将学术不端的检测提前到收稿阶段[8]。姜学霞认为,学术不端文献检索系统的应用应科学合理,并建议将送审稿件和检测重复的论文一并送审稿专家综合参考[9]。但由于各期刊涉及的学科不同,应用学术不端文献检测系统的检测结果有一定差异,因此对检测结果的处理方式也有差异。
笔者供职的《西北农林科技大学学报(自然科学版)》自2010年开始应用AMLC进行稿件初审前检测,近年又增加了刊发前二次检测,尽最大可能避免学术不端问题稿件的发表,在应用过程中获得了一些体会和思考,现总结如下。
一、初审稿件重复率的总体分布情况
从中国知网的科技期刊学术不端文献检测系统(AMLC)中自带的Excel导出功能,导出本刊所有上传论文的检测数据,按重复率分段选择2015~2017年检测数据作为分析对象,如表1所示。从表1可以看出,检测重复率在0~10%的稿件数量占比为52.84%,检测重复率在10%~20%的稿件数量占比为29.07%,检测重复率在20%~30%的稿件数量占比为10.35%,总体上检测重复率<30%的稿件数量占比达到92.26%,这与孙雷心对《中国农业科学》初审稿件AMLC的检测结果(重复率<30%的稿件数量为87.92%)[6]接近。因此依据AMLC检测结果,重复率<30%的稿件一般会进入专家审稿程序。从表1还可以看出,检测重复率30%~40%的稿件数量占比为4.02%,检测重复率≥40%的稿件数量占比仅为3.71%,这与《中国农业科学》《环境卫生工程》初审稿件的AMLC检测结果[6-7]也一致。从不同年份来看,重复率<20%稿件占比总体呈逐年上升趋势,究其原因可能是:(1)我刊的收稿质量有了进一步提升;(2)近年来随着国家各部门对学术不端问题的重视,以及对学术不端行为治理措施和防范体系的完善,作者自身学术道德水平提高;(3)应用AMLC检测的期刊越来越多,作者从主观上采用多种方式刻意降低文字的复制比[10]。
表1 稿件初审检测重复率的分布
二、重复率30%左右稿件的初评及处理
AMLC检测重复率30%是目前多数期刊判断稿件是否涉嫌学术不端的界限,但在稿件实际处理过程中检测重复率低于或者高于30%的稿件(或者说检测重复率30%左右稿件)存在难以决断的情况,是选择送专家审稿还是直接退稿对作者的影响较大,需要编辑慎重处理。在查看AMLC检测结果时发现,此类稿件的重复内容出现在材料和方法部分的居多,引言和讨论中的较少,并不是论文的主体部分。孙雷心对《中国农业科学》初审稿件AMLC检测结果分析也认为,易出现重复的部分是论文的材料与方法部分,在引言和讨论部分常见的重复是研究背景介绍和转述他人结果[6]。检测重复率20%~40%的稿件中有73.42%的重复出现在试验方法部分,出现在结果部分的仅为13.92%[11]。从表1可以看出,在2015~2017年,本刊检测重复率20%~30%的稿件有137篇,检测重复率30%~40%的稿件有52篇,以应用AMLC检测结果的规定,重复率<30%进入专家审稿程序,但在实际稿件处理过程中,应从以下几个方面对这部分稿件进行认真核查。
(一)从论文题目的快速初评
论文题目的考察重点关注重复检测列表中已发表论文题目与检测论文题目中重要的关键词。稿件“响应曲面优化双水相体系提取藏药瑞香狼毒多糖及抑菌抗氧化活性研究”的检测重复率为30.9%,与已发表论文题目“响应曲面优化菟丝子多糖提取工艺及抗氧化活性研究”有重复。从题目可以明显看出,“藏药瑞香狼毒多糖”“菟丝子多糖”是两种不同的多糖材料,重复内容也主要是方法部分,所以并未机械地按照>30%即退稿的处理习惯,而是提出问题请作者修改后进入专家审稿程序,经专家审阅认为“选题较好,修改后可以发表。”保证了该研究成果的传播。稿件“基于线粒体COⅠ, Cytb和EF-1α基因部分序列探讨中国蝶科的系统发生关系”的检测重复率为32.60%,检测列表中已经发表的论文题目“基于线粒体COⅠ和Cytb 基因序列研究粉蝶科七属间的系统发生关系”。从题目可以看出,主要的关键词“线粒体、COⅠ、Cytb、蝶科、系统发生关系”相同,怀疑与已发表论文可能存在重复,所以下载发表论文进行详细比对发现,检测稿件所用材料包含了已发表论文中粉蝶科和眼蝶科的17个种,与已发表论文的结构及有关线粒体COⅠ, Cytb的方法和内容基本相同,且没有引用已发表论文,则说明原因直接退稿。稿件“1980~2010年锡林浩特市土地利用/覆被变化研究” 的检测重复率为29.60%,按重复率<30%即送专家审稿,但结合投稿时间(2015年3月17日),从题目中的“1980~2010年”可以明显看出研究缺乏新意,只能说明情况做退稿处理。
(二) 快速阅读稿件,考察论文的可读性和核心内容
在实际稿件初审工作中,编辑通过快速阅读论文,从摘要、前言、试验方法到结果分析,会对论文的可读性和核心内容有一个比较全面的了解,如作者的思路是否清晰、语言表达是否流畅,以及前言部分对相关研究领域现状及存在问题阐述是否透彻、材料和方法是否明确、图表设计是否合理、研究内容是否充实等。如在检测稿件“枸杞抗坏血酸氧化酶基因的克隆与表达分析”时发现,其检测重复率为29.10%,未超过30%的退稿界限,但阅读后发现,该研究仅克隆了抗坏血酸氧化酶基因并进行不同组织表达,有关图片简单,达不到本刊的收稿要求,因此说明原因后做退稿处理。另一篇稿件“转AtCIPK23基因马铃薯低钾胁迫蛋白质差异表达研究”,其检测重复率为35.10%,虽然重复率不是特别高,从题目看也无大的问题,但阅读后发现文章写作质量太差,语句不通,各部分逻辑关系不清,因此说明情况也以退稿处理。
(三)从参考文献质量的快速初评
浏览文后参考文献,可以了解作者对所研究学科领域进展掌握的深度和广度,因此可作为判断论文创新性高低的一项主要依据,如参考文献的数量和质量,特别是近5年内参考文献的数量,及引自该学科领域公认的高水平核心期刊参考文献的数量。如稿件“谷子雄性不育和杂种优势利用问题与展望”的检测重复率为33.10%,从参考文献看,近5年的文献数量不足50%,作为一篇综述文章显然无法反映相关领域的最新研究成果,也不能为同行提供启发和帮助,鉴于以上原因对该稿件给予了退稿处理。
三、重复率≥40%稿件的分类处理
对于AMLC检测重复率≥40%的稿件,可能部分内容或者观点还具有创新性[7]。也有编辑同仁认为,重复率>50%的论文切忌轻弃,重复部分往往是作者自己的学位论文[2]。而学位论文析出稿件不应简单地以检测重复率过高直接退稿,应以内容的科学价值为标准来正确处理此类稿件[12]。为此,对本刊2015~2017年检测重复率≥40%的50篇稿件进行了进一步分析。
(一)学位论文重复稿件
学位论文的再发表一直存在争议,但大多数期刊编辑部将学位论文的再发表仅限定于作者本人的学位论文,且署名单位必须是学位授予单位。但在学位论文再发表过程中也存在一些问题。张淑敏等认为,如果学位论文已经超过3年,研究结果的创新性降低[13]。与学位论文重复的稿件在研究设计和主体文字表述上相同,但研究时间点、研究材料与方法及结果数据等核心内容均与学位论文不同,则也要慎重对待[14]。在查看AMLC检测结果时也发现,检测稿件的上传时间比学位论文的上传时间推后1~3年,甚至更长,多数检测稿件的推后时间为2~3年。说明对于本人以学位论文署名单位发表的论文可以考虑进入专家审稿程序,但要注意学位论文的上传时间及主体内容与学位论文的区别。从表2可以看出,重复率≥40%的稿件中与学位论文重复的有33篇,其中有19篇稿件来源于作者本人的学位论文,还有14篇来源于同门的学位论文。对这19篇源自作者本人学位论文的稿件,除8篇署名单位不是学位授予单位做退稿处理外,其余11篇按论文题目、可读性、核心内容及参考文献审查后,有3篇由于可读性差或者研究内容简单给予退稿,有4篇通过专家审稿后发表,使研究成果得到公正评价及传播。
(二)期刊论文重复稿件
由表2可以看出,与期刊论文重复的有12篇稿件,这12篇稿件中10篇稿件的作者来自同一单位或者同一课题组,其中6篇的检测重复率低于50%。由于学科特点相同或者类似,此类论文一般采用相同的写作模式,重复多出现在前言、方法甚至结果部分,说明原因给予退稿处理。与期刊论文重复的12篇稿件中还有4篇部分研究内容重叠,重复率高于50%。如检测稿件“精河流域径流变化特征及其对降水变化的响应”与期刊论文“艾比湖流域径流变化特征分析——以精河为例”部分内容交叉,重复率52.9%,此类稿件一般说明情况也做退稿处理。
(三)其他重复稿件
由表2可以看出,与学位论文和期刊论文均有重复的稿件有4篇,检测重复率接近或者超过50%,论文的前言、方法、结果部分与学位论文和期刊论文交叉重复,对此类稿件直接退稿。与报告重复的有1篇,重复率为61.90%,且试验在2011年11月~2013年4月进行(投稿时间为2016年10月19日),研究的时效性也较差,鉴于以上原因对该稿件也进行了直接退稿。
表2 初审检测中重复率≥40%的50篇稿件重合原因分析
四、结 语
目前在稿件初审检测实践中,对于检测重复率多少即视为学术不端各期刊的规定不同。笔者所在编辑部初审方法是,结合AMLC检测结果,对稿件题目和参考文献等进行比对和判断,再在此基础上快速浏览全文,以给予稿件公正的处理。对于检测重复率不同的稿件采取不同的方法处理:(1)检测重复率<20%的稿件快速阅读后直接送专家审稿;(2)检测重复率20%~40%的稿件则需要慎重对待,通过对比论文题目,快速阅读稿件了解论文的可读性、核心内容及参考文献质量,对可读性差、核心内容简单及参考文献数量和质量差的稿件,结合重复率结果直接退稿,而论文条理清晰、内容充实的稿件则请专家审稿;(3)检测重复率≥40%的稿件则依据重复文献类型区别对待,以学位授予单位发表作者本人的学位论文,在考虑学位论文时效性的同时,可以通过专家审稿来确定是否刊用;对于学科特点相同或者类似且采用相同写作模式的论文,则直接退稿处理;与学位论文和期刊论文同时重复,或者与报告重复,且重复率高的稿件则直接退稿。
近几年,为进一步防止学术不端行为的发生,《西北农林大学学报(自然科学版)》在稿件进入发表流程前会进行二次检测。目前有些期刊也采取了这种措施[2,15]。通过这种方法确实发现了一些因时间差或其他原因导致的二次检测重复率较第一次检测时增加的现象[16],进一步说明发表前再次检测十分必要。《西北农林大学学报(自然科学版)》的二次检测结果亦如此。因此通过送审前检测和发表前检测,不仅杜绝了学术不端文献面世以及可能带来的不良影响,也在一定程度上肃清了科研学术的生态环境,促进科研人员学术作风的自正,更在很大程度上确保了科技期刊发表论文的公正性和质量,为科技期刊的质量提高发挥了一定作用。