《放射学实践》应用AM LC检测已发表论文结果分析及应对策略
2016-03-24夏黎明艾文霞
■石 鹤 夏黎明 汪 晓 杨 岷 明 桥 艾文霞
华中科技大学同济医学院附属同济医院《放射学实践》编辑部,武汉市解放大道1095号 430030
科技期刊学术不端文献检测系统(AMLC)是由CNKI开发的、以中国学术文献网络出版总库为全文比对数据库,对文献进行检测,判断其是否存在学术不端行为的智能系统[1]。《放射学实践》(以下简称本刊)杂志于2011年正式开始使用AMLC,迄今已检测3500余篇稿件,已有100余篇论文被检测后认定为不端论文而退稿,有效遏制了抄袭、剽窃、重复发表等学术不端行为,在预防和打击学术不端行为方面发挥了重要作用。现在国内大部分期刊已经采用AMLC对作者投稿进行检测,有关AMLC的应用等方面已有多篇论文发表,对AMLC的应用价值、存在的问题及应该采取的对策等方面进行了深入探讨[2-6],如杨晨晨[2]认为 AMLC存在不能有效地检测图表和公式等的重复性、不能有效地识别稍加变动的多源性抄袭等问题;秦小川[6]认为AMLC并不能真正地达到人工智能,编辑日常工作中不能完全依赖AMLC的检测结果,应进行综合分析。笔者发现此前发表的文献都是对作者投稿的文章(未发表论文)进行检测,尚未发现有对已经发表的论文进行检测的相关文献。与未发表论文不同的是,已经发表的论文在发表之前均经过检测(本刊论文发表之前需经过两次检测),而经过检测而最终得以发表的不端论文,其学术不端的行为、方式更为隐蔽,更难以被系统和编辑识别,对此类论文的学术不端行为和方式进行回顾性分析,能更好地掌握其特征,积累检测经验。本文对本刊2015年已经发表的301篇论文利用AMLC进行检测,对检测结果进行深入分析,并对不端论文发表之前的检测过程进行追踪、溯源,总结漏检的不端论文的特征,为提高检测效果、效率提供借鉴和参考。
1 研究方法
1.1 检测对象及方法
1.2 不端论文判断方法及标准
根据文献不端检测系统的判定标准以及相关文献的研究结论[2-7],将文字重合度≥40%作为初步筛选不端论文的标准较为合适,为了最大程度检出不端论文,本研究将文字重合度≥20%或最大单篇文献文字重合度≥10%(满足其中任意一个条件即可)作为初步筛选不端论文的标准,同时对每篇被检论文的检测结果进行分析,对文字重合度<20%且最大单篇文献文字重合度<10%的被检论文,重点分析论文结果部分。本研究只是将文字重合度和最大单篇文献文字重合度作为参考指标和筛选条件,具体结论通过笔者综合比对、分析得出。
关于博硕士论文,如果博硕士论文的第一作者(或通讯作者)将内容整理后再以第一作者在期刊上发表,笔者遵守国内的惯用方法,认定为非不端论文,如果博硕士论文的其他作者再将其整理后以第一作者在期刊上发表,则认定为不端论文[6,7]。
2 研究结果
301篇被检论文中,文字重合度≤20%的有241篇,占所有被检论文的80.1%,20% <文字重合度<40%的有48篇,占所有被检论文的15.9%,文字重合度≥40%的有12篇,占所有被检论文的4.0%;最大单篇文献文字重合度≥10%的论文有69篇,占所有被检论文的22.9%。经笔者综合比对、分析,有6篇被认定为不端论文,占所有被检论文的2.0%。
301篇被检论文中,有6篇被认定为不端论文,这6篇不端论文的相关检测数据见表1。从表1可以看出,有3篇论文的文字重合度≥40%,6篇论文的最大单篇文献文字重合度均≥10%。对6篇不端论文的检测过程进行追踪、溯源,发现论文发表之前进行的两次文献不端检测中,6篇论文的文字重合度均<40%,其中2篇论文的文字重合度≥20%且最大单篇文献文字重合度≥10%。6篇论文中5篇的发表时间与被抄袭文献的发表时间接近(不超过3个月)。
表1 6篇被认定为不端论文的检测数据
3 结果分析和讨论
3.1 不端论文的鉴定标准
CNKI每年都会发布“已刊发论文学术不端分析表”,公布严重疑似学术不端文献,其中,严重疑似学术不端文献包括:①本文与发表在前的且本文未标明引用的其他文献的文字重合度大于40%;②一稿多发稿件中第一次发表以后重复发表的稿件,包括同一作者改动已经发表的文献再次投稿发表的文章,其改动部分少于10%。笔者认为仅通过以上标准,无法判定是否为不端文献。本研究结果显示,301篇被检论文中有12篇文字重合度大于40%,其中仅3篇为不端论文,因此仅将文字重合度大于40%作为鉴定标准值得商榷,最终的鉴定结论应该通过仔细比对、综合分析得出。本研究将文字重合度≥20%或最大单篇文献文字重合度≥10%(满足其中任意一个条件即可)作为初步筛选不端论文的标准,同时对每篇被检测论文的检测结果均进行分析,这样做是为了最大程度避免漏检不端论文。
3.2 已发表的不端论文的特征
3.2.1 不端论文与被抄袭文献发表时间接近
本研究显示6篇不端论文中5篇与被抄袭文献的发表时间比较接近,发表时间间隔在3个月以内。
3.2.2 对论文进行修改,以躲避系统的检测
此类论文在本研究中包括以下两种情况:①对论文的核心部分,即结果部分进行修改。本研究发现有1篇论文将结果部分的表格描述改为文字描述,由于文献不端检测系统对图表不能进行有效地检测[2,8],所以躲过了系统的检测;②现在有的作者通过各种途径在投稿前对文章进行检测,如果发现文字重合度较高,就进行人为的修改,这些修改大多是通过改变用词、调整顺序等方式,并不会对论文的观点和结论造成影响,但可以躲避系统的检测。
3.2.3 不端论文与被抄袭文献存在作者重合,作者为同一单位
本研究显示6篇中4篇不端论文与被抄袭文献的作者单位一致,同时存在作者重合,4篇中2篇第一作者相同,另外2篇第一作者不同,但存在作者重合。
3.3 发表前不端检测未检出不端论文的原因分析
对6篇不端论文的检测数据进行分析,并对发表之前的检测结果进行追踪、溯源,发现6篇论文发表之前的两次检测中文字重合度均在40%以内,其中1篇文字重合度两次检测均为0。同时,稿件追踪系统也未提示异常。6篇不端论文在发表前的不端检测中未被检出的原因,包括非人为漏检和人为漏检两种情况:①非人为漏检。6篇中4篇为非人为漏检,漏检的原因是论文发表之前的两次检测中对比数据库中未出现被抄袭文献;②人为漏检。6篇中2篇为人为漏检,其中1篇为作者对结果部分的描述进行了改动,将表格方式的描述改成了文字描述,同时文字重合度较低,未引起检测编辑的注意;另外1篇为综述论文,进行检测的编辑未仔细与被抄袭文献进行比对,同时文字重合度不是很高,从而造成了漏检。虽然综述论文本身就是引用别人的观点,但综述论文也有主题思路,如果与被比对文献在主题、引用文献方面基本相同,也应该被认定为不端论文,因此对综述论文的检测不能疏忽。
4 应对策略
学术期刊一旦发现已发表的论文涉及学术不端行为,决不遮掩,应该采取有力措施予以处理。可在期刊及网络上公开声明,对情节严重的学术不端行为进行充分曝光,将情况通报作者单位,惩治相关责任者,维护学术论文的严肃性[9]。除了对已经发表的不端论文的作者进行惩戒之外,更重要的是采取哪些措施能避免或减少漏检的不端论文,根据本研究的结论,笔者认为采取以下措施能起到不错的效果。
4.1 保证出刊前进行最后一次检测
现阶段大多数期刊只在稿件初审之前进行检测,并未进行多次检测。除了初审检测外,期刊有必要进行刊出前的再次检测,初审检测结合刊出前检测的做法值得提倡[10]。部分期刊也采取多次检测的方法,最后一次检测是在收取版面费之前,由于期刊收取版面费后还要进入等待发表的过程,这个时间也成了一个检测的盲区。采用此检测方法是考虑到如果在收取版面费后、出刊前检测为不端论文,容易就版面费的退费问题与作者产生矛盾。本刊对每篇来稿均进行两次检测,第一次检测的时间是作者投稿之后、初审之前,第二次检测是在所有审稿通过之后、收取版面费之前。但经笔者统计,本刊自使用文献不端检测系统以来,每年未通过检测而退稿的文章不少于10篇(2015年为21篇),虽然本刊在检测不端论文方面花费了大量精力,也采取了很多卓有成效的措施,但每年仍然有为数不少的不端论文发表,笔者分析其原因,可能与第二次检测距论文发表的时间较长有关,本刊论文从收取版面费到正式发表一般需要4个月以上,这段时间也成为了一个检测的盲区,因此本刊的第二次检测时间定为论文发表前而不是收取版面费之前显得很有必要,一旦论文发表前检测为不端论文,应坚决退稿,坚定打击学术不端行为的决心。
4.2 相关数据库应该加快文献的更新速度
论文印制成纸质版发表后或在论文发表的同时,刊社将论文的电子版上传至数据库,数据库要对论文进行一定的汇编处理,导致中国学术文献网络出版总库中的论文有一定的滞后性(现在为2个月),公开发表但尚未被总库收录的论文,该系统无法检测[2,3],因此会造成检测结果的不真实性。如果有不端论文的检测时间处于其对应的被抄袭文献公开发表之后但尚未被总库收录这个时间段内,该篇不端论文将会被漏检。如果能缩短从公开发表到被总库收录的时间,则能减小因为数据更新不及时而造成的影响。
4.3 呼吁更多期刊采用文献不端检测系统中的“稿件追踪”功能
目前,中国知网的“文献不端检测系统”新增了“稿件追踪”功能,编辑利用“稿件追踪”功能可以清楚地查到每一篇稿件的投稿历史,从而避免一稿多投及一稿多投导致的重复发表。同时,“稿件追踪”功能可以查看投稿论文的检测时间[11],可以为编辑判断此篇论文是否是作者经过检测后进行人为修改提供参考。虽然本刊也加入了稿件追踪平台,可以对稿件的投稿及检测情况进行追踪,但稿件追踪平台发挥的作用有限,几乎没有不端论文被监测到,因为目前加入稿件追踪平台的期刊较少,为编辑了解稿件投稿历史增加了难度,因此,呼吁更多的期刊加入稿件追踪平台,这样更容易判断一篇被多次检测的稿件到底是作者自己检测还是被已投的编辑部检测,从而为在技术上防范一稿多投、一稿多发提供了保障。
5 结语
AMLC是抵制科技期刊学术不端行为的有力工具,对不端论文的检出有重要作用,但不是所有不端论文都能被检测出来,为了减少漏检情况的发生,笔者认为做好以下三点最为重要:①检测者采取正确的检测策略,更加仔细地对可疑论文进行比对,其中最重要的是坚持在出刊前进行最后的检测;②AMLC及时更新对比数据库;③呼吁更多的期刊采用“稿件追踪”功能,让一稿多投无处藏身。笔者相信,只要做好以上三点,更多的学术不端论文将被检出,AMLC对学术不端论文的漏检也会大幅减少。
[1]CNKI科研诚信管理系统研究中心.学术不端文献检索系统手册.http://check.cnki.net.
[2]杨晨晨.运用学术不端文献检测系统检测医学论文存在的问题及对策[J].编辑学报,2014,26(1):42-44.
[3]康银花.药学论文学术不端的表现及责任编辑的应对策略[J].中国科技期刊研究,2012,23(4):676-678.
[4]贺晋瑜,杜学梅,李敏生,等.科技期刊学术不端文献检测系统应用探讨[J].中国科技期刊研究,2013,24(4):777-779.
[5]石鹤,明桥,夏黎明,等.对正确使用学术不端文献检测系统的探讨[J].湖北第二师范学院学报,2011,28(8):80-82.
[6]秦小川.《中医学报》应用AMLC检测结果分析和体会[J].中国科技期刊研究,2013,24(6):1122-1125.
[7]郑雨田.未发表文章与已发表文章内容重合度分析——以医学文章为例[J].中国科技期刊研究,2011,22(6):894-897.
[8]陆宜新.学术不端检测中的隐性重复现象分析[J].中国科技期刊研究,2015,26(6):552-555.
[9]魏秀菊,王柳,赵光磊.学术期刊办刊中防范学术不端行为的实践及启示——以《农业工程学报》为例[J].中国科技期刊研究,2008,19(4):632-636.
[10]王曼.医学期刊修回稿再次学术不端文献检测的必要性分析[J].编辑学报,2013,25(2):146-147.
[11]王继红,邓群,肖爱华.利用“稿件追踪”系统高效识别一稿多投[J].科技传播,2015,7(9):156-157.