医学期刊图表重复的防范策略
2015-03-26王昱苏吴凤鸣
■徐 晶 王昱苏 吴凤鸣 王 林 田 慧 杨 蓉
1)南京医科大学附属口腔医院《口腔医学》杂志编辑部,江苏省南京市汉中路136号 210029
2)南京医科大学,江苏省南京市汉中路140号 210029
1 引言
学术不端是科技期刊需要重点防范的行为之一[1]。目前,很多数据库都开发了以自身数据库作为比照的相似性检测系统,如中国知网以《中国学术文献网络出版总库》为全文比对数据库建立的科技期刊学术不端文献检测系统(AMLC),万方数据库以万方数据的学术文献资源为比对提供的论文相似性检测服务(PSDS),国内的科技期刊大多采用两者之一;也有一些期刊采用国外类似的检测系统,如 Plagiarism、mudropbox、WordCheck、paperpass、TurnItIn、CrossCheck等。相似性检测系统在期刊社的广泛应用,提高了期刊社对学术不端检测的效率,制止了相当一批的不端行为。
值得注意的是,由于此类系统的应用原理被越来越多的作者熟悉,一些不端行为开始“升级”,利用检测系统的局限性,作者对词序加以调整,以躲过系统对相似段落的定义。同时,系统对含有数学公式和图表的PDF和word文件检测有很大的局限性,目前难以有效地对这类数据进行比对判断;含有大量图表的文章在进行检测时,往往与真实结果存在较大差距;极端情况下,一篇由公式和图表组成的论文,AMLC等系统基本是无能为力的[2-3]。
医学论文经常使用图片和表格来表示结果、佐证观点,这些图表到底是作者科研成果的结晶还是“拿来主义”的移花接木,期刊社需要花更多的时间和精力进行甄别,难度很大[4]。
如何对图表真实性进行判定,并对是否抄袭、重复进行判别,是医学期刊编辑的必备技能,但是目前行内对学术不端检测的探讨集中在不同系统的比较及在编辑事件中的应用,缺乏对涉及图表不端问题的专门探讨,编辑对此类问题也是束手无策。本文结合笔者的工作实践,从收稿、编辑初审、同行专家外审角度谈如何发现端倪,并从作者投稿、编辑出版、数据发布角度谈图片版权意识的建立。
2 作者、编辑、数据库在防范图表抄袭不端行为中的作用
无论是作者、编辑还是数据库,在图表重复的防范中都应各司其职,具体见图1。
2.1 投稿时签署著作权转让相关文件并对图片进行加密处理
2.1.1 签署协议,作者自律
期刊社要求作者所在单位出具《介绍信》,并与作者签署《著作权转让授权书》,由作者声明来稿资料真实、无剽窃他人作品及一稿多投的问题,要求作者签字,并加盖单位公章。这在一定程度上对可能的不端行为是一种震慑。
图1 稿件出版流程中的图表重复的防范策略
2.1.2 作者加密图片
对图片加密或者加上水印已经是很平常的技术,这对防止盗图有很好的作用。目前还未发现有国内期刊对纸质出版的图片加上水印,多由于担心加上水印会遮挡图片,影响图片的表达力,版面也不美观。但为了增强版权意识,防止图片盗用,是否考虑在不影响图片内容表达的同时,加上水印,值得商榷。
2.1.3 建立黑名单库
应设立“黑名单”制度,如发现来稿涉嫌抄袭或剽窃,则将作者列入“黑名单”,并通知作者及单位,在一定时间内或者永久拒收列入“黑名单”作者的任何稿件。
2.2 收稿
医学论文的作者既有从事医学科研的研究人员,也有从事临床一线工作的医生,论文发表情况是他们科研产出的主要评价指标,甚至关系其职称晋升。极少部分人员需要论文,但自己因各方面问题不能完成,只能求助“枪手”。“枪手”稿件,多半是东拼西凑而来,不可能是临床积累或者实验室实验得出的结果,没有科学价值,却在如何躲避检测手段方面“颇有心得”。
根据《中华人民共和国著作权法》第17条规定,论文代写人作为著作权人,他有权利接受别人的委托为他人创作作品,对于创作之后,这个作品的署名权以及著作权的归属,还有发表权等相关问题可以通过合同来约定。由于监管的空白,论文的代写代发就有了一定的市场[5]。目前,论文代写代发表业务广告铺天盖地,搜索引擎检索会出现很多相关内容。“枪手”如此活跃,如果稿件均被期刊录用并发表,势必造成期刊质量下滑,抄袭成风。这个问题,需要法律的监管,而期刊也应加强戒备。
一般在收稿阶段,需要对作者信息进行核实,以下情况,编辑应提高警惕。
2.2.1 注意非第一作者或通信作者投稿稿件
在线投稿系统中需要作者注册,收稿时应将注册作者和文章正文中的作者进行比较,可发现是作者本人投稿还是他人代投。同时,在与作者的沟通中也能发现一些非作者操作的端倪。这类代投,有“枪手”操作的可能。期刊社在这类稿件面前要绷紧一根弦,不能放过一篇不合格稿件,也不能误伤了不会操作投稿系统的真正作者。
本刊2012年曾收到一篇稿件,投稿系统中的注册作者并非上传稿件中的作者,搜索注册作者的联系方式,发现在网络上其与代写稿件联系在一起,果断退稿。
2.2.2 注意作者来源单位和个人简历与论文内容不匹配的情况
2.3 编辑初审
初审是科技期刊“三审制”的第一步,一般由编辑负责;初审应根据办刊宗旨、编辑方针和编辑思想对来稿进行初步评价、鉴别和筛选[6]。初审时,要考察稿件是否符合刊物的办刊宗旨和选题方向,学术性、真实性、科学性、创新性如何[7]。其中,考察真实性是主要工作。大部分的期刊在编辑初审步骤进行学术不端检测,应遵循以下细节:
2.3.1 建议统一采用DOC格式上传检测
AMLC系统支持 doc、docx、wps、caj、txt、pdf、nh等多种格式上传待检测原文,刘彦超等曾将同一篇论文分别采用doc、txt、pdf 3种格式进行上传,结果认为系统对于图片、表格的检测能力较差,图片均不参与比对[8];但“文献总字数”、“重合字数”、“总文字复制比”出现差异,原因是在pdf格式文档的检测报告单中,组织结构图、表格及其所包含的文字均自动缺失,不参与比对;在txt格式文档的检测报告单中,组织结构图及其包含文字自动缺失,不参与比对,但原表格中所包含的文字参与比对;在doc格式文档检测报告单中,原组织结构图、原表格中所包含的文字均参与比对。当然,不同格式对检测结果的影响不大,但既然doc能包含图片、表格中的文字进行比对,且期刊社在接收投稿中多数为doc格式,还是建议尽量都采用此格式上传原文,以保持公平。
2.3.2 多种数据库结合使用
不端检测软件主要有CNKI的科技期刊学术不端,很多数据库都开发了以自身数据库作为比照的相似性检测系统,如中国知网以《中国学术文献网络出版总库》为全文比对数据库建立的科技期刊学术不端文献检测系统(AMLC)、万方数据的论文相似性检测服务(PSDS)、维普资讯的论文引用检测系统、武汉大学的ROST反剽窃系统。它们在功能和形式上大同小异,支持的文件类型相近。主要区别在于其基于的数据库收录范围不同导致其比对的内容有差异。鉴于如今与CNKI或万方签署独家合作协议的期刊较多,国内数据库没有一家能收录完整[9],所以没有哪种检测系统能搜全、搜尽所有的数据,检测数据的可靠性大打折扣。中文期刊编辑部如要追求较好的比对效果,最好同时使用多家单位的检测产品。尤其在对论文的内容有怀疑时,多采用一些检测系统,往往能得到更多的检出重复率,有助于编者对不端行为的识别[10-12]。
国外类似的检测系统也有很多。许多著名的出版公司也有基于其数据库比对的系统,但因中文期刊很少被收录,因此这类系统对于中文期刊的检测无能为力。使用英文关键词或主题词在外文数据库检索,可以发现一些不同语言重复发表或抄袭外文文献的情况。
2.3.3 注意已经被提前检测的稿件
我们在检测过程中发现,有些文章上传AMLC以后,会在文章篇名前出现一个红色的三角形符号,中间有一个感叹号,光标移近会提示类似“可能已提前检测,检测时间:2014/8/4 9:06:47,检测结果:64.5%”,这表明此文章在此之前已经被提前检测过。
这种情况有几种原因:一是作者所在单位在投稿前对其进行学术审查;二是作者一稿多投或者先投他刊被拒后再投本刊;三是作者有意通过检测系统调整文章内容后投稿,故意降低文字重复率。
不管是何种原因,我们主张在接受到此类稿件是应关注两个方面:一是文章被提前检测的原因,这一点只能通过与作者的沟通进行判断,此类稿件也最好在正式发表前再次进行检测,以杜绝一稿多投重复发表的时间差;二是应注意提示文字中的检测结果,如果之前的检测结果重复率很高,而收稿时的该值明显降低或者降低到了警戒线以下,要特别留意,作者可能通过文字顺序的调整以及一些图表公式的应用或转换来逃避系统的检测,降低检测敏感性,这给编辑部的检测工作带来了很大难度,但至少说明作者之前的抄袭或剽窃来源于AMLC对应数据库的收录,那么采用主题词或者关键词检索等可以找到相似文献,编辑应对文献进行阅读比较,看其观点、实验方法、技术、结果等是否抄袭。
2.3.4 发挥编辑主观能动性,客观分析检测结果
不管哪个软件,都是客观系统,而在学术不端检测中会有很多的不可控因素,如作者的自引、学位论文和会议论文的再发表、隐蔽不端行为、图表抄袭等,这都需要人工加以判别。
作为医学期刊的编辑,不能只是订一条警戒线,不加细致判别医学论文格式相对统一,专业名词较多,治疗流程、给药方案、实验步骤等相似度较高,在一定程度上会造成方法部分的重复率高[13]。编辑在判定是否抄袭,要分析其重复的段落、比重、原因,区别对待,不加细致判别地只认数据说话。
编辑一方面要有严谨的工作态度,在识别不端行为方面发挥主观能动性;另一方面也要多阅读本行业期刊,了解行业动态;同时也要关注编辑专业期刊,学习编辑同行的经验,在工作中加以应用。
对于论文相似度检测中遇到的有疑问稿件,可将其检测报告标红后一同发给审稿专家进行评议,有助于审稿专家进一步甄别不端行为。
2.4 外审及复审
专家外审和主编复审(终审)在稿件的质量评估方面起到了很重要的作用,他们均在本行业领域拥有扎实的基础知识和(或)高超的临床技能,对于本领域的前沿进展和发展动态非常熟悉,在稿件的科学性、先进性、真实性方面独具慧眼[14]。例如,在本刊的来稿中,有一些就被外审专家指出,论文所述疾病非常罕见,作者所在单位不可能在研究时间内累积如论文所述的病例量,涉嫌学术不端,论文不宜被接纳。而这些论文,在前期的初审和学术不端检测中均未发现不端行为。因此,充分利用同行评议有助于解决学术不端系统的专业局限性,对于发现和杜绝升级版的不端行为有重要的作用[4]。
2.5 编辑加工
通过审稿的稿件,会由编辑整理审稿意见并交还作者修改,编辑在处理同行评议意见、修改文章时建议留意以下内容:
2.5.1 留意图片上的具体信息
医学论文中常出现的CT图片、X线影像图片上都会有医院名称,要将其放大识别并与第一作者和通信作者的单位比对,如不吻合,则有学术不端的嫌疑,在此问题上多加留意,也可以防止出版后可能引起的著作版权纠纷;要注意图片上的各种信息与正文内容是否一致,如细胞种类、观察时间等各类参数,如有不一致,则要多加留意。
2.5.2 留意图片分辨率,要求提供原始资料
较低的照片,可能来源于对他人文献的扫描或者复制,这类图片,作者都无法提供原始高分辨率图片。
对于线条图、柱形图等统计图片以及表格数据,其是否涉及不端行为的判断就更难一些。一般如编辑对数据是否伪造有疑惑时,可请作者提供原始实验资料。查看图片和文件属性也是一种办法,看文件创建时间、修改时间,有无PS注册者的信息都有助于编辑识别图表的原创性和真实性。我们曾在工作中遇到类似稿件请作者提供数据,作者发过来的数据以word或者excel表示,其属性中显示的创建时间就在请作者提供之后,这往往表明作者的原始数据是临时编造出来的,文章的真实性值得怀疑。
2.5.3 留意图题、表题
对于图表较多的论文,编辑应特别注意图题、图注、表题、表注,且对图表的正文说明文字加以留意,在检测过程中如发现这部分重合较多,则需打开被重合原文进行仔细比对。
2.6 出版后处理
从数据库角度来说,对图片加密,使他人不得从下载的pdf或者caj文档上拷贝图片,可以简单有效地防止图片抄袭。可通过“文件”——“属性”——限制从文档中提取内容。
2.7 其他:完善检测账户的规范管理,遵守与检测系统提供方的合同条款
目前,有一部分作者希望其东拼西凑的论文能在投稿前进行检测,好对重复部分进行修饰,降低文字重合率。各编辑部应加强检测系统帐号的管理,只能用于本社来稿发稿的检测,不得帮助他人检测文章而进行技巧性修改后再投稿,更不能随意对外人透露账户和密码,这是助纣为虐,会大大增加编辑同行检测和识别的难度。
中国知网也采取了一系列措施整治这种行为:加强账号管理,全面实行检测系统账号与IP绑定;设置总量限制,严格审核申请检测篇数;加大惩处力度,坚决打击违规使用行为。各期刊社在使用过程中应严格遵守与检测系统提供方的协议内容,维护学术公正[15]。
3 总结
总之,学术不端的防范,是正与邪的较量,任重而道远。有新的检测手段,很快就会出现新的对付办法。学术不端的表现形式越来越隐蔽,图标重复是其中较难鉴别的一种,医学期刊编辑站在反对学术不端的前沿阵地,务必要思想重视,态度严谨,知识更新,行动给力,才能对层出不穷的升级版不端行为有所防范。而处于出版上下游的作者和数据库也应从自己角度,树立图片版权意识,防范自己版权被盗用。
[1]徐晶,王昱苏,杨蓉,等.提倡合理引用,反对学术不端——《口腔医学》应用学术不端检测系统的问题和对策[J].南京医科大学学报:社会科学版,2013,(4):376-378.
[2]杨晨晨.“科技期刊学术不端文献检测系统”在《新疆医科大学学报》审稿中的应用及判断[J].中国科技期刊研究,2012,23(6):1088-1090.
[3]杨晨晨.运用学术不端文献检测系统检测医学论文存在的问题及对策[J].编辑学报,2014,26(1):42-44.
[4]张秀峰,王蔚,段佳,等.数字出版时代科技期刊应对学术不端的防范措施[J].编辑学报,2012,24(5):471-473.
[5]潘霞.委托作品著作权归属及其完善[J].出版发行,2014(7):76-78.
[6]鲁亚琳,陈红.初审和定稿——编辑不可不为的2个环节[J].编辑学报,2006,18(2):111-113.
[7]李林.科技期刊编辑初审工作四步法[J].中国科技期刊研究,2011,22(5):795-796.
[8]刘彦超.学术期刊应用学术不端文献检测系统相关问题探讨[J].武警学院学报,2013,29(7):85-89.
[9]贺晋瑜,杜学梅,李敏生,等.科技期刊学术不端文献检测系统应用探讨[J].中国科技期刊研究,2013,24(4):777-779.
[10]王宇.升级版的造假——反检测手段的浅析[J].湖北第二师范学院学报,2012(11):133-135.
[11]张旻浩,高国龙,钱俊龙.国内外学术不端文献检测系统平台的比较研究[J].中国科技期刊研究,2011,22(4):514-521.
[12]倪爱香.学术期刊编辑对学术不端行为的防范策略[J].中国科技期刊研究,2013,24(3):586-588.
[13]杨柱星,林荣慧,胡榜利.医学论文学术不端的特点及判定[J].中国科技期刊研究,2011,22(5):697-701.
[14]聂兰英,王钢,金丹,等.论科技期刊审稿专家队伍的建设[J].编辑学报,2008,20(3):241-242.
[15]CNKI科研诚信管理系统研究中心.关于“学术不端文献检测系统”使用的声明[EB/OL].,2014-09-28.http://check.cnki.net/amlc2/shengming.htm.