英文科技期刊论文图片学术不端审读方法探索与思考
2022-06-21叶青
叶 青
浙江大学出版社《浙江大学学报(英文版)》编辑部,浙江省杭州市西湖区天目山路148号 310028
近年来,国际上大规模撤稿事件频发,每一幅造假图片的曝光,都会在网络上引起激烈的讨论,并受到舆论谴责,这不仅对科研环境,也对社会风气造成了恶劣的影响。科技期刊作为科研论文的重要载体,是科研成果展示和传播最主要的平台,有责任也有义务确保其刊载论文的真实性和科学性。但随着科技论文的电子化、网络化,图片数据的获取变得更加容易,同时,图片编辑和修饰软件的快速发展和日益成熟,使得对图片不当使用和修改变得更为隐蔽,相应的检测也变得更为困难。而现有的针对文本相似度的检测系统,在图片问题上依旧束手无策。美国国立卫生研究院研究诚信办公室(Office of Research Integrity, ORI)的报告中提到[1],1995年有5.7%的学术不端案件涉及图像问题,然而到2005年,这一数据已经上升到了44.1%。2016年,Bik等[2]开展了一项针对生物医学论文的调查,通过对40种期刊20621篇论文的人工检查,发现约有3.8%的论文存在图像的问题,其中至少有一半的图像存在人为故意修改的嫌疑。值得注意的是,这一结果仅仅针对图像不恰当使用这一种形式,图片问题整体上则应该更为严重。
国际上大部分的英文科技期刊对于论文中图片相关的学术不端行为的检测,目前主要还是依赖于评审专家和同行学者的发现和举报。然而,大部分的举报是发生在论文正式发表之后,即使期刊编辑部能及时做出回应和妥善处理,学术不端行为导致的一系列不良后果已经酿成,对刊发论文的期刊以及论文作者自身学术声誉造成了不可逆的损害。Martin和Blatt[3]通过对JournalofCellBiology进行调查,发现其录用的论文中依旧有10%存在对图像数据的不当操作。因此,国外有不少期刊针对图片问题在编辑部初审阶段就专门增加了图片检测的环节,甚至还设立了专门进行图片检测的岗位[4]。
近年来,我国期刊也开始重视图片学术不端的问题,笔者在前期研究中明确了图片剽窃、图片伪造和图片篡改这三大类图片学术不端类型,并提出了相应的应对策略[5]。张维等[6]对《第三军医大学学报》来稿中图片相关的学术不端案例进行了辨析,并制定了生物医学期刊图片处理规范。陈秀妍等[7]调研了PubPeer网站和相关文献中的真实案例,总结了图表数据学术不端的类型和表现特征,并提出对应的甄别和防范措施。而对于具体的图片学术不端检测方法在期刊编辑部日常工作中的实践及判断标准的讨论,则少有研究提及。针对图片学术不端问题的界定和处理,国际出版界主要参考ORI、国际出版伦理委员会(Committee on Publication Ethics,COPE)、科学编辑委员会(Council of Science Editors,CSE)[8]、威立(Wiley)[9]和爱思唯尔(Elsevier)[10]的相关政策或准则。虽然以上单位或组织对图片学术不端问题进行了详细阐述,但是其中适用于我国期刊的图片学术不端检测和判断的方法,需要进行进一步实践和整理。
针对图片剽窃,若仅仅依靠人工进行识别,由于被剽窃的对象很难锚定,对检测人员的学科背景要求较高,目前主要依靠同行评审和小同行读者举报,而一些图片剽窃检测软件还处于研发和试用阶段,尚未达到正式使用的水平[11-13]。相对而言,图片篡改和伪造会对图片本身进行不同程度的修饰处理,这就会留下一些蛛丝马迹,因此本研究以图片不当处理的检测为切入口,实践比较了不同图片检测方法的优缺点,并制定了图片不当处理的判断分级标准,以期为科技期刊编辑人员在图片学术不端审读环节提供借鉴,从而规范科技期刊论文图片的正确处理和合理使用。
1 研究方法与对象
1.1 研究方法及工具
本研究的起始阶段,主要以案例分析和文献研究为基础,结合实际工作经验,初步制定图片学术不端的检测方法。在后续的检测方法有效性验证和工作流程完善阶段,主要针对图片不当处理的检测,采用人眼识别和计算机软件辅助识别相结合的方式进行。所涉及的计算机辅助识别工具包括:(1) 计算机软件Photoshop CC 20.0.1;(2) ORI开发的Droplets工具包(https://ori.hhs.gov/droplets);(3) Forensicallyβeta在线检测工具(https://29a.ch/photo-forensics/#clone-detection)。
1.2 研究对象
在案例搜集整理阶段,主要检索分析Retraction Watch数据库网站(http://retractiondatabase.org)和PubPeer网站(https://pubpeer.com)中图片相关的典型案例。在图片检测方法的试用阶段,检测了浙江大学出版社的1种生物医学SCI英文期刊的近期投稿,总计250篇论文。在图片检测方法的验证阶段,检测了国内3种生物医学SCI英文科技期刊2020年发表的453篇论文。本研究检测的图片类型主要包括电泳凝胶图、免疫印迹图、流式细胞图、显微镜观察图等。
1.3 图片不当处理的审读依据
本研究依据国际出版界广泛接受和认可的图片处理规范及指南,包括CSE发布的《科技期刊出版伦理白皮书》[7]、威立发布的《科研诚信与出版伦理最佳实践指南》[8],以及爱思唯尔发布的《研究与出版伦理手册》[9]。通过对相关内容进行翻译、汇总和整理,制定了以下6条科技论文图片处理规范,作为本研究审读工作的判断依据。
(1) 允许对整幅图片进行亮度、对比度或颜色平衡的调整,但是这些调整不可以掩盖、消除或歪曲原图中的任何信息。
(2) 不允许对图片中的特定区域(或某个特征属性)单独进行增强、掩盖、移动、删除或添加。
(3) 应避免对图片进行过度修饰,例如以牺牲其他区域为代价来强调图像中的一个区域(这类似于篡改实验数据)。若必须对图片进行非线性调整或删除部分信息,则应该在图注(或正文)中公开所有操作记录。
(4) 应避免将从不同的凝胶、电场、曝光或实验条件下获得的图像放在一张图中。若必须对图片进行合成(拼合),则应该在各组成图片之间添加明显的分割线,并在图注(或正文)中进行文字说明。
(5) 应避免在不同的图片中重复使用相同的图片(如对照),如果重复使用的图片为相同实验条件下获得的,则应该在图注(或正文)中进行文字说明。
(6) 作者有义务保存论文中所有图片的原始图像和数据,同时需要记录修改图片的所有操作。
2 结果和讨论
2.1 图片不当处理检测工具的使用情况
针对图片不当处理的检测,本研究使用了Photoshop、Droplets及Forensically这3种计算机辅助识别工具。Droplets工具包作为Photoshop软件的一个插件合集,需要依赖于计算机本地软件Photoshop才能正常使用,该工具包有丰富的功能可以下载使用,本研究主要用到的有Features in dark or light areas(主要用于电泳凝胶图和免疫印迹图的检测)、Forensic-Gr Map(主要用于流式细胞图和显微镜观察图的检测)、Advanced Overlay-Adjustment Layers(主要用于疑似图片重复使用的检测)。通过工具包提供的一系列操作可以直观地展示图片中的可疑操作痕迹,但是不能实现自动化操作,而且需要操作者具有一定的学科背景和软件操作技能[5]。Forensically是一套免费的在线数字图像取证工具,它具备克隆检测(Clone Detection)、误差水平分析(Error Level Analysis)、亮度梯度(Luminance Gradient)、主成分分析(Principal Component Analysis)、元数据提取(Meta Data)等功能。与Droplets相比,Forensically在处理少量图片时具有优势,其不需要借助其他计算机软件运行,只需要计算机可以上网即可访问运行,操作也相对简单;特别是克隆检测功能,可以快速有效地识别图片中重复使用的区域。但是,当需要检测大量图片时,考虑到网页上传速度的限制,使用本地化的Droplets工具包更为快捷。此外,Forensically使用的便捷性也势必会在功能上有所限制,对于图片细节的检测,Droplets则更胜一筹。
2.2 图片不当处理检测方法的实践与完善
对于初步建立的图片不当处理检测方法,首先在编辑部内部的期刊初审阶段进行试用,熟悉常见的图片学术不端类型,掌握图片检测工具的使用方法,从而对检测方法的有效性进行验证。通过对250篇来自浙江大学出版社的1种生物医学SCI英文期刊的投稿图片进行初审检测,发现有8篇稿件(3.2%)存在疑似图片不当处理,怀疑这些稿件存在潜在学术不端行为。常见的图片不当操作包括电泳条带拼接、图片重复使用、背景过度修饰等。通过与作者的沟通,有一位作者给予了合理的解释,在替换正确图片并补充文字说明后顺利进入审稿环节;其余7篇稿件的作者承认对图片进行了不当处理。同时发现,单人检测的漏检率较高,建议两人次以上进行复审,但考虑到编辑部初审工作繁重,建议复审编辑只针对初审通过的稿件进行图片检测,可显著减少无效工作时间。
在图片不当处理检测方法的验证阶段,共选取3种国内英文期刊2020年度发表论文的图片进行检测,以此来验证所建立的图片检测方法的有效性,并形成具有操作意义的修改意见。该阶段的工作涵盖了3种所选期刊2020年正式出版论文正文中出现的所有图片,涉及图片1601幅。第一轮检测发现11篇论文存在疑似图片不当处理,涉及图片16幅。这16幅图片主要为电泳凝胶图、蛋白质印迹图及显微照片,疑似存在以下几种问题:图片拼接、图片篡改、图片过度修饰及图片重复使用。由于第一轮检测所采用的图片均从正式发表论文的pdf文件中提取,部分期刊存在图片被压缩后分辨率降低的情况,影响了检测判断。因此,第一轮检测得到的所有疑似图片的检测结果和分析均反馈给相应期刊的编辑部,在收到重新提供的原图或作者的解释回复后进行复检和验证,进一步完善图片检测的具体判断标准和操作规范。其中有5篇论文的作者提出异议,并给出合理解释。经复审核实,排除了初审发现的所有案例中存在主观上误导读者的图片造假的可能,但是按照国际出版伦理规范的要求,还有6篇论文中的9幅图片存在疑似图片处理不规范行为,占检测论文总数的1.3%。这9幅图片存在疑似图片拼接、图片不成比例拉伸或图片过度修饰的问题,根据表1所示的图片不当处理等级,主要集中在1~2级。
2.3 图片不当处理的判断标准
鉴于图片伪造和图片篡改类型的复杂性和多样性,在参考EMBO杂志社[14-15]对图片畸变的3级标准的基础上,对图片不当处理的类型进行汇总和梳理,根据主观上是否存在造假的意图以及客观上处理后的图片是否改变图片内容的展示(破坏图片的完整性)、是否影响实验图片的结论、能否提供原始数据、能否重现图片处理的过程,将图片不当处理重新定义为4级(表1)。图片不当处理的等级为1~2级,如果论文已经发表,一般进行勘误即可纠正错误;达到3级及以上,就会面临撤稿风险;而达到4级,则会被认为存在学术不端的行为。
表1 图片不当处理的4个等级
3 思考与建议
根据本研究对图片不当处理的检测实践,以下几点经验可供期刊编辑部及期刊主管部门参考。
3.1 期刊编辑部应提高对图片不当处理的重视
(1) 通过使用本研究建立的图片检测方法,在初审试用阶段和年审验证阶段分别发现有3.2%和1.3%的论文存在图片不当处理的行为。建议期刊编辑部制定针对图片不当处理的检测机制,将图片学术不端检测的环节加入到各编辑部的日常工作流程中,无论是在初审阶段还是在论文的年度自检阶段,都能在一定程度上有效遏制学术不端行为的发生。尤其是在初审阶段,投入的时间相对较少,并且在论文发表之前处理学术不端事件,期刊往往能占据主动,免于陷入撤稿事件等不利局面。
(2) 本研究发现,不同计算机软件在处理不同类型图片时效果存在差异,检测人员由于学科背景不同及对检测软件的熟悉程度不同,判断也会有一定差异。建议期刊编辑部加大对图片学术不端检测工作的人员投入,加强对图片学术不端检测人员的培训,掌握1~2种计算机辅助检测工具的使用;邀请相关学科的编辑人员或学者加入,形成更为广泛的检测队伍;积极向学科专家征求意见,与期刊同行定期开展经验交流,切实有效地提高期刊编辑部的图片检测水平。
(3) 本研究针对图片不当处理划分的4个等级,可以为编辑部在处理图片相关的学术不端行为时提供判断依据和参考。同时,建议期刊编辑平时关注国际知名网站(Retraction Watch、PubPeer等)最新公布的图片学术不端案例,熟悉图片学术不端案例的新形式,学习国际知名出版单位在图片学术不端问题上的处理态度和工作经验,从而丰富图片不当处理等级的典型特征,有效提高日常编辑检测工作的效率。
3.2 期刊编辑部应加强对作者关于正确处理图片的引导
(1) 本研究发现,大部分图片不当处理稿件的不当处理等级为1~2级,尚未达到学术不端的标准,究其原因,主要还是作者对正确处理图片的规范不够了解。编辑部可以通过投稿须知,将正确处理图片的规范及不当处理图片的类型告知作者,根据投稿阶段的图片检测结果,针对有疑问的图片处理与作者进行沟通,规范处理发表后存在图片不当处理的论文(发表勘误、撤稿或表达关注等),这都能对作者群体起到良好的教育和警示作用。
(2) 高质量图片是顺利完成检测的前提,分辨率偏低的图片会给检测工作带来困难,增加检测判断的误判率。建议期刊编辑部在作者投稿或者校稿阶段,要求作者提供论文中所有图片的原始文件,包括未修改的原始文件,有条件的期刊可以进一步要求作者提供所有图片修改处理所使用的软件信息,以及具体的修改步骤[16],达到原始图片可以重复性展示最终论文图片的效果,以便在论文产生怀疑时,可以第一时间提供验证与检测。
3.3 期刊主管部门应注重对期刊学术伦理的建设
现有的期刊审读工作重点是对期刊内容质量、编校质量、印制质量和出版形式质量进行审读。对图片的审读主要涉及图的序号差错、图的位置差错,以及图的内容和说明文字不符。而对于图片中可能存在的学术不端问题的审读,缺少明确的规范和具体的标准。同时,目前我国在国家及行业层面也缺少对图片学术不端检测的统一标准,而图片学术不端行为的类型多样且复杂,这导致检测标准在不同行业、不同单位、不同人员之间存在差异,不利于图片学术不端行为的有效识别和统一判断。此外,图片不当处理的检测工作量相对较大,对检测人员的学科背景及检测技术的要求较高,许多期刊还未有能力独立开展图片不当处理的检测。建议期刊主管部门根据不同期刊的学科特色,组织相关领域的专家成立针对图片学术不端问题的检测团队,为期刊编辑部提供有力的技术指导和支撑。此外,建议主管部门率先制定相应的图片处理规范与指南,以及图片检测的标准与细则,从管理层面加强对期刊伦理建设的引导,从而有效遏制学术不端的滋长,净化科研环境。
4 结语
本研究通过对图片不当处理检测工具的实践使用,并通过对期刊日常工作的不同阶段的效果验证,制定了图片不当处理的分级标准,为进一步制定和优化我国科技期刊图片学术不端的审读规范和标准提供参考。本研究针对的图片不当处理问题主要涉及图片篡改和伪造两大类型,未对图片剽窃问题进行探讨。目前国外已经有多家出版商开始试用图片相似度检测软件,用于分析论文中是否存在图片重复使用或者比较多篇论文之间的图片相似度[13],这给我们未来的图片学术不端检测带来了一缕曙光。
致谢感谢浙江农林大学何珂博士和浙江大学单颖博士在图片不当处理检测过程中提供的建议和帮助。