中国学者图像学术不端撤稿情况分析
——基于撤稿观察数据库
2023-10-30徐奇智
■徐奇智 范 晴
1)中国科学技术大学科技传播系,安徽省合肥市金寨路96号 230026 2)科学教育与传播安徽省哲学与社会科学重点实验室,安徽省合肥市金寨路96号 230026
近年来,经过数字图像技术修改的图像成为学术不端的重灾区,并呈逐年上升趋势。到2021年初,科学图像学术不端(Academic Misconduct in Scientific Images,AMSI)已经高居论文被撤销原因之首[1-2],并在我国频频引发舆情。科技部对Elizabeth Bik和饶毅举报多名院士和学者涉嫌AMSI的事件进行调查,给出的结论为“图片误用”,而非“图片造假”,从而引发网络舆情质疑。虽然该调查报告将“重复使用图片”认定为“图片误用”,但国际期刊对类似行为采取了更严厉的处罚。同年10月,《DNA与细胞生物学》期刊将张文宏医生为通信作者的一篇论文撤稿,理由为“重复使用图片”,即使第一作者已经增补了最新的实验图片。两相对比,舆情再次质疑我国学术道德标准偏低,严重损害了我国学者的学术形象,因此对其现状与趋势进行研究已经刻不容缓。
AMSI高发可显见的原因在于科学图像在科学论证中的核心地位以及数字图像技术的出现。对4个世纪的科学论文的定量研究显示,科学图像作为证据逐渐成为科学论文的核心元素,“语言和视觉的互动……构成了20世纪末科学论证实践的核心”[3]。随着数字图像技术的出现和广泛应用,学术行为不端的目标瞄准论证价值巨大的科学图像。数字图像技术能够提供按照主观意愿修改的非标准过程,并且处理后的图像由于数据复杂,识别和检测图像操作痕迹的难度较大,这为图像学术不端行为提供了“便利”。更多主观意愿介入图像产生过程的可能性,使得发现和防止图像学术不端行为充满挑战。
为了应对这一挑战,AMSI逐渐成为相关领域的研究热点,学术界对此进行了大量研究,特别是科技期刊的防范策略[1, 4]、数字图像操作识别技术[5-6]、科学图像伦理准则[7-10]等。Cromey[7]讨论并尝试制定了学术共同体内部的科学图像伦理准则。Nature期刊报道了美国雪城大学研究员Acuna博士带领的研究小组成功研发的一款论文图片查重软件[11],并将其作为防范AMSI的重要工具。学术界还出现了专业的“学术侦探”,最著名的学者包括Bik等,他们发表了相当数量的AMSI调查论文[12]。我国相关学者和机构也在此方面进行了研究:孙力炜等[6]主要研究了科技期刊的防范策略;任艳青等[13]从被撤销论文的责任主体、责任客体及主要原因3个维度进行了讨论,他们认为图像、数据、同行评议等方面的学术不端行为呈现出新的特征;叶青[14]收集和梳理了撤稿观察数据库(Retraction Watch Database,RWD)中与图片相关的撤稿记录,并针对图片的伪造、篡改、剽窃等问题提出了应对策略;段姚尧等[4]针对医学论文图片的真实性进行了讨论。很多学术期刊也针对科学图像提出了专门的学术规范,并且专文报道与科学图像学术规范相关的重要事件。
通过对领域内过去的相关研究进行总结,发现大多研究都对防范AMSI采取了“堵”的态度。但是,“堵”并非唯一的治理手段,为避免陷入“道高一尺,魔高一丈”的无尽循环,“疏”同样重要。为寻找“疏”的途径,需要先定位AMSI行为的最重要源头及其动机,再采取相应的有效举措。国外研究者对中国的相关行为缺乏针对性的深入分析,未能找出中国学者图像学术不端行为的独特特征,对于中国AMSI行为的疏导并无太多助益。本研究尝试使用RWD并结合中国科学院文献情报中心期刊分区数据库,检索收集国际期刊因AMSI撤销我国学者论文的信息,对期刊类型/等级、地域、单位等维度进行分析,找出中国学者在图像学术不端行为上的特征,探讨中国学者图像造假的源动力。与被动的“堵”不同,本研究的思路是寻找源头上的疏通路径,通过减少不端行为的发生,坚固期刊所建立的防线。
1 研究方法
1.1 数据来源
调查数据来自RWD[15]。撤稿观察(Retraction Watch)是一家关注学术不端并专门报道撤稿情况的博客,由学者Adam Marcus和Ivan Oransky于2010年创建,并于2018年将公开报道的撤稿事件搜集整理形成数据库并在线发布。RWD每日更新,最早可追溯到1756年发表的论文(因图像原因而撤稿的论文最早为1979年发表的论文),是目前同类数据库中最全面、规模最大的撤稿数据库,被众多学术不端行为研究者使用。
1.2 数据筛选
本研究在RWD中以image作为撤稿原因[Reason(s) for Retraction]的检索关键字进行搜索,获得5790条有关AMSI的记录,占全部43602条记录的13.28%(截至2023年4月20日0时)。随后使用爬虫工具获取了相关数据并存入MySQL数据库,按照如下步骤进行筛选:
(1)剔除非研究性论文。按照分类获得研究性论文5572篇,其他类型(包括临床观察、案例报告、媒体新闻等)218篇。
(2)筛选出撤稿数据。对于涉及AMSI的研究性论文共有4类处理结果(撤稿、更正、关切、其他),其中被撤稿论文共4581篇。
(3)确认论文归属国。因RWD论文归属国存在不准确的数据,部分第一作者国籍和单位归属国均不属于中国的论文也被归为中国论文,因此按照第一作者国籍筛选出归属国为中国的论文(以下简称“中国论文”),共得到2530篇撤稿论文。
在数据筛选过程中发现,中外数据存在显著差异(χ2=204.46、P<0.001)。如果存在AMSI,对中国论文的处理结果较少更正和关切,更多的是撤稿。在全部5572篇研究论文中,中国论文的占比为 51.08%,在处理结果为“撤稿”的论文中,中国论文的占比上升至55.23%(表1)。
表1 科学图像不端行为处理结果
1.3 数据编码与分析方法
在完成数据筛选后,本研究对部分字段进行了人工编码,编码规则详见表2。采用SPSS 26和Excel等工具对所得编码数据进行描述性统计、卡方检验、t检验等分析。
表2 人工编码字段定义及编码规则
2 结果与分析
2.1 中外趋势对比分析
根据RWD对AMSI的分类进行分析,发现中外作者的不端行为类别存在显著差异(χ2=428.33、P<0.001)。如表3所示:中国作者主要涉及的图像不端行为是图片复制和图片争议,且此类行为显著多于国外作者;国外作者在伪造图片、图片操纵等有意造假的行为上的比例高于中国作者。
表3 中外学者图像导致撤稿的学术不端行为分布
对2000—2022年的研究论文撤稿数据进行分析,结果如图1所示。按照撤稿年份计数后发现,国外研究论文的撤稿数量从2010年开始迅速增长,而我国研究论文的撤稿数量在2019年后快速增长,目前仍处于上升趋势。
图1 2000—2022年因图像学术不端行为导致撤稿的论文数量
撤稿事件有一定的滞后性,应通过论文发表日期来考察AMSI发生的趋势。按照发表日期对2000—2022年的研究论文撤稿数据进行分析,结果如图2所示。可以看到:国外图像造假行为高发于2006—2015年,在2013年后逐年降低;中国相关学术不端行为从2012年开始快速上升,2019年到达目前的最高峰;2020年之后数量下降的原因可能是撤稿周期长,导致图像学术不端行为目前还未被充分发现。
图2 2000—2022年发表的被撤稿论文数量
对平均撤稿周期进行分析,发现中国论文的撤稿周期(Tmean=1249.90,N=2846)显著低于外国论文的撤稿周期(Tmean=2206.11,N=2726),且t=-26.17、P<0.001。此外,近年来撤稿周期逐渐缩短(图3),表明学术界对于图像学术不端行为的警觉性和关注度已经显著提升,采取了更加及时的措施。
图3 当年发表的研究性论文的平均撤稿周期变化趋势
2.2 出版机构与期刊分析
中国作者的研究论文撤稿记录共涉及82家国际学术出版机构,其中撤稿数量排名前10的出版机构如表4所示,世界著名的Elsevier、Wiley、Springer Nature、Taylor &Francis等学术出版机构均名列其中。值得注意的是,三大OA出版机构Frontiers、Hindawi和MDPI在最近5年也开始撤销中国论文,数量分别为27篇、53篇和17篇。相比于三大OA出版机构的巨大发文量,这一撤稿论文占比较小,与近年来围绕三大OA出版商论文质量和学术不端的争议情况不吻合,需要引起注意。
表4 撤稿数量排名前10的学术出版机构
中国作者的研究性论文撤稿记录涉及468种期刊。其中:中国科学院Top期刊113种(24.15%),接近期刊总数的1/4,Top期刊撤稿442篇(17.47%);SCIE收录期刊351种(75.00%),撤稿2042篇(80.71%);非SCIE期刊117种(25.00%),撤稿488篇(19.29%)。按照中国科学院文献情报中心期刊分区表计算撤稿数量,如表5所示。虽然各分区涉及期刊数量无显著差异,但撤稿数量差异较大。其中三区刊均撤稿8.05篇,四区(6.24篇)和二区(5.78篇)紧随其后,非SCIE期刊的刊均撤稿量(4.17篇)低于二区期刊。
表5 期刊分区撤稿情况
对各分区近年来每年的撤稿数量进行分析,结果如图4所示。前期撤稿数量较少,各分区差异不明显;自2020年起,一区期刊撤稿数量依旧保持着相对较低的水平,而二、三区期刊撤稿数量暴增。
图4 各分区近年来每年的撤稿数量
根据中国科学院文献情报中心期刊分区表升级版(2019—2022年)中的学科大类,撤稿论文主要来自医学(1144篇,占56.02%)和生物学(476篇,23.31%)领域(图5),这两个领域的撤稿论文占比也远高于非中国作者在SCIE期刊上的撤稿论文占比。医学和生物学是我国图像学术不端的重灾区。
图5 SCIE期刊撤稿数量在中国科学院文献情报中心期刊分区表升级版的学科大类中的分布情况
2.3 第一作者区域与机构分析
按照省份统计撤稿数量后发现,排名前10的省(区、市)为山东省(413篇,16.32%)、吉林省(195篇,7.70%)、江苏省(185篇,7.31%)、广东省(177篇,7.00%)、河南省(167篇,6.60%)、上海市(150篇,5.93%)、北京市(117篇,4.62%)、浙江省(108篇,4.27%)、陕西省(103篇,4.07%)、湖北省(101篇,3.99%),见图6。其中山东省的撤稿数量最多,是第二名的两倍有余。
图6 各省区市的撤稿数量分布
对第一作者所属单位进行编码,按照单位性质归为高校、科研院所、医院和其他四类,分析发现接近3/4的撤稿论文来自医院,总数达1883篇,而高校、科研院所和其他机构的被撤稿论文分别为503篇、131篇和13篇,如图7所示。
各地区各类机构的撤稿数量存在显著差异(χ2=1232.02、P<0.001),在部分区域中,来自医院的论文占比最高。如表6所示,在撤稿数量最多的10个省(区、市)中,排名第一的山东省和排名第二的吉林省的撤稿论文绝大多数来自医院,占比分别为89.59%和94.87%。除此之外,医院也是河南省撤稿论文的主要来源单位,其撤稿数量占据了该省撤稿数量的89.22%。相比之下,北京市(58.97%)、江苏省(63.78%)、浙江省(65.74%)的医院撤稿比例较低。第一作者位于香港特别行政区、台湾省和海外地区的撤稿数据中,医院的撤稿数量仅分别占20.00%、21.05%和5.08%。
表6 撤稿数量排名前10的省区市各类型机构撤稿数量
2.4 分析结论与讨论
我国AMSI情况较为严重,近年来处于高峰且未见下降迹象。对“撤稿观察”数据库中AMSI撤稿数据进行分析后发现,2020—2022年撤稿数量占据了我国图像不端撤稿总量的76.20%,仅2023年1—4月就撤稿218篇,占全球数据的72.42%。从全球AMSI撤稿数据来看,中外作者在不端行为发生时间、不端行为类型和处理结果上存在显著差异。国际上AMSI始发于数字图像技术出现并逐渐成熟的20世纪90年代,并经过十几年的逐渐发酵,在2010年前后达到高峰,此后逐年回落;我国研究者在2013年才开始大规模采用此类手段,并快速在两三年内达到高峰,目前还处于高峰期。从时间上看,撤稿数据与论文工厂的大规模出现时间有密切的关系。在不端行为类型上,我国主要集中表现为图片复制,伪造图片和图片操纵等明确的主观造假行为相对较少,这似乎是某种成系统的不端行为来源,与近年来我国论文工厂等学术黑色产业链的活跃相呼应。尽管造假行为的严重程度不如伪造图片和图片操纵,但我国更多被撤稿,一方面可能暗示这些论文中的图像数据难以更正,另一方面也可能因为近年来国际期刊加重了处罚力度。
从出版机构和期刊的角度分析,我国AMSI撤稿呈现出学科集中、分区集中和出版商分散等特点。在学科上,医学和生物学是重灾区,占据SCIE期刊撤稿总数的79.33%。一是因为在生物和医学领域,图像在研究中起着至关重要的作用,如显微镜图像、X光片、MRI扫描图像、细胞染色图像等,这些图像是研究结果的直接证据。二是图像处理技术的复杂性不仅容易导致研究者们在图像处理过程中出现错误,也给审稿人的检验和审核带来了挑战。三是我国生物和医学领域的研究者在面对职业发展时,发表论文的压力较大,导致其更容易追求图像数据的“理想化”或“可复制性”。在分区上,我国图像学术不端的论文重点集中在中国科学院文献情报中心期刊分区表的三、四区,一区或Top期刊数量反而较少,这一方面说明顶级期刊对于审稿要求更为严厉,造假难度较大;另一方面,顶级期刊的图片检测技术应用更为深入、投入的人力成本更大,有更大可能在论文出版前发现图像学术不端,这也为其他期刊提供了防范策略的参考。值得注意的是,目前国内已经有高校、科研院所和医院将三大OA出版商的所有期刊列入警示清单,其撤稿数量相对较低,不能说明其图像学术不端行为较少,反而可能潜藏未发现的问题,需要进行进一步的研究。
对期刊第一作者归属单位和所在省区市进行分析发现,医院成为图像学术不端行为的集中地,其撤稿论文占比接近3/4,暗示了医生具有较强的造假动机,且部分省区市的情况异常严重。撤稿数量排名第一的山东省,撤稿数量占16.32%,且接近90%来自医院。撤稿数量排名第二的吉林省,虽然撤稿数量不到山东省的一半,但医院撤稿数量占比高达近95%。在港澳台地区和海外中国学者的撤稿中,来自医院的撤稿占比相对较小,暗示大陆(内地)地区的医院可能存在制度性问题。
3 建议与启示
近年来,我国学者在国际期刊中因图像学术不端遭遇集体撤稿的事件频繁发生,已经影响我国学术界在国际上的形象,因此亟需采取应对措施。
对于学术出版界,防范AMSI较为困难,尤其在人工智能技术与数字图像技术结合后,将面临更大的挑战,因此需要制定全方位的措施。显而易见的措施包括:与国际学术出版界接轨,建设严格的图像规范;引入先进的图像检测技术,提高图像筛查的精确性。这些措施在过去已经有多项研究进行了详细的阐述,是学术出版界对于这类不端行为的“堵”。本研究的数据显示,我国AMSI有独特的特点,其主要源头在于特定群体来自政策的“造假动力”。如果这种动力持续存在,则“堵”不胜“堵”。因此,除升级期刊的防范措施外,还需要疏导这种造假动力,并建设联合治理机制。
(1)我国AMSI较为严重,且对于单一期刊来说检测困难,因此建议从国家层面出发建设统一的学术图像库。例如,基于中国知识基础设施工程(China National Knowledge Infrastructure,CNKI)建设学术图像库,并在学术图像库的基础上建设学术图像检测平台。
(2)参考国际出版伦理委员会(Committee on Publication Ethics,COPE)的机制,建设中国学术出版伦理联盟,在联盟的基础上建设更加广泛的图像学术不端防治机制:对于医学、生物学等主要依赖图像进行数据阐述的学科,联盟内建设原始图像共享数据库;构建联盟内部共享的高风险作者库,对投稿中存在的不合理图像以及投稿者进行标记,以便在此类作者再次投稿时进行干预。
(3)在处理涉嫌图像学术不端的论文时,期刊应积极向作者反馈并进行核实。对于不能提供充足原始数据支持的图像,应及时与作者进行沟通并采取拒稿(发表前)或撤稿(发表后)的措施;对于已经发表的论文且不能得到作者答复的,应当联系作者所属单位;对于单位答复不清的已发表论文,期刊无法协调单位上级主管机构(例如医院的上级主管单位、各省区市卫健委)时,联盟可以承担联系并协调上级机构的职责。
(4)我国对医生职称晋升的评价体系仍存在问题,临床医生被要求按照大学的科研评价标准进行评估,这无疑会导致医生人力资源的错配。各省区市卫健委应遵循国务院改革完善人才评价机制的要求,破除唯论文、唯学历、唯奖项、唯帽子的职称评定标准,健全医务人员晋升体制,如增加实践能力、医德水平等维度,根据各省区市的情况和岗位类型制定灵活的晋升指标和渠道,提升各指标的可行性,避免论文成为医务人员的唯一可行性选择。
(5)在医院和医科院校针对医生和医学生集中开展学术道德教育活动,并建立相关惩罚措施,例如撤销申请材料中包括学术不端论文的职称评定、荣誉称号、项目资助等。
尽管防范技术的发展日新月异,但新的造假技术也会相应出现。因此,需要在源头对我国科学图像学术不端的现象进行有效遏制,加强涉及AMSI的学术伦理教育,在晋升上避免“唯论文”的导向,建设学术出版伦理联盟,共享AMSI数据,期刊、作者单位、上级主管机构三方联动。具体来说,可以通过改革科研评价体系,引入更多元化的评价指标,以鼓励科研人员进行真实、可靠的科研活动,并注重制度的贯彻与反馈,确保各省区市严格执行落实。如此,方有可能有效减少AMSI的发生。
4 结语
本研究深入探讨了中国学者在图像处理上的学术不端行为的根源,以期在源头上实施干预,从而降低此类行为的发生率。然而,撤稿作为这一问题的终极结果,其真实原因仅能通过现有的线索进行推测,这就增加了研究的复杂性。为了获取更为准确的原因,需要采用访谈、问卷等定性研究方法进行深入探索。然而,由于学术不端行为的负面性,受访者可能会对此类研究产生抵触,从而不愿意接受研究者的调查,这无疑增加了研究的难度。此外,由于缺乏在投稿环节的AMSI数据,分析问题的维度受到限制,可能会影响研究的深度和广度。因此,需要寻找更多的数据来源和更全面的研究方法,以期更全面、更深入地理解这一问题。
虽然本次调查数据触目惊心,但仍应当看到正在出现的良好迹象。近日,广东省人力资源社会保障厅、广东省卫生健康委和广东省中医药局联合印发的《广东省卫生健康专业技术人才职称评价改革实施方案》中已经明确要求突出对临床实践能力的评价,不再把论文作为职称申报的必要条件[17]。相关举措陆续出台,相信能够有效改变图像学术不端行为高发的现状。