医学学术不端论文特征分析及防范对策
——以国家卫生健康委员会通报的科研诚信案件为例
2022-12-20江雨莲
■江雨莲 刘 爽 孙 激*
1)四川大学华西第二医院《中华妇幼临床医学杂志(电子版)》编辑部,出生缺陷与相关妇儿疾病教育部重点实验室,四川省成都市人民南路三段20号 610041 2)《中华血液学杂志》编辑部,天津市和平区南京路288号 300020
科研诚信是科技创新的基石。随着中国科研水平的迅速提升,科研诚信问题屡见报端。自2015年我国遭遇大规模撤稿事件以来,科技部等部门先后制定一系列科研诚信政策。2021年6月3日,国家卫生健康委员会(National Health Commission,NHC)官网开设“医学科研诚信”专栏,以宣传科研诚信政策,并对各级卫生健康行政部门所属医疗卫生机构、医学科研机构查实并公开通报的科研诚信案件调查处理结果予以转载、通报。
对被撤回医学学术不端论文特征、影响、撤回原因、引用特征等进行分析,可帮助科研单位、期刊出版单位、政府等制定防范对策。目前,有学者对Retraction Watch数据库中被撤的“论文工厂”论文[1]、中国学者科技论文[2]、开放获取期刊论文[3],及所有被撤研究型论文的特征[4]、影响及撤回原因等进行分析,并从不同层面提出对策与建议。有学者对特定学科领域的撤回论文及其学术不端行为进行分析,如生物医学论文[5-9]、植物学和农学论文[10];有学者归纳总结在期刊编辑出版实践中遇到的学术不端案例特征,并介绍编辑部的应对措施及其效果[11];有学者对作者贡献声明[12]、同行评议中的审稿意见造假现象[13]、被撤论文的引用特征[14]等进行探讨,进而提出防范策略;也有学者对高校科技期刊网站出版伦理制度建设情况进行研究[15];还有学者根据《高等学校预防与处理学术不端行为办法》(教育部令第40号),对高校学术期刊编辑在科研诚信体系建设中发挥的作用等进行研究[16]。但是,上述研究均未挖掘学术不端论文作者职称、工作单位等信息,较少分析论文被撤后的引用情况,且目前未见针对NHC通报的医学学术不端论文的深入研究。为此,本研究以2021年6月3日至12月31日NHC通报的医学学术不端论文为研究对象,采用统计学分析方法,对学术不端论文作者职称与科室信息、论文引用情况、学术不端行为特征与处罚措施等进行分析,并总结存在的问题,进而提出相应防范对策与建议,旨在为有效应对和防范医学学术不端提供参考。
1 数据来源与研究方法
1.1 数据来源
选择2021年6月3日至12月31日NHC通报的13批科研诚信案件中的309篇医学学术不端论文为研究对象,涉及被通报的第一作者、通信作者、其他参与作者共1019位(若同一作者被多次通报,仍记为1位作者)。
1.2 研究方法
通过刊发学术不端论文的期刊的官网、PubMed与Web of Science数据库、作者工作单位官网与微信公众号等渠道,收集309篇论文的以下信息。(1)作者特征:姓名、职称、科室、工作单位、所在地区,及论文署名作者数;(2)论文特征:发表时间、有无撤回声明及撤回声明发布时间、撤回时滞(论文从发表到撤回的时间间隔),及截至2022年1月31日的总被引频次、撤回后被引频次;(3)学术不端行为;(4)对论文作者的处理措施。本研究将撤稿(Retraction)声明、关注(Expression of Concern)声明统称为撤回声明。
将所有数据录入Microsoft Excel 2010中,采用Excel与SPSS 19.0软件进行统计学分析。对于呈偏态分布的定量资料,如被引频次等,采用M(Q1,Q3)[中位数(第25百分位数,第75百分位数)]表示。对有撤回声明与无撤回声明论文所在期刊的影响因子(Impact Factor,IF)、分区(来自2021年《中国科学院文献情报中心期刊分区表》)、总被引频次,及各种学术不端行为发生率等,采用Mann-WhitneyU检验、χ2检验、Fisher确切概率法等进行统计学比较,以P<0.05表示差异有统计学意义。
2 结果与分析
2.1 作者特征
2.1.1 作者工作单位及所在地区分布
纳入的309篇论文中,有1019位被通报作者,其工作单位分布在22个省区市;来自山东的被通报作者数量最多,为706位(69.28%),被通报作者数多于10位的地区有11个,见表1。1019位作者属于172家医疗机构,其中50家(29.07%)属于市级三乙及以下,被通报作者数排名前15的医疗机构见表2;11家机构位于山东,被通报作者数最多的为济宁市第一人民医院(288位,28.26%),涉及102篇学术不端论文。
表1 被通报作者数>10位的地区
表2 被通报作者数排名前15的作者单位
2.1.2 作者职称与科室分布
除1位作者无法核实职称外,其余1018位被通报作者中,初级、中级、副高级、正高级者分别为74、434、393、117位,分别占7.27%、42.63%、38.61%、11.49%;医师有856位(84.09%),护师有117位(11.49%),医技/药师及其他岗位作者有45位(4.42%)。1018位作者分布于60个科室,被通报作者数>20位的科室有21个,见表3。其中,骨科作者数量最多,为80位(7.85%);其次为儿科作者(67位,6.58%)、消化内科作者(52位,5.10%)、心胸外科作者(48位,4.71%)、呼吸与重症医学科作者(47位,4.61%)。
表3 被通报作者数>20位的科室
2.1.3 署名作者数与作者被通报次数分布
纳入的309篇论文中,署名作者共有1378位,有4位署名作者的论文占比最高(23.95%,74/309),95.15%(294/309)的论文署名作者数≤7位,署名作者数最多为12位。被通报的1019位作者中,8位被通报4次,15位被通报3次,均来自济宁市第一人民医院与东营市胜利油田中心医院;95位(9.32%)作者被通报2次,分别来自山东(84位)、江苏(6位)、浙江(3位)与河南(2位);其余901位(88.42%)作者被通报1次;共计被通报1168人次。除36位不知情署名作者外,有174位作者未被工作单位通报处罚。
2.2 论文特征
2.2.1 被引用情况
截至2022年1月31日,纳入的309篇论文中,被引频次最低为1次(9篇),最高为113次(1篇),论文平均被引频次为13.6次;261篇(84.47%)论文被引频次≤20次,见图1。
图1 309篇学术不端论文刊发后的被引频次
2.2.2 撤回情况
309篇论文中,有、无撤回声明论文分别有223篇(72.17%)与86篇(27.83%)。223篇有撤回声明的论文中,201篇有撤回日期。分析201篇有撤回日期的论文的撤回后被引用情况,结果显示:仅30篇(14.93%)论文撤回后未再被引用,171篇论文撤回后再次被引用;最高被引频次为20次(1篇),平均被引频次为3.9次,13篇(6.60%)论文撤回后被引用≥10次。有撤回声明论文所在期刊的IF中位数为4.429(3.507,5.678),无撤回声明论文所在期刊的IF中位数为3.507(3.362,6.113),有、无撤回声明论文总被引频次中位数分别为10.0次(6.0次,16.0次)与10.5次(6.0次,16.0次);二区及三区期刊论文分别为133篇(59.64%)、36篇(41.86%)。有撤回声明期刊的IF情况、分区情况均显著优于无撤回声明者,其差异有统计学意义(Z=2.771,P=0.006;χ2=7.919,P=0.005);而有、无撤回声明论文的总被引频次差异无统计学意义(Z=-0.280,P=0.779)。无撤回声明的86篇论文被NHC通报后,其篇均新增被引频次为1.3次。
2.2.3 撤回时滞分析
201篇有撤回声明并注明撤回日期的论文中,发表最早的论文发表于2008年(1篇);201篇论文集中发表于2018—2020年,发表于2019年的论文数量最多(124篇,61.69%);201篇论文于2020—2022年被集中撤回,各年度撤回论文数量分别为84篇(41.79%)、109篇(54.23%)、8篇(3.98%),见图2。论文平均撤回时滞为691天,2017—2020年各年度发表论文的平均撤回时滞分别为1262、1013、570、271天。
图2 有撤回声明并注明撤回日期的201篇学术不端论文的发表与撤回时间
2.3 学术不端行为分析
309篇论文的学术不端行为主要包括数据造假(162篇,52.43%),第三方代写、代投或买卖论文(138篇,44.66%),编造研究过程(101篇,32.69%),不当署名(74篇,23.95%),图片造假(31篇,10.32%),知情同意违规、私自投稿等论文授权问题(14篇,4.53%),伪造通信作者邮箱(8篇,2.59%),抄袭和剽窃、违规使用基金项目(2篇,0.65%)。存在授权问题的14篇论文中,13篇(92.86%)同时涉及第三方代写、代投或买卖论文。二区、三区期刊论文数据造假和编造研究过程发生率均明显高于四区期刊论文,而二区、三区期刊论文第三方代写、代投或买卖论文发生率则明显低于四区期刊论文,差异均有统计学意义(P<0.05);二区、三区及四区期刊论文的其他学术不端行为的比较差异均无统计学意义(P>0.05),具体情况如表4所示。
2.4 处理措施
对1019位被通报作者的处理措施与《科研诚信案件调查处理规则(试行)》中的科研诚信案件处理措施一致,具体包括:(1)科研诚信诫勉谈话、党内警告;(2)医院内与医院网站公开通报批评;(3)终止或暂停其参与的院级及以上各类相关科研项目,按原渠道收回已拨付资助经费、结余经费,撤销利用涉事论文获得的相关学术奖励、荣誉称号、职务、职称等,并收回奖金;(4)取消其1~8年内申请或申报科技计划项目、科技奖励、科技人才称号和专业技术职务晋升等的资格,甚至永久取消;(5)取消其已获得的学术团体及学术机构委员或成员资格;(6)取消其1~8年内作为提名或推荐人、被提名或推荐人、评审专家等的资格,甚至永久取消;(7)1~6年内暂停招收研究生,甚至取消其研究生导师资格;(8)撤销其博士学位或博士学位申请资格;(9)限期内联系杂志社撤稿,缴纳罚款,并评定当年医德考评不合格,取消其当年评优评先资格等。
3 医学论文防范学术不端行为策略
3.1 国家政府
3.1.1 国家与各地区完善科技评价制度
近年,我国科研评价改革如火如荼,国家有关部门出台了一系列破除“唯论文、唯职称、唯学历、唯奖项”政策,纠正过往过度量化评价机制导致的扭曲评价,但是收效甚微,社会各界尚未找到破“五唯”的制度源头[17]。在体制机制、治理结构和文化认知方面,加快完善科技评价制度体系,制定配套措施,平衡好科技评价的“破与立”“量与质”“标与本”问题迫在眉睫。政府应持续推进和完善科研人才分类评价制度,梳理我国科研诚信发展阶段的内在逻辑和变化趋势,推动我国科研生态体系建设。本研究发现,1019位被通报作者中,市级三乙及以下与区县级医院被通报作者中的中级及以下职称者占比显著高于市级三甲医院、省级三甲医院作者,这可能与市级三乙及以下医院与区县级医院中级及以下职称人员科研资源较少,从而铤而走险,违反学术道德有关。建议从国家层面对医护人员采取分类管理的职称评审制度,综合考虑其学历、工龄、临床能力,及教学、科研获奖等相关情况合理评价。
在国家层面采取措施的同时,各地区政府亦应结合国家政策与本地区实情、科研失信特点,制定符合当地情况的科研评价标准。本研究结果显示,NHC通报的科研诚信案件中,69.28%的学术不端论文作者来自山东,山东可谓重灾区,这与其他研究[1]结果一致。2018年9月15日,山东省人力资源与社会保障厅和山东省卫生健康委员会选择9家医疗机构开展职称制度“双自主”改革试点工作,其中就包括山东省立医院、山东省千佛山医院、青岛大学附属医院、烟台毓璜顶医院、聊城市人民医院、临沂市人民医院6家机构。而本研究显示,这6家机构共有65位作者被NHC通报,并且50位(76.92%)作者的学术不端论文发表于“双自主”改革试点工作开展后,因此该试点工作的实施效果和监督力度不得不让人反思。笔者对山东省人才评价、职称评审、科研诚信相关政策进行研究后发现,山东省的科研诚信政策相对较欠缺,如科研诚信建设联席会议制度、科技厅科研失信记录实施细则及省内科研诚信体系建设情况调查等不完善,这也从侧面反映了科研诚信政策体制不健全会助长学术不端现象。当然,实际存在的学术不端论文远比已发现的多,全国各地区都不能存侥幸心理,都应该深入分析本地区科研诚信案件特点,总结突出问题,制定策略,及时完善科研诚信政策,并在实施中不断进行评估与调整。
3.1.2 铲除第三方代写、代投与买卖论文产业链,加大学术不端惩处力度
纳入的309篇论文中,涉及第三方代写、代投或买卖论文问题的论文数量排名第2,占44.66%。可见,目前我国第三方代写、代投与买卖论文产业猖狂,所产生的垃圾论文不仅造成社会资源的巨大浪费,还有损实事求是、求真务实的科学精神,破坏公平竞争的学术规则,侵蚀世界科技强国建设的基石。为遏制第三方代写、代投与买卖论文产业链,2015年中国科协等七部门联合印发《发表学术论文“五不准”》;2018年教育部印发《教育部办公厅关于严厉查处高等学校学位论文买卖、代写行为的通知》,同年科技部联合其他部门开展针对第三方代写、代投与买卖论文产业链的“清网行动”;2022年9月,科技部等部门联合印发的《科研失信行为调查处理规则》新增了有关买卖实验研究数据等科研失信行为的处理规则,并对从事第三方代写、代投与买卖论文的中介机构作出查处规定。但是,这些措施对第三方代写、代投与买卖论文产业链的打击力度仍然十分有限,并且目前我国尚缺乏相应法律、法规对此进行规制,各类部门文件对其约束力甚小,第三方代写、代投与买卖论文问题屡禁不止,科研人员经常收到冒充“××编辑”的邮件、微信消息。纵容第三方代写、代投与买卖论文产业链,实际上也助长了学术不端现象。相关部门对考试作弊零容忍,对作弊者和辅助作弊者都有法律制裁,因此针对论文“买卖作弊”,政府应明确行业监管主体、强化责任追究,尽快完善相应法律法规,采取综合性法律手段制裁涉事中介机构及作者,铲除这一黑色产业链[5]。
作者单位对学术不端论文作者采取了思想、学术、经济方面的处理措施,起到了一定警示作用,但是作者单位的惩处力度仍较低,并且处理措施仅针对学术不端论文作者,甚至部分知情署名作者未被采取处理措施。为解决学术不端论文地区集中现象,应加大对学术不端的惩处力度:学术不端论文集中地区的卫生管理与科技管理部门应当引起重视,未来相关政府部门可对学术不端行为频发的医院、地区科技管理部门进行适当惩处。
3.2 医学科研机构:加强科研诚信教育和科研管理,警惕科研成果数量异常增加
积极有效的科研诚信教育可从根源上遏制学术不端行为的发生。医学科研机构作为医务人员主管单位,是科研诚信的第一责任主体,有责任和义务把关其医务人员的学术道德,加强医务人员的科研诚信教育,建立个人诚信档案,从严从重处理学术不端行为,提高医务人员的科研规范性和诚信自觉性[6]。过往研究对学术不端论文作者职称、科室分布特征的关注不足,本研究分析显示:被通报作者中,中级与副高级职称者分别占42.63%、38.61%,医师和护师分别占84.09%、11.49%;学术不端作者数排名前5的科室依次为骨科、儿科、消化内科、心胸外科、呼吸与重症医学科。医学科研机构应重点加强对中青年医务人员及骨科、儿科等科室的医护人员的科研诚信教育;在对医师加强科研诚信教育的同时,不能忽视对护师的教育。医学科研机构可将科研诚信教育培训纳入医务人员入职培训、科研任务、学术交流等活动中,引导其自觉遵守科研诚信要求,开展负责任的研究。医学科研机构可通过Retraction Watch数据库、PubPeer及中国科研诚信网、国家自然科学基金委员会网站、NHC网站等平台,了解学术不端论文的特征及区域分布,监测本单位医务人员学术不端论文参与情况,跟踪、调查、发布预警信息,对苗头性问题及时预警和纠正,如中国科学院科技伦理委员会总结了近年来最常见的10种学术不端行为,并采取发布诚信提醒方式教育本单位教职员工[18]。本研究中,11.58%的学术不端作者被通报≥2次,发表≥2篇学术不端论文;涉及学术不端的论文多与miRNA有关。医疗机构有必要对学术不端人员的其他科研成果、本单位相同研究方向的科研成果进行全面调查,及时发现和制止其他学术不端行为,最大限度降低不良影响。
纳入的309篇论文涉及的学术不端行为中,数据造假占比最高(52.43%)。2021年1月,NHC等联合印发的《医学科研诚信和相关行为规范》规定,医学科研人员应当确保论文相关资料和数据齐全、完整、真实和准确;相关论文等科研成果发表后1个月内,科研人员要将所涉及的原始图片、实验记录、实验数据、生物信息等原始数据资料提交所在机构统一管理、留存备查;医疗机构应妥善管理本机构医学科研相关原始数据、生物信息、图片、记录等,以备核查[19]。在大数据时代,良好的科研数据管理非常重要。医学科研机构应特别重视科研数据管理,建立健全科研活动记录、科研档案保存等的制度,建立科研信息管理平台,要求医务人员在科研实施过程中,在该平台自行记录和上传相关科研原始数据、论文发表过程等信息,确保科研数据记录完整、真实。本研究中,除不知情作者外,174位署名作者未被工作单位通报处理。署名作者为“除负责本人的研究贡献外,同意对研究工作各方面的诚信问题负责者”,故署名作者亦应承担相应责任,但是作者单位并未对其进行处理,这或许与医疗机构不清楚作者署名要求及责任有关。医学科研机构有责任加强对本单位科研论文和成果的署名管理,依法依规严肃追究无实质性贡献的挂名作者的责任[19];科研管理部门在确定本单位医务人员科研成果时,应有知识产权归属意识,认真核实、严格审查作者署名真实性,履行监管责任[20]。本研究中,27.83%的学术不端论文无撤回声明,这可能是因为期刊编辑部尚处于调查取证阶段,当然也不排除相关作者后续并未与期刊编辑部联系撤回论文。由此可见,我国医疗机构应不断加强对学术不端的防范,特别应提升对科研数据、科研成果署名等的管理水平。
本研究中,28.26%的被通报学术不端的论文作者来自济宁市第一人民医院。笔者对Web of Science核心合集中该院作者的发文情况进行统计,发现2015—2017年该院作者发文量分别为99、126、182篇,而2018—2020年该院作者发文量大幅上升至332、343、249篇,这与本研究发现的学术不端论文集中发表于2018—2020年一致。医学科研机构对本单位科研论文产出陡增应提高警惕,严查其中是否存在学术不端行为。
总之,医学科研机构应重视对其医务人员业务水平与学术道德的“双审核”,加强科研诚信教育和科研数据、科研成果署名管理,特别是对在短期内发表多篇论文、取得多项关键性研究成果的医务人员,应对其研究结果开展实证性核验,避免“走过场”,杜绝医务人员侥幸凭借学术不端论文或其他科研成果获取利益的情况,从而维护学术道德、净化科研环境。
3.3 国内医学期刊:积极开展对深度学术不端行为的研究和防范,提升科研服务水平
本研究中,发生率最高的学术不端行为前3位依次为数据造假,第三方代写、代投或买卖论文,编造研究过程,并且二区、三区期刊论文的学术不端行为主要为数据造假和编造研究过程,其学术不端现象更加技术化、隐蔽化;四区期刊论文的学术不端行为主要为第三方代写、代投或买卖论文。国内医学期刊作为我国医学论文的重要载体,也需要提高对此类学术不端行为的重视度:应及时更新对学术不端行为的认识,积极开展针对防范深度学术不端行为的相关学术研究和技术应用[5];提高数据审查意识,提升统计学能力,运用统计学知识鉴别数据真实性,在审稿流程中增设数据和统计学、图像审查流程,将权威统计学专家纳入期刊编委会。在审稿流程中,期刊若发现稿件存在可疑数据,应要求作者提供原始数据[21]。论文处理过程中,期刊可关注论文的作者注册信息(用户名、密码、手机号、邮箱)、投稿后登录账号次数、投稿IP;对于上述信息异常论文,及时将其与已发现学术不端的论文关联,进行识别,为及时甄别学术不端论文提供参考[22]。有条件的期刊可通过升级采编系统,在投稿阶段拦截软件代投稿件,如中华医学会杂志社远程稿件管理系统在作者注册投稿阶段设有手机号、邮箱验证环节,要求作者必须填写身份证号码,并且目前该系统正在升级调试,新增了登录时间和IP地址的显示功能,有助于编辑核查投稿IP地址与作者单位IP地址的一致性,并对可疑IP地址进行动态监测。
本研究纳入的存在授权问题的14篇学术不端论文中,13篇(92.86%)为第三方代写、代投或买卖论文,可见期刊编辑部在初审阶段应加强论文授权书审核。笔者所在的《中华妇幼临床医学杂志(电子版)》的采编平台要求作者投稿即提交论文授权书、作者贡献声明、作者利益冲突公开声明、基金证明材料,并在初审阶段审核这些材料的真实性,及时与作者沟通核实有问题的材料,并借助中国知网学术不端文献检测系统“稿件追踪”功能辅助判断学术不端,不断完善初审阶段学术不端审查流程。单刊的作战能力有限,建议国内医学期刊编辑部与同类期刊联盟,防范第三方代写、代投与买卖论文,建立并共享作者与投稿IP地址黑名单库,以共同防范学术不端。
学者对Retraction Watch数据库自建立至2018年9月收录的被撤回论文进行分析,结果显示:由于引用被撤回论文而被撤回的论文约占0.1%(12/9189)[4]。本研究发现,27.83%的学术不端论文并无撤回声明,并且在有撤回声明与撤回日期的论文中,85.07%在撤回后仍被引用。Luwel等[23]的研究显示,即使论文被撤回,绝大多数施引文献对其的态度也是积极的;袁子晗与张红伟[24]对哈佛大学心脏干细胞撤稿事件中被撤回论文的2942条施引记录的分析显示,持否定态度的施引文献仅占约2%(51/2942)。此外,本研究发现:有撤回声明的学术不端论文所在期刊的IF、分区情况均显著优于无撤回声明者;学术不端论文平均撤回时滞为691天,短于王景周[1]报道的“论文工厂”论文的撤回时滞961天;2017—2020年发表论文的平均撤回时滞分别为1262、1013、570、271天,可见学术不端论文撤回时滞越来越短,学术界自我净化效率越来越高。
我国医学期刊有必要加强学术诚信的教育和宣传,在投审稿与编校环节加大学术不端审查力度,提醒作者确保引用文献真实、可信,切不可引用未实际阅读的文献;论文刊登后一旦被证实为学术不端论文,期刊则应及时公开发布撤回声明、被撤回原因,并在期刊醒目位置进行展示;适时通知作者所在单位、收录数据库、基金项目主管部门等,对学术不端论文作者采取撤销利用涉事论文获得的利益、撤销论文收录、追回已资助款项等惩戒措施,提高学术失信成本,最大限度减轻学术不端论文的不良影响。同时,国内医学期刊亦可分析各自期刊作者、读者特点,深入剖析其科研需求,为其制定具有针对性的科研服务措施,通过合理的学术服务帮助作者高效完善研究,提升科研服务水平。总之,期刊编辑部作为科研成果问世前最后一道关卡的“守门人”,应当勇于担当责任,捍卫科研诚信,增强主体意识,加大审查力度,遏制学术不端行为。
4 结语
科研诚信是科技创新的应有之义。学术不端行为防范是一项系统性工程,各部门、各单位需要携手共筑抵抗学术不端行为的围墙。本研究对NHC通报的309篇学术不端论文的作者特征、学术不端行为及处理措施进行整理、分析,发现多数被通报作者来自山东,大部分作者拥有中级或副高级职称,来自骨科的学术不端作者数量最多,仍有部分署名作者未被通报;27.83%的学术不端论文无撤回声明,85.07%有撤回声明与撤回日期的论文被撤回后仍被引用;学术不端行为主要包括数据造假,第三方代写、代投或买卖论文,编造研究过程。为此,笔者从国家政府部门、医学科研机构、医学期刊的角度出发,提出我国医学学术不端行为防范策略。本研究亦存在一定的不足之处,如仅对2021年6月3日至12月31日NHC通报的医学学术不端论文进行了分析,未纳入2022年2月通报的论文,纳入的样本有一定局限性,尚不能全面反映我国医学论文学术不端情况。未来将扩大样本范围,以期更全面、深入地了解我国医学学术不端论文情况,为防范我国医学科研领域学术不端问题提供参考。