APP下载

被撤销论文的学术不端行为及应对策略研究

2019-10-21田瑞强姚长青潘云涛

中国科技期刊研究 2019年9期
关键词:时滞不端诚信

■田瑞强 姚长青 潘云涛

1)武汉大学信息管理学院,湖北省武汉市武昌区八一路299号 4300722)中国科学技术信息研究所,北京市海淀区复兴路15号 100038

科研诚信已成为社会和学界关注的热门话题。研究论文的撤销是对含有严重缺陷或错误,从而动摇其可靠性的文献正式宣告失效。因此,撤销论文的数量和频率是科学健康发展的重要指标[1]。Steen[2]的研究表明,2000年以来的10年间学术造假增长了近10倍。Nath等[3]基于1982—2002年PubMed数据库的统计表明,因无意错误而被撤销的论文占比为62%,高于因科研不端(包括篡改数据、伪造数据和抄袭剽窃)而被撤销的论文(27%)。Wager等[4]同样指出错误是论文被撤销的主要原因,而不是学术不端。Fang等[5]通过分析生物医学领域的2047篇被撤销论文发现,因错误而被撤销的论文占比为21.3%,远低于因学术不端而被撤销的论文(67.4%)。张晴等[6]统计了CNKI中的被撤销论文,发现因学术不端引起的撤稿占被撤销论文总数的67.4%。由于不同研究者的数据范围差异,且已有研究多以某几个学科领域为对象,缺乏全部学科数据的研究,从而导致对于学术论文被撤销的主要原因或者当前研究中学术不端行为的主要表现形式并没有清晰、明确的认识。此外,研究者对撤销原因的分类也不完全一致,导致对论文被撤销原因的研究存在差异。当研究样本为某领域的较小量数据时,已有研究对论文被撤销原因的分析往往相互冲突。因此,对科研诚信建设的这些基本问题,目前没有形成共识。Retraction Watch最初是报道被撤销论文和相关主题的科学博客,近期该网站建立了被撤销论文数据库,收录了近2万篇被撤销论文,是当前覆盖范围最广的被撤销论文数据库,几乎囊括了全世界所有学科领域的被撤销论文。本研究基于Retraction Watch数据库统计自1955年以来全球范围的被撤销论文,分析学术不端的主要原因,并讨论相应的应对策略,以期为科研诚信建设提供借鉴和参考。

1 数据与方法

1.1 被撤销论文来源

美国记者Oransky和Marcus于 2010年建立了Retraction Watch网站,致力于监测、跟踪被撤销论文[7]。笔者在Retraction Watch数据库中检索了其中收录的全部被撤销论文。

截至2018年9月,Retraction Watch共收录被撤销论文19126篇。表1统计了Retraction Watch数据库收录的所有被撤销论文,由于存在一篇文献被标引为多种文献类型的现象,表1统计的被撤销论文总量大于网站检索到的文献总量。按照文献类型统计,被撤销论文主要由研究论文和会议论文组成,这两类论文约占总量的85.6%。本研究选取文献类型为研究论文(Research Article)的被撤销论文作为研究对象。检索策略:论文出版时间为1900-01-01—2017-12-31,文献类型为Research Article。检索时间为2018年9月23日,检索得到9189条记录。

表1 Retraction Watch数据库收录的被撤销论文统计

1.2 撤销原因分类

科研诚信办公室定义的学术不端行为是指“在提议、进行或审查研究时或者在报道研究结果时的捏造、伪造或剽窃”[8]。美国国立卫生研究院界定的科学论文被撤销原因包括:普遍的错误、未经证实的数据以及不能再现的数据[9]。出版道德规范委员会(Committee on Publication Ethics,COPE)认为论文被撤销的原因主要包括:诚实错误、不可重复、期刊管理错误、重复出版、剽窃、捏造数据、篡改数据、伦理问题、误导性报道等[10]。

Benos等[11]、Fang等[5]和Zhang等[12]都曾对论文被撤销原因进行研究,且分类大致相同。刘红等[13]将论文被撤销原因分为3种:科学不端行为、有意的问题行为及无意的问题行为。丁媛媛[14]将其分为7种,没有将未获授权擅自发表、剽窃他人成果这类授权问题合并。由于COPE期刊出版指南在学术出版领域具有广泛影响,其关于撤销原因的分类被广泛接受,Fang等[5,11-12]的研究与COPE的工作一脉相承。

本研究在文献[15]撤销原因分类的基础上,将错误(Error/Mistake)和出版错误(Publisher Error)合并、将作者争议(Author Dispute)和授权问题(Lack of Consent /Approval)合并,同时考虑Retraction Watch的撤销原因分类,增加了诉讼/调查、引用被撤销内容2类,将论文撤销原因分为9类,并与Retraction Watch的撤销原因分类进行映射。这9类撤销原因如下:(1)重复,包括论文、数据、图像、文本重复等;(2)错误,涵盖了各类诚实错误,如期刊失误,数据、图像材料、文字等错误;(3)不可再现,包括各类投诉和担忧,如关于作者、数据图像的担忧和投诉;(4)造假,包括各类不端行为,如同行评议造假、伪造/篡改等;(5)授权问题,涵盖了政策、道德、版权、利益冲突、知情同意等方面的违规行为;(6)抄袭,包括各类存在原创性问题的剽窃和抄袭;(7)诉讼/调查,包括民事、刑事诉讼及其他机构的调查;(8)引用被撤销内容;(9)原因不详。

2 结果与分析

2.1 撤销趋势分析

Retraction Watch收录的研究论文中,最早被撤销于1967年,被撤销论文最早发表于1955年。1955—2017年的被撤销论文分布情况见图1。1955—2005年,每年的被撤销论文总量都在百篇以内,其中,2003—2005年的被撤销论文数量较多,在70~80篇之间,其余年份均少于50篇;2006—2014年,每年的被撤销论文数量快速增长,从100篇左右迅速增长到接近800篇;2015年以来,每年的被撤销论文数均超过1000篇。从出版时间看,被撤销论文集中发表于2000年之后,尤其以2010年发表的被撤销论文最多,共1161篇。

2.2 撤销原因分析

对9189篇被撤销论文按照9种撤销原因进行分类统计,结果如表2所示。可以看出,重复、错误、不可再现、造假为论文被撤销的主要原因,约占70%。由于授权问题被撤销的论文约占9%,包括作者署名、版权、利益冲突、机构和道德等其他违规情况。因抄袭被撤销的论文约占8%,包括文本、数据、图像等抄袭。由于涉及诉讼或其他调查而被撤销的论文约占4%,其中78%是期刊或机构主导的调查,10%涉及刑事诉讼,4%涉及民事诉讼。由于引用被撤销内容而被撤销的论文约占0.1%。

图1 1955—2017年被撤销论文的分布

在由于重复而被撤销的论文中,51%属于完全论文重复(Duplication of Article),29%属于图像重复,数据重复和文本重复占比均约10%;在由于错误被撤销的论文中,37%属于数据错误,18%属于分析错误,14%属于图像错误,方法错误和出版商错误占比均约7%;在由于不可再现而被撤销的论文中,41%属于数据问题;在由于造假被撤销的论文中,54%属于数据造假,24%属于同行评议造假,8%属于图像造假。

表2 研究论文的撤销原因统计

综上所述,数据问题是论文被撤销的主要因素。因涉及数据问题被撤销的论文共2146篇,占被撤销论文总数的23%。其中,由于关于数据的担忧/问题(Concerns/Issues About Data)、数据错误(Error in Data)、伪造/篡改数据(Falsification/Fabrication of Data)而被撤销的论文均达到600篇及以上(表3)。

数据错误、伪造/篡改数据的情形相对明确,而关于数据的担忧/问题常常并不确定。根据COPE的撤销论文指南,在以下情况期刊应考虑发表关注(Issuing an Expression of Concern):收到来自作者的关于论文存在不端行为的说明,而证据尚未确定;有证据表明研究结果不可靠,但作者所在机构并不调查该案;关于该论文的调查正在进行,但很长一段时间内无法得出结论等。关于数据的担忧/问题通常都是相关研究的可靠性存在质疑,也会导致研究不可再现。

表3 因数据问题被撤销的论文的分类统计

2.3 国家及原因分析

被撤销论文共分布在118个国家/地区,其中18个国家的被撤销论文数量均超过了100篇,它们的被撤销论文总量约占85%。表4显示了被撤销论文数量排名前10的国家。中国和美国的被撤销论文数量最多,远高于其他国家。中美两国的被撤销论文量约占40%,这与其论文产出基数巨大也密切相关。印度和日本的被撤销论文数量也超过500篇。其他国家的被撤销论文数量在200~400篇之间。被撤销论文在国家分布上具有明显的集中趋势。不同国家的论文被撤销的原因也大相径庭,中国的研究论文大多因错误和重复被撤销,美国的研究论文大多因错误和不可再现被撤销。

2.4 撤销时间分析

自论文发表至其被撤销,存在一定的时间周期,可以将这个时间周期称为撤销时滞或撤销周期。Retraction Watch标注了论文的发表日期和撤销日期,能够方便地计算撤销周期,由此统计得到被撤销论文的平均撤销时滞为1095天(约3年)。2005年之前,被撤销论文的平均撤销时滞较长,约为2437天。2005年以后,被撤销论文的平均撤销时滞变短,约886天,特别是2015年以后的平均撤销时滞更短,仅为302天。论文被撤销的速度正变得越来越快。按撤销原因来看撤销时滞,存在授权问题的论文的平均撤销时滞为734天,因抄袭、错误和原因不详而被撤销的论文,其撤销时滞分别为812、856、802天,造假论文的平均撤销时滞最长,达到1598天。造假论文更不容易被发现,因此撤销时滞最长。

表4 被撤销论文量排名前10的国家的论文被撤销原因统计

表5 被撤销论文的平均撤销时滞

3 应对策略研究

科研诚信制度化建设包括预防、惩治、管理、保障等方面,是一个系统工程。其中,后端处理和前端治理同等重要。科研诚信建设需要多方参与,科研机构、基金资助机构、专业学会、期刊出版商和研究人员都应遵循相应的学术规范,维护科研诚信。通过对国内外现有学术不端治理研究的比较、吸收,本研究提出可以从4个方面着手推进,有效治理学术不端行为:(1)依靠宣传教育,从科研人员的职业生涯发展角度进行科研诚信教育;(2)科研诚信建设不能仅靠一个部门或一种期刊,需要多方合作,建立共同治理的机制,将研究机构、基金资助机构、学术出版机构、科研人员等利益相关方紧密结合起来共同推进,才能够取得良好的效果;(3)学术不端治理需要长效机制,是常态化工作,体现于科研及出版的方方面面;(4)公开透明是推进科研诚信建设的有力工具。因重复、错误、不可再现、造假是论文被撤销的主要原因,笔者认为:通过合理采用查重工具可以有效减少重复这种显性、易识别的学术不端问题;而对于不可再现、造假等不易识别的学术不端问题,则需要从科研诚信教育、多主体的合作治理和长效体制机制建设方面入手。此外,数据问题是论文被撤销的主要原因之一,因此,促进科学论文相关数据的公开透明更加必要。

3.1 基于职业成长的科研诚信教育

Benos等[11]在科学知识的治理中提出基于自我职业管理的模型(Model Based on Professional Self-Regulation)来应对学术不端,该模型的核心为个人的职业声誉。以声誉为核心的非正式机制一直以来在维护学术生态环境中起到了重要作用。在科学研究的生产阶段,基于造假势必损害声誉的考虑,研究者的学术道德能防止其出现学术不端行为。在论文发表前的同行评议环节,尽职的同行评议也能有效防止学术不端。基于个体自我管理的模型特别依赖于对科研规范的遵守,强调个人的学术道德信念。

此外,科学道德建设理应结合到高等教育中也是学界共识[16]。美国高校和与研究院开展的负责任研究行为(Responsible Conduct of Research,RCR)教育可以说是这方面的典范。RCR涵盖了科研事业的重要阶段和内容,针对本科生、研究生以及不同层次的研究人员,主题涉及9个方面:科研合作,利益冲突和承诺管理,数据采集、管理、共享和所有权、人类研究保护,实验动物福利,导师指导,同行评审,出版实践和作者责任,研究不端行为[17]。在科研诚信教育的形式和方法方面,美国高校结合学科特色,采用的教育形式主要包括研讨班、讨论会、系列讨论与讲座、科学道德论坛、发证书、案例库、主题报告等[18]。

3.2 基于中心化模型的多方合作治理

Montgomery等[19]提出从科学研究活动的组织领域(Organizational Field)和机构逻辑(Institutional Logic)的协同进化角度讨论科研伦理的变化。其中组织领域和机构逻辑这两个重要的概念,也成为中心化管理模型治理学术不端的基础。学术研究组织领域的参与主体有:供应方(职业科学家、研究团队、个体研究者等)、资源方(大学、公共及私营基金组织)、消费方(其他研究者、决策者、组织领导、商业公司等)及其他主体(期刊编辑、学会等)。机构逻辑则塑造了领域内行为者的认知准则和行为信仰,是个人及组织的身份认同和价值观的基础。Montgomery 等[20]提出将学术不端类比为“病毒”,引入Leydesdorff的“产学研三螺旋”模型治理学术不端,强调多参与主体共同管理和控制被撤销论文的传染效应。

中心化的管理模型设想存在一个管理机构,它应拥有全部撤销数据,能够主动为与学术不端研究相关的科学家发出警报。从本质上讲,个体视角和组织视角的治理机制分别强调了责任和干预,即自我职业管理和外部监督。中心化的管理模型强调多参与主体合作管理、控制、治理学术不端。在该合作模型中,撤销声明应首先报告给中心组织,该中心组织可由各利益相关主体协商产生。然后,基于中心化的管理模型,该中心组织将撤销声明推送给相关的科学家。中心化组织模型的设想能够解决基于个体自我管理的模型中由于非中心化造成的撤销标识不规范、声明分发不统一、研究者并不能保证其引用的参考文献并未被撤销的问题。尽管中心化管理模型仍是研究者的构想,实践中也还没有相应的应用实例,美国科研诚信办公室(Office of Research Integrity, ORI)与高校、科研机构、学(协)会、专业团体等合作建立资源共享机制,寻求协同治理的实践可为中心化管理模型的未来发展提供很好的应用条件。

3.3 学术不端治理的制度建设

许多国家的实践表明,科研诚信建设都依赖于科研管理制度的保证。通过完善科研管理制度,可以有效减少学术不端行为的发生[21]。20世纪80年代以来,美国形成了较完备的学术不端治理体系;赵婷婷等[22]总结了美国学术不端治理的体系结构、职责分工及运行机制。陈翠荣等[23]认为美国研究生学术不端监管机制的设计理念注重学术道德自律与他律,注重过程监管、多元监管。在我国治理学术不端的制度建设方面,陈玉国[24]提出从制度、规范、技术层面构建学术不端行为的防范体系;邓瑶等[25]的问卷调查结果显示,虽然我国科技期刊采取了相关学术不端防范措施,但防范程度参差不齐,须在制度建设、查重方式、惩戒措施方面加强和完善;焦爽等[26]提出建立学术不端共享信息数据库,健全学术不端问责制度、被撤销论文管理以及上报制度,建立对被撤销论文作者的管理体系。

经过20多年不断修改、完善政策制度和程序,ORI成为政治与科学相结合的“边界组织”典范[27],在科研诚信建设与学术不端治理实践中享有盛誉,形成了一套完备的运行机制。关于学术不端行为的治理政策,ORI不仅从4方面进行全面规定:学术不端行为界定及认定标准、机构的责任、审查和调查的处理程序、对举报人的保护措施等,而且赋予管理机构在治理学术不端行为时可采取11项政策工具的权力[28]。总体来看,国内对学术不端行为的治理实践和研究还不成熟,因此,ORI的相关政策实践可以为国内科研诚信制度建设提供很好的参考。

3.4 公开透明的学术出版

公开透明对于科学进步至关重要。保证研究过程、研究论文及数据的透明度,使科学研究过程更注重协作、共享、重用,有利于科研诚信建设,也有利于科技进步。传统的学术出版,论文与数据相互割裂,很难发现有效数据之间、数据与论文之间的联系,降低科学交流的效率。低透明度的学术出版,不仅妨碍科学交流中数据的交换与共享,也存在学术不端的潜在风险。开放科学的兴起,利用技术手段使研究活动更具协作性和开放性。科研诚信[29]是开放科学的重要议题,开源软件、开放获取、开放数据、开放同行评议等开放科学运动的理念及技术力量正使得科研诚信建设具有了更多可能性。

开放科学中心(Center for Open Science,COS)即是开放科学运动的先锋。开放科学中心是2015年启动的旨在提高研究的开放性、完整性和可重复性的非营利性技术机构。目前已有4800多种期刊[30]加入COS倡导的透明度和开放性促进(Transparency and Openness Promotion,TOP)指南。TOP指南为开放科学框架建立了可供所有期刊使用的数据共享政策,主要从3个层面增加研究的严谨性。第1个层面:披露[31]。文章必须说明研究结果的关联数据是否可用,如果可用,如何访问它们。第2个层面:强制公开。文章必须在可信存储库中共享研究结果的关联数据。第3个层面:验证共享数据是否可重复。必须向第三方提供共享数据,以验证它们是否可再现论文的研究结果。TOP政策包括8项内容:引文标准、数据、分析方法、代码和研究材料透明度、设计和分析过程透明度、预先登记研究计划、分析计划的预注册、重复性研究。

4 结语

本研究发现:重复、错误、不可再现、造假、数据问题是论文被撤销的主要原因;中国论文的被撤销原因以错误和重复为主,美国则以错误和不可再现为主。这些发现对于针对性治理学术不端具有重要意义,例如,加强在论文审稿阶段的重复性检测,应能大幅减少学术不端行为的产生。学术及出版行业对学术不端论文的反应正变得越来越迅速,学术不端论文从发表到被撤销的时滞正变得越来越短;同时,造假论文更不容易被发现,撤销时滞最长,未来需要加大对造假论文的监测力度。

科研诚信建设是个系统工程,涉及预防、惩治、管理、保障等方面,并且需要多方合作,建立长效治理机制。对于诸如重复等易识别的学术不端行为,采取相应的技术手段和控制流程有望有效防控;对于诸如不可再现、造假等不易识别的学术不端行为,则需要从科研诚信教育、多主体的合作治理和长效体制机制建设方面入手。此外,促进科学数据的公开、透明对于应对与数据问题相关的学术不端非常必要和有效。

猜你喜欢

时滞不端诚信
关于采用《科技期刊学术不端文献检测系统(AMLC)》的声明
随机时滞微分方程的数值算法实现
论文作者学术不端行为类型
针对输入时滞的桥式起重机鲁棒控制
《中国粮油学报》关于学术不端稿件的认定和处理办法
不确定时滞奇异摄动系统的最优故障估计
美好生活离不开诚信
我们和诚信在一起
Application of the Good Faith Principle to the SCS Arbitration Initiated by the Philippines Against China
《中国医疗美容》学术不端检测方法