PubMed数据库撤销论文文献计量分析
2016-03-26陈小清邢美园
■陈小清 邢美园
浙江大学医学院附属第一医院图书馆,浙江省杭州市上城区庆春路79号 310003
科学界具有自我净化和纠错机制,根据科技期刊论文错误轻重程度不同采取勘误、更正、修订、增补和撤销等净化措施,而论文撤销是其中最严重的一种[1]。论文撤销是指已发表的论文,经读者或者审稿人举报,在调查后被证实违背了科研道德规范,应作者或主编要求对其进行撤销,期刊编辑部一般以“撤销声明”正式宣告对某篇文献的撤销[2]。
近年来,撤销论文受到学术界广泛关注。国际医学期刊编辑委员会1987年首次提出,对不适宜在文献资源中继续保存或者有错误的学术论文,通过撤销稿件的方式对其进行处理[3];出版道德规范委员会(The Committee on Publication Ethics,COPE)专门制订了编辑行为准则[4]和撤销指南(以下简称COPE指南)[5];2010年美国记者Oransky和Marcus创建了“Retraction Watch”网站,致力于监测撤销论文[6]。 2015 年,BioMed Central、Springer、Elsevier三大出版商撤销旗下杂志中我国发表的科研论文百余篇,引起我国科学界高度重视,中国科协、教育部、科技部等七部门特联合制定了《发表学术论文“五不准”》。一些大型科学文献数据库(如Web of Science、PubMed、ScienceDirect等)逐步加强撤销论文的管理,对其收录的撤销论文及撤销声明进行规范化标注,以方便查阅者及时获取撤销信息,降低学术影响力[7]。
我国有关撤销论文的研究较少,从文献计量角度进行分析的文章更少。2011年中国科学院的刘红等[2]率先对撤销论文进行研究,他们统计分析了ScienceDirect数据库1993—2010年间的撤销论文。随后,中国科学技术信息研究所的姚长青等[8]统计分析了Web of Science数据库2003—2012年间的撤销论文,张晴等[9]统计分析了CNKI数据库建库至2014年来国内被撤销的论文;青岛大学的姜天华等[10]统计并对比分析了至2013年PubMed数据库和国内常用数据库的撤销论文。撤销论文涵盖科学共同体各个领域,各数据库收录期刊范围不同,故选择不同数据库进行分析,结果也会有所差异。已有研究中仅姜天华等以PubMed数据库为数据源,但是其仅简要统计了撤销论文发表时间分布和引用情况,主要统计分析PubMed数据库中国期刊上的撤销论文及这些文章在国内数据库处理情况,以对比分析国内数据库与PubMed对撤销论文处理方法的异同。本文从PubMed数据库收集撤销论文,从文献计量学角度研究该库自建库以来撤销论文总体情况和分布特征,考察我国学者科研论文被撤销情况及其学术影响力,以期提高科研工作者对撤销论文的认识和警惕,增强研究者遵守科研道德规范意识。
1 数据来源与方法
PubMed数据库最早实现对撤销论文及其撤销声明的标注,根据学术不端论文的不同原因和情况,设有“Retracted Publication(已撤销出版物)”“Retraction of Publication(撤销出版声明)”“Published Erratum(出版更正)” “Duplicate Publication(重复出版)” “Corrected and Republished Article(校正和再版论文)”等类型。本文通过检索式 “Retracted Publication[Publication Type]”“Retraction of Publication[Publication Type]”检索该库中所有被撤销论文及撤销声明,检索时间截至2015年5月12日,对这些文章的时间、撤销率、第一作者国别、来源期刊、被引次数及中国被撤销论文情况等方面进行统计分析。
2 结果与分析
数据库中共检索到撤销声明记录3853条,撤销论文3676篇,其中免费获取全文论文1494篇,占40.64%。最早被撤销的论文发表于1959年,1966年被撤销[11],第二篇被撤销论文发表于1973年,1977年被撤销[12]。自1973年起,除1974年外,至今每年都有文章被撤销。
2.1 撤销论文整体走势
每年论文撤销数是指当年发表随后又被撤销的论文总数,撤销时间是指撤销声明发布时间,每年论文撤销率是指当年发布的撤销声明总数占当年出版的论文总数百分比[13]。
图1描绘了PubMed数据库中撤销论文增长趋势。2000~2013年被撤销的论文篇数迅速增长,2013年达581篇,约是2000年的25倍;论文撤销率由0.000044增长到0.000588,增长了约12.5倍。图2描绘了PubMed数据库中3676篇撤销论文发表时间分布。2010年发表的论文被撤销最多,达296篇;其次是2009年,有290篇。这可能与2009年COPE指南正式出版发行有关。论文撤销大概分为三个阶段:第一阶段1959~1988年,撤销论文数比较少,基本维持在10篇以内;第二阶段1989~2010年,这段时间撤销论文数迅速增加,并在2010年达到高峰;第三阶段是2011年后,这段时间撤销论文数呈下降趋势,主要原因是论文从出版到撤销是一个比较缓慢的过程,存在一定的时滞性。这一结果与姚长青等[8]对Web of science数据库撤销论文研究的整体走势相类似。
图1 历年撤销声明记录数及撤销率分布情况
图2 PubMed中3676篇撤销论文发表时间分布
2.2 撤销论文国家/地区和期刊分布
3676篇撤销论文共有3375篇文章列出了作者地址。这些文章第一作者分布在84个国家和地区,其中61个国家和地区的撤销论文均不超过15篇,超过90%的撤销论文分布在其余23个国家和地区。表1列出撤销论文20篇以上的国家,其中美国撤销论文最多,904篇;随后是日本、中国、德国和印度。
所有撤销论文共涉及1340种期刊,其中撤销论文只有1篇的期刊有784种,占58.51%;2~5篇的期刊有442种,占32.99%;6~10篇的期刊有67种,占5.00%;11~20篇的期刊有29种,占2.16%;仅18种期刊撤销论文在20篇以上(见表2)。2013年IF<1的撤销论文有185篇,涉及109种刊;IF 1~3有1028篇,涉及507种刊;IF 3~5有965篇,涉及275种刊;IF 5~10有624篇,涉及133种刊;IF 10~20有462篇,涉及58种刊。可见期刊被撤销的论文以5篇以下为主,且IF值主要在1.0~3.0间。
撤销影响因子(Retracted Impact Factor,RIF)是用来评判期刊负影响的指数,RIF越大,说明该刊该年刊载的论文对学术界的负影响越明显,越应该引起相关领域研究者的重视[14]。因实证研究仅验证2011年期刊RIF近似衡量公式,故本文以2011年IF作为参考。表2显示,撤销论文20篇以上的18种期刊中Journal of biological chemistry撤销论文最多,有 97篇,其次是 Proceedings of the National Academy of Sciences of the United States of America和Science;Nature、Cell、Science三本期刊 2011 年 RIF值较高,负影响力较大。可见,影响力高的期刊,并不代表其被撤销论文多。例如期刊JAMA被撤销论文仅3篇,但是其2011RIF值为59.191。
2.3 撤销论文被引情况
论文撤销后有被引用现象。PubMedPlus可以对PubMed的检索结果进行分面检索与聚类分析,笔者以撤销论文在该平台中被引频次为基础,列出前15篇高被引论文,并检索其在Web of Science和Scopus数据库中被引情况(检索时间2015年5月19日),详情见表3。
2.4 我国被撤销论文统计
PubMed数据库中撤销论文第一作者是我国科研工作者的有383篇(不含台湾、香港和澳门),发表在全世界291种期刊上,主要分布在我国24个省市和直辖区,以上海居多。图3绘制了我国至2014年被撤销论文的发表时间分布,表4列出这383篇撤销论文的第一作者地区分布。
我国第一篇撤销论文由中日友好医院1995年发表在Acta radiologica,并于1999年被撤销[15],比国际上第1篇论文撤销时间晚30余年。2004年前,我国年撤销论文均在5篇以下。2004~2014年间,我国撤销论文数量迅速增加。2013年达到高峰,有58篇,比2004年增长了7倍多。笔者认为,导致这种现象原因主要有两方面,一是科学界自我净化能力增强,对论文的科学性、严谨性和诚实度等要求越来越严格;二是,每年国家发表论文总量在不断增加。2004年我国共发文108141篇,到2014年我国发文452877篇,增长了3倍多[16]。
表1 撤销论文在20篇以上的23个国家/地区
表2 被撤销论文20篇以上的18种期刊
表3 Top15高被引撤销论文在不同数据库平台被引情况
表4 我国撤销论文地区分布
图3 PubMed数据库中我国被撤销论文发表时间分布(至2014年)
3 讨论
3.1 撤销原因
本文统计结果显示尽管撤销论文只占论文总量的一小部分,但是历年论文撤销率开始明显增多,2000年后论文撤销率增长尤为迅速,2013年约是2000年的12.5倍。全球撤销论文主要集中在美国、日本、中国、德国和印度,均超过200篇,五个国家撤销论文总数约占总体57.8%。这与姚长青等[8]统计Web of Science数据库中撤销论文稿源国排序略有不同。而我国近10年来年撤销论文数增长7倍多,上海和湖北最多,均超过40篇。
数据库收录范围的扩大、年发文量的增加,一定程度上均会使撤销论文增多。那么,为何文章发表后还会被撤销呢?COPE指南作者Wager E与Williams P通过分析Medline1988~2008年870篇撤销论文总结出12种撤销原因:诚实的错误、不能再现成果、编辑部出错、重复发表、剽窃、未许可的数据/作者争议、数据造假、数据错误、道德问题、科学不端、不准确、未说明[17]。研究显示因诚实的错误而被撤销的论文最为常见,其次是剽窃与重复发表[18-21]。2015年我国科研论文因同行评议造假被BMC、Springer、Elsevier大规模撤销。 同时 Stretton S等研究发现因剽窃而被撤销的论文中,第一作者来自低收入国家比来自高收入国家的论文多,而且第一作者母语为非英语国家比母语为英语国家的论文多[22]。论文被撤销,关键在于作者科研态度不够严谨,妄图投机取巧、弄虚作假。如果研究者有意识的针对性的检查研究方法与实验数据,有些学术问题是完全可以减小甚至是避免的。论文被撤销不仅影响个人名声,还影响单位的学术声誉,相关部门可设置惩处方案及开展相关信息素养培训讲座,加深学者对这一现象认知,提高其防范意识。
3.2 平均撤销时滞
撤销时滞是指文章从发表到撤销通知发布之间的时间差。本文统计撤销论文时间分布显示2013年后撤销论文有所减少,这主要归结于撤销的时滞性。期刊先出版再评价的出版模式[23],论文受关注度不同,使得文章撤销时滞不一。有的文章发表后需要很长一段时间才能被撤销,如Bezouska K等1994年发表在Nature上的论文2013年被撤销[24],撤销时滞长达19年;而有的文章可能发表没多久就被撤销,如Ali SM等2013年5月发表在Journal of contemporary dental practice上的论文于2013年9月就被撤销[25],撤销时滞仅4个月。
Trikalinos NA[26]等通过研究高影响因子高被引撤销论文得出平均撤销时滞为28个月,并且资深学者的论文被撤销比初级学者需要时间更长(分别为79个月、22个月)。Steen RG等[27]研究得出被撤销论文平均在其发表后第32.91个月被撤销,其中2002年前发表的论文平均撤销时滞为49.82个月,2002年后为23.82个月。Foo JY[28]研究得出2000年前造假论文需52.24个月被撤销,2000年后需33.23个月。Singh HP等[29]统计发现2009~2013年发表论文撤销所需要时间比2004~2008年短。可见,撤销论文处理时间越来越快,在一定程度上也降低了危害,加速了科学共同体的净化。
3.3 撤销论文学术影响力
结果显示,超过90%期刊撤销论文少于5篇,其中 J Biol Chem、Proc Natl Acad Sci u s a、Science、Anesth Analg、Nature五种刊撤销论文最多,均超过55篇。撤销论文所在期刊IF值主要集中在1~3之间,且IF<5的期刊撤销论文数比IF≥5期刊多。可见,一定范围内低影响因子期刊撤销论文更多,这与Steen RG[30]研究结果基本一致。通过近似RIF值可看出IF越高的期刊,其撤销论文负影响力越大。同时有研究表明高IF期刊因造假而被撤销的论文偏多[31],低IF期刊因剽窃和重复发表而被撤销的论文偏多[21,32]。发表论文期刊IF值高低关乎个人利益与学术生涯,也代表国家技术进步和创新发展,科研人员应严格遵守科研诚信道德规范。
检索结果提示论文撤销后仍会被引用,并且同一撤销论文在不同数据库中引用次数不尽相同。陈超美等[13]研究发现论文撤销后平均被引时间为4年。Steen RG[30]统计分析PubMed数据库中2000~2010年撤销论文得出期刊IF值越高其撤销论文被引次数越多,高IF期刊论文被撤销后平均被引18.4次,低IF期刊论文被撤销后平均被引3.6次。撤销论文仍存在一定价值而被使用,会误导科学家判断研究现状。笔者认为论文撤销后不宜再正向引用,且COPE指南指出撤销论文的结论不能作为参考依据;反面引用时其引用格式应与其它引文加以区分,各期刊应统一。期刊编辑部应做好把关,严格核实参考文献;同时数据库对撤销论文应统一标识,易于查阅者识别,以防止撤销论文中错误的观点、数据和结论等扩大,给相关学术领域带来破坏性的影响,尽可能降低其学术影响力。
4 小结
撤销论文净化了学术氛围,保证了科学研究文献资源的可靠性。本文通过对PubMed数据库撤销论文的文献计量分析,揭示了国内外论文撤销现状,了解了撤销论文一些基本特征。近来国际期刊自我检查不断加强,撤销论文越来越多,反映了研究者缺乏严谨科学态度及科研诚信意识,值得深思。正如赵金燕[1]所说在学术环境净化的路途中,有争议、有试错、有假想,需要研究者、编辑部、数据库出版商及相关科研部门等同仁共同努力与探索,去发掘新的思想与方法对症下药。
[1] 赵金燕.撤销论文对于全球防治学术不端行为的意义和遏制作用[J].中国科技期刊研究, 2015,26(6):556-560.
[2] 刘红,胡新和.国际学术期刊撤销已发表论文的实证分析——以ScienceDirect数据库为例[J].中国科技期刊研究,2011,22(6):848-852.
[3] Retraction of research findings.International Committee of Medical Journal Editors[J].CMAJ, 1988,138(7):596.
[4] COPE code of conduct[EB/OL].[2015-07-30].http://publicationethics.org/resources/code-conduct.
[5] Wager E, Barbour V, Yentis S, et al.Retractions: guidance from the Committee on Publication Ethics(COPE)[J].Croat Med J, 2009,50(6):532-535.
[6] Retraction Watch[EB/OL].[2015-07-30].http://retractionwatch.com/.
[7] 范少萍,张志强.国外撤销论文研究综述[J].编辑学报,2014,26(5):496-502.
[8] 姚长青,田瑞强,杨冬雨,等.撤销论文及其学术影响研究[J].中国科技期刊研究, 2014,25(5):595-604.
[9] 张晴,姚长青,潘云涛,等.中文学术期刊撤销论文研究[J].中国科技期刊研究, 2014,25(5):611-615.
[10] 姜天华,陈静,耿波,等.数据库中关于撤销论文处理的实证分析——PubMed数据库与国内数据库的对比[J].中国科技期刊研究, 2014,25(5):616-619.
[11] Goldstein L,Eastwood JM.On the primary site of nuclear RNA synthesis.A retraction[J].JCell Biol, 1966,31(1):195.
[12] Gullis RJ,Rowe CE.Stimulation of phospholipase A2 of synaptosomes of guinea-pig brain by noradrenaline and other amines[J].Biochem Soc Trans, 1973,1(4):849.
[13] Chen c, Hu ZG, Milbank J, et al.A visual analytic study of retracted articles in scientific literature[J].Journal of the American Society for Information Science and Technology, 2013,64(2):234-253.
[14] 范少萍,张志强.期刊撤销影响因子的构建及其与期刊影响因子的关系[J].大学图书馆学报,2014,32(2):76-84.
[15] Wu W,Thuomas KA.Pituitary microadenoma.MR appearance and correlation with CT[J].Acta Radiol, 1995,36(5):529-535.
[16] SCImago Journal&Country Rank[EB/OL].[2015-07-30].http://www.scimagojr.com/countrysearch.php? country=CN&area=0.
[17] Wager E, Williams P.Why and howdo journals retract articles?An analysis of Medline retractions 1988—2008[J].J Med Ethics, 2011,37(9):567-570.
[18] Steen RG.Retractions in the scientific literature:is the incidence of research fraud increasing[J].JMed Ethics, 2011,37(4):249-253.
[19] Decullier E, Huot L, Samson G, et al.Visibility of retractions:a cross-sectional one-year study[J].BMC Res Notes, 2013,6:238.
[20] Damineni RS, Sardiwal KK, Waghle SR, et al.A comprehensive comparative analysis of articles retracted in 2012 and 2013 from the scholarly literature[J].J Int Soc Prev Community Dent, 2015,5(1):19-23.
[21] Madlock-Brown CR, Eichmann D.The(lack of) impact of retraction on citation networks[J].Sci Eng Ethics, 2015,21(1):127-37.
[22] Stretton S, Bramich NJ, Keys JR, et al.Publicationmisconduct and plagiarism retractions: a systematic, retrospective study[J].Curr Med ResOpin, 2012,28(10):1575-1583.
[23] Giles J.Open-access journal will publish first,judge later[J].Nature, 2007,445(7123):9.
[24] Retraction:Oligosaccharide ligands for NKR-P1 protein activate NK cells and cytotoxicity[J].Nature, 2013,500(7463):490.
[25] Retraction notice to:influence of post fit and post length on fracture resistance:an in vitro study.J Contemp Dent Pract 2013;14(3):496-500[J].J Contemp Dent Pract, 2013,14(5):1008.
[26] Trikalinos NA,Evangelou E, Ioannidis JP.Falsified papers in high-impact journals were slowto retract and indistinguishable from nonfraudulent papers[J].JClin Epidemiol, 2008,61(5):464-470.
[27] Steen RG,Casadevall A, Fang FC.Why has the number of scientific retractions increased[J].PLoS One, 2013, 8(7):e68397.
[28] Foo JY.A retrospective analysis of the trend of retracted publications in the field of biomedical and life sciences[J].Sci Eng Ethics, 2011,17(3):459-468.
[29] Singh HP, Mahendra A, Yadav B, et al.A comprehensive analysis of articles retracted between 2004 and 2013 from biomedical literature-a call for reforms[J].J Tradit Complement Med, 2014,4(3):136-139.
[30] Steen RG.Retractions in themedical literature:howcan patients be protected from risk[J].JMed Ethics, 2012,38(4):228-232.
[31] Steen RG.Retractions in the scientific literature:do authors deliberately commit research fraud[J].JMed Ethics, 2011,37(2):113-117.
[32] Fang FC,Steen RG,Casadevall A.Misconduct accounts for the majority of retracted scientific publications[J].Proc Natl Acad Sci U SA, 2012,109(42):17028-17033.