AMLC与PSDS检测医学论文重复率结果分析
2016-06-01彭松蔡纲胡欣
彭松 蔡纲 胡欣?
摘 要:本文选择《安徽医学》投稿论文作为研究样本,利用中国知网学术不端文献检测系统(AMLC)与万方数据论文相似性检测系统(PSDS)对论文进行检测,比较分析检测结果。通过比较分析检测医学论文重复率的结果发现医学论文重复率较高,AMLC与PSDS检测差异显著,单篇检测结果差异较大。
关键词:论文;医学;重复率;中国知网;万方数据
中图分类号:G213 文献标识码:A 文章编号:1672-8122(2016)05-0069-02
一、引 言
2015年3月27日,BioMed Central撤回了43篇“伪造”同行评审的论文,其中41篇来自中国,作者单位涉及30余家国内知名三甲医院,学术造假、论文抄袭瞬间再次成为社会舆论的焦点。急功近利、学术浮躁是我国学术界的固有顽疾,而因为毕业、晋升、竞争的压力,作者进行学术造假、论文抄袭的现象较为普遍。
为了净化学术环境,彻底消除学术造假、论文抄袭,政府在政策方面出台了相关规章制度规范学术研究行为,数据库商等软件行业则从技术上寻求解决,其中论文相似性检测系统就是反抄袭、反剽窃的有效技术之一[1]。目前,国内应用较广、影响较大的论文检测系统为中国知网学术不端文献检测系统(AMLC)与万方数据论文相似性检测系统(PSDS),这些检测系统对医学论文的反抄袭、反剽窃起到了积极的作用,有效地遏制了学术造假与论文抄袭。2010年,《安徽医学》编辑部开始启用AMLC,对于论文重复率超过30%的稿件直接退稿。2014年底,《安徽医学》网络投稿平台正式启用,同时一并启用PSDS。自此,《安徽医学》所有稿件必须经过网络投稿平台注册,且必须通过AMLC与PSDS的同时检测,更加严格地控制论文的重复率(不得超过20%)。本文利用AMLC与PSDS对《安徽医学》登记接收的论文进行论文重复率检测,并对检测结果进行统计分析,现报道如下。
二、研究资料与方法
1.研究样本。选择2015年3月15日至2015年4月15日《安徽医学》网络投稿平台登记接收的论文作为研究样本。排除作者、单位等信息不全的论文;如有任一重复率检测系统(万方、知网)无法检测的论文,则排除该论文。
2.分析方法。将符合要求的研究样本,分别上传至AMLC、PSDS进行检测,对AMLC与PSDS的检测结果进行定量与定性分析,并进行统计学比较分析。
3.分析指标。选择论文重复率作为本文定量分析指标,即AMLC文字复制比和PSDS论文相似比。参照《安徽医学》处理稿件经验,将论文重复率≤20%作为正常稿件,论文重复率>20%作为抄袭嫌疑稿件。
4.统计学处理。应用SPSS 15.0软件对本文数据进行统计分析,定量分析指标以均数±标准差( )表示,比较分析采用t检验,定性分析指标以例(百分比)表示,比较分析采用χ2检验,以P<0.05为差异有统计学意义。
二、调查结果分析
1.研究样本基本情况。2015年3月15日至2015年4月15日《安徽医学》网络投稿平台共登记接收论文226篇,其中207篇论文符合本研究要求,纳为研究样本。稿件来源:安徽省省内稿件115篇,占55.56%;省外稿件92篇,占44.44%。稿件学科:临床医学类稿件167篇(含基础医学1篇),占80.68%;护理医学类稿件18篇,占8.70%;医学教育、卫生管理、公共卫生等稿件共22篇,占9.73%。
2.重复率检测结果比较。经过AMLC与PSDS的系统检测,AMLC的论文重复率平均为(16.61±17.05)%,PSDS的论文重复率平均为(10.77±15.69)%。AMLC与PSDS的检测结果进行比较,差异有统计学意义(t=-8.050,P=0.000)。
3.重复率定性检测结果比较。AMLC检测出141篇正常稿件,占68.12%,抄袭嫌疑稿件66篇,占31.88%。PSDS检测出175篇正常稿件,占84.54%,抄袭嫌疑稿件32篇,占15.16%。AMLC与PSDS的定性检测结果进行比较,差异有统计学意义(P>0.05)。如表1所示。
三、讨论与建议
1.医学论文重复率较高。通过AMLC与PSDS的共同检测,发现医学论文的重复率处于较高水平。AMLC的重复率为(16.61±17.05)%,论文重复率>20%的稿件占31.88%;PSDS的重复率为(10.77±15.69)%,论文重复率>20%的稿件占15.16%。王福军等[2]对《第三军医大学学报》《遵义医学院学报》来稿文字复制比进行统计分析,AMLC检测论文重复率>20%的稿件占20.3%,PSDS检测论文重复率>20%的稿件占15.7%,与本文分析结果相似。中国知网对已发布的期刊文献进行学术不端文献检测,发现大量存在文字重合率超过30%的文章。不可否认,论文抄袭、一稿多投、重复发表等导致了医学论文重复率的高水平。一方面是我国科研人员普遍对学术不端行为认识不足,抵制学术不端的意识不强,导致学术不端行为频繁发生;特别是剽窃抄袭他人研究成果、数据造假、论文重复发表,直接导致了论文的高重复率。另一方面,不合理的学术评价、学术体制的误导和法律规范的缺少,导致了论文抄袭等学术不端行为的发生[3]。
2.AMLC与PSDS检测差异显著,单篇差异较大。通过统计分析本研究的检测结果,发现AMLC与PSDS检测的论文重复率存在统计学差异,AMLC检测的论文重复率明显高于PSDS;且AMLC检测结果中,论文重复率>20%的稿件比例显著高于PSDS,差异亦有统计学意义。另外,统计结果显示单篇论文AMLC与PSDS的检测结果差异较大。例如:稿件编号为2015-688的论文,AMLC检测论文重复率为42.70%,PSDS检测论文重复率仅为7.70%,相差达35.00%;稿件编号为2015-656的论文,AMLC检测论文重复率为48.10%,PSDS检测论文重复率为82.80%,相差达34.70%。对于学术论文而言,产生以上差异的主要原因为检测资源库的时间跨度差异、对比范围差异与对比期刊差异。AMLC资源库的期刊回溯到1915年,而PSDS资源库的期刊仅回溯到1985年,时间跨度的差异直接导致两者资源数量的巨大差异(AMLC期刊论文3000万篇,PSDS期刊论文2000万篇)[1]。AMLC对比范围包括中国学术期刊网络出版总库、中国博士硕士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国专利全文数据库、互联网资源、部分英文数据库、港澳台学术文献库、优先出版文献库等,而PSDS对比范围包括中国学术期刊数据库、中国学位论文全文数据库、中国学术会议论文数据库和 中国学术网页数据库等[4],由此产生的差异显而易见。另外,中国知网、万方数据近年开始与多种学术期刊签订了独家收录协议,使得AMLC与PSDS的资源数量出现了差异。中国知网收录的文献类型多样,学科覆盖范围广,独家收录期刊种类越来越多;然而万方数据独家收录中华医学会下属的“中华系列”“中国系列”“国际系列”高质量期刊,这一优势使得万方数据在医学学科出类拔萃[5]。
3.建议。(1)统一检测标准。无论是AMLC,还是PSDS,他们都有各自的核心检测技术与对比范围,缺乏统一的标准,导致检测结果的巨大差异。因此,建议加强学术不端检测系统建设,尽快统一国内的检测标准,如:统一对比范围,互相开放独家收录期刊的文献资源,统一增加图书、图片与外文文献资源,统一扩展检测文献的常用格式等;(2)作者严于律己。急功近利、学术浮躁是造成我国学术不端行为的根源,而作者自身缺少学术道德,对学术不端行为认识不足,对论文抄袭的危害估计不足,是造成医学论文高重复率的直接原因。因此,医学论文的作者应严于律己,加强对学术不端的认识,主动拒绝论文抄袭,成为执行道德原则和道德规范的学术行为主体[6],这是预防医学论文抄袭的重要基础;(3)编者严格把关。医学期刊的编辑与审稿专家应严格把关,客观、公正、科学的评价论文,这是预防医学论文抄袭的关键。审稿专家在对医学论文创新性和内容进行科学评价的同时,需加强对论文研究方法和数据的审阅,重点审查一稿多投、抄袭、篡改数据等不端行为[3]。期刊编辑对作者的投稿应进行多次重复率检测,投稿时必须进行首次检测,修回论文需进行再次检测,刊用论文在正式发表前仍需检测,以避免作者一稿多投或重复发表。编辑在多次检测过程中,应使用多个数据库,首次检测采用一个数据库(如AMLC),复测时采用两个或多个数据库(PSDS等)联合检测,尤其是医学期刊,多个数据库联合复测可以检索出独家收录的文献[7];(4)读者积极监督。谢燕等[8]认为学术成果的检验不是一次性完成的,期刊编辑、专家审阅仅仅是论文发表的入门审查,重要的是发表后在社会上接受实践检验。读者是学术期刊重要的服务对象,因此有必要将读者纳入医学论文的预防体系之中,加强医学论文抄袭的防范。医学期刊应鼓励读者积极参与学术不端监督,注意收集读者对发表论文的反映,重点关注已发表论文是否存在抄袭、一稿多投、重复发表等行为。
捏造数据、篡改数据和剽窃等学术不端行为严重败坏了学术风气,阻碍了学术进步,违背了科学精神和道德,抛弃了科学的真实诚信原则。学术不端行为的蔓延是不折不扣的负能量传播,给科学事业的发展带来了严重的负面影响。处在信息爆炸时代的科技期刊,其主要功能是站在对学术求新、对读者负责的社会视 角,对内容庞杂、数量巨大的作者来稿进行甄别和筛选,剔除垃圾信息,创造出更新更美的科学文化精品[9]。总之,学术期刊应积极承担起抵制学术不端行为的重任,编审人员不仅要善于利用现代技术手段进行审查、评价论文,同时要加强学术不端行为预防机制的建设,完善学术规范与学术道德教育,为读者、作者营造健康的学术环境。
参考文献:
[1] 李志明.知网、万方、维普论文相似性检测系统比较研究[J].大学图书情报学刊,2015(1).
[2] 王福军,冷怀明,谭修荣.AMLC与PSDS检测结果的比较研究[J].中国科技期刊研究,2014(9).
[3] 吴林娟.学术期刊出版机构对学术不端行为的控制[J].图书与情报,2011(6).
[4] 徐仲.两种学术不端检测系统的差异性及问题讨论[J].图书馆理论与实践,2014(8).
[5] 张宁.职称评审中学术不端文献检测系统之比较研究[J].图书馆工作研究,2014(11).
[6] 史书侠.学术不端文献的计量分析[J].中华医学图书情报杂志,2012(2).
[7] 曾玲,徐川平,吴开明.《重庆医学》拟刊用稿件二次查重结果分析[J].重庆医学,2013(29).
[8] 谢燕,钱俊龙,潘小伦等.从防范学术不端论文中提升编辑职业素养[J].中国科技期刊研究,2011(4).
[9] 陈锐锋.防治学术病,促使科技期刊健康发展[J].科技与出版,2013(8).
[责任编辑:东方绪]