代投论文的甄别与防范
2018-07-17王景周
■王景周
《暨南大学学报》编辑部,广东省广州市天河区黄埔大道西601号 510632
剽窃、伪造、篡改、不当署名、一稿多投、重复发表、代写、买卖等学术不端行为已被学界广泛关注。近年来,中国大规模国际论文被撤稿的主要原因是“涉嫌同行评审造假”。2017年4月,《肿瘤生物学》(TumorBiology)撤销了107篇涉嫌第三方机构代投和同行评审造假的中国作者已发表论文,这是因为施普林格(Springer)出版集团发现这些论文的不同作者、不同评审人使用相同的电子邮箱[1]。虽然国内学术期刊同行评议造假比较少见(中国编辑一般不会把文章发给作者推荐的审稿人审稿),但论文代投现象却比较普遍。
中国科学技术协会等部门发布的《发表学术论文“五不准”》[2]指出“论文代投”指论文署名作者未亲自完成提交论文、回应评审意见等过程,而由他人代理的行为。“代”的主体是署名作者之外的任何机构或个人,即本研究所指的“第三方”。由于语言障碍和信息的不对称性,很多人认同论文代投,尤其是英文期刊的论文代投,但代投者——第三方的出现使得论文发表变得异常复杂,从而滋生出各种学术不端行为。
编辑部采编系统中投稿者的个人注册信息及其体现出的共性和编码规则是发现代投论文的最重要线索。刘清海[3]基于1篇代投论文讨论了代写代投论文的基本特征;刘婷婷[4]和郑小虎等[5]分析第三方来稿的特点及防范措施;陈锐锋[6]通过1篇造假论文的发现过程提出加强作者信息审查的方案;张海燕等[7]和关珠珠等[8]提出通过作者注册信息及文章特征识别“枪手”论文及判别稿件真实性的方法。虽然论文中介代理问题已受到普遍关注,国家政策层面也在做积极调整和严厉处理,如2015年12月中国科学技术协会等部门发布了《发表学术论文“五不准”》,2017年1月国务院办公厅印发了《关于深化职称制度改革的意见》[9],2017年6月科技部在处置《肿瘤生物学》集中撤销107篇中国论文事件中强调,既查‘主犯’,也查‘从犯’,标本兼治,严惩学术造假[10]。但代投代发现象依然没有得到有效遏制,并且呈现出多样性、隐蔽性和复杂性,所以对论文代投代发现象的深入研究和治理依然具有重要意义。本文基于《暨南大学学报(自然科学与医学版)》和《暨南学报(哲学社会科学版)》(下文分别简称《暨南大学学报》和《暨南学报》)两个采编系统中2万余条注册信息,结合工作实践,分析论文代投的危害性和严重性,提出基于编辑部责任主体的多源信息、多渠道交叉验证策略,成功锁定部分规模大、代投时间长、成功率高的第三方机构,以降低代投论文进入稿件处理流程的可能性,在一定程度上避免各种深层次、强隐蔽性的衍生不端行为。
1 论文代投的严重性及危害
1.1 论文代投的严重性
(1) 国际论文集中撤稿的重要原因之一。2017年4月,《肿瘤生物学》期刊发表撤稿声明[11],撤销107篇涉嫌同行评议造假的已发表论文。此次撤稿的规模创国外学术期刊单次撤稿量、单期撤稿总量、中国学者遭集体撤稿总量等多项纪录[12],施普林格·自然出版集团大中华区总裁安诺杰[13]表示,《肿瘤生物学》利用2015年撤稿中掌握的虚假同行评审信息,反查2012—2016年该刊发表的所有文章,最终发现这批问题论文。施普林格·自然出版集团调查发现,多数被撤稿的论文作者是通过第三方投稿。2017年7月,科技部等部门联合召开《肿瘤生物学》集中撤稿调查处理新闻通气会,调查结果显示[14]:107篇论文中,95篇由第三方机构提供虚假同行评议专家或虚假同行评议意见。
(2) 国内论文存在严重代投现象。此次撤稿规模大,但仍只是冰山一角,还有很多期刊和论文存在类似问题。难道中文期刊就不存在类似问题?有人说“问题更严重,只是少有人去追究”[15]。笔者对《暨南大学学报》2017年第2期拟用稿《在变迹滤波方法下的MIMO雷达图像旁瓣抑制策略》进行终审时发现一校指出的问题依然没有得到解决,与责任编辑沟通后发现作者在自校环节中只修改了一处,即替换作者简介中的原始注册邮箱u*5904@163.com。对这篇文章的原始稿件、修回稿、自校稿进行比较,发现修回稿修改仔细,并且专门补充了两条出自《暨南大学学报》的参考文献,可见是有经验者刻意所为,但作者电话一直处于无法接通的状态。将作者注册信息中的身份证号码和手机号码在采编系统内进一步查询,结果令人吃惊(图1)。此外,对编辑部的两个采编系统进行排查,还发现了一些带有明显代投特征的电子邮箱,比如作者姓名全拼+tg@163.com,仅《暨南大学学报》系统中就有188条注册信息(数据统计截至2017-12-30)。
图1 问题账号系统内注册情况
(3) 代投机构运营时间长、成功率高、涉及面广。以疑似代投论文作者注册信息中的手机号139773844*9为例,百度139773844*9,该号码为论文代理平台才*城——大型文化创意服务平台(www.caizicheng.com,目前网址已无法打开)的联系电话,内含大量实时交易信息,比如:“低价转让已被《现代预防医学》正式采稿文章8800元”“转让已被《中华护理杂志》正式采稿文章15000元”等,最新交易区滚动显示“purui购买guilin05《贵州地质》期刊”等(数据采自2017-05-02才*城网站)。才*城网站的备案信息为桂ICP备12000381号。通过信息追踪发现,此论文代理中介至少已有11年(2006—2017年)发展历史(图2)。在维普资讯中文期刊服务平台(以下简称“维普”)高级检索中输入139773844*9,发现3篇内容完全不相关的论文;通过维普查询其中一篇论文中出现的电子邮箱jiankang200920*0@163.com,又得到3篇完全不相关的论文;通过维普检索其中一篇论文中出现的电话号码0773-21360*9,得到11篇完全不相关的论文,其中最早的论文发表于2006年。通过中国知网(China National Knowledge Infrastructure,CNKI)检索发现有1篇医学论文已发表于3种不同的期刊。
1.2 论文代投的危害
(1) 代投催生造假。论文代投是论文代写、论文买卖、有偿发表等灰色利益链上的关键环节。第三方代投机构受利益驱使,已由过去的语言服务发展到集论文代投、代写、代发的全流程服务,从而形成一个完整的产业链和买卖市场,为了确保代投论文的顺利发表,第三方代投机构还提供虚假同行评议信息,伪造同行评价意见,操纵评审结果等。这严重损害了我国科技界的国际声誉和广大科研人员的尊严[6]。
(2) 代投是一稿多投、一稿多发的重要原因之一。“论文录用或见刊”是委托人和代投机构完成金钱交易的前提,为增加论文发表的概率和缩短发表周期,第三方代投机构通常会“广撒网”。笔者将疑似代投论文上传至CNKI的学术不端检测系统(Academic Misdemean Literature Check System, AMLC),通过“稿件追踪”功能可发现不少稿件已多次投至不同期刊,其中投稿次数最高的一篇稿件已投稿19次。
图2 基于个人信息的不相干论文关系图
(3) 造成资源的极大浪费,打破科研生态圈的平衡。论文造假不仅损害中国科技界的国际声誉,导致低水平研究重复、垃圾论文成堆,更严重的是消解求真求实的科学精神,破坏公平竞争的学术规则,侵蚀着世界科技强国的建设基石[16]。
2 疑似代投论文的发现与甄别
2.1 发现的主体
第一主体人为新投论文入库操作者。投稿进入期刊在线处理系统后,“操作”选项显示修改、查重、查相似度、入库、退稿、重投、删除等功能,如果入库者为同一人负责,则较易查看雷同信息。如果由学科编辑分别入库,则不易发现共同信息,增加代投稿件发现成本。入库最好由副主编或资深编辑执行。第二主体人为学科编辑。学科编辑送审前一般会对论文内容进行初审。另外在稿件退修阶段,编辑与作者的沟通也是发现代投的关键环节,沟通过程中,尤其是针对文中存在的实质性问题的交流时,编辑更容易发现代投甚至代写情况。第三主体人为主编或副主编。主编终审时不能走马观花,流于形式。
2.2 发现的线索
个人注册信息和编码规则是发现代投论文的最重要线索。作为代投机构,稿件需批量处理,为便于记忆和管理,代投邮箱一般会有相对固定的编码规则,其邮件名称、用户名或密码等能够反映出一定关联性。
2.2.1录用前反常特征
(1) 一“名”多“稿”。同一作者同时或短时间内投稿1篇以上,且每次投稿注册邮箱均不同。
(2) 作者信息资料中,虚构身份证号码,全为某个数字或123456789123456789等;联系电话所属地与投稿作者单位所在城市不同,联系电话为空号,甚至是餐厅、美容院等单位的联系电话。
(3) 论文作者数量较少,个人信息不完备。
(4) 投稿论文中没有作者姓名及简介,正文双栏排版。
(5) 合著者属地和专业方向关联性差。
2.2.2录用后反常特征
(1) 要求更换主要作者、增补作者、更改作者署名顺序、更改作者联系方式和个人简介,或私自在修回稿中更改以上信息。
(2) 长时间不提交修改稿。这可能是因为一稿多投,稿件已被其他期刊录用或第三方与作者的合同已终止。
(3) 申请撤稿或延期发表。以文章内容有问题、样本量小、实验出入大为由,申请撤稿或延期发表。
(4) 以同义术语、语词更改论文题目、修改论文的引言部分内容。
(5) 大幅度修改文章核心内容、主要图表和数据。
2.3 甄别策略
基于稿件处理系统投稿作者的电子邮箱、联系电话、身份证号码、用户名、密码等注册信息,挖掘疑似代投论文,结合专业知识服务平台(CNKI、维普、万方数据、Web of Science等)与搜索引擎(百度、谷歌和360等)进行协同查询(图3)。根据信息间关系图的节点度数及其连通性,可有效甄别出疑似代投论文。
图3 代投论文甄别的系统策略
2.3.1系统内甄别
下面以玛格泰克稿件处理平台为例。
(2) 导出Excel文件。导出信息时,勾选字段选项:姓名、手机号码、身份证号码、单位、通信地址、邮箱、密码、用户名。
(3) 对导出的Excel文件进行查“同”和查“相近”。分别按以上信息进行升序或降序排列,排序后即可看到相同或相近的个人信息。针对不同作者或不同评审人使用相同个人信息进行整理、排查和提炼,建立代投者注册信息数据库。通过“查同”甄别代投稿件的难度较小,而通过“查相近”甄别代投稿件的难度比较大。如果入库者由专人负责,则较容易发现诸如用户名为作者姓名拼音的首写字母+123,邮箱地址为作者姓名全拼+tg@163.com、邮箱字段中出现glcaizic、glczc等(本研究追踪发现,即上文所述才*城所为)。
(4) 新投论文入库前首先在编辑部已建立的代投论文注册信息数据库中进行查询比对。
2.3.2基于知识服务平台的甄别
编辑部将稿件处理中发现的无法直接甄别的疑似代投论文进入知识服务平台进行二次甄别:(1)在学术不端检测系统进行查重和稿件追踪;(2)针对注册信息中的手机号码和电子邮箱在平台数据库高级检索中检索;(3)在服务平台的知识图谱中查看作者发文情况及合作者关系图。
通常情况下,论文代理机构在投稿前通过有偿查重服务进行检测和处理,因此,编辑部须特别警惕重复率高和重复率特别低的投稿。AMLC的稿件追踪功能对中文期刊的适用性较高。维普的高级检索中有“作者简介”检索项,可方便检测同一手机号码或邮箱代投的不同论文,其“360网络图”可直观地显示作者发表的论文标题、期刊、所属基金项目、合作者等知识节点。不同知识服务平台功能存在差异性,且收录期刊存在局限性,所以多平台综合应用可有效地甄别论文代投状况。
2.3.3基于搜索引擎的甄别
搜索引擎360和百度手机卫士均提供电话号码归属地查询,据此可以判断是否为异地操作;借助全国公民身份证号码查询服务中心的“身份证号码解读”可判断作者注册身份信息与身份证是否相符(http:∥www.nciic.com.cn/framework/gongzuo/index.jsp)。此外,第三方代投机构运营时间长、专业化程度高、反侦察能力较强,个人注册信息也在不断更新,知识服务平台信息挖掘不全面,查询中发现维普独有的“作者简介”搜索项“同号手机号码或邮箱”信息查询中有较多遗漏。通过多种搜索引擎交叉查询能够发现有意义的线索。比如,经过系统内排查,确定梁长蓂等[17]论文为疑似代投论文,且2015年第6期已刊发,为查找原因,堵塞管控漏洞,对该文注册手机号码183051461*5和邮箱chenggu*e@163.com分别在维普、360、百度和谷歌进行检索,结果如表1所示。因此多渠道检索有助于发现和甄别代投论文。
表1 2条注册信息在4种检索方式的结果
注:†的网站链接为https:∥max.book118.com/,工信部备案号:蜀ICP备08101938号-1,公安局备案号:51011502000106。
3 代投论文防范
3.1 明确期刊的主体责任
虽然“五不准”中明令禁止“论文代投”,但对代投行为的处罚却缺乏必要的法律、法规依据。代投并不存在造假、欺诈、侵犯知识产权等问题,之所以不准代投,是因为它是滋生各种学术不端行为的重要因素,是论文代写、同行评议造假、论文买卖、有偿发表等灰色利益链上的关键环节。“撤稿事件”引发社会问责,政府管理部门强调,作者、第三方机构和期刊都有不可推卸责任,并表示加强信用管理、承担处罚责任,但期刊和第三方机构选择沉默[19]。第三方机构的治理、作者的教育和管理固然重要,但需要一个过程,甚至是漫长的过程,政策的制定和落实具有滞后性。期刊编辑部主动担当主体责任是遏制代投论文及其滋生的各种不端行为的重要保障。
3.2 完善编辑部内控机制
3.2.1加强注册管理
建立统一的学术身份标志,规范作者个人信息著录格式。大量代投论文通常提供163、126、QQ、gmail等公共邮箱,因此可要求作者使用单位专属邮箱或提供作者的开放研究者与贡献者身份识别码(Open Research and Contributor ID, ORCID),这一信息将与研究、研究成果发表等环节紧密相连,有助于在数字信息大环境中建立信任,减少诸多信息呈现的负担[20]。
3.2.2规范工作流程
(1) 专人负责论文入库环节。对入库论文进行学术不端检测系统查重,对个人注册信息和论文基本内容进行审查,收紧入口。
(2) 论文信息更新程序化。论文修回稿要附修改说明,修改处要逐条明示;论文署名、作者个人信息、主要内容变更以及撤稿需制定处理细则,责任编辑不能自作主张,需作者提出书面申请后,编辑部讨论决定。
(3) 建立学术不端行为黑名单数据库。通过采编系统“列黑名单”或“字节过滤”可阻止代投者某种注册方式,但代投者可能寻找新注册方式,反而增加了期刊发现代投问题的难度和时间成本。
3.2.3曝光与反馈
经过甄别确认代投论文,可通过期刊门户网站曝光作者信息,包括论文名称、署名作者、单位等。并将投稿论文上传CNKI等学术不端检测系统,方便其他期刊单位查询和发现问题。也可针对代投情况比较集中的单位,反馈信息给对方人事部门。另外,为防止有人恶意所为或误判,也可公布疑似代投论文,并为其增加申辩环节。
通过系统内线索,结合大型知识服务平台和网络搜索引擎进行数据挖掘锁定第三方代投机构,比如前文所述的才*城。多个编辑部之间互通信息,并及时反馈给国家相关主管部分,更大范围地防范和治理第三方中介代投代发论文。
3.3 充分发挥编辑的学术评价功能
同行评议结果是一篇论文能否被录用的重要依据,但同行评议者的遴选有赖于编辑,同行评议意见也需编辑鉴别。作为学术评价的“组织者”,编辑或许没有超高的学术辨别力,但必须要有较宽的视野,且善于发挥组织者的作用,向专家合理借力,客观公正地评价论文质量。代投并伪造同行评议造假而导致论文批量撤稿事件也恰巧折射出编辑学术评价能力的缺失。陈志贤等[21]和金一超[22]针对学术编辑的学术评价能力、作用和提升路径有借鉴意义。
4 结语
系统内排查发现的代投情况比较严重,且有团体化发展趋势。这与学术管理制度不完善、评价机制不科学、学术规范教育不到位、惩罚力度不足、威慑力不强有关;也与国家出台的各种规范执行机构不明确、指令内容多、可操作性不强有关。国家层面须尽快建立科研行为严重失信记录制度和黑名单信息共享机制,建立期刊质量监测评估体系和平台,实行学术期刊预警制度,建立预警监测名单。2015年出台的“五不准”中提出存在违反“五不准”行为者应主动申请撤稿,但未指明具体处罚措施;2016年7月教育部颁布实施的《高等学校预防与处理学术不端行为办法》明确的6类学术不端情形,尚未包括论文代投。为更好地改善学术生态环境,各责任主体要主动担当责任,期刊编辑要不断完善内控机制,提升论文甄别能力,充分发挥学术诚信治理中“吹哨人”的作用。