我国学术期刊识别伪作者的方法
2017-03-30江霞
江 霞
我国学术期刊识别伪作者的方法
江 霞
概述我国学术期刊识别伪作者的方法,供同行参考应用,杜绝学术不端。阅读大量文献,结合编辑实践工作经验,总结分析识别伪作者的方法。认为识别伪作者的方法主要有两种:一种是利用CrossCheck反剽窃文献检测系统、学术不端文献检测系统、专业软件、基于数字指纹的文献相似度检测及利用语义角色标注技术等辅助工具判断抄袭从而识别伪作者;另一种是科技期刊编辑增强责任意识,通过从期刊网站注册的作者信息、作者工作单位与文章内容吻合度、电话沟通、将每次修改稿的作者署名和排序与原稿进行比对、和通讯作者联系,审核基金项目与论文关联度等多种方法自主识别伪作者,这些方法都能从一定程度上杜绝弄虚作假的学术不端行为。认为学术期刊编辑采取多种方法自主识别伪作者外,还需要完善相关管理制度,建立健全法律责任体系,加强高等院校对学生学术道德的培养,提高网络媒体平台的自治意识与社会监管能力;同时,编辑要敢于担责,同行期刊应建立联盟机制,共同杜绝学术不端。
学术期刊;伪作者;学术不端
[作 者]江霞,南方医科大学南方医院《护理学报》编辑部。
“伪”指虚假,与“真”相对[1],伪作者指虚假的论文作者,即论文真正的写作者并不是署名作者。目前,国内学术期刊论文抄袭、剽窃、弄虚作假等学术不端[2]现象非常普遍。同时,学术不端行为中伪作者的身份与行为较隐蔽,不易识别与判断。为了净化学术氛围,杜绝弄虚作假行为[3],学术期刊需要采取多种手段识别“伪作者”,以确保科技期刊学术论文的科学性。当前,我国学术期刊对学术不端行为的研究主要集中于防范措施及其检测系统方面的报道[4-13],但针对具体识别“伪作者”的方法研究极少,江霞[14]结合实践工作经验,通过从期刊网站注册的作者信息、作者工作单位与文章内容吻合度、电话沟通等几种方式识别“伪作者”取得了一定效果。鉴于此,笔者在上述识别“伪作者”的研究基础上,进一步扩大研究范围,综合同仁报道的研究成果,更加全面、深入地整理出我国常用的几种识别“伪作者”的实践方法,旨在为学术期刊编辑识别“伪作者”提供参考,现介绍如下。
一、学术期刊识别伪作者的方法
(一)利用辅助工具识别伪作者
1.CrossCheck反剽窃文献检测系统识别法。系统因实现了多语种的文献检测功能而在国际上广泛应用,其操作方法简单,只要将被测论文传送到检测系统,与其储备数据资源库或互联网开放共享资源进行对比检测,系统就会迅速生成一个相似度报告,显示被测论文与其他内容匹配的相似百分比,并以不同的颜色标出各相似的文本内容[15]。学术期刊编辑可据此判断论文是否涉及抄袭,从而识别伪作者。该系统的弊端是只能对语言文字进行比对,还无法对储备数据库以外的内容,“高级”抄袭以及公式、图像、表格等内容进行直观有效的比对。
2.利用学术不端文献检测系统识别法。学术不端文献检测系统主要有3种:CNKI学术不端文献检测系统、万方论文相似性检测系统和武汉大学自主开发的ROST反剽窃系统。编辑只需将目标检测论文上传到上述检测系统,系统就可以快速提供被测文献与其他文献的雷同比例,其比对结果包括被测论文雷同的字数与字段长度,雷同文献的作者及来源,发表时间等。编辑可依据系统生成的检测报告来判断抄袭、伪造、剽窃、不当署名等学术不端行为[16]。前2种检测系统目前在学术界应用比较普遍,ROST反剽窃系统已将研究重点转向内容挖掘,较少正式运用。编辑可据此判断论文是否涉及抄袭和是否属于自身研究成果,从而识别伪作者。上述3种检测系统的弊端是无法识别同义词替换、句子语序调整等语义抄袭行为。
3.利用专业软件进行识别法。
(1)Turnitin剽窃检测[17]识别法。Turnitin剽窃检测是一款学术工具类软件系统,它通过大部分主流浏览器接入互联网,将被测论文与Turnitin背后海量的全球数据库和网页内容作比对,迅速得出一个相似度比例和涵盖大量相关信息的原创性检测结果。科技期刊编辑可根据这些Turnitin精确定位出的论文中非原创的内容,对论文整体的原创性做出一个客观判断,据此识别伪作者。
(2)文本相似性百度检测法。该检测软件是一种可以帮助用户检测论文是否为原创的论文相似性检测工具,用户只要在输入区输入目标检测论文,然后设置好随机检测字数,设置好每次检测间隔之后,系统就会自动在百度上搜索相关的语句、词条,如果有相似的内容会很明显地显示出来[18]。通过这个程序,可以很方便地了解到一篇论文是否为抄袭,或者抄袭程度如何,从而识别伪作者。
4.基于数字指纹的文献相似度检测识别法。为了应对自然语言抄袭,基于汉语词频的文本数字指纹的文献相似度检测识别法[19]应运而生。该方法是通过对具有参考性的语料库进行词频和字频统计形成一个 hash词表,然后基于最大熵原理为任意长度的文本生成一个基于词频特征的文本数字指纹,对于任意两篇文献可以通过计算对应的两个数字指纹的Hamming距离来得到一个相似度的估计,进而判断一篇论文是否为抄袭,或者抄袭程度如何,从而识别伪作者。该方法的不足也是对语义级别的抄袭较难识别。
5.利用语义角色标注技术对学术文献检测识别法。利用语义角色标注技术对学术文献检测的方法,可以识别同义词替换、句式调整、语言结构调整等语义级别的抄袭行为。其方法是以句子为最小单位进行文献的语义相似度检测;其操作步骤为:提取文献中所有词语的上位词,每篇文献形成句子—词—语义角色—上位词四部图,通过四部图确定两篇文献的待对比句子[20],进而得出两篇文献的语义相似度,判断论文是否为抄袭,或者抄袭程度如何,从而识别伪作者。这种方法由于受语义角色标注工具和技术的限制,还未能得到广泛使用。
(二)学术期刊编辑自主识别伪作者
1.从期刊网站注册的作者信息中识别。目前,很多学术期刊建立了自己的官网,方便作者在网络平台在线投稿。一般来讲,在线投稿时作者必须要注册用户名,填写作者的真实个人信息。学术期刊编辑只需在审稿过程中提高警惕,认真比对网站注册的作者信息与论文的署名作者信息是否吻合[14],就可以识别伪作者。
2.从作者工作单位与文章内容吻合度进行识别。大部分学术论文是研究者将理论和专业知识在实际工作中的运用与升华。因此,学术期刊编辑在审稿过程中一定要密切关注作者的实践经历,以保证文章内容的真实性与实用性。判断作者的实践经历很重要的信息来源是作者的工作单位[14]。学术期刊编辑在审稿过程中,可以运用自己的专业知识和实践经验,打电话与作者沟通,质问有关论文研究目的与意义,资料与数据来源,以及写作思路与过程等方面的问题,了解作者的实际工作资质、经历和工作范畴与任务等,经过进一步的交流,编辑可以从作者工作单位及任务中与文章内容的吻合度识别出伪作者。
3.从电话沟通过程中识别。部分学术期刊的作者群由于工作性质较为特殊,作者身份或以男性为主,或以女性为主。如,目前护理工作者绝大多数为女性,对于个人信息显示为女性,而编辑在审稿过程中与作者电话沟通时,发现实际通话人是男性者,编辑可以要求作者对文章内容进行概括陈述[14],进而核实其作者身份的真实性,以识别伪作者;另外,还有一些利益集团、“枪手公司”代替作者打电话来咨询论文事宜,也可通过这种电话交流方法判断通话人是否为伪作者。
4.将每次修改稿的作者署名和排序与原稿进行比对来识别。一篇论文从投稿到发表,基本上都要经历1次甚至于多次修改。有些作者出于某种原因,在修稿过程中增加、减少或变换作者,或更改作者排序,若作者不主动作出说明,编辑很容易忽略这一环节的审核。在当今以在线电子稿件为主的审稿模式下,尤其是对多次修改的稿件,编辑更加应该重视对作者屡次修改稿署名和排序与原稿进行比对,以识别伪作者。
5.利用和通讯作者联系进行识别。学术期刊编辑在论文的审理与编辑过程中应与通讯作者进行联系和沟通,以核实录用的论文署名是否真正体现了各作者的实际贡献;通讯作者应对文章进行把关,并屡行监督的责任和义务,同时向编辑部出具所有作者亲笔签名的论文专用使用权授权书,以避免有些署名作者在未知情同意的情况下刊发论文,而被动地成为伪作者。
6.从基金项目与论文关联度进行识别。目前,许多学术期刊的基金论文比逐年提高,很大一部分原因是高水平作者不断增加,作者在科研项目中产出了一部分优质论文,甚至于有一些学术质量高的核心期刊,其自身影响力吸引了行业内绝大部分的基金论文,还有很多学术期刊采取免审稿费、免版面费、优先审稿并提前录用等多种优惠措施拓展了一部分基金论文,以此来提高期刊学术质量从而扩大其影响力。在诸如上述条件的刺激下,很多作者为了能快速刊发论文,将并非基金资助的论文挂上某个科研课题作为基金论文投稿。笔者在审稿过程中,曾经发现有的作者投稿时论文中标明了基金课题名称及级别,当收到本刊修稿意见要求其出具基金项目相关批文复印件及研究内容与论文关联度以辨真伪时,作者便称论文并非基金论文;此外,笔者在审稿过程中还曾发现,某一个时间段内,某一个基金项目名称会在不同省份、不同单位的不同研究范畴的论文中同时出现,经初步鉴别这一批论文作者之间并无真正的合作研究后,笔者便与作者联系,要求其提供基金项目相关批文复印件及作者排序、研究内容与论文关联度等相关资料时,作者便不再与编辑部联系,有些放弃修稿甚至撤稿;还有部分作者虽然提供了课题立项相关资料,但论文却是大部分抄袭了基金课题的相关内容且作者并非课题中的主要研究人员。这些现象表明,作者枪手公司或者中介公司,或是朋友“情谊”,提供了关联度不大,甚至是虚假、伪造的基金项目论文。提示学术期刊编辑审稿、用稿时不能唯“基金论文比”,也不能因非基金论文而错失了优秀稿件,更需要对标识了基金项目的论文进行严格的内容匹配度审核,从中识别伪基金论文及伪作者。
二、讨论
(一)完善科研管理制度,净化学术氛围,有利于识别并查处伪作者,杜绝学术不端行为
在当今学术风气日趋低下的社会环境中,伪作者赖以生存的肥沃土壤是强大的需求量。而刺激这一需求的是现有的评审与用人机制。作者为了发表毕业论文、职称论文,通过百度搜索找到枪手公司、中介骗子公司高价买论文的事例不胜枚举。中国高校科技期刊研究会曾代表200多家医学会员期刊发函并抄送期刊的正规名称和官网给百度公司,要求百度公司为广大读者提供一个健康的网络环境,恪守相关审核制度,清除相关因竞价而在网页搜索中置顶的假冒网站[21]。但此举收效甚微,笔者不定期上网去随便检索几家医学期刊官网,仍然会发现虚假网站置顶横行,本刊不少作者也曾致电编辑部,称其投稿至骗子网站后,被收取高额版面费而未收到样刊,或收到伪劣样刊后骗子销声匿迹。2016年年初,国务院办公厅发布了关于《国务院办公厅关于优化学术环境的指导意见》[22],该文件对诚信自律、学术道德,以及学术不端的表现与处理等,作出了明确的定义与规定,要求非常具体。
文件出台后,很多科研管理单位、高等院校都制定了相关的执行对策,比如有作者反映其所在的大学研究生学院、人事处、科研处等部门综合意见后发文规定,凡是发现有学术不端行为的论文,研究生不予毕业,晋升职称者取消申报资格等。比如,我刊发现存在一稿两投、论文抄袭等学术不端行为者,经与作者沟通不果时,即向其单位反映,单位非常重视并对涉事作者及其导师进行严厉批评教育,同时严格按单位的学术不端行为的处理规定进行相关处理。这从很大程度上对该校学生和老师进行了一次深刻警示教育,从而能在一定程度上杜绝学术不端,净化学术氛围。笔者在审稿过程也发觉,本刊作者的诚信意识有所增强,在投稿或修稿过程中会主动询问论文属于会议交流或硕士毕为论文是否可投稿等问题,有些作者投稿时还会附上收集的原始研究资料与数据,有些作者会主动阐述统计学处理方法的过程以及对统计学专业老师致谢等。
目前,在杜绝学术不端行为上,我国还没有出台专门的法律来进行规范,而且司法部门也基本不介入学术腐败案件的调查处理,尤其是对网络上提供的学术期刊虚假信息的治理与监督更加缺位与无助。因此,识别伪作者,治理学术不端行为,更加需要完善相关科研管理制度,建立健全与之相适应的法律责任体系,加强高等院校对学生学术道德的培养,提高网络媒体平台的自治意识与社会监管能力。
(二)学术期刊编辑应有责任担当,同行期刊应建立联盟机制,共同杜绝学术不端
遵守学术伦理道德、净化学术环境、规范论文发表是期刊编辑的重要责任[23]。学术期刊编辑应具有把握论文学术诚信的判断力,坚持求真务实的编辑精神,除了按照上述多种方法识别伪作者外,更应敢于担责,自觉在学术论文审稿、期刊出版过程中杜绝学术不端行为;同时,建议同行期刊,尤其是专业相同或相近的期刊,同心协力,签署学术期刊联合声明,对造假严重者的论文“终生不用”;对伪作者、一稿多投等学术不端论文,坚决不用;并联合发表声明将学术不端行为公之于众[24],同时通知其所在单位及职称评审等部门进行严肃处理,并联合同行期刊至少2年内拒绝接受此类作者投稿。通过多方合作,多管齐下,共同杜绝学术不端行为,维护学术诚信与尊严。[本文系广东省科技计划项目(2015A030302021)]
[1]中国社会科学院语言研究所词典编辑室.现代汉语词典[M].3版.北京:商务印书馆,2002(增补本):1311.
[2]田美娥.科技期刊的学术不端行为及其预防[J].今传媒,2009(12):70-71.
[3]江霞,方玉桂,陈伶俐,等.医学科技期刊应用《科技期刊学术不端文献检测系统》判断抄袭时应慎重对待的几种情况[J].中国科技期刊研究,2010,21(4):471-472.
[4]刘清海.从来稿基本信息着手发现学术不端的线索[J].编辑学报,2014,26(5):449-451.
[5]刘清海.科技期刊编辑在防范学术造假论文中的作用[J].编辑学报,2014,26(3):258-261.
[6]张旻浩,高国龙,钱俊龙.国内外学术不端文献检测系统平台的比较研究[J].中国科技期刊研究,2011,22(4)514-521.
[7]王宇.学术不端文献检测系统研究综述[J].西南民族大学学报(人文社会科学版),2013(4):236-240.
[8]张敏.学术不端行为:学术期刊编辑的认识误区与防范策略[J].广东农工商职业技术学院学报,2009,25(2):81-83.
[9]蒋寅.治理学术腐败和学术不端行为的思路与对策[J].社会科学论坛:学术评论卷,2009(17):30-63.
[10]黄俊辉,李奉华,阙国鹰,等.基于荣誉制度的诚信教育与早期防范高校学生学术不端行为的探讨[J].中国高等医学教育,2009(10):45-46.
[11]孙瑞灼.对学术不端“零容忍”需要制度保障[J].教育与职业,2009(28):84.
[12]程郁缀,刘曙光.防止学术不端和期刊的责任[J].武汉大学学报(人文科学版),2009,62(5):635-638.
[13]张红军,黄健,杨勇,等.高校学术不端行为的防范和措施[J].重庆医学,2009,38(12):1546.
[14]江霞.科技期刊识别伪作者的方法——以《护理学报》实践为例[J].编辑学报,2013,25(2):151-152.
[15]林汉枫,贾晓燕,张月红,等.重视学术伦理是期刊编辑义不容辞的责任——《浙江大学学报》(英文版)初探CrossCheck的工作模式和规范标准[J].中国科技期刊研究,2011,22(3):328-333.
[16]谭华,崔洁.学术不端文献检测系统的使用建议[J].编辑学报,2010,22(2):153-155.
[17]不详.Turnitin剽窃检测系统[EB/OL].http://baike. baidu.com/link?url=fJiK1paX_cu8OZoCwqSAyY3dREUo2Q2 TNXklEhRKZX6bSCDCzqfHF2IxkUOZ5vHYFDCEclC2rAH5 VWNrfA8Hlq.
[18]不详.文本相似性百度检测V1.22官方免费版[EB/OL]. http://www.cncrk.com/downinfo/24906.html.
[19]白如江,王晓笛,王效岳.基于数字指纹的文献相似度检测研究[J].图书情报工作,2013,57(15):88-95.
[20]王晓笛,祝娜,白如江,等.基于语义角色标注的文献相似度检测研究[J].图书情报工作,2014,58(12):130-135.
[21]中国高校科技期刊研究会.关于对中国高校科技期刊研究会医学期刊官网进行认证和置顶的协调函(附215家医学期刊官方网址)[EB/OL].http://blog.sciencenet.cn/blog-278395-924483.html.
[22]国务院办公厅.国务院办公厅关于优化学术环境的指导意见[EB/OL].http://www.gov.cn/zhengce/content/2016-01/13/content_10591.htm.
[23]叶青,杨树启,张月红.科研诚信是全球永远的课题——中国科研管理与学术出版的诚信环境[J].中国科技期刊研究,20l5,26(10):1040-1045.
[24]江霞.广东省医药卫生期刊论文责任编辑信息公开状况研究[J].科技传播,2016,8(13):41-42.