高校学报应用CNKI学术不端文献检测系统研究
2014-04-05周宁
周 宁
(青岛职业技术学院 学报编辑部,山东 青岛 266555)
高校学报是指由高等院校主办的、专门进行学术研究成果报道的期刊,一般以“某某学报”冠名。中国知网(CNKI)从2006年开始正式研发学术不端文献检测系统,该系统对中国知网收录的、有公开刊号的期刊开放使用,其他没有公开刊号的期刊或者科研机构、图书馆等需交费使用。多数高校学报同中国知网签署了使用学术不端文献检测系统的协议。这个系统的研发是随着数字出版的快速发展应运而生的。中国知网所有收录的论文均由同其签订合作协议的学术论文出版机构提供,但是,这些学术论文出版机构大多是隶属某个科研院所,以高校学报为例,高校学报编辑部一般是各自组稿、独立出版和发行的,没有力量把收到的稿件同已经正式发表的稿件一一进行比对,很难完全阻止一些文字抄袭行为。中国知网借助本身资源优势开发了学术不端文献检测系统,开放给合作高校学报编辑部使用,从源头上阻止了一些文字上大量抄袭的稿件流入学报编辑部。学术不端文献检测系统的主要用户是高校学报,其他科研院所主办的学术刊物也适用。中国知网的合作单位使用的系统有学位论文学术不端行为检测系统、科技期刊学术不端文献检测系统、社科期刊学术不端文献检测系统。本文以高校学报使用的社科期刊文献检测系统为例,分析该系统的特点、作用、存在的问题。
一、学术不端文献检测系统的特点
编辑部在收到投稿之后将稿件上传到学术不端文献检测系统,系统可以快速检测该文是否存在抄袭、篡改、一稿多投等学术不端现象,并有详细报告单。近几年笔者一直负责使用所在学报的学术不端文献检测系统,结合工作实际,总体来说,学术不端文献检测系统有如下特点。
(一)定向内部使用,遵守保密制度
高校学报必须与中国知网签署使用协议,由中国知网授权使用。学报编辑部在使用该系统时必须遵守保密制度。原因显而易见,学术不端文献检测系统的目的是防止学术不端稿件流入编辑部,不是用它来规避学术不端行为。文字抄袭是低层次的抄袭行为,系统主要对此种不端行为进行查询,如果编辑部将查询报告单详情直接告知作者,那么,作者在修改时会只修改“不端”的文字,而在论文创新性和学术性等方面较少改动,导致的结果是论文的学术不端检测虽然通过了,但论文的学术水平并没有提高。如此一来,编辑部和作者有“串通”规避系统查询之嫌。
(二)系统易于操作,检测快速
学术不端文献检测系统使用非常方便,易于操作。可以单篇上传或者论文打包上传,一般编辑部采取批量打包上传方式。编辑部收到稿件,经过初步筛选,将符合学报办刊宗旨、基本达到学术论文一般要求的投稿打包上传至系统,在网络正常的情况下,系统在收到打包文件之后,会逐篇将上传文件同知网数据库进行全文比对,单篇文献检测速度可以达到毫秒级响应。[1]
(三)检测报告详细,准确率高
中国知网对每个上传的论文都会出具一份检测报告单,报告单分为简洁型、全文型、去除本人文献型和全文对照型。以全文型报告单为例,报告单分别列出检测文献题名、作者、检测范围、时间范围、总文字复制比(重复字数、总字数、疑似段落数、疑似段落最大重复数等)、文字重复详细来源、标有红色或黄色字体的全文(颜色不同代表文字复制或引用),等等。在检测报告单中,详细列出了文字重复的来源,其中点明了来源题名、来源出处、作者姓名、文字复制比、是否引用、来源发表时间以及是否本人等,可以说,上传的论文引用或抄袭已发文献的详情在报告单中一目了然,证据确凿,准确率高。使用者点击报告单中带颜色字体部分,系统会弹出该段文字的复制来源。同时,系统还支持段落和句子检测、改写、组合等多种类型学术不端行为检测,其检测论文复制和改写等不端行为的功能非常强大。
二、学术不端文献检测系统在高校学报中的应用
(一)收稿环节中的应用
首先,面对大量的投稿,学术不端文献检测系统起到了一个“过滤器”的功能。作者投稿之后,稿件进入学报编辑部的第一关是编辑部编辑收稿,这是收、审、编、印、发的第一个环节。有的学报编辑部稿件在完全专家外审的情况下,收稿时编辑要全面审读稿件,并从内容和形式两个方面对其衡量后,作出是否正式收稿、进入下一个环节的结论。以笔者所在的学报编辑部为例,每年作者通过投稿专用邮箱投的稿件有1800篇左右,负责收稿的编辑在初步审查之后,下载900多篇,这900多篇稿件上传到中国知网学术不端文献检测系统查询,查出疑似学术不端稿件近400篇,编辑再次审读剩余的500篇,合适的稿件正式收稿,并送专家审稿。其次,学术不端文献检测系统对一稿多投的稿件有警示,并可以显示出该论文在什么时间上传过学术不端文献检测系统,以及检测结果是多少,提醒编辑部作者有可能一稿多投,编辑部据此可以判断稿件的状态。再次,辅助作者咨询稿件收稿情况。编辑部面对大量的投稿,不可能对每一篇投稿的不收稿原因都详细记录,但是那些符合办刊宗旨、整体看来写作规范的论文上传至系统,如果后来没有正式收稿,那么,这些稿件有可能是学术不端文献检测系统检测结果超标。如果作者来电咨询投稿结果,编辑部可以通过查询学术不端文献检测系统的检测结果,答复作者。
(二)审稿环节中的应用
1997年6月新闻出版总署发布的《图书质量保障体系》第八条明确规定:“坚持稿件三审责任制度”,即我们通常说的“三审制”。三审制指由初审、复审和终审三个审级组成的审稿制度,这是我国出版界从图书到期刊长期实行的审稿制度。三审制是出版单位必须遵守的基本制度,对一些重点稿件、内容过于复杂的稿件以及一些难以决定取舍的稿件,有必要适当地增加审次,并广泛听取有关专家的意见。现在,很多编辑部鉴于稿件的专业性较强,将大部分稿件实行专家外审,在专家审稿的过程中,学术不端检测结果可以起到参照作用。[2]比如说,有的稿件文字复制比虽然较低,但是复制的却是已发论文核心内容,那么,专家可以据此判断该论文是否还有创新性。再如,有的稿件文字复制比虽然略高,但是是在合理引用范围之内,是为了论证自己的观点,那么专家在审读过程中也可以适当参照把握。编辑审稿像医疗诊断一样,不经过最终的分析、判断,不要轻易下结论判定这篇文章是否抄袭。系统初步诊断结果不等于最终结果。[3]
(三)出版环节中的应用
一篇稿件从收稿到三审结束,发送至印刷厂快也需1~2个月,稿件从收稿之日的学术不端查询到定稿发排,期间大概有1~2个月的时间差,而中国知网的数据库是在不断更新的,所以,稿件在发至印刷厂排版之前非常有必要再次进行检测,发现问题立即撤换稿件。
三、使用学术不端文献检测系统过程中要注意的问题
以上讨论的是学术不端文献检测系统在使用中的主要功能,其实,在使用中发现该系统的问题更重要,只有以批判的眼光来审视该系统,才能在具体工作中不为其左右,提高编辑工作的质量。大多数的高校学报编辑部已经使用学术不端文献检测系统,该系统在为编辑部提供有效帮助的同时,也存在几个要注意的问题。
(一)定量和定性的问题
这里涉及到一个重要概念——文字复制比,文字复制比是指论文中的重合字数在论文字数中所占的比例。它涵盖注明出处的引用所占的比例,是一个绝对数字。通过该指标,我们可以直观了解到重合字数在该检测论文中所占的比例情况。这个比例只是描述在检测论文中重合文字所占的大小程度,并不是指该论文的抄袭严重程度。只能这么说,百分比越大,重合字数越多,存在抄袭的可能性越大。因此,这个系统只提供一些客观事实,而不给出是否存在学术不端的结论。对一篇作者辛苦撰写的论文,尤其是需要引证前人研究资料的论文,即使文字复制比超出了中国知网所谓“30%”的界线,我们也不能轻易下结论,认为该作者存在学术不端行为。
中国知网的“30%”是一个可以商榷的数字。适当引用是法律赋予的正当权利。从法律的理解上,研究版权保护问题最常用的有两个文件:一是文化部出版局的《关于颁发〈图书、期刊版权保护试行条例〉的通知》(文出字(84)第849号),该文件于1984年6月15日颁发;二是《图书、期刊版权保护试行条例实施细则》(以下简称《实施细则》),该文件于1985年1月1日颁发。这两个文件对我国普及版权知识和建立版权制度起了积极的促进作用。但实际上这两个文件都属于内部文件,文化部在发文时已强调“不公开发表”、“内部掌握,参照执行”。2003年国家版权局4号令废止了一批有关著作权管理的规章、规范性文件,其中就有这两个文件。虽然这两个文件已经废止了,但是它们的影响却很深远。因为这两个文件尤其是《实施细则》对一些版权问题有详细的数字上的规定,比如《实施细则》对“适当引用”的规定,有研究者在从法律实践的角度探讨这个问题时还在引用这个文件。[4][5]本文之所以再次描述这两个文件,就是想引起业内更多的重视。我国《著作权法》没有明确规定“适当引用”与抄袭或剽窃的比例,但是有明文规定的限制方式。
(二)检测时间、发表时间和中国知网资源库更新时间的时间差问题
检测时间即学报编辑部将收到的稿件上传到知网的时间,发表时间即稿件录用后正式出版的时间,中国知网资源库更新时间即中国知网将收到的论文等资源上传到数据库的时间。对于高校的学报编辑部和中国知网来说,这三个时间每天都会有新的未发表论文上传、新的论文正式发表、已发表的论文上传,因此,如何处理好这三个时间的时间差问题是关系到有效发挥学术不端文献检测系统功能的重要方面。例如,青岛职业技术学院学报曾在2011年第3期(6月25日出刊)刊发过某文,中国知网于当年10月发给编辑部一份检测情况与复核处理意见,指出该文涉嫌一稿多投,要求编辑部复核同意撤掉稿件。编辑部于2011年3月8日收到该文,通过了学术不端文献检测,经过三审之后决定放在第3期刊发,在发排前,即2011年5月30日,编辑部又进行了刊前检测,检测结果无问题,2011年6月25日学报出版之后,上传到中国知网。通过知网的意见单,编辑部发现此文大部分内容已经在2011年3月1日出版的某刊发表,作者改变题目后再次投稿,而且在编辑过程中没有告知编辑部此文的绝大部分内容已发表。由于该文在某刊出版三个月后在知网仍然检测不到,在作者故意不告知的情况下,造成了青岛职业学院学报发表在后的结果。编辑部也不可能无限次去检测论文,已发表的论文传到知网和人工检测中间总是有时间差,这个时间差只能缩减,却不可能没有。这是一个需要考虑的问题。
(三)比对范围本身的问题
这个问题也可以说是中国知网的局限性所在。中国知网研发的学术不端文献检测系统,对未公开刊发论文的学术不端文献检测比对范围显然是中国知网已经收录的文献。中国学术期刊网络出版总库、中国博士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国专利全文数据库、互联网资源、部分英文数据库、港澳台学术文献库、优先出版文献库、互联网文档资源等是该系统的比对范围。但在浩如烟海的文献资料中,随意举出一个例子,中国知网就不可能囊括其中,比如说,图书资料、部分古旧期刊、大部分外文资料,等等。因此,中国知网虽然收录了绝大多数的国内学术期刊,但是,作为比对源,远远不够。
(四)文字复制比的影响问题
近几年来,各省在职称评审中纷纷对提交的论文进行学术查新,查新中一个重要的指标就是“重复率”。重复率和学术不端文献检测系统的文字复制比非常相似,由此可见,用技术手段来检测论文是否抄袭已经在政府机构评审活动中开始实施,这说明,通过系统检测得出的文字复制比已经有了相当的影响力。在文字复制比是衡量一篇论文的学水平高低的标尺并不成立的概念下,文字复制比已经用于很多评审活动,这不失为一种学术水平评比的“快餐”行为,是一条便捷途径。因此,文字复制比这一概念影响面愈广,人们愈应该提高警惕,沉下心来,踏踏实实地对一篇学术论文给予深度解读,尽可能地发现其创新点,尊重作者,尊重劳动。
四、发挥学术不端文献检测系统功能的建议
虽然学术不端文献检测系统在使用过程中会产生一些问题,但是在当前文字抄袭比较严重的形势下,该系统正成为编辑出版的有效辅助工具,因此,编辑在使用该系统时应掌握科学的手段,辩证地看待检测结果,不为检测结果所左右,发挥学术不端文献检测系统的正作用。
(一)科学掌握文字复制比
《〈中国学术期刊网络出版总库〉删除学术不端文献暂行办法》规定,学术不端文献检测中心将定期于每月2号前向有关编辑部发出“疑似学术不端文献清单”,清单上将该学报编辑部近期刊发的稿件有疑似学术不端情况的列出,请编辑部复核并给出是否删除的处理意见,待复核稿件的检测情况分为“文字复制比”和“一稿多投”,其中文字复制比中国知网给出的参照比例是30%,即文字复制比为30%以上的已发论文在编辑部复核确认之后将被从中国知网的数据库里删除。如此的话,编辑部对这篇稿子从收、审、编、印、发的所有工作都付之东流,而且还占用了学报的有限版面。因此,编辑部应科学掌握文字复制比的比例。根据我国《著作权法》第二十二条的规定,“合理使用”他人已发表的作品,可以不经著作权人许可,也不向其支付报酬,但是有明文规定的限制方式,即“合理使用”应指明作者姓名、作品名称,并且不得侵犯著作权人依法享有的其他权利。据此,作者“为介绍、评论某一作品或者说明某一问题而在作品中适当引用已发表作品”时必须注意:“引用数量应适当,即引用部分不能构成自己作品的主要部分或者实质部分。”[6]327《著作权法》不仅描述了“合理使用”的权利,而且还规定了“合理使用”的方式。“适当引用”标明出处,这既是我国著作权法保护版权精神的体现,也是尊重原作者的重要体现;反之,如果用了别人已发表的文字,而不标明出处,这是抄袭。
“引用数量适当”需要编辑在“量”上掌握一个科学的尺度,在“质”上要有敏锐的眼光。依据多年使用该系统的经验,我们认为20%左右的文字复制比可以作为普通高校学报编辑部收稿的一个参照比例,按照这个比例收进来的稿件还算是一个相对较安全的数字,同时,稿件也不至于被排除太多导致稿源出问题,当然,对于抄袭别人核心观点的论文除外。
(二)适当增加检测次数
当前,大部分高校学报编辑部以初审检测为主,初审检测无疑是学术不端检测中最为重要和有效的一步,可以将有明显抄袭行为及部分重复发表的稿件拒之门外,避免浪费外审专家和编辑的宝贵时间和精力,因而初审检测成为绝大多数编辑部的首选。[7]但是,前面已经论述过,稿件的上传时间和发表时间有一个时间差问题,如何解决好这个问题,最直接的方式就是增加检测次数,但是,增加检测次数的时机是需要选择的。在高校学报编辑部普遍人员偏少,编辑一般还兼任编务,编辑出版环节较多,出版技术日益更新的情况下,对于稿件的检测也不应无限次,检测两次就可以。收稿时检测一次,另外一次可以放在出刊前,即正式排版前,这样,一旦发现有问题还来得及撤换稿件。当然,增加检测次数主要是考虑在技术上便于实现,高校学报最主要的还是依靠作者自觉抵制学术不端行为,学术不端文献检测系统只是提供了一道屏障,提醒、警示科研人员应坚守学术道德底线。
(三)以使用系统为辅,以专家和编辑审查为主
高校学报编辑部使用学术不端文献检测系统仅是一种重要的技术手段,在科学技术日益更新的今天,通过技术防范学术不端必不可少,但是也不能完全依赖技术,必须依靠专家和编辑审查来确定一篇稿件的学术规范。特别是学术不端问题的认定是个敏感问题,所以在使用学术不端文献检测系统过程中,应牢记它只是一个机器,所产生的报告只能用作审稿时的参考,而不应取代编辑在初审中的主观能动性。[8]有的作者可能会通过变换语言顺序等方式躲避学术不端文献检测系统的检测,但是论文是否有创新性却是不能编造的,因此,学报编辑部在重视使用技术手段检测的同时,主要力量还是应放在审查论文的学术创新性上,这种创新性也是投稿论文的价值所在。
综上所述,高校学报编辑在使用学术不端检测系统的过程中提出了改进系统的一些建议,中国知网已经采纳了其中的部分建议,并在技术上进行了更新,如对于疑似一稿多投问题,该系统现在已经能显示出投稿论文是否上传过,并显示检测日期、检测结果,那么,对于后检测的编辑部来说,就可以得到提醒。[9]学术不端文献检测系统的研发是为了更好地服务于学术期刊编辑部,在源头上防止学术不端稿件流入学报编辑部,而学报编辑部了解了学术不端文献检测系统的各项功能,在使用过程中能够发现更多的问题,一方面系统研发方可以据此对系统不断完善;另一方面这也是同行间的交流,便于在编辑工作中有针对性地甄别稿件。在社会各界和学报编辑部的共同努力下,高质量的学术论文要对抄袭说“不”,只有倡导学术规范和合理引用的论文才有可能在思想和理念上给人以创新性的思维启迪,这需要编者、作者、出版者群策群力,营造一个干净的学术环境。
[参 考 文 献]
[1]张旻,高国龙,钱俊龙.国内外学术不端文献检测系统平台的比较研究[J].中国科技期刊研究,2011, (4).
[2]李祥,杨梦媛.“学术不端文献检测系统”是治理学术不端的有效手段[J].云南大学学报(自然科学版),2011,(S2).
[3]吉家友.学术不端文献检测系统数据分析[J].中国出版,2012,(4).
[4]冯雪姣.学术论文中“适当引用”的法律思疑[J].出版发行研究,2009,(1).
[5]赵蔚.文献学术不端与学术不端检测的多学科解读[J].中国出版,2012,(12).
[6]中国编辑学会,全国出版专业职业资格考试办公室.出版专业基础[M].上海:上海辞书出版社,2009.
[7]王音,田喆.从编辑部公告看使用学术不端检测系统中存在的问题[J].编辑学报,2011,(5).
[8]孔琪颖,蔡斐,张利平,徐晓.正确看待“科技期刊学术不端文献检测系统”检测结果[J].编辑学报,2009,(6).
[9]史成娣.论“学术不端文献检测系统”在编辑工作中的应用——以“科技期刊学术不端文献检测系统”为例[J].南昌教育学院学报,2009,(4).