APP下载

对科研成果“查重”的反思

2023-06-16屈振辉

天津中德应用技术大学学报 2023年2期
关键词:学术不端查重科研成果

摘  要:在高校教师职称评审中,对科研成果“查重”已成为判别其学术不端的主要手段,但它存在科研成果重复率标准、范围和对象不统一,统一规定不同类别科研成果的重复率不合理,同一科研成果用不同系统“查重”重复率不一,有偿“降重”助长学术不端行为等困境。认为某些“查重”系统和制度的人性基础是性恶论,智能化“查重”只是辅助手段,“查重”系统在设计上有缺陷不能盲从。应正确看待和运用“查重”,慎重地对待智能化“查重”,建立统一“查重”系统并禁止有偿“降重”服务,以此完善科研成果的“查重”工作。

关键词:高校教师;职称评审;科研成果;查重;反思;学术不端

中图分类号:G644      文献标识码:A    文章编号:2096-3769(2023)02-073-06

2017年,教育部、人社部下发的《高校教师职称评审监管暂行办法》第15条规定:“高校教师职称评审中申报教师一旦被发现弄虚作假、学术不端等,按国家和学校相关规定处理。因弄虚作假、学术不端等通过评审聘任的教师,撤销其评审聘任结果。”为防范和杜绝高校教师职称评审中的学术不端,很多高校都要求对教师参评所提交的科研成果进行“查重”;山东、山西等省甚至以省级教育主管部门的名义规定对申报高级职务教师的论文进行“查重”,并还规定了重复率。然而通过深入分析,以“查重”方式评判学术不端也存在某些困境,特别是以统一规定的“查重率”认定学术不端的做法更是存在问题。如何理性地看待对高校教师职称评审中的科研成果“查重”?如何完善高校教师职称评审中的科研成果“查重”?这是本文要解决的核心问题。

一、研究综述

进行科学研究是高校教师的基本任务。目前高校教师职称评审仍然以结果为导向,因此科研成果自然成为高校教师职称评审中的重要指标。高校教师职称评审中的科研成果评价首先要防止学术不端。判别学术不端需从海量的作品中“大海捞针”,而人为判别又具有主观性,且费时费力,因此“查重”技术开始被广泛地运用。目前在我国高校中,学位论文、论文发表、职称评审都要“查重”。对“查重”之风日盛的现状,有学者开始对其进行理性审视,认为“查重”技术对遏制抄袭现象的作用有限,但可能会妨碍文献的正当引用,一定程度上会影响学术创新,忽略了学科和研究方法的差异性。另外“‘查重的弊端还在于我们过于迷信技术的力量,用电脑取代人脑,把文章交给网络,机械地作出判断。”[1]也有学者指出,“如果查重软件只能检测文字重复率,不能辨识论文创新点,那么即使它是用计算机语言编写的程序,其科学性也会受到怀疑……用计算机语言编写的程序也是人为的产物,人工智能可以相信但不能迷信。”[2]既然“查重”系统是依据一定的规则编辑而成(例如连续字数),那么只要不按照其“规则”出牌,即使真的是剽窃、抄袭之作,稍微改头换面也能通过“查重”。因此现在的“查重”系统也从早期文字比对的简单功能,发展到现在语义识别以及独创性判别的“智能化”阶段。但即使如此,上述问题还是存在。用于“查重”的学术不端检测系统也存在不少问题,这点已经被不少期刊编辑认识到。有编辑工作者指出学术不端文献检测系统的检测结果多以文字的复制比来表示,但文字复制比的高低并不能代表作者是否有学术不端行为,有的文章虽然文字复制比较低但仍可能存在不端行为。[3]也有编辑工作者从伦理学的视角对学术不端检测系统进行了是与非的审视。[4]

在高校甚至省级教育主管部门要求对教师在职称评审中递交的科研成果进行“查重”之后,一些高校的图书馆工作人员对职称评审论文的查重检测问题进行了实证研究。首先,研究以数据分析的形式证明,高校职称评审论文查重检测对学术不端行为起了一定的抑制作用,但不区分具体情况统一规定“查重”率,即“每个学科都有其特殊性,系统仅是科研评价的辅助工具,在预先设置好的原则下运行,不能差别对待。查重仅能提供给参评者一個同一规则下的比对结果,具有参考价值,不是绝对的标准……所以要理性认识查重结果,查重标准柔性化更能抵达查重检测的初心。”[5]该研究指出了高校教师职称评审中论文查重检测存在的某些问题,但还不够全面。本文将做更深入的研究。

二、高校教师职称评审中科研成果“查重”的困境

“查重”原是图书情报学领域的专业术语,较普遍的涵义是指“查核所处理的文献是否为已进行过标引的复本,以便区别情况分别处理。”[6]但现在学界似乎却将其视为学术不端检测的代名词:参评职称的科研成果须通过“查重”才有参评资格,申请学位的论文须通过“查重”才能参加答辩,不少期刊也规定稿件须通过“查重”才能发表,并规定了查重率的高限。“查重”在我国似乎成为正在逐渐做大的“产业”:“中国知网”“维普”“万方”等文献检索系统纷纷推出有偿的“查重”服务,就更不用说“淘宝”上那么多倒卖“查重”账号的牟利者了。目前学界通常说的“查重”主要是指运用学术不端检测系统对科研成果是否存在剽窃、抄袭而进行检测。然而,在现实中“查重”却遭遇到很多困境。

1.重复率问题

重复率虽然只是数字比例,但现在却成为判别科研成果学术不端与否的标准。但重复率的标准、范围和对象也并不统一:重复率到底多高才算是学术不端,不同单位的规定不统一,普遍共识是重合率不超过30%,超过即视为不合格,但也有更低者;通常只对公开发表的论文规定查重率,对出版的专著则不“查重”;通常只对在非核心期刊上公开发表的论文或科研论文规定查重率,对核心期刊上公开发表的论文或教研论文则不“查重”;通常只对申报高级职称教师的科研成果有“查重”的规定,而对申报中级及其以下职称教师的科研成果则不“查重”……。有些省甚至以主管部门文件的名义做出统一规定,但仅同一年度重复率高低的要求也不相同。如2014年度山东省教育厅的规定是“论文重复率(即总文字复制比)不超过30%,且单篇最大文字复制比不超过20%……不符合上述要求的,高评委办事机构不受理个人申报。”山西省教育厅的规定是“重复率超过10%的论文,即不能作为申报支撑材料。”以重复率高低判别学术不端与否,但在不同单位对重复率规定不一的情况下,仅凭此判定学术不端却变得越来越难。

2.科研成果类别问题

高校教师科研成果仅论文而言类别很多,而用统一重复率标准要求是否合适呢?“现有的论文检测系统的原理基本相同,都是将论文切块分解后,与资源库中的内容进行匹配度检测。”[7]而抛开真正的学术不端不谈,依据前述论文检测系统原理,在论文总字数恒定的前提下,有两类论文重复率必然很高,即研究综述和马列理论研究。它们必然引用大量以往文献,才能使读者“知其所以然”,特别是马列理论研究类论文,更不可能更改经典作家的原话,削足适履地满足重复率要求。“名言名著、经典理论等的引用会被检测系统机械、刻板地认定为‘抄袭,造成‘表面抄袭率偏高的现象。”[8]因此“如果在实际工作中仅仅以重复率的数据为标准,而不顾及不同论文阐述理论观点的具体需要,就会偏离制定制度的初衷。”[9]然而遗憾的是,无论高校或省级主管部门在规定重复率时并未区别对待上述这些情况。

3.“查重”规则问题

“查重”最初是靠人工,“以前主要是依靠导师和评审教师的记忆去‘查重,但个人的积累和记忆毕竟有限,不可能‘面面俱到。”[10]而后来则靠计算机,其算法也比较简单,以连续字数多少为判定标准,例如中国知网推行“连续十三字”原则;现在“查重”则更加“智能化”。例如“格子达”检测系统就宣称其采用“智能强大的核心算法”,即“语义指纹多重识别,词组级颗粒,独创动态递归语义比对算法”。强大的检测机制即是采用语义识别技术,快速命中并识别出检测文件与比对源中的相似内容,这使“查重”从“文字查重”简单的阶段发展到“思想查重”的复杂阶段。虽然越来越趋近于“查重”的本质,但也存在问题:目前市面上的“查重”系统众多,每个系统据以判定重复率的算法都不相同;加之每个系统进行比对的文献数据库的内容及大小不同,即不同的“查重”系统“所采用的数据源、比对技术等均是影响因素。”[11]这些因素都将造成同一科研成果用不同版本的“查重”系统进行检测,重复率有高有低甚至差别还比较大的情况。例如“当同一篇稿件在同一时间、同一地点用 AMLC 和万方论文相似性检测系统进行检测时,其检测结果可能有所不同,甚至个别的差异还比较大。”[12]这种状况同样存在于对高校教师参评职称科研成果的“查重”检测中,这就使得“查重”检测及结果缺乏应有的公信力。

4.“查重”与“降重”并存

俗话说“道高一尺、魔高一丈”。若说“查重”是防范学术不端的“道高一尺”,那么所谓的“降重”就是助长学术不端的“魔高一丈”。概言之,“降重”的方法主要有“调整原文段落与格式”“插入空格”“翻译外文文献”“插入图标网格”“未被录入查重系统数据库的书籍文献”等,“极具讽刺意味的是,通过灵活运用上述方法,抄袭的文章绝大多数都能顺利通过查重软件的检测。”[13]更具讽刺意味的是,一些提供有偿“查重”的服务者也提供所谓“降重” 服务,即在“查重”检测后再用该系统“智能化”地修改作品直至达到要求的重复率,集“矛”与“盾”、“道”与“魔”于一体。如果说“查重”收费是否合理仍在探讨中,那么“降重”无论收费与否都肯定不合理——其有协助作弊之嫌,轻者是失德重者是违法;有时重复率高低都是同一系统说了算,表面上看似客观但实际上却令人怀疑——如前所述,“查重”系统的数据源、比对技术都将影响重复率,因此原文献的重复率和“降重”后文献的重复率都只能够由同一系统给出,这就好比“既当裁判员又当运动员”。

三、高校教师职称评审中科研成果“查重”的反思

笔者认为,高校教师职称评审中科研成果“查重”有三个方面值得反思:

1.人性论

“查重”无论制度设计还是系统设计,都体现出强烈的“性恶论”色彩。先就“查重”系统而言,“设计过程并不单纯是追求对自然的理性控制和实现技术的功能效率,人类的价值理念通过设计过程内化于技术设计成果之中。”[14]换言之,产品设计的背后蘊藏不同的人性假设。有些“查重”系统如“中国知网”,其设计就体现了“性恶”的人性假设——其名就叫“学术不端检测系统”。高校教师职称评审中提交的科研成果,是否存在学术不端须经其检测后才能确定,而在检测前它们不能被指为学术不端。“无罪推定”是现代我国法律的原则,现在无论有无学术不端都要经过名为“学术不端检测系统”的检测,这其中多少有些“有罪推定”的意思,对大多数学术端正的高校教师也似有侮辱之嫌。“万方”和“维普”命名则相对较为中性,名为“论文相似性检测系统”和“论文引用检测系统”,给人的感觉也相对好些。而就“查重”制度而言也是如此。有些高校甚至省级职称主管部门规定,高校教师在职称评审中提交的科研成果都规定必须经过“查重”检测的环节,甚至是“先查再评、不查不能参评”,这也表现出其对参评教师的不信任,也是其所持的“人性恶”心态的体现,不少参评的高校教师对此都颇有微词。

2.合理性

“查重”技术的发展现已从文字比对进入“语义识别”等高度智能化阶段,即从“文字查重发展到“思想查重”。但以人工智能为基础的“查重”技术能否实现“思想查重”却值得怀疑。笔者认为,“查重”只能是判断学术不端的辅助手段,若将其作为主要手段那就是本末倒置,做出最终判断的还应是本领域的专家。进而言之,即使是“语义识别”等智能化的技术,其实质仍然是对人脑思维的一种模拟,但是这种模拟通常比较简单,远远不及“阿尔法狗”等高级人工智能。“阿尔法狗”等采用“深度学习”方式,即多层的人工神经网络,就像生物神经大脑的工作机理,通过合适的矩阵数量将多层组织链接在一起,形成类似神经网络的“大脑”进行精准复杂的处理,即对多种、复杂思维的模拟。“阿尔法狗”经多次改进才击败人类最厉害的围棋手,然而学术研究思维的多样性和复杂程度并不亚于下围棋。“语义识别”等智能化“查重”技术,不可能达到“阿法狗”对人类思维模拟的多样性和复杂程度,又何以进行“思想查重”呢?“如果查重软件只能检测文字重复率,不能辨识论文创新点,那么即使它是用计算机语言编写的程序,其科学性也会受到怀疑……用计算机语言编写的程序也是人为的产物,人工智能可以相信但不能迷信。”[15]因此,“智能化”“查重”是难以令人信服的。

3.不盲從

设计“查重”系统是为判别学术不端,规定“重复率”则是为界定学术不端,但“重复率”较低的科研成果也可能存在学术不端。例如隐性重复,即“检测重复率低但仍存在与他人观点相同、论证基本一致、所得结论相似、表述方式与他人不同但表述的意思一致的情况。”[16]再如,它在判别与界定学术不端时也很有限,其只能判别与界定抄袭、剽窃等行为,而对改头换面的一稿多投、篡改或捏造数据和结论,则无法判别与界定。况且还存在前述针对“查重”系统设计缺陷而实施的“反查重”诀窍和“降重”服务,在判别与界定学术不端时就更不能唯“查重”系统和“重复率”高低而论。从合理性与不盲从这两点上看,在高校教师职称评审中,“查重”结果只能作为判断学术不端与否的参考,而不能作为决定性标准。“评审”并不仅仅是评判教师科研成果学术水平的高低,也包括评判教师科研成果中是否存在学术不端行为,因此在对学术不端的判定中,不能以机器“查重”的结果替代评委的主观性评价。

四、高校教师职称评审中科研成果“查重”的完善

1.以人工评审为主,机器“查重”为辅

人工智能无论如何都不能替代人,电脑无论如何也都不能替代人脑。因此,不能完全把高校教师的科研成果交给“查重”系统,用机械的方式去做判别;做出主要和最终判别的只能是人,即评委。“查重”只能是一种辅助性手段,切不可喧宾夺主、本末倒置,还要正确地看待重复率。笔者建议,在高校教师职称评审中,高校以及省级教育主管部门在有关职称评审的规范性文件中,对重复率做出规定时必须慎重并要有依据;且必须区分不同类别的科研成果而给出高低不同的查重率要求,不能“千篇一率”。还要注意“查重”运用的时机和名义,即应规定先由职称评委对成果进行人工审读,只有在怀疑其中存在学术不端的可能时,才启动运用“查重”程序进行辅助性判断,才能使用名为“学术不端检测系统”的“查重”系统进行检测,切不可以颠倒这个顺序,更不能乱用“查重”。

2.以人工评审为主,智能化“查重”为辅

在高校教师职称评审中,对参评的成果通过连续字数比对进行“文字查重”,基本上可做到“铁证如山”,而使用“语义识别”等智能化的“查重”,其结果则要慎重地对待,其只能够起到辅助功能。从道理上来讲,“‘人工智能距离人的智能有其短板,其超越人类者在于计算,其远低于人类者在于思考,而论文,则是人类思考的体现。”[17]所谓的智能化“查重”,实质是用系统模拟出一种或多种人类思维去检测所有可能的人类思维,这其中难免会犯以偏概全的错误。因此,即使是智能化的“查重”也只能是辅助性手段,判断学术不端主要还要靠职称评委的主观判断。有经验的职称评委往往可以从科研成果的参考文献、作者已发表的成果中就可以发现学术不端的端倪。另应指出的是,高校教师科研活动非常复杂,其突出表现在思维的复杂性和多样性上,这种复杂性和多样性有很多是“人工智能”无法比拟的,对此智能化的“查重”只能作为辅助手段。

3.建立统一的“查重”系统

虽然判别学术不端主要靠职称评委的主观判断,但“查重”作为辅助性手段仍然是必要的。然而,如前所述,“查重”系统的数据源、比对技术都将影响重复率,同一科研成果用不同版本“查重”系统重复率存在一定差异,这将给判别学术不端带来较大的困难。在这种情况下,必须通过建立统一的“查重”系统以避免上述问题。实现这种统一比较困难,主要原因在于市场。笔者认为,“查重”系统不应市场化,最好是由国家教育主管部门建立专门供高校职称评审使用的官方、公益性的“查重”系统。目前“查重”系统暂时无法统一,可考虑通过建立“查重”的国家技术标准,使“查重”能有章可循。

4.禁止有偿“降重”服务行为

如前所述,“降重”并不是对科研成果的修改、完善,而是利用“查重”系统在规则或“算法”上的缺陷处理科研成果,使科研成果的重复率降到要求的标准。虽然客观而言,“降重”也将助推“查重”系统向更“智能化”的方向发展,但“降重”并不具备正当性。“降重”不仅不能消除学术不端,反而还会助长学术不端。特别是有偿的“降重”还有可能存在欺诈,必须禁止。当然,这需要国家有关部门协调联动、共同应对。鉴于目前“查重”和“降重”已形成庞大的市场,教育主管部门应当联手市场监管部门出台措施禁止商业性的有偿“降重”服务。

2017年,教育部等五部委联合下发《关于深化高等教育领域简政放权放管结合优化服务改革的若干意见》(教政法〔2017〕7号),至此我国高校教师职称评审进入全面自评时代。在这种背景下,高校教师职称评审中的科研成果“查重”也将全面交由高校自行管理。因此,各高校应在深入研究的基础上,慎重地执行相关规定,以避免产生重大争议或误判。在这其中,特别要破除对“查重”系统“技术万能主义”的迷信,而恢复评审人员在这方面的权威判断,因为前者只是辅助手段,而后者方才是根本。

参考文献:

[1]卢威.学位论文“查重热”的冷思考[J].研究生教育研究,2015(1):66.

[2][13][15]杨再贵,许鼎.论文查重应区别对待[J].决策探索(下半月),2015(5):75,76.

[3][16]陆宜新.学术不端检测中的隐性重复现象分析[J].中国科技期刊研究,2015,26(6):4.

[4]康存辉.道德治理视阈下的学术不端检测是与非[J].武汉纺织大学学报,2015(2):74-76.

[5]赵冬梅、常志红.高校图书馆在职称评审论文查重检测中的实践与探索[J].晋图学刊,2020(6):78.

[6]沈文柱.最新图书馆信息采编与图书情报实用技术大全(中)[M].乌鲁木齐:新疆人民出版社,2004:895.

[7]眉间尺.论文查重很必要,但不是万能灵药[N].科技日报,2018-04-13(007).

[8]王海蓉.科技期刊查重面臨的问题及其应对措施[J].韶关学院学报,2017(03):102.

[9]卢黎歌,程馨莹.关于文科类学术论文的引经据典与重复率问题[J].南海学刊,2016(2):5.

[10]晋浩天.论文“查重”,能否遏制抄袭之风?[N].光明日报,2014-05-19(006).

[11]王启云.论文查重,你了解多少?[N].中国科学报,2019-11-25(007).

[12]吴昔昔,贾建敏,吴健敏,王小同.低重复率稿件中的学术不端行为检测与防范[J].编辑学报,2016(03):4.

[14]王以梁,秦雷雷.技术设计伦理实践的内在路径探析[J].道德与文明,2016(4):133.

[17]翟春阳.古有削足适履,今有削足适度[N].杭州日报,2019-09-16(009).

Reflections on Duplicate Rechecking of Scientific

Research Achievements

——An Analysis on College Teacher's Research Materials

for Professional Titles

QU Zhen-hui

(Hunan Women's College, Changsha 410004, China)

Abstract: In the process of university teachers' professional titles appraisal, duplicate rechecking has become the main means to discern the academic misconduct. However, there are still many deficiencies in this means , such as the inconsistent checking standard, scope and research materials, differentduplicate rate of the same material under different systems as well asthe paid service to lower the rate, which encourages plagiarism. Thispaper shows that those duplicate rechecking systems are constructed on the doctrine of evil human nature. And the intelligent system is only an auxiliary means because it is not convincing with some deficiencies so it cannot be blindly followed. Therefore, it is necessary to rationally regardit and apply the way of rechecking, cautiously treat the intelligent system, establish a unified mechanism and prohibitanypaid service to lower the rate  so as to improve the working procedure.

Key words: Professional Title Appraisal; Achievements in Scientific Research; Duplicate Rechecking; Reflection; Academic Misconduct

收稿日期:2022-06-05

作者简介:屈振辉(1977),男,河南信阳人,女性创新创业研究所副教授,硕士,研究方向为教育治理。

此文为湖南省教育科学“十三五”规划课题“治理视域下的地方高校教师职称自评改革研究”(编号:XJK19CGD060)和长沙唯真教育咨询有限公司委托研究课题“大学生诚信就业与学术诚信的关联度研究”(编号:2018001)的研究成果。

猜你喜欢

学术不端查重科研成果
科研成果转化
学位论文查重乱象引关注
中国科研成果震撼全球
学术论文该“查”什么?
论文查重别大意
学术论文该“查”什么?
加强医疗科技自主创新和科研成果转化
学术不端行为防范机制的构建
审批复杂 科研成果落地难
高职教育类期刊学术不端问题的成因及对策探析