基于知网甄别学术论文不端行为的认证技术研究——以中央财经大学为例
2013-09-11文/徐颖
文/徐 颖
学术是国家思想文化建设的基础,学术的兴衰往往成为国运隆替的象征,学术风气的正邪也往往成为世道人心的缩影。[1]
学术不端问题早在20世纪90年代起便引起国内学者的关注,但在当时并不是研究的焦点。随着方舟子打假热潮的来临,以“新语丝”和“学术批判”为代表的网络学术打假的兴起,学者的学术论文被指造假、抄袭或者是剽窃等现象时有发生,这其中不乏国内著名的院士、高校学者和教授。一时间,国内学者的学术道德问题被推到风口浪尖,学术问题成为众人议论的焦点,学术界、教育界开始对学术不端问题予以广泛关注并展开系统研究。目前,国内有关学术不端问题的研究主要涉及学术不端行为的定义及行为表现、学术不端行为的成因分析、学术不端行为的防治措施等方面。如学者董正华(2009)、[2]张浩、高国龙、钱俊龙(2011)、[3]林雅英(2012)[4]先后对学术不端行为明确提出了不同类别,进行了狭义与广义区分等;造成学术不端行为的原因有许多,目前学术界普遍认可的原因主要有科学工作者自身的主观原因以及社会环境、学术制度等客观原因。如马玉超,刘睿智(2011)、[5]李晴(2011)[6]等;对学术不端行为的防治措施研究,主要包括加强对科研工作者学术规范道德的建设、制定合理的教学科研制度、科研工作去行政化、加强对学术不端行为的监督力度、规范并完善对学术不端行为的惩罚措施等几个方面。如杨进军(2005)、[7]蔡红建(2010)、[8]胡二龙(2011)[9]等。
本文试图结合中央财经大学科研管理信息系统的工作实践案例,依托中国知网公开的科研成果数据标准和优势,采用信息化的手段和技术的甄别、对接与认证等途径进行科学化的科研管理,根治学术不端行为的源头。
一、高校科研成果管理现状和问题
长期以来,高校的科研成果管理归属在职能部门科研处,随着信息化管理方法的普遍推广和应用,各高校开始研发和使用现代化的信息手段介入科研管理工作,通常采用的是自主研发和技术合作研发等形式,并相继建立了科研管理信息系统,对科研论文、著作和项目进行有效管理。
1.科研工作信息化管理现状
随着科研管理系统的普遍应用,各高校科研管理工作基本上能够满足现阶段管理的要求,通过三级管理即个人网上申报、学院审核认定、学校通过认定等程序,实现了科研管理信息化的工作模式。从管理的时间和效率上看,相对于10年前的手工操作、填写并记录科研数据而言,的确是今非昔比,大有成效。就论文而言,科研论文的管理要求每个科研人员全力配合,不仅要求科研人员准确输入数据,还要求携带期刊原件到学校进行审核。学校对论文进行分级管理,二级管理人员必须具备严谨的工作态度,以论文发表的期刊为依据,对每一篇论文信息的真实性进行认真核对。目前,从事这项工作的科研人员和二级管理单位所投入的时间和精力相对较多,效益受到了制约,即使如此,还会出现不必要的误差,只有科研人员和管理人员通力合作才能及时和准确完成任务。
2.信息化管理中存在的问题
随着信息化管理工作的推进,问题也不断暴露出来,主要表现在以下方面。
其一,原件来源的真实性较难验证。科研管理对论文的管理是依据纸质的期刊和论文的原件来证实其真实性的。但难辨真假是管理工作的最大困惑和难度。目前,各高校根据自身的办学目标、理念、思路以及学科特色,制定出了科研成果如论文的分类、级别,以核心期刊或非核心期刊来区分论文的水平和高低是许多高校采用的方法。高校教师在成果奖励、评聘职称等工作中,基本上是以发表在高水平期刊上的论文作为标准和要求,这就客观上造成了教师为能在高水平期刊上发表论文而铤而走险。这其中还不断出现相应的中介机构,利用人性的功利心、欲望和利益观念纷纷支招,有的是不明真相被利用而导致假期刊、假文章的出现,甚至造成偷梁换柱等道德恶劣行为屡屡发生,给高校这片净土的学术环境造成了严重的危害。
其二,数据的无缝对接难以实现。近年来,各高校根据学校的发展目标,在科研管理工作中基本采用了信息化的手段,利用开发研制的科研系统全面开展项目、成果、学术交流等各项管理工作,满足了校级内部的管理要求。但在新的形势下,信息系统能否实现精细化管理的目标,将成为现阶段的重要问题。如对论文的管理,按照教育部人文社科统计的要求,系统只是对论文信息进行简单的文字记录,如作者、论文题目、发表期刊、发表时间、是否为项目的阶段成果等,不同系统中提交的论文数据格式不相统一,导致无法正常打开全文进行阅读,给论文查阅带来极大不便等。
其三,信息系统的可扩展性及兼容性较差。各高校的科研管理系统在满足校内管理要求的同时,不同程度地存在着与各中外文献数据库之间系统不兼容,不能互访和共享数据资源等问题。
如何满足上述诉求,实现数据的无缝对接、延伸、扩展和兼容等,突破现实科研管理工作中的问题,寻找切实可行的精细化管理的方法和途径,实现数据信息的标准和统一,是目前高校科研管理工作中的难题。现阶段我国正处于“十二五”国家教育发展规划时期,伴随着教育规模的发展,计算机技术的现代化和信息管理的时代化,使得高等教育科研管理工作创新有了显著的突破。
3.中央财经大学科研管理信息系统的作用
作为首家与教育部社科统计完全兼容的信息化管理系统,中央财经大学科研管理工作自2004年与人文社科网合作开发建设科研管理系统以来,实现了科学化、网络化、信息化、无纸化等的管理,建立网络中心平台,实现了科研管理工作等功能,它不仅为及时完成教育部科研统计上报工作提供了便利条件,还为学校科研管理工作、科研统计工作以及科研服务各职能部门所需各种科研数据提供了极大的便利,真正实现了资源共享的目的,实现了无纸化办公的目标。这套系统具有科学性、应用性、实用性和可操作性等特点,可以说是科研管理工作在理念、方法与手段方面的变革与创新(如图1所示)。
这套系统于2005年在全国首届科研管理工作培训中进行了展示与交流,并引起全国许多高校的广泛关注。以中央财经大科研管理信息系统为蓝本,至今已推广到全国20多个省(区、市)400多家高校和科研单位,以其全新的科研管理工作理念、方法和手段,在教育部人文社科网站上公开广泛宣传,在全国社科管理工作中起到了示范和带头作用,推动了高校社科管理信息化工作的进一步深入。[10]
二、中国知网的优势和劣势
中国知网(简称CNKI)是当前国内最大的资源综合信息数据库,始创于1995年,由清华大学、清华同方发起,同方知网技术产业集团承担建设,被科技部确定为“国家级重点新产品”项目。CNKI是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。其主要特点如下。
1.数据权威
CNKI工程建设得到了教育部、中宣部、科技部、原新闻出版总署、国家版权局和国家计委的大力支持,得到了全国学术界、教育界、出版界、图书情报界等社会各界的密切配合。在清华大学的直接领导下,采用自主技术建成了世界上全文信息量规模最大的“CNKI数字图书馆”。CNKI数据已在各高校和科研院所广泛使用,成为中文知识信息资源库中的权威。
2.数据覆盖面广,时效性强
CNKI资源总库拥有涵盖我国期刊、博硕士学位论文、会议论文、报纸、年鉴、专利、标准、科技成果、工具书、古籍等各类文献资源,且时效性强的大型全文数据库和二次文献数据库,同时拥有由文献内容挖掘产生的知识元数据库。
3.严格遵循数据标准
针对不同类型的文献资源,CNKI均提供标准数据格式,全面涵盖文献资源各项内容。以论文为例,信息包含主题、篇名、关键词、摘要、作者、第一作者、全文、参考文献、基金、作者单位、刊名、年、期、中图分类号、ISSN、统一刊号、更新时间、来源类别和全文电子版,信息全面,并且针对所有属性均可进行检索。
4.数据应用灵活
CNKI数据应用方式灵活,可在线直接进行浏览、下载等应用,也可通过“机构科研成果库”进行成果的浏览、统计。“机构科研成果库”可独立部署在校内服务器,可定期从CNKI总库获取本校成果数据的更新,同时提供Web Service接口,方便与校内科研管理系统进行灵活的数据对接。
当然,针对高校科研管理应用,中国知网的论文管理数据也存在着不足之处。一是作者信息无法关联。中国知网的论文作者信息不能直接和校内的科研人员信息相关联,无法针对科研人员进行论文管理。二是论文分类信息不完整。中知网提供的论文分类信息不完整,无法满足高校论文管理的需要,学校需要对论文分类信息进行完善补充。
三、实现科研系统与知网数据对接的技术途径
由于管理方式和管理理念的不同,高校和中国知网在科研论文管理上都有自己的优势和不足,如何协调利用双方的优势已成为关键性研究问题,在这方面中央财经大学科研管理工作中的探索性实践值得借鉴。
1.系统数据对接的技术方案
(1)系统数据对接模型。系统数据对接的技术设想和方案就是要将网络数据与期刊数据统一化、标准化,并能融入科学化、数字化、精细化的科研信息系统的管理过程,提高科研管理水平。
由图2可以看出,该系统由客户端、内网服务器、知网云端数据库三部分组成。内网客户端用户向内网服务器的科研管理系统发送科研请求,通过查询位于内网的知网机构科研成果库,获取论文详情,并将查询结果返回给客户端,位于云端的知网数据库定期推送数据到内网中的知网机构科研成果库,从而实现内网用户能及时快速地访问知网机构科研成果。
(2)系统数据对接功能。通过系统数据的成功对接,能够实现管理的功能有:一是可统一高效地收集获取论文基础信息;二是系统可以将科研管理系统的论文和知网库论文进行匹配,获取知网权威数据,减少科研人员信息录入工作量;三是科研人员完善论文信息,保证论文信息的完整性;四是减少管理人员的管理投入;五是科研人员认领未匹配的论文信息,作为系统自动匹配论文作者和论文学院归属的补充,保证论文数据的准确性;六是针对知网论文数据中的遗漏进行补充,保证论文库信息的完整性。
(3)系统数据对接的核心价值。系统的核心价值具体体现在:其一,简化了科研人员填报数据信息录入的工作;其二,简化了二级科研管理员的审核工作;其三,通过系统数据的对接,借助知网平台,能够杜绝个人虚假论文数据的录入;其四,从学校管理层面上实现了抵制学术不端行为的产生等作用。
(4)系统数据对接的柔性适用于系统间的异构。将新建的“中央财经大学科研成果库”与现有的“中央财经大学科研信息系统”进行数据对接,功能互补(这里包括学术不端行为的检测功能),通过技术手段实现资源共享,资源再利用、资源再配置,形成完善、合理的全方位的管理状态,达到理想化、科学化、信息化、可实际操作的先进管理工作环境,最终实现科研管理信息化,提高管理水平。
2.系统数据对接的制度设计方案
科学、合理、完善的政策、制度建设,是保障系统管理工作执行的基础。《中央财经大学科研管理工作办法》对现有系统数据的配置与功能规定如下。
首先,从管理的角度进行设计,实现了统计与分析数据的方案。如按成果类型分组,包括论文成果、学位成果、著作成果、科技成果;按发表年度分组,即发表成果历时追溯,从学校建校至今的成果全部涵盖;按收录索引库分组,包括EI、SCI、SSCI、ISTP、ISSHP、A&HCI等数据;按学科领域分组、按语种分组。
其次,从推进学校科研发展的角度设计全校发表高频论文的数据统计,如引用频次、下载频次等,对于论文的质量导向以及为学校科研工作发展提供数据参考。
再次,从教师个人从事科研活动中的科研数据来设计,其发表的论文可以按时间、年度、类型、级别等进行统计与分析,实现了个体数据的统计与管理。
3.甄别学术不端行为的认证技术
(1)系统数据整合过程。系统数据整合过程是将中央财经大学科研管理系统和中国知网科研成果库数据集成,其方案主要包含两个方面:业务管理集成和数据集成。
业务管理集成。将知网的论文管理数据和科研处的论文管理流程相集成可以有效地发挥两个系统论文管理上的优势,在减少管理投入的同时获取更高质量的管理效果。其功能优势表现在:一是实现知网数据和日常管理数据相结合;二是简化个人信息录入;三是简化管理审核流程;四是实现论文电子归档;五是实时查阅论文被引信息。
数据集成。科研管理系统针对论文管理扩展数据导入接口。确保知网导出的论文信息可进行Excel格式的数据导入。系统将在数据导入的过程中自动完成数据智能匹配。系统在智能匹配的过程中将完善论文的所属机构和作者职工号信息。针对无法完成智能匹配的成果,由科研人员介入手工完成认领匹配功能。
(2)期刊论文管理流程再造。科研论文和知网“机构科研成果库”集成之后,将大幅度简化知网收录论文的管理流程,而未被知网收录的论文仍可沿用原来的论文管理流程。科研人员发表的论文可以依据是否为知网收录的论文分别进行论文的录入和管理。论文管理的业务流程如图3所示。
对于知网收录的论文的具体操作包括:①个人登记论文题目信息。②系统根据论文题目和论文所属学校在知网进行检索。③系统自动从知网获取论文的发表时间、发表期刊、一级学科、依托基金、论文电子版附件等论文属性。④系统自动根据论文的发表时间和发表期刊确定论文的刊物级别(用于论文的考核和奖励)。⑤个人登记论文作者信息。⑥系统自动校验论文作者的准确性(因论文作者可能存在校内老师之间重名、校内老师和校外人员重名、校内老师和校内学生重名等情况,系统无法将知网作者信息与校内老师匹配,需要论文作者手工输入信息)。⑦根据CNKI疑似学术不端判定标准,判定学术成果疑似程度。比如常见的一稿多投问题,通过信息化管理的方式对论文的疑似程度作了具体要求,并通过疑似学术不端成果名称、成果内容、发表期刊、发表时间等判定是疑似自抄,还是一稿多发,或是疑似他抄,并对重合比例程度等指标进行规范,对确实认定为学术不端成果的要进行鉴定,并给出处理意见,防范和杜绝不端行为的发生。⑧知网论文系统自动审核通过(因论文关键属性均来源于知网权威数据,故可跳过人工审核过程)。
对于非知网收录的论文的具体操作步骤包括:①个人登记论文必填属性信息;②个人上传论文附件电子版;③个人填写论文作者信息;④个人提交论文发表期刊原件,成果管理员根据期刊原件对论文基础属性、论文作者等信息进行审核确认。
(3)集成频率与实施步骤。集成频率由科研管理部门确定知网论文信息的收集频率,可按照年、季、月为单位进行数据的收集整理。当然论文管理的实现集成必须先完成业务集成,业务的顺利集成需要科研处制定相关的制度来保障。具体的步骤是:第一,科研管理部门确定提供收集论文信息的数据结构和收集频率;第二,科研系统针对论文集成的数据格式进行数据导入定制开发;第三,科研系统针对知网导入的论文信息完成论文数据和科研人员的智能验证;第四,科研系统允许科研人员针对知网未收集到的论文进行补充录入;第五,进行论文管理的集成测试;第六,测试通过,论文集成管理正式运行。
结语
中央财经大学科研管理工作通过依托中国知网公开的科研成果数据标准和权威数据,将现行的科研管理系统进行整合,并与中国知网科研数据库进行系统数据的有效对接,运用的是信息化的手段和技术,对学术论文进行甄别、对接与认证等途径进行科学化的科研管理,并实现了对论文原件来源的真实性验证、数据的无缝对接、不同信息系统间兼容性的提升,进而能较好地根治学术不端行为的源头,营造公平、自由、和谐的学术环境,杜绝学术不端行为的泛滥,维护科研诚信的道德标准。该系统未来将考虑的进一步改善方向是:其一,结合更多高校科研管理工作的实际情况,进一步向外推广;其二,融合更多海外文献数据库,使得高校科研管理系统能与更多的中外文献数据库实现无缝对接和扩展。
[1]蒋寅.治理学术腐败和学术不端行为的思路与对策.[J].社会科学论坛,2009, (9)
[2]董正华.学术不端行为研究及对策[D].大连理工大学, 2009
[3]张浩,高国龙,钱俊龙.国内外学术不端文献检测系统平台的比较研究[J].中国科技期刊研究,2011, (4)
[4]林雅英.高校学术不端行为的表现及其防范路径研究[J].中国科技信息.2012, (17)
[5]马玉超,刘睿智.高校学术不端行为四维度影响机理实证研究.[J].科学学研究,2011, (4)
[6]李晴.高校学术腐败与学术不端行为成因及对策思考[J].包头职业技术学院学报,2011, (4)
[7]杨进军.当前我国学术不端行为的成因及对策研究[D].西南交通大学, 2005
[8]蔡红建.遏制学术不端对策讨论[J].人民论坛.2010, (8)
[9]胡二龙.诚信视角下的中国科研不端行为监管机制及优化研究[D].中南大学, 2011
[10]徐颖.高等院校科研管理信息系统研究[J].西安电子科技大学学报, 2006, (7)