检测电子作业被抄袭的软件研究
2017-04-10邓玮蔡春玲雷刚
邓玮+蔡春玲+雷刚
摘 要:在这个网络信息技术飞速增长的时代,高校在课程学习验收成果的形式是也开始电子化。但与此同时,由于电脑的易操作性,抄袭现象也伴随而来。我们采用了两种简单的操作方法,实现了二个小软件。通过监测关键字,统计个数比对以及截屏监测作业制作过程来大致判断有无存在抄袭。实验研究表明软件能初步判断出学生作业中是否有可能抄袭。
关键词:电子作业 检测抄袭 关键字 截屏 距离计算
【中图分类号】G434
1引言
随着计算机应用的普及,高校正在逐步实现作业的电子化和网络化。这种作业形式的改革有效减少了教育资源浪费,教师工作任务量,提高了效率,使教与学得到了互动。作业的电子化是高校教学改革发展趋势,同时带来的负面影响则是加重抄袭现象,这就成为作业改革受到严重困扰的主要因素。所以研究一款减少抄袭现象发生的技术对作业质量的提高具有重要意义
2 国内外现状分析
大学作业抄袭在国内外已十分常见。中国青年报在调查中对2340人进行的一项调查显示,82.7%的人认为大学生作业抄袭现象普遍,45.5%的人感觉“非常普遍”。在国外,Cramster.com网站中包含数百本教科书附加答案,学生仅需月付少量金钱,便能轻松解决作业。
中国学者付兵在《基于信息隐藏技术的电子作业防抄袭研究》《网络环境与机房环境下电子作业反抄袭策略》这些篇论文中提到,他采用了信息隐藏算法对作业文本嵌入原创信息,对作业进行片段拷贝检测,从而准确定位抄袭源。西米苏里州立大学的J. Evan Noynaert教授在论文《Plagiarism Detection Software》中指出“Plagiarism detectionsoftware is a powerful tool in the fight against plagiarism.”并提出软件从三个方面来检测抄袭:Quiz methods ,Writing style methods以及Comparison with original sources。
在这些理论和实践的基础上,探究出一个方便直接的防抄袭系统,对大学生未来可持续发展都有积极的作用。
3 系统设计的主要设计思路
3.1设计方向
两个主要的设计方向:动态截屏和检查关键字个数。
3.2具体设计思路
3.2.1采用QT软件设计两个独立的客户端,分别为教师与学生使用。
3.2.2 教师端的采用QT的file读取技术,任意选择两个文件读入软件,统计文件中指定关键字的个数,利用算法得出两篇作业关键字个数的相似度,若相似度过高则可大体判断为抄袭。
3.2.3 学生端采用QT的图像截取技术,用定时器自动将电脑整个屏幕截图以图片格式保存在一个文件夹中。通过截图可判断做作业过程中学生是否出现异常操作。若短时间内截图中作业内容变化大或者截图中出现正在用浏览器搜索网络上的作业等,则可能存在抄袭。
4 研究过程
4.1图片定时记录以及存储
由于图像信息修改较为麻烦,能较真实的还原事物本质,则在研究过程中,着重利用Qt Creater中现有的针对图形图像处理的QPixmap类,运用其已有的grabWindow()函数,通过参数的设定,最终对学生电脑在作业时的整个屏幕进行捕捉记录,并利用saveScreen()函数将捕捉到的圖像信息以系统时间为命名方式存储在文件夹中,较为真实的还原了学生的作业过程。为了提高记录效率,后期利用Qtimer类以1min/张的频率进行图像信息的存储。
4.2内容对比检测
在数学中,空间向量的模越短,则两点坐标越相近。基于这一性质,系统罗列了电子作业中大部分可能用到的关键词,并按照其字符串长度进行排序,形成一个n维数组arr[n]。其次,对需进行比较的电子作业进行关键词的提取,记录各个关键词的数量,并按照数组arr[n]中元素的排列方式形成两组n维数组a[n]和b[n]。那么就等同于得到了2个三维坐标,在空间向量中,我们可以利用数学公式(1)求出二个向量之间的模,从而得到两点间的距离,为了增加检测结果的可信度检测程序中录入了50余个关键字。
公式1 计算距离的公式
根据d的数值大小来判定相对比的两份电子作业相似性。我们设定了一个指定的阙值,当得到的结果d的数值小于等于该指定阙值5时,则可判定为疑似抄袭。
结束语
现如今的中国高等教育的教育模式基本类似于“师傅领进门,修行靠个人”,在经历过快节奏的高中生涯后,自由的大学生活给大学生带来巨大的心理反差,许多人不再专心于专业课程学习,渐渐荒废学业,致使毕业时前途迷茫,遗憾蹉跎。
本项目的研究主要以检测大学生是否抄袭作业,使大学生独立自主完成专业作业,培养个人良好素质习惯。为社会输送更多学而有成的专业能手。提高高等教育培养出优秀人才的比例。对自身以及社会都有良好的影响。
本研究的特点,它是具有一定实用性的检测软件。可以从多个方面来判断抄袭,容易操作,简单,可行性大。
参考文献:
[1]付兵.基于信息隐藏技术的电子作业防抄袭研究.长江大学计算机科学学院:1-5.
[2]祁俊.王晓英.抄袭检测系统对计算机类电子作业的影响分析.青海大学:1-3.
[3]化柏林.抄袭检测系统将给中国学术界带来的变化.科技导报, 2009,27(12),107.
[4]胡秋芬.电子作业防拷贝技术比较研究.浙江越秀外国语学院, 2013,34(6):59-60.
[5]李建军.反抄袭软件的局限及学术打假之策.编辑之友·术业,2010,6:87-91.
[6]罗国辉.反抄袭系统的设计与实现.开发研究与设计技术,2007,1615-1616.
[7]石陆魁,张军,陈飞,李金钊.汇编语言程序相似性检测混合算法.河北科技大学报,2011,32(2):139-142.