基于数据挖掘的在线考试系统设计与实现
2015-04-29张维国
张维国
摘 要: 由于网络教学平台的快速发展,使学生自主学习趋向网络化。在线考试系统是学生检验课程学习的一个重要手段。结合现代教育的发展需要提出了一种基于数据挖掘的在线考试系统的设计方案。运用数据挖掘技术构建在线考试系统,建立一套科学合理的成绩分析和評价系统,可以节约大量的人力、物力,提高工作效率。该系统的设计和实现为推动高校的教育信息化管理积累了经验。
关键词: 在线考试; 数据挖掘; 数据分析; 成绩分析; B/S
中图分类号:TP392 文献标志码:A 文章编号:1006-8228(2015)12-41-04
Design and implementation of online examination system based on data mining
Zhang Weiguo
(Nanjing Institute of Tourism and Hospitality, Nanjing, Jiangsu 211100, China)
Abstract: Because of the rapid development of the network teaching platform, the students' autonomic learning trends to be network-oriented, and online examination system becomes an important tool for students to test the learning of the courses. With the development requirement of modern education, a design scheme of online examination system based on data mining is put forward in this paper. Using data mining technology to build online examination system, establishing a scientific and reasonable performance analysis and evaluation system, can save a lot of manpower and material resources, improve work efficiency. The design and implementation of the system has accumulated experience for the promotion of education information management in colleges and universities.
Key words: online examination; data mining; data analysis; performance analysis; B/S
0 引言
数据挖掘作为一种新兴的技术,包括了人工智能、数据库、统计学等学科的内容,其主要特点是对数据库中大量数据进行抽取、转换和分析,从中提取出能够对用户有作用的关键性数据。数据挖掘技术运用到在线考试系统中,能够很好的处理在线考试中涉及到的数据,让在线考试系统的实用性、高效性得到进一步的增强,帮助教师更加快速、完整的统计与分析考试信息,完善课程教学。
利用在线考试系统所积累的考试数据来分析教师的教学效果和学生的学习效果,用数据挖掘技术对这些数据进行分析,分析出来的结果用于指导教学计划的制定和教学任务的实施,特别是学生对教学内容的兴趣、教学效果的检验等方面的分析和了解,有助于学校有的放矢地进行教学活动的计划和实施。
1 在线考试系统数据挖掘的定义
在线考试系统资源挖掘是指从数据服务器上的考试资源中抽取教师及学生感兴趣的知识,“兴趣”就是教师和学生通过考试想获得的知识(如知识点的掌握情况、考试时间等)。在线考试系统资源挖掘其实就是对考试试卷、学生答卷以及教师教学水平等信息资源的使用,以及对这些资源之间存在的关系进行分析,找出隐藏在这些数据背后的有效信息。
原先的网络考试系统用户在客户端查询某门课程、某次考试、某个院系、某个专业、某个班级或某个学生的考试情况时,显示的结果只是单一的、孤立的条件匹配结构列表清单,而没有显示出综合评价某次考试所反映出来的教学中隐含的信息和规律。在线考试系统通过数据挖掘技术对数据进行统计与分析后,改变了这种情况。
在线考试系统资源挖掘可以将考试试卷、学生答卷以及教师教学水平等信息进行分类、汇总,使用户在在线考试系统资源上查询信息更加高效、全面、准确。对于考试数据服务器分析得出的信息规律,可反馈于教学,有利于提高教师教学水平、促进教师指导学生进行更有效的学习,同时为改革考试方式和内容积累经验。
2 在线考试系统的框架结构及功能模块设计
2.1 系统框架结构设计
在线考试系统打破了传统考试方式对时间段和空间上的限制,系统由数据库服务器、Web服务器和浏览器组成,采用B/S三层体系结构设计,并运用HTML语言、ASP和ActiveX文档等技术。用户打开Web浏览器通过HTTP协议向服务器发出请求,并接受和显示Web服务器提供的信息。在线考试系统的框架结构如图1所示。
[用户层][管理员][院系秘书][教师][学生] [应用层][科目管理][题库管理][用户管理][成绩管理][分析决策][信息发布][试卷管理][综合管理] [数据层] [数据库]
图1 在线考试系统功能架构图
数据库是在线考试系统数据层的核心,用户层通过应用层的功能来管理数据层;应用层包括的主要功能有:科目管理、题库管理、用户管理、成绩管理、分析决策、信息发布、试卷管理和综合管理等;用户层是在线考试系统中的角色,即:管理员、院系部秘书、教师和学生。
2.2 系统目标和功能
在线考试系统可以用于学生对课程的学习效果进行远程自助检验、结课考试、学校的课程清考。对在线考试系统中的数据进行挖掘,并提供挖掘模式分析,帮助教师更客观地了解学生知识点掌握情况,及时针对教学内容和教学方法进行改进,让课程教学内容更加合理,真正做到因材施教。
在线考试系统主要由以下五个功能模块组成。
⑴ 组卷模块
①手动组卷是教师设定组卷要求,从试题库中抽取出符合要求的试题组成试卷。②自动组卷模块的理论基础涉及试卷评价指标与组卷要求、数学模型、智能组卷算法、试题库中试题属性及编码方法等。指标项有:试卷总分、试题类型、分值、试题难度、考试时间等。用户将组卷参数设置完成后,学生进入在线考试系统后,选择某一课程进入考试时,系统根据考试计划设置好的试卷总分、试题类型、分值、试题难度、考试时间从试题库中随机抽取对应课程试题,并自动组成一份试卷。③自動抽卷模块用于学校的教考分离,实现对课程试卷统一管理,在线考试系统可以从课程试卷库中随机抽取考试课程的试卷,试卷抽取完成后,教学秘书通过网络下载并印刷试卷。
⑵ 试题库模块
在线考试系统试题库模块用于从题库系统中依据组卷策略选取对应课程的试题。试题库中的试题要求其属性能适应于在线考试系统进行数据挖掘。根据数据挖掘的结论对题库系统进行动态调整,从而满足教学和考试的需求。
⑶ 考试模块
学生根据学号和密码登录到在线考试系统,在规定的考试时间内进行在线考试,包括自动计时、最终将考试数据提交到服务器端等功能。
⑷ 阅卷模块
在线考试系统依据学生提交的结果进行自动阅卷,由阅卷功能模块自动判卷,并计算出考试成绩。同时对学生的考试数据进行汇总,提供学生考试数据分析报表,并将数据返回给其他功能模块。
⑸ 挖掘系统
对学生的考试过程数据进行挖掘,数据主要包括答题顺序、试题分布、答题时间、难度系数等,对这些数据进行挖掘,其分析结论用于指导教师的教学工作。
3 数据挖掘在在线考试系统中的应用
3.1 关联规则分析课程对学生考试成绩的影响
在教学分析中,数据挖掘技术中的关联规则分析是一种使用频繁,行之有效的方法,它能挖掘出大量数据中项集之间有意义的联系,对教师的教学过程起指导作用。将数据挖掘技术中的关联规则运用于在线考试系统的成绩分析当中,能够挖掘出各类课程对学生成绩产生影响的因素,对学校的专科课程设置进行指导,从而提高教师的教学效率,增强学生的课程学习兴趣。
运用关联规则算法先设定一个最小可信度和支持度,得到初步的关联规则,根据相关规则,分析出课程结构的设置和课程成绩分布的影响,从而进行专业课程的结构调整,让课程设置更加合理。在线考试系统随机抽取园林技术专业一个班6个学期开设课程的成绩,对数据进行预处理后,列出学生课程成绩的部分视图如表1所示。
表1 学生成绩表
[学号\&课程1\&课程2\&课程3\&课程4\&课程5\&…\&100551101\&69\&70\&77\&67\&92\&\&110551112\&69\&91\&52\&85\&65\&\&120101233\&63\&67\&72\&76\&90\&\&130101403\&86\&60\&75\&78\&91\&\&130215113\&80\&60\&65\&75\&90\&\&…\&\&\&\&\&\&\&]
通过对45条学生记录的32门课程成绩的分析,每门课程用A、B、C…Z、a、b、c…z表示,课程成绩分成4级,量化规则如表2。量化后的成绩视图如表3。
通过关联规则分析发现,对课程A和课程E学得好的学生,课程M通常很好;对课程B和课程C学不好的学生,课程E通常不好;对课程A、课程N和课程O学得好的学生,课程P学得也不错;导致留级或退学的课程主要有课程B、课程C、课程J、课程b等。通过成绩预警模型的运用发现,学生有课程导致留级或退学的课程出现不及格,可及时制定相应的策略,发出警示,加强对这些学生的管理,尽可能避免留级或退学的情况发生。
3.2 采用分类算法分析对考试成绩有影响的因素
数据挖掘技术中的分类算法就是对一组对象或一个事件进行归类,通过这些数据可以进行分类模型的建立和未来的预测。分类算法对考试中得到的数据进行分类,通过学生的一些基本情况探讨一些对考试成绩有影响的因素。分类算法可以用以下步骤实施。
3.2.1 数据采集
数据采集的工作是从数据源获得能够保存至数据库或数据仓库中的数据信息。在线考试系统中采集需要的数据,学生信息(学号,姓名,性别,出生日期,籍贯,院系,专业,班级等)、课程成绩(学号,课程代码,成绩等)、课程信息(课程代码,课程名称,院系等)、考试易错题(课程代码,本次考试易题,以往考试易错题)。
3.2.2 数据预处理
数据预处理是数据挖掘前的数据准备工作,一方面保证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。其目的在于把一些与数据分析和挖掘无关的项清洗掉,为了给挖掘算法提供更高质量的数据。
⑴ 数据集成。把数据采集过程中得到的多种信息,利用数据挖掘技术中的数据库技术生成相应的学生考试成绩分析数据库。
⑵ 数据清理。在学生成绩分析数据库中,会出现一些情况缺失,对于这些空缺处,就需要使用数据清理技术来填补遗漏。例如,可以采用忽略元组的方法来处理那些没有参加考试的学生数据。
⑶ 数据转换。数据转换主要功能是进行数据的离散化操作。在这个过程中可以根据实际需要进行分类,比考试成绩0~59分到较差类、60~80分为中等类、81~100分为优秀类。
⑷ 数据消减。数据消减的功能是把所需挖掘的数据库消减但又不能影响到最终的数据挖掘结果。比如在分析学生学习情况的影响因素中,学生信息表中的字段很多,可以选择性的删除院系、班级、籍贯等字段,形成一份新的学生基本成绩分析数据表。
3.2.3 利用数据挖掘技术,得出結论
通过数据挖掘技术的应用,从在线考试系统数据中得到学生数据的相关分析,比如:学生考试中的易错点在什么地方,学生考试成绩的自身原因和环境原因,师资队伍的搭配情况,课程的设置情况等,从中得出调整学校教学资源的方案等,完善学校对学生的教学。
4 总结
数据挖掘技术是目前计算机应用上的前沿研究方向之一,特别是在电子商务、通信领域取得了令人瞩目的成绩。在教育领域,数据挖掘技术的应用还不够深入和广泛。随着网络教学的不断普及,数据挖掘的研究和应用也会越来越受到重视和推广。数据挖掘和关联规则在网络考试系统上的应用,对网络教育平台上的网络考试系统数据进行挖掘和分析,从而对授课老师提供反馈意见,有助于老师改进教学内容和教学方法,有助于学生发现自己的知识薄弱点,指导学校人才培养方案的制定工作。
参考文献(References):
[1] 王春霞.基于数据挖掘的在线考试系统[J].电脑知识与技术,
2006.11:27-28
[2] 李文雄,武东英,刘胜利,肖达.基于本体的网络攻击案例库模
型研究[J].计算机科学,2014.41(10):173-176,195
[3] 陈源,谭玉玲.基于数据挖掘的在线考试系统研究咖啡[J].常
州信息职业技术学院学报,2007.1:22-24
[4] 吴英,刘俊熙.计算机考试数据分析中数据挖掘技术的应用[J].
制造业自动化,2010.32(9):136-139
[5] 柴旭光,鞠淑范.基于k-means算法的在线考试系统的研究
与实现[J].邢台职业技术学院学报,2013.30(106):85
[6] 李仕琼.数据挖掘中关联规则挖掘算法的分析研究[J].电子
技术与软件工程,2015.4:200