基于数据挖掘的高职教学质量监控评价系统设计及应用
2015-06-08任锁平
任锁平
(陕西职业技术学院 教务处,陕西 西安 710100)
近年来随着信息技术的快速发展,产生越来越多的数据,然而这些数据中隐含着很多无法用眼睛观察的信息,数据挖掘技术能够通过对大量的数据进行分析、挖掘,寻找数据背后的关系,帮助人们正确的进行决策判断。
而随着国民经济的转型,职业教育也迎来了良好的发展机遇,如何更好的实现职业教育的内涵式发展,是每一位职教工作需要考虑的。高职教育质量监控评价系统正是在这个背景下诞生的一种评价工具。但是仅仅靠评价系统难以做到真实而有效的评价,借助数据挖掘技术,实现对评价系统中产生的大量数据进行挖掘、分析,探寻数据背后的隐含意义,并帮助管理部门进行正确的决策和判断,有效提升高职教育教学质量,加快实现职业教育现代化。
1 数据挖掘
近年来数据挖掘技术引起了广泛关注,其主要原因在于信息技术与互联网的迅猛发展,大量基础数据的产生,人们需要了解这些数据背后的隐藏内容,因而诞生了数据挖掘的概念及技术。
1.1 数据挖掘概念
数据挖掘(Data Mining,DM)一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标[1]。同时它也被认为数据库中知识发现(KDD)的一个环节,大多数情况下认为数据挖掘比数据库中知识发现是两个等同概念,但数据挖掘更加注重于算法分析来探寻海量数据背后的隐含知识的目标。数据挖掘结合了统计学、计算机学科等多学科,支持多种数据格式的挖掘,无论是结构化的还是非结构化的数据都可以通过处理后进行数据挖掘,有较高的应用价值。
1.2 数据挖掘的功能及过程
数据挖掘的功能主要有两方面:描述和预测[2]。描述功能主要是用来数据之间的共同特点及联系,主要包括数据分类、聚类分析、汇总与归纳、偏差检测等;而预测功能主要是通过对现有数据分析来预测未知的数据,主要包括有统计方法、关联规则、决策树与回归、序列模式等。
数据挖掘的过程主要包括:确定对象、数据准备、模型建立、数据挖掘与结果分析等步骤,具体如图1[3]所示。
1.3 数据挖掘算法
数据挖掘过程中算法是其核心内容,以SQL Server2008为例,如图2所示。SQL Server2008中提供的数据挖掘算法主要有以下几种:决策树、聚类分析、Naive Bayes、关联规则、顺序分析和聚类分析、时序、神经网络、线性回归、逻辑回归等。
图1 数据挖掘的一般过程Fig.1 The general process of data mining
图2 SQL Server2008创建数据挖掘结构Fig.2 SQL Server2008 create data mining structure
2 基于数据挖掘的高职教学质量监控评价系统设计
随着现代职业教育的快速发展,职业教育信息化也将成为助力现代职业教育快速发展的重要手段。2012年教育部成立职业院校信息化教学指导委员会,也标志着职业教育信息化步入快速发展的轨道,教育信息化包括很多方面,不仅仅是教学的信息化,还包括教育管理的信息化等,而现阶段的职业教育信息化更多的进行事务处理,利用数据挖掘技术进行数据分析还很少,利用数据挖掘进行教育信息化数据进行分析,将成为教育信息化发展的重要方向。
目前,数据挖掘在电子商务、医疗、金融、交通等方面取得了广泛应用,并促进了其快速发展。而数据挖掘在职业教育方面也必将能够解决教育教学管理中的问题,促进职业教育信息化的快速发展,实现现代职业教育建设。
2.1 系统需求分析
教学质量监控评价系统主要目的在于实现形成相互衔接的多元评价机制和质量预警机制,依托数字化校园网络平台,实现信息及时交换、传输、汇总、分析和反应,形成涵盖人才培养全过程、全方位、多元参与的教学质量监控评价平台。评价主体包括有政府、学校、教师、学生、行业企业、第三方、家长等,各主体在登录页面通过身份验证进行客观评价,最终通过对数据的挖掘分析,为提高教育教学质量提供决策支持。详细流程图如图3[4]所示。
图3 教学质量监控评价系统流程图Fig.3 Flow chart of evaluation system of teaching quality monitoring
2.2 系统功能需求及设计
2.2.1 功能需求概述
基于数据挖掘技术的高职教学质量监控评价系统具备不同用户通过身份验证进行系统登录,实现数据的收集或评价,系统门户首页包括登陆模块、资源和课程的展示,各类大赛的视频及资料展示,企业、行业、教师、政府等对学院课程、教材、人才培养方案、课程标准评价展示等。系统同时支持手机端访问和使用,随时随地可使用系统进行评价或者资源的使用。系统提供权限管理、信息上传、下载、删除、修改、更新、数据导出(提供多种类型的数据导出)项目添加等功能,同时为方便配合SQL Server2008数据库进行数据挖掘,对数据输入进行限定,方便后期数据处理。同时系统要实现数据自动备份功能,提高系统安全性。
2.2.2 系统总体设计
基于数据挖掘技术的高职教学质量监控评价系统设计上充分考虑不同用户的需求和条件,采用B/S模式架构,具有灵活性和方便性,对客户端的硬件要求低等特点。数据库采用SQL Server2008,由于它具备SQL Server Analysis Service组件,故而在数据挖掘方面减少了大量的数据采集和整理的工作,提高了工作效率。系统开发技术采用J2EE,开发语言采用JAVA。数据备份采用日、周、月策略进行备份。具体如表1所示。
表1 系统主要实现技术Tab.1 System main implementation techniques
在硬件方面,考虑后期产生的数据量较大,为长期实现系统正常运行和使用,服务器配备了4*E7-4820的CPU,256GB内存,8TB硬盘,完全能够满足系统正常运行和要求。
2.3 系统结构设计
本系统结构设计融合了基于B/S模式的CMS(内容管理系统)系统和MIS(管理信息系统)系统,基于B/S的MIS系统是本系统结构中设计中的重要部分,系统涉及的大部分功能均在MIS系统中实现,同时由于其基于B/S模式,简化了操作流程和使用门槛,提高了系统的可用性和实用性。在CMS系统中主要设计了新闻通知、学院荣誉、行业、企业评价机构简介、家长评价等信息。而基于B/S模式的MIS中设计了各主体评价的评价内容、评价标准、评价方法等设计,同时针对高等职业教育的特色,添加了企业针对学生实习和带队教师的评价标准及方法。
2.4 数据库设计
数据库设计是系统较为重要的部分,由于本系统设计中存在CMS和MIS两个不同的管理系统,因此在数据库设计上也有所不同,而最重要的则是MIS系统中的数据库设计,文章以MIS系统中行业用户的数据库设计描述数据库的实现。
行业用户评价主要是针对学院人才培养方案的设计合理性进行评价,行业用户名的基本信息用HY-Users用户表来保存用户基本信息,如单位名称、用户名、密码、联系电话、地址等。结构如表2所示。
表2 用户表Tab.2 Industry user table
其中单位名称是指行业名称,而联系人则是指该行业评价学院人才培养方案的联系人,用户备注信息主要是备注该行业是针对某一院系或某一大类专业。
3 数据挖掘在高职教学质量监控评价系统中的应用
SQLServer2008数据库中,数据挖掘主要是依靠Analysis Services来实现的。其中包含了数据挖掘解决方案中需要用到的大部分工具和模型。与其他数数据库比较具有以下几个特点[5],一是多个挖掘模型之间进行交叉验证,在相同结果之间的模型之间进行对比,有利于决策者做出更加明智的决断,例如在高职教学质量监控评价系统中对学生成绩分析,一般的分析往往只能看到结果,无法对原因进行分心,通过交叉验证可以探寻具体的原因;二是算法上的改进,在时序算法中除了基于ARTxp算之外,新增加了一种基于ARIMA算法,两种算法并无优劣之分,前者适于短期预测,后者适于长期预测;三是数据挖掘模型中实现钻取,但钻取功能有一定的限制,并非所有的算法都支持钻取功能。
SQLServer2008数据库在高职教学质量监控评价系统中进行数据挖掘时需要根据实际情况进行数据的收集、整理、模型选择、分析等。以最常见的评教举例,以往的评教仅仅是得到一个评教结果,其造成结果的原因无法知道。为了能够发现教师本身素质与学生评教结果之间的内在联系,选用关联规则结构进行数据挖掘,其采用了Apriori算法进行挖掘,探寻内在联系。具体的步骤分[6]为:首先准备评教结果数据,包含了评教结果与教师的各项基本信息,其次是进行关联规则挖掘,例如将准备好的数据进行教师学历、职称、分类,总评分为有、良、中、及格几个等级,采用基于Apriori算法对数据进行处理,得出关联规则,其中可设0.2位最小支持度,再次利用支持度算法求出每个子项集的支持度,最后在得出的频繁项集,设置置信度为0.3,根据算法求出每一项关联规则的置信度[7],并对结果进行分析解释,得出结论,用以改进和提高教育教学质量。
4 结束语
随着信息技术的不断发展,数据挖掘技术的不断成熟,基于数据挖掘技术来解决高职教学质量监控与评价系统将会为重要的教育管理评价技术,为教育管理者提供决策判断,也必将推动现代职业教育的快速发展。
[1]百度百科.数据挖掘 [EB/OL].[2015-01-28].http://baike.baidu.com/view/7893.htm.
[2]郑碧嶷.基于数据挖掘技术的高校辅助决策系统设计与实现[D].北京:北京工业大学,2013.
[3]吴建兰.基于数据仓库的教学质量监控评价系统[D].泉州:华侨大学,2005.
[4]中国高职高专教育网.陕西职业技术学院“国家示范性高等职业院校建设计划”骨干高职院校建设方案.[EB/OL].[2014-12-28].http://61.164.87.131/web/articleview.aspx?id=20121225104748212&cata_id=gspf.
[5]IT专家网.在SQL Server 2008 R2上实现人工智能数据挖掘[EB/OL].[2014-12-28]http://database.ctocio.com.cn/analysis/385/9416385.shtml.
[6]张震.基于数据挖掘技术的教学质量评价系统研究[D].合肥:合肥工业大学,2006.
[7]丁留宝.PQDIF文件生成方法及在多操作系统下的实现[J].陕西电力,2014(7):83-87.DING Liu-bao.The method and implementation of creating PQDIF file in different operating systems[J].Shaanxi Electric Power,2014(7):83-87.