APP下载

数据挖掘技术在高校教务管理中的应用综述

2013-04-29吴天真李文静

科协论坛·下半月 2013年7期
关键词:教务管理数据挖掘应用

吴天真 李文静

摘 要:高校教务管理系统中积累大量的教学数据,其中蕴藏一些有用的信息。数据挖掘技术在教务管理中的应用主要是通过学生的成绩、教学评价、教师科研教学等数据的分析,发现其中隐藏的信息,从而为教务管理者制定相关决策,例如人才培养方案的制定、课程安排、试卷命题提供依据。

关键词:数据挖掘 教务管理 应用

中图分类号:TP311.13 文献标识码:A 文章编号:1007-3973(2013)007-075-02

1 引言

近年来,随着高校信息化建设的深入,高校内部构建了丰富的信息系统并累积了海量数据。教务管理是高校日常活动中的重要组成部分,对教务管理系统积累的大量数据进行分析和挖掘,将会发现一些潜在的知识,从而为提高教学质量,优化教学资源提供可靠的数据依据。本从将对数据挖掘技术在教务管理中的应用进行论述。

2 数据挖掘概述

2.1 数据挖掘的概念与应用

随着计算机硬件和信息技术的发展,使得海量数据的处理已经成为研究与生产中的一项重要工作,数据挖掘技术由此而诞生。数据挖掘也叫知识发现,指的是从大型数据集中提取一些事先未知的、隐含的潜在知识的过程。这些知识的表现形式可以是概念、规律、模式、规则等。如今,数据挖掘目前已经广泛应用于许多领域,比如生物医学、金融数据分析、零售业、电信行业等等。

2.2 数据挖掘的功能

数据挖掘除了具有查询数据的功能,还能够发现以前未发现的模式,并预测将来的趋势和行为。概括起来,数据挖掘主要有以下几项功能,即概念描述、分类和预测、关联分析、聚类分析、和孤立点分析。

(1)概念描述。它是指描述某类对象具有的内涵、并概括这类对象的有关特征。概念描述的两种方式分别是数据特征化和数据区分。数据特征化是描述某类对象的共同特征,而数据区分则是描述不同类对象之间的区别。

(2)分类和预测。首先,分类建立一个能够描述并区分数据类的模型,然后使用这个模型来预测类标记未知的对象类。归纳分类的形式有多样,比如分类规则、判定树和神经网络等等。当被预测的值是数值而不是类标记时,通常称之为预测。

(3)关联分析。关联分析的目的是发现关联规则,这些规则展示的是两个或两个以上的数据项频繁地在给定数据集中一起出现的条件。若这些数据项是以某种规律共同出现的话,这些数据项之间就可能存在某种关联,这种规律称之为关联规则。其关联类型主要有简单关联、时序关联、因果关联。可信度就成为是关联分析生成的规则的一个重要衡量指标。

(4)聚类分析。聚类指的是将待挖掘的数据分成多个类或者簇,具有较高的相似度的数据会被分到同一个簇中,而差距较大的数据则会处于不同的簇中。聚类分析是一种重要的人类行为,它增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。传统的模式识别方法和数学统计法是聚类分析的主要技术。

(5)孤立点分析。孤立点指的是数据库中存在的一些异常记录,它们与数据的一般行为或者模型不一致。孤立点可能会包括很多潜在的知识,如不满足规则的特例、分类中的反常实例,这些罕见的事件可能比正常出现的更有趣。孤立点分析又称作孤立点挖掘。

2.3数据挖掘的步骤

数据挖掘的步骤一般包括:确定待挖掘对象、数据预处理、建立模型、数据挖掘、模式评估和与知识应用这几个阶段,其中数据预处理又包括数据清理、数据集成、数据选择与数据变换。

3 教务管理中的数据挖掘

数据挖据在教务管理的应用主要有以下项目:学生信息管理、教学评价、成绩分析、远程教育、智能教学、个性化培养,其中教学评价、成绩分析以及个性化学习方案都是教务管理的重要环节。教务管理中存在大量的待处理数据,比如教师信息、学生信息、学校的所有课程信息、教学计划信息、管理部门的信息等等,使用数据挖掘技术能有效的提高教务管理的效率。结合2.2中提到的数据挖掘的功能,这里主要介绍在教务管理系统中比较广泛应用到的以下四种数据挖掘任务。

3.1 分类和预测

分类和预测在教务管理的应用一般是用于针对学生制订个性化的人才培养方案。尊重学生的个性发展是现代高等教育的重要理念,这就要求高校将体现学生的个性化特征当作人才培养的工作重点,要制定不同的培养方式以适应不同的学生的个性发展。通过积累的一定数量的数据,其内容主要包括学生个体信息,如性格特征、兴趣爱好、日常行为记录以及学习情况等,还要包括教学信息,如课程设置、教师分配和学校教学资源调配情况等,由此建立若干个模型,在此基础上进行分析、归纳和总结。以共同之处为标准,按照分类模式进行划分、归类,由此制订出多个具有个性化特征的培养方案。然后将某个给定范围内的学生划分,使用某种个性化的培养方案。将分类与预测应用到制订人才培养方案的过程中,既对学校的学科课程设置提供了建设性意见,又为学生自主性学习与个性化学习提供更为科学有效的指导,有利于实现人才培养的多样化、个性化、创新型人才的培养目标。

3.2 关联分析

关联规则是通过分析一个事务中某些项的出现规律,挖掘出隐藏在数据间的关联或相互关系。目前在教务管理应用中研究得最多的就是关联规则的挖掘,如“关联规则在选课系统中的应用”和“关联规则在高校学位预警中的应用”,两篇文章所研究得都是对大量学生成绩数据进行分析,前者是发现不同课程设置顺序对学生成绩的影响,由此可以更合理的安排课程顺序。后者则是挖掘高年级学生的成绩数据,从中得到不能授予学位学生的不及格课程规律,从而达到学位预警的目的。还有一些关于师资方面应用的研究,比如关联规则在教务管理决策支持中的应用,通过分析了教务管理中教师信息之间的隐藏关系,并对数据进行了标准化、离散化处理,通过事例分析了教师的教学与科研之间的隐含关系,可为教务管理提供决策支持。

3.3 聚类分析

在教务管理中,聚类分析主要应用于分析试卷质量。首先通过对学生考试成绩的分布进行测量,从而对试卷质量得出一个大致评价。一般来说,在试卷编制得比较成功,试题质量较好的情况下,考试成绩会呈正态分布,测量效果符合自然分布规律。

双峰型如果考试成绩分布呈双峰型,则说明试题难度区分不大,存在偏难或偏易的两极分化现象,而中等难度的题目太少。这种试题的难度分布缺乏区分度,不能将将成绩优秀的学生与成绩较差的学生进行区分,只能区分中等程度的学生。

陡峭型的成绩分布则说明试题中的大部分是属于同等难度的,这样的试题难度系数偏小,致使学生分数分布过于集中,这样也不能将学生的学习成绩进行区分。因此,可通过对学生考试成绩分布状况的分析,计算出两个判断指标,即峰态系数和偏态系数,然后将成绩分布情况类型进行分类,再进行聚类分析。如此就能有效地提高试卷命题质量。

3.4 孤立点检测

孤立点指的是数据集中与大部分数据模型不一致的数据对象。孤立点检测又称作异常检测,目的在于识别出与其他数据特征有明显不同的观测值。孤立点检测算法的目标是发现孤立点,还要避免将正常的对象标注为孤立点。孤立点检测算法的两个标准是高检测率和低误报率。教务管理系统中的数据挖掘大多利用关联分析或者分类分析。在发现这些规则的同时,也会忽略一些偶尔现象。偶尔现象也会包含一些重要信息,更应该引起关注。孤立点检测的目的就是找出教务管理信息中往往会被忽略的例外情况。例如选取学生各个学期的平均成绩作为特征值,如果该生平均成绩呈上升趋势,说明该生进步较快,呈下降趋势则成绩下降明显,成绩不稳定的学生则有可能有作弊嫌疑。孤立点检测还可以用于课程分析,选取用各个学期的选课人数作为特征值,以发现情况特殊的课程,为课程设置、制定教学计划提供参考信息

4 结束语

随着教务管理系统中数据信息规模的迅速增长,数据挖掘技术的合理有效利用对教育管理模式的改革、完善和发展具有重要的意义。数据挖掘工具可以比较客观地发现教务系统中隐藏的信息,从而为教务管理人员制定相关决策提供重要依据,提高了管理效率。

猜你喜欢

教务管理数据挖掘应用
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
基于SaaS的教务管理工作
新形势下高校二级学院教务管理优化路径探析
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究
高校教学秘书队伍建设存在的问题及对策
有关开设跨文化课程优化教务管理的讨论