数据挖掘技术在学生成绩管理系统中的应用

2012-10-13郭慧

太原城市职业技术学院学报 2012年5期

关键词：决策树增益数据挖掘

郭慧

（山西华澳商贸职业学院，山西太原 030031）

数据挖掘技术在学生成绩管理系统中的应用

郭慧

（山西华澳商贸职业学院，山西太原 030031）

将数据挖掘技术引入到学生成绩管理系统中，能够对教育决策和教学评价提供强大的理论支持，提高教师“教”和学生“学”的质量。论文以学生成绩分析表为数据集建立挖掘模型，使用决策树ID3算法完成构建模型，并对模型的准确性进行了必要的评估。通过分析，得到相关属性与学生成绩之间的关系，并从中挖掘出学生成绩的好坏与哪些因素有关、它们之间存在怎样的关系等。

成绩管理；数据挖掘；决策树；ID3

作为决策支持过程的最新技术，数据挖掘能够深层次地对数据进行挖掘和分析，其无疑会对教学决策和教学评价提供强大的理论支持。在学生成绩管理系统中，数据挖掘技术的应用可以深入分析学生成绩与各因素之间潜在的关联。譬如，经过对学生成绩的相关分析，数据挖掘技术可以解决诸如“学生成绩的好坏与哪些因素有关”、“它们之间又是怎样的关系”的问题，其评价结果对于教与学的改进及提高意义重大。

在传统的教学过程中，习惯采用数据库查询的方法实现对数据信息的处理。笔者将采用数据挖掘技术中的ID3算法实现对数据的处理，并形成分类规则，从而更深入地分析此数据。

一、数据挖掘的流程

（1）明确挖掘对象及目标：定义好要解决的问题。此处以山西华澳商贸职业学院计算机2009级软件班学生，共有60名学生、12门课程、三个学期为例，希望根据学生的考试成绩，分析出学生成绩的好坏与哪些因素有关，并以此所得结果来指导并促进教师“教”和学生“学”。

（2）数据准备：从学生成绩管理系统的数据库中提取相应的数据，并进行预处理，如去除噪声、对丢失数据进行填补及删除无效数据等。

（3）数据挖掘：数据经过预处理后，根据数据功能的类型和特点选择相应的算法对其进行数据挖掘。

（4）结果分析：对挖掘的结果要进行必要的解释和评价，使其转换为易于用户理解的知识。

（5）知识运用：教师可以将分析所得知识运用到教学环节中，如进行教学决策，从而达到教学指导的目的。

二、数据仓库的建立

基于本数据挖掘的目标是分析学生成绩的好坏与哪些因互素有关，而学生成绩管理系统数据库的数据必然存在大量的冗余问题，此处必须对库的信息进行提取以便形成相关数据表。之后,还必须对数据进行相关性操作。

（1）数据集成

数据集成决不是简单的数据合成，而是在原始数据的基础上经过转换、提炼，形成规范化的、统一的、可挖掘的数据。此处针对数据库技术，将收集到的相关数据库文件进行利用SQL语句实现表的连接操作，从而生成“成绩分析”表，其数据结构为：学号、姓名、性别、作业、参加活动、平均成绩等。由于针对的是专业能力基本信息收集，一些无关属性应被剔除，如学生的出生日期、家庭住址等。集成后的数据如下：