基于数据挖掘技术的学生综合测评体系研究
2008-12-29邢涛孟洪涛
中国市场 2008年18期
摘要:由于我国大众化高等教育的普及,高校学生数量的激增,给学生管理工作带来了诸多新的问题,把数据挖掘中数据仓库和联机分析处理等技术合理应用到高校学生综合测评体系中,是解决上述问题的一种有益探索,并在高校各项工作起到辅助决策作用,对提高管理水平和效率具有重要的意义。
关键词:数据挖掘;学生;测评
伴随我国高等教育由精英化教育向大众化教育逐渐转变,势必给学校学生管理带来诸多问题。学生的信息大量且复杂,学生的状态和发展越来越难以预测。因此学校迫切地希望学生管理信息系统能够具备辅助决策的能力,尤其是在大学生综合测评中。经研究发现,数据仓库和联机分析处理技术是可行而有效的方法。
一、数据仓库和联机分析处理
联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。而Nigel Pendse和Richard Creeh将OLAP应用定义为快速分析共享的多维信息(FASMI)。
构造数据仓库涉及数据清理和数据集成,可看作数据挖掘的重要预处理。此外,数据仓库提供联机分析处理(OLAP)工具,用于各种粒度的多维数据分析。因此,数据仓库成为数据分析和联机分析处理日趋重要的平台,并将为数据挖掘提供有效的支持。
一般数据仓库体系可分为四层次结构,如图1所示。
对于学生综合测评数据仓库,第一层数据源是学生综合信息,经过数据清理和抽取,在第二层数据仓库,即开发的学生综合测评信息系统中进行存储和管理,之后通过第三层OLAP服务器进行各种处理和集成,在第四层前端工具,SQL server2000的Analysis Services和 DBMiner软件建立多维挖掘模型,形成可视化数据立方体,进行数据挖掘和知识发现。
本系统的开发基于VB语言,数据库为SQL server 2000数据库管理系统。考虑到数据的安全性,采用客户/服务器方式,数据库管理以学生管理中心数据库为核心,其它部门数据库管理相对独立,定期向中心数据库提交数据。
二.具体应用
1. 物理结构和数据仓库设计
数据仓库的设计结构为星型模式。主题事实表是汇总整理后的“综合测评事实表”,以及“学生情况”、“时间”、“性别”等三个维度表。由此,我们可以在建立数据立方体之后,方便地在时间(总时间、学年、学期)、学生基本情况和性别等各个维度上对综合测试内容(包括德育水平、学业水平、课外实践能力、综合能力)进行分析和选择,并根据需要进行各种OLAP操作。
2. 构建多维数据模型
我们把有效数据进行提取,并利用MOLAP服务器建立多维数据模型。在学生综合测评可视的多维立方体上进行OLAP操作,通过对立方体的上卷、下钻、切片和切块,可以看到任何学生或任何班级在任意时间段的某一项或综合测评结果。对于管理者,可以了解每个学生或班级的发展状况,起到有效的辅助决策作用;对于用人单位,也可以了解到毕业生在校期间的表现情况,使人才的选拔更加客观和准确。
在数据仓库的基础上,通过Analysis Services生成三维学生综合测评数据立方体。但Analysis Services不能数据可视化。我们采用了数据挖掘系统——DBMiner软件实现数据立方体的可视化操作。图2是利用Analysis Services和DBMiner生成的综合测评数据的三维立方体形式表示。我们可以通过颜色和小立方体的大小就可以直接看出学生的综合、德育、学业和课外实践情况。
下面我们举例对多维数据立方体进行OLAP操作。图3为先按学号维进行了从学号到班级的上卷后,按时间维进行了从学期到学年的上卷。我们可以直观看到某个班级的在一学年的总体情况。图4为从总时间到学期下钻操作,生成按学期显示的综合测评立方体。
图5为总数据切块生成的十个学生的测评情况。立方体的尺寸和颜色直观表示了学生的学业水平和课外实践情况。实际上,只需将鼠标点在小立方体上,即显示出某学生在某学期的测评数据。如图,鼠标所在位置显示的是其第六学期的学业测评值和课外实践值分别为76.72和2。
三.结论
本研究着眼于管理的模型和方法,从管理的角度研究数据仓库和联机分析处理技术的应用,采用定量分析和定性相结合的方法,对于高校本科学生管理中的一些问题给出新的科学的解决方法。
作者单位:北京航空航天大学经济管理学院
参考文献:
[1]Jiawei