数据挖掘在高校招生管理信息系统应用探究
2014-08-15马婷
马 婷
(陕西学前师范学院招生办公室,710100)
1 数据挖掘的简述
1.1 数据挖掘的定义和基本内容
数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程,数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
1.2 数据挖掘的特点
数据挖掘在人工智能领域,习惯上又称为数据库中的知识发现,也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤,知识发现过程由以下三个阶段组成:(1)数据准备;(2)数据挖掘;(3)结果表达和解释。
数据挖掘可以与用户或知识库交互,数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤,数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
2 数据挖掘在高校招生方面的重要作用
2.1 高校招生具体内容
高校每年一次的迎新工作是高校展开各项管理工作的一个非常重要的环节,它是对每一级学生展开的活动,而且对高校今后的教学、学生管理、后勤服务等方面都起着非常重要的影响作用,这也是每年高校都十分重视的一项环节,因此,几乎每个高校都一样,在新生正式注册之前,高校的领导都要召集各学院、系、招生办、学生管理、后勤管理等部门来参加这次终于会议,对即将展开的招生工作进行详细的部署和安排,以便各部门之间能够相互合作,共同完成这项工作。而且几乎所有的高校报到方式都一样:有关部门在学校设置相关的报到点,然后就是新生按照流程图一步步办理各项手续。
2.2 数据挖掘在高校招生方面的重要作用
数据挖掘技术已经在很多行业得到广泛应用,比如商业、金融业、保险业、通信业等等,并且在这些行业中已经取得了非常骄人的成绩。高校管理者要不断学习先进管理知识,不断创新人才培养模式,对学校的可持续发展做出科学、合理的决策,而数据挖掘技术在这方面将扮演着非常重要的作用,对高校招生管理信息系统的设计起着举足轻重的作用,这是因为在高校招生管理信息系统中应用数据挖掘技术一方面能够在很大程度上促进部门之间的协调工作,这样将会使信息能够及时的进行传递和处理;另一方面,通过对历年招生录取数据进行详细分析并挖掘有效信息,将会给学生提供更加真实、详细的信息,以便学生能够合理的填报志愿。
3 基于数据挖掘的招生管理系统
3.1 研究内容
数据挖掘招生管理系统研究的内容主要包括以下四个方面:一是,对高校招生管理工作的业务逻辑方面进行研究,以便设计出来的招生工作业务模型能够适应时代的潮流;二是,在Microsoft.NET 平台之上研究出一个具有能够对新生资格审查、信息采集、转专业审批、宿舍分配、班级分配、书籍发放等功能的高校新生注册管理信息系统,另外,还非常有利于帮助高校的招生部门对当年该校各院系、专业的录取分数线、录取人数、录取考生志愿分布、录取考生基本情况等方面的信息进行科学有效的统一;三是,大量的应用逻辑通过多层c/s 体系结构实现在业务逻辑层中得到运行,这样不仅能够解决系统“胖”客户端问题,还能够解决数据库安全问题,可以说是一举两得的好事;四是,对数据挖掘的相关技术进行研究,对于生源数据中潜在的有用信息通过数据挖掘算法来发现,这样就能够使系统的功能更加强大,最后实现对高校招生工作的部署和决策具有一定的指导作用。
3.2 技术路线
3.2.1 多层c/s 架构的设计
虽然.NET 技术路线在设计时具有多层结构的设计,但是用户界面只是对其中基本的界面进行相应的操作,然后将这些操作过程通过调用的方式发给业务处理层,最后再经过一定的分析和处理,而里面的数据操作层在调用时要根据具体需要看是不是进行数据处理,如果需要进行数据处理,这时候数据操作层将收到的任务组织成不同的数据操作,最后再跟原先的数据进行相互交换,最后再把最终的结果输送给业务处理层,而当业务处理层将收到结果时,要将结果进行一定的技术处理,最后再把处理的结果输送到用户界面层,这样用户界面层,就可以把最终的结果反馈给用户进行查看。
3.2.2 SOL Server 数据挖掘技术
数据挖掘得到了很多技术支持,其中为其提供非常丰富支持的一项技术就是Microsoft SQL Server 2005 Analysis Services(SSAS,SQL Server 分析服务),该技术的功能是比较全面的,其中包含多维数据分析、处理引擎、多种数据挖掘算法、各种服务器等,Visual Studio 2005 一方面具备了SQL Server 2005 的最佳开发环境,另一方面还在其内部设置了Analysis Services 项目模板,而在对用户管理Analysis Services 数据库方面也设计了各种可视化向导工具来来帮助用户进行管理,这样在进行挖掘各项任务时就显得非常方便、快捷,将会在很大程度上提高用户的工作效率。
3.3 利用熵值离散法与关联规则对数据进行提取
3.3.1 熵值离散法
熵有好几种表示含义,因此,在不同状态、环境下所表示的含义是不相同的,其中在信息论中表示对不确定性的一种度量,也就是说信息量越小,不确定性就越大,熵也就越大;相反信息量越大,不确定性就越小,熵也就越小,因此,在高校招生管理信息系统设计时,可以根据熵的这种特征,来判断某一事件发生概率的大小,也可以利用熵来了解指标的离散程度,即离散程度越小的指标,对其综合评价的影响就越小,相反离散程度越大的指标,对其综合评价的影响就越大。
3.3.2 关联规则
在描述记录中的指标取离散值的情况时,关联规则挖掘是非常适合的,比如,在最开始的数据库中的一些指标值是不间断的数据,这是要在关联规则挖掘之前对这些数据进行相应的数据离散化,数据离散化在数据挖掘之前起着非常重要的作用,并且离散化的结果对关联规则挖掘的结果起着决定性的作用。而现在利用熵值离散法与关联规则相互合作,共同来进行数据挖掘,把开始的所有数据混合,在提取时要用布尔关联挖掘算法提取。
4 数据系统挖掘的结果分析,便于招生工作展开
一般情况下,几乎全部的系统数据都是经过初步处理后保存在数据库里面,因此,我们在查找我们所需要的各种信息时,可以从数据库里面进行查找。比如:(1)学生籍贯。在数据库里面,我们可以非常清楚的知道,什么地方的考生最多,该地方的招生比例是多少等等;(2)考生报考专业。管理、国际经济与贸易、土木工程等专业报考的学生人数相对来说比较多,说明这几个专业是比较热门的专业;(3)学生性别。男生人数明显多于女生,说明该高校要在以后的招生过程中加大对女生的招生比例,减小对男生的招生比例,从而实现男女平衡等等,通过对这些数据进行相应的挖掘,就可以大致判断出今后的招生情况。
5 结束语
随着我国社会经济的快速发展,高校招生数量也在不断增加,同时招生工作也变得越来越艰难,数据挖掘能够将考生信息进行深入的挖掘和分析,这对高校招生工作来说是非常重要的,将会使其工作变得非常顺利。