APP下载

数据挖掘技术在招生数据管理中的作用

2016-06-30古亮刘培艳

电脑知识与技术 2016年14期
关键词:数据管理数据挖掘

古亮+刘培艳

摘要:该文通过对高校招生数据的分析,归纳总结出高校招生数据,尤其是艺术类招生数据的特点,并对其进行归类。然后对数据挖掘技术进行了陈述,试图将数据挖掘技术应用到高校招生数据的管理和分析中,提高高校招生数据管理的有效性,节省时间和人力物力成本。

关键词:高校招生;数据管理;数据挖掘

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)14-0001-02

高校招生工作是高校进行人才培养的第一步,是整个高等教育过程中的基础性工作,其影响力涉及千家万户,涉及全国的每一位考生。近年来,高校扩招、改革、招生政策、录取制度也进行了改革,加之物联网、大数据时代的悄然到来,给招生工作带来了新的机遇,同时也是我们面临很多新的挑战。如何在保证招生工作公平、公正、公开的基础上引进新的工作思想和新技术,简化招生工作流程,节省人力、物力和时间资源,是做好招生工作的要务之一。

1 高校招生数据的特点

随着计算机网络技术的飞速发展,高校的招生录取工作基本上实现了基于网络进行的状态,这种招生报名和录取的形式提高了招生工作的效率,降低了招生过程中的人力物力成本,但却带来了新的问题,即招生录取过程中的数据处理问题,因为在报名系统中下载得到的数据会出现格式不统一等状况,给后期的招生录取、工作总结以及之后的与教务处的交接工作、学生管理工作都带来了一系列的麻烦[1]。而招生数据的准确性又设计每一位考生的切身利益,不容有半点马虎,一点细微的错误都可能导致一个家庭的悲剧,因此我们必须严肃认真地对待招生数据的处理。现将这些数据的特点归纳总结如下:

1.1 普通类招生数据的特点

高校普通类招生数据的特点相对统一、整齐,涉及的信息主要包括以下几种:(1)考生号,这也是标志每一位考生的主要关键字,由各省招办按照统一的规律进行编排;(2)考生身份证号,鉴于身份证号的唯一性,其也可作为识别考生的主要关键字,但是由于考生来自全国各地,其身份证号不具有一定的规律性,因此我们一般不作为主关键字来处理,而是作为次要关键字,也就是说当数据产生冲突或错误等情况时,由其进一步验证考生身份;(3)考生姓名,一般处理为字符串,处理的过程中需注意校验每一个字符的正确性,否则会给学生入学后的教学管理和学籍管理工作带来很大的麻烦,也会对考生自身产生一定的影响;(4)报考专业,这个属性我们一般可以用专业代码来代替,处理起来更加方便;(5)成绩,一般情况下,普通类招生按文化成绩排名录取,艺术类中有些表演类的或者面试类的专业则按专业成绩排名,所以考生成绩是一个非常重要且难以处理的属性,因此,我们在这里现将这些专业进行分类,按录取原则将其归类,并按类别分别建立表单,以表单名称标志其录取规则。除此之外,我们还要根据自己的需求建立成绩的小项目属性,因为当出现两个考生的总成绩一致而招生计划数不够的情况下,我们会根据录取原则按某门科目的成绩高地优先录取,如语文成绩等,也有一些专业会出现对某门科目的小分数线要求,如英语;(6)学生类别,学生类别主要分文、理两种,在录取的时候会按文理分开排队和录取;(7)其他属性,如考试类别,包括城镇应届、城镇往届、农村应届、农村往届等;生源地,这涉及某些边远地区可能会有录取的优惠政策等;是否服从调剂等信息。以上涉及的信息,在制作成为数据库时有些我们可以组织编排成代码的形式,另外在录取中还要增加一项,即是否提档,这以便我们后期做录取结果数据的统计和分析。

1.2 艺术类招生数据的特点

艺术类招生数据相比普通类要复杂很多,涉及不同专业有不同的考试规则,录取规则等等,还涉及初试成绩、复试成绩等,并且每个专业都有所差别,因此我们一般将其按专业划分,做成单个小数据库。各数据库以专业来命名进行区分,内部仍以考生号作为主要关键字,但这里的考生号是我校自己按规则编排的,次要关键字为考生身份证号,除此之外涉及的主要属性包括初试成绩,是否进入复试,复试成绩。

2 数据挖掘技术简介

数据挖掘是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程[2]。

数据挖掘是整合了人工智能、机器学习等多领域的知识,其主要过程是利用已有的数据库进行数据训练,使用某种算法,如决策树、支持向量机等,构造出相应的数据模型,然后利用训练好的模型进行数据分析和结果预测。

数据挖掘作为一门多专业交叉学科,是当今大数据时代下最前沿的技术,引起了国内外众多领域研究人员的高度关注。在这方面,国外起步相对早一些,应用领域也相对广泛,包括空间和天文学领域,其中比较有代表性的包括喷气推进实验室以及SKLCAT等。我国在这方面的研究主要集中在高校和相关科研单位,其资金来源和研究方向都以国家自然科学基金以及863计划等。

到目前为止,数据挖掘技术在世界范围内应用广泛。毫不夸张地说,数据挖掘技术可以分析处理一切有规则的数据库,比如在教育中涉及的考试成绩分析,学生能力分析等等。其在社会中的应用领域也十分广泛,包括市场、金融、医学、教育等。

3 数据挖掘技术在高校招生数据管理中的应用

3.1 对普通类招生数据的处理

(1)代码的转换

对于有些属性,可以用代码的形式表示,更方便后期的数据汇总、分析等处理,如报考专业、学生类别等等,这就需要招生工作人员首先编排好代码规则,然后作进一步的转译处理,将一些复杂的文字转变成简单的有意义的字符串,或将一些文字、字符串转变成具有特定意义的数字代码,在处理大量的数据时,我们可以借助excel的公式或者SQL语句进行处理[3]。

(2)信息合并

有时候我们所要的信息不是来自同一个数据表或者数据库中的,因此需要首先对信息进行合并处理,才能得到我们想要的数据库,一般合并的方法,我们也采用excel表或者SQL语句进行合并处理,处理的过程中应注意校对,以免将不同数据按同一条数据进行合并,导致错误的发生。

3.2 对艺术类招生数据的处理

由于艺术类招生由两部分成绩构成,所以除普通类招生数据的处理之外,还要对其进行综合处理,由我们本校建立的数据库和从招考报名网上下载导出的数据库进行合并,此时考生身份证号是唯一的主要关键字,以身份证号进行连接,因为此时的考生号分别为我校自行编排的和各省招办编排的,不具备一致性,因此,对数据库进行合并之后要进行严格的校验工作。

3.3 数据的分类总结

分类技术在很多领域都有应用,其主要过程可以分为两个步骤:(1)训练,包括训练集—>特征选取—>训练—>分类器;(2)分类:新样本—>特征选取—>分类—>判决。首先我们将上述建立的数据库增加录取结果项,并按录取结果进行分类,类别只有两个,即是或者否[4]。然后使用决策树归纳的算法自顶向下构造决策树。利用决策树,我们就可以预测某一条件的考生是否有很大可能被我校录取。此外,我们还可以建立考生报考志愿决策树,以此来判断符合哪些条件的考生更容易报考我校,据此来调整招生宣传策略。

4 小结

高校招生工作是高校发展的基础,其具有相当的重要性、严肃性和规范化。招生过程中涉及最多的莫过于数据的处理和分析。高校招生数据是相对繁琐和复杂的数据,对其进行规范的管理和分析对招生工作的顺利进行有至关重要的作用,也能为后期的招生和报考工作提供依据。大数据和物联网时代的到来,为高校招生数据的管理和分析开辟了新的道路,作为招生工作人员,我们应该紧跟时代的步伐,抓住大数据时代的契机,将新的技术和理念引入到招生数据处理中,甚至整个招生过程中,使其为招生工作服务。因此我们今后的工作重点将是在有效数据库的基础上建立相应的信息管理和处理系统,将整个的招生流程整合到一起,提高招生考试部门的整体管理水平和工作效率。

参考文献:

[1] 李星华,关晓霞.高校招生数据处理探析[J].电脑知识与技术,2015,4(11).

[2] 谷铁涛.基于数据挖掘的招生管理系统分析[J].山东社会科学,2014(s2):51-52.

[3] 朱丽丽.数据挖掘在高校招生中的应用研究[J].计算机与现代化,2012(8).

[4] 杨悦,郭大勇.数据挖掘在高校招生工作中的应用前景[J].教育科学,2007(10).

猜你喜欢

数据管理数据挖掘
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
列控数据管理平台的开发
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于云计算的数据管理技术研究
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究