APP下载

探讨数据挖掘在高校招生中的应用

2021-07-25张迪

电脑知识与技术 2021年16期
关键词:数据挖掘

张迪

摘要:随着大数据技术的不断发展,数据挖掘技术被应用于高校招生工作中,极大地节省了物力人力,提升了招生效率。基于此,各位立足于数据挖掘相关内容分析高校招生中应用数据挖掘的先进意义,该文重点探讨高校招生中数据挖掘的应用路径,以供参考。

关键词:数据挖掘;高校招生;关联规则算法

中圖分类号:G202      文献标识码:A

文章编号:1009-3044(2021)17-0024-02

开放科学(资源服务)标识码(OSID):

1 背景

招生工作是高校一切活动的重要前提,高质量的招生工作能够为人才培养目标的实现奠定良好基础。在当前大数据时代下,通过在高校招生中应用数据挖掘技术,能够准确掌握学生信息,为录取通知书的打印等后续工作提供便利。

2 数据挖掘概述

所谓数据挖掘,其属于计算机科学的一种,主要指的是通过使用算法在大量数据中寻找隐藏信息的过程,主要涉及的方法有在线分析处理、统计、专家系统、模式识别以及机器学习等。在使用数据挖掘技术获得目标数据时,共分为七个步骤,分别是对问题进行定义、构建数据挖掘库、对数据进行分析、准备数据、建立模式、对模型进行评价以及应用模型。目前,数据挖掘的应用十分广泛,例如Credilogros Cia Financiera S.A.中客户信用评分的改善以及电信行业的应用等。

3 分析高校招生中应用数据挖掘的先进意义

随着计算机技术的不断发展和大数据分析技术的普及应用,挖掘技术被广泛应用于各个分析领域,并发挥了不可替代的作用。对于高校招生工作而言,招生数量、质量是高校各项工作高质量开展、人才培养计划得以实现的重要基础,但在学生高考结束后,高校无法获取考生信息、报考信息,这给高校招生工作中的宣传与咨询工作、人才选拔工作以及招生决策的制定提出了极高的要求。因此,需要采取一定方法对学生素质进行分析,预测学生对各个专业的报考情况等,而这些需求通过应用数据挖掘技术均能够得到满足。通过在高校招生中应用数据挖掘技术,能够充分发挥高考注册数据库、毕业生就业数据库、大学招生数据库等数据库的作用,通过使用关联规则算法掌握学生近几年的活动数据和考试成绩,进而对学生考试成绩进行估算,进而为招生工作的开展奠定良好基础。同时,由于高校间具有一定竞争性,提前掌握学生成绩和素质能够提前提供电话宣传和咨询工作,进而吸引考生报考本校,提高考生报考质量[1]。

4 探讨高校招生中数据挖掘的应用路径

4.1 做好数据挖掘的前期准备工作

在高校招生中应用数据挖掘技术时,应做好数据准备工作,构建高校招生数据仓库模型,并选择合适的关联规则算法,从而为后续招生工作中的应用奠定良好基础。首先,在数据准备阶段主要分为两方面,分别是数据选择和数据预处理。对于数据选择,在我国教育事业不断发展的背景下,高校招生工作量越发庞大,涉及众多数据,数据中难免夹杂着无效数据,为此,需要对其进行筛选,即数据选择,从而为数据挖掘准确性提供保障。通过数据筛选后,剩下的数据满足可定义要求,但仍具备零散性,所以,需要对其进行数据转换、聚集以及集成处理,删除无关特征,合并数据对象,建立新的数据特征,提高数据挖掘效率。其次,根据自身需求综合运用数据挖掘技术和功能对招生数据仓库模型进行构建,使其能够在后续工作中发挥出招生决策的分析优化作用。其中,所应用的构建方法是数据驱动法,通过在高校学生管理体系、招生系统中对数据进行整合,从而根据自身需求构建概念模型、物理模型以及逻辑模型。最后,由于高校招生工作不仅涉及学生相关数据,还包括考生家长、就业前景等数据,为此,在对数据进行管理时应对关联规则算法进行合理选择,实现对相关数据库数据的有效处理和挖掘,达到高校招生目的,提高学生到校报到率。

所谓关联规则算法,主要指的是对数据间的关联点进行寻找,并以此为基础建立图形,进而满足后续数据处理需求。挖掘过程可分为两个步骤,一是对所有频繁项集进行搜索,二是以频繁项集为基础产生强规则。在高校招生工作使用关联规则时,主要运用Apriori算法,该算法整体关联形式较为简单,通过将频集理论为基础开展逐层搜索迭代,进而得到候选集Ck,再根据任何非频繁的(k-1)项集都不是频繁k项集子集的频集理论进行剪枝。目前,大部分关联规则挖掘算法均是在Apriori算法的基础上延伸而言,例如划分技术、动态项集计数技术等,从而提高考生数据的收集效率。例如,将考生ID作为联系点,在其进行志愿填报工作时,就可以对适合填报的专业名称进行统计,将统计结果作为预测基础[2]。或是利用学校高考统招以及学生成绩等数据,按录取方式以及学生素质等指标对学生信息进行相对性分析,从而掌握各项数据的隐藏信息,该过程就是定义挖掘问题环节。之后,整合多个源数据库,开展数据准备工作,主要包括考生基本情况、学生公开的各项成绩等,之后从中选择用于数据挖掘的有效数据,进而帮助招生办工作人员掌握能够切实反映生源真实信息的数据,为生源质量、院校报考情况等内容进行合理预测。最后,对学生在校期间进行测评成绩综合量化,其中,智育成绩和德育成绩占比分别为70%和30%,通过合计成绩对学生实际情况进行准确预测。

4.2 招生宣传和咨询工作方面的应用

数据挖掘技术的应用能够帮助高校招生办工作人员从大量数据中寻找目标数据,并对此类数据进行分析,将分析结果作为工作开展基础。一般情况下,在学生报考前或是录取前,高校往往无法得知哪些学生能够报考该学校,只有报考者能够单方面地知道谁能够录取。在该情况下,既不利于学生选择学校和专业,也不利于高校高品质学生的选择。因此,高校往往会在学生成绩出来后、报考前就运用数据挖掘技术对该届考生数据进行挖掘,寻找符合学校要求的高品质学生。在其进行挖掘过程中,主要对考生的历史信息进行分析,并以目标标准库为基础对哪些学生能够录取本校进行分析,之后通过对比相对应的信息与结果判断是否与预期相同,进而从大量数据中心挑选出咨询关注范围的考生。最后,对其进行数据进行归类,以此为基础推断学生信息,以主动的方式联系学生,开展招生宣传和咨询工作。例如,通过电话宣传和线上宣传,吸引符合要求的学生前往本校进行参观,进而达到招生宣传和咨询工作的目的,提高招生质量。

以华北工业大学为例,在省招办投档前,华北工业大学无法获得有哪些学生想要报考这所大学,在该情况下,华北工业大学利用多年来积累的学生录取数据,通过对没有分类的中学历史数据库、某省历年历史数据库进行查询,能够使用数据挖掘技术找到符合本校录取要求的学生,进而对学生信息进行推断,根据推断结果开展招生宣传和咨询工作。在该工作中,主要面向目标考生讲解优惠政策,让目标考生更愿意报考华北工业大学,进而通过数据挖掘、服务招聘、高校宣传等工作为招生质量奠定良好基础[3]。

4.3 高校人才选拔方面的应用

对于高校招生工作而言,其主要目标是尽量选择优质考生,提高报考工作的质量和效率,为此,数据挖掘技术在高校人才选拔方面也发挥着不可替代的作用,尤其在录取和登记工作中。由于我国人口数量较多,且教育水平较高,接受高等教育的学生人数不断增加,导致考生信息具有极大的工程量,而数据挖掘技术的应用能够有效减轻工作人员的工作量和工作压力,并实现考生信息的良好定位。除此之外,数据挖掘的使用还能够帮助高校招生办工作人员进行考生的挑选,在一定程度上促进教育事业的发展。因此,在数据挖掘过程中,能够为高校提供大量有效数据,使其掌握学生的相关信息,让招生办工作人员推测出学生的综合素质及不足之处。通过数据挖掘技术的分析,能够从众多考生中挖掘中满足本校期待的考生,提高生源质量。除此之外,通过在人才培养制定方面应用数据挖掘技术,能够借助数据分析结构提高方案可行性。例如,利用中学学籍库分析学生素质,此类数据库真实地记录着考生的学习情况以及各方面的能力和品行,为此,通过应用数据挖掘技术,能够通过其关联算法掌握学生与各项活动之间的联系,并利用定性与定量相结合的分析方法和指标对学生成绩进行计算,为高校人才选拔工作的顺利展开提供保障。主要使用的方法有分析、演化相关数据库,以规则推导方法对学生素质进行评价,并对其进行模糊处理,再以加权平均法对数据分析结果进行排序,最后使用动态聚类法分析评价结果,进而为人才选拔提供助力。值得注意的是,在使用数据挖掘技术对考生历史数据进行处理后,当出现新的数据后,可以基于历史数据处理结果对新数据进行模拟、推算,进而获得相对准确的结果。在给高校人才选拔工作提供帮助的同时,还能够为高校人才选拔机制的创新奠定良好基础,使其不断优化、更新。

4.4 科学制定招生决策方面的应用

随着教育事业的不断发展,高校招生工作不仅是面向学生提供高校信息,还需要为高校招生决策提供帮助,而数据挖掘技术能够通过学生综合素质的分析为招生决策的制定奠定良好基础,发挥辅助作用。具体而言,在高校开展招生工作时,相关工作人员可以根据候选人分布情况以及考生对专业的报考需求对本校生源计划进行规划,而这需要建立在数据挖掘分析结果上,提升高校分省分专业的科学合理性。对于高校省级次专业生源计划和社会需求而言,二者在一定程度上具有一定的序列关系,可以说,二者构成了一个链条系统[4]。在高校生源计划制定不合理的情况下,会对学生未来就业的顺利性造成影响;若是高校在对招生计划进行制定时,没有将就业形势以及学生就业计划很好地体现出来,那么会导致学生在毕业时出现难以就业的问题。因此,为有效避免此类问题的出现,提高招生质量、为学生顺利就业提供保障,应在高考注册数据库、大学招生数据库以及毕业生就业数据库等相关数据库中使用数据挖掘技术,通过分析海量数据并使用挖掘关联分析和序列分析功能,能够有效利用C45决策树生成算法对专业及就业情况进行分析与总结,从大量数据中寻找有价值的规则。进而为各专业将来的职业需求和变化进行预测,根据预测结果制定高校招生决策,能够保证专业设置数量的合理性、生源计划规划的科学性,实现人才的科学培养,为社会提供所需人才[5]。

5 结束语

综上所述,通过在高校招生工作中应用数据挖掘技术能够有效提高招生质量和招生效率,为高校人才培养计划的实施奠定良好基础。因此,应将数据挖掘技术应用于高校招生工作中的咨询和宣传、人才选拔以及招生决策制定等方面,从而为招生工作提供有效参考。

参考文献:

[1] 王炳堃.数据挖掘技术在高校招生数据管理中的研究和应用[J].陇东学院学报,2020,31(5):11-14.

[2] 许佳,林雨萱.高校招生中引入数据挖掘技术的应用前景探索[J].计算机产品与流通,2019(8):265.

[3] 阿布力米提·卡依木.数据挖掘技术在高校招生数据管理中的应用研究[J].大庆师范学院学报,2018,38(3):33-36.

[4] 越縉.数据挖掘在民办应用型本科高校招生中的应用研究[D].合肥:安徽大学,2019.

[5] 王新伟.数据挖掘在高校招生工作中的应用概述[J].才智,2018(27):166.

【通联编辑:谢媛媛】

猜你喜欢

数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议