大数据技术在高校学生管理中的应用
2019-07-16唐元林
唐元林
摘 要 简要介绍了大数据的概念,论述了大数据应用于高校学生管理的紧迫性,同时介绍了大数据的安全管理和大数据分析方法在高校学生管理中的应用,并分析了构建各类学生管理模型的思路和方法。
关键词 大数据;高校;学生管理;应用
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)235-0155-02
在如今信息化时代,大数据广泛应用于各个领域,给各行各业带来了巨大的变化,同时,数据量也呈指数级增长,高校在长期的运行过程中产生大量有价值的数据,如何利用这海量的数据提升高校学生管理水平是各高校面临的挑战和机遇。
1 大数据技术概述
大数据是指那些数据量特别大,数据种类特别复杂的数据集,这种数据无法用传统的数据库进行存储和管理。大数据的主要特点是数据量大、数据类别复杂、数据处理快和数据真实性高。数据的形式有结构化数据、半结构化数据和非结构化数据,如视频、图片、文本和网络浏览记录等。大数据技术主要包含5个方面:可视化分析、数据挖掘、预测性分析、语义引擎和数据质量管理。通过数据挖掘找到影响某个结果的影响因素,并构建相应的数据模型,通过机器学习算法,采用已有的数据不断训练模型参数,使得模型预测更加准确。
2 大数据技术应用于高校学生管理的紧迫性
随着近年来高校扩招政策,各个高校的学生规模不断扩大,给高校带来巨大的管理压力。一方面,高校学生管理人员配备相比学生规模还是远远不够;另一方面,高校学生中有很多是独生子女,独生子女个体的巨大差异也给高校学生管理带来了很大的困难。随着如今各高校各类学生管理信息系统的不断完善,学生的学业数据、社团活动、出入门禁数据等数据的累积,采用大数据技术对现有数据进行采集、加工、分析和整理,产生可以反映学生个体特征的数据,从而给高校学生管理人员的管理提供依据。同时,各二级学院、辅导员、班主任可以根据分析结果给学生提供个性化的帮助,如就业、选课等方面的指导,从而不断提高高校的学生管理水平。
3 大数据技术在高校学生管理中的应用
3.1 学生相关数据的采集存储
3.1.1 数据的属性
大数据分析的前提是要累积一定规模的学生相关数据,包括学生的成绩数据、课堂考勤数据、课程平台学习数据、参加社团活动数据、校园卡使用数据、门禁数据、图书馆借阅数据等。大数据分析要求数据必须满足规模性、动态性、多样性。规模性是从量上来度量,数据量越大,越接近实际情况,分析越准确,一定规模的统计样本数是大数据分析的基础。多样性是从数据种类的维度上来度量,数据的种类、数据的来源越多,越有助于数据的交叉验证,从而确保分析结果的可靠性。动态性是从时间序列的维度来度量,结合了时间维度,可以判断某个要素随时间的变化趋势,使得数据分析更加科学和丰富。
3.1.2 数据的存储
目前绝大多数高校还是采用传统的服务器存储学生的各类数据,传统服务器如果遇到停电等突发情况时将面临数据丢失等风险,虽然各高校都会配备不间断电源,但是不间断电源最多只能维持几个小时,还是无法满足高校的管理需要。随着学生规模的不断扩大,学生管理产生的数据将急剧增加,服务器呈现多而分散的问题,不利于数据的共享和数据处理。基于云架构的分布式文件系统(DFS)因其具备无限扩展性、冗余性、容错性被广泛应用于各领域,高校应采用云平台来存储学生各类数据,以便更好的对数据进行整合和处理。
3.1.3 数据的来源与获取
与学生管理相关的数据有学生成绩数据库、学生社团活动数据库、学生选课数据库、学生信息数据库、学生校园卡使用数据库、学生图书馆借阅数据库、学生在线学习数据库、学生出入门禁数据库、毕业生就业数据库、学生校内网页、论坛留言等数据。绝大多数数据库是由学校的教务处、学生处和团委牵头建立,组织学生填报,以教务系统为例,涉及学生管理数据的表有近百个。包含学生成绩数据,学生选课数据,学生基本信息数据库,这些数据以结构化数据为主。学生参加社团活动数据以非结构化数据为主。充分收集不同来源的学生管理数据,数据的质量直接决定了分析结果的准确性。
3.2 学生相关数据的安全管理
学生相关数据采集后还要做好数据安全的管理,学生相关数据的安全是大数据技术分析的前提。网络的开放性决定了学生各类数据被黑客等攻击是不可避免的。另外高校的管理人员信息安全意识普遍比较薄弱,加之缺乏信息安全相关背景知识,这给学生相关信息安全带来很大的隐患。一方面要采用最新的信息加密技术对学生相关数据进行加密保护,同时也要做好数据的定期备份,确保系统出现故障情况下能短时间修复;另一方面,高校也要加强管理人员的信息安全教育,如各类学生管理系统的密码设置规范和网络使用禁忌等,确保学生信息的安全。
3.3 学生管理数据的融合和分析
通常情况下学生管理数据来源于不同部门,各部门采用的数据形式不尽相同,同时数据的结构也不同,有结构化数据、半结构化数据和非结构化数据,如视频、图片、文本和网络浏览数据等。对于以上这些数据要采用数据融合技术将结构不同、定义多样的数据进行转换,使得其成为结构相同、语义相近的数据,便于后续的数据分析和处理。
大數据技术分析主要有可视化分析、数据挖掘和预测分析等。可视化分析是能够直观的展示大数据的特点,具有良好的交互性。数据挖掘是从大量有噪声的、模糊的、随机的实际数据中,提取有价值的数据。预测分析是在可视化分析和数据挖掘的基础上,建立模型,通过数据训练优化模型,从而可以利用模型预测未来可能出现的情况。数据挖掘是数据模型的发现过程,高校可以利用数据挖掘方法构建各类学生管理模型,比如学业预警模型、学生选课推荐模型等。可以采用机器学习算法训练模型参数,使得模型预测更加准确。
数据挖掘有4种常见的分析方法,分别是描述型分析、诊断型分析、指令型分析和预测型分析。描述型分析是最常见的大数据分析方法,注重大数据的背后发生了什么;预测型分析注重未来将发生什么;诊断型分析主要侧重发生的原因;指令型分析侧重给用户提供可行的解决方案。数据挖掘采用的算法主要包括分类与预测挖掘、聚类挖掘、关联规则、决策树方法、神经网络方法、遗传算法、模糊理论、可视化技术等,其中聚类分类与预测挖掘、关联规则和决策树分类三种算法比较适用于高校学生管理。
3.3.1 聚类、分类与预测挖掘算法在学生管理中的应用
聚类算法主要包括K-means、 BIRCH、DBSCAN、CLIQLE等方法,高校在学生管理里时候可采用K-means算法的聚类挖掘分析技术,这种分析技术能够分析出某一类学生群体的行为特征。高校可以利用学生在网络平台的学习行为数据,判断某个群体学生的学习效果和课程的质量。高校也可以利用学生就业数据库找出就業率比较高群体学生的特征并加以分析。高校可以利用学生成绩数据分析出有学业危机的学生群体,并进行人为干预。
3.3.2 关联规则算法在学生管理中的应用
关联规则算法主要用于发现大数据背后各要素之间可能存在的关联,主要算法有挖掘布尔关联规则频繁项集的Apriori算法,该算法可以用来分析某种现象的影响因素。高校可以通过学生参加社团活动数据发现学生的兴趣,向学生推荐合适的课程。高校可以结合学生就业数据和学生参加社团数据,得出就业率高和学生参加社团的相关度。高校可以利用学生在校内实名网络中网页浏览数据,分析出学生浏览负面信息与学生存在心理健康问题的相关度。
3.3.3 机器学习在构建学生管理模型中的应用
为了使得模型的预测更加准确,可以采用机器学习方法训练模型参数。机器学习分为有监督学习和无监督学习。高校可以采用有监督的机器学习,通过已有的数据不断训练模型,使得模型的预测更加准确。通过成绩数据和学生网络学习等数据高校可以建立学生的学业预警模型。通过学生各类竞赛数据、成绩数据、社团等数据构建学生的能力模型,给学生提供个性化的就业推荐。高校可以利用学生对课程的评价数据和学生网络平台的学习行为数据,构建优质课程模型,给学生提供更优质的课程资源。高校可以利用学生网络浏览数据、校内各类网络留言数据建立实时的学生心理健康状态监测模型,及时发现可能存在负面情绪的学生,通过跟学生的及时沟通,化解学生的心理健康问题。
参考文献
[1]张静,刘危,杨兵,单文波.试析大数据分析在学科建设中的应用[J].高教学刊,2019(5):1-5.
[2]杨阳,石城,苏力.大数据时代高校学生教育管理工作摭探[J].成才之路,2019(6):8.
[3]袁兴梅.基于大数据的高校学生教育管理研究[J].中国成人教育,2018(24):34-36.