智慧校园建设背景下大数据技术在高校学生管理中的实践应用
——以陕西LG高校为例
2020-03-02彭榆翔李秉祥
李 蒙,彭榆翔,李秉祥
(西安理工大学 经济与管理学院,陕西 西安 710048)
随着大数据、移动互联网、云计算、人工智能等新兴技术的发展,高校信息化建设正从教育信息化1.0的数字校园逐步升级为教育信息化2.0时代的智慧校园。从数字校园的管理信息化逐渐发展为教学、科研、管理的信息化服务,利用多种多样的智能设备开展信息与服务的深度融合,打造智慧教育新平台。从教育部印发的《教育信息化2.0行动计划》到国务院出台的《加快推进教育现代化实施方案(2018—2022年)》,提出要大力推进教育信息化,创新信息时代教育治理新模式,开展大数据支撑下的教育治理能力优化行动。近年来,高校智慧校园建设正在稳步推进并逐渐完善,学生在校期间使用的应用系统越来越多,随之而来的数据量也呈几何倍数增长,进入了信息爆炸的大数据时代。高校的一卡通系统、无线校园网络、教务考勤系统、学生管理系统等各种应用系统每天都产生大量数据,这些数据如同是智慧校园的“血液”,为教育大数据挖掘提供了坚实的基础。
在大数据技术的不断演进过程中,高校智慧校园建设正处于向“互联网+大数据”的深刻变革之中,而同样在“互联网+”影响之下的学生管理问题也日益凸显出来,无处不在的移动网络使学生无时无刻不在通过网络获取各种信息,同时也不可避免地使学生的学业不同程度地受到了消极影响。如学生没有养成良好的学习习惯和生活习惯,在上课期间利用手机看电视剧、玩游戏、刷微博抖音等现象时有发生,导致课堂学习效率低下,学生对于学习新技术、新知识缺乏兴趣,求知欲动力不足,喜欢投机取巧、避难就易的选择课程[1-2]。概括而言,新信息化环境下大学教育主要存在以下三个突出问题:一是学生主观学习动力不足。在大学宽松的学习氛围下,由于缺乏外在压力与有效监督,很多学生经常发生缺课、早退等现象,甚至在课堂上“开小差”,这种情况多见于大一学生,所以也称为“新生病”,长此以往精力投入不足,将致使学业荒废。二是学生学习方法不当。很多学生在进入大学后,仍保持着高中时代的学习习惯,没有及时适应新的教学模式,如MOOC、翻转课堂等,造成事倍功半的效果,致使他们的学业成绩不理想。三是学生的学习障碍没有得到纠正。这其中有教师教学方法的原因,也有学生个人主观不努力的原因。在“不想学习”“不会学习”“想学不会学”三种情况中,前两种情况占绝大部分[3]。针对这些情况,高校迫切需要创新大学生管理方法,推进精细化、差异化的管理方式。大数据技术为个性化管理、智能化决策提供了新思路。
2013年,我国学者开始研究大数据技术在教育行业领域的应用及其所带来的影响和变化[4],已有研究成果主要为利用大数据技术对学生行为开展分析[5-7]、转变管理工作思维与模式[8-10]。但鲜见利用大数据技术对大学生进行精细化、差异化管理的研究成果。本文从高校大学生管理工作视角出发,利用教育信息化1.0的数字化平台数据,运用大数据技术挖掘其中隐藏的信息价值,为高校学生管理工作提供新的思路与方法,以推进高校大学生校园管理方式变革,加快形成现代化的教育管理与监测体系,推进管理精准化和决策科学化。
一、大数据技术在高校学生管理中的实践应用
在高校学生管理工作中,对学生在校行为进行科学合理分类,针对不同类型学生制定相应的管理服务办法,提供个性化帮扶措施,能够提高学生管理和教学服务工作的精细化程度,提升人才培养的质量水平。在互联网大数据时代,学生的一卡通消费数据、课堂刷卡考勤数据、图书借阅数据、上网数据等,反映了他们在校期间学习与生活的规律,可以动态和准确地映射出学生的行为特征以及隐藏在这些数据背后的行为习惯。
本文以陕西LG高校本科生作为研究对象,选取四个年级本科生一学年的行为数据,设置了学生行为特征与学生成绩研究变量,如表1所示。其中,消费行为数据主要来源于一卡通系统;作息行为数据主要来源于阳光考勤系统、一卡通系统以及上网认证系统;学习行为数据主要来源于教务考勤系统、图书借阅系统和上网认证系统。抽取的原始数据包括8426392条一卡通的消费流水、741904条阳光考勤流水、929088条图书借阅流水等。由于数据中存在冗余和结构不一致情况,经过数据处理剔除了信息缺失严重和部分异常值的学生样本,最后得到12904名学生样本数据。
表1 学生行为特征与学生成绩研究变量
(一)利用K-means算法对学生行为聚类分析
K-means算法是学者MacQueen在1967年提出的,它是聚类算法的经典算法之一[11]。K-means算法的核心思想是找出K个簇中心m1,m2,…,mk,然后通过不断迭代让每一个数据Xi(i=1,2,…,n) 尽量靠近所在簇中心mj(j=1,2,…,k),而且让不在同一簇的数据尽量相互远离。簇心的计算根据聚类算法不同而不同,K-means算法是根据一簇内所有数据的平均值来确定簇中心。
在对数据进行聚类分析之前,先对数据进行标准化和无量纲处理。然后使用Spss Modeler软件进行聚类分析,建立新数据流,再用K-means算法对数据进行处理。
1.学生消费行为聚类分析
对学生消费数据进行K-means算法聚类分析。根据聚类算法评价准则,当设置聚类数为5时得到最佳的聚类效果。对聚类后的学生分类结果进行分析,根据学生消费的实际情况,比较各个聚类簇中每个平均值与学生总体指标平均值的高低,并记H为高于学生总体指标的平均值,L为低于学生总体指标的平均值。各类簇学生消费行为聚类分析结果如表2所示。
表2 学生消费行为聚类分析结果
从表2可以看出,学生消费行为特征分为五类。第一类学生月消费水平最低,月消费峰值也最低,但消费次数频繁,属于消费水平较低的群体;第二类学生月消费水平中等,但月消费峰值较高,消费次数较少;第三类学生月消费水平中等偏上,月消费次数较多,月消费峰值居中;第四类学生月消费水平最高,月消费次数频繁,月消费峰值最高;第五类学生月消费水平较低,消费次数最少,月消费峰值也较低。
2.学生作息行为聚类分析
对学生作息行为指标中的饮食规律习惯、上网习惯、早起习惯、锻炼身体习惯进行K-means算法聚类分析。根据聚类平均准则,当聚类数为3时,各类簇的学生占比、指标的平均值如表3所示。
表3 学生作息行为聚类分析结果
由表3可以看出,第一类学生每月经常早起、在学校食堂就餐比较规律、上网时间较长、常参加体育锻炼;第二类学生每月赖床较多、在学校食堂就餐不规律、上网时间最长、体育锻炼次数很少;第三类学生每月经常早起,但去学校食堂就餐不规律、上网时间较长、参加体育锻炼的次数较少。
3.学生学习行为聚类分析
对学生学习行为中的上课考勤率、图书借阅量、去图书馆次数、学习时长四个指标进行K-means算法聚类分析。各类簇的学生占比、指标的平均值如表4所示。
表4 学生学习行为聚类分析结果
表4显示,第一类学生上课到课率最高,借阅图书较少,去图书馆次数最多,学习时间最长;第二类学生上课到课率最低,借阅图书最少,去图书馆次数最少,学习时间最短;第三类学生上课到课率较高,借阅图书最多,去图书馆次数较多,学习时间较长;第四类学生上课到课率一般,借阅图书较少,去图书馆次数一般,学习时间较少。
4.学生群体特征及管理建议
通过以上三类大学生不同行为特征的聚类分析,我们认为可以将不同群体学生的行为特征作为高校学生管理工作中对学生实施个性化管理的依据,并提出实施个性化管理建议,详见表5。概括如下:一是针对学生在学校食堂消费差异性很大的情况,在学生管理工作中尤其要关注消费过高与消费过低的学生,对经济困难的学生要制定相应的贫困补助政策;二是针对学生在校期间上网时间普遍偏多(平均每天上网时长7小时左右)的情况,管理者在思想上要有清醒的认识,在互联网时代,虽然从网上获取信息比从其他途径获取信息更便捷,学生对网络的依赖也越来越强,但从学生身体健康角度考虑,应制定合理的学生上网行为规范,加强学生上网管理与监督;三是针对学生学习投入不足、去图书馆次数少、图书借阅量少(平均图书借阅量仅8本)的情况,应制定激励大学生奋发学习的综合措施,如设立优秀奖学金、开展读书日活动等。
表5 学生群体特征及管理建议
(二)利用Apriori算法对学生在校行为与学业成绩关联分析
以上聚类分析已将学生的在校行为分为消费行为、作息行为、学习行为三个类别。为了进一步研究学生行为特征与学业成绩之间的关系,探寻大学生在校行为特征是否与其学业存在必然联系,继而选取Apriori算法进行关联分析,从大数据中挖掘隐藏其中的关联性及其规律。
Apriori算法于1994年由Agrawal和R.Srikant最先提出,是一种为布尔关联规则进行挖掘频繁项集的算法[12]。它是关联规则分析的经典算法。使用频繁项集性质的先验知识进行剪枝,以此达到控制候选项集的增加数量。Apriori算法采用了逐层搜索的迭代方法来发现频繁项集,用k项集来搜索(k+1)项集,以此来遍历整个数据集中存在的所有频繁项集。
在进行Apriori算法关联分析之前,将学生特征指标数据和学业成绩指标数据作为数据源。在Spss Modeler软件中建立一个新的数据流,建立Apriori算法模型,并对相关参数进行设置。
在Apriori算法模型的参数设置中,对学生消费行为的五种类型、作息行为的三种类型、学习行为的四种类型与学生学业成绩的三种类型进行设置,设置为关联规则的前项与后项变量。设置支持度为10%,置信度为80%,进行关联规则分析,共得到24条关联规则。根据本研究目标,剔除与合并冗余规则,选择提升度大于1的关联规则,其中后项为学生学业成绩的关联规则,如表6所示。
表6 关联规则分析结果
由表6可以看出,第一条规则反映有10.265%的学生群体特征为不早起、饮食不规律、上网时间长、锻炼次数少,这类学生有82.423%的可能为学业成绩较差。而规则支持度为8.461%,表明这类作息行为类型为2且学业成绩较差的学生占比为8.461%。第二条规则反映有11.841%的学生群体特征为月消费低、消费峰值低、消费次数少,且经常早起,饮食不规律、上网时间较长、锻炼次数少,这类学生有83.246%的可能为学业成绩一般。而规则支持度为9.857%,表明这类消费行为类型为5、作息行为类型为3且学业成绩一般的学生占比为9.857%。第三条规则反映有53.156%的学生群体特征为经常早起,饮食不规律、上网时间较长、锻炼次数少,这类学生有84.068%的可能为学业成绩一般。而规则支持度为44.687%,表明这类作息行为类型为3且学业成绩一般的学生占比为44.687%。第四条规则反映有23.683%的学生群体特征为到课率一般、不常去图书馆、借阅书籍量较少、学习时间较短,且经常早起、饮食较规律、上网时间较长、经常锻炼,这类学生有80.366%的可能为学业成绩一般。而规则支持度为19.033%,表明这类学习行为类型为4、作息行为类型为1且学业成绩一般的学生占比为19.033%。第五条规则反映有10.308%的学生群体特征为经常早起、饮食较规律、上网时间较长、经常锻炼,且到课率较高、常去图书馆、借阅书籍较多、学习时间较长,这类学生有81.343%的可能为学业成绩良好。而规则支持度为8.385%,表明这类作息行为类型为1、学习行为类型为3且学业成绩良好的学生占比为8.385%。
利用大数据技术对学生进行不同行为特征分类,可以方便管理者对不同类型学生群体进行有针对性的干预与辅导,有利于对大学生开展个性化管理,进一步提高高校学生管理工作效率;能够提醒管理者尤其要重点关注那些由大概率事件导致学业成绩不佳的学生群体,制定相应的学生管理制度,帮助学生改善作息规律,提高学业成绩。研究还发现,经常早起锻炼、规律就餐和借阅书籍等行为可以促使大学生学业成绩提高。相反,缺乏良好作息行为的大学生,其学业成绩不良是大概率事件。
二、大数据技术在高校学生管理方式上的创新
通过对陕西LG高校本科生的行为数据进行K-means算法聚类分析与Apriori算法关联分析,得到学生在校行为的聚类结果以及学生在校行为与学业成绩的关联规则。这不仅将学生的日常在校行为与学业成绩联系起来,更是将不同特征的学生群体区分开来。高校可依据学生在校行为数据聚类分析结果,针对不同类别学生群体制定差异化的管理措施,以进一步提高学生管理工作效率。大数据技术的应用为高校学生管理工作提供了新的思路与方法,有助于高校学生管理方式的创新。
(一)利用大数据技术可使学生管理模式从统一管理转变为个性化管理
在当前高等教育高质量发展背景下,传统大学生管理模式已不能适应时代发展的需要。美国教育家杜威曾说:“如果我们还用昨天的方式教育今天的孩子,那等于抹杀孩子的未来。”在信息化背景下高校智慧校园建设日新月异,大学生获取知识与信息的途径变得多样化,每天接受的外界信息也越来越多,学生思维与行为模式正发生着前所未有的改变,满足个性的需求也越来越强烈。通过大数据技术,高校可以掌握学生在日常消费、作息、学习等方面的行为习惯,及时了解不同学生群体的个性化需求并制定相应的管理措施,从而使学生管理模式从统一管理向个性化管理转变。
(二)利用大数据技术可使学生管理工作从被动式管理转变为主动式管理
大数据技术带来的是管理理念上的变革,高校作为人才培养的摇篮,需要紧跟社会发展步伐。高校一卡通系统、数字化校园系统、学生教务系统、图书借阅系统、阳光考勤系统等各个应用系统为学校管理工作提供了丰富的数据资源。对这些沉淀的大数据进行挖掘,能得到全校学生的学习、作息等信息,从而可使学生管理工作方式由原来出现问题后再设法解决问题转变为主动发现问题,潜在隐患随即解决或提前设防。如在学生管理工作中,个别学生已有异常行为特征但未被察觉(如患心理或精神疾病,表现为作息时间紊乱等现象),往往造成后果才被发现,而利用大数据预测类型算法可以及时预测与发现学生的异常行为,安排辅导教师提早进行干预,从而使学生管理工作从被动式管理转变为主动式管理。
(三)利用大数据技术可使学生及学生管理工作绩效评价从单一化转向多元化
目前对学生及学生管理工作绩效评价主要以学业成绩排名为中心,这种评价方式存在一定片面性。一是评价方法、评价指标设计不甚合理;二是评价者与学生之间存在严重的信息不对等,无法通过有效技术手段全面系统掌握学生在校日常表现、努力程度等。利用大数据技术可以采集到大学生在校生活、学习等行为数据,可对班级、年级乃至全校的学生群体行为进行分析,依此来全面系统地判断学生在校生活、学习的状态以及学生管理工作的效果,从而使学生及学生管理工作绩效评价从单一化转向多元化。
三、结语
本文选取陕西LG高校四个年级本科生一学年的校园信息系统中的各类行为数据,运用聚类分析法对学生在校行为特征进行分类,同时对学生在校行为特征与学业成绩进行关联分析,发现不同学生群体的消费行为、作息行为、学习行为特征与其学业成绩之间具有密切关系,这为学校针对不同类别学生采取差异化管理措施提供了依据,并在此基础上给出了智慧校园建设背景下运用大数据技术改进学生管理工作方式的建议。高校要充分利用教育信息化建设的成果,通过大数据技术和信息化手段将所获取的大量数据信息进行加工处理,从而为学校决策和发展提供丰富的数据支持。