基于学生画像技术的高校学生事务精细化管理探究
2020-09-10黄山
黄山
摘 要:学生画像技术对提升高校学生事务精细化管理水平已得到广泛共识,但目前仍缺少对具体平台搭建的深入研究。本文从高校学生事务需求出发,提出了学生画像技术的实现方案,并就该实施方案的意义以及应用领域进行了分析和总结。基于学生画像技术为实现高校学生事务精细化管理提供了一条行之有效、切实可行的方案,对研究个性化思想政治教育具有一定的参考价值。
关键词:学生画像;学生事务管理;精细化;高校
高校学生管理工作的愿景是不断整合学习资源,更好地服务学生在学期间的学习与生活。目前,对于高校来说,涉及学生管理的具体部门较多,协作效率低。同时,在当今大数据时代,高校各类数据不断增长(平均每年约翻一倍),数据源种类繁多且信息多样化,如何利用大数据技术高效整合海量的校园数据,挖掘其背后隐藏的价值,进行学生管理工作创新,成为高校亟待解决的问题。在大数据时代背景下的学生工作需要掌握学生的精准特征,以及为学生提供私人订制的成长服务,将工作重心放到“辅”和“导”上,得到学生的配合与支持,帮助学生认知自己,进而实现自我管理、快乐成长。
一、学生精准画像之于高校学生工作的意义
学生精准画像对于高校学生工作有着重要意义。通过对学生进行精准画像可以全方位的了解学生,如学生的心理健康状况预警、精准资助、成绩预测、失联预警、学生诉求等,围绕学生在校期间的安全、学习、生活、就业等方面的具体问题,刻画学生全维度画像,帮助学生工作者全面认识学生,精准定位异常学生群体,帮助高校实现对学生的精细化管理和个性化引导。
1.学生事务管理理念由学生集体向学生个体转变
在传统的学生事务管理模式下,学校更偏重于管理,追求统一和可控,忽视学生的个体[1]。基于学生画像技术的学生事务精细化管理,收集学生个性需求信息,预判每一名学生的情况和特点,为学生绘制专属的“画像”,再依据画像的特征,为其定制特有的教育成长方案。因此,实现了以学生为中心的管理理念的转变,这也正是新时代高校育人目标的趋势。
2.实现全方位的学生评价
在传统学生工作管理模式下,对学生的评价往往通过一些可见的指标,如学习成绩,学生干部担任情况等[2]。这种评价体系单一,信服度较低。但事实上,对一个人的评价取决于他的综合素质。学生画像的核心在于了解学生,画像是真实学生的虚拟表示,是建立在一系列真实的学生行为数据之上的目标用户模型。而学生画像的实际工作内容,就是将学生信息标签化,通过收集学生的社会属性、行为信息(如离校、晚归、上网、借书、社交、学习等等)、偏好特征等各个维度的数据,进而对学生特征属性的刻畫,并对这些特征分析统计,挖掘潜在的价值信息,从而抽象出一个学生的信息全貌,得出学生在各方面的综合情况,精准全面地评价每一名学生。
3.让个性化思想政治教育成为可能
个性化思想政治教育是尊重和包容学生个性,激励和促进学生个性全面自由发展的内在需要,对学生自身成长和教育方式方法变革都大有裨益[3]。以大数据技术为基础的学生画像,通过收集学生的基本信息、日常行为数据等全方位描述学生的综合情况和个性特征,学生工作者能精准把握学生思想行为特征和问题,以此区分学生群体,实施差异化教育,从而提高思想政治教育的质量和水平。
二、学生精准画像的设计
本文基于吉林大学珠海学院的学生工作实际使用需求,对学生画像系统进行整体设计。该系统从数据获取、数据存储、数据挖掘建模与数据可视化这五部分进行设计。其整体结构图如1所示:
如图1所示,学生的校园数据存在多源性、多样性问题,首先需要将多渠道分散的数据汇总,并做归一化、标准化处理,得到可用的关联数据。这些数据包括存储于高校教务、学工等系统中的基础属性数据,如学生基本信息、学业成绩、奖助学金、上网数据(上网时间戳、上网时长、上网流量分布等),一卡通消费数据、门禁打卡数据、图书借阅数据、社会活动数据、社团数据、竞赛数据,以及从网络、社交媒体爬取的学生社交数据。其次,需要对上述数据进行脱敏与加密处理。数据安全是信息安全的重要环节,许多敏感数据涉及到学生的隐私,这些数据如果被不法分子窃取后果不堪设想。因此,需要从源头着手,对原始数据进行脱敏、加密处理才能保证用户数据的安全。数据脱敏首先需要考虑敏感数据定义问题,敏感信息包括敏感内容、敏感级别、类型、长度、取值范围等。确认脱敏目标后,需要进行脱敏方法的选择以及脱敏程度的把控,即脱敏规则。数据脱敏可分为可逆性脱敏和不可逆脱敏[4],可逆性脱敏是指脱敏后的数据通过一定的规则和手段可以恢复到未脱敏之前的数据,不可逆脱敏即数据脱敏后不能恢复到未脱敏之前的状态。在本文的场景中,采集的数据只需提供给算法模型训练与运算,只需保留数据的原始特征即可,不需要可恢复特性。学生隐私数据主要包括学生的日常行为(如消费行为、上网行为等)、学生基础信息(如身份证号、家庭地址、家庭成员等)。脱敏流程如图2所示,客户端上传用户原始数据,数据管理中心根据脱敏规则对数据进行抽取、转换、裁剪、验证,最终将脱敏后的可用数据存储下来。
需要开发的画像类标签从大类上可大致划分为三类,人口属性标签、学生行为标签、风险预警维度标签,进一步细分还可以分为学生偏好画像和群体属性、群体偏好画像等。属性类标签和行为类标签是开发的重点,无论是做偏好或者预测类标签也都是以上面两类标签为基础进行深度挖掘,画像的相关数据模型需要从高校学生工作的实际使用需求出发。
人口属性类指标按照常见属性标签可划分出很多,本课题按照标签等级进行等级划分,属性标签示例如图3所示。
学生行为类指标按常见一级、二级标签划分可以划分出很多,这里只给出一些示例,如表1所示。
风险类标签指标常见分类可划分出很多,也有很多应用场景,比如根据某个学生连续缺勤或缺勤次数过多情况、上网时长过长等标签可以大致预测该学生是否有考试挂科的风险。根据学生的门禁打卡情况统计学生的作息规律情况,进而判断该学生是否有安全风险。根据学生在网络上发布的内容,通过NLP技术进行情感识别与敏感词识别,可判别该学生是否有心理健康问题,以便于心理老师及时进行心理辅导。根据学生在校的消费情况判断学生的经济状况,辅助贫困生资助工作等。标签画像字典如表2所示。
画像标签的开发是学生画像工作的重头,具体工作可从以下几方面开展:
1.学生画像表结构设计(存储标签以及学生行为);
2.元数据管理(管理标签元数据);
3.数据同步(同步MySQL、oracle、HBASE等多源数据);
4.标签准确性校验(学生标签质量保障);
5.数据清洗与任务调度设计(高效、稳定,保证每日数据的加工)。
建好学生画像模型后,开发人员可通过调度任务,按周期定时从各业务库和日志库抽取数据进行加工处理。各类型标签每天加工的数据有成百上千万条,数据分析人员不会每天对这些数据的质量进行核查,去发现每一类标签的数据是否有异常。例如在根据日志数据中的链接参数抽取用户发表的社交媒体数据时,当目标页面的链接结构发生了变化,而对应的画像的脚本没有作调整(修改解析链接的正则表达式),会导致学生该类行为数据的大量缺失(解析出来的数据为空)。为避免画像标签应用过程中由于数据异常导致标签预测错误、分析结论错误,需要对学生画像数据进行质量监控管理,如图4所示。
在数据处理的同时进行两条并行作业ETL任务,一条任务统计原始数据,另一条任务进行数据梳理(脱敏、特征处理等),对两条线的数据进行对比校验,若校验成功,则进行下一步操作,将处理好的数据入库,映射关系入元数据管理系统,标签数据入Hbase,最终由画像系统作页面展示,否则进行回调操作,并发送告警邮件给管理员检查,直至校验成功为止。任务监控管理视图如图5所示。
画像系统开发完成后,前端页面将后台功能封装起来,分析人员可利用可视化组合操作进行自定义分析。效果如图6所示。
三、学生精准画像于高校学生工作中的应用
1.用于精准评优助困
学生评优助困是高校学生工作的重要工作之一,传统的方式是先由各个辅导员推荐名额至学生处,学生处汇总上报给学校,再进行评选或公示。传统模式工作量大、流程复杂且公平公正性难以保证。利用学生画像系统,可以根据学生日常的生活、学习等相关标签,对学生进行全面分析。该类标签可以将学生分为不贫困、一般贫困、特困等类别,可显著提升工作效率,且评判结果具有客观性、公正性。
2.用于成绩预警
學业指导的主要工作与工作难点在于帮助学生避免学习生活出现问题和克服学习中的各种困难,成绩预警是其中最重要的一环。利用学生画像系统的精准画像功能及时发现偏离正常发展轨道的学生,并进行有针对性的学业指导与干预,有利于提升高校的教育教学水平。成绩预警模型将标签划分为一般、严重、非常严重三个等级。模型对学生的历史成绩数据进行挖掘,生成关联规则库,进而预测学生在后面的学习中潜在的风险。
3.辅助心理健康教育工作
心理健康教育是集教育、服务于一体的工作,是高校学生工作的主要内容之一。大学生心智还不成熟,很容易出现心理问题,利用大数据技术及时掌握、了解学生的心理动态,并对有心理问题的学生及时进行心理辅导具有重要意义。
画像系统通过爬取用户的社交媒体、网络论坛、贴吧上的相关信息以及学生的日常消费情况、上课出勤情况建立心理预警模型,从而为学生打上预测标签。
4.用于学校危机事件预警
传统的学生行为管理工作往往依靠经验,在大数据时代,可帮助高校主动掌握学生校园行为发生的特点和规律,并可据此作出判断和预测,实现“前置式”管理模式创新。
通过对学生网络行为的监控,可对使用校园网络的学生进行热点话题分析,针对重点的敏感词(如轻生、焦虑、失恋、愤恨等)、学生运动轨迹(门禁打卡数据、食堂打卡数据[5]、校门进出打卡数据等)跟踪观察在校生的行为轨迹,根据预先规划的学校运动区、学习区、生活区、危险区等区域进行数据建模。一旦模型检测到数据出现不稳定或者超常规的迹象时,就要密切关注和跟踪学生的行为,防患于未然。
四、结语
随着大数据时代的到来,个性化思想政治教育越来越被人所熟知。其中,高校学生事务管理是思想政治教育的一个重要组成部分,利用大数据技术实现高校学生事务精细化管理是个性化思想政治教育的开端,也是时代赋予的必然结果。
参考文献:
[1]刘柏岩.精准画像在高校学生事务精细化管理方面的运用[J].佳木斯职业学院学报,2017(12):263+265.
[2]蔡红生,李恩.移动互联网背景下高校学生事务管理的创新[J].学校党建与思想教育,2018(21):82-84.
[3]李怀杰,申小蓉.大数据时代个性化思想政治教育论析[J].思想理论教育,2019(03):105-110.
[4]Privacy-Preserving Updates to Anonymous and Confidential Databases[J].Trombetta,Alberto,Jiang, Wei,Bertino,Elisa,Bossi,Lorenzo.IEEE Transactions on Dependable and Secure Computing,2011(4).
[5]赵国亮,陈晓军,李思奇,吴傲.基于数据分析高校学生自画像的初探[J].数字技术与应用,2017(08):233-234+236.
责任编辑 邱翔翔