基于大数据的高职院校贫困生精准资助
2022-11-09冯永鹏张云婷
冯永鹏,张云婷
(1.江南大学,江苏 无锡214222;2.无锡商业职业技术学院,江苏 无锡214222)
教育部在2022年工作要点中提出,要加强精准资助,推进资助育人,全面落实各项学生资助政策[1]。大数据提高了精准资助的靶向精准度与资助内容的被瞄准率,使资助工作从“经验主义”走向“数据主义”,大数据带给我们方便的同时,仍然还有很多深层次问题需要面对。一方面,作为建立在海量数据支撑基础上的思维方式,这些海量数据所反映的客体真实性如何?另一方面,如何在符合法律法规的基础上更加全面、完整和系统地掌握数据?这些问题在文中详细探讨。
一、大数据技术在高职院校贫困生精准资助工作中的价值功能
大数据因人而生,由人发展,为人所用,具有鲜明的意识形态属性。大数据时代开启了一场新的时代变革,人们对于大数据的基本态度以及从多方视角看到大数据释放出的潜在价值的态度,正是我们认识这个问题的关键。大数据在贫困生精准资助过程中具有巨大技术优势,是化解“供与需”矛盾,消除“泛与散”现象的有效手段,有助于推动高职院校贫困生精准资助工作的科学开展。
(一)信息采集与分析功能
大数据能够通过采集、处理和分析学生数据信息,以有效的信息技术手段和计算方法,发现和提取学生信息数据的价值,实现精准识别。一是大数据的信息采集功能。在遵守相应程序且非用作其他教育目的的情况下,大数据可以通过技术优势采集学生所在生源地经济水平信息、学生家庭经济及成员信息、学生日常生活消费数据、学生本人及受资助信息、学生勤工俭学信息、学生社交特征以及行为轨迹等信息,为确定资助名单提供可靠依据,提高靶向瞄准的精准度,防止片面依赖经验决策或因经验不足难以决策等情况发生。二是大数据的分析功能。一方面,大数据能够在采集学生基本信息的基础上,依靠寻找数据尺度算法和降低复杂度,全程记录贫困学生的在校需求情况、受助情况轨迹与校园活动轨迹,做到深度分析与及时反馈,从动态上把握重点特殊困难群体并有针对性地进行资助帮扶,进行个性化资助策略调整。另一方面,大数据可以对受助学生从进校到毕业进行全过程、全方位和全立体的数据分析,对受助群体及个体的思想和行为特征进行多维度的描述,从而立体式地还原受助学生数字化生活的真实状态,从而为学生成长提供帮助。此外,大数据还可以根据受助学生的个人数据信息建立需求模型,观察不同学生的行为特征和群体特征的差异性,在一个数据库中找到普遍联系,然后对适用于这种普遍联系的个人深入勘察,帮助我们规避“画像”缺陷。
(二)数据支持与筛查功能
大数据可以完善精准资助服务发展支持体系,提供以智能化、信息化为主导的精准筛查对接资助服务,真正实现资助工作的科学化和精准化。一是大数据的支持功能。大数据以信息化平台为基础,以互联网大数据管理为保障,以精细化管理为手段,提高资助和受助数据共享、集成与支持功能,通过分析学生学期和学年消费金额和消费形式,获取、处理和分析消费数据,以有效的信息技术手段和计算方法,发现和提取受助信息数据的价值,形成数据共享、集成与分析模型,为高职院校精准资助工作提供高附加值的应用和支持,促使了高职院校精准资助工作的创新化与深度化。同时,大数据可以实现受助学生信息采集、跟踪管理、信息更新全方位全节点的资助数据可视化。二是大数据的筛查功能。大数据技术可以对受助学生生活和心理状况进行详细筛查,并用程序科学检测学生校园卡消费、学费银行卡收支、学生贷款记录等情况,做到每学期对数据库进行更新,通过细致的情况统计和优化数据统计方法,筛除不能反映真实情况的“坏数据”,保留“好数据”,形成科学量化评估指标体系,进而最终确定受助学生名单,保证实现每一位家庭经济困难学生“应助尽助”,确保资助力度真正符合学生实际所需。
二、大数据技术应用于高职院校贫困生精准资助的可行性分析
(一)有助于转变传统资助思维
为进一步证实大数据技术在高职院校贫困生精准资助中的可行性,本研究采用随机森林模型算法对江苏省无锡市五所高职院校10000份采样数据进行分析。随机森林算法是监督学习算法,它利用在森林里创建的多个决策树解决分类和回归问题[2]。随机森林算法一大优点是可以科学地测量出每个特征对分类结果的相对重要性,用该算法进行特征重要性评估的核心思想是通过查看每个特征在森林里的每颗树上做了多少贡献,最后取一个平均值,得到各特征的相对重要性程度,从而为高职院校贫困生精准资助提供科学化参考。总体来看,随机森林模型在特征筛选上的客观表现和科学体现也是使用其进行数据分析的重要原因。
(二)有助于链接学生服务系统数据
本研究设定8个阈值,以贫困类别为标签,利用随机森林算法对10000份采样数据中的学生日常消费数据进行分析,得到特征重要性评估图(见图1)。选择学生日常消费数据作为主要分析对象,是因为学生日常一卡通消费情况能够更加直观地反映出学生的消费行为规律、消费行为以及真实的消费水平。首先,对10000份学生一卡通消费产生的数据获取、处理,对一卡通消费情况进行适时动态分析,发现学生一卡通通过关联性因素挖掘分析,获得有效数据,从食堂消费次数、次均消费金额、超市消费数据、衣物消费数据、电子产品消费数据、生活费来源以及其他额外消费数据等多个维度建立贫困学生精准识别统计模型,通过反复迭代的方式确定模型中各参数的具体权重,并根据综合得分情况划分贫困学生与贫困等级。
图1 高职院校贫困生认定影响因素重要性评估
根据数据分析结果(图1)可以看出,学生利用一卡通在食堂每次的均消费、每月的衣物消费、在食堂吃饭的次数、在超市的消费金额以及在众多影响因素中占比最高。把这四个影响因素作为主要观测点,观察特别贫困学生、比较贫困学生、一般贫困学生及非贫困学生在其影响因素下的消费情况,对比四个类别学生的消费情况反映出的消费差异。分析发现,特别贫困学生、比较贫困学生、一般贫困学生及非贫困学生在食堂吃饭的占比逐级递减,每次在食堂的均消费、每月超市的消费和每月的衣物消费都逐级递增(图2)。由此得知,贫困学生比非贫困学生更习惯在食堂用餐,且均消费也要低于非贫困学生,额外消费也较少,这与现实情况比较相符,也印证了所采集数据的真实可信。
图2 四个类别学生的消费情况
为了更加直观地观察贫困生和非贫困生之间的消费差异,对四个类别学生的食堂均消费、超市均消费及衣物均消费数据进一步分析,发现:特别贫困学生均最低,非贫困学生均最高。上述数据进一步证实了,食堂均消费情况、超市均消费情况、衣物均消费情况三个数据能够更加直观地反映出不同等级类别的贫困学生的真实消费情况(图3),为精准认定贫困学生、科学划分贫困等级提供了有价值参考。
图3 各类别学生消费对比
(三)有助于为高校精准资助提供科学指导
运用随机森林算法可以根据学生的不同类别消费数据自动分析并等级评价,科学划分相应贫困等级。如若发现已经认定为贫困生的学生出现高消费情况,可以及时进行教育引导,而对于系统数据评价非困难低消费学生,可以通过线上与线下相结合的方式,让隐形贫困和临时性贫困的学生能够得到及时的资助。无论学生消费行为预警引导还是学生动态关怀,其认定性将会更加精准。随着后期学生网络消费、网络支付等“线上一卡通”学生消费数据的接入,大数据会更加完整,并根据数据自动迭代、深度学习,从而真正实现学生精准资助的智能化、科学化。
三、运用大数据技术精准资助高职院校贫困生的实践路径
在科学把握新时代资助工作深刻变革的背景下,运用大数据有助于真正实现高职院校精准资助工作的“供给侧改革”。
(一)充分发挥大数据技术,提升资助认定的精准性
在大数据背景下,须站在战略高度,看到高职院校精准资助工作的新思路新方向,找准着力点,朝着问题去,使大数据在高职院校精准资助工作领域得到快速推广与应用。一是树立大数据理念,学会“让数据说话”。随着人工智能和大数据的快速发展,迫使高职院校学生资助部门需建立起以“数据说话”为核心的定量决策思维,根据大数据的时间长度与空间广度分析,使资助工作主客体对相互之间思想和行为变化及特征的把握更加真实、全面,既能从变化的数据中寻找因果关系,又能从系统的数据中寻找关联要素。二是整合数据资源,提升认定精准度。进一步整合家庭经济困难学生数据资源,将全国学生资助管理信息系统与民政、扶贫、残联等部门有关信息系统对接,对基础信息进行共享和比对,加强资助数据的获取、筛选、整理、组织、分析和决策,确保贫困学子等信息全部纳入“贫困生”数据库,同时确保信息真实有效。三是建立联动机制,形成工作合力。大数据使用的关键点在于数据能否互通,倘若数据无法互通,那么分析得出的结论就相差甚远。这告诉我们,运用大数据来处理海量信息,对信息处理的要求更高,信息的采集、存储、处理和分析各个环节更需要各部门间建立资源共享、协作攻关的动态合作机制,切实加强部门间的工作协同,科学利用大数据进行信息整合,打造精准资助工作“一盘棋”格局,否则,大数据战略只能是一盘散沙。四是强化育人理念,将精准资助与立德树人有机结合。精准资助更深层次的理念是资助过程中是否实现了育人效果。当前,运用大数据进行精准资助的理念正逐渐普及,在资助认定上大数据可以做到精准的经济资助,但这只是资助育人的初级阶段,如何做到资助与育人并重,把“立德树人”根本任务融入学生资助工作全过程,实现从“输血”变为“造血”才是重中之重。一方面,在资助方式上由过去的保障型资助向发展型资助转变,强化有偿资助,培育受助学生的感恩与自强意识;另一方面在资助内容上加强受助学生心理适应资助、能力培养资助、就业指导资助与创新创业资助。譬如,探索设立专项基金资助家庭经济困难大学生海外游学工作项目,不仅可以拓展贫困学生国际视野,也可以增长见识、提升能力与完善人格,切实发挥资助育人功效。
(二)充分实现数据对接,构建完善的资助数据平台
一是实现资助对象识别指标化。运用大数据平台科学采集学生生源地经济水平信息、学生家庭信息、学生受助信息、学生日常消费信息四类基本数据,并结合学生的勤工助学、志愿服务、社会实践、家教轨迹、获奖情况、借阅兴趣、社交特征等多个维度进行综合数据分析挖掘,将数据进行整合与处理,构建个性化指数模型,系统判定学生的困难指数与资助等级。二是实现数据对接、联通与共享。目前,多数学校借助自身专业优势建立大数据平台,运用大数据平台将各部门实时数据进行打通,使数据可以实现更大规模的关联计算,进而实现数据驱动业务,为实施“智慧资助”提供了有效的数据支撑,实现用数据跑腿、用数据打假,做到由“粗放”与“漫灌”向“精细”与“精准”转变,真正实现“点助”。三是实现线上与线下良性互动。注重整合数据资源,打破原来的数据孤岛模式,建立一个更加科学、有效的数据管理平台。探索运用大数据平台对资助数据进行专业化处理,为科学精准认定提供基础,从而更好地提升高职院校精准资助工作效率和质量。大数据平台以严谨的评判标准,线上采集“客观数据”,分析校园卡和其他消费数据,线下结合学生在校表现的“主观数据”,运用大数据算法努力在资助公平和学生尊严之间找到平衡,既凸显了“人性化”主体价值和数据的本真意义,又打破了原先资助资源“一刀切”的分配模式。譬如,南京某职业院校建立了集贫困学生认定、学生校园消费行为动态分析、学生消费行为预警与引导、学生动态关怀、线上线下有机融合为一体的学生精准资助管理系统。平台依据学生线上申报、班主任线上审核,采用权重记分方式对学生的消费数据自动分析和等级评价,如果发现贫困学生存在高消费行为,系统将进行预警,系统还将对学生群体中非困难低消费学生进行提醒,通过班主任线下的及时核实和反馈,进行选择性资助。
(三)充分完善评价体系,拓宽精准资助工作领域
对于大数据技术,学界一贯的观点是大数据技术是人文的,大数据技术终归是为人性服务,脱离了人性的技术,也就无所谓应用和其他价值。一是坚持工具评价与价值评价相结合。对于大数据而言,无论它是如何的智能,面对技术的发展,我们仍需回归到理性中来,若执着于某种工具,我们可能会失去看问题的多元视角。大数据根据数据采集、挖掘和分析做出准确预判,克服基于经验或直觉所产生的推断缺陷,但同时也要避免过度依赖数据,因为大数据为我们提供的只是参考答案,而不是最终答案,大数据的“碎片化”“模糊化”会导致人们难以系统认知复杂事物,需理性认知、认清大数据。毕竟资助工作的目标是育人,是培养受助学生实践能力、创新精神和社会责任感的重要方式,数据只是起到了辅助作用,工具评价终究要服务于价值评价[3]。二是建立科学有效的评价体系。首先,构建科学的工具评价指标体系,通过大数据比对、分析等评价手段,建立“全局一把尺子”贫困生识别认定机制,健全“数据采集、数据运用、数据监管”三维程序,实现民政、学校等部门数据库的全方位对接,提供以智能化、信息化为主导的精准对接资助服务。其次,结合工具评价和价值分析,通过价值评价修正工具评价结果,从而更加全面、准确地了解受助学生的实际情况。再次,重点考虑“客观数据”与“主观数据”所扮演的角色,也就是说当数据说话时会发生什么,是否有利于推动我们的工作,唯有将“客观数据”与“主观数据”结合,并融会贯通,而不单纯只是为了“数据”而“数据”,大数据才会变成强大的工作武器。三是坚持定期审核与动态调整相结合。采用定期审核与动态调整的认定方式,能够做到资助对象指标明晰,认定资助对象更加精准,避免了“唯大数据论”。建立学期审核制度,一方面通过班主任、辅导员长期观察与寒暑期实地走访等途径及时了解掌握学生基本情况;另一方面通过合理且不侵犯学生隐私的方式收集学生的校园超市消费数据、助学贷款数据、学费欠费数据、校园公交使用数据、电子产品消费数据等信息,复核家庭经济困难学生资格,对于不符合情况定期更新与调整家庭经济困难学生数据库,努力做到人本化认定、动态化认定与精准化认定[4]。
(四)充分健全监督效能,强化数据安全保障机制
提高数据安全保护意识,确保信息安全是用好数据的前提。一是健全学生资助信息安全管理机制。首先,规范学生资助信息系统的使用权限与范围,科学与严谨公开各类学生受助详细信息,落实信息安全宣传教育,强化数据各阶段使用保护。在资助数据使用阶段,运用互联网技术对数据进行智能分类,通过对敏感数据进行特别标识与脱敏处理或者“差别隐私”,将数据信息模糊处理,促使大数据库的查询不能现实精确的结果,而只是相近的结果,防止信息泄露;在资助数据公示阶段,对数据异常调用行为进行实时监测,并制定统一、完整的资助信息管理规范体系[5]。二是创新信息安全保障技术手段。高职院校在推进大数据建设和充分发挥大数据固有价值的同时,必须坚持隐私安全与保护并重的方针。针对当前可能面临的数据安全与隐私保护等信息安全问题,需进一步探寻最新安全保障技术手段,强化学生资助信息终端设备及网络环境安全管理,创新统一身份认证登陆、加快信息安全基础设施建设,以保障信息化数据安全,切实解决数据安全和个人信息保护问题。三是提升数据安全防控机制。大数据的使用安全风险主要体现在“采集、存储、使用、公示”四个环节,贫困生数据具有内容丰富与特征明显两个特点,即通过关联信息和大数据算法,贫困学生的兴趣爱好、学习能力、性格特征、消费水平等深层个人特征可以被推算出来。因此,高职院校要强化数据采集、存储、使用与公示过程中的保护措施,使得学生的个人信息得到安全保障,避免引发二次利用。四是提升管理人员信息安全防范意识。不断强化资助管理人员对于受助群体的数据信息安全保护意识,在数据采集、使用与公示的过程中,防止泄露学生个人信息与隐私,不断提升大数据精准资助工作安全化、标准化和信息化水平[6]。
总体来看,在大数据背景下,不再是“一把钥匙开一把锁”,而是“一把钥匙可以开不同的锁,而同一把锁也可由不同的钥匙来开”。利用大数据开展高职院校贫困生精准认定工作,有利于实现资源配置的精准化,有利于资助管理决策的科学化,有利于在资助公平和学生尊严之间找到了平衡,既充满人性,又精准高效。可以说大数据技术与高职院校精准资助工作的深度融合有助于引发“资助生态”的再平衡。