基于数据挖掘技术的高职院校学生精准资助体系框架研究
2020-04-14朱杰
朱 杰
(无锡商业职业技术学院会计金融学院,江苏无锡 214153)
在我国,家庭经济困难学生问题一直是从中央到地方、高职院校和社会关注的焦点。现有调查和研究指出,高职院校在校生中家庭经济困难学生的比例要高于本科院校,高职教育的对象与精准扶贫的对象是高度契合的。2019年2月,国务院印发了《国家职业教育改革实施方案》,明确新时代职业教育改革“路线图”。随着高职院校春天的到来,学生资助的问题理应需要投入更大的工作力度。近年来,教育部门提出要大力推进精准资助,采取了一系列措施并取得一定成效。出于资助伦理,需要保护隐私、尊重人格,出于规范管理,需要更便捷、有效的工具方法,在资助工作具体实践中,依然存在诸多难题。本文提出基于数据挖掘技术来构建精准资助体系框架,使高职院校学生资助工作管理更为科学合理;研究对象限于家庭经济困难学生,不包括资助工作的其他目标群体。
1 精准资助现存问题的主要症结
为了帮助家庭经济困难学生能够顺利完成学业,政府层面已出台了一套比较完善的学生资助政策。同时,诸多高职院校联合企业、社会力量也在提供资助。资助谁及其相应的资助力度,也即家庭经济困难学生的认定,成为资助工作是否精准的源头和关键问题。随着社会变迁,家庭经济困难学生的阶层出身多样、学生心理因素有差异,认定工作越发困难,具体表现为在认定过程中,很难做到定量评价和定性评价的结合、公开透明和保护隐私的平衡,其结果就是在实事求是、客观公平上打了折扣。
如在认定申请之初,需要遵循自愿申请的原则。然而,家庭较差的经济状况会给一些学生造成了心理阴影,他们的自尊心较高,不愿主动透露家庭的真实情况。长期持续的经济压力可能使这些学生形成自卑、焦虑、敏感和偏执的心理,这也会阻碍师生对他们的准确识别。固然,辅导员要积极引导贫困生如实反映家庭经济困难情况,主动利用国家资助完成学业,但毕竟是有一定工作难度,特别是在新生入学时,师生良好关系尚未建立之际。
如在认定等级方面,划分资助档次需要根据学生家庭经济困难程度或残疾等级,一般设置一般困难、比较困难、特别困难等三级。目前看来,在评价方面定性的多,定量的少。例如对于扶贫部门认定的建档立卡贫困家庭子女或孤儿等情况的,通过定性评价容易分级。而对于数量更多、情况复杂的大多数贫困生,很难把他们归入合适的等级,需要更可靠的量化数据提供客观依据,帮助辅导员准确、全面地了解学生的实际情况。
如在认定依据方面。虽然,各高职院校都有家庭经济困难学生具体认定办法,对认定依据有详尽的规定。实际上,诸多学校采用学生家庭所在地有关部门颁发的证书、盖章的证明作为主要标准。在现实生活中,我国社会信用体系有待进一步完善,少数并非贫困的家庭可能依靠社会网和关系优势取得真盖章的“假”证明,校方很难做到严查其真实情况。因此,主要靠书面材料作为依据的做法之弊病是显而易见的。
2 数据挖掘概述及所需元数据
2.1 数据挖掘技术
数据挖掘(Data Mining,DM))是使用一定算法在海量数据里发现隐藏的模式与信息的过程。近年来,该技术在信息和数字化领域得到了高度关注,其应用日益广泛。因为计算机文件和数据库中存储的数据量正以惊人的速度增长,然而,需要对这些数据加以有效处理,我们才可以从中获得更有针对性、有价值的信息。例如,销售部门负责人对目前简单的营销联系人列表表示不满意,希望通过了解客户以前购买的详细信息,来预测客户未来的购买情况,那么就需要新的数据技术来协助解决这个问题。传统的数据库系统虽然能够较为有效地实现数据录入、查询、统计等功能,但是在海量数据中找不到数据与数据间的联系与隐藏的规则,因此,不能从现有数据出发来演算、预测未来发展趋势。对数据背后隐藏的信息利用不足,引发了看似矛盾的结果,一方面是面临数据爆炸膨胀,另一方面却感觉有效信息匮乏。而数据挖掘则是使用一定算法在海量数据中发现隐藏的模式与知识的过程。
2.2 数据仓库技术
数据挖掘技术需要数据仓库技术作为前导,数据仓库技术发源于20世纪末,由“数据仓库之父”W.H.Inmon提出的。它是体现历史变迁、主题式的、集成的、相对稳定的数据集,用来支持管理决策。数据仓库不同于以往一般的数据库。传统的数据库系统作为一种数据管理方法,主要用于数据库的更新,即在数据库里添加信息。这种技术的缺点在于分析数据有难度,不能直接用于决策应用服务。而数据仓库是用于计算机系统结构化数据环境的工具包、决策支持系统协助管理、在线分析和决策制定以及数据源相关问题应用的解决方案。目前对数据仓库的研究,提供了怎样从数据库中提取信息的方案,从不同维度进行切片、切块、钻取,获取所需的分析结果。因此,利用数据仓库不仅能做到准确、安全、可靠地从数据库里提取数据,而且可形成规则信息,通过一系列工具的处理,可以为决策者的分析和使用做出判断和支持。
2.3 数据挖掘在学生教育管理领域的应用
数据挖掘的兴起,为学生教育管理提供了高效崭新的工具,有力地支持教与学。数据挖掘在教育领域有着广泛的应用场景,学业上可以了解学生的学习习惯与学习特征,预测学生的学习效果,提供辍学预警,提供个性化学习服务;在管理上,有研究提出基于数据挖掘进行学生校园行为分析预警平台、安全管理预警模式构建,例如,R.Balele提出运用数据挖掘可提高学生国家助学贷款的分配效率。从数据挖掘在教育大数据中的应用趋势来看,一方面是数字化教育研究的体现,另一方面也是教育信息化发展的需求[1]。
随着高职院校信息化建设步伐加快,校园一卡通系统在诸多学校有着广泛应用,渗透于学生学习生活及校园管理的各个方面。校园一卡通在为学生提供便捷服务的同时,也积累了海量数据,仅一所学校的一卡通系统每年产生的业务流水数据量可能高达数千万条。通过对这些数据的有效管理和组织,再使用数据挖掘发现其中隐含的信息和知识,能够为学生资助工作提供可量化的决策支持。因此,可将校园一卡通消费数据作为元数据,综合应用数据仓库和数据挖掘技术,构建高职院校学生精准资助系统,具体包括建立数据平台、开展数据分析、应用数据挖掘模型与改进评价过程等。
3 高职院校学生精准资助体系框架
3.1 学生资助管理的系统需求
作为计算机应用的一部分,学生资助管理系统被用于家庭经济困难学生的日常管理。具有智能处理、数据格式规范、查询便捷、检索稳定、存储信息量大、安全性高、成本低廉等优势,能够有效提升高职院校学生资助工作的管理水平。基于数据挖掘技术的学生资助管理系统的发展目标是对数据预处理、建立家庭经济困难学生的数据仓库、数据挖掘、前端展现及应用[2]。重点是保证数据库的安全可靠,保持数据的一致规范,做到用户界面的友好。将查询、添加、修改、删除等指令作改进后,管理系统可以在决策中起到重要的辅助作用。系统需求评估公式如下:
3.2 精准资助体系的总体结构
由于管理系统需要满足学生和管理者不同的访问方式,实现资金信息的查询、应用和审计,因此有必要使用B/S架构进行开发和设计。
数据分析模块。本模板主要用来识别家庭经济困难学生群体。一是在线分析处理(On Line Analysis Processing,OLAP)。通过OLAP操作,实现多角度、多层次的多维数据组织与分析,具体是指使用一卡通系统数据库中的数据转换来统计学生的消费信息,可以月份为单位把每名学生消费金额、主要的消费时段、内容和地点都作统计处理,总结处理学生的生活状况,计算出基本消费水平[3]。二是数据挖掘。基于学生校园卡消费的关键指标,可使用SPSS Modeler中的K-Means 算法进行挖掘建模。进行两阶段聚类。第一阶段是粗类,用来区分家庭经济困难学生与非困难学生两个大类;第二阶段是细聚类,对家庭经济困难学生分为特别困难、比较困难、一般困难三级即三个细类。在此基础上比对分析各细类间的消费情况。后续还可以对受资助的学生进行动态管理。
认定管理模块。本模块主要用来识别学生个体。首先,学校相关人员根据各部门的实际情况输入所需信息,由系统管理员发布。其次,在指定的时间内,想要申请的学生登录系统选择模块,进入申请页面,填写相关信息,提交申请到表格,系统将申请移动到数据库中。建立批准页面,系统显示本院系管理范围内申请者的应用信息,自动与数据分析模块比对后提供申请者类归属的参考信息,并提醒辅导员要审查学生的申请。如果批准,结果将提交到数据库;如果没有,则返回通知。校学生资助部门或院系管理员登录系统后,系统将根据部门或院系级别审核辅导员批准的学生申请信息。如果申请获得批准,信息将存储在数据库中,同时向学生反馈有新的工作通知,并且申请不会返回到请求中。学生也可以查询批准结果。
学生贷款管理与奖学金管理模块。学生贷款管理模块与奖学金管理模块作为两个不同的模块,其功能及方法与认定管理模块非常相似。每个模块的实现过程如下:审核申请、推荐、审核、最终审核、数据形成。
系统管理模块。系统管理模块拥有两个子系统:系统的基本设置和功能参数的设置。其中,系统的基本设置具有用户管理与权限设置功能。用户登录是系统的窗口界面,主要用于判断用户类型,根据用户名和密码来分配相应权限,具有添加、修改、删除用户与用户密码等维护功能。学生是一个普通用户,本人可以通过学生ID(学号)和密码登录系统。权限设置有班主任或辅导员、院系管理员、部门管理员和系统管理员等四类,即四级管理员,每类管理员的权限由系统作统一分区,上级管理员有权限来管理下一级管理员。管理员之间的相同级别的信息是独立的。各级管理员可以根据自己的权限对系统用户进行管理,只能在相应的权限内查看和管理信息数据,有效地保护系统的安全。此应用的一般发布也可置于学校校园网的系统界面上,对资助工作的组织和实施进行信息传播。功能参数包括信息审核与发布、数据备份与恢复、日志管理等。在功能参数设置方面,数据备份与恢复模块可以设置自动数据备份的间隔,手动或自动备份数据库数据,即使在数据丢失时也能恢复数据。
4 结语
在我国加快发展现代职业教育的当下,下大力气解决好家庭经济困难学生的资助问题不仅事关教育公平,也是坚决打赢扶贫攻坚战的硬任务。校园一卡通系统是高职院校“智慧校园”建设的重要组成部分,也让大数据的搜集、挖掘成为可能[4]。通过数据挖掘技术有效利用校园一卡通的海量数据,为学生资助工作提供了更广泛的数据源和更科学的分析方法,推进资助信息系统建设与应用,提高资助精准度,加强规范管理和隐私保护。此外,在探索数据挖掘助力学生资助工作的同时,不应局限于冰冷的数字,还要注重人文思维的保有、具身认知的发挥[5],体现精准资助与资助育人的意蕴结合。