利用大数据技术 构建高校精准资助工作模式
2018-12-03刘秋韵
刘秋韵
高校家庭经济困难生(以下简称贫困生),是高校中人数不少、不容忽视的群体。推进高校精准资助工作模式的构建,关系着高等教育大众化阶段的健康发展,关系着高等教育的公正公平,更关系着高校、社会的和谐稳定和可持续发展。
然而,高校在贫困生资助工作中仍遇到不少实际问题,目前有两个突出方面。
一是贫困生的认定难,或者说做不到精准认定。在高校贫困生资助工作中,贫困生的认定是关键步骤。由于我国正处于区域经济发展不平衡的阶段,地域、城乡发展不均衡,经济收入水平差距大,加之我国还没有建立起一套完善的收入申报制度和税收申报制度,公民的收入和家庭经济状况是不透明的。贫困生认定方法缺乏科学性,导致对学生贫困程度的衡量存在偏差。如何准确鉴定贫困生,就成了精准资助的困难问题。
二是不同档次的高校在资助资源的分配上严重不平衡。虽然资助政策总的原则是“向欠发达地区倾斜”,“向低收入人群倾斜”,而且从表面的数据看目前的分配确实体现了这样的原则;但是,将各种因素考虑进去后,因高校档次差异导致的不平衡是相当严重的。对于985、211、普通高校、三本院校、民办院校、高职高专,不同层级的学校,贫困生的结构大不一样,越是高端的学校,贫困生比例越小。可是,越是高端的学校,获得资助资源的渠道越多,总量和人均量越大。以社会捐赠为例,清华大学2017年的获得社会捐赠达11亿元之多,很多985高校也都达数亿,而大量普通高校获赠款项很少,甚至为零。两个贫困程度相当的学生,在高端学校获得的资助可以是低端学校学生的数倍甚至更多,高端学校资助资源富余,而低端学校大量贫困生资助额很小或得不到资助。这种局面,一方面是受资源向高端集中的“精英主义”导向所影响,但还有一个不容忽视的原因,是没有大数据平台的支撑,无法获取各种类型资源的动态数据,因而不能通过测算进行资源平衡的预算和分配。
一、解决精准资助问题,必须运用大数据技术和大数据思维
(一)大数据技术与大数据思维
所谓大数据技术就是面对越来越混杂的互联网海量信息开发出来的一系列技术,这些新技术催生了与传统思维迥异的大数据思维,大数据思维又反过来创新更多的大数据技术。
大数据思维的精髓可以概括为以下几点:
1.大数据思维注重多因果相关性。一个经典的例子可以让我们瞬间明白大数据思维的妙处:沃尔玛集团通过购物单的大数据分析,发现许多购物单中,如果有啤酒,常常会伴随尿布,而持这样的购物习惯者通常是男人。这样的发现就让超市将尿布和啤酒摆放在一起出售,有利于提高销售量。传统的思维会纠结于“为什么买啤酒的男人同时要买尿布”这样的思考,而大数据思维抛开这些,直奔主题:这两者的相关怎么利用?
大数据思维告诉我们,知道了“是什么”时,“为什么”其实没那么重要了。
2.大数据思维处理全部数据,而不是传统的样本分析。全数据分析往往能作出样本分析无法得到的独特发现。
3.大数据思维不追究数据的精确性,而是直面互联网数据的混杂性,并能从杂乱无章中发现有用的资源。
4.大数据思维以独特的角度发现传统思维无法发现的解决问题的途径,能避免思维定势,有不可思议的预测和预警能力。
(二) 与资助工作相关的大数据信息的利用
在互联网时代,大学生的个体经济状态都能通过互联网收集的相关数据得到精确的记录与分析。通过大数据技术获得这些信息,从根本上改变了资助方和被资助方之间信息不对称的困境,为高校精准资助贫困生提供准确的信息基础。比如数字信息化校园管理离不开的“校园一卡通”,其应用的业务范围非常广泛,食堂、超市、洗澡、购物等都可以刷卡,方便学生的日常生活。校园一卡通也成为获取学生生活和经济情况数据的有效途径。基于学生校园一卡通的客观消费数据,对其进行分析处理和数据挖掘,可识别学生潜在的消费行为特性,从而分析其经济状况,更加真实、客观地评定贫困生。
在贫困生“三级证明”的信度和效度不理想的状态下,学生的日常消费是鉴别贫困生的最重要的依据,而现已在全国高校推行的“校园一卡通”系统使得挖掘学生日常消费大数据成为可能。现有的实验研究表明,在可靠的算法下,通过数据清洗,消除数据“噪音”后,鉴别贫困生的可靠性几乎可达100%。
目前已有不少相关研究,一些高校也已经有了一些实践性应用,并取得了良好的效果。例如,成都电子科技大学组织开发的“精准资助”系统,华南理工大学开发的“贫困生认定与评级系统”,江苏大学和南京理工大学利用校园一卡通的食堂就餐大数据自动识别贫困生。这些先锋式的实践让我们看到大数据技术在精准资助上的根本作用。
但是,各校零星的实践无法解决全国性的症结性问题,因此我们提出建立精准资助的全国大数据平台的设想,并且倡议一套制度化的精准资助的程序操作。
二、 建设贫困生精准资助的全国大数据平台的构想
(一) 统一规划,合力开发
这个全国大数据平台,应该由国家机构统一规划,组织专项资金,组织全国性的跨学科团队实施开发,这样既可避免各地各高校的重复研发,又能保证开发出的系统的高水平,还便于统筹调用全国的各类信息资源。
(二) 实现资助资源的动态、公平分配
平台建成后的一个顶级功能是国家每年对各地、各高校的资助资源都能根据系统实时计算,确保公平分配,使需要的地区和学校得到更多的资源,从而精准实施全国范围内均衡分配。
(三) 核心模块是“大数据分析软件包”
这个“大数据分析软件包”,具备对各类数据(生源地经济数据、学校所在地经济数据、学生消费数据、教育成本数据、学生学习表现数据,等等)的综合分析功能,可以用来动态鉴别学生的贫困水平。该软件包可在网络上供各高校调用,用以预选、鉴别贫困生,评估贫困等级。统一的算法,保证了资助的统一标准。
(四) 实现与其他各类信息资源的对接或共享
与人口数据、社保数据、扶贫数据、纳税数据等对接与共享,会进一步提升该平台的价值,使之成为助学贷款的信用依据,促进教育资助向以助学贷款为主的有偿资助转型。
(五) 注意做好贫困生个人隐私、信息安全的保护工作
大数据平台的建设和使用中,定会涉及个人隐私和信息安全等法律问题,要充分研究并作出预案。
三、 精准资助的程序化操作
精准资助的制度保证,就是整个操作的程序化和量化,杜绝人为干扰。
精准资助的全过程,必須包含如下程序或模块:
—— 国家在下拨资助资源时,要在大数据平台中根据各地(校)贫困学生数、城乡学生比例、各地当年经济发展指标、自然灾害情况、物价指数,各校获得的其他资助资源总量等,进行计算,根据计算结果,在各地区、各层次高校合理分配资源。
—— 资源分配到各学校后,学校利用“大数据分析软件包”对学生消费数据进行分析,预选出资助对象,不再将名额分解至学院和班级。考虑到数据量,对新生的资助先暂以“三级证明”为依据,但事先告知骗取资助的严重后果。
—— 学生通过网络提出资助申请。
—— 班级对资助对象进行民主评议。
—— 院校学工组结合大数据筛选和民主评议结果决定受资助人和资助等级。
—— 院校利用大数据平台对资助对象实施动态监督,发现其消费水平与资助标准严重不符时,及时中止资助,并将之记入个人信用档案。
——至少每年度对资助效果进行整体评估。(作者单位:上海师范大学)