APP下载

教育大数据在高校贫困生预测中的应用研究

2018-07-25朱剑林朱容波康怡琳韦唯

教育教学论坛 2018年21期
关键词:大数据

朱剑林 朱容波 康怡琳 韦唯

摘要:教育大数据为教育创新发展注入新动能,数据驱动教育,变革创造未来。但目前,学术界对教育大数据的研究较于其他领域相对滞后。本文讨论对教育大数据进行科学研究的目的和意义,以贫困生预测问题探讨大数据在高校教育中的运用,分析研究教育治理、教育内容、教与学方法、教育评价、教育供给方式,助力人的全面、自由、个性化教育。

关键词:大数据;教育科学;助学金预测;梯度提升决策树

中图分类号:G641 文献标志码:A 文章编号:1674-9324(2018)21-0267-02

一、引言

当今世界,随着信息技术的快速发展,和人类生产生活相关的各类数据呈爆炸式增长,这导致了大数据分析和人工智能理论和技术的迅速发展,影响着人们的生活工作方式和思维方式,也改变社会的生产力和生产关系,成为创新的新动力。自2012年以来,美国[1]、英国、法国等国家陆续将大数据提高到国家战略层面,我国在2015年召开的党的十八届五中全会上明确提出了实施“国家大数据战略”[2]。大数据得到社会各界的高度重视和广泛参与,以共同应对大数据时代的挑战。教育信息化一直是我国教育领域的重点工作,相关文件见《国家中长期教育改革和发展规划纲要(2010-2020年)》《教育信息化十年发展规划(2011-2020年)》《教育信息化“十三五”规划》[3]。教育大数据有广义和狭义教育大数据之分,广义的教育大数据泛指所有来源于日常教育活动中人类的行为数据,它具有层级性、时序性和情境性的特征;而狭义的教育大数据是指学习者的行为数据,它主要来源于学生管理系统、在线学习平台和课程管理平台等。人类社会技术的发展离不开教育的支撑,同时技术的发展也推动了教育的创新变革。《2018年度国家自然科学基金项目指南》[4]专门开辟教育研究通道来专门研究教育的难题,F07是给教育交叉学科的代码,意在推动以自然科学范式和手段,特别是让传统教育科学与信息科学、神经科学、认知科学相交叉,研究教育的基本理论和基础问题,支撑新时代的教育。在该研究领域,电子科技大学大数据研究中心-教育大数据研究所在贫困生精准资助、图书推荐、成绩预测领域做了很多开创前沿性工作[5]。

二、教育大数据研究目的与意义

1.针对高校中的主要工作,进行教育大数据研究的目的如下[6]:①高校学生学习分析。通过构建包含学习者行为数据、领域模型和教学策略的数据计算模型,促进学习者个性化诊断和有效学习的发生。②高校教育教学工作。通过整合学习者知识、认知和态度等详细信息进行学习者模型的构建,预测学习者未来学习发展趋势,探索和改进包含最佳教学内容和教学顺序的领域模型。③高校管理工作。利用大数据、物联网、人工智能等信息技术,优化办学要素的结构,提高管理水平,基于多维数据精准管理,促进高等教育管理由增量发展向质量发展转变的重要工具和基础。百年大计,教育为本。教育是人类传承文明和知識、培养年轻一代、创造美好生活的根本途径。教育是我国实现“两个一百年”奋斗目标和实现中华民族伟大复兴“中国梦”的智力支撑,特别是高等教育发展水平是一个国家发展水平和发展潜力的重要标志。

2.课题具有重要的理论意义和实践意义:①理论意义。将数据集扩展到教育领域,丰富大数据理论研究。对教育数据集进行系统的教育科学研究,为助力人的全面、自由、个性化发展提供理论指导。②实践意义。运用大数据、人工智能等相关技术建设高校教育大数据分析平台,采用信息理论和技术对教育科学进行认知规律、教学规律、教育管理的研究,突破教育公平和个性化的矛盾,实现规模化与个性化统一。

三、教育管理问题之一——贫困生预测

1.研究意义。助学金政策是国家针对大学生的一个扶贫政策,即国家和地方拿出一部分资金资助家庭经济困难的同学,以帮助他们减轻家庭经济和心理负担,从而能够顺利完成学业。然而,在学生助学金等级认定过程中存在着“虚假困难”难辨别,“真实困难”难覆盖等问题[5],这也使得高校助学金的评定不能真正达到公正、公平,导致了高校资助工作发展不到位。只有合理运用成熟的技术手段来解决助学金评定中所存在的问题,才能让助学金的发放更合理,发挥更大作用,也有益于推动高校学生资助往健康、健全的方向发展。

2.研究内容。主要研究分析学生的校园数据,包括消费一卡通数据、寝室门禁数据、图书馆借阅数据、图书馆门禁数据、学生成绩数据。根据数据提取、构造能抽象描绘出学生在现实生活中的消费、行为等合理特征,通过机器学习完成对已有的学生数据建模,评估验证得到一个能判别分类学生获得助学金等级的优良模型,从而运用此模型精准预测评定未来学生获助学金等级。

3.需求分析。传统的发现贫困生的方法是基于学生基本属性的评估和基于学生的在校消费记录的分析。但是,学生基本属性是一种静态特征,用于挖掘贫困生不够精确。目前丰富的校园记录数据是用于描述学生状况的重要来源,教育心理学指出,学生的多源行为记录客观反映了学生的经济状况。通过对学生在校园产生的多源异构数据进行分析、挖掘,有效的抽取得到与学生经济状况相关的多类量化特征,从而通过这些量化特征观测学生经济状况,完成建模预测。

4.总体设计。本次项目主要分为三个大步骤:对原始数据预处理,选择适合的算法拟合训练集数据得到模型,根据训练集学习到的模型对测试集进行预测输出,得到最终结果。

5.数据分析。本次数据来源于Datacastle大数据竞赛平台,由其中的智慧中国杯下的教育赛提供。将某高校学生在2013/09-2015/09的数据混合,切分成训练集与测试集两组。

6.模型评估。贫困生预测问题采用梯度提升决策树(Gadient Boosting Decision Tree)来建模[7],其策略是每一次建立模型是在之前建立模型损失函数的梯度下降方向。贫困生预测的精准率、召回率、F1-score分别为0.9、0.89、0.86。

四、总结

综上所述,我们已经进入了一个“数据驱动学校,分析变革教育”的大数据信息时代,大数据必将给传统教育注入新的动能。信息时代大数据相关技术的发展使得研究认知规律、教学规律、教育管理规律成为可能,其及时性、互动性、科学性等特点,弥补了传统教育中滞后性、单向性、封闭性等不足。我们国家的教育大数据研究尚处启蒙阶段,教育大数据的科学系统研究大数据将促进高校决策、评估、教学、管理、服务及评估等工作的变革,但也会带来诸如数据安全问题、个人隐私问题等挑战。只有对教育大数据进行系统、科学的研究,才能突破教育公平和个性化的矛盾,实现规模化与个性化的统一,为每一个学生提供优质、自由、个性化的教育,助力学生的全面发展。

参考文献:

[1]Big Data Research and Development Initiative[DB/OL].[2012-03-29].

http://www.whitehouse.gov/sites/default/files/microsites/ostp/

big_data_press_release_final_2.pdf.

[2]中国共产党第十八届中央委员会.中国共产党第十八届中央委员会第五次全体会议公报[EB/OL].(2018-03-22).[2015-10-29].

http://www.xinhuanet.com/politics/2015-10/29/c_111698307

8.htm.

[3]中华人民共和国教育部.教育部关于印发《教育信息化“十三五”规划》的通知[EB/OL].(2018-03-22).[2016-06-07].

http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622

_269367.html.

[4]国家自然科学基金委员会.2018年度国家自然科学基金项目指南[EB/OL].(2018-03-18).[2017-12-15].

http://www.nsfc.gov.cn/nsfc/cen/xmzn/2018xmzn/index.html.

[5]Chu Guan,Xinjiang Lu,Xiaolin Li,Enhong Chen,Wenjun Zhou,Hui Xiong.Discovery of college students in financial hardship[C].16th IEEE International Conference on Data Mining (ICDM 2016),2016:141-150.

[6]陳桂香.大数据对我国高校教育管理的影响及对策研究[D].武汉大学博士论文,2017.

[7]周志华.机器学习[M].北京:清华大学出版社,2016:3-20.掘。

猜你喜欢

大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路