我国教育大数据研究面临的问题与挑战
2018-08-14裴莹
摘 要:随着信息技术的飞速发展,大数据逐渐开始与教育进行深度融合,成为教育改革的推动力量。通过对教育大数据概念和特征进行分析和研究,探讨了我国教育大数据研究领域面临的问题与挑战,以期通过对教育大数据的分析与研究推进个性化学习的变革。
关键词:教育大数据;个性化学习;隐私
中图分类号:F27 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.18.027
1 教育大数据的概念
国内外许多公司和学者都对大数据进行了定义,大数据指无法在有限的时间内利用常规工具进行处理的数据集合。但大数据在教育领域的应用仍属于新兴事物,学术界尚没有对教育大数据给出公认的定义,本文认为教育大数据指教育领域所生成的数据量庞大、数据类型众多,从而无法使用常规软件工具进行有效管理和处理的数据集合。教育大数据主要获取渠道是学校信息管理平台、学习平台以及各种在线教育平台。大数据在教育领域应用的前提是海量的学习数据能够被有效的存储、处理和分析。
2 教育大数据的特征
2.1 海量性
美国知名咨询公司麦肯锡认为:大数据指数量庞大以至于传统软件不能对其进行处理与分析的数据集合。麦肯锡并未明确指出多大的数据集才可以称之為大数据,因此,通常大数据中的“大”是一种主观且动态的理解,但数据规模庞大仍被认为是教育大数据的最主要特征。荷兰诺达思信息技术公司通过软件技术对课堂学习进行了观测发现:在40分钟的教学过程中,一个学生个体学习情况数据量为5到6GB,这接近于利用传统软件收集到的五千年的数据量。教育行为会产生非常庞大的数据,首先,随着高科技与信息技术的飞速发展,许多学校利用信息管理系统组织教学工作,通过教学信息系统的推广和建立,实现了教育资源的有效利用和整合,随之也产生了海量的教育数据。其次,互联网的飞速发展,加快了在线学习平台的普及和应用,2013年起,“慕课”在全球流行开来,使得教育数据量随之呈现爆炸性的增长。MOOCs中的“M”即是massive大规模、大量的意思,传统的课堂教学通常面向百人以下的学生,而MOOCs则能够借助互联网对上万人同时授课。“慕课”在为全球学生提供课程和知识分享的过程中,学生的学习行为则被软件工具真实的记录下来,利用大数据分析技术对这些海量信息处理和分析的结果,可以有效地帮助学习者修订学习方案,从而选择更适合自己的学习路径。
2.2 动态性
传统的教育数据侧重于了解学生的学习效果,主要静态的记录学生的基本信息和学习成绩。而教育大数据则利用软件动态的掌握和分析学生的学习行为,如回答问题的数量与质量、作业完成情况、线上与线下的师生互动等。通常这些数据是动态变化的,因此,从根本上改变了传统的“分数决定一切”的教学评价体系。教育数据并不是僵化、一成不变的,只有不断流动且更新才具有价值和生命力,教师基于实时的监测学生学习行为数据,构建学生学习效果的动态评价系统,从而及时修正教学计划,建立针对每个学生的个性化的教学路径。通过在线学习系统的视频教学跟踪学习者的学习行为,通过记录学生对暂停键与关闭键的点击,可以分析学生对某个视频中部分内容的喜好,例如教学内容过于复杂难懂学生可能会提前点击关闭键。教师则应该根据这种关闭行为及时的修订视频内容,借由内容的调整来改进教学效果以增进学生对教学内容的理解。
2.3 多样性
知名咨询公司德勤从“多样性”的视角来分析大数据的特征,认为“大数据与常规数据间的本质区别并不是海量的数据规模,大数据的一个重要特征是数据的多样性”。结构化是传统常规数据的重要属性,例如,教学系统里存储的各种学生基本情况与学习成绩。但随着基于高新科技的教学手段的飞速进步,出现了多样化的数据类型,数据的结构的复杂度不断增加,教育数据呈现了异质性的特征,表现为:邮件、视频、图片等。这些非结构化的信息可以用来分析学习者的学习倾向、态度。信息时代的教育背景下,教师要学习通过对非结构化的数据进行处理和分析来真实的揭示学习者的学习行为。虽然多样化的非结构化数据会增加数据处理的难度和复杂度,但新兴的数据分析软件—Hadoop可以对非结构化的数据(点击量、数据喜好、地理信息)进行处理,以全面展示学生的学习情况。
2.4 真实性
教育大数据虽然数量庞大,也不能因此不重视数据的真实度,提高教育数据的可靠性迫在眉睫。许多调查问卷的结果并不客观真实,很大一部分原因在于被调查者并未真实作答。因此,对教育信息的真实和客观性的需求就凸显出来。传统的教育数据主要来自于考试、作业和提问,但是基于学校声誉、教师业绩等考量有可能会对学生学习数据进行部分修改,所得出的结论无法真实客观的评价学生的学习情况。基于海量数据的教育大数据可能会记录一些掩饰过的信息,但大数据技术不会基于少量信息对学习者进行学习评价,而是借助大规模的全息数据形成学习者的全面系统的评价,不仅依靠显性的学习评价,而且综合了学生隐性的学习行为。因此,教育大数据将成为观测学生学习行为的“显微镜”和个性化教育分析与决策的重要基石。
2.5 价值性
维克托·迈尔·舍恩伯格在《大数据时代》一书中主要从“价值型”的角度来分析大数据:“在信息与大数据时代,从大数据中挖掘可利用的价值是最重要的事情”。学校收集的学习者的行为数据通常都是分散的且碎片化的,需要通过大数据技术对多样化的学习数据进行综合处理,取得对学生行为分析至关重要的高价值性的数据,并使用分析结果预测学生行为,为每一个学生设计个性化的学习路径。教育大数据被有效的收集且及时的使用才能体现其价值,有价值的教育大数据才能引起教育工作者的关注,传统的数据分析主要关注学生整体的学业水平而对学生个体学习分析价值不高。如考试成绩整体不理想教师就会通过试卷分析确定试卷问题所在并在下一次考试时纠正,而大数据技术能够关注每个学生个体的微观表现,通过对学生学习行为全面的数据分析找到每个学生个体考试成绩差的原因,并在未来对不同学生设计差异化的教学路径。因此,教育大数据的价值性主要体现在为学生设计个性化的教学路径、改进学生的学习效果、修正教师的教学计划、分析学生的学习偏好,为每位学习者设计有针对性的定制教学方案。
3 我国教育大数据研究面临的问题与挑战
3.1 增加教育大数据的实践研究
多数教育大数据的文献是关于教育大数据的起源、作用、核心技术、教育政策等基础研究领域,实证研究文献非常有限,且研究對象较窄、研究实践跨度较小,无法从实证角度证明教育大数据真实的作用。教育大数据的本质目的是为教师制定正确的教学方案给出支撑,有利于教学效果的提升,体现了全人教育的理念。从理论上将通过对海量教育大数据进行全方位的处理和分析,可以通过改进教学方案从而提高教学效果,但是很少有实证研究去论证教育大数据怎样进行具体操作、定制教育究竟如何去实现等诸多实践问题,关于教育大数据所产生的真正的教学效果的实证研究并不多见。教育大数据领域的理论研究较为成熟,但是实证研究还明显不足,要通过真实的案例量化地分析强有力的证明教育大数据究竟是如何重塑整个教学过程。对教育大数据的研究不能仅仅应该只关注概念层面的问题,更多的应是去关心“如何进行操作、会产生何种效果”的问题。教育大数据将成为教育领域变革的重要技术,今后的研究应侧重于应用实证方法,通过量化的指标体系,揭示隐藏在教育数据后面的信息,为教育工作者制定教育决策给出最精准的技术支持。
3.2 增加教育大数据的隐私研究
对学生课堂或者在线学习行为的监控、记录、处理和分析,可能会遇到部分学生的隐私,这就会面临如下问题:“监控的过程如何征求被监控者的许可”、“如何有效地设置分析和处理数据的权限”、“如何避免分析结果用于商业目的”、“收集和分析学习数据如何取得家长的理解”等。教育大数据的使用有可能会遇到家长的反对,学校要着手解决三个问题:如何对数据的使用进行合理的授权,以保证数据使用不跨过边界;凡是涉及到学生隐私的数据如何进行保密或者清理,以保证数据不会被泄露或者被商业使用;数据管理员要严格签订保密协议,制定严格的保密制度来规范使用者的行为。教育大数据的使用必须在保障学生隐私的基础上进行,要征求到家长的许可,获得学生的同意,保证所有教学信息的采集在公开透明的方式下进行,制定合理而严密的数据管理制度,保证信息的采集与使用是真正对学生有利的。我国对于个人隐私的法律条款隐藏在各大法律法规中,尚没有建立起完整的一套单独的个人隐私法,且教育大数据尚处于新兴阶段,相关的法律法规并不健全,因此,教育主管部门应该着手制定相应的教育信息保护条例,规范教育大数据的使用和管理,以最大程度上保障学生隐私不受侵犯。
3.3 加强基础教育领域的教育大数据研究
目前,许多国家开始逐渐推进本国大数据开放平台的建设,在全球掀起了大数据开放的浪潮。教育数据作为大数据平台最重要的核心部分,开放的程度和广度将不断扩大。而我国教育大数据的研究主要集中在高等教育与职业教育阶段,对基础教育阶段涉及较少。大数据的推动下,许多发达国家的基础教育阶段的教学已经完成了向数字化的转变,通过对大量教育信息的分析和处理,得到针对每一个学生的最优教育路线,以完成大数据技术对教育领域的渗透。但是,我国教育大数据的现有研究成果还是集中于高等教育领域,对基础教育方面的设计稍显不足,大数据基础教育的研究才刚刚开始,尚没有建设成完善的开放教育大数据平台,且技术不能支撑做出准确的教育决策。因此,必须推进从小学到大学全阶段的大数据平台的建设研究,实现教育个性化和科学化,并最大程度推进教育公平。
3.4 完善行业标准
一个产业健康有序的发展,必须有一套完善健全的行业标准作为支撑,目前,我国的大数据的产业标准正在积极有序的制定当中,而专门针对教育类大数据的标准制定还并未启动。为落实《国家中长期教育改革和发展规划纲要(2010-2020年)》加快教育信息化进程的要求,2012年,《教育管理信息-教育管理基础代码》等7个教育信息化标准公布,有利于教育信息产业的良性发展,但教育大数据领域的规范的制定还属于空白领域。教育大数据的行业标准必须解决教育大数据中会遇到的数据安全、隐私保障、信息整合、权限设置、利益归属等复杂问题,尽早出台相关的行业标准进行规范,才能保证教育大数据在应用过程当中的效率和规范,从而加快教育信息化的进程。
参考文献
[1]维克托·迈尔·舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013:34-35.
[2]杨阳.浅谈未来大数据时代的大学生思想政治教育[J].才智,2013,(17):93-94.
[3]徐鹏,王以宁,刘艳华,张海.大数据视角分析学习变革:美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,(6):11-17.
[4]裴莹.基于教育大数据的个性化学习模式分析[J].教学与管理,2016,(9):101-103.