大数据背景下学习评估方法分析
2017-10-31王传根吴昊刘路路
王传根+吴昊+刘路路
摘要:随着大数据时代的到来,对当前教学、学习考核思维模式都有了新的发展需求,文章探讨了当前教育大数据的存储方式,如何对大数据进行挖掘、提炼进而分析教育大数据。这些方法对教师来说可以提高教学质量、掌握学习者的学习特征,从而针对不同的学习者给出需要的教学内容和形式,从而提高学习效率。
关键词:大数据;数据挖掘;数据分析;大数据存储
中图分类号:G434 文献标志码:A 文章编号:1674-9324(2017)42-0213-03
一、引言
当前,教育信息化已成为成主流趋势,其应用方面,如Web考试系统,技术也相当成熟,但在考试过程控制、题库管理等方面还存在一定的问题,主要是考生的考试结果系统不能实时保存,如此考试的一些重要参数无法统计,也就很难实现对考试的客观评价;另外还有如电子白板、在线课程、各种多媒体应用软件等,但这些信息化技术最大的不足之处就是缺乏对课程信息的分析[1]。在大数据背景下,其目的是发掘数据是否有关系,然后透过数据之间的关系来预测下一步要发生的事情[2]。相关关系的核心是量化数据之间的关系。大数据时代有其重要的特征,如数字数据瞩目的速率增长,人们的生活、生产方式也发生着前所未有的变化,这些新特点,也是当前的课程教学、考核改革方向的热点。大数据具有三个特征[3]:数据量大、数据产生得快、数据具有多样性。第一,由于课程的学习者、考核数据、评估数据等规模都非常大,因此用来学习的样本量本身就很大,并且,在此系统运行过程中会产生新的数据,这些数据通常在运行过程中是指数倍增长,往往超出一般数据库软件所能捕捉、存储和分析的数据量。第二,大数据往往是在课程学习、分析等过程中新产生的数据,这些数据是即时产生,而不是事件发生后去采集的。第三,大数据拥有非常多的数据类型,课程中的每个学习步骤,都可以跟踪采集相关学习行为的数据,如观看学习视频时间长度、平时测试的分数、通过率、课程讨论发帖数量、发帖的质量等,这样的数据采集也是不容易的,需要一定的软硬件环境。从这三个特征我们也可以发现,大数据时代背景下,课程的学习模式、教学模式、考核模式等都是通过对大量数据的获取以此产生新的数据并进行分析,从而科学地进行课程改革,提高学习效率。文中主要讨论如何确立数据的高效存储、如何确保数据的高质量性,以及如何对数据进行分析以保障课程教学和学生学习质量。
二、大数据存储技术
大数据时代,数据的多样性以及数据量的丰富使得早期的关系数据存储方式已经很难满足现实的需求,存储问题也是当前大数据时代急需解决的问题。大数据时代的另一个概念就是云存储。当前,信息资源以海量形式存储于“云”上已经成为一种趋势。基于大数据的课程教学、学习结合“云计算”的存储技术来实现的大数据存储环境,可根据数据的类型、结构不同而选择不同的数据存储方案,使各种类的数据及时、高效地同步到数据的“云”中心。大数据存储管理是一项系统工程[4],是多种技术的协同工作。目前比较主流的是分布式文件系统(DFS,Distributed File System),本质上这是一个基于C/S的应用程序,通常包括主控节点、多个数据节点和各种大数据应用或者终端用户组成的客户端。分布式存储的目的是将大数据划分为小数据,均匀分布至多个数据节点上,将数据的规模降到单个节点可以处理的程度,其结构如图1所示:
三、基于大数据的学习评估
当前,随着大数据的浪潮,大数据处理与分析已经成为教育领域改革与发展的热点,世界各国政府和教育行政部门都对此高度重视。2012年美国教育部发布了《通过教育数据挖掘和学习分析促进教与学》的报告。其主要内容是要求对教育大数据进行分析挖掘,获取有用的信息,促进美国的教育发展[2]。通过上节的分析可知当前教育大数据的存取有了较为可靠的技术基础,但通常我们获取的只是教育大数据的原始信息数据,如图2所示,只有通过设计各种相应的算法对各种采集到的原始教育数据进行挖掘,开发相应的学习分析模型软件,发现影响教育各因素之间的关系,并实现赋予这些影响教育的因素的相关意义,才能使这些因素数据转变为信息;并经过进一步的分析和综合,形成知识;最后通过实践运用,知识才上升到智慧层次[5]。从图2可以知道,大量的原始数据经过一步步处理、提炼、挖掘、分析得到我们想要的能够应用的智慧信息。因此,教育数据挖掘和学习分析技术是大数据学习评估的关键技术。
1.教育数据挖掘。教育数据挖掘是运用数理统计、人工智能与机器學习和数据挖掘等数学和计算机技术等多种技术,对原始教育大数据进行分析处理,通过数理统计知识来构建相应的数据模型,对学习结果、学习内容、学习资源以及教学行为等各种变量之间的相互关系进行分析[6],当然,这种分析是通过设计的数据挖掘算法来实现的,分析的结果要求能较好地预测学习者后面所想要学习的内容(当然是根据当前推导而来),并为教育管理者、学习者、教育教学研究者以及教学软件开发者提供信息,实现教育系统中教育资源的良性互动,最终实现改进学习的目的。数据挖掘还可以区分优等生和差生(这里强调的考试成绩)的一些学习特征,如随堂测试的分数、参与课堂讨论的频度等。因此,教育数据挖掘主要是对大量数据的分析后对学生的学习状况,以及未来学习趋势进行的一般反馈,不具备量体裁衣的功能,但具有指导性意义[7]。教育数据挖掘流程具体如图3所示。
2.学习分析。学习分析与教育数据挖掘研究的对象有所区别,数据挖掘研究的对象应该是一个集合,但学习分析的研究对象主要是学习者个体、个体特定的学习环境,目的是通过对教育大数据的分析和建模即数据挖掘来进行知识发现,预测学习者潜在的问题,通过这些发掘点,我们可以设计相应的、针对个体本身的课程内容和形式来帮助对应有学习问题的学习者,同时也可以帮助教师改进教学方法和设计针对个体的教学方案[8]。学习分析强调针对个体学习的特征,例如设计适应学习者水平和能力的教学内容,对于学习有困难、有障碍的学习者进行干预,提供反馈等[9]。endprint
學习分析具体过程如图4所示。首先,学习者对当前的教学内容以及教学方式进行学习,在这个过程中会产生大量数据,数据按照特定的存储模式如DFS模式进行存储。之后,系统会对存储的数据进行挖掘、提炼,并保存结果进行大数据学习分析,这样可以通过分析对学习者的特征进行归类,并通过预测模型对课程内容和教学环节顺序进行调整。如可以降低或者加大课程内容难度、提供更多的先修课程。对于教师和教学研究者,通过基于教育数据挖掘结果和大数据的学习分析,可以对学习有困难、有障碍的学生进行干预,对个体进行方案的调整。学习分析对数据基本没有要求,可以是结构化数据也可以是非结构化的数据甚至是多媒体数据[10]。结构化数据往往指量化的数据,包括平时作业和平时测验成绩、考试成绩、学习过程中发生的时间、次数等数据;非结构化数据一般指在线发帖子、作业内容、参与小组报告等;对媒体数据往往是学习者上传或者下载的学习视频、PPT课件等,这些数据构成了我们当前学习评估的新方向。例如教育数据挖掘过去评估较为简单,即考试分数,还有一些过程性评估大都通过模糊的方式来对学习行为进行大概的描述。当前,通过教育大数据的分析可以准确、实时地跟踪和记录学习者发生的行为,这也必然会带来教育研究质量的提升、研究范围的拓展以及研究深度的挖掘[11]。
四、结论
大数据作为信息技术发展的新趋势,同样对于当前教育改革也是重要因素。在大数据时代这样的背景下,教育领域同样蕴藏着具有广泛应用价值的海量数据,如何对这些海量数据进行提炼以便更好地指导我们的学习是研究的关键。文中主要讨论了学习分析和数据挖掘这两大大数据在教育领域处理的关键技术。教育数据挖掘可以对获取的大数据进行统计、分析、综合和推理,发掘数据之间的关联以及规则,做出教育预测和决策;大数据的教育学习分析对学习者提供干预,设计相应的适应于个人的学习方案,同时对教育工作者或者教学管理者的教学方式、教学内容、教学设计提供方案,使教学实践活动转向关注个体,这将有利于促进教育公平。尽管基于教育大数据分析给我们展现了美好的愿望,但实现这一系列的数据采集、存储以及分析面临着较多的困难。第一,当前大数据挖掘和学习分析的分析者和管理者严重匮乏,获取大数据的数据量远远不够;第二,缺乏数据共享的政策保障;第三,数据采集和分析如何确保个人隐私保护;第四,由于大数据分析和传输对硬件和软件的要求很高,这就需要有足够的硬件和软件资源。这都是亟待解决的问题[10]。
参考文献:
[1]张燕南,胡继岳.关于大数据应用与教育的思考[J].中国电力教育,2013,3(32):5-7.
[2]徐鹏,王以宁,刘艳华,张海.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,(6):11-17.
[3]http://en.weikipedia.org/wiki/Big_data.
[4]Jeffery D,Ghemawat S. MapReduce:simplified data processing on large clusters [J].Communications of the ACM,2008,51(1):107-113.
[5]马婧,韩锡斌,周潜,程建钢.基于学习分析的高校师生在线教学群体行为的实证研究[J].电化教育研究,2014,(2):13-18.
[6]魏顺平.教育数据的挖掘、分析、应用[J].中小学信息技术教育,2013,(10):18-21.
[7]夏火松.数据仓库与数据挖掘技术[M].北京:科学出版社,2004:124-205.
[8]杨庆安,赵伟男,张海.大数据在教育领域应用的学习分析框架构建[J].软件导刊:教育技术,2013,12(5):88-89.
[9]张羽.教育政策定量评估方法中的因果推断模型以及混合方法的启示[J].清华大学教育研究,2013,34(3):29-40.
[10]张羽,李越.基于MOOCs大数据的学习分析和教育测量介绍[J].清华大学教育研究,2013,4(34):22-26.
[11]James Manyika,Micehael Chui,Brad Brown,et al."Big data:The Next Frontier for Innovation,Competition,and Productivity" McKinsey Global Institute(2011).endprint