APP下载

基于大数据的学习分析技术研究现状与趋势

2018-01-20许文

电脑知识与技术 2018年31期
关键词:学习分析数据挖掘大数据

许文

摘要:大数据背景下,学习分析的快速发展为实现个性化学习、自适应学习提供了技术保障,是在线学习、MOOCS等形式教学方式取得更好效果的重要技术辅助。该文以梳理相关学习分析文献为基础,分析探讨了学习分析的概念内涵及特征,并从学习分析的理论基础与框架模型、学习分析技术与工具研究、学习分析技术应用与实践研究角度综述了大数据背景下学习分析技术研究现状与趋势。

关键词:学习分析;学习分析技术;大数据;数据挖掘

分类号:G434        文献标识码:A        文章编号:1009-3044(2018)31-0024-04

The Research Status and Future Prospect of Big Data-Based Learning Analysis

XU Wen

(Department of Information Engineering, Jiangxi Vocational College of Finance & Economics, Jiujiang 332000,China)

Abstract: In the background of large data, the rapid development of learning analysis provides technical support for realizing personalized learning and adaptive learning. It is an important technical aid for online learning, MOOCS and other forms of teaching methods to achieve better results. Based on the literatures of related learning and analysis, this paper analyzes and discusses the conceptual connotation and characteristics of learning analysis. Based on the theoretical basis and framework model of learning analysis, the research and analysis of technology and tools, the application of analytical techniques and practical research Current Situation and Trend of Learning Analysis Technology in Data Background.

Key words: learning analytics; online learning;large data; data mining

隨着信息技术的发展及各种互联网、物联网应用的出现,人和世界的交互逐步以可存储的数据记录下来,这些数据随着应用增加呈现爆发式增长,并表现出数据量大(Volume)、形式多样(Variety)、生成快速(Velocity)和真实性(Veracity)的特点,这些数据被称为大数据。数据处理技术的发展和进步使大数据体现出价值,因其提供了前所未有的可量化维度来支持人类的发明、创新和服务活动,被誉为是“创新、竞争和生产力的下一个前沿”。[1]大数据的出现快速影响到社会生活的各个方面,并已经在推动各行业传统的业务流程、服务方式和创新方式的变革。

泛在学习背景下,移动学习、在线学习、大规模共享开放课程(MOOCS)的出现及信息技术在传统教学中不断深入应用使得教育大数据急剧增长,这些教育大数据真实地记录了学习者复杂的学习行为,是了解学习者学习状态、评估学习效果及提供学习建议的基础依据。如何使用大数据的理论、方法和技术处理教育大数据以提高学习效率、优化学习效果成为教育领域人们关注的重要问题。自2011年以来,学习分析与知识国际会议(LAK,The International Conferenceon Learning Analytics & Knowledge)每年定期举行以促进学习分析技术发展和应用。美国新媒体联盟(NMC)的《Horizon Report》更是将学习分析技术评价为影响教育发展趋势的关键技术,并将于较短时间被广泛采纳[2-4]。各学习技术研究机构和高等教育院校均开展了不同程度的学习分析实践,有效地推动了学习分析理论和实践的发展及与其他教育技术的融合。

本文以梳理学习分析相关研究文献为基础,介绍基于大数据学习分析技术的基本概念、研究现状、发展趋势,分析大数据背景下学习分析技术带来的学习变革趋势和应用中存在的挑战。

1 学习分析相关文献分析

本研究以“学习分析”和“Learning Analytics”作为主题词,检索近五年来发表在国内核心期刊、LAK会议论文、美国高校教育信息化协会等机构专题报告、教育类国际权威期刊上的文献,共计获取文献292篇,文献数量自2012年始呈现快速增长趋势(图1),体现了教育界对该领域的持续高度关注。

通过关键词分析和引文关系分析,与“学习分析”相关的高频关键词有:“大数据”“教育大数据”“教育数据挖掘”“在线学习”“MOOCS”“智慧学习”“教育变革”“社会网络分析”“行为分析”“学习过程”等(表1),从中可以看出学习分析的发展离不开大数据和数据挖掘技术的发展;相关研究主题分布在:学习分析理论基础、学习分析模型与方法、学习分析技术与工具、学习分析应用与实践、学习分析面临的伦理与道德挑战。

对获取文献的标题和摘要进一步梳理发现:国际上对学习分析的研究集中于学习分析服务框架构建、学习分析模型研究、学习分析方法研究、学习分析工具和可视化及实证研究等方面;国内学习分析研究中代表性的有:吴永和等对学习分析相关国际会议进行介绍评析、综述了学习分析相关研究现状、发展及面临的挑战[5-6];马晓玲等对学习分析系统构建进行了研究,提出了学习分析系统论域、形式化建模学习分析系统信息空间模型[7]; 李青等对学习分析数据互操作规范IMS Caliper Analytics进行了解读[8];马晨辉、徐艳艳以采集学习者视频行为数据为例对学习分析中数据采集的研究与技术实现进行了探讨[9]。孟玲玲等从多个角度对学习分析工具进行了分类,并从使用环境、数据支持格式、是否可视化等维度详细比较。[10] 这些研究有效推动了学习分析技术在我国的发展和应用,国内对学习分析的研究主要集中于理论探讨、研究综述和应用分析方面,鲜有实践研究。

2 学习分析概念界定与特征

学习分析是近年兴起的一个研究领域,然而其探索及应用早于1969年就已存在,吴青等[11]详细梳理了学习分析源起、教育数据挖掘(EDM,Educational Data Mining)、学习分析协会成立(SoLAR,The Society for Learning Analytics Research)、LAK举办(标志学习分析成为独立新兴研究领域)的发展过程。在此过程中,研究学者从不同的角度对学习分析的概念进行界定(表2),但目前学术界对学习分析的概念还没有形成统一的认知,在多数研究文献中引用的定义来自LAK11[12]、EDUCAUSE(Learning analytics: the coming third wave)[13]、Horizon Report[1-3]及George Siemens[14]。

这些学习分析的定义从不同的角度为我们描绘了学习分析的轮廓,其过程具有周期性,包括如下步骤:学习数据的测量收集整理、预测建模、模型挖掘、学习干预、效果评价。结合实践研究成果,我们认为学习分析具有下列四个方面的特征:

(1)数据来源多样化

从产生数据的对象角度分,学习分析的数据来源包括教师、学生、管理人员、决策者等学习利益相关者;从产生数据的技术平台角度分,学习分析的数据来源包括网络学习平台、网络教学平台(BlackBoard、Moodle、MOOCS)、在线学习系统、社交媒体(微博、微信、博客、论坛、贴吧、APP)、传统课堂中的数字化教学资料等[15];从产生数据的类型角度分,学习分析的数据来源包括学习行为数据、学习环境数据、学习者情绪状态、学习者注意力水平等。这些数据大多是非结构化或半结构化数据,需要综合利用多种传感设备获取,并采用大数据处理技术对数据进行抽取、清洗、规范以供学习分析引擎进一步使用。

(2)分析结果的指向性

学习分析的结果具有明确的指向性,其目的在于理解目前学习者的学习行为所处的状态、评估学习者的学习绩效,对学习过程进行优化(提供资源辅助、学习建议等),根据阶段评估结果和预测模型对学习行为结果进行预测,以尽早发现潜在的问题,并据此进行学习干预。这也是学习分析区别于教育数据挖掘(EDM)和学术/行为分析的关键之处。

(3)分析结果可视化

学习分析结果的可视化呈现是学习分析实践应用中重要的一个环节,通过可视化工具可以使学习分析的结果简明易懂,不同的使用者可以根据可视化呈现的结果对与自己相关的方面进行分析与判断,并针对性地做出调整,如学习者调整学习策略和方法,教师调整教学内容和教学方式等。

(4)服务对象多元化

学习分析具有应用性特点,其本身不关注于生产关于学习与教学的理论,而是基于现有的教育教学理论在相关模型下理解教育数据,并提供学习、教学和管理支持。因此,学习者是学习分析首先的服务对象,既是学习分析的起点也是学习分析的终点[16];其次,学习分析服务于教学过程中的教师、教学管理者、决策者,其职能所需的數据分析结果在粒度上有所区别。

综上所述,学习分析技术主要依据学习者学习需求、通过获取、模型分析和模型解释学习过程所产生的数据,进而评估学习者的绩效、预测未来的学习效果,进而有针对性地进行学习干预,以实现优化学习效果目的的一种应用。

3 学习分析研究主题

3.1 学习分析的基础理论与框架模型

学习分析的基础理论研究体现在两个方面:一是学习分析建立的理论基础,George Siemens[17]、Macfayen[18]等从推动学习分析发展的相关领域角度梳理:数据挖掘、学习理论、教育理论、社会网络等都曾为学习分析的研究与实践提供了理论支撑,体现出学习分析应用性的属性;二是指导学习分析研究与实践活动的相关理论框架及模型,包括学习分析的过程、利益相关者、应用领域、道德和隐私保护等。

George Siemens[14]着眼于学习的个性化和自适应这一目标提出“学习分析过程模型”,该模型以智能数据和学习者数据为输入,综合考虑社会、技术、教育等因素,通过学习预测、干预,重构教学以实现学习者的个性化学习和自适应学习。Elias[22]提出学习分析循环改进模型,基于计算机、人力、理论、组织因素四个方面资源,进行数据收集、信息处理、知识应用的循环分析过程。Khalil[23]等提出学习分析生命周期模型,该模型认为学习分析由学习环境、大数据、分析、行动四个步骤构成,一个周期从学习环境开始到行动结束,随后开始下一个周期。Greller[24]等提出了学习分析的六维关键因素设计框架,该框架内部约束、外部约束、利益相关者、工具、目标、数据六种因素,并列出了每种因素的具体用例。李艳燕等[25]梳理了学习分析五个基本组成要素:学习过程、学习环境、受众、教育环境、五个环节(数据采集、数据存储、数据分析、数据表示、应用服务(绩效评估、过程预测、学习干预)),涉及学习者、教师、教育管理者三类对象,同时为其提供服务。胡艺龄、顾小青、姜强等[26-30]从不同的角度对学习分析模型进行了完善和该进。这些模型对于指导研究者进行学习分析系统设计、算法设计及应用实践具有重大意义,是研究者进行相关理论探讨和实践的基本依据。

3.2 学习分析技术与工具研究

学习分析研究是一个交叉应用领域,其发展借鉴了多个领域的理论、工具和方法,包括[21]学业分析、行动分析、网站分析、教育数据挖掘、统计与数学方法、文本分析与语义分析、社会网络分析、可视化理论等。相关分析方法基本都有相应的分析工具支持,并进行了相关应用实践。常用的学习分析工具有:Mixpanel Analytics用于可视化与实时分析,Userfly可用性测试,Gephi开源的可视化交互分析, Socrato基于题库的学习评估,SNAPP可视化社会网络与行为分析,LOCO-Analyst基于情境的社会网络分析等。

国内多侧重于对分析方法及所对应工具的介绍和对比研究,孟玲玲等[10]从使用环境、数据支持格式、是否可视化等维度对24种学习分析工具进行了对比研究,魏顺平[31]对LIWC、CATPAC、Atlast、Nvivo、VINCA、Geghi、UCINET等文本、内容、社会网络分析工具进行了归纳研究。然而对如何结合具体的情况使用这些工具尚缺乏相关理论指导,同时各工具所得到的结论在不能互相佐证时也缺乏理论框架进行解释说明,这是普及和应用学习分析技术所亟待解决的问题之一。

3.3 学习分析应用与实践研究

国外应用与实践研究早于国内,经典的案例有北亚利桑那大学的GPS(Grade Perfoemance status)项目、澳大利亚Wollongong大学的SNAPP(Social Networks Adapting Pedagogical Practice)、Pardos等[32]学者基于Web的教学平台ASSISTments研究实践、Lonn等[33]针对密歇根大学学生的M-STEM Academy 学业预警系统实践等。随着理论研究的深入,国内应用与实践方面的研究也在不断增加,顾晓[34]就使用学习分析技术构建信息技术课程教学平台进行了实践,陈春燕[35]对使用Gephi工具对Moodle平台上的讨论进行了可视化呈现实践等。从这些实践多集中于MOOCS或在线学习平台,如何将实践领域进一步扩大到传统教学环境还需进一步研究。

4 结束语

学习分析技术的研究和发展为我们实现个性化学习和自适应学习提供了更好的技术保障,有效地推动MOOCS和在线学习效果的提高。然而,其未来的发展还面临着诸多需要解决的问题,包括:数据采集与处理技术的局限导致对规模最大的传统教育支持不够,隐私与伦理上的问题、各系统统一标准的研究与制定问题等。虽其如此,不得不承认学习分析技术在大数据环境下为教育研究与实践提供了更有效的方法和支撑,使我们可以更好地迎接数据变革教育的时代。

参考文献:

[1] Manyika,J.,Chui,M.,Brown,B.Big data: The nextfrontier for innovation, competition, and productivity[DB/OL].http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/bigdata-the-next-frontier-for-innovation,2016-11-10.

[2] JOHNSON L, ADAMS BECKER S, WITCHEY H, et al. The NMC Horizon Report: 2011 Museum Edition [J]. Austin, Texas: The New Media Consortium, 2011.

[3] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition [J]. 2013.

[4] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2012 higher education edition, Austin[J].http://www.nmc.org/publications/2013-horizon-report-higher-ed, 2013.

[5] 吴永和,曹盼,邢万里,马晓玲.学习分析技术的发展和挑战——第四届学习分析与知识国际会议评析[J]. 开放教育研究,2014(06):72-80.

[6] 吴永和, 陈丹,等.学习分析:教育信息化的新浪潮[J]. 远程教育杂志,2013(04):11-19.

[7] 马晓玲,邢万里,等.學习分析系统构建研究[J].华东师范大学学报(自然科学版),2014(02):1-19.

[8] 李青,赵越.学习分析数据互操作规范IMS Caliper Analytics解读[J].现代远程教育研究,2016(02): 98-106.

[9] 马晨辉,徐艳艳. 中国高等教育学会教育信息化分会第十二次学术年会论文集[C].2014

[10] 孟玲玲, 顾小清, 李泽. 学习分析工具比较研究[J]. 开放教育研究,2014(04):66-75.

[11] 吴青,罗儒国.学习分析:从源起到实践与研究[J]. 开放教育研究,2015(01):71-79.

[12] Siemens G. Learning and Knowledge Analytics-Knewton the future of education[EB/OL].

http://www.learninganalytics.net/?p=126,2011-04-14.

[13] Brown, M. Learning analytics: the coming third wave[DB/OL].http://net.educause.edu/ir/library/pdf/ELIB1101.pdf,2011-4-1.

[14] Siemens, G. What are Learning Analytics?[EB/OL].http://www.elearnspace.org/blog/2010/08/25/what-are-learning-analytics/.2010-08-25.

[15] 李青,王濤. 学习分析技术研究与应用现状述评[J].中国电化教育,2012(8):129-133.

[16] 包昊罡,李艳燕.大数据背景下学习分析的特点[J].北京广播电视大学学报,2015(1):9-15.

[17] Siemens G. Learning Analytics: The Emergence of a Discipline[J].AMERICAN BEHAVIORAL SCIENTIST,2013,57(10SI):1380-1400.

[18] Macfadyen,L.P.,Dawson,S.Mining LMS data to develop an “early warning system” for educators:A proof of concept[J].Computers Education,2010,54(2):588-599.

[19] Baker,R. S. J. d., Yacef, K.. The State of Educational Data Mining in 2009:A Review and Future Visions[J]. Journal of Educational Data Mining,2009,1(1):3-14.

[20] U.S.Department of Education,Office of Educational Technology.Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief [R]. Washington, D.C., 2012.

[21] 郭炯,郑晓俊.基于大数据的学习分析研究综述[J].中国电化教育,2017(1):121-130.

[22] Elias,T. Learning analytics: Definitions, processes and potentials[EB/OL].

http://libvolume4.xyz/homescience/bsc/semester4/teachingmethodsandmediaee2/learningprocess/learningprocesstutorial1.pdf,2016-07-11.

[23] Khalil,M.,Ebner,M.Learning Analytics: Principles and Constraints:World Conference on Educational Multimedia, Hypermedia and Telecommunications[DB/OL].https://www.researchgate.net/publication/278940599_Learning_Analytics_Principles_and_Constraints,2016-08-1

[24] Greller,W.,Drachsler,H.Translating Learning into Numbers:A Generic Framework for Learning Analytics[J].EDUCATIONAL TECHNOLOGY & SOCIETY,2012,15(3):42-57.

[25] 李艳燕,马韶茜,黄荣怀.学习分析技术:服务学习过程设计和优化[J].开放教育研究,2012,(5):18-24.

[26] 胡艺龄,顾小清.教育效益的追问:从学习分析技术的视角[J].现代远程教育研究,2014(6):41-48.

[27] 花燕锋,张龙革.基于MOOCs的多元同心学习分析模型构建[J].远程教育杂志,2014(5):104-112.

[28] 姜强,赵蔚,王朋娇,等.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育,2015(1):85-92.

[29] 唐丽,王运武,陈琳.智慧学习环境下基于学习分析的干预机制研究[J].电化教育研究,2016(2):62-66.

[30] 李彤彤,黄洛颖,邹蕊,等.基于教育大数据的学习干预模型构建[J].中国电化教育,2016(6):16-19.

[31] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013(2):6-7.

[32] PARDOS Z A,BAKER R S,SAN PEDRO M O,et al.Affective states and state tests:Investigation how affect throughout the school year predicts end of year learning outcomes[C].//Poreedings of the Third International Conference on Learning Analytics and Knoelege(pp.117-124).ACM,2012.

[33] LONN S,KRUMM A E,WADDINGTON R J,et al.Bridging the gap from knoeledge to action:Putting analytics in the hands of academic advisors[C].In Proceedings of the 2nd International Conference on Learning Analytics and Knoeledge.ACM,2012:184-187.

[34] 顾晓.学习分析技术在高中信息技术的应用实践研究[D].上海:上海师范大学,2012:30-39.

[35] 陈春燕.学习分析在 Moodle 网络课程中的应用研究[D].上海:上海师范大学,2014:43-58.

猜你喜欢

学习分析数据挖掘大数据
基于并行计算的大数据挖掘在电网中的应用
浅析大数据在教育中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究