2007—2017年我国学习分析研究进展与现状分析
2018-11-21李梦蕾李爽沈欣忆
李梦蕾 李爽 沈欣忆
【摘 要】 学习分析作为当前教育技术研究热点经历了近十年的快速发展。为把握国内学习分析研究在过去十年间的主要进展和现状,本研究采用文献计量法、可视化分析、内容分析等方法对《中国电化教育》《中国远程教育》等五本国内核心学术期刊2007—2017年发表的204篇学习分析文献进行分析,总结、评述了十年来我国学习分析文献的研究类型、年度高频关键词、研究者与机构、研究数据、研究技术与工具、研究主题。在此基础上提出学习分析研究四个发展趋势:从技术和数据驱动转向教育需求驱动,多元化、多模态、高质量的数据采集,跨学科合作与技术融合,学习分析在教育领域全面展开。本研究希望通过描绘和反思近十年来国内学习分析研究图景,为今后学习分析的研究与实践提供参考。
【关键词】 学习分析;教育大数据;学术期刊;文献计量分析;可视化分析;内容分析;主要进展;发展趋势
【中图分类号】 G420 【文献标识码】 A 【文章编号】 1009-458x(2018)10-0005-12
一、引言
学习分析运用各种数据采集工具和分析技术,研究教学实践中的学生投入、学习绩效和进展,为课程、教学和评估的实时调整与改善提供了重要支撑(Johnson et al., 2012),成为当前发展最为迅速的研究领域。尽管学习分析最早可以追溯到20世纪60年代的计算机管理教学(顾小清, 等, 2012),但是学习分析领域真正引起广泛关注是在2011年美国新媒体联盟(New Media Consortium)《地平线报告》发布之后,报告将学习分析技术视为影响教育发展的新兴技术。从2011年起,学习分析引起国际教育技术领域的广泛兴趣,发展迅速,并推动了教学评价与研究的科学化发展。随着我国进入“互联网+”时代,教育信息化环境全面升级,大量教育数据产生,成为新时期教育教学生产力的关键要素。挖掘这些数据隐含的教学知识与需求,探索新环境下的教育教学规律、提升教学的精准度与适应性、创新教学服务供给模式、推动教育教学系统变革的需求日益强烈。在此背景下,近几年学习分析在我国教育领域的关注度与应用持续升温,该领域的技术工具和实践应用研究均发展迅猛,成为教育大数据的主要应用领域,也成为推动新时期教育教学研究范式变革的重要力量(王良周, 等, 2015; 杨现民, 等, 2017)。然而,学习分析作为一个新兴领域,无论是理论研究还是实践应用研究都仍处于初期探索阶段,学习分析的教育应用价值与潜力尚待挖掘,迫切需要更多高质量研究支撑未来学习分析的教育应用。为此,有必要对以往学习分析的相关研究进行系统梳理与评述,总结学习分析研究近几年的主要进展,剖析已有研究的局限与问题,明确未来研究方向与发展路径。综上所述,本文将聚焦能够体现我国学习分析领域研究与实践关键进展和成果的国内核心学术期刊,对近十年来学习分析研究文献进行系统综述,以期为学习分析的理论研究与实践探索提供参考。
二、文献综述
已有学者对学习分析进行了文献综述。如黄志南等(2016)以 Web of Science 核心库为数据来源,采用多种分析工具及可视化技术,从高被引文献、核心作者分布、论文高产机构和高频关键词入手,梳理并揭示了当前学习分析的研究现状;吴青等(2015)从利益相关者、研究目标、研究对象、技术方法四个维度梳理了学习分析的形成过程;孟玲玲等(2014)从多个角度对学习分析工具进行了分类,并从使用环境、数据支持格式、是否可视化等维度做了详细比较;韩锡斌等(2017)对2008—2016年与学习分析相关的国内外学术期刊、硕博士学位论文和会议报告与论文进行了系统梳理,包括概念与综述、构成与模型、技术系统、组织实施和效果评价五个方面,并提出了该领域的发展趋势和路径。
对相关综述文献的深入分析发现,已有研究关注的文献时间跨度各不相同,主要是在学习分析兴起的近十年范围内;综述的文献来源以期刊文献为主,也有少數综述关注国外期刊文献以及国际会议中的主题报告和论文(吴永和, 等, 2014; 曹帅, 等, 2016; 李香勇, 等, 2017)。有的综述还对国内外文献做了对比研究(韩锡斌, 等, 2017; 郭炯, 等, 2017)。从综述范围来看,尚没有专门针对国内教育技术和远程教育核心期刊2007—2017年学习分析文献的系统分析。
在综述内容方面,已有综述的聚焦点各有不同。大部分综述的内容围绕学习分析模型与方法、学习分析的技术与工具、学习分析的实践与应用、学习分析的研究主题等方面。如王紫琴等(2017)从学习分析技术规范的角度综述了ADL、IMS 和 ISO /IEC三大标准组织制定的学习分析技术规范,并对Caliper Analytics和xAPI两个学习分析技术规范进行了比较,分析两者的不同点和内在联系;李艳燕等(2012)通过对已有实证研究文献的概括,整理出五种典型的数据分析方法,并提出了面向不同利益相关群体的应用服务。可是,从综述内容上来看,已有文献缺乏对学习分析研究者、数据来源、数据量、分析方法与工具、分析主题的系统分析,因此难以全面描述领域研究现状,难以深入挖掘研究问题与局限。
在综述方法上,大部分综述研究都借助多种可视化工具和技术来分析学习分析的现状。如牟智佳等(2016)以元分析、知识图谱、社会网络分析为研究方法,从研究者国籍、学科背景、关键文献、关键词、研究主题和研究方法六个方面,对文献进行内容分析;黄志南等(2016)利用可视化工具分析了学习分析研究主题的年度变化,并在此基础上加入了对文献主题内容的分析。然而,在整体上大部分研究较少综合定量、定性、可视化等多种方法对文献进行多视角、深入的分析。
综上所述,有必要对近十年来我国核心教育技术学术期刊的学习分析研究文献进行系统深入的分析与综述,总结十年来学习分析在我国教育技术领域的主要研究进展,分析已有研究局限与问题,为未来研究与实践提供参考和依据。
三、研究方法
核心期刊是期刊中学术水平与影响力较高的刊物。已有研究对远程教育领域核心期刊进行了期刊影響力的分析,指出《电化教育研究》《中国电化教育》《中国远程教育》《现代远程教育研究》《开放教育研究》《现代教育技术》《远程教育杂志》七本期刊基本上反映了我国远程教育领域的学术水平、研究动态、热点话题和发展趋势,是我国远程教育领域的重要信息来源。其中,《电化教育研究》《中国远程教育》《中国电化教育》三本期刊的影响指数最高(黄淑敏, 2011)。考虑到本研究将基于文章内容对核心期刊文献进行人工筛选以避免使用关键词搜索导致的文献遗漏,人工筛选文献工作量较大,因此决定从七本期刊中选择五本进行学习分析相关文章的筛选。除了影响指数最高的三本期刊,还选择了近几年学术影响力提升较快的《现代远程教育研究》和《开放教育研究》两本期刊。聚焦这五本核心期刊,综合应用文献计量分析、可视化分析、内容分析等分析技术对学习分析相关文献进行系统分析。
(一)文献样本及其选取
本研究综述的文献样本通过如下两个步骤获得。首先,在中国知网(CNKI)以“大数据”和“学习分析”为关键词,以“核心期刊”、发表时间在2007—2017年为筛选条件对《中国电化教育》《电化教育研究》《中国远程教育》《现代远程教育研究》《开放教育研究》五本期刊进行第一轮文献检索,得到62篇文献。之后,研究者逐篇筛选五本核心期刊在2007—2017年发表的文章,选取与学习分析主题相关的研究文献,一方面避免遗漏没有以学习分析和大数据为关键词的相关文献,另一方面对关键词检索结果进行印证。最后通过双向检索和统计,最终筛选获得有效文献样本共204篇,作为文献综述分析的对象。
(二)文献分析过程与方法
本研究综合应用文献计量法、可视化分析、内容分析方法对所选取的204篇文献进行分析。研究者首先根据分析内容对204篇文献样本进行整理与编码,整理与编码的内容包括文章题目、来源期刊、时间、作者、作者单位、研究类型、学习分析对象、分析数据来源、类型、样本量、分析技术与工具、分析主题等。两名研究者完成了编码工作,协商编码问题,检验编码结果,确保了编码结果的有效性。在文献样本编码的基础上,研究者分别借助Citespace5.0分析工具对文献样本的研究类别、研究年度热度变化、作者合作关系进行可视化分析,采用Excel2013对133篇实证研究的被试或参与者的教育阶段、来源、类型和样本量、分析的技术和工具进行了描述性统计;采用UCINET6.0对实证研究中采用的学习分析方法进行关系网络分析,采用内容分析法对文献样本的研究主题进行归纳与分析。
四、研究结果
(一)年度研究类型与热点分析
1. 文献研究类型分析
对文献样本分析发现,已有文献可以分为三类:①理论分析类(53篇),即从理论视角出发构建学习分析的理论模型框架,或探讨与学习分析相关的技术理论,探讨学习分析的发展趋势和基于各种平台和应用范围的理论架构;②实证研究类(133篇),即基于真实教育教学案例和数据开展学习分析的实证研究,以探索规律、构建模型、探索方法、开发系统等;③文献综述类(18篇),即从不同聚焦点对学习分析领域的文献进行综述,如学术群体、文献可视化分析、分析工具、在线学习行为和大数据视角等。因此,本研究把大数据与学习分析的文献分为三类,即实证研究类、理论分析类和文献综述类。由文献的年度统计分析(见图1)可以看出,文献量逐年增大,三类文献均增长较快,实证研究类的涨幅最大,说明研究者和实践者都相继进入学习分析领域开展研究,在理论建构的基础上更加倾向与真实的学习分析实践案例相结合,在实践中探索和寻找理论与实践的交叉点。
2. 文献年度高频关键词分析
对五本期刊文献样本关键词的分析(见图2)显示,学习分析从2011年被《地平线报告》定义为影响教育发展的新兴技术之后迅速引起国内学者的关注,在2012年呈现爆发式增长(节点越大,表明出现的频次越高),从2012年至2017年的年度热词分别是MOOC、教育大数据、翻转课堂、教育技术、可视化、互联网+、高等教育、深度学习、人工智能。2012年被称为“MOOC元年”,与之伴随的是对MOOC平台的数据进行学习分析的大规模兴起。随后几年互联网飞速发展,教育信息化深入开展,教育数据集日渐庞大,越来越多的研究者开始关注“互联网+教育”“教育大数据”背后的潜在价值,并在学习分析技术领域积极践行。近两年来关于学习分析的研究主要集中在高等学校。EDUCAUSE分析和研究中心(ECAR)不久前发布了《2017年高等教育十大战略性技术》报告,认为学习分析技术是2017年美国高等院校正在投入的技术之一,高等院校准备让应用系统支持院校新的数据需求。未来工厂(2016)发布了《2016—2020年在线教育迈向智能时代》,预测人工智能为核心的新技术与教学融合是在线教育的下一个核心驱动力,而人工智能的本质是基于大量数据的分析建立模型进行应用。目前人工智能和学习分析的融合已经在自适应学习、虚拟助手、专家系统、语言学习等方面具有广泛的应用,2017年“人工智能”在学习分析领域的高频出现正预示着人工智能将在在线教育领域迎来爆发期,通过对学习过程中产生的数据进行分析建模,运用技术手段充分发挥机器标准化的优势和人类富有情感及在创造力和复杂决策上的优势。未来,随着技术的成熟和学习分析理论的深入融合,更多新的场景必将出现。
(二)作者可视化分析
从图3可看出,作者整体分布较分散,没有形成大的合作网络,研究者大部分形成小的研究流派或者单独开展研究。经过进一步查阅文献发现,这些小研究流派大部分是基于高校内部和研究院内部的合作,跨校跨领域合作极少,且内部研究者大多为师徒关系、同事关系。目前主要形成了四大流派,如最大的合作网络是以祝智庭、顾小清为中心的华东师范大学,以郑勤华、孙洪涛、武法提、牟智佳等为代表的北京师范大学远程教育研究中心和教育技术学院,以姜强、赵蔚为核心的华中师范大学等,他们之间都各自形成了较强和固定的关系网络并不断加强合作。但学习分析领域还应进一步加强不同机构的合作,发挥权威专家的学术引领作用,丰富不同高校间的联系,搭建学习分析的研究交流平台,形成更大型的研究者关系网。
同时,要鼓励不同学科领域学者的交流合作,推进学习分析的跨学科合作研究。学习分析研究需要丰富的学科背景作支撑,包括脑认知科学、学习科学、社会学等,学习分析技术可以吸收借鉴其他学科的分析方法、理论、技术,对不同的分析场景、对象提出适用的理论框架体系,如与脑认知科学结合来探究学生认知规律,通过交叉合作的形式解决教与学中的问题,等等,进而形成跨学科研究的学习分析生态圈,以更加开放、多元的视角开展研究和实践,推动学习分析领域更快发展。
(三)样本与数据来源
教育大数据产生于各种教学实践活动,核心的数据源头是“人”和“物”,“人”包括学生、教师、管理者和家长,“物”包括学习平台、校园网站、服务器、多媒体设备等各种教育装备(杨现民, 等, 2016)。与传统教育数据不同,大数据更多是过程性、即时性的行为和现象的记录,这使得大数据下的学习分析技术能够对每一个学习者的学习过程进行细致分析。通常不同数据的类型和来源不同,主要的采集方式和应用场景也不同。通过133篇实证研究文章进行二次编码和整理,得出以下发现:
1. 学习分析对象所在教育阶段
学习分析对象主要是在在线平台开展教学和学习活动的教师和学生。整理案例研究中学习分析对象的相关信息可以发现,学习分析的对象类别多样:从小学到大学本科、研究生都有所涉及,年龄跨度大,教育阶段多样,同时有很多MOOC学习者,以及不同教育阶段的教师。经过讨论,排除文章中未明确告知所分析对象的文章32篇,将学习分析对象按照教育阶段和种类分为五大类(如图4所示):基础教育阶段、职业与继续教育阶段、高等远程教育学校、传统高校、非学历教育。可见,目前学习分析领域的研究主要集中于传统高校和继续教育领域,基础教育的研究占比较少,这与教育大数据与分析技术最早产生于高校有关,同时说明未来基础教育领域研究空间很大。
2. 学习分析数据来源
根据学习分析数据的来源和范围不同,可以将其分为个体数据、课程数据、班级数据、学校数据、区域数据和国家数据,从上到下,从小到大,不断汇聚。基于文献总结(如图5所示),目前国内学习分析研究的数据主要来自于在线学习平台(如Moodle平台、电大网络教育平台、MOOC平台、网络研修社区等)及在线学习管理系统(如智能导学系统、学习神经元、Few仪表盘、电子学档等)。也有实证研究的数据来自于网易、新浪和猫扑等网站论坛和QQ、微信、微博等移动社交平台。此外,少量学习分析研究也结合线下调查问卷的数据作为学习数据的补充。可以看出,分析数据的来源更加多元化,而且已经有学者开始关注社交平台等非正式学习空间中的数据。未来,数据还有可能更多来源于多模态数据、情境中的互动、运动手环等。随着越来越多的数据被关注和采集,学习数据的多来源不仅让我们更加清晰地了解学生的偏好和习惯,而且数据间的关联性加强,能够更加准确地再现学习过程。
3. 数据类型
分析目标和研究目的不同,则需要选择与研究的数据类型不同(郁晓华, 等, 2016)。学习分析类研究关注的数据不再仅仅是学生基本特征和学业成绩,还包括分布在各种教学、学习情境和空间中的教学和学习过程生成数据。这些生成数据种类多样、繁杂,既有行为频次、行为时间等行为属性的数据,也有行为对象相关数据。行为类型不同,行为对象数据也存在差异。如果是学生与技术系统、工具的互动行为,行为对象是功能模块、资源、练习题、帖子、笔记、微博等,相关数据可能是资源的元数据、学生创作内容特征数据、学生考试成绩数据等。如果是学生的社会性互动,那么行为对象就是教师或同伴,相关数据是不同主体的特征和基本信息数据。根据文献样本报告的数据所属对象,本研究将分析数据分为学生、教师和课程三类数据集合,见表1。学生数据由学生基本特征与信息数据以及学生在学习过程中产生的各类行为数据构成。教师数据由教师基本特征与信息、教师与课程平台或技术工具的交互行为数据、教师与学生的互动数据构成。课程数据包括课程基本信息数据和课程生成数据。后者都是由学生和教师生成,与前两类数据集有交叉,但课程数据是以课程为对象进行的数据分析,支持课程实施情况的分析和评估。
对文献样本的数据类型分析发现,大部分研究的数据类型相对单一,体现在:①已有研究主要关注学生学习行为数据,缺乏学生行为数据与学生特征、基本信息数据的关联分析,缺乏学生数据与教师数据、课程数据的关联分析,因此难以评估课程和教学因素对学习行为的影响;②对学习行为数据的分析以表面的量化行为数据分析居多,较少关注体现学习质量的行为数据、挖掘行为数据中隐含的情感和认知特征、对学生在线学习进行深入剖析。近几年,已经有一些研究者意识到对体现学习质量和心理投入的行为数据,以及多元、多类数据进行整合分析的价值,对学生的在线学习特征及其影响因素进行了更深入的探索。未来研究要更多关注体现学习质量的行为数据,要融合多类、多元数据对学习进行全面、深入的分析。
4. 分析数据量
学习分析教育价值和潜力的有效发挥建立在对大数据分析的基础上。那么已有研究分析的数据量级是怎样的呢?为考察该问题,本研究对文献样本中实证研究的数据量进行了统计(见图6),发现明確报告数据量的文献只有61篇。其中,分析数据量小于100的文章有5篇;数据量在100到10,000之间的文章有33篇,占比近一半;数据量大于1万以上的文章有23篇。有的研究使用了几百个在线帖子及在线行为数据进行分析和预测;仅有少量研究的数据量达到1.1亿次的课程点击量,几十万学习者的在线行为数据。根据分析,已有研究学生样本量以百人左右为主,在线数据记录数主要在万条以内。可见,正如魏顺平(2016)所指出的,虽然大数据时代已经到来,但是国内学习分析实证研究以小样本研究为主,真正基于大数据的学习分析研究还没有全面展开,已有研究所发现的规律与模型大多只是在特定情境下的局部探索,很难获得普适性的规律与模型。未来,需要从样本规模、学习经历完整性和深度等方面采集更大规模的数据,将学习分析建立在大数据基础上,提升分析的价值。
(四)分析技术与工具
1. 分析技术与方法
教育数据挖掘为学习分析技术奠定了基础(胡水星, 2016)。学习分析过程包括数据采集与储存、数据筛选、数据预处理、数据变换、数据挖掘、模式解释与评价等环节。对已有研究的分析方法调查显示,已有研究采用了描述性统计、关系挖掘、文本挖掘、社会网络分析、内容分析、聚类等多种数据挖掘方法。本研究基于Romero和Ventura(2007)对教育挖掘技术的分类将学习分析技术分为五类:统计分析、可视化分析、聚类与分类、关联规则挖掘和序列模型挖掘、文本挖掘。对方法出现频次的统计分析发现(见图7),出现频次最多的三种方法是描述性统计、社会网络分析和聚类。从方法类型上看,统计分析类方法出现频次最多,其次是聚类与分类方法。
研究者根据每个研究中组合使用的分析方法建立矩阵图,采用UCINET6.0绘制出学习分析方法关联使用的关系网络图(见图8)。据图可知,多数研究组合了多种方法开展学习分析。其中,描述性统计、聚类分析、相关分析处于网络的中心,可见它们是与其他方法关联使用频度较高的分析方法。此外,社会网络分析、方差分析也与其他方法有较高的组合使用频度。组合使用频次较高(≥5次)的方法为描述性统计分别与方差分析、聚类分析、社会网络分析、内容分析的组合,相关分析与聚类分析,社会网络分析与内容分析。
综上所述,相关研究多采用多种分析方法对学习数据进行挖掘,但是分析以对学习数据的描述性、探索性分析为主,缺乏对学习过程的建模分析。根据方法组合的分析结果,结合具体研究分析,可知大多数研究会首先对数据进行描述性分析,之后再开展深入的数据挖掘,检验成绩差异。根据行为特征聚类学生、分析学生互动形成的关系网络和交互质量是已有研究较为常见的研究路线。
2. 工具
学习分析工具在学习分析过程中具有重要作用,任何研究分析的顺利进行都离不开优质工具的支持,便捷、实用的工具可以使研究更为有效(刘三,等, 2017)。对样本中实证研究采用的分析技术与工具进行统计分析发现,报告分析工具的文献采用的技术工具主要集中在统计分析工具、社会网络分析工具、内容分析工具三类。
研究对各类工具在文献中的使用频次进行了统计(见表2),发现统计分析工具是最常用的学习分析工具,其中SPSS的使用频次最高(24次),有研究使用SPSS进行数据的预处理、数据转换、差异检验、回归分析、聚类、降维等。在统计分析工具中,Excel(8次)和AMOS(5次)也是研究者较多选择的统计分析工具,前者操作简单,多用于简单的描述性统计、差异检验、回归分析等,后者多用于SPSS所不能实现的结构方程分析。在社会网络分析中,UCINET(5次)更受青睐,除了该工具支持数据的深入分析,可能还因为该软件的数据兼容性更强,更易获得。在内容分析工具中,使用频次最高的是Nvivo(3次),它是一种常用的非常灵活的编码工具,能够分析音频、视频、图片和文档信息,适用范围较广。除了上述三种之外,有学者还使用了其他的分析工具,如Google Analytics、Quinlan等。
分析工具的统计结果表明,国内研究者常选用的分析工具往往具有较好的可获得性和易用性,如SPSS、Excel、Nvivo、UCINET。专业性较强的工具或可获得性较差的工具使用率普遍偏低。这在某种程度上反映出现有学习分析研究团队分析研究的技术力量和资源支持有限。另外,值得注意的是,已有研究大多缺乏对所用技术工具的评价与反思,也较少有学者对同类分析技术或工具进行对比分析。工欲善其事必先利其器,有效的分析工具将会显著提升学习分析的效果,未来亟须学习分析工具的对比与评价研究,以便为分析工具的选择提供参考。
(五)研究主题
基于对文献内容的分析与编码,本研究将文献样本的主题归纳为六大类(见图9):探索教与学规律、学习过程监控和评价、学习分析的工具和方法、学习分析的基本理论、自适应和个性化学习、其他。在编码中,研究者发现部分文章可能涉及多个主题内容,经过协商选择了文章的核心内容进行主题归类。极少数文章不属于前五大类中,但仍与学习分析相关,如在介绍教育技术发展、大数据平台构建中介绍性地谈到学习分析领域,研究者把这类文章归到“其他”类,未做进一步分析。本研究对前五个主题的内容进行详细论述。
1. 探索教与学规律
在学习分析相关文献中,探索教与学规律的研究占比最大。过去十年不仅是教育大数据和学习分析兴起和发展的十年,也是教与学环境数字化和网络化显著发展的十年,亟待探索新环境下教与学的规律,而学习分析为挖掘和揭示新环境下教与学的深层规律提供了有力支撑。已有研究基于教学平台中的各种教学数据对在线学习行为特征及其影响因素、教学交互行为特征、教师特征与行为对学习行为的影响、学生特征对学习行为的影响、特定在线学习活动对学习体验和效果的影响等进行了探索。如马婧等(2014)基于网络教学平台中师生行为的表征数据,探索了网络教学环境中教师教学行为与学生自主学习行为之间的关系;张婧婧等(2017)通过对B站中一门PS课程的弹幕数据进行分析和文本挖掘,發现弹幕在一定程度上有助于促进师生、生生间的情感交流,缩小师生间的心理距离,增强学习者的社会临场感,减少网络学习孤独感;王敏娟等(2007)用内容分析法对师生讨论记录进行挖掘,探索性别、对话风格和平等参与之间的关系。此外,还有研究关注社会化批注对大学生深度阅读的影响(柴阳丽, 2016),探究英语学习规律(兰国帅, 等, 2013)、学生学习行为规律(石磊, 等, 2017)等。
学习分析技术和教育大数据的结合有助于挖掘不断丰富的教育数据中隐含的教学知识与需求,是探索新环境下教与学规律的重要方法。然而,现有研究在规律探索层面更多是基于单一数据来源分析行为层面的规律与特征,未来需要更多聚焦多来源、多类型数据的整合分析,挖掘行为数据背后的学习心理特征与规律,探索教与学的规律。
2. 学习过程监控与评价
采用学习分析技术对学生学习行为及过程进行评价、监控和预警的研究是学习分析研究关注的另一个重要主题。已有文献对学习过程监测模型和指标、学习绩效预测模型与指标、学习预警与反馈模型和系统、教学干预方式与模型、学习路径、学习预警与反馈、困难学生干预等进行了探究。研究者力求基于学习行为数据对学习投入、学习过程与路径进行有效的监控,支持基于过程的学习评价和教学,根据学习情况实时调整,及时发现预警行为或预警学生并提供有效的干预和反馈。在该主题下,定义基于学习数据的监控与预警指标,构建相应监控和预警模型,设计开发监控、评价和预警系统成为这方面研究的热点。如孙鸿飞等(2007)利用电子学档记录学生学习过程信息并提供及时反馈,一定程度上实现了对在线学习各环节的监控;李爽等(2016)在学习行为投入理论框架下定义在线学习行为投入评测指标,基于实际数据分析相应指标内在结构以及对学习绩效的预测作用,探索在线学习行为投入的有效评测指标;金义富等(2016)探讨了大数据环境下的学业预警系统设计框架,提出了一种基于离群数据挖掘与分析的课程、课堂、课外“三位一体”预警信息发现与生成模型LAOMA(Model of Learning Alert Based on Outlier Mining and Analysis),构建了学业预警两类六级信号系统及反馈机制;张家华等(2017)基于傳统RTI模式构建了在线学习干预模型,通过分析技术及时预测可能出现学习风险的学习者,并为其提供适当的学习干预。
3. 学习分析的方法与工具
对学习分析工具与方法的介绍与分析是学习分析文献的第三大主题内容。这可能与学习分析作为一个新兴领域,人们的关注点还集中于该领域技术与工具的引入和选择有关。文献多从工具和方法的介绍以及在实际案例中的具体应用入手,对其适用性、优缺点进行评价和分析。如刘三
学习分析工具和方法直接影响学习分析效率与效果。现有文献主要以介绍某个工具和方法为主,未来需要更多聚焦于在实证检验基础上对多类学习分析工具和方法进行对比研究,以支持实践中工具和方法的选择。
4. 学习分析的基本理论
学习分析基本理论的文献占比不高,且主要集中在早期,对学习分析定义、一般学习分析系统构成与设计的理论探索较多,涉及内容包括学习分析概念界定、系统构成和基本框架、理论模型构建等。在概念界定方面,许多研究都将学习分析概念与其他相关概念,如教育数据挖掘、学术分析、预测分析等进行辨析,帮助人们明确学习分析概念的内涵与外延。有的学者对特定领域的学习分析模型进行了理论探索,国内研究者多聚焦于对国外已有模型理论的分析和评价,本土原创的学习分析模型较少。整体上,已有学习分析框架有两种建构方式,一是以某种逻辑顺序呈现学习分析要素,二是以时间顺序呈现学习分析过程(魏顺平, 2016)。祝智庭等(2013)从学习分析学的视角探讨其设计框架和学习分析的资源过程模型与重要环节;郑娅峰等(2017)从知识加工、社交关系、行为模式三个维度构建了面向计算机支持的协作学习分析模型。该分析模型用于自动测量协作过程中知识水平与知识发展,深入挖掘协作过程中交互模式的序列与规律,有效识别群组成员的交互结构。也有研究从学习分析系统要素及要素间的关系出发,从大数据下学习分析理论的视角研究教学的新范式(杨现民, 等, 2017; 祝智庭, 等, 2013)。整体上,该主题的文献缺乏对学习分析应用所需理论创新与理论模型的探索,随着学习分析实践的快速发展,这类研究的需求将日趋强劲。
5. 自适应和个性化学习
自适应和个性化学习是学习分析最具潜力的应用领域,然而该主题下的研究却是最少的。现有文献从用户模型与资源推荐模型、个性化和自适应算法与技术、自适应学习系统等方面对基于学习分析的自适应和个性化学习进行了初步探索。在用户模型与资源推荐模型方面,研究大都基于学生相对稳定的个人信息和动态变化的学习过程数据来发掘学习者的学习特点、学习动机、学习兴趣和认知风格等深层次信息,并提供个性化的学习支持服务(岳俊芳, 等, 2017)。陈海建等(2017)选取上海开放大学的一门课程开展实验验证,以标签化的形式构建用户画像,利用学习者的基本信息,在线学习行为和课堂表现,挖掘学习者个人兴趣、爱好、学习能力等特点,以有效服务于个性化教学;韩建华等(2016)构建了智能导学系统结构模型和个性化学习过程模型,通过实证研究验证了该模型的应用效能:能够创建学习者个性化学习路径,根据因果图编辑过程和结果给出个性化指导和建议,对学习者的学习过程进行干预,根据学习者的测试结果生成个性化评价;在算法和方法层面,方海光等(2016)构建了量化自我学习算法QSLA(Quantified Self Learning Algorithm)作为实现基于教育大数据的自适应学习的基础;黎孟雄等(2012)基于模糊聚类的方法,并结合协同过滤、智能分词和移动Agent技术,建立了教学资源的自适应推荐模型,对目标用户的检索期望进行了预测和体检;张驰等(2009)使用EM算法对移动学习中的学生进行聚类分析,发现学生的群体分布特点,结合学生群体特征及差异对移动学习课程资源设计和教学设计进行改进。未来,随着人们个性化学习需求进一步释放,各类教育机构都将更加重视教育教学产品与服务在满足学生个性化需求方面的能力,自适应与个性化学习方面的应用研究将成为学习分析研究的核心内容。
五、结论与展望
本研究基于对2007—2017年十年间国内五本教育技术与远程教育领域核心期刊中学习分析相关研究文献的计量分析与内容分析,对我国学习分析研究进展与现状进行了系统梳理与评述。研究发现,近十年来学习分析领域发展迅猛,形成了多个学术研究团队与中心,关注热点从早期的学习分析定义、理论框架、技术引进和综述,逐渐转向学习分析在MOOC、高等教育等领域的应用研究,研究主题多元化,在教学规律探索、学习监控与评价、技术工具研发、理论研究、自适应与个性化学习等研究领域都取得了一定进展。然而值得注意的是,已有研究也存在一些问题和局限,如相关实证研究在数据来源多样性和丰富性上、在研究视角与方法的多元性和新颖性上略显不足,本土化理论研究以及学习分析应用所需的理论模型研究整体缺乏,学习分析的应用研究领域以高等教育为主,实证研究报告不够规范与完整,等等。在文献分析基础上,本研究认为未来我国学习分析相关研究将呈现如下趋势:
1. 从技术驱动和数据驱动转向教育需求驱动
在学习分析兴起和应用之初,学习分析的教育应用以技术驱动和数据驱动为主,由此导致研究和实践可能偏离真实的教育问题(韩锡斌, 等, 2017)。早期关注的焦点是突然剧增的教育数据,以及各种能够挖掘这些数据中隐含的学习知识和教育知识的技术,教育大数据成为新的教育生产要素,数据分析和技术发展倒逼教育教学服务的创新(李爽, 2016)。随着教育数据日益丰富、数据规范和标准的建立与推行、数据挖掘技术不断成熟,教育各类相关利益群体基于数据的决策与服务意识以及个性化需求不断增强,学习分析研究与应用将不再从数据和技术出发,而是回归教育需求,实现从数据和技术驱动向教育需求驱动的转变。
2. 多元化、多模态、高质量的数据采集
随着生物识别技术、传感器技术、可穿戴设备、物联网技术等技术的发展,各种学习场景、技术平台、系统、工具及其数据的全面联通与便捷共享,学习分析所采集和分析的数据将呈现多元化和多模态的发展趋势,以支持对学习经历进行全方位的分析与监控。近几年来,非正式学习空间和情境的学习数据、学习过程中学生的生物信号数据、学习情境数据开始受到更多关注。此外,在数据采集中人们越来越重视采集那些能够体现学习质量和心理体验的数据,而不再只关注访问量、点击率等浅层次的行为数据。
3. 跨学科合作与技术融合
跨学科合作研究和技术融合是未来学习分析的重要趋势。未来几年,学习分析研究所应对的是处于不断创新变革的教育系统中的教育教学问题,问题的复杂性和数据的多元化都需要突破单一的研究视角和技术方法,从教育学、信息科学、系统科学、脑认知科学、工程学、心理学等多学科中汲取营养,开展多学科合作,只有这样才能掌握更加全面的数据信息,认识和探索更为复杂的教学和学习问题,掌握和评估学生的学习,提供个性化的精准教学服务(牛敏娜, 2017)。
4. 学习分析研究在教育各领域全面开展
前十年的学习分析研究主要以高等教育、正式学习为主,基础教育、职业教育等领域以及非正式学习的学习分析研究较少。随着我国“互联网+教育”改革的推进,基础教育、职业教育、成人与继续教育等领域的在线教育将获得显著发展,非正式学习也将迅速崛起,成为人们学习的重要途径。在此背景下,学习分析的研究与应用将在教育各领域全面展开,以响应教育各领域以及终身教育在新教育教学形態下对教学规律、方法、技术探索的需求。
[参考文献]
曹帅,王以宁,徐鹏. 2016. 学习分析技术的研究现状与未来趋势——基于2011—2015年LAK会议论文的分析[J]. 中国电化教育(05):78-84.
柴阳丽. 2016. 社会化批注对大学生数字化深阅读影响的实证研究[J]. 现代远程教育研究(02):107-112.
陈海建,戴永辉,韩冬梅,等. 2017. 开放式教学下的学习者画像及个性化教学探讨[J]. 开放教育研究,23(03):105-112.
方海光,罗金萍,陈俊达,等. 2016. 基于教育大数据的量化自我MOOC自适应学习系统研究[J]. 电化教育研究,3(11):38-42,92.
顾小清,张进良,蔡慧英. 2012. 学习分析:正在浮现中的数据技术[J]. 远程教育杂志,30(01):18-25.
郭炯,郑晓俊. 2017. 基于大数据的学习分析研究综述[J]. 中国电化教育(01):121-130.
韩建华,姜强,赵蔚,等. 2016. 智能导学环境下个性化学习模型及应用效能评价[J]. 电化教育研究,3(07):66-73.
韩锡斌,黄月,马婧,等. 2017. 学习分析的系统化综述:回顾、辨析及前瞻[J]. 清华大学教育研究,38(03):41-51,124.
胡水星. 2016. 教师大数据应用学习[M]. 杭州:浙江教育出版社:12.
黄淑敏. 2011. 中国远程教育领域核心期刊的学术影响力报告——基于2006—2010年载文被引特征分析[J]. 广州广播电视大学学报,11(05):13-18,107-108.
黄志南,陆星儿,胡贺宁,等. 2016. 学习分析主题结构研究及可视化分析[J]. 开放教育研究,22(05):102-111.
金义富,吴涛,张子石,等. 2016. 大数据环境下学业预警系统设计与分析[J]. 中国电化教育(02):69-73.
兰国帅,张一春. 2013. 合理利用超媒体注释技术促进英语阅读理解及词汇习得——梅耶多媒体信息设计“临近原则”的实验验证[J]. 中国远程教育(09):40-45.
黎孟雄,郭鹏飞. 2012. 基于模糊聚类的教学资源自适应推荐研究[J]. 中国远程教育(07):89-92.
李爽. 2016. 基于学习分析的在线学生支持[M]. 北京:中央广播电视大学出版社.
李爽,王增贤,喻忱,等. 2016. 在线学习行为投入分析框架与测量指标研究——基于LMS数据的学习分析[J]. 开放教育研究,22(02):77-88.
李香勇,左明章,王志锋. 2017. 学习分析的研究现状与未来展望——2016年学习分析和知识国际会议述评[J]. 开放教育研究,23(02):46-55.
李艳燕,马韶茜,黄荣怀. 2012. 学习分析技术:服务学习过程设计和优化[J]. 开放教育研究,18(05):18-24.
刘三,彭晛,刘智,等. 2016. 基于文本挖掘的学习分析应用研究[J]. 电化教育研究,7(02):23-30.
刘三,石月凤,刘智,等. 2017. 网络环境下群体互动学习分析的应用研究——基于社会网络分析的视角[J]. 中国电化教育(02):5-12.
马婧,韩锡斌,周潜,等. 2014. 基于学习分析的高校师生在线教学群体行为的实证研究[J]. 电化教育研究,35(02):13-18,32.
孟玲玲,顾小清,李泽. 2014. 学习分析工具比较研究[J]. 开放教育研究,20(04):66-75.
牟智佳,俞显. 2016. 知识图谱分析视角下学习分析的学术群体与热点追踪——对历年“学习分析与知识国际会议”的元分析[J]. 远程教育杂志,35(02):54-63.
牛敏娜. 2017. 基于大数据视角分析学习变革[J]. 时代教育(04):105.
石磊,程罡,李超,等. 2017. 大规模私有型在线课程学习行为及其影响因素研究——以国家开放大学网络课程学习为例[J]. 中国远程教育(04):23-32,80.
孙鸿飞,刘洪沛,上官右黎. 2007. 电子学档在在线学习监控中的应用研究[J]. 中国远程教育(02):57-60.
孙洪涛. 2013. 开源工具支持下的社会网络分析——NodeXL介绍与案例研究[J]. 中国远程教育(02):14-20.
王洪江,穆肃,黄洁,等. 2017. 自主学习投入度实时分析方法及应用研究[J]. 电化教育研究,38(10):44-50.
王良周,于卫红. 2015. 大数据视角下的学习分析综述[J]. 中国远程教育(03):31-37.
王敏娟,克里斯蒂娜·塞拉,赵晓楠. 2007. 在线学习中的性别差异、对话风格和平等参与[J]. 中国远程教育(02):25-29.
王紫琴,彭娴,吴砥. 2017. 学习分析技术规范比较研究[J]. 开放教育研究,23(01):93-101.
未来工厂. 2016-11-17. 《EDAI:2016—2020年在线教育迈向智能时代》[EB/OL]. http://www.imxdata.com/archives/16839
魏顺平. 2016. 在线教育学习分析研究[M]. 北京:中央广播电视大学出版社.
吴青,罗儒国. 2015. 学习分析:从源起到实践与研究[J]. 开放教育研究,21(01):71-79.
吴永和,曹盼,邢万里,等. 2014. 学习分析技术的发展和挑战——第四届学习分析与知识国际会议评析[J]. 开放教育研究,20(06):72-80.
杨现民,骆娇嬌,刘雅馨,等. 2017. 数据驱动教学:大数据时代教学范式的新走向[J]. 电化教育研究(12):13-20,26.
杨现民,王怀波,李冀红. 2016. 滞后序列分析法在学习行为分析中的应用[J]. 中国电化教育(02):17-23,32.
郁晓华,江绍祥. 2016. 在线教与学集体智慧的有效利用:学习分析的视角与架构[J]. 开放教育研究,22(03):98-106.
岳俊芳,陈逸. 2017. 基于大数据分析的远程学习者建模与个性化学习应用[J]. 中国远程教育(07):34-39.
张驰,陈刚,王敏娟,等. 2009. 移动学习中使用EM算法的学生聚类分析[J]. 中国远程教育(05):68-71.
张家华,邹琴,祝智庭. 2017. 学习分析视角下在线学习干预模型应用[J]. 现代远程教育研究(04):88-96.
张婧婧,杨业宏,安欣. 2017. 弹幕视频中的学习交互分析[J]. 中国远程教育(11):22-30,79-80.
郑娅峰,徐唱,李艳燕. 2017. 计算机支持的协作学习分析模型及可视化研究[J]. 电化教育研究,38(04):47-52.
祝智庭,沈德梅. 2013. 学习分析学:智慧教育的科学力量[J]. 电化教育研究,34(05):5-12,19.
Johnson L, Adams S. Cummins M. (2012, September 16). The NMC Horizon Report:2012 Higher Education Edition[EB/OL]. http://www.org/publicatopns/horizon-report-2012-higher-ed-edition
Romero C, Venturcl S. (2007). Educational data mining: A survey from 1995 to 2005[J]. Expert systems with applications,33(1), 135-146.
收稿日期:2018-03-03
定稿日期:2018-07-26
作者简介:李梦蕾,硕士研究生;李爽,本文通讯作者,博士,副教授,硕士生导师。北京师范大学远程教育研究中心(100875)。
沈欣忆,博士,助理研究员,北京教育科学研究院(100029)。
责任编辑 刘 莉 张志祯