基于过程数据及分析的在线学习路径研究:规律与规划
2020-06-01黄晓地
崔 萌 穆 肃 黄晓地
(1 华南师范大学 现代远程教育研究所,广东广州 510631;2 查尔斯特大学 计算机与数学学院,新南威尔士州奥尔伯里 2640,澳大利亚)
一、引 言
在数据密集型科学研究范式(祝智庭等,2013)的背景下,在线学习研究着重关注学习过程,包括学习过程的全数据感知、学习行为与路径分析建模、动态过程监控与管理(穆肃等,2018)。在线学习路径的生成与导航是个性化学习的必备要素(EDUCAUSE,2014),也是智慧教育系统关键技术之一(钟绍春,2019)。学习路径是学习者学习过程中选择的一系列概念和活动的序列集合(牟智佳,2016)。有效的学习路径有利于解决“学习迷航”“认知负荷过载”等问题,进而改善在线学习成效和体验。近年来,学习路径研究逐渐成为教育技术研究新的重要生长点(兰国帅,2017),亟需系统梳理学习路径研究的关注点、发展脉络和未来走向等,清晰了解其整体研究状况,以便支持基于学习数据和人工智能技术的智能化学习分析与预测、教育知识图谱生成、学习过程监控与管理等研究与实践。
本研究采用定量和定性分析结合方法梳理学习路径国内外研究现状,定量分析文献的关键词,展示学习路径研究整体状况,定性分析梳理文献核心内容,聚焦四个问题:学习路径是什么,具体研究了什么,发展特点有哪些,未来方向有哪些。
二、文献选取及过程
表一 中英文文献检索规则及结果
表二 近五年高频关键词汇总(前30)
研究分别以“学习路径”和“learning path”为关键词在中英文权威数据库检索文献。中文文献源于CSSCI期刊、北大核心、CNKI硕博士论文、专利和会议论文库;以关键词、篇名或摘要含有“学习路径”为规则进行检索。英文文献源于SCI、SSCI、ESCI、A&HCI、CPCI收录期刊及会议;以关键词、拓展关键词、篇名、摘要中含有“learning path”为规则检索论文。检索时间为2019年12月9日,文献发表时间跨度为2014年至2019年(近五年),共检索到中文论文391篇和英文论文637篇。因文献作者对学习路径的理解和界定不尽相同,初次检索所得文献包含与本文相关度不高的文献,如机器人行走路线的学习路径,为此本研究对初次检索得到的文献进行二次筛选。研究者通读所有文献摘要,人工判断该文献内容与“基于数据的在线学习路径”研究主题的相关度,利用中文文献分析工具E-Study和英文文献分析工具EndNote,从“内容相关、引用率高、专业权威期刊”三方面进行相关度判定并赋值,形成六个等级的相关度,分别以数值5到0标记,最高相关度标记为5,最低标记为0,3表示有相关度。本研究选取相关度得分大于等于3的文献进行分析,其中中文文献324篇、英文255篇(见表一)。
关键词反映了文献的核心内容,高频关键词在一定程度上代表了某一领域较受关注的研究内容。本研究对选取的中英文文献的关键词进行量化分析,得出频次前30的高频关键词(见表二)。选取出现频次为3及以上的关键词生成高频关键词共现网络(见图1、图2)。共现网络的节点大小代表网络的中心度,展示领域研究内容的聚焦点。
关键词量化数据显示,相关研究以学习路径为中心,与个性化学习、自适应学习、教育大数据、学习分析、教育数据挖掘、在线学习、智慧学习、知识图谱、人工智能等研究关系紧密。学习路径规划(如个性化路径生成)、学习路径可视化(如学习路径图)、学习路径生成智能算法(如蚁群算法、遗传算法、机器学习)、学习路径系统构建(如个性化学习系统、适应性学习系统)是研究者的关注热点。大量关于学习情境感知模型、知识地图构建、学习者特征模型(如学习风格)、学习资源推荐等的研究为学习路径的要素构成、生成算法、系统应用提供了支持。
图1 近五年中文高频关键词共现网络图(频次3及以上)
图2 近五年英文高频关键词共现网络图(频次3及以上)
三、概念界定
明确界定学习路径对文献分析至关重要。学习路径研究分布在多个领域,如教学设计、学习科学、学习分析等。教学设计研究者倾向于将教学设计流程的可视化表达称为学习路径(赵琳等,2017),此种理解多出自教学设计实践层面的研究,缺少抽象分析、量化表达,无法为基于数据的学习路径智能分析提供支持。从学习分析角度出发,部分研究者将可量化信息节点的组织序列称为学习路径(曹良亮,2014),特点是易于实现基于数据的呈现和分析。因此,学习路径研究近年从以教学设计为主导的流程设计逐步转到以个性化学习为主导,以学习数据为基础,以学习分析为目标,以智能分析技术为支撑的在线学习路径研究。本文的学习路径指基于数据的学习路径,相关分析也依此展开。
表三 以学习内容为节点的学习路径描述
(一)概念内涵
借鉴“图论”思想(Durand et al.,2013),学习路径被抽象化理解成学习节点的组织序列及在此基础上的数学建模(见图3)。构成学习路径的要素有路径节点和节点间的关系。学习路径包括路径起点、路径过程和路径终点,分别表示学习过程的开始、学习进行中与学习结束。路径节点是学习路径最基本的构成要素,是学习者达成学习目标所发生学习事件的最小单元,包含一系列学习信息,如知识点(Vanitha et al.,2019)。节点之间存在一种或多种关联进而形成关系体系,如序列关系、包含关系。学习路径形成的影响因素有知识特征、学习者特征和环境特征等(黄志芳等,2015)。
图3 学习路径构成要素
(二)学习路径节点的分类
1.以学习内容为学习路径节点
此类研究关注“学习者学什么”,学习路径的节点为学习内容,学习路径为知识序列、概念序列或学习资源序列(见表三)。根据教育学原理,知识之间存在序列、从属等关系,形成知识地图(Zhu et al.,2018)。知识地图是以知识点为基本单位对学习内容进行的结构化表征(黄荣怀等,2012),能够展示知识整体结构,有知识定位、学习导航(李士平等,2016)等作用。如何构建科学合理的知识地图,如何根据学生知识掌握情况重构个性化知识地图是此类研究的重点。
表四 以学习行为为节点的学习路径描述
2.以学习行为为学习路径节点
该类研究关注“学习者怎么学”,学习路径节点为“学习行为”,学习路径为学习行为序列(见表四)。学习行为序列体现学习过程的动态特征,挖掘隐藏在行为数据背后的规律,能帮助教学双方深度理解学习过程与结果。学习行为节点建模是此类研究的关键,如何确定待分析的学习行为,用哪些数据量化表征这些行为尤为重要(乐惠骁等,2019)。
学习行为分登陆、浏览和点击等操作性学习行为(李爽等,2017)和具有学习活动属性的学习行为。具有学习活动属性的学习行为指有教学理论支持、系统化的学习行为。如根据古娜瓦德娜(Gunawardena)知识建构分析框架将知识建构过程的学习行为分为分享、比较、讨论主题信息,发现和探索观点间的不一致,进行意义协商和协同知识建构,测试和修订协同建构的知识,应用新建构的知识和与协同翻译活动无关的行为(杨现民等,2016)。不同学习活动的行为体系不同(首新等,2018;郑兰琴等,2017;冷静等,2019)。
由于学习内容和学习行为的不可割裂性,单纯考虑某一方面都会导致学习过程分析的片面性。所以,有研究者同时考虑学习内容和学习行为这两方面信息进行学习路径分析。如姜强等(2018)提出学习路径包括学习活动和学习对象。赵蔚等(2018)、罗梅罗等(Romero et al.,2018)提出学习路径是学习内容和学习活动序列。学习路径节点信息的多维性有助于学习过程分析的完整性,但信息点的简单混合不能真正解决分析的片面性问题,需考虑多类信息的融合处理。师亚飞等(2019)提出的“学习画像模型”,包含学习元序列和学习元时间序列,用于描绘学习的发生、发展过程。这种多维信息系统整合建模保证了多维性和系统性,是学习路径节点建模的可行方向。
四、核心内容
学习路径研究主要关注三方面内容(见图4):学习路径是什么,即学习路径节点及其相互关系的确定;学习路径的走向如何确定,如学习路径合理规划;学习路径有无一般或特殊模式,如学习路径模式发现。路径规划利用已有数据对未来路径进行最优规划,包括基于知识特征、学习者特征和情境特征生成最优学习路径,重在智能适应。路径发现关注发现已有学习路径数据的规律,包括发现普遍学习路径和发现最优学习路径,突出群体智能。学习路径研究成果的教学应用主要有个性化学习路径推荐(刘萌等,2016;Dwivedi et al.,2018)、学习干预、学习预测等(刘三女牙,2016)。
(一)学习路径规划(节点排序)
学习路径规划指合理安排学习路径各节点的学习顺序,为学习者找到最优学习路径。此类研究多将学习内容作为路径节点,通过优化算法为学生找到知识网络的最优路线。其首要任务是确定何为“最优”,需考虑知识特征和学习者特征因素(Liu et al.,2019)。知识特征包括知识点内容、知识点性质,如学习难度、知识点关系(李士平等,2016)、知识点对应资源特征等(李浩君等,2019)。学习者特征包括个人信息、学习需求、学习风格(Joseph,2017)、学习兴趣(岳俊芳等,2017)、知识掌握程度(李菲茗等,2019)、能力水平(Zhu et al.,2017)、学习体验(王珏等,2017)、情感状态(马相春等,2017)等。
图4 学习路径研究的关键内容
1.基于知识特征的最优学习路径
知识地图包含学习者所有可能产生的路径。知识地图一般由学科教师、领域专家基于对知识结构的理解人工构建而成,也可利用本体技术形式化表征较为复杂且操作性强的知识地图(赵蔚等,2015)。典型案例有物理学科本体构建(赵呈领等,2014)、教育技术课程本体构建(胡海斌等,2017)。有研究者将知识地图看作由知识点构成的有向无环图(Alshalabi et al.,2018),最优学习路径可转化为有向无环图中的最短路径,即学习者以最少的精力完成所有知识点的学习。常用算法有适用于单源点最短学习路径问题的迪杰斯特拉算法、最短路径快速算法(Shortest Path Faster Algorithm)以及适用于多源点最短学习路径的弗洛伊德算法。节点之间的关系(如知识难度、知识中心度)、关系权重的确定是这类研究的关键。权重值可由专家确定,也可通过马尔可夫链等方法确定(李孟等,2014)。
2.增加学习者特征的最优学习路径
增加学习者特征可增强学习路径的可选择性、可变更性。为弥补基于知识的最优学习路径的不足,研究者提出符合学习者特征的个性化学习路径才是最优学习路径。从知识掌握的角度看,最符合学习者知识掌握水平的路径即为最优路径。研究者通常先以知识特征确定初始的最优学习路径,再根据学习者对知识点掌握情况的动态变化形成个性化学习路径。学习者知识掌握程度判断的依据和方法是这类研究的关键,学生答题情况是知识掌握水平常见的判断依据,知识掌握水平判断方法可由人工或智能算法确定(Supic,2018)。从学习风格角度看,最符合学习者学习风格的路径即为最优路径。如何合理匹配知识特征和学习风格进而找到最符合学生个人情况的学习路径是难点。挖掘相同学习风格学生群体的普遍学习路径是个性化学习路径生成的可行方法之一(姜强等,2018)。学习者的知识水平、学习风格是研究较多的个性化学习特征(Dwivedi et al.,2018),学习需求、学习兴趣等也被研究者列为最优学习路径的影响因素,但大多未被作为独立影响因素单独深入研究,更多的是列入学习者特征信息作为整体综合分析(Kamsa et al.,2018)。
(二)学习路径发现(序列发现)
学习路径发现指通过已有的学习过程数据,发现个人或群体未直接表现出来的学习路径模式。这类研究多将学习行为作为路径节点,发现个体或群体学习规律(李维娜等,2017),如发现学习者个人经常访问的知识点序列可以支持学生认知特点分析。群体学习路径可为学习者群体提供高效的学习路径参考(De,2016;唐烨伟等,2019)。学习行为的选择直接关系学习路径价值发现的准确性(Hayashi et al.,2018)。学习行为选择方式分四种(见表五)。现有学习行为的选取和量化表征没有统一的理论基础和编码标准,部分研究行为编码的可信度不高,缺乏系统性和科学性,导致最终学习路径分析结果的可信度降低(武法提等,2018)。
表五 学习行为选择方式对比
1.普遍学习路径发现
普遍学习路径指在学习路径群中具有共现、序列等群体特征的路径。滞后序列分析(Bakeman et al.,1997)可以帮助教师准确把握学习者潜在的行为模式(胡振凡,2016;刘智等,2017),如大学生协同翻译活动的知识建构行为模式发现(Yang et al.,2015)。序列模式挖掘通过现有序列找到有共现特征的频繁序列集,可用于发现具有共现特征的学习路径。林布锴(2017)以阅读行为为基础挖掘成功学习者的普遍学习路径。此类研究的发展方向有影响因素的综合考虑(张晓滨等,2016)、算法的改进(徐启寒等,2018)。关注过程状态变化的马尔可夫链(Taraghi et al.,2014)也是常用的算法。张茜(2018)用隐马尔可夫模型挖掘在线学习行为规律,理解学生学习过程,也有研究者用隐马尔科夫链挖掘MOOC的关键学习行为转换模式,进而分析学习持续度(Davis et al.,2016)。基于过程交互模式分析的流程挖掘方法(van et al., 2015)也用于学习行为模式分析。有研究者利用流程挖掘方法分析学生自我调节学习过程中的交互行为,挖掘交互行为模式(Maldonado et al.,2018)。
2.最优学习路径发现
群体中的最优学习路径属于群体最优解问题(赵呈领等,2015),体现了群体智能(Xie,2017)。蚁群算法是一种基于种群寻找最短路径的启发式搜索算法,属于蚁群觅食最短路径问题(赵铮等,2016),重要参数有启发信息和信息素。启发信息可来自学习风格、学习状态(赵琴等,2018)等学习者特征(刘新新等,2018)。粒子群算法是模拟鸟群觅食的一种基于迭代的优化算法,属于鸟群觅食最短路径问题(吴雷等,2016),重要参数有粒子和适应度。例如,粒子为学习资源,适应度为资源与目标知识点的相关度,通过学习难度和学习投入等影响因素更新粒子找到最短路径。多维信息特征映射的粒子更新影响因素是该算法改进的方向之一。遗传算法是一种随机搜索启发式算法,属于遗传优化最优解问题,重要参数有适应性函数、交叉概率、变异概率。它通过环境因素和学习者个性化特征产生学习对象染色体(Jung,2019),经过一系列的选择、交叉、序列突变、长度变异,生成新的学习路径集合,并进行适应度评估,获取最优学习路径(李浩君,2016)。
五、发展趋势
(一)学习路径由预设的、静态的转变到生成的、动态的
根据以上分析可知,已有的知识地图导航路径多为预设的静态路径。在考虑综合情境特征后,学习路径常由教师、知识、学习者和环境共同决定,此时的学习路径具有不可预知性,在学习过程中动态生成,没有固定的路径适合所有学习者(Lin et al.,2013)。知识体系更新、学习风格转变等影响因素动态变化,学习路径随之动态更新。所以,个性化动态学习路径的模型构建、算法优化和系统开发是研究者的关注重点。近年来,有学者强调教育需求设计(陈佳琳等,2019),提出个性化不能只强调技术和算法,应回归教育,更多考虑教与学的实际需求。如何将先进的学习路径生成技术并将其应用到解决复杂多变的教学实际是每位研究者应该思考的问题。
(二)用于学习路径分析的数据由单一维度转向多维度整合
学习路径研究最普遍的数据来源是在线学习平台中直接可得的外显数据和需从底层数据挖掘而得的内隐数据(祝智庭等,2012)。如何利用数据标准接口(如xAPI)进行在线学习路径分析是重点(顾小清等,2014)。人工智能时代更关注学习发生的全过程输出(郭炯等,2019),单维度的在线学习数据虽量大且易得,却不能真实反映学习者的认知心理过程。近年来,在教育神经科学、脑科学、学习科学等融合背景下,在线学习过程的多维信息整合分析逐步得到重视(李浩君等,2019),基于多维度数据考量学习行为(牟智佳,2016)及心理特征已成为教育技术研究的趋势(陈凯泉等,2017)。通过数据挖掘技术析取学情与行为数据,使过程性学习行为考察和个性化发展支持成为可能。已有研究有:眼动数据支持的在线学习路径分析(穆肃等,2019)、深度学习(刘哲雨等,2018)、学习情感(薛耀锋等,2018)、学习情绪(Ma et al.,2018)、学习兴趣(陈靓影等,2018)、在线学习过程监控(许陵等,2014)等。多维度数据整合分析的创新价值可观,是在线学习分析的重要趋势(穆肃等,2019)。
(三)实现学习路径应用的技术方法趋向于人工和机器结合
学习路径影响因素判定,建模参数确定,算法和系统实现可由人工或者机器完成。传统的研究较多采用人工方式,智能技术支持的智慧学习时代更强调机器自动化实现(钟绍春,2019),利用多重智能算法实现学习路径的高效精确生成与应用。例如,学习风格是学习路径的重要影响因素,传统的学习风格识别大多用人工编写的量表测量,方法单一、主观性强、难以考虑学习的过程性因素等,从而导致测量结果不可靠。智能技术应用下,有研究者提出基于海量的在线学习过程数据,利用神经网络技术智能推测学习者的学习风格并验证了有效性(Rasheed et al.,2019)。人工方式的优势在于教育领域专家理论的权威性,机器数据分析的优势在于大规模、自动化(刘三女牙,2016)。整合和利用人工和机器分析,多学科融合,多样化方法优势互补,是学习路径研究高质量开展的保证。
六、未来展望
近年来,学习路径的研究保持增长态势,主要关注学习路径研究思路的发展、算法优化和技术升级。本文对选取文献的关键词进行聚类,形成时间趋势图(见图5、图6)。其中,颜色分布代表内容聚类,颜色深浅代表时间趋势,颜色越浅代表该内容越新。数据显示,“学习过程”“学习行为”“个性化”“综合情境”“可视化”等研究有增多的趋势。当下对学习路径的研究呈现多维信息特征映射的教育知识图谱构建,综合情境感知的个性化学习路径生成,基于学习行为且体现群体智能的学习路径发现,多维度数据支持的在线学习路径可视化四个方向。
(一)多维信息特征映射的教育知识图谱重构
人工智能时代的教育知识图谱以知识元为节点,根据其多维语义关系进行关联,在知识层面和认知层面上表示学科领域知识和学习者认知状态,可用于知识导航、认知诊断、资源聚合、路径推荐的知识组织与认知表征工具(李振等,2019)。教育知识图谱是知识地图的升级,为学习路径的生成提供更多有价值的参考信息。目前,教育知识图谱构建的难点有:知识图谱的知识粒度仍需细化;需利用多维信息对知识特征进行全面建模;学生认知状态变化对知识图谱结构的动态影响;教育知识图谱构建及应用技术的智能化。
(二)面向学习过程综合情境感知的个性化学习路径生成
关注学习过程,综合考虑学习路径各方面的影响因素,进而提高个性化的准确性是学习路径研究的重要方向(Zhou et al.,2018)。未来,学习路径的节点应为一个综合信息包,包含学习过程各类情境信息,为学习过程分析提供支持(穆肃等,2019)。多维度信息的综合考虑在带来最优路径准确性的同时,也带来了研究难度的提升,研究者需在理念和算法上有所突破,所以此类研究目前大多数仍处在理论和方法探讨阶段,实质性的研究成果较少。其难点在于学习过程中综合情境信息的感知、提取与系统整合;个性化学习路径智能生成技术的实现。
(三)基于学习行为且体现群体智能的学习路径发现
群体智能概念来自对自然界中生物群体行为规律的观察,表示非智能群体通过简单合作表现出的智能行为的特征(Wong et al.,2012)。群体具有自组织性,它的控制是分布式的,群体智能不是简单的、多个体的集合,而是超越个体行为的更高级的群体智慧体现。从个体行为到群体行为的演变过程往往较为复杂,难以预测,但具有重要研究价值。在大数据时代,在线学习群体产生大量学习行为数据,学生群体学习行为是否也具有群体智能表现,如何借助智能算法挖掘群体智能规律是研究的新方向(穆肃等,2019),难点在于基于学习行为的学习路径建模和群体智能发现算法的构建与实现。
图5 近三年中文高频关键词聚类时间趋势
图6 近三年英文高频关键词聚类时间趋势
(四)多维度数据支持的在线学习路径可视化
持续记录学习路径的多维属性数据并将其可视化,形成直观、完整和可回放的学习路径图(Xia et al.,2019),能够加深学习者的自我认识,培养学习者的自控能力,也能够帮助教师发现学习者的学习模式,预测他们的学业表现和风险。已有研究表明,学习路径的直观呈现有助于培养学生的自我效能感(姜强等,2019)。可视化技术的优劣直接影响可视化系统的教学实践应用,如何突破可视化技术瓶颈,实现自动、高效的在线学习路径直观呈现,是此类研究的关键。