数智赋能下的学习分析:国际焦点与前瞻
2024-01-01王炜赵帅
摘 要:第十二届学习分析与知识国际会议(LAK)作为学习分析领域最具影响力的知识平台,是探索该领域国际焦点与前瞻的抓手。研究采用LDA主题模型、社会网络及引文回溯等语义挖掘方式对LAK22收录文献进行评述与分析,发现学习分析在多模态学习数据挖掘、学习者精准学业预测、学习动态监控与反馈、个性化教学干预决策、安全与道德伦理保障等方面的研究焦点及其在理论、应用与技术层面的前瞻动向。这启示我们,未来学习分析研究应关注涵盖安全伦理道德的学习分析理论建设、关注各类传感器在多模态数据挖掘中的应用、关注自我调节学习策略在监控反馈中的应用、关注情感算法在学业精准预测中的技术开发、关注符合脑认知学的干预决策系统技术开发。
关键词:学习分析与知识国际会议;学习分析;多模态数据挖掘;学业预测:教学干预;教育公平与伦理
中图分类号:G4 文献标志码:A 文章编号:2096-0069(2024)03-0085-08
引言
作为促进教与学发展的关键技术,学习分析一直是学界关注的热点议题之一。学习分析研究学会(Society for Learing Analytics Research,简称 SoLAR)组织的学习分析与知识国际会议LAK(International Conference on Learning Analytics amp; Knowledge,简称LAK)作为专门面向学习分析研究的国际性顶级学术会议[1],汇聚和展示了学习分析领域最具权威的学术观点,是学习分析领域前沿与动态的方向标。第十二届学习分析与知识国际会议(LAK22)于2022年3月21日至25日在线举行,主题为“学习分析以促进转型、突破和社会革新(Learning Analytics for Transition, Disruption and Social Change)”。来自教育技术学、社会学、计算机科学、数据学科等领域的专家、学者、行政领导以及相关从业人员,共同交流和研讨。LAK22共接受长论文39篇、短论文23篇。对LAK22收录的论文进行研究分析,能够析出当前学习分析的研究热点,有利于厘清学习分析研究的发展脉络,展望学习分析研究的未来趋向。
一、研究过程与结果
(一)分析框架设计
本研究选定第十二届学习分析与知识国际会议所收录的全部62篇论文为分析对象,以Python、UCINET为研究工具,通过对论文正文、关键词及参考文献开展LDA主题建模、社会网络和引文回溯分析,力求析出数智赋能下的学习分析领域的国际焦点,厘清研究的前瞻动向,以期构建学习分析领域的研究热点结构和学习分析研究发展框架,并对学习分析研究的发展提出关切与展望。研究路线与分析框架如图1(见下页)所示。
(二)LDA主题模型
以LAK22收录的62篇文章正文为样本,利用Python,将全部文本数据转化为小写英文;并对每个字符进行英文判断,去除非英文的数据;对处理结果进行按照空格切分,得到切词后数据。然后,使用Gensim构建词典语料库,使用LDA模型对数据进行训练,将文本数据划分为3~10个主题;通过结果主题效果归类判断,选择最优主题聚类数为5,生成LDA结果。
表1展示了每个主题中所辖的典型文本及其权重。主题1主要围绕多模态学习数据挖掘与分析展开,包含学习者的社会交互情况、发帖文本、基于传感器的生理数据挖掘类型,涵盖了文本、语音分析等数据处理方式。主题2中主要用于预测学习者学业表现的学习者建模以及算法训练,足见精准化用户学业走向预测是当前国际学习分析领域的视角之一。主题3指向学习动态监控与反馈,主要体现在学习分析仪表盘、自动化、可视化等呈现方式。主题4聚焦学习分析中的个性化教学干预与数智决策,包含学业预警等介入方式,也包含智能教学系统等数智决策形态。主题5关注学习分析中的伦理道德与隐私安全问题,包含用户隐私、规则保障等关键词。5个主题聚类分别代表学习分析的5大国际焦点:多模态学习数据挖掘、学习者精准学业预测、学习动态监控与反馈、个性化教学干预决策、安全与道德伦理保障。
(三)社会网络分析
样本选定大会收录论文的62组关键词,利用Ucinet 6.0与NetDraw开展可视化关键词共现网络结构和中心性计算研究。
1. 共现网络分析
从LAK22高频关键词共现网络结构可以看出,核心关键词的网络结构与本届大会的主题“学习分析以促进转型、突破和社会革新”紧密相关,“学习分析”一词处于网络中心位置,为研究的核心内容,体现了LAK22的办会宗旨。环绕学习分析,呈现出多模态学习分析、计算机支持的协作学习、伦理、教育数据挖掘以及高等教育等主题,表示学习分析与协作学习、数据挖掘、高等教育、安全伦理等方面显著关联。同时,自动反馈、机器学习、自然语言处理等话题也在网络中占据重要地位,可见当前数据科学、信息技术和智能技术在一定程度上延展了学习分析的内涵,推动了学习分析技术的转型发展。另外,人工智能技术和多模态数据挖掘与分析技术作为LAK22的重点研究视角,是新时代学习形态向数智化转型发展的重要契机。此外,公平伦理等核心关键词暗示了学习分析技术的发展与数据安全伦理问题间的平衡关系及同步探索。
2. 中心性计算
在网络节点中心度数值计算部分,据表2所示,学习分析、高等教育、伦理等关键词在高频关键词共现网络中有较高的度数中心性,处于较重要的地位,为学习分析领域的发展提供了较多的知识溢出。在线学习、讨论板、多模态学习分析等关键词在高频关键词共现网络中有较大的中间中心度,这些关键词更有可能在网络中扮演“枢纽”与“过渡”的角色;计算机支持的协作学习、伦理、机器学习、混合式学习、自动反馈、自然语言处理等,在高频关键词共现网络中有较小的接近中心性,表示后续发展的前景开阔,这些关键词更有可能成为学习分析的发展前沿。
(四)引文回溯分析
在引文回溯分析环节,选用LAK22收录的62篇论文中的2587条参考文献为研究样本,按其发表时间,从首届LAK22举办时间2011年开始,以每3年为1个时间切片进行划分,形成4个时序集合,并对每个时序集合内的引文题目进行词频分析,通过对比不同年份词频的变化特征,揭示学习分析领域研究视角的演变,以此推演学习分析研究的发展规律与前瞻动向。对比发现,“学习分析”占主体,且体量趋于平稳,表明各阶段的引文都将学习分析标记为中心议题。理论层面,“技术”“数据”标签的体量渐趋减小,“公平”“体系”标签的比重逐步提高,这表明学习分析领域的关注点正逐步从“技术本位”向“教育本真”转变。应用层面,“协作学习”的体量逐步增加,这表明学习分析的应用越来越关注对学习者协作交互情况的分析,体现了学习分析与计算机支持协作学习两大研究方向的渐进与融合;且“教室”等关键词弱化,“在线”“虚拟”等关键词体量增加,这体现了学习分析的应用正从现实场景向虚实融合学习场景迈进。技术层面,“反馈”“仪表盘”等关键词亦逐步弱化,“自动化”“支持”等核心词凸显,这表明学习分析研究维度正从描述性、诊断性功能向支持教育数智化预测与干预升级。
二、数智赋能下学习分析领域的国际焦点
依据2022年学习分析与知识国际会议收录文献的LAK22主题模型及其文献关键词的共现情况分析,本研究构建了数智赋能时代学习分析领域的研究视角结构分布图(如图2所示)。其中,数据挖掘、学业预测、监控反馈、教学干预共同构成了学习分析的运转闭环,伦理安全作为重点研究视角渗透在学习分析的各个环节。
(一)多模态学习数据挖掘
在数智时代,多模态数据广泛而海量存在。如何依托多模态数据间的互补学习来发现隐藏在数据背后的巨大价值,是现阶段数据科学研究的主要议题。数据互补与融合分析是多模态数据挖掘与分析的重要手段之一。学习分析的数据输入变量从学业成绩、学生的教育记录、人口统计数据逐渐扩大到在线讨论内容、自我报告、在线学习行为,如登录的频率、访问内容的持续时间和发布的评论的数量,甚至包含对语篇分析、脑电波、移动点轨迹、面部表情、情感信息等数据的采集。例如,卡鲁巴亚(Karumbaiah )等[2]对虚拟学习环境中学生情感状态与学业成绩关系的实证研究进行了系统回顾,提出自动情感探测设备和学生情绪状态自我报告在虚拟学习环境设计中具有重要作用。
(二)学习者精准学业预测
在学习预测层面,不断提升算法模型预测的准确率是学习分析当前的研究热点之一。人工智能技术在学业预测领域的核心是算法,数据与算力是基础。目前越来越多的学者建议运用最少的数据量,开发和训练相对先进的算法,如集成方法、深度学习算法、使用经验贝叶斯的方法、因果模型等,在体现出良好的预测能力同时,实现数据的简约性。这样既能提升算力效率,也有益于数据安全。集成化的预测模型与绩效归因分析模型也成为关注焦点之一,温克(Vinker)等[3]设计出融合学习分析、数据挖掘、机器学习等要素的信息技术智能MOOC教学系统,该教学系统表现出更准确的学业预警性能,能够预测学生辍学的风险,甄别出高辍学风险的学生。
(三)学习动态监控与反馈
现有研究已证实形成性协作反馈在促进协同和提升学业成效方面具有积极效用,学习分析仪表盘作为监控与反馈工具,其动态化、可视性化与无痕化的特性设计是该方向的研究焦点。基于问题驱动的学习分析仪表盘,可将学习者的学习行为与知识轨迹可视化,以更加直观地展示更为丰富的信息,帮助学生理解复杂的信息,增强其学习动机,提高其对复杂概念的认知,使其更充分地了解自身学习的变化情况。无痕化反馈则主张将反馈机制嵌入课程内容所在的智慧学习环境。例如,超级学习分析仪表盘将学业进程反馈内嵌于学业内容,在支持学习者交互的同时,弱化了学习分析干预对学生注意力的影响。
(四)个性化教学干预决策
当前,智能教学系统与自适应学习系统逐渐成为学习分析应用的主流。智能系统依据用户情况,自动向学习者发送注意力提醒,推荐学习资源,甚至提供学法指导。塞赫里什(Swiecki)等[4]通过网络分析和统计测试方法,发现了学习共同体的认知发展与其言语行为之间的重要关联,并对比了两种不同的教学干预措施对这些关联的影响;张旭东等[5]设计了一种多级跟踪聚类分析方案,用于在在线学习环境中跟踪数据并可视化学生的自我调节学习策略,这些反馈可以促使教师重新思考课程结构的设计,并实施干预措施。学习分析中的教学干预与决策逐渐从人工半自动化向智能全自动化转变,然而,智能学习系统在应用中也暴露出一些问题,如用户的依从性较差、算法评判标准不公平、对学生独立思考机会的削减等。相比之下,自适应学习平台的开发被证实更符合人脑认知的特点,基于学习资源设计的半推荐系统仅给出可能的问题解决方案,为学习者留下自我反思的空间,从而促进学习者的深入思考。
(五)安全与道德伦理保障
伴随科技的发展,数据在带来便利的同时,也带来不确定的伦理风险,包括人工智能是否安全,大数据安全和隐私保护如何来保障,教育是否公平、包容等。防范用户隐私泄露等伦理道德问题是当前学习分析和数据科学研究领域的重要议题之一,斯利巴(Slibar)等[6]对2010年至2021年期间发表的93篇论文进行了定性分析,探讨了学习分析应用与伦理隐私保护之间的关系,明确了在学习分析实施过程中与道德隐私相关的问题及其处置指导方针。数据的收集与使用要有标准、界限和授权,数据存储应给予保护。
三、数智赋能下学习分析领域的前瞻动向
基于关键词接近中心性计算与引文回溯的分析结果,在回溯学习分析研究趋势的基础上,从理论、应用与技术层面归纳数智赋能下学习分析领域的前瞻动向。
(一)理论层面:注重数据安全以及伦理道德等教育公平视角
防范人工智能算法歧视、保障人人享有公平的信息化教育机会以及隐私保护和数据安全,成为本届学习分析与知识国际会议重点关注的热点主题之一。教育公平是学习分析理论模型开发时需要考量的重要维度,包括剔除可能存在不公风险的数据类目收集与分析,使机器学习算法更好地服务于高等教育。例如,李成璐等[7]探索出一种创新性学伴推荐者算法,通过在现有的网络嵌入模型基础上提出公平网络嵌入,为在线学习者提供公平和准确的信息,确保学伴推荐引擎不会出现性别、族裔等歧视,以支持在线学习者网络的知识探究。研究结果还表明,在学习分析中构建公平感知模型对于解决数据中的潜在偏差和创建值得信赖的学习分析系统至关重要。
(二)应用层面:注重数据挖掘与监控反馈对协作学习的促进
如何提升用户的交互协作水平以支持学习者的社会知识建构,是学习分析领域的主要研究议题之一。协作学习研究主题主要关注学习分析技术为计算机支持的协作学习提供的环境支持,聚焦在学生小组交互中学习分析技术的协作数据采集与反馈。在分布式的协作学习情境中,自动文本分析和语篇分析对在线协作讨论文本的研究,可用于小组协同探讨的交流专注于主题一致性和语义多样性的研究;采用聚类分析技术,则可发现在线讨论中学习者所扮演的新兴角色和脚本角色在社会和认知维度的相似性和差异性;认知网络分析能协助可视化协作过程中社会知识的发展轨迹,为计算机支持的协作学习的教学实践和技术发展提供参考。
在集中式的协作场景中,挖掘学习者协作学习过程中的言语对话、面部行为、空间和音频等数据,通过定位提取和语音检测,捕捉用户的非语言事件,构建多模态学习分析数据模型,包括语言模态中的语义信息和发言人信息、音频模态中的发言人音调变化以及视频模态中的发言人面部肌肉运动、行动轨迹、身体朝向等数据,分析判断学习者的学习意图和表现,进而为计算机支持的协作学习提供实时的自适应支持。例如,埃尔坎(Elkan)等[8]基于语义分析的协作同伴反馈理论,将同伴反馈作为提升同伴协作活动的支架,并证实其能够有效提升学习者互动水平。
(三)技术层面:注重人工智能与个性化学习系统的设计开发
人工智能与学习分析应用融合研究是最多产的话题之一。人工智能技术加成主要体现在智慧算法推荐和个性化的学习支持,注重对人的非认知能力的培养,如批判性思维、问题解决能力、自我效能感、元认知等高阶能力。自然语言处理与自适应反馈作为人工智能在作业自动评估与分析方面的重要技术支持,是本届大会的重要关注点之一。费雷拉·梅洛(Ferreira Mello)等[9]探讨了一种文本自动校正工具在作文课堂上的有效性,结果发现获得纠正性反馈是提高学习者语言技能的方法之一;但通过对比教师的作文批改,发现该工具的准确性有待提高。这说明技术固然提高了教学效率,但人类的教学活动并不能为机器所完全取代。
四、研究启示
本研究基于当前学习分析领域的5个国际焦点与学习分析在理论、应用与技术层面的前瞻趋向,构建学习分析研究的发展趋向框架,发现学习分析领域的发展呈现出学习数据挖掘多模态化、学习者学习表现预测精准化、监控反馈动态可视及无痕化、教育决策与干预智慧化、数据安全与伦理道德法治化的特点。
这启示我们在未来的学习分析研究应重点关注以下几方面:在理论层面,关注涵盖安全伦理道德的学习分析理论建设;在应用层面,关注各类传感器在多模态数据挖掘中的应用,关注自我调节学习策略在监控反馈中的应用;在技术层面,关注情感算法在学业精准预测中的技术开发、关注符合脑认知学的干预决策系统技术开发。
(一)关注涵盖安全伦理道德的学习分析理论建设
未来学习分析系统在兼顾高度智能化与隐私高度安全化的同时,应进一步完善相关法律政策,提升教育系统网络安全保障能力,加强对学习分析系统开发与运营方的监控,提高面向用户的透明度,包含数据的采集范围、目的等,提高学习者对自我隐私的保护意识,提升用户对学习分析技术的信赖度,保障学习分析活动参与者的知情权、选择权和隐私权。此外,还需要防范人工智能的算法偏见与歧视,进一步弥合数字鸿沟,加快信息无障碍建设,确保每一个家庭的子女享有公平的信息化教育机会。
(二)关注各类传感器在多模态数据挖掘中的应用
针对学习数据挖掘向情感多模态发展的趋势,应开展基于各类感知设备和技术的多模态数据融合算法研究。学习日志、运动数据、网络学习中鼠标点击流已作为数据来源开始被专家学者运用[10]。有些学者提出利用多通道传感器设备,追踪学习者的情绪灵活性、情绪适应性和情绪拐点等情感数据,保障学习者在学习过程中的情绪监控与调节。无感传感器的应用与情绪传感器技术的进步,可以使得多模态学习数据挖掘从表情、行为、眼动、手指、生理、语音向学习者的注意过程、情绪过程、行为过程和认知过程延展,从而实现从生理数据到心理数据的升维。有些学者提出实时合并学习阶段数据学习路径图,及时介入,以支持学生自我调节学习,满足学习复杂性的要求。
在多模态数据融合算法方面,由于传感器的种类越来越多、精度越来越高,再加上有多种多样的特征提取方式,因此,充分利用广泛存在的海量多模态数据,攻克多模态学习数据的模态不完整性、学习发生的时效性等难题成为一项紧迫性任务。通过多模态数据融合与互补分析,挖掘学习数据中隐藏的价值,是设计数据融合分析方法面临的严峻挑战。
(三)关注自我调节学习策略在监控反馈中的应用
弱干扰的动态可视化的监控与反馈,通过对学习者的学习起点分析、学习目标设置、学习过程监控及学习结果反馈4个方面的支持,更好地增强学习者对自身的认知评估、学习进度把控,能够提升其批判性思维与元认知能力,促进其自我调节学习。作为在学习分析中监控与反馈的表征工具,学习分析仪表盘的设计亦需包括自我学习评价、学习目标设置、学习过程监控及学习结果反馈4个循环环节。在自我学习评价环节,学习分析仪表盘要能够根据用户先前的表现和结果,展示学习者在某一项学习任务上的现有能力与水平,帮助学习者判断自己的学习效能;在学习目标设置环节,学习分析仪表盘需辅助学习者分析学习任务,设置学习目标,基于学习目标与能力起点设计学习规划与策略;在学习过程监控环节,学习分析仪表盘需动态反馈学习者的任务完成进度、学习策略执行情况、学伴协作交互密度、情感状态等信息,使学习者可以在学习的进程中及时纠偏;在学习结果反馈环节,通过学习分析仪表盘的反馈,学习者对自己使用的每种学习策略的结果进行监控、反思与修正,以确定所选策略的有效性。
(四)关注情感算法在学业精准预测中的技术开发
智慧教育场域、智能移动终端和各种穿戴设备中内嵌感知技术的广泛应用,为近年来情感计算技术的蓬勃发展奠定了数据基础。基于情感计算技术,学习分析系统可以通过学习者的面部表情来识别和判断其学习状态,预测学习者的学业表现。情感计算将智能感知传感器识别到的学习者行为数据标记为各类情感标签,如发言语速较快、声音洪亮可能对应紧张、自信等情绪状态。在标记足够多的情感标签后,情感计算可利用深度学习技术,如卷积神经网络、递归神经网络算法、区域候选优化算法等,通过模型训练与数据积累,逐步形成学习者情感状态的识别模型,最后基于趋势预测算法实现学习分析中学习者学习表现预测的精准化。基于情感计算的精准化学习预测,可以使时空分离的师生在云端了解彼此的心理感受,提高师生交互的质量,改善在线学习环境中因为缺乏传统课堂的氛围而导致的学生厌学情绪。
(五)关注符合脑认知学的干预决策系统技术开发
学习分析需融合人脑科学与认知科学的最新研究成果,纳入促进学习者非认知能力发展的控件,开发出智能学习环境中基于脑认知原理的高级学习模型,通过帮助学生准备个性化的目标课程、自动推荐知识关联的学习资源与自动学伴配对,使学习分析技术促进学习模式的革新。学习分析技术应不断迭代升级,开发出基于人脑与认知科学的个性化学习系统,实现向支持智慧教育的方向迈进。
数智技术的跨领域深度融合与发展,正在催化学习变革、驱动社会转型。数智技术的赋能将持续推进学习分析在理论、应用与技术层面的发展与创新,使学习分析技术参与教育数字化转型,实现信息社会学习形态的新突破,促进教育变革与社会革新。
参考文献
[1] 陈雅云,郭胜男,马晓玲,等.数智融合时代学习分析技术的演进、贡献与展望:2021学习分析与知识国际会议(LAK)评述[J].远程教育杂志,2021,39(4):3-15.
[2] KARUMBAIAH S, BAKER R, TAO Y, et al. How does students’ affect in virtual learning relate to their outcomes? A systematic review challenging the positive-negative dichotomy[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 24-33.
[3] VINKER E, RUBINSTEIN A. Mining code submissions to elucidate disengagement in a Computer Science MOOC[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 142-151.
[4] IQBAL S, SWIECKI Z, JOKSIMOVIC S, et al. Uncovering associations between cognitive presence and speech acts: A network-based approach[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 315-325.
[5] ZHANG T, TAUB M, CHEN Z. A multi-level trace clustering analysis scheme for measuring students’self-regulated learning behavior in a mastery-based online learning environment[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 197-207.
[6] SLIBAR B, GUSIC MUNDJAR J, RAKO S, et al. Co-occurrence patterns of issues and guidelines related to ethics and privacy of learning analytics in higher education:literature review[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 577-582.
[7] LI C, XING W, LEITE W L. Do gender and race matter? Supporting help-seeking with fair peer recommenders in an online algebra learning platform[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 432-437.
[8] ER E, VILLA-TORRANO C, DIMITRIADIS Y, et al. Theory-based learning analytics to explore student engagement patterns in a peer review activity[C]//LAK21: 11th International Learning Analytics and Knowledge Conference,2021: 196-206.
[9] FERREIRA M R, FIORENTINO G, OLIVEIRA H, et al. Towards automated content analysis of rhetorical structure of written essays using sequential content-independent features in portuguese[C]//LAK22: 12th International Learning Analytics and Knowledge Conference,2022: 404-414.
[10] 陈羽洁,张义兵.国际学习分析研究新趋势[J].数字教育,2018,4(4):11-16.
(责任编辑 李强)
International Focus and Prospect on Learning Analytics Empowered by Digital Intelligence
Wang Wei1, Zhao Shuai2
(1. Institute of Educational Digitization, Guangdong University of Education, Guangzhou, Guangdong, China 510303;
2. College of Elementary Education, Ludong University, Yantai, Shandong, China 264000)
Abstract: As the most influential knowledge platform in the field of learning analytics, the LAK22 is a catch-all for exploring the international focus and foresight in the field. Using semantic mining methods such as LDA, SDA and citation backtracking to analyze the literature included in LAK22, it is found that learning analytics research focuses on multimodal learning data mining, learner’s accurate academic prediction, learning dynamics monitoring and feedback, personalized instructional intervention decision-making, safety and moral and ethical safeguards, and its prospects in theory, application and technology. Based on this, many suggestions are proposed, such as paying attention to the theoretical construction of learning analytics covering safety and ethics, the application of various types of sensors in multimodal data mining, the application of self-regulated learning strategies in monitoring and feedback, the technological development of affective algorithms in accurate academic prediction, and the technological development of intervention and decision-making systems in line with brain cognition, so as to provide reference to the development of the field of learning analytics in China.
Key words: "LAK; Learning analytics; Multimodal data mining; Academic prediction: instructional interventions; Educational equity and ethics
收稿日期:2023-03-05
基金项目:国家社科基金“十四五”规划2022年度教育学一般课题“数据驱动下教师智能教育素养提升路径与机制研究”(BCA220207);2024年度广东省哲学社会科学规划一般项目“教育数字化转型下人工智能赋能基础教育的研究”(GD24CJY13);2023年度广东省新师范建设助推基础教育高质量发展研究与实践项目“人工智能背景下教师队伍建设研究与实践”;广东省社科联研究基地“粤港澳大湾区教育数字化发展研究中心”资助
作者简介:王炜(1968 — ),男,辽宁锦州人,博士,院长、教授、博士生导师,研究方向为计算机支持的协作学习、大数据与学习分析;赵帅(1991— ),男,黑龙江佳木斯人,博士,讲师,研究方向为计算机支持的协作学习、学习分析。