基于CiteSpace的学习分析热点与发展趋势的研究
2021-09-08李春英李琨
李春英,李琨
(北京开放大学北开业务部,北京 100081)
学习分析作为教育技术领域的一项新技术,自2011年《地平线报告》发表之后,始终受到教育领域学者的密切关注。 目前学习分析的概念尚未形成定论,研究者们从不同的角度来解释学习分析的内涵。首届“学习分析与知识”国际会议正式提出:“学习分析是对学习者及其学习情况的数据进行测量、收集、分析和报告,从而了解和优化学习过程及其环境。”[1]国内顾小清等学者认为学习分析技术是收集与学习者相关的学习数据, 利用不同的数据分析方法和模型进行数据解释,用分析结果解释学习者的学习过程和情境,从中获知一定的学习规律,也可将结果反馈给学习者,为其提供学习帮助[2]。 在传统教学中,由于手工搜集和数据处理技术的限制,教师对教学过程的分析和评价结果往往是无穷无尽的。 随着教育信息技术的更新迭代和在线学习用户的增多,人们可以用更便捷的技术软件或工具进行多维度、多层次的数据采集,这为学习分析的发展提供了更有力的技术支持。 该文通过文献计量分析,了解学习分析的现状、研究热点和趋势,为以后的研究提供依据。
1 研究方法及数据来源
1.1 研究方法
文献计量分析是常用的学术文献研究方法之一, 实现相关领域文献的定量分析是其主要特点。CiteSpace 是美国德雷克塞尔大学陈超美教授研发的一种文献计量分析工具。 该文利用CiteSpace5.1.3R3 对中国知网(CNKI)10年来发表的668篇文献进行可视化分析,并通过关键词共现分析、聚类分析和突出词分析对, 揭示国内学者在学习分析方面的现状、热点和发展趋势。
1.2 数据来源
为了更好地把握“学习分析”研究的发展现状和热点,以中国知识网为研究数据源,期刊检索的检索条件为:关键词“大数据”和“学习分析”。 自2011年学习分析概念被正式提出以来,我们以2012年为研究起点, 涵盖2012—2019年主题=汉英扩展(大数据+学习分析)期刊文献检索,通过检索共获得919篇文献。为确保文献的典型性,通过人工筛选和剔除重复文献、新闻报道、公告等,获得了668 篇有效文章。
1.3 研究过程
对668 篇文献相近关键词和机构进行的合并处理,转化为可识别的CiteSpace5.3 标准格式;导入可得到关键词的共现分析、聚类分析、凸显词分析结果并以知识图谱显示;结合不同文献的分析结果,可以得出“学习分析”研究的现状和热点。
2 研究结果分析及讨论
2.1 总体描述性统计
2.1.1 研究总体情况分析
文献量和走势图在一定程度上能够反映出学习分析的整体发展趋势。 将检索出来的668 篇文章进一步进行计量可视化分析(见图1),可以清晰地发现发文数量发文机构、发文期刊、发文作者和发文关键词呈现连续增长趋势。
从时间上看经历逐年上升的态势, 可以分为三个阶段。
(1)研究启蒙阶段(2012-2013年),李青等人于2012年发表的《学习技术研究与应用现状述评》是学习分析领域在国内的首篇文章[3],由于学习分析在国内外都处于探索阶段,基本上处于理论研究阶段,实际应用较少。
(2)快速发展期(2014—2017年)有关学习分析研究呈现快速增长,学习分析技术于MOOC、MOOCs、电子书包等在线教育领域等方面进行了应用。
(3)融合发展期(2018—2019年)。2018年《教育信息化2.0 行动计划》等文件出台后,学习和分析发展迅速,进入融合创新和发展阶段。学习分析所提供的多维度的数据为教学管理、教学决策提供重要依据。
2.1.2 机构文献分析
通过统计一个机构发表的论文数量, 可以揭示其在某一学科研究的连续性、深度和贡献[4]。 该研究通过检索和数据分析, 筛选后得到的668 篇文献共涉及86 个研究机构。 发文数量7 篇以上研究机构为,东北师范大学(47 篇)、北京师范大学(27 篇)、华东师范大学(24 篇)、华南师范大学(11 篇)、陕西师范大学教育学院(10 篇)、江苏师范大学(10 篇)、首都师范大学(9 篇)、中国科学院(8 篇)江南大学(8篇)、华中师范大学(7 篇)、北京大学(7 篇),11 家机构占总发文量的25%;通过CiteSpace 软件分析学习分析研究合作机构的知识图谱。 共有86 个节点,32个连线,节点密度为0.008 8。这一数据表明,研究机构间合作并不多见。师范类大学、开放大学系统的发文的数量和质量占有较大优势, 对该领域的研究起到带动和引领作用。
2.1.3 文献作者分析
对于作者发文量的分析可以反映该作者在相关科领域研究的持续性、深度及贡献度[5]。 该研究通过检索和数据分析, 筛选后得到的668 篇文献共涉及188 人。 发文数量≥4 篇14 人, 仅占总人数的6.45%,姜强(11 篇)、赵蔚(10 篇)、杨现民(7 篇)、张海(7 篇)、祝智庭(7 篇)、顾小清(4 篇)等是学习分析领域的高产作家。通过CiteSpace 软件分析研究人员合作的知识图谱。 共有214 个节点和91 个连接,节点密度为0.005 2。 这些数据表明,研究人员共同发文是很常见的,但是不同机构间作者合作较少,还没有形成有凝聚力的科研群体。
2.2 研究热点分析
2.2.1 关键词共现分析
关键词是一篇学术论文中最能揭示论文研究领域、中心内容的代表性词汇,是学术论文的核心,[6]因此, 高频关键词可以反映相关领域的理论框架以及研究热点;通过Citespace 可视化学习分析共现词分析图谱(见图2)。 学习分析、大数据、教学大数据、数据挖掘、学习分析技术、个性化学习、MOOCs、机器学习、智慧教育、人工智能、在线学习、深度学习、教学模式、智慧课堂、翻转课堂都是该领域的研究热点。
图2 学习分析共现词可视化图谱
2.2.2 关键词聚类分析
关键词聚类分析是一种探索性数据挖掘技术,其主要作用是对某一领域的关键词进行识别及分类。将采集的数据结构化,从而探索该领域的主题分布和组织结构。通过Citespace 软件的关键词聚类功能, 得到关键词聚类知识图谱, 该图谱模块值Q(Modularity)为0.864 7,S 值(Mean Silhouette)为0.517 5。一般而言,当Q 值>0.3 时,说明网络结构划分具有显著性;当S 值>0.5 时,聚类结果具有合理性[7]。该次聚类分析共得到17 个聚类图谱,主要聚类为教育数据、混合式学习、学习者分析、自适应学习、智慧课堂、教育数据挖掘、教学改革、学习分析技术等,经过提升分析归纳为学习分析理论及框架研究、 技术研究和应用研究三大类热点。
2.2.3 学习分析领域的研究热点
(1)热点一:理论及框架研究。
理论研究是开展实践应用的基础和依据。 学习分析理论研究体现在学习分析理论基础、模型框架、发展趋势等方面。 一是学习分析建立的理论基础,George Siemens 、Macfadyen 从不同角度推动学习分析的发展,如数据挖掘、网络技术、学习理论、组织行为理论、教学理论、社会网络等。 这些都从理论上为学习分析的研究和应用提供了支持。 二是学习分析框架和模型的研究。 国内外学者从不同角度构建了学习分析模型和框架。 George Siemens 提出学习分析过程模型,Elias 提出学习循环改进模型,Khalil 提出学习分析生命周期模型, 李艳燕等提出国内学习分析框架要素; 姜强等提出个性化自适应在线学习分析模型, 这些模型对研究者设计和应用学习分析系统具有指导意义。
(2)热点二:技术层面研究。
学习分析是指通过技术、 算法和教学理论的结合对数据进行分析。各环节都离不开技术、工具和系统的支持。一是学习分析技术系统的研究,学习分析的关键因素是数据,数据的收集、预处理、分析等环节直接影响到学习分析效果, 而技术的升级迭代为数据的处理提供有力支撑。 二是学习分析的方法和工具。学习分析方法主要包括内容分析、社会网络分析、文本挖掘、情感分析、视觉分析、系统建模以及统计分析聚类、预测、关系挖掘、文本挖掘等一系列数据挖掘方法。 目前如何在具体的操作环境中使用上述工具还需要更深入的研究, 这也是学习分析技术未来的研究方向之一。
(3)热点三:应用研究。
学习分析应用是学习分析的目的所在。 近年来国内学习分析应用研究呈现出种类多,辐射广的特点。 包括以下内容:一是学习分析环境研究,学习环境的构建是实现教与学方式变革的外部条件。 包括智慧教室、智慧课堂、智慧学习平台,如MOOC、moodle、Blackboard、Sakai、实践教学平台等。 二是个性化自适应学习的应用研究: 大数据技术为针对学生自身特点制定个性化自适应的学习路径提供了可能性。三是学习行为应用研究,在大规模的在线学习环境中, 通过对学生学习行为数据的深入挖掘和分析,构建学习者行为分析模型,关注学习者的需求和学习过程的动态路径,提供个性化的教育服务供给,实现学习效果的最大化。
2.3 研究发展趋势
凸现词是指在一定时期内从大量主题词中检测出的变化率高的词。 该研究确定研究前沿的方法为凸显词分析法。在CiteSpace 中,选择Burstness,取Y为0.1,最终得到8 个凸显关键词。 结果见图3。
图3 凸显关键词图谱
2012—2016年凸显词为电子书、MOOC、翻转课堂、知识图谱。 2018—2019年凸显词为智慧课堂、深度学习、人工智能、机器学习,表明这四个关键词是学习分析前沿热点。机器学习是人工智能的核心,能够实现对教育大数据分析和预测。 机器学习先后经历了浅层学习和深层学习两个发展阶段。 深度学习已在政府、学校、社会机构等各个层面引起了广泛的关注和重视[8]。追求深度学习已成为推动教育技术应用的最新趋势。
3 结论与建议
经过以上对学习分析相关文献进行的可视化分析和研究,笔者认为今后应注意以下2 个方面。
3.1 研究结论
第一,师范类大学、开放大学系统发文的数量和质量占有较大优势。第二,同一机构内部的合作占比很大。 第三,学习分析涉及多个主题,需要跨学科的研究。 第四,我国研究分析的深度还不够,研究还不成熟。数据挖掘、学习分析技术和学习行为建模的应用研究是目前我国学习分析领域的研究核心。 智能学习、深度学习、人工智能和机器学习将是未来的研究方向。
3.2 发展建议
(1)加强对学习分析在实践中的应用研究。学习分析技术研究在理论研究不断深入同时, 应重点关注学习分析技术教学实践,为教学、管理及决策提供指导。 (2)注重学习分析的信息与隐私安全。 数据存储分析是一把双刃剑, 在给利益相关者提供服务的同时,也存在信息与隐私泄露的风险,优化教学与保护个人隐私之间的平衡是学习分析面临的一大挑战。 (3)探索多模态学习分析工具的使用。 学习行为是一个极其复杂的过程, 从单一模态来研究学习行为具有一定片面性, 可穿戴技术的发展为多模态学习分析提供了技术支持,通过心率监视器到、视觉跟踪器、 表情识别设备等多模态数据感受器可采集多模态的学习者的心率、专注时间、肢体语言、表情等数据及情绪心理变化, 深入研究学习心理对学习效果的影响。