文献计量视角下学习分析的研究热点与趋势分析*
2023-03-02许佳欣
元 帅 许佳欣 黄 焕
(1.湖北第二师范学院 计算机学院,湖北 武汉 430205;2.基础教育信息技术服务湖北省协同创新中心,湖北 武汉 430205;3.中南民族大学 教育学院,湖北 武汉 430074)
学习分析技术作为教育技术领域的新技术,融合了教育学、心理学、计算机科学与技术、人工智能等多学科知识[1],是交叉学科研究的热点,也是技术赋能教育的重要体现。2011 年,首届学习分析技术与知识国际会议将学习分析定义为“测量、收集、分析和报告有关学习者及其学习情景的数据集,以理解和优化学习及其发生情景”。十多年来,它一直受到相关领域研究者的密切关注,并有力地推动教育数字化转型和教育评价改革。近年来,我国教育数字化的发展,进一步推动了对学习分析的研究与发展。本研究对中国知网2013-2023 年北大核心期刊中有关学习分析的文献进行可视化分析,旨在了解学习分析技术的研究现状和热点,总结学习分析的发展阶段,并在此基础上预测其未来发展趋势,为相关研究和实践提供参考依据和经验借鉴。
一、研究设计
(一) 研究方法
本研究采用关联分析、社会网络分析、聚类分析、知识图谱、共现网络分析、统计分析等方法对文献进行定量分析。关联分析是对数据集中反复出现的关系进行挖掘提取,从而根据一个数据项的出现预测其他数据项的出现。社会网络分析是在关联分析的基础上,揭示各类数据之间的关系,社会网络分析和关联分析可以用来展示不同学术研究团队之间的合作关系。聚类分析根据大量文献中的描述对象及其关联的信息,进行信息对象分组,可用于对关键词的分析,可以挖掘关键词所反映的热点和主题。共现网络分析用于揭示不同关键词之间的共现次数和网络关系,并分析共现关键词之间的联系。知识图谱是以可视化的形式展现知识发展进程与结构关系,统计分析则用于数据频次的统计,这两种方法共同融入不同的研究结果中[2]。
(二) 研究数据
为保证文献资料的全面性和准确性,本研究选用中国知网学术期刊数据库作为文献数据来源。在数据收集过程中,首先通过高级检索的方式,将主题、篇名、关键词(三者关系为或) 设定为“学习分析”进行精确匹配,检索时间设置起始年为2013 年,结束年为2023 年,限定期刊来源类别为北大核心,共检索出2 875 篇相关文献。其次,为保证文献数据的典型性,减小后期分析误差,共进行了三次人工筛查和剔除,第一次剔除了不符合检索条件的文献,第二次剔除了与主题内容不符合的文献,第三次通过阅读文献摘要剔除不符合学习分析研究领域的文献,最终得到650篇样本文献。
(三) 数据处理
经过文献下载、文献格式化、文献清洗三个环节进行数据处理。首先,对中国知网数据库搜索到的文献进行筛选,并以文本格式导出文献信息。其次,以中国知网数据库的字段标识符为标准格式,以Refworks 格式导出文献信息。最后,对地区、单位、作者、关键词等进行相关性的批量合并,将预处理完成的文本数据进行规整以供后续分析。
(四) 研究过程
研究过程主要包括6 个方面。一是下载文献信息:从选定的数据库中下载有关学习分析的文献和题录信息;二是转化数据格式:将下载的题录数据进行格式的转换和统一,以匹配后续使用的工具软件来进行定性与定量分析;三是抽取字段信息:将字段中包括标题、作者、地区、关键词、发表年限、参考文献等有效信息进行抽取;四是统计条目频次:根据抽取的字段信息运算频次排列表中的条目元素,统计完成后进行扩展区域的降序排列;五是构建共现矩阵:将所分析题录信息的数据导入相应的软件中,运算相应条目元素的数量并将其作为矩阵知识单元,进而得到相应知识单元的共现矩阵;六是生成网络图谱:筛查共现矩阵数据,并基于此矩阵导入相关的可视化分析软件,生成共现网络知识图谱。
二、学习分析的期刊文献研究现状
(一) 发文量分析
通过对历年发文量的分析,有助于研究学习分析领域的理论水平和发展趋势。笔者将650 篇样本文献绘制成横轴为发文时间、纵轴为发文数量的发展趋势图,可以得出近十年我国关于学习分析的研究热度处于较高水平,说明学习分析研究受到广泛关注,但波动较大,如图1 所示。2013-2023 年共有两次研究热潮,分别是2016 年和2019 年。通过进一步分析,我国学习分析研究可以分为如下三个阶段。
图1 2013-2023 年学习分析研究相关发文量趋势图
1.研究萌芽阶段(2013-2014 年)
学习分析的概念一经提出,就受到我国研究者的广泛关注。尽管该时期我国的学习分析研究主要处于教育理论研究阶段,缺少实际应用,研究成果不多,但已初步探索了该领域的研究方向。李青、王涛[3]辨析了学习分析的基本概念,剖析了学习分析技术在教学实践中的优势和不足,为后续的研究提供了参考。
2.稳步发展阶段(2015-2017 年)
数字化时代,云计算、大数据、物联网、移动计算等新技术逐步广泛应用,学习分析得到了有力的技术支持。同时,国家加强对教育信息化的建设,2016 年印发的《教育信息化“十三五”规划》指出,推动形成基于信息技术的新型教育教学模式与教育服务供给方式,提升教育治理体系和治理能力现代化水平,形成与教育现代化发展目标相适应的教育信息化体系,充分发挥信息技术对教育影响和作用。在技术的支持和政策的引导下,我国关于学习分析的研究迅速发展,2016年,有71 篇相关文献关注了学习分析的理论研究,并且逐步探索学习分析的应用场景[4]。
3.创新发展阶段(2018-2023 年)
在这一阶段,为适应新时代的要求,教育领域进行了综合改革,尤其是人工智能技术的融合创新发展,加快了教育数字化、教育信息化、教育现代化的进程。该阶段有关学习分析方面的论文呈现爆发性增长,并迎来了第二次研究的热潮。2019 年,中共中央、国务院印发的《中国教育现代化2035》,全面推进了教育信息化,同年,学习分析类文献发表量达到112 篇。研究者对学习分析的研究逐渐系统化,更多集中于人工智能技术与大数据技术在学习分析领域的创新应用[5]。
(二) 核心作者分析
通过分析作者的发文量可以了解该作者在相关学科领域的研究持续性、深入程度以及对学术界的贡献度[6]。筛选后的650 篇有效文献来源于315 名作者,其中发文数量超过5 篇的作者有23人,占总人数的3.54%。例如赵蔚(24 篇)、姜强(19 篇)、武法提(17 篇)、顾小清(16 篇)、刘清堂(14 篇)、刘三女牙(10 篇) 等是学习分析领域的高产作者。利用Citespace 对学习分析研究的核心作者进行可视化分析,生成核心作者合作知识图谱。其中,共形成了315 个节点、220 条连线,整体网络密度为0.0044。图谱中节点大小与作者发文数量有关,作者之间的连线粗细表征合作强弱。从该知识图谱中可以发现,作者间的合作关系表现较为离散。尽管形成了多组规模化的研究团队,有一定的紧密合作关系,但合作发文大多是同一所高校、机构的合作,缺少有凝聚力的科研团体。今后需要广泛加强跨学校、跨机构的合作,形成研究团队,共同推动学习分析研究的快速发展。
(三) 研究机构分布
对学习分析领域的研究机构进行分析,统计出发文量前十的研究机构,如表1 所示。
表1 学习分析研究发文量排名前十的研究机构一览表
由表1 可知,该领域的科研力量主要集中在以北京师范大学为代表的重点师范院校,具有鲜明的行业特征。其中,北京师范大学发文量最高,共82 篇,表明其在该领域具有较强的研究实力和影响力。排名前十的研究机构集中分布在北京、广东、江苏、浙江等地区,说明教育资源和研究环境对学习分析的发展起到了重要作用,但也表明学习分析的研究存在地域差异。未来,各个机构应当加强地域间的合作交流。
三、我国学习分析研究热点
(一) 关键词共现分析
关键词可以高度凝练一篇文章的主要内容和中心思想。对关键词进行共现分析,可以反映当前学习分析领域研究热点。本研究提取与统计关键词,生成关键词共现分析图谱。如果关键词的节点越大,表征其出现的频次越高。统计出现频次大于10 次的关键词见下页表2 所示。学习分析作为领域内的直接关联词,共出现260 次,其次是在线学习(63 次),接着是大数据(40 次)、学习行为(37 次)、学习投入(36 次)、人工智能(35 次),这些都是领域内的研究热点。中心性指代节点在网络结构中的重要程度,中心性越大说明该关键词对信息的流动和传递的作用越大。其中,中心性大于0.1 的节点称为关键节点,大数据(0.61)、在线学习(0.56)、人工智能(0.48) 是联系其他关键词的关键枢纽。
表2 学习分析研究关键词频次和中心性一览表
(二) 关键词聚类分析
关键词聚类分析是一种探索性的数据挖掘技术,其主要目的是识别和区分某一领域的关键词,可以反映该领域的主题分布。通过关键词聚类分析得到知识图谱,该聚类的聚类模块值Q 是0.8686>0.3,聚类平均模块值是S=0.9568>0.8,据此说明该网络结构划分显著,聚类结果合理。本研究选取了具有代表性的前10 个聚类类别,包括“学习分析”“协作学习”“在线学习”“人工智能”等主题词。
通过分析关键词聚类图谱以及深入阅读文献,可以归纳学习分析的研究热点为学习者特征研究、教学实践研究、技术层面研究三个方面。
1.学习分析的学习者特征研究
结合聚类结果,本研究将“学习行为”“学习投入”“在线学习”等关键词归为一个主题。近年来,随着教育信息化的发展,大规模的在线学习环境已经形成。越来越多的研究者利用学习分析技术收集学习过程数据,从而对学习者的特征进行研究,帮助研究者理解学习者的内在规律,以期提高学习成效,创新学习方式[7]。例如,在研究学习者的学习行为特征方面,将学习行为作为学习分析技术的数据来源,通过学习分析技术构建学习行为模型,为学习者的个性化学习提供指导建议,从而改善学习效果,为智慧学习分析奠定基础[8]。
2.学习分析的教学实践研究
结合聚类结果,本研究将“精准教学”“虚拟现实”“深度学习”等关键词归为一个主题。学习分析可以体现教育教学规律和特点,在教学实践中发挥重要作用。将学习分析与教师教学进行结合是教育信息化发展的必然要求,也是教育改革发展的必然结果[9]。对于教师的教学来说,可以使用学习分析技术收集教学过程数据,对课堂教学、教学设计等方面进行分析,提供有效的教学策略和方法,帮助教师完成教学实践,提高教学质量,进而实现精准教学,为智慧教育奠定基础[10]。
3.学习分析的技术层面研究
结合聚类结果,本研究将“人工智能”“大数据”等关键词归为一个主题。随着技术的发展和学习分析应用场景的扩大,可以发现学习分析的发展和创新变革离不开人工智能技术的支持,而大数据作为学习分析的基础和重要驱动力,也为学习分析的发展赋能[11]。例如,在个性化教育应用中,借助人工智能技术和大数据技术可以更深入地了解学生的学习行为和需求,通过分析学生的在线活动、作业和测试结果等数据,教师可以更好地掌握学生的学习进度,并为其提供相应的指导。同时,大数据技术可以帮助教师更好地评估学生的学习效果,进而制定更加科学的教学计划[12]。
四、我国学习分析的研究趋势
突显词解释可以帮助理解聚类中的关键词,从而更好地把握研究的重点,合理预测未来发展趋势。本研究基于关键词图谱,分析近10 年间在学习分析的相关文献,以起始年份选取排名前11位的突显词(见下页表3)。可以看出,“学习投入”“人工智能”“智慧课堂”等关键词在2013-2016 年出现,且延续至今,可以预测其将成为未来学习分析领域的研究重点。
表3 学习分析研究关键词突显分析表
五、结语
本研究以中国知网学术期刊数据库近10 年(2013-2023 年) 有关学习分析的650 篇相关文献为研究对象,采用关联分析、社会网络分析、知识图谱等方法进行数据处理与可视化,直观展示学习分析领域的研究现状、热点,把握学习分析的发展趋势,为学习分析的后续研究提供参考。通过研究近10 年以学习分析为主题的相关文献发现,我国学习分析领域的研究主要有以下三个方面的特点。
第一,近10 年我国学习分析领域的理论研究水平有一定深度,总体上呈现动态上升的趋势,大致可以分为三个阶段,2014 年前为研究萌芽阶段,2015-2017 年为稳步发展阶段,2018-2023 年为创新发展阶段,在政策驱动下出现了快速增长。学习分析领域的研究者形成了小规模的研究群体,但未能打破单一院校之间的界限,形成更大的、有凝聚力的研究团队。目前的研究机构类型多样,但是研究视角比较单一,研究主体以师范院校为主。同时发现,研究成果存在地域差异,跨地区、跨机构的研究成果较少。
第二,我国学习分析领域的研究热点大致可以分为三个方面:基于学习分析的学习者特征研究、基于学习分析的教学实践研究、基于学习分析的技术层面研究,一些研究项目取得了较好的研究成果,而且具有一定的创新意义。
第三,在研究趋势的预测方面,研究者将更多关注学习投入、人工智能、智慧课堂等方面的研究。此外,在研究和实践过程中,要注意隐私保护、数据安全等技术问题,使学习分析更好地服务于人类社会[13]。
为了预测学习分析领域的研究趋势,本研究基于关键词分析,提取未来研究热点相关的突显词。其中,“学习科学”“多模态”等关键词在近几年出现,由于相关理论知识尚待完善,适用技术尚未成熟,研究有待进一步深入,但随着理论和技术条件的发展,这些内容会成为未来研究的重点之一;“学习投入”“人工智能”“智慧课堂”等关键词在近三年出现,相关研究不断增多,也是未来学习分析的研究热点。