人工智能辅助教育应用研究的全球知识图谱:发展路径与前沿动态
——基于CNKI与WoS的文献计量分析
2023-02-18王成梁留伊丹王永固
王成梁,戴 坚,留伊丹,王永固
(浙江工业大学 教育科学与技术学院,浙江 杭州 310023)
0 引言
过往信息技术的发展与应用仅改变了传统教育的表层模式,如通过计算机或移动设备向学习者提供学习内容,但该方式没有从根本上改变教育形式。人工智能(Artificial Intelligence,AI)的飞速发展及其在教育领域的推广应用让教师教学和学生学习都发生了根本性改变,AI 技术也因此被认为是最有希望提升学生学习效果的技术之一[1]。
综合多位学者的研究,人工智能辅助教育(Artificial Intelligence in Education,AIEDU)可以界定为人工智能相关技术、算法和概念在教育教学各个环节中的应用[1-3]。过去10 年中,AIEDU 在各种教育环境中都得到了广泛应用,还有部分研究并不局限于具体教育环境与教育内容,开始深入到AIEDU 的个性化运用[4]和针对教学环境进行的算法创新[5]中。
随着教学研究的不断深入,AIEDU 领域成为跨学科研究的热点,但是如果没有全面了解AIEDU 研究领域的发展状况,可能会对该领域众多研究方向感到些许迷惘。尤其对于刚进入该领域的研究者而言,很难从错综复杂的研究现状中找到该领域的发展主线与研究前沿。因此,本文从研究热点(关键词关系网络)和演进路径(时间线图)出发,结合具体高被引文献进行深入分析。文章主要关注以下问题:①国内、国际收录AIEDU 研究论文的主要期刊有哪些?②国内、国际AIEDU 研究中出现频次最高的关键词有哪些?彼此间有何联系?③国内、国际关于AIEDU 研究的研究热点、演进路径有何异同?
1 研究工具与数据来源
1.1 研究工具
本文主要利用CiteSpace 和VOSviewer 文献计量学工具进行知识图谱绘制。CiteSpace 被形象地译为“引文空间”,其原理是采用相似性算法在时间切片内获取时区视图和时间线视图,从而在时间维度上清晰地勾勒出知识演进过程以及某个聚类中文献的历史跨度,了解该领域的发展进程与趋势[6]。VOSviewer 采用基于概率论的数据标准化方法,在关键词、共机构、共作者等领域提供了多种可视化视图,具有制图简易、图像美观等特征。
1.2 数据来源与描述性统计
国内研究选取CNKI 作为数据来源,检索策略为SU='人工智能' * '教育',时间跨度为2010-2021 年,数据库最后更新时间为2021 年10 月6 日,来源类别选择CSSCI 与CSCD 索引学术期刊,获得1 707 条文献记录。但是通过数据库获取的数据不经仔细筛查可能会存在一些重复或与主题不符的文献数据,因此在分析前需要对数据进行预处理,避免数据本身的质量问题影响分析结果,保证可视化分析的有效性。本文主要采用潘玮等[7]提出的数据清洗“DEAN”流程对文献数据进行筛选,最终获得703 篇有效文献。通过对文献年发文量进行统计,可以发现从2017年开始,该领域的发文量开始快速增长。
国外研究选取Web of Science 作为数据来源,检索策略为TS=(("artificial intelligence" OR "AI" OR "deep learning" OR "machine learning")AND "education"),时间跨度为2010 年1 月-2021 年10 月,检索时间截止为2021 年10月6 日,索引选择SSCI 与SCIE,文献类型选择为Articles,获得2 317 条文献记录。由于“深度学习(deep learning)”同时是教育学和AI 领域的关键词,因此同样需要进行数据预处理,处理方式与国内研究文献类似,筛选后最终得到313 篇有效文献。国内外人工智能辅助教育应用领域发文量如图1 所示,其中左图为国内发文量,右图为国外发文量。
Fig.1 Number of articles published in the field of artificial intelligence assisted education applications at home and abroad图1 国内外人工智能辅助教育应用领域发文量
对文献所属期刊进行统计,可以反映出哪些期刊是AIEDU 研究的主要阵地。国内教育技术学相关刊物是收录该领域论文的主要刊物,其中刊文量最多的期刊是《中国电化教育》,达到95 篇,刊文量大于50 篇的期刊还有《电化教育研究》、《远程教育杂志》和《现代教育技术》;国外发表该领域论文的刊物大部分属于教育技术和计算机教育领域,与国内期刊情况较为类似,刊文数量大于等于10 篇的期刊有Sustainability、Education and Information Technologies、Educational Technology &Society、IEEE Access和Com-puters &Education,其中Sustainability刊文量最多,为22篇,说明近年来开源期刊的快速发展推动了该领域的研究,虽然目前学者们在实现开放获取的最佳途径上还存在分歧,但研究成果免费共享的想法却得到了广泛认同[8]。
2 作者合作情况分析
对作者合作网络进行分析,可以了解该研究领域学术群体的分布情况。703 篇文献共计有3 314 名作者,运用VOSviewer 分析目前该研究领域最大的合作群体,结果如图2 所示。由图2 可知,该领域的核心作者是黄荣怀、曾海军、杨现明、马陆亭等,这些学者在教育技术领域深耕多年,往往能敏锐捕捉该领域的时事热点,把握研究发展前沿,并发表高质量论文。
Fig.2 Author cooperation network knowledge graph of domestic artificial intelligence assisted education application research图2 国内人工智能辅助教育应用研究作者合作网络知识图谱
对上述核心作者所属单位进行分析发现,大部分作者属于北京师范大学、华中师范大学和北京航空航天大学,这些学校均在人工智能教育研究方面有着独特优势,建立了以“人工智能+教育”为目标的学术机构或学术团队,例如华中师范大学专门建设了人工智能学部,用于培养人工智能辅助教育应用领域的人才。黄荣怀作为研究人工智能辅助教育学术团体的核心学者,对该领域各方面的研究均有关注,包括但不限于技术应用导致的技术悖论和理论问题、国家与国际组织政策文件研究等[9]。
使用VOSviewer 进一步对国际人工智能辅助教育应用领域的作者进行合作分析,发现了313 篇文献,共计990 名作者。国际作者合作网络并没有像国内一样形成由若干个权威学者主导的研究中心,大部分学者的发文量较少,其中最大的学术合作群体知识图谱如图3所示。
Fig.3 Author collaboration network knowledge graph of international artificial intelligence assisted education application research图3 国际人工智能辅助教育应用研究作者合作网络知识图谱
对比图2 与图3 发现,后者知识图谱的密度远高于前者,说明国际人工智能辅助教育应用研究更加开放,且学者之间的合作更加深入。此外,从研究内容来看,国内主要以理论研究为主,如杜静等[9]注重人工智能教育的内涵定义和原则建构;国际研究较为注重实证分析类和应用开发类的研究,如Standen 等[10]以克服问题儿童学习障碍这个实际问题为导向,研究开发基于人工智能的自适应学习系统。
3 研究现状与热点分析
3.1 国内研究关键词分析
关键词反映研究领域的聚焦点,高频关键词往往代表了该领域研究热点。运用VOSviewer 软件对国内文献的关键词进行分析,选择其中频次大于等于5 的关键词进行可视化,结果如图4 所示。圆节点越大,表示关键词出现的次数越多;节点连线代表关联强度,连线越粗表明二者出现在同一篇文献中的次数越多;节点颜色不同代表聚类不同,即研究主题不同。
Fig.4 Keyword knowledge graph of domestic artificial intelligence assisted education application research图4 国内人工智能辅助教育应用研究关键词知识图谱
分析图4 可知,全图围绕“人工智能”这个核心关键词展开,而“智能时代”“智能教育”“智慧教育”等组成了次级核心关键词中具有鲜明特征的一类。有学者指出,将AI引入教育是一次根本性变革,过去教育技术的发展都未能使教育摆脱“工业化”的刻板印象,故产生“把机器制造得越来越像人,把人培养得越来越像机器”的现象,而AI 是推动“工业化”教育向“智慧型”教育转变的关键[11]。
“深度学习”“大数据”“个性化学习”“自适应学习”“学习分析”等次级关键词体现了AI 在教育领域的应用态势,即技术应用为人才培养提供了独特的方式方法[12]。深度学习作为一种基于大数据的先进算法,目前已经是机器学习领域一个新的研究方向,受到了诸多学者关注[13]。如今AI算法在在线教育大数据领域的运用已经非常普遍[14-16],基于人工智能的智能化测评、过程性评价也逐渐成为研究热点[17-18],可见对于人工智能的应用研究,越来越多学者聚焦到提供个性化教学服务与因材施教的教学分析。华为政企业务教育业务部总经理曾伟经在与《中国教育网络》的一次访谈中提到“教与学不止全面,更懂千人千面”,言外之意便是要尊重个体差异,在人工智能技术的支持下推进个性化教学[19]。现任科大讯飞执行总裁、公司董事吴晓如也在一次访谈中提出人工智能赋能教育的意义在于实施评估,并基于此给予精准、个性化的指导[20]。从上述分析讨论可以看出,目前关于AIEDU 的研究已经呈现出一片繁荣景象。任何一种教育技术的研究都是为了更好地推动教育发展,在此目的背后,学术性的理论研究与企业中的应用研究都是不可或缺的。
进一步探究关键词共现图可以发现,AI 在教育领域的应用存在于诸多子领域,如高等教育、职业教育、教师教育和思想政治教育等。胡钦太等[21]提出人工智能的教育应用为解决高等教育评价模式陈旧、数据缺乏、指标呆板单一等问题提供了方法与途径;徐晔[22]借助“生态系统即结构”(Ecosystem as Structure)理论模型,在AI 的视域下探索高等职业教育智能生态系统;李世瑾等[23]通过结构方程模型探索教师对人工智能教育的接受度,发现绩效期望是提高AI 相关技术使用意愿最主要的因素。与前三者不同的是,AI 运用于思政教育研究并没有得到学术界的普遍支持,部分学者反而认为这是“人工智能泡沫”,受到了一定程度的反对[24]。
从“教育伦理”“未来教育”“教育变革”等关键词可以发现,随着AI 与教育的不断融合,教学模式变革成为学者关注的一个新焦点[25]。此外,教育伦理问题也逐渐受到重视,一方面是学者们对未来教育的展望,另一方面是其担心技术的不当应用会导致“技术理性主义”,尤其是深度学习算法所需的大量数据极易侵犯他人隐私。基于此,学者们呼吁在拥抱AI 技术的同时也要关注AI 变革教育的限度,回归教育的育人本质,但也不能因噎废食、一味抵触,应该通过对AI 教育伦理与社会规范的思考,探寻教育中技术向善的可能性、合理性和有效性[22,26]。
3.2 国际研究关键词分析
使用VOSviewer 软件对发表在外文期刊中的文献进行关键词分析,选择频次大于等于5 的关键词进行可视化,结果如图5 所示。由图5 可知,“人工智能(artificial intelligence)”“机器学习(machine learning)”“教育(education)”“深度学习(deep learning)”“大数据(big data)”“系统(system)”等高频关键词构成了该领域的代表性术语。
Fig.5 Keyword knowledge graph of international artificial intelligence assisted education application research图5 国际人工智能辅助教育应用研究关键词知识图谱
“人工智能(artificial intelligence)”和“机器学习(machine learning)”是全图关键词的核心。机器学习是人工智能的一个子领域,研究计算机如何模拟人类的学习行为,以获取新的技能或知识,重新组织已有的知识架构不断改善自身性能,在国际教育研究中被众多学者频繁使用[27]。其应用领域主要包括分析和预测、评估和评价、自适应系统和个性化以及智能辅导系统等[28],比较典型的应用如使用机器学习技术预测在高等教育体系中哪些学生更容易取得成功[29],同样的方法也可以进行MOOCs 辍学预测。在预测、分析和评估过程中,还会涉及到教育数据挖掘(educational data mining)、学习分析(learning analysis)、深度学习(deep learning)等技术。以MOOCs 辍学预测为例,往往需要先使用深度学习算法构建辍学预测模型(model),并收集数据对模型进行训练,形成稳定的模型之后方可预测个别学生的辍学概率[30]。与传统神经网络需要人工提取并整理特征信息、调整参数相比,深度学习神经网络基于自动提取特征信息的预测往往具有更高的准确率,并具备自我完善的能力[31]。
不论是分析(analytics)、预测(prediction)还是分类(classification),想要达到最终目标都离不开数据支持,尤其是近年来深度神经网络的发展,在提高准确率的同时,对模型所需数据体量也提出了更高要求。因此,教育大数据(big data)也逐渐成为学者们关注的一个新焦点和前沿教育研究的新趋势。在此新领域中,Romero 和Ventura 是较为权威的学者,关注教育数据挖掘中的预测、分类和过程挖掘,对其中的关联规则挖掘技术应用较多[32],研究背景大多为高等教育和在线学习。此外,10 余年来在线学习(online learning)和网络化学习(e-learning)的推广和普及为在线数据收集奠定了良好基础,尤其是疫情推动下在线教育的飞速发展,更是大大提高了教育技术中数据收集的便利性和可靠性,使教育大数据分析成为可能[33]。此外,依靠大数据的人工智能技术还与个性化学习和精准教育(precision education)息息相关,许多实证研究已经表明,基于深度学习技术的学习表现分析和辍学预测可以个性化地为学习者或教师提供准确信息,从而达到精准教育、因材施教的目的[34]。
从图5 中可以观察到,高等教育(higher education)是AIEDU 研究的主阵地。有学者指出,AI在教育管理领域的应用将为高等教育机构内部架构带来有效的变革,其使用前景主要包括调查教师如何丰富教育形式、学生如何学习以及高等教育机构如何作出准确且恰当的决定,在高等教育大众化导致高校治理工作量迅速增加的时代背景下,这些应用显得尤为重要[35]。
4 聚类分析与路径分析
4.1 国内研究聚类分析与路径分析
为了解国内人工智能辅助教育应用领域的研究路径,本文采用CiteSpace 的Timeline 时间线功能进行可视化知识图谱绘制,提取该领域的9 个主要聚类,结果如图6所示。
Fig.6 Domestic network clustering knowledge graph图6 国内网络聚类知识图谱
从图6 中可以看出,该领域的研究在2017 年前后展现出截然不同的态势。尤其是智慧教育概念的提出引起了大量学者对“AI+教育”新议题的关注,该年更是被称为“人工智能产业化元年”[36]。2019 年后AIEDU 的研究趋于理智化、规范化。从关键词的演进中,可以大致将时区分成若干阶段:2010-2016 年研究关注面较为狭窄,AI 和教育的结合不够紧密,主要关注一些比较浅层的教育应用,如教学软件、文本统计等;2017-2019 年为该领域的研究爆发期,智能教育、高等教育、大数据等关键词聚类都在该阶段异军突起,成为主流研究领域,深度学习等技术开始成为该领域的主要研究工具与方法,而且研究者开始关注新教育生态下的人才培养体系[37],研究整体呈现出向诸多领域并进深入的趋势。
为了更加清晰地了解AIEDU 领域突然爆发的研究热点,可以进一步使用CiteSpace 的Bursts(爆发词)功能进行分析,结果如图7 所示。发现大部分爆发词集中在2017-2018 年,同时AIEDU 进入发文高峰期;2020-2021 年该领域的研究体现出教育和AI 深度融合的态势,随着技术在真实教育场景中的推广应用,研究开始关注变革与伦理问题[38],并且出现了对教育本质的思考以及教育智能化进程的反思,逐步认识到AI 本质上只是一种工具、一类技术[39],在运用时需要警惕技术功利主义,恪守教育发展的本真逻辑[40]。此外,从前文描述性统计体现的发文趋势也可以看到,在第3 阶段该领域研究的增长态势开始逐渐放缓,并逐步趋于理性化。
Fig.7 Domestic research on the burst period and intensity of burst words图7 国内研究爆发词爆发年限与爆发强度
4.2 国际研究聚类分析与路径分析
对国际人工智能辅助教育应用领域的研究路径进行分析,提取该领域的8个主要聚类,结果如图8所示。
Fig.8 International network clustering knowledge graph图8 国际网络聚类知识图谱
由图8 可知,国际人工智能教育领域研究的阶段性相较于国内并不显著,但在研究方法上有比较明显的侧重点。结合聚类#0、聚类#1 和具体文献可以看出,结构方程模型和技术接受模型(Technology Acceptance Model,TAM)被广泛应用于接受度与使用意愿调查中[41-42],尤其是在疫情的背景下,相关技术在得到推广的同时,AI 技术应用也掀起了社会科学研究热潮[43]。
此外,同国内进行比较可以发现,国内更加关注“智能教育”“智能时代”“未来教育”等抽象概念,而国外偏重于定量的实证研究,聚类#2、聚类#3 主要体现了实证研究的类型和所需方法,回归(regression)、分类(classification)等数据分析方法成为关键词的典型代表,有学者选取2010-2020 年社会科学引文索引数据库的教育与人工智能研究类别中的100 篇论文进行分析,发现其中实证研究论文多达63 篇,分析论文仅占37 篇,与国内理论分析和质性分析占主流的研究模式形成鲜明对比[44]。
国际研究还关注AI 技术在体育教育中的运用,从聚类#7 中可以看出,自2016 年开始,体育教育与AI 相结合的研究热度不断上升[45-46]。将体育视为一种特殊的教育,对运动员生理指标与运动负荷之间关系进行数据挖掘,可制定强度合理、效果显著的运动训练计划[47]。也有研究将人工智能技术运用于如乒乓球等专业运动教学训练中,形成数字化、智能化的教学过程,进而提高姿势的准确性与回球的稳定性[48],尤其是动作识别、骨骼检测等技术的精准度迅速提高,大大拓宽了人工智能在体育教育领域的应用前景。相较而言,国内对于体育教育与AI 相结合的研究还未形成显著热点。
为了更清晰地了解国际人工智能教育研究路径的发展,对国际文献数据进行Bursts(爆发词)分析,结果如图9所示。由于2010 年没有该领域相关论文,因此爆发词分析年份是2011-2021年。
Fig.9 International research on the burst period and intensity of burst words图9 国际研究爆发词爆发年限与爆发强度
对比分析图7 和图9 发现,与国内爆发词相比,国际研究的爆发词在时间上分布较为均匀,没有出现某个年份突然有大量爆发词的情况。爆发词中强度最大的是“高等教育(higher education)”,这是由于高等教育是接触教育技术较多的一个教育阶段,不管是对学生还是老师而言,都更有机会利用AI 技术的优势,提升教学以及学习效果[28]。从2020年开始兴起的意愿(intention)研究成为近期研究热点,在所筛选的文献中,2021 年有11 篇以用户意愿为核心的实证研究(基于上文的检索式可以更便捷地找到以上文献)。有学者基于计划行为理论(Theory of Planned Behavior,TPB)探究了学生学习AI 的意愿,发现公众对AI 的态度、自我效能感等变量都影响了学习AI 的意愿,为在学校推广AI教育的研究人员和教师提供了依据[49]。
国内与国际AIEDU 的研究演变路径和侧重点上虽然存在一定差异,但是整体都呈现出不断深入和细化的特点,且越来越关注研究的完整性,例如不以教育伦理为主题的研究,往往也会对伦理问题作一定论述[27]。归纳而言,国内与国际的研究都呈现出百花齐放、百家争鸣、欣欣向荣的景象。
5 结论与展望
本文通过VOSviewer 和CiteSpace 软件分析2010-2021年AIEDU 的研究脉络、热点及趋势,系统回顾了该领域国内、国际的发展态势,从国内、国际研究的分析和对比中可以发现:①国内、国际刊发该领域论文的主要刊物集中在教育技术学和计算机教育领域,国内具有高度集中性,国外开源期刊(如Sustainability、IEEE Access等)是刊发该领域论文的主力期刊;②国内、国际均在该领域形成了一个由若干领域内权威学者组成的研究学术网络,但是国内团体有较强的中心性,分布在不同院校中的核心学者(如黄荣怀等)成为该领域学术共同体的中心;③从关键词中可以发现,国内、国际研究的关注点各有特色:从研究教育类型来看,国内在不同教育类型(高等教育、职业教育、教师教育、思想政治教育)上均有研究,而国际更倾向于高等教育(higher education);从研究内容来看,国内学术理论研究和企业应用研究都有涉及,国外以实证型研究如基于算法和模型的预测(prediction)、分析(analysis)、分类(classification)研究为主;④从研究发展态势看,国内外研究都以AI和教育为核心,呈放射状演进,应用场景的创新与精准化在不断深入,关键词和时间线图都体现出人工智能技术与教育的融合不断加深。与此同时,越来越多国内、国际学者开始呼吁AI 应用于教育需要回归教育本源,并展开了伦理探讨和接受度研究;⑤从路径分析和爆发词出现的年份来看,国内2016 年才进入研究和发文的高峰期,而国际研究整体上没有出现短时间研究热度暴涨的情况,近年来发文量的增加也主要得益于开源期刊运动的发展。
有理由相信,AI 和教育相结合的研究会持续且动态地进行下去。因此,从科学文献计量的视角出发,梳理得到的研究脉络极具价值,能为该领域研究者提供研究方向与思路。具体而言:①可以帮助一些对人工智能辅助教育应用领域感兴趣的学者建立该领域已有研究的清晰框架,深入了解该领域发展过程;②对高频关键词的聚类和演进分析可以帮助学者了解人工智能辅助教育应用领域的聚焦点与热点,为学者在研究议题的选择上提供参考;③分析了人工智能辅助教育领域内的核心论文与核心作者,可以帮助学者快速找到研究时想要参考的文献;④对该领域期刊的相关分析,可在一定程度上为相关学者在投递该主题论文时提供期刊选择指南。
本文也存在一些局限性,国际研究选用的论文是从Web of Science 数据库的两大索引中筛选得到的,没有将其他科学数据库(如Scopus)纳入考虑范围,会导致分析数据不够全面,因此接下来的研究会扩大文献筛选范围,更广泛地了解研究动态与前沿热点,为人工智能辅助教育应用领域提供更加全面、可靠的综述分析。