APP下载

智能辅导系统发展历史和趋势概述

2021-05-19璐,王

合肥师范学院学报 2021年1期
关键词:聚类领域人工智能

郭 璐,王 懂

(1.中国科学技术大学,安徽 合肥 230026,2.合肥师范学院 文学院,安徽 合肥 230601;3.沉浸式媒体技术文化和旅游部重点实验室,安徽 合肥 230051)

一、研究背景

近年来,人工智能(AI)因其在包括教育在内的各个领域的广泛应用而引起广泛关注。越来越多的研究者开始考虑人工智能教育(AIED)这一前景广阔的交叉学科领域。人工智能教育很可能成为人类教育的一个重要方向。人工智能辅助下的教育是革命性的。AI系统可以实时评估教学效果,调整教学策略[1-2],开展对情感的认知[3-4],并对认知状态[5]进行识别。智能辅导系统(Intelligent Tutoring Systems,ITS),是人工智能技术发展的产物,是一种兼具智能化和人性化的计算机软件。系统广泛应用于教育行业,根据学生的指标和参数,制作各种具体的学生模型。学生模型的建立是数字化学生个人能力的有效途径,使学生得到个性化、互动性的帮助,也是教师因材施教的重要手段。

在传统课堂教学中,几乎可以达到面对面个性化教学的效果。一些研究表明,ITS有助于学生在标准化考试中取得更好的成绩,教学效果与现实生活中的教师没有太大的不同[6]。未来,ITS将接管课堂中的知识教学任务,从而让教师有更多的精力去关注学生的其他综合素质。而这无疑将重塑我们教学方式。在过去的50年里,人们为人工智能辅导系统做了大量的工作。最早的尝试可以追溯到20世纪70年代,当时计算机首次用于教育。20世纪70年代出现了第一批提供个性化和适应性指导的人工智能系统。该领域的第一个应用是1970年完成的SCHOLAR[7],经过几年的发展,出现了诸如1977年斯坦福大学设计的BIP系统等一批颇具影响力的智能教学系统。

1982年,有学者提出了ITS智能导师系统的概念,ITS是利用计算机模拟教学专家经验的方法来辅助计算机系统的教学[8]。ITS使用人工智能技术模拟面对面的人类辅导,提供最符合学习者认知需求的学习活动,并提供有针对性的及时反馈,而这一完整的教学过程并不需要人类教师在场[9-10]。ITS将为学生在各类情境下的学习活动提供相匹配的支持[11]。一些智能辅导系统已经被学校所采用,这些系统被用来为学生进行定制化的教学[12]。

智能辅导系统已被证明在提高学生的学习动机和学习效率方面是非常有效的[13]。智能辅导系统的研究充分利用了人工智能、认知科学和教育的进步,提高了计算机支持教育的能力,像优秀的人类导师一样,自主地为学习者提供适合他们特定需求的有效教育体验[11]。

随着计算机技术的发展和跨学科研究成果的不断融合,在ITS研究的发展中,研究课题的概念和术语也在不断演变。从早期的计算机辅助教学,如CAL(计算机辅助学习)、CAT(计算机辅助训练)、CAI(计算机辅助教学),到现在的主流术语ITS(计算机辅助教学)。由于该领域非常年轻以及跨学科的复杂机制,ITS概念边界是模糊的[9]。但其应用成果相对丰富,一些学者总结了ITS的组成和特点。

学习解决方案是否由ITS本身实时生成,这区分了基于“步骤”的ITS与基于“应答”的CAI/CAL/CAT系统[14]。ITS系统由教师模型、学习者模型、教学策略库、领域知识库和人机交互界面五个部分组成。Woolf提出了学生模型、教学模块、领域知识模块和交流模块四个主要部分[15]。Joseph & Mia & Erik发现了第五个组成部分:专家模型[16]。

此外,许多学者在系统设计、系统特点、教学方法实施、教学效果研究等方面进行了研究。但是,目前对这一领域的总体情况和发展还缺乏系统的综述研究。与以往结合传统计算机辅助教学理念如CAI的研究不同,本研究将针对AIED中较为突出的子领域:ITS。通过系统梳理,对其研究进行分类和总结。

本研究所要研究的问题:

(1)ITS研究基本情况,包括发文量、主要研究国家合作网络、主要研究期刊、主要研究机构。

(2)学科的知识结构,包括热门研究主题,知识基础和研究前沿。

(3)学科中的研究领域构成、参考文献共被引分布,具有突现性、中介中心性的文章。

二、数据搜集

本文采用文献计量学的研究方法对ITS领域研究的知识基础和研究前沿进行了系统性研究,通过引文分析、共词分析和共被引分析等方法追溯领域的发展历史和学科缘起,同时通过经过验证的算法寻找领域内的研究热点和未来发展方向。

本研究的数据来源是Web of Science 核心合集数据库中的科学引文索引(SCIE)和社会科学引文索引(SSCI)中的研究性论文。本研究通过高级检索的方式,以TS=("intelligent tutoring system"OR"Intelligent Computer Aided Instruction"OR"Intelligent Computer Assisted Instruction"OR"Artificial Intelligence in Education"OR"adaptive educational system"OR"adaptive learning system"OR"constraint-based tutors"OR"Algebra Cognitive Tutor"OR"Autotutor"OR "sql-tutor"Or"assistments"OR"elm-art"OR"iweaver"OR"Student modeling"OR"Bayesian Knowledge Tracing")为关键词字段进行检索,于2019年11月29日收集了764条论文信息。

三、结果和讨论

(一)研究现状

1.发文量

检索文献记录(文章)764条,按年份划分的出版数量如图1所示。

图1 1963-2019年Web of Science中历年来与ITS相关的论文量

有关ITS主题文献的发表时间分布见图1。最早在有关ITS的研究出现在1963年,但在随后的整个1970年代,该领域发表在SCIE和SSCI上的研究几乎为一片空白。与此同时,这一时期发表的文献主要是围绕计算机辅助教学(CAI和CAT)相关概念开展的一些研究。这说明,这一时期学术界对ITS相关概念的关注较少。

自20世纪80年代中后期以来,ITS相关领域的论文又重新出现。1988年出现了5篇与ITS相关的研究论文,此后发表的论文数量显著增加。以1988年为起点,ITS相关文章的总体数量呈现出“逐级”增长的态势。发文量增长的第一阶段出现于1988年至1998年。在这十年中,ITS的论文数量经历了第一个快速增长期,从1988年的5篇,增长到1998年的36篇。第二阶段是从1999年到2006年,发文量在经历了1999年的短暂下滑后迅速地回升,呈现出波动式增长的态势,并在2006年达到第一个发文峰值,发文量达到59篇。紧接着在2007年却出现了断崖式下降,跌至26篇。但仅仅一年之后,即2008年,发文量又重新上升。将2007年至2019年被划定为第三阶段,这一时期发文数量集中在25篇至77篇之间,其中,2013年达到77篇的历史最高水平。总体来看,ITS研究领域的论文发文量呈现出波浪式的增长的趋势。

2.引文量

图2

图2a为自1963年以来的被引文献数量。从1998年的49次到2018年的1461次,ITS领域的总被引次数呈指数增长趋势。图3a是Origin 2019 Pro制作的引文增长拟合曲线,R2=0.97,拟合指数很高。图2b为原始曲线的规则残差,说明拟合曲线的残差越接近于曲线,越符合指数拟合,越偏离越远。发现随着时间的推移,引文的增长逐渐偏离了拟合曲线。

从1990年到2009年,引文数量略低于拟合曲线,但从2009年起,引文数量赶上了曲线,从2010年起,年引文增长率超过了指数增长率,2012年除外。很明显,被引用的次数显著增加。这表明ITS的研究热度增加了。可以预测,这是一个新兴潜在研究领域,将在未来几年受到更多的关注。

3.主要研究国家

在WoS检索到的ITS相关论文中,美国的发文数量排名第一(308篇),约占总数的40%。美国的发文数量几乎是排名第二的加拿大的6倍。美国是ITS研究最突出的国家,这与国家的科研实力密不可分。

图3 国家/地区合作网络

通过对国家/区域合作网络的分析,可以了解ITS领域的国际合作情况。使用VOSViewer,构建一个前15个国家/地区的共现合作地图。网络中两个节点之间的连接厚度代表了两个国家/地区的合作强度。线越粗,则两个国家/地区合作的论文越多。从图3可以看出,美国是合作网络的中心,与大多数国家/地区都有合作,其中美国与加拿大、德国、中国、新西兰的合作较多。此外,亚洲国家/地区之间的合作更加紧密,而欧美国家/地区之间的合作更加紧密。

4.主要研究期刊

主要ITS的研究期刊可以通过相关文章的数量排名获得。表1中排名第一的《计算机教育》是施普林格出版的系列丛刊。1973年至2019年,共出版了11200多册计算机科学经典著作,包括计算机科学、信息技术研究和教育领域的最新成果。其中,《智能辅导系统论文集》《人工智能课堂笔记》和《智能辅导系统》等均为《计算机教育》旗下专设研究ITS的主题期刊。表1中期刊所属的研究领域涵盖了计算机科学、教育、工程、心理学、电子、运筹学和管理学等,而不同学科领域能够反映出ITS研究本身所具备的跨学科性质。

5.主要研究机构

ITS出版物数量最多的前10个机构见表2。其中,卡内基梅隆大学(CARNEGIE MELLON UNIV)是发表论文最多的大学。这所大学在计算机科学领域享有世界声誉,在ITS领域也有着独特的研究条件。

表1 ITS主要研究期刊

表2 ITS主要研究机构

图4 关键词共现聚类网络

6.研究领域

在研究ITS相关论文的学科分布时,分析了其研究领域。根据Web of Science(WoS)的论文所属领域分类,ITS的研究领域主要集中在计算机科学、教育学、工程、心理学等领域。而对计算机科学的各个子领域,如计算机科学理论方法、计算机科学跨学科应用、计算机科学控制论等进行了较为详细的分类。这也体现了ITS研究具备多学科融合的显著特点。

(二)研究热点:关键词的共现网络分析

关键词是本文高度细化的研究内容。通过本文的关键词共现分析,可以有效地获取该领域的研究主题/热点。对于把握其研究热点,对相关研究具有重要的指导意义。本部分选择VOSviewer构建关键词共现聚类图。时间跨度从1963年到2019年。连接的强度是这一行中的一个关键字与另一个关键字出现的总次数。如图6所示,除“智能辅导系统”一词外,共现总链接强度排名前列的关键词依次为学生(233)、知识(160)、模型/模型(148)、指令(144)、自动辅导(125)、绩效(101)。

图4显示了VOSviewer1.6.4提供的“网络可视化”。图中节点的大小和字体取决于关键字的权重。权重越大,字体和节点就越大。图中每个节点之间的距离尽可能准确地表示它们之间的相似性,即相似度高的个体尽可能地接近,相似度低的个体尽可能地接近。

从图4可以看出,从1963年到2019年,ITS研究主要包括四个关键字聚类,图中分别用序号表示。其中最大的1号聚类(共30个关键词)围绕“学生建模”“系统”“设计”“贝叶斯网络”“加工学习”等主要节点,体现了计算机技术在其研究中的核心地位。集群节点还包含诸如“个性化”“适应”“自适应学习”“自适应超媒体”“项目反应理论”知识表示等,表明相关的计算机技术研究领域被应用于个性化学习、评估和知识表示等,这些也是热点话题。2号聚类以“学生”“自动导师”“对话”“模型”“理解”为主要节点,结合“解决问题”“认知负荷”“情感”“自然语言”“潜在语义分析”等23个关键词。以“知识”“绩效”“教育”为主要节点的3号聚类(22个关键词)主要关注教育学与应用的理论与系统结合。以“介绍”“动机”“反馈”“认知”“元认知”“自我调节”为关键节点的4号聚类(共16个关键词)表明其研究重点是认知学习过程。

结合关键词排序和聚类来看,ITS的热门研究主题话题主要集中在计算机科学领域,涉及应用研究、教学策略、认知心理学、效果评价等方面。

(三)研究演变和趋势:文献共被引分析

1.参考文献共被引分布

共被引分析是指在第三篇被引论文的参考书目中同时出现两篇文献,那么这两篇文献形成了共被引关系[17]。共被引分析定义了参考文献和研究专业的概念和一致性。高共被引文献是指示某一特定研究领域的先进思想和发展的指标[18]。如表3所示,可以找到共被引用次数最多的5篇文献,并分别对这些文章的思想进行简要说明。

表3 Top 5共被引参考文献

通过分析文献的共被引,利用CiteSpace从文献中提取文献源信息,建立共被引网络,形成聚类,有助于确定某一领域的知识库分布。该网络可用于显示给定研究领域的知识基础。通常推荐使用Log-likelihood Ratio(LLR)算法来命名集群[18]。聚类分析可以帮助我们了解与ITS相关的主要研究领域。以聚类为单位,选取较大或较新的典型聚类进行分析,是共被引分析的重点[18]。

图5中的文献按照LLR算法进行聚类。聚类的文献越多,聚类领域就越重要。集群ID为集群数量,如图5所示,分别为#0,#1等,集群包含的成员数量越多序号越小[19]。图5中各个聚类由左及右的分布次序代表了聚类依次出现的时序,可用来判断聚类中被引文献的发表年代。

图5 共被引聚类图谱(LLR)

图5显示了文献共被引聚类的分布情况,下面重点讨论其中最大的5个聚类中最具代表性的参考文献,这些参考文献代表了各聚类的研究方向。

第1个聚类#0通过围绕ITS系统的各类应用的研究设计来人工智能教育系统的教育效果,共有70个成员,VanLehn,Graesser和Jackson等比较了使用人工智能系统和阅读或听讲座的形式三种形式,哪种教学更有效。结果取决于学生的准备是否与教学内容相匹配。研究进行了7项实验,比较了2种人类辅导(口语和计算机介导)与2种基于自然语言的计算机辅导(Why2-Atlas和Why2-AutoTutor)以及涉及学习文本的3种控制条件。结果表明,当新手(没有学过大学物理的学生)学习中级学生(学过大学物理的学生)写的内容时,辅导课对话确实比互动性较差的教学更有益。当新手学习为新手或中级学生编写的材料时,研究为中级学生编写的材料时,ITS并不比基于文本的控制条件更可靠[2]。这篇文章代表了一组关于Autotutor的文章。

Graesser,Shulan Lu等重新分析两篇已发表的会议综述,得出AutoTutor在深度理解方面产生了大约0.7sigma的学习收益的结论[20]。Graesser,Chipman,Haynes和Olney的文章先简要概述AutoTutor的教学策略,这体现了建构主义的教学方法[21]。

Scotty D. Craig的研究表明,学习与厌倦负相关,与心流正相关,这与Csikszentmihalyi对心流体验的分析预测是一致的。本研究采用建构主义学习框架探讨情绪状态与学习过程的关系。这篇文章对ITS情绪与认知评估这一类主题的研究产生了重大影响[4]。

第2个聚类#1围绕计算机支持的协作式学习,共有45个成员。Michelene T.H. Chi等人运用实验的方法,检验了教师采取三种不同教学策略的教学效果。研究认为教育的重点不仅在于教师行为的有效性,还在于学生自主学习建构的有效性以及互动效果。研究提倡教师运用鼓励的方式来提示学生,而非运用解释和说教的方式。当然,这种方式需要大量深层次的“脚手架”内容进行辅助[22]。Johnson和Rickel阐述了动态教育智能体背后的动机研究,描述了它们提供的关键功能,并讨论了相关技术问题。讨论通过描述一系列的教育智能体的技术状态的来说明[23]。VanLehn等人描述了系统的教学原则和功能,系统的设计和实现以及教学有效性的评估[24]。

第3个聚类#2通过围绕科学探究,共有45个成员。Koedinger和Corbett指出,ACT-R的优势和认知导师的原则是普遍适用的,可以应用于许多领域。然而,这些原则也提出了一些更高层次的课程设计问题:学生应该学什么?什么样的问题解决活动支持这种学习?学生们带来了哪些相关知识?研究也提出,设计认知导师的活动要在课程目标、教师实践需求、课程内容和社会背景的指导下完成[25]。Kurt VanLehn分析了一批ITS的软件功能结构,将ITS的系统行为界定为“外循环”和“内循环”。“外循环”的功能是为学生选择接下来要做的任务,而“内循环”则是分析步骤、提供有效的教学帮助和评估知识[26]。Woolf介绍了一批运用人工智能算法为教育学,心理学,认知和评估教育效果提供工具的方法和想法[27]。

第4个聚类#3通过围绕adaptive testing,共有28个成员。Anderson,Corbett,Koedinge和Pelletier认为,学生是在生产规则单元中学习技能的,而最好的师生互动方式是导师提供即时反馈,包括简短且有针对性的错误信息。这个研究对后面的学习效果测评产生一定的影响[28]。

2.具有高突现性的最新出版物

由图5可见,年份最新的聚类为6#,而聚类中具有高突现性值的文章,可代表该领域当前的研究主题趋势。聚类6#中Koedinger等学者通过对科学、数学和语言学习领域的研究,阐明了KLI框架所提供的对知识、学习和教学事件的分析。该文章引起了对ITS学习效果评价的研究热潮[29]。

聚类6#中,Desmarais和Baker介绍了模型技术,包括贝叶斯网络和图形模型、IRT和潜在特质模型、贝叶斯知识追踪以及各式学习者评估模型,并介绍其应用在ITS系统中的情况。另外,这个研究指向了研究的一个热点,就是情感分析[30]。

聚类7#中,Beal指出,参加智力测试的学生进步了,但重复测试的学生没有进步。使用软件较多的学生比接触较少的学生进步更大。数学能力最差的学生进步最大[31]。

3.具有高中介中心性的最新出版物

中介中心性值可以体现出研究范式的转移。聚类10#中,由Pedro等发表的题为“利用系统探究行为的机器学习检测器来估计和预测探究技能的转移”(Leveraging machine-learned detectors of systematic inquiry behavior to estimate and predict transfer of inquiry skill)(Centrality=0.16)一文,是近十年来ITS领域中介中心性最高的论文之一。

该论文探讨了团队研发的一套机器学习模型,该模型被用以检测中学生在物理的微观世界中进行科学探究的技能和评估。研究比较了贝叶斯知识追踪法和平均法,发现这两种方法都能有效地评估学生的技能。模型的技能评估是两种类型“inquiry transfer tests”测试的重要预测因子[32]。这篇论文代表了利用技术开发个性化自适应模型来评价学习效果的研究趋势,并且引领了以个性化学习分析与评价为核心的新的研究方向,这代表了一个潜在的研究范式的转折点。

四、结语

通过对ITS发表文献的可视化分析,本研究探讨了的ITS的基本研究情况、研究相关范畴、研究的演变和趋势。

ITS是一门具有跨学科特点的应用学科。ITS的研究较早在上世纪60年代的社会科学领域展开,但ITS的实质性发展是从计算机科学在自然科学中的贡献开始的,ITS最大的类别是计算机科学、教育、工程和心理学。ITS研究与这些学科的发展相适应,呈现出阶梯式、波浪式的发展趋势。

本研究揭示了其研究的热点问题。学生、知识、模型、指导、Autotutor、表现、系统、设计、动机、学生模型、超媒体、对话、策略、个性化、反馈等主题基本反映了ITS研究的热门问题。

在共被引参考文献的分布图谱中,选取了最新的具有“突现性”和“中介中心性”的典型文章,用以探讨ITS研究的最新趋势。“利用系统探究行为的机器学习检测器来估计和预测探究技能的转移”一文是最近5年发表文献中的最高的中介中心性。它代表了一个潜在的研究范式的转折点。而情感分析将是ITS领域未来几年的研究热点。

近年来,随着大数据、人工智能算法和计算机硬件的不断完善,可以预见其将迎来新一轮的研究热潮。以往的研究通常停留在实验室。而近年来,随着学科的商业化,大量的用户行为数据被捕获,数据量大幅增加。反过来,又促进了人工智能算法的发展。基于教育学和认知心理学的特点,有必要对教师、学生和其他使用者的行为进行分析和评价。因此,数据也是一个非常重要的环节。ITS在过去没有被广泛应用的一个重要原因是数据的缺乏,而大数据的应用必将有助于对ITS新型模式的探索。

猜你喜欢

聚类领域人工智能
电子战领域的争锋
将现代科技应用于Hi-Fi领域 Perlisten S7tse
2020 IT领域大事记
基于K-means聚类的车-地无线通信场强研究
领域·对峙
2019:人工智能
人工智能与就业
数读人工智能
基于高斯混合聚类的阵列干涉SAR三维成像
下一幕,人工智能!