智能导师系统研究进展与发展趋势
2021-11-28梁迎丽
梁迎丽
(南京邮电大学教育科学与技术学院,江苏南京 210023)
0 引言
新一代人工智能技术取得了突破性进展,并不断深入应用到各个行业和研究领域。在教育领域,基于人工智能技术的智能导师系统(Intelligent Tutoring System,ITS)成为当前研究热点,其目的是模拟人类教师实现一对一个性化教学。智能导师系统由早期的CAI 发展而来,随着认知科学理论及人工智能技术的发展而不断演进。高度交叉的智能导师系统不仅涉及计算机科学、信息科学和人工智能等硬科学,而且还涉及认知科学、教育心理学和语言学等软科学。如今,智能导师系统在数学、物理、医学、信息与计算机科学等学科教育教学中应用广泛,满足学生的个性化学习需要,极大提升了学生的学习效率和效果[1-3],尤其在疫情期间有力保障了超大规模在线学习活动的顺利开展。
1 智能导师系统体系结构
传统的教育学理论认为,教学系统由教师、学生、教学内容三大要素构成。在实际教学中,教师的教学活动通常包括[4]:①解释关于某个主题的核心知识;②讲解如何在给定领域应用知识来解决问题;③提供问题解决的一些例子;④在问题解决过程中,通过提供线索和纠正信息来支持学生;⑤分析学生的解决方案并解释错误;⑥考虑学生的学习目标和经验,对后续相关活动提出建议。ITS 体系结构由教学模型、学生模型和领域模型组成,分别与教学系统的教师、学生、教学内容三大要素一一对应。其中,教学模型模拟了实际教学中的教师角色,学生模型模拟了实际教学中的学生,领域模型模拟了实际教学中的教学内容,其对应关系如图1 所示。ITS 的这种体系结构被称为“三角模型”。可以说,教学系统三要素的基本理论有效地解释、支撑和保障了ITS 体系结构的科学性,奠定了ITS 的理论基础,是ITS 有效模拟人类教师实现一对一个性化教学的重要依据。
Fig.1 Correspondence between ITS“triangular model”and the three elements of teaching图1 ITS“三角模型”与教学三要素的对应关系
在ITS 体系结构中,领域模型又称为专家知识,通常由产生式规则、层次结构、本体、语义网络和框架的形式表示领域基本概念、规则和问题解决策略,其关键作用是实现知识的自动推理功能。学生模型是ITS 的核心组成部分,它动态描述了学生在学习过程中的认知水平、情感状态以及学习过程中的进步情况。学生模型的主要功能体现在:①收集关于学习者的显性和隐性(推理)数据;②能够用这些数据表示学生的知识水平;③作为解释学生知识水平并为其选择最优教学策略的依据。教学模型根据领域模型和学生模型的输入数据,选择适合学生的教学策略和活动安排。通常教学模型与学生的高度交互主要通过人机交互界面实现,通过创设各种形式的学习环境,为学生提供与领域知识的接口通道。因此,有研究者认为ITS 体系结构中应增加接口部分。
2 智能导师系统研究进展
围绕ITS 系统结构的3 个组成部分,结合教学中的实际应用,ITS 理论、方法和技术研究在多学科教学应用领域展开。
2.1 领域模型
为了使ITS 具有人类教师的智能,首先要具有清晰的领域知识表示能力,其次要具有知识的自动推理能力,能够解决领域内的问题。因此,在ITS 研究领域中,具有推理能力的领域知识模型研究十分重要。为了让计算机表示出人类知识,需要弄清楚人类知识是如何表示的。心理学家和认知科学研究者从认识论角度出发,对人类的知识表示及其推理进行研究。在此基础上,心理学与计算机科学家构建了一些表示人类知识规则和推理机制的认知模型,如美国卡内基·梅隆大学提出的ACT-R(Adaptive Control of Thought-Rational,ACT-R)认知架构,是关于人类认知总体结构的计算模型和开发认知模型的软件平台,用以仿真并理解人的认知理论,其目标是使系统能够执行人类的各种认知任务。一些ITS 的早期版本都采用了ACT-R 的产生式规则,如Algebra Tutor、Geometry Tutor 和LISP Tutor。要想实现知识表示与自动推理,就必须诉诸于一定的技术手段。知识表示是人工智能研究最基本的问题之一,人工智能的研究成果为教育应用ITS 提供了广泛的基础。人工智能知识表示方法体系如图2 所示。其中,产生式规则和约束、语义网络和本体是ITS 领域模型最常用的几种方法。
Fig.2 Knowledge representation system图2 知识表示方法体系
产生式规则以If Condition Then Action 的形式描述,将规则作为知识的单位,其语义含义是:如果前件满足,则可得到后件的结论或执行后件的相应动作。该领域模型能够帮助系统理解学生的思维和问题解决方法。卡内基梅隆大学人机交互研究中心采用产生式规则的领域模型开发了几何认知导师系统[5](Geometry Cognitive Tutor,CCT),在美国的高中和初中数学课中,已有数万名学生使用该类型的认知智能导师系统,教学效果显著。为克服产生式规则领域建模的复杂性,有研究者提出使用基于约束的建模方法(Constraint-Based Modeling,CBM)。CBM 将问题解决方案表示为抽象的约束条件,约束与产生式规则区别在于:产生式规则的结论或动作由前提条件触发,而约束条件由结果触发。SQL-Tutor[6]是采用该领域模型方法的系统之一,它由新西兰坎特伯雷大学计算机科学与软件工程系智能计算导师小组研发,在CBM 理论基础上进行了扩展、测试,至今已有十余年教学应用历史。
语义网络和本体都通过带有标记的有向图进行知识表示,适合于逻辑推理。本体是面向特定领域公认的概念,其描述深度大于语义网络。目前,通过自动化构建领域本体的方法成为领域建模新途径。用领域本体表示知识具有两方面优势:①其标准形式使其具有共享性和重用性;②其形式化结构使知识表示和推理过程实现一定程度的自动化,称为“本体学习”技术。其用来实现知识的自动化提取,如可根据不同形态的知识源(文本、数据库、XML文档等)提取不同的知识类型(概念、分类、概念关系、属性、实例、公理等),然后构建本体或者更新已有的本体。文献[7]描述了MATHESIS 本体,开发了可重用的数学导师编辑环境。MATHESIS 本体提供了具有语义的、可重用的、开发模型追踪导师系统所需的陈述性和过程性知识,加快了模型追踪导师系统的敏捷开发。
2.2 学生模型
学生模型是对学生个人知识技能水平、认知特征、学习风格和情感状态等信息的数字化表示,其中,学生的知识技能水平是关键信息。学生模型的主要作用是为教学模型提供决策依据。只有清晰准确地描述学生当前的水平与状态,才能在教学模型作用下实现个性化教学。因此,学生模型是ITS 的核心。
传统的覆盖模型、偏差模型和贝叶斯网络模型通常用于构建学生模型。虽然这些模型提出了较为有效的解决思路,但其在学生能力、状态水平和特征的刻画等方面仍存在很大的不确定性。在此基础上,一部分研究者采用了神经网络、模糊神经网络模型和模糊逻辑算法等数学模型来提高学生模型的有效性和准确度;同时,也有一大部分研究者采用数据挖掘方法从学生学习记录数据中挖取有效信息。对学生模型数据挖掘的方法有聚类、分类、预测、关联、决策树、时间序列、模式挖掘和文本挖掘等。其中,聚类、分类方法可以检测学生的行为,对学生进行分组分类;预测的方法可以预测学生的行为表现;关联挖掘可以揭示学习内容序列之间的联系,以实施合适的教学策略;决策树方法可以识别学生的认知特征,判断学生是否为新手还是经验丰富;模式挖掘可以揭示学生行为之间的模式规律,推断学生的个性特征,为泛在学习情境研究提供支持。
值得注意的是,学生的情感状态极大影响到学习效率和效果[8]。因此,情感状态是学生模型的重要组成部分[9]。ITS 对学生情感的研究主要聚焦于情感感知、情感识别与情感引导3 个方面。文献[10]提出基于语音和情感识别的计算机口语对话导师系统,在促进口语对话导师系统自动适应学生情感状态方面做了重要的研究工作。该研究首先创建了人机对话语料库,当学生情感发生消极、中立和积极性变化时,在语料库中进行标注。然后,从学生的言语中自动提取声音韵律特征,从转录的言语中提取实词项。通过所提取的上述特征,预测学生在讲话过程中情感的变化;文献[11]采用了基于统计的语音识别方法,根据ITS 中学生与系统的交互信息进行情感推理;文献[12]采用传感器测量学生的心率、血压、皮电反应、呼吸频率等信息,感知学生的心理生理状态,并对其进行调节。有研究提出利用深度学习算法进行情感识别[13],借助于ITS 中用户的面部表情与其肢体动作的相关性,构建关于面部表情的数据库并提取相关特征,采用视觉—面部表情与键盘敲击动作相结合的情感识别方式。实验结果表明该混合方式能有效促进ITS 用户情感识别。学生情感识别与引导研究主要从认知科学的研究角度出发,借助情感代理Agent或AI 技术进行情感推理,识别学生的情感状态并进行引导。针对获取的信息制定合适的系统交互策略,如调节环境、任务强度等,增强学生的动机意识。通过设置人机交互代理的方法建立情感同伴,预测和引导学生的受挫情感问题。
2.3 教学模型
学生知识技能水平及其情感状态等特征是进行教学决策的依据。因此,如何构建与学习者的交互环境,从中获取学生当前的知识技能水平和情感状态等信息,是ITS教学模型研究的首要问题。ITS 教学模型的作用主要体现在与学生的交互过程中,通过适应性决策选取适合的教学策略,并推荐个性化学习资源以主动适应学生需要。
教学模型主要模拟教师的教学过程。教师通常具有学科领域知识,具有认知和学习能力以及相应的教学策略,这些特征为教学模型的实现提供了几种可借鉴方法:①观察教师的教学活动并对其进行模拟;②观察真实情境下学生和系统的交互情况并将其作为参考;③借鉴学习理论的研究成果并将其作为理论指导依据。尽管如此,ITS系统与学生人机交互的计算机辅助教学,与师生面对面交流与沟通的课堂教学存在很大差异。考虑到这些差异,方法③成为教师模型实现的有效途径。Bloom 的掌握学习理论、Vigotsky 的最近发展区理论、Gagne 的教学设计理论,以及协作与社会化学习理论以及交互设计理论,是实现教学模型适应决策的理论依据。
个性化教学尊重学习者的个性特征,如学习风格、兴趣、特长等,以满足学习者个性化需求为目标。ITS 中个性化教学体现在学生模型基础上,依据学生特征向其提供个性化的学习路径、学习内容、学习策略和学习伙伴等资源。如通过概念图模型建立领域知识结构,通过诊断与测试单元测评出学生未掌握的知识点,然后生成个性化学习路径推荐给学生。在对情境感知的泛在学习研究中,采用启发式路径算法为学生寻求最佳的学习路径[14]。值得注意的是,已有的资源推荐研究忽视了学习者能力水平这一重要因素。有研究者提出以项目反应理论为基础,根据学习内容的难易程度以及学生的能力水平,向学生推荐个性化学习路径。同时,个性化课程序列也能促进学生的个性化学习。文献[15]利用贝叶斯网络和模糊逻辑开发了用于高校教学的智能导师系统,有效提高了学生成绩。
交互式环境设计和及时有效的教学反馈是ITS 促进个性化教学的重要环节和有效方式,是教学模型的主要任务。研究表明,为学生提供交互式学习环境和即时反馈对于在线学习和智能教学至关重要。引导性反馈、参与式反馈教学等理念为教学模型交互环境和反馈功能的实现提供了理论指导。如编程教育中的智能导师系统[16],应用了知识追踪、多模态学习感知、深度学习等相关技术,设计了可视化和支持协作的交互式程序设计学习环境,为中小学阶段的编程学习提供了智能化辅导和支持。如批改网是用于辅助大学英语教学的一种智能导师系统[17],该系统以大型语料库为基础,基于自然语言处理技术等算法实现对学生英语词汇、句法、篇章结构、内容等多个方面的智能评价,并提供拓展辨析、学习提示、推荐表达、语法搭配等方面的即时反馈与内容推荐,能够及时解决学生学习过程中存在的问题,纠正典型的语言错误,有效提高学生的英语学习效率。此外,有研究者将认知导师创作工具(The Cog⁃nitive Tutor Authoring Tools,CTAT)嵌入于大规模在线开放课程MOOC 平台中,有效提升了学习者“做中学”的积极性[18]。
实践表明,教学模型复杂性高,具有极大的不确定性。如何选取简单有效的教学策略,并通过交互式环境设计和即时反馈等方式向学生推荐个性化学习资源,是有效实现一对一个性化教学的关键,也是当前教学模型研究面临的难题。
2.4 相互关系
ITS 所有功能都表现在学习者与系统的交互过程中,交互环境设计是ITS 实现的重要前提,测评数据是实现学生模型的重要依据,教学模型是领域模型和学生模型之间的桥梁。教学模型根据领域知识及其推理,依据学生模型反映的学生当前知识技能水平,作出适应性决策,并向学习者提供个性化的资源推荐和学习支持服务,最终实现一对一个性化教学目标。
事实上,在众多的ITS 教学系统中,领域模型、学生模型与教学模型三者之间是相互依赖和相辅相成的,其相互关系如图3 所示。首先,学生模型是ITS 的核心与关键,它的重要性体现在:从理论的角度分析,学生是教学过程的主体,以学生为中心的教学设计等活动需要尊重学生的学习风格、知识水平、情感态度、生理心理状态等个性化特征,如此才能实现有效教学;从技术的角度分析,要想实现学生个性化特征等信息的数字化和智能化表示,必须借助于人工智能等技术,将学生知识水平和情感状态等个性化特征进行科学的量化分析,并将其作为学习支持服务的根本依据,在此基础上才能实现个性化的智能辅导。其次,教学模型是领域模型和学生模型之间的纽带,教学模型的实质是作出适应性决策和提供个性化的资源推荐服务。教学模型根据学生模型所反映的学生特征,尤其是知识和能力水平、情感状态等个性化特征,对学生当前的整体状态进行识别和判断,并从领域模型所包含的知识和策略库中选取针对性的学习资源,通过一定的策略推荐给学生,由此从技术层面实现“因材施教”的教育理念。最后,领域模型和学生模型是教学模型功能实现的基础。领域模型的知识表示与自动推理、学生知识水平和情感状态的数字化表示,为智能教学提供了教育科学层面的根本遵循。
Fig.3 Relationship between domain model,learner model and teaching model图3 领域模型、学生模型与教学模型的相互关系
由此可见,ITS 中的领域模型是学科知识体系的科学化和系统化表示,知识表示与自动推理是领域模型的最重要功能;学生模型依赖于智能测评技术,是学生学习水平与情感状态等学习特征的数字化表示,是反映学生个性化特征的重要依据;教学模型根据学生模型所体现的知识水平等信息,借助于领域模型作出个性化判断和适应性决策,向学生推荐个性化学习资源,并通过智能测评促进学生不断学习。
3 智能导师系统发展趋势
当前,新一代人工智能技术正在推动教育领域的深层次变革。技术的进步与教育理念的革新,将进一步推动智能导师系统的创新发展。有研究指出,游戏化和社交功能是未来智能导师系统的发展方向,智能辅导的有效性研究是未来智能导师系统关注的突出问题[19-20]。在对智能导师系统领域模型、学生模型与教学模型的相互关系分析基础上,本研究认为自动化测评和个性化资源推荐是决定未来智能导师系统发展趋势的关键性因素。
当前,评价理论和学习理论互相促进发展,测评系统与ITS 日渐融合,自动化测评已成为个性化学习系统的决定性因素。这种决定性主要表现在两个方面:①测评是获取学生特征,尤其是学生知识、技能水平等主要特征的重要来源;②测评数据是以学生模型为基础,实现个性化资源推荐的重要依据。通常,ITS 通过分析学生与系统的交互过程和学习记录收集学生学习能力信息。但传统的学生模型往往侧重于学生学习风格、兴趣和情感状态等特征的描述,忽略了学生的知识技能水平这一主要因素。事实上,测评数据是反映学生知识技能水平的重要来源。计算机辅助测评(Computer Assisted Assessment,CAA)系统的应用引发了评价内容、方法和形式的深刻变革,尤其是自动化测评技术已经成为实现知识和技能测评的重要手段。在技能训练方面,CAA 能够创设高度交互的、有意义的问题解决情境,注重学生解决问题能力的培养,且自动化测评结果具有客观性、一致性、高效率和高可用性等优点,能够为教师的教学决策提供真实可靠的依据。因此,自动化测评技术将极大地提升学生模型的准确性,为个性化学习奠定基础。
教学模型是领域模型和学生模型的桥梁,其实质是做出适应性决策和提供个性化资源推荐服务。也就是说,教学模型根据学生模型所反映的知识技能水平,从领域模型中选取合适的资源推荐给学生,并以恰当的教学策略为指导,实现一对一个性化教学。由此,教学模型实现一对一个性化教学的过程即是适应性教学策略选取和个性化资源推荐算法的实现过程。适应性教学策略选择是资源个性化推荐的前提,其表现在两个方面:①在适应性教学策略选择方面,这种适应性表现为多个层次,从适应性应答学生的表现、适应学生的知识水平、帮助学生取得具体目标,到对学生的情感状态做出适应性反应,提供适应学生元认知能力的帮助。然而,正如前文所述,教学模型具有极大的复杂性,如何选取简单有效的教学策略是当前教学模型研究面临的难题。针对此问题,“因材施教”是最简单且最有效的教学策略,即根据学生的知识技能水平,向其提供适合该水平的学习资源;②在个性化资源推荐算法方面,学习资源包括学习路径、学习内容、学习策略和学习伙伴等类型,但已有的个性化推荐服务仅考虑学生的学习风格、偏好和兴趣等特征,忽视了最重要的学生能力特征,最终造成信息过载、认知超负荷和缺乏适应机制等问题。针对该问题,本文认为资源推荐算法应以满足学习者能力水平的学习需求为主要目标。从测评数据反映学生能力水平的重要指标角度分析,自动化测评将是实现个性化资源推荐的重要基础。
4 结语
新一代人工智能技术给智能导师系统带来了新的发展机遇。面对突如其来的新冠疫情,智能导师系统通过模拟人类教师的教学和辅导,为在线学习者提供了有针对性的、个性化的学习支持服务,有效保障了疫情期间在线教学秩序,为全球教育体系提供了技术保障。本研究详细分析了ITS 体系结构中的领域模型、学生模型和教师模型及其之间的关系,在此基础上进一步指出自动化测评技术是实现学生模型的关键性方法与技术,是教师模型做出适应性教学策略选择和实现个性化资源推荐的重要基础,并提出CAA 技术是当前ITS 研究的突破口。可以预见,在新的学习理论指导下,以适应性决策和个性化推荐技术为基础,借助于人工智能技术的不断进步实现人机协同学习,将是智能导师系统未来的发展方向。