APP下载

情感导学系统(ATS)的关键技术及其导学模型研究*
——论智能导学系统走向情感导学系统之意蕴

2019-10-14龚礼林刘红霞

远程教育杂志 2019年5期
关键词:导学学习者智能

龚礼林 刘红霞 赵 蔚 刘 阳

(东北师范大学 信息科学与技术学院,吉林长春 130000)

一、引言

20 世纪70年代初,MIT 智慧实验室的Carbonell教授提出,将人工智能技术(Artificial Intelligence,AI)应用于计算机辅助教学(Computer Assist Instruction,CAI),由此产生了智能导学系统(Intelligent Tutoring System,ITS)[1]。 智能导学系统因能模拟教学,为学习者提供个性化的学习体验,而受到国内外研究者的关注。

迄今为止,智能导学系统的发展已近半个世纪,国内外获得大量的研究成果。 迈入21 世纪,研究者们逐渐意识到, 智能导学系统缺乏人类教师所具有的情感,因此,研究无法有较大突破。 MIT 的Picard教授提出情感可以计算的观点, 迅速受到学术界的广泛关注。ITS 领域的研究者开始将情感融入相关研究中, 由此产生了新一代智能导学系统——情感导学系统(Affective Tutoring System,ATS)。ATS 不仅能适应学习者的知识水平,还能识别学习者的情感,提供具有人文关怀的个性化学习体验。

二、ATS 的起源与发展

(一)从PI 到CAI,再从ITS 到ATS

计算机辅助教学起源于20 世纪早期的程序教学(Programing Instruction,PI),从程序教学到情感导学系统,经历了如图1 所示的重要历程。 1925年,美国心理学家Sidney Pressey 设计了第一台自动教学机,这种机器可以自动测试和计分,开创了机器教学研究的先河。然而,由于机器设计问题以及教学条件的不成熟,Pressey 的自动教学机对程序教学的发展影响有限。 直到1954年,Skinner 提出教学机器能解决现存的许多教学问题, 发明了著名的程序教学机器,掀起了风靡世界的程序教学运动[2]。

图1 智能导学系统发展历程

为了克服程序教学缺乏个性化的缺点,20 世纪60年代,Crowder 提出基于学生的反馈来展示学习内容,以分支程序结构替代线性程序结构的观点。分支程序教学虽然离真正个性化学习相距甚远, 却在一定程度上促进了个性化学习的发展[3]。 60年代末至70年代初,生成性计算机辅助系统(也称自适应系统)逐渐产生。生成性计算机辅助系统具有许多优点,例如,自动生成学习材料以节省机器内存等。 然而,该系统也产生了一系列问题,仍不能满足人类智能教学需求。Carbonell 认为,如果不使用人工智能技术, 就无法从根本上解决这些问题。 20 世纪70年代,Carbonell 提出人工智能技术与计算机辅助教学的融合,标志着智能导学系统的诞生[4]。

迈入21 世纪,大量的研究表明,学习者情绪、兴趣、压力、学习风格等因素与学业成绩紧密相关,正是这种思想促进了情感导学系统的发展。 情感导学系统可以追溯至1997年麻省理工Picard 教授的专著《情感计算》,他指出,情感计算来源于情感或能够对情感施加影响的计算[5]。 此后,各国纷纷对情感计算投入研究,如,美国MIT 情感计算小组研发可穿戴设备来识别人类情感,英国伯明翰大学开展“认知与情感研究”等。 21 世纪初,ITS 领域研究者开始关注情感研究,于是产生了新一代教育系统——ATS。

(二)相关理论的发展

早期的程序教学是基于行为主义学习理论而设计的教学模式, 该模式允许学生根据自己的速度和水平,以特定顺序进行材料的学习。其理论基础是行为主义的操作性条件反射原理和积极强化原理,学习的实质是学习行为概率的变化。 程序教学模式在事实性知识的获取和基本技能的训练中效果显著,但在深层学习和高阶思维的培养方面则力不从心。20 世纪60年代开始, 主流学习理论开始由行为主义转向认知主义理论。 心理学家和教育学家不再强调外显的行为, 而开始关注复杂的认知过程, 如思维、问题解决、概念行为等[6]。彼时,计算机科学家、心理学家以及教育学家开始思考如何让计算机能像人类大脑一样思考,即人工智能。人工智能与教育领域的结合,产生了智能导学系统。当时的智能导学系统的设计主要受认知主义和建构主义的影响。 认知主义认为,智能导学系统价值在于个性化教学,它允许学生在与计算机软件的互动过程中开展学习; 而建构主义认为,学习是一个社交过程,智能导学系统应提供一个可供学习者之间进行协作、交流和知识建构的学习情境。 21 世纪初,心理学、神经科学、认知科学和教育学的相关研究表明, 情绪在影响学习过程、问题理解、决策和动机方面起着重要作用[7]。相关理论如认知失衡理论、控制-效价理论和心流理论等,促使研究方向逐渐由智能导学系统向情感导学系统转变。

(三)ITS 与ATS 的关系辨析

从定义上看,Conati 认为,ITS 是一个跨学科领域,旨在研究如何能设计像优秀教师一样提供个性化学习的教育系统[8]。 Carbonell 则认为,ITS 是一个拥有学科知识和教学指导原则的数据库,该系统可以与学生进行自然语言对话,能以自然的方式与学生进行互动[9];而ATS 的定义多数是建立在ITS 的定义之上,所以ATS 是一个不仅能自适应学习者知识水平,还能根据学习者情感状态,提供个性化干预的教学系统。

从功能上看,ITS 能够根据学习者知识水平选择合适的教材、调整教学速度,以适应学习者的学习能力, 并在解决任务时给予提示, 完成任务后提供反馈。而ATS 除了具有ITS 的功能外,还能根据学习者的情绪状态,甚至学习风格、压力、兴趣,提供个性化干预,以改善学习效果。

从模型结构上看,ITS 主要包含存储学科知识的专家模块、存储学习者知识的学生模块、存储教学策略的教学模块, 以及用于学生与系统互动的用户界面模块。 而ATS 中的学生模块不仅需要存储学生知识水平,还需存储学生的情感状态、学习风格等,教学模块中通常还需存储教学代理的相关信息。

综上,不论是从定义、功能还是结构上看,ATS 是结构更加复杂、功能更加完善的ITS,有些学者称之为情感智能导学系统(Emotionally Intelligent Tutoring Systems,EITS)[10],是智能导学系统的新概念。 更多观点认为,ATS 能真正模拟人类教师, 是下一代智能导学系统。从剑桥词典上看,intelligent 被释义为能够较为轻松地理解和学习。 事实上,ATS 具有适应学习者情感状态的特征,这也是intelligent 的一种体现。之所以称其为下一代智能导学系统或者情感导学系统,是因为ATS 无论在结构还是功能上都是较ITS 更为完善,因此,有别于传统的智能导学系统。

(四)ATS 研究现状

目前的ATS 研究, 还处在以技术搭建为主、情感导学为辅的初级阶段。 研究多集中在如何更好地收集和识别学习过程中的情绪,面部表情、眼动数据以及语音信息是较为常见的数据来源。如,奥克兰梅西大学Sarrafzadeh 等开发的Easy with Eve, 利用摄像机采集面部表情数据, 采用支持向量机的分类算法,可识别微笑、大笑、惊讶、生气、害怕、伤心、恶心以及中立等情感状态[11],并根据学习者不同情绪提供不同干预措施。 坎特伯雷大学Zakharov 等开发EER-Tutor,通过对眼睛、眉毛以及嘴唇的追踪,提取面部表情,可识别开心、微笑、生气、沮丧及中立[12],通过制定相应规则赋予教学代理情感以及个性化情感反馈。 Zatarain-Cabada 等开发基于移动设备的FERMAT,通过手机摄像头收集面部表情,采用神经网络算法对面部表情进行识别, 由诊断性测试得出学习者的知识水平, 以此根据学生者的情感状态和知识水平进行个性化教学[13]。 英属哥伦比亚大学Jaques 等利用眼动仪, 收集学习者对ITS 界面的注视数据特征,利用随机树、朴素贝叶斯、逻辑回归等分类法,可识别无聊、好奇以及感兴趣等情感状态,并具有较高的准确率[14]。Litman 等开发ITSPOKE,通过麦克风提取声韵、语音强度、音量、持续时间等语音特征,可识别消极、积极以及中立情绪[15]。 Amershi等利用生理传感器,收集学习者皮肤导电率、心率、肌肉活动等生理信号,通过无监督分类识别开心、悲伤、钦佩、批评、骄傲以及羞耻等[16]。

此外, 也有研究通过收集多模态数据识别学习者情感。如Paleari 等开发VALERIE,利用摄像机、麦克风、鼠标以及生理传感器等,收集面部表情、语音语调、生理数据等,并根据学习者不同的情绪赋予智能代理不同的性格。 初步实验表明,VALERIE 具有良好的性能[17]。 Lin 等开发的ATS 中,融合面部表情及语义信息,以识别学习者情感,并赋予教学代理情感给予学习者反馈, 采用准实验研究设计的结果表明,ATS 有助于提高学习表现[18]。 虽然,ATS 研究正致力于识别更精准、 更加丰富的学习情绪, 但事实上, 一些基本情绪在学习过程中很少或者几乎不会产生,如恶心、恐惧、伤心等。若致力于提高这些情绪识别的研究, 对促进ATS 教学效果的作用微乎其微。 因此,大多数ATS 开始针对特定的学业情绪进行识别研究,如困惑、厌倦、沮丧、焦虑等[19-20]。

三、ATS 情感识别的关键技术

(一)情感采集

人们通过面部表情、肢体动作、语音会话等多种方式向外界传递情感。目前,最常见的用以识别学习过程中情绪特征的来源,为面部表情与日志文件。面部表情是情绪表达最明显、直观的方式,通过提取眉毛、眼睛和嘴唇变化等特征,以识别学习者情绪。 通常, 面部表情可通过照相和摄像装置拍摄、 录制获取。日志文件的数据既反映了学生与系统的互动情况,又间接反映了学习者的情感状态,如,当对一个问题重复提交相同错误的解决方案, 可能表示学习者目前正处于较为负面的情感状态,例如沮丧、懊恼等;当学习者长时间没有进行操作时,可能正处于迷惑状态或者走神等。这些学习行为的操作记录,可通过系统后台获取。 此外,肢体动作,例如,身体姿势、手势等能可靠地传达情绪信息。通常,肢体动作可通过摄像装备、 体感机和深度摄像机, 如Kinect 等获取。随着无线电技术的发展和覆盖,可穿戴传感器被用来识别人体动作并取得较好效果。 语音会话是人类所特有的表达情绪的重要手段, 与面部表情构成直观的情绪表达方式,语音可通过手机、计算机自带录音设备、话筒、采音器等设备获取。 生理信号包括心率、血压、心电、肌电、脑电、皮电等,可通过相应生理传感器获取,例如,无线血压监测仪可收集血压信号,心脏传感器等可收集心率信号。

(二)预处理

为了便于后续信号特征的提取, 我们需要对所有采集的信号进行预处理。 人脸以及肢体动作识别均涉及图像的预处理, 目的是为了消除图像中的冗余信息,去除干扰、噪声,增强特征信息,从而提高图像识别的可靠性。 常用方法包括直方图均衡化、去噪、归一化等。 对学习行为数据的预处理,主要包括数据的筛选、编码等。 语音信息在采集过程中由于人类发声器官和语音采集设备会产生混叠、失真、高频等现象,需要对语音信号进行预加重、分帧和加窗等预处理操作,以提高特征提取质量。 生理信号是较微弱的电信号, 且在采集过程中易受噪声以及其他信号干扰,例如,人体、采集设备和电磁环境等。 因此,预处理操作包括去噪和去伪迹, 常用的方法包括数字滤波器、独立分量分析、数学形态学和小波变换等。

(三)特征提取

特征提取是情感识别中的核心步骤, 决定着最终识别结果的准确度。主要包括以下四种提取方式:

1.面部表情

常用的面部表情提取方法,包括几何特征提取、纹理特征提取等,面部表情变化主要从眼睛、鼻子、嘴唇、下巴等区域的形状以及相对位置的变化反映,几何特征是对相关部位的形状以及结构关系变化的几何描述,可作为人脸识别的重要依据。Ekman 等提出面部表情编码系统,将人的基本表情分类为高兴、悲伤、惊讶、恐惧、愤怒和厌恶等六种,并给出了具体面部表情变化[21]。 例如,当处于高兴状态时,眉毛下弯、唇角向后拉升、牙齿可能外露以及脸颊抬起等。纹理是一种反映图像中同质现象的视觉特征, 体现物体表面具有缓慢变化或者周期性变化的表面结构组织的排列属性, 纹理特征的提取一般通过一定大小的窗口,从中取得纹理特征,常用的方法包括局部二值法、离散余弦变换等。

研究早期大多采用几何特征提取方法,Cohen等用几何表示面部运动单元, 面部运动单元组合成七种基本表情类别, 通过朴素贝叶斯分类算法进行表情识别[22]。 近年来,面部表情的研究集中在复杂环境中表情识别、复杂精神状态分析、疲劳检测、心理压力分析以及智能虚拟代理中的表情识别等[23]。

2.肢体动作

肢体动作也是传达情感的重要方式,例如,当处于高兴状态,人会欢呼雀跃,当处于极度害怕时,会四肢僵硬。由于学习者通常采取坐姿进行学习,对于肢体动作的特征提取, 一般考虑手势和上肢动作的特征提取。主要包含灰度值特征、纹理特征以及形状特征。 此外,一些研究表明,在学习过程中对座椅以及座椅后背的压力差,也可以用来识别学习者情绪,且识别率高达70%[24]。

3.语音会话

对于语音信号的特征提取,主要在语速、基频、强度和声质等参数上。 Murray 和Arnott 总结出人类语音效果和情感的一般对应关系[25],为计算机语音识别的特征提取提供了参考,如表1 所示。当个体处于恐惧状态时,语速加快,基频变化范围提高;当处于愤怒状态时,基频范围提高,能量增加,伴随着重读音节突变、语速加快等现象;悲伤和厌恶时的语速均变慢,同时基频向下变形;而高兴时的语速有可能较快或较慢,基频较高,基频向上变形。皮卡德指出,语音情绪变化与内在生理结构具有密切联系, 当个体处于恐惧、生气或喜悦时,语速加快,音量提高,这是因为这些情况唤起了交感神经系统, 从而提高了心率、血压和肌肉的紧张度。当处于烦恼、悲伤时,语音会有相反的变化,则与副交感神经紧密相关。

4.生理信号

通过学习者面部表情、身体姿势和语音语调,可以获取学习者情感状态, 但这类信号容易掩饰或伪装,难以排除主观因素的影响,有时并不能真实地反映人的情感状态。生理心理学研究表明,生理信号变化比表情、 姿势或语音, 更能反映人的真实情感状态。这类信号由神经系统和内分泌系统所支配,具有自发性,不易受主观意念控制等特征,因此,往往能获得客观真实的情感状态。

表1 语音效果与情感状态一般对应关系

生理信号常用的特征包括时域、 频域、 时频域等。 研究早期,国内外主要采用皮温(Skin Temperature,SKT)、血压(Blood Pressure,BP)、肌电图(Electromyogrm,EMG)、心电图(Electrocardiogram,ECG)、皮电反映(Galvanic Skin Response,GSR)、呼吸作用(Respiration,RSP)等生理特征识别情绪。 近年来,随着神经生理学以及脑成像技术的发展, 脑电图信号(Electroencephalogram,EEG) 因具有较高的时间精度,而受到研究人员的重视。 Eimer 等使用人脸图片作为情感诱发材料[26],并通过比较脑区相关点位的差异来识别惊恐和中性情绪。Zouridakis 将原始脑电信号映射到常用频段上, 将频段能量作为脑电特征来识别不同情绪[27]。

(四)情感识别

1.人工神经网络(Artificial Neural Network,ANN)

人工神经网络从信息处理角度对人工神经元网络进行抽象, 构建简单模型。神经网络是一种运算模型,由大量的节点相互连接构成。 由于神经网络具有自学习功能,因此,被广泛应用于图像识别分类中。新西兰梅西大学(Massey Universiry)开发了一套面部表情自动分析系统,该系统主要由三个部分组成:基于人工神经网络的人脸检测、人脸特征提取、模糊人脸表情分类器。 该系统能够准确地识别七种情感状态:惊喜、快乐、悲伤、困惑、厌恶、愤怒和中性状态[28]。

2.支持向量机(Support Vector Machine,SVM)

支持向量机是目前应用最为广泛的分类方法,在解决小样本、 非线性及高维模式识别中表现出特有的优势。其基本思路为:寻找超平面,将样本分割,从而进行分类,分割的原则是间隔最大化。对于低维不可分数据,SVM 通过构造核函数, 将其映射至高维空间进行分割。 由于采用不同的核函数会导致不同的SVM 算法,因此,核函数的确定是SVM 的关键。

3.贝叶斯分类器(Bayes Classifier,BC)

贝叶斯分类器是建立在贝叶斯定理基础上的分类算法,其原理是通过对某对象的先验概率,利用贝叶斯公式计算出后验概率, 即该对象属于某一类别的概率。 常见的贝叶斯分类器包括Naive Bayes、TAN、BAN 和GBN。

4.隐马尔科夫模型(Hidden Markov Model,HMM)

隐马尔科夫模型是基于概率统计的模型, 用来描述一个含有隐含未知参数的马尔科夫过程, 其基本思想是通过可观察的参数确定隐含参数, 通过隐含参数进行模式识别和分类。 隐马尔科夫已在语言识别、 自然语言处理、 模式识别等领域得到广泛应用。 如,高慧等通过HMM 从汉语语音中识别平静、生气、欢快和悲伤四种情绪[29]。 近年来,HMM 也被用于生理信号识别, 如,Albornoz 等利用HMM 对脑电情绪进行识别[30]。

5.K 最近邻(k-Nearest Neighbor,KNN)

K 最近邻分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。 该方法的思路是:如果一个样本在特征空间中的k 个最相似(即特征空间中最邻近) 的样本中的大多数属于某一个类别,则该样本也属于这个类别。例如,闫静杰等通过稀疏典型相关分析方法,融合人脸表情和语音两模态情感特征,使用K 近邻分类器进行双模态情感识别[31]。

四、ATS 导学模型

(一)ITS 模型及其智能技术

通常,ITS 基本框架包括专家模块(领域知识模块)、学生模块、导学模块和用户界面模块,如图2 所示。 在导学模块中,ITS 强调根据学习者知识水平与教学目标,以合适的教学策略呈现合适的教学活动,旨在更好地提供个性化教学, 包括以适合学习者风格的方式呈现学习材料, 针对学习者的反应给予个性化反馈,以帮助学生者主动构建问题解决方案等。大多数ITS 具备三类智能技术:课程排序、智能解决方案分析和问题解决支持[32]。 课程排序技术的目标是为学生提供最符合个人的学习序列 (学习案列以及学习问题等),帮助学生找到“最佳学习路径”。 智能解决方案分析,旨在分析学生的问题解决方案。与只能判断答案是否正确的非智能检查器不同, 智能分析器可以判断答案是否错误或不完整, 以及是哪些缺失或不正确的知识导致错误的产生。 智能分析仪可以为学生提供错误反馈并更新学生模型, 问题解决支持的目标是为学生提供解决问题的智能帮助,如给出提示、反馈等。

图2 ITS 的基本框架

随着Web 技术的不断发展,自适应导航支持、自适应信息过滤、智能协作学习、适应性群体形成与同伴互助、智能班级监控等智能技术,逐渐融入智能教育系统,为自适应学习提供更加完善的技术支持。

(二)ATS 现有模型

1.学习者情感

近年来,神经科学、心理学和教育学关于情感与学习的关系, 促使ITS 领域的研究重点从认知过程向情感认知过程转变[33]。 相关研究表明,情感或情绪可以影响人类行为和认知过程的各个方面,如,注意力、长期记忆、决策、理解、记忆、分析、推理和知识应用。学生的情感状态可以影响其解决问题的能力,甚至影响学习过程和学习动机。通常,积极情绪在创造力的发展和问题解决过程中发挥着重要作用, 积极情绪可以提高学生的学习动机。 当学生具有动力去学习时,思维能力和获取知识能力会得到加强;而当学生感到消极时,思维会受到阻碍。 因此,在ATS 的导学模型设计中,不仅要考虑到学习者的知识水平,还要考虑自适应学习者的情感状态。

如图3 所示,Sarrafzadeh 认为的ATS 基本框架,包含与ITS 相一致的模块,即领域知识模块、教学模块、学生模块等[34]。 不同之外在于,Sazzafzadeh 认为在学生模块中,不仅包括学习者知识水平,还应存储学习者的非言语行为, 以便更好地进行情感识别,例如,身体姿态、面部表情、生理信号与语音会话等;导学模块通过分析现有知识水平和情感状态后,呈现不同的教学策略,例如,在Easy with Eve 中,当通过面部表情识别为厌倦或无聊时, 系统会改变当前呈现的内容, 并通过知识评估检测当前内容是否掌握;当面部表情检测为迷惑时,会根据学习者知识水平,选择呈现前一章或者后一章的学习内容。

图3 Sarrafzadeh 情感导学系统基本框架

2.学习兴趣、压力

大量的研究表明, 学习兴趣与学业成就紧密相关。通常,对某个学习活动或者主题感兴趣的学生,会主动花费更多的时间和精力去思考、 参与和完成任务,进而得到更好的学业表现。 兴趣可分为情境兴趣和个人兴趣。情境兴趣是指学生在某个情境下产生的较为短暂的兴趣,它可能被一个奇怪的问题或是令人惊讶的故事触发,情境兴趣被认为是影响学业成就的重要指标之一[35]。 而个人兴趣则是指相对长久的偏好,学生可能对某种特定的主题、活动感兴趣。

该系统还可以通过学习者自我评估模型以及生理分析设备系统, 获取学习者对学习内容的学习兴趣、压力以及学习效率,旨在通过模型训练使学生情感模型能够独立反映学习者的兴趣、压力以及效率。首先,学生通过问卷调查对学习兴趣、压力等进行自我评估。 其次,收集学生各项生理数据,如心率、血压、体温等,采用逻辑回归、方差分析、神经网络、序列分析等方法,建立生理数据与学习兴趣、压力的关系。研究表明,生理数据能较为准确地反映学习者的兴趣、压力以及学习效率等,如,较高的学习压力通常表现为较高的血压和心率[37]。 最后,根据学生情感模型,以合适的风格(文本、音频、视频等)以及合适的顺序呈现学习内容。

3.学习风格

学习风格是指学习者对不同学习方式的偏好。自学习风格这一概念被提出以来, 研究者即对学习风格进行了大量的探索和研究, 产生了诸多学习风格理论及模型。 VAK 学习风格理论,将学生的认知风格分为视觉学习型、听觉学习型以及动觉学习型。由Felder 和Silverman 提出、被广泛采用的学习风格模型(FS 学习风格模型)认为,学习风格是个体获取并处理信息的偏好[38]。 虽然,关于学习风格与学习成就的关系仍存在争议,然而有大量研究表明,以符合学习者学习风格的方式进行教学, 可以带来更好的结果。 然而,存在两个关键问题,即在ITS 或ATS 教学中如何将学习者的学习风格建模? 以及如何自适应个人学习风格来展开教学?

现有ITS 通常使用自我评估问卷,如Wang 采用FS 学习风格量表评估学习者风格[39]:活跃型学习者更喜欢动手实践; 而沉思型学习者更喜欢独立思考问题;感知型学习者喜欢具体的、有实践性的学习材料;而直觉型学习者更喜欢理论或者抽象的材料,如数学公式等。 之后,根据不同学习风格特点,自适应地呈现学习材料。此外,也有研究通过分析学生使用ITS 的行为,来评估学习者的学习风格,如Latham 等开发基于对话的智能导学系统Oscar, 基于FS 学习风格模型,根据学习者与Oscar 的对话交互,对学习者的学习风格进行建模预测。 根据FS 模型,Latham确定了对话交互的数量、 回答问题的数量、 阅读时间、理论性问题得分、实践性问题得分等13 个行为变量来表征学习风格。研究结果表明,不同风格的预测准确率达61%至100%,且该系统能有效提高学习者13%的学业成绩[40]。

4.智能教学代理

社会认知理论强调学习是高度社会化的活动,与教师、同伴、教学材料和教学环境等的互动,影响学习者的认知和情感发展[41]。 当个人进行智力活动时,与同伴、工具和情境等的互动,可以有效提高学习表现,建构个人认知图式。 因此,在教学过程中未能提供有助于构建认知和智力的社会认知因素,将难以完成教学目标。 传统的ITS 旨在模拟教师,提供一对一的教学,然而,这些学习环境通常无法提供社交互动。随着计算机技术的发展,教学代理的设计可以解决ITS 环境中社会认知因素方面的缺失。教学代理是导学模块中十分重要的一部分, 负责教学策略的实施,是智能化的充分体现。教学代理通常具有一般的会话和辅导功能,例如,进行问候、介绍、设置任务、回答问题、提供指导、反馈、解释、评估等。在教学代理的相关研究中,为了更好地模拟交互环境,促进学习交流,教学代理被设计成不同的角色,如专家、导师、学习同伴等。随着情绪对学习的影响被日益重视,一些学者认为,在ATS 教学过程中,还应考虑教学代理的情感状态设计, 达到深度情感交互。 如,Paleari 等设计MAUI 框架, 充分考虑学习者与教学代理的情感交互,通过收集生理信号、语音会话、面部表情等,分析学习者情感状态。教学代理通过模拟人类教师, 根据学习者情感状态呈现相应的教学代理情感[42]。

Zakharov 等开发的EER-Tutor 通过可供选择的四位智能代理:Callie、Diane、David 以及Mark 进行教学。其中教学代理情感状态的呈现,依据学习者情感状态以及认知状态, 并通过一系列规则呈现给学习者,如表2 所示[43]。针对负面情绪,EER-Tutor 采取情感导向性信息反馈。例如,当学习者没有提交问题解决方案时,教学代理回复“你此刻显得很沮丧,如果你不喜欢这次学习,我很抱歉”。 当学习者提交的方案存在错误时,教学代理会鼓励学习者找出错误,如“不要沮丧,你很快就能解决这个问题”。当学习者反复请求新问题时,教学代理会回复诸如“如果你感到不开心,我很抱歉。我希望你能找到一个可以解决的问题”。“你看起来有点沮丧,何不尝试一个简单一点的问题呢”?“你对这种体验并不满意,如果本次学习对你不顺利, 我感到很抱歉”。 通过实验证明,EER-Tutor 与学习者的深度情感交互功能提高了学习者学习满意度。

由于ATS 研究技术要求高、难度较大,目前大多数研究将其纳入学习者内部因素,如学习者情感、学习风格、学习兴趣,包括融合多模态情感,以提高情感识别率和可信度、 动态自适应学习者风格和学习兴趣; 而在如何更好地实施情感化和个性化教学方面,即导学模块的教学策略研究仍然较少。导学模型是专家模型和学生模型的桥梁, 是教学策略的用武之地,是在识别学习者情感、学习风格和学习兴趣等因素之后, 研究如何更好地实施教学以提高学习者的表现,对导学模型的研究是有重要意义。本文基于社会认知理论、学习风格理论,基于FS 学习风格模型,提出了基于学习者情感、学习风格和学习兴趣的导学模型,以期根据学习者情感、风格和兴趣提出相应的教学策略。

城市中心广场仍保留有耸立的列宁雕像,连同花岗岩底座据目测高达4米,同时小克里姆林宫一侧建有无名烈士纪念碑,碑前是永不熄灭的长明灯火!忘记历史意味背叛,战斗的俄罗斯民族的这一特性值得世人敬仰。

表2 EER-Tutor 智能教学代理行为规则

(三)理论基础与导学模型构建

1.社会认知理论

社会认知理论是社会心理学的重要理论之一,旨在解释人在社会情境中的行为调节机制。

班杜拉(Albert Bandura)认为,可用人类能动性来解释人在社会环境中的功能。人类能动性分为:个体能动性、中介能动性和集体能动性[44]。Kim 和Baylor认为,基于此可以构建ITS 教学代理的三种角色:个体能动性对应响应同伴, 即教学代理允许学习者个体主动选择合适的任务, 对学习者的问题请求给予回答,设计时需要考虑到教学代理的能力、年龄、学习方式等因素;中介能动性对应同伴模型,即教学代理与学习者分享共同的属性来增加学习者的社会构建;集体能动性对应合作者,教学代理通过分享专业知识和技能帮助学习者达成学习目标, 多个教学代理共享合作可增加社会环境的丰富性[45]。

2.学习风格理论

由Felder 和Silverman 提出的学习风格模型被广泛应用于教育领域。 依据不同的学习偏好,Felder和Silverman 将学习者分为五类: 感知型与直觉型、视觉型与听觉型、归纳型与演绎型、主动型与反思型以及顺序型与全局型[46]。 感知型学习者喜欢通过观察、感知来获取信息,而直觉型学习者则喜爱使用猜测、想象力、直觉等。 Felder 和Silverman 认为,虽然每个人都会同时使用感知和直觉来学习, 但大多数人都会对其中一种有所倾向。在传统课堂上,一名教师不可能同时满足不同风格的学习者。然而,智能导学系统等个性化学习软件的出现, 使得一对一教学成为可能,融入自适应学习风格的智能导学系统,将有助于进一步提高学习者的个性化教学。

3.基于学习者情感和FS 学习风格的导学模型及教学策略

基于社会认知理论和学习风格理论, 本文提出基于学习者情感和学习风格的导学模型, 如图4 所示。 首先是学习者情感状态的检测与学习风格和学习兴趣的评估。 模型通过融合面部表情、语音会话、肢体动作、生理信号等数据进行情感识别,通过知识水平评估测试、历史学业成绩、学习风格自测与学习兴趣自测等方式,确定学习者认知水平、学习风格与学习兴趣。其次是导学模块。模型重点关注情感表达与智能导学两方面。 情感表达指ATS 通过教学代理表达拟人化的情感关怀, 一般需要设置教学代理的面部表情、肢体动作、语音声调等,使其能根据学习者情感以及认知水平等,模拟人类教师进行智能化辅导。 例如,当学习者表现出沮丧情绪时,ATS 及时以鼓励式口吻激励学习者并提供有价值的建议。 智能导学是指根据学习者知识水平、 学习兴趣和学习风格等,通过教学代理实施智能化个性教学。

图4 基于学习者情感和认知风格的导学模型

教学策略的目的在于激励学习者参与学习;帮助他们集中注意力;激发对学习的好奇心;培养批判性思维技能;保证任务完成度;提高课程内容的学习效果等。 Boulay 和Luckin 总结了三种获取教学策略的方法, 以便运用在ITS 的发展中, 即观察人类教师、 研究学习理论、 观察学生与ITS 的互动[47]。Astleitner 提出了FEASP(害怕、嫉妒、生气、同情和快乐)教学策略,以提高学习过程中的积极情绪,减少消极情绪[48]。Zikuda 等提出ECOLE(学习的情感和认知)方法,旨在提高学习过程中的兴趣、快乐和满足等,同时减少焦虑和厌倦。 ECOLE 方法基于自我调节能力、 社交互动等指导方针提出10 种教学策略,包括明确教学结构、根据学生知识和技能水平提供学习内容以及教学过程中融入教师情感等[49]。

Mile 指出,大多数教学策略都是基于教学、实践和测试三个步骤[50]。 本研究借鉴Mile 的教学策略三步骤,在社会认知理论和学习风格理论的指导下,提出基于学习者情感和认知风格的教学策略。在教学、实践以及测试过程中,ATS 应能充分发挥导师、学伴以及顾问的角色,如,根据学习者知识水平以及情感状态等自适应地教学(导师),同学习者一起探索、讨论学习过程中遇到的问题(学伴),以及给予学习者有价值的学习建议(顾问)等。

(1)教学。 在课程的选择方面,课程材料和教学过程应结构清晰明确(减少困惑、厌倦);让学习者有机会自己选择学习主题(提高学习兴趣、动机和参与度);提供适合不同认知水平的学习内容(适应学习者认知水平)。

在材料的呈现方面,ATS 应能根据不同学习风格呈现不同学习材料。具体表现为:提供事实性信息如数据、实验及其结果等(感知型学习者)和抽象概念如原理、理论、数学模型等(直觉型学习者);提供强调实用的问题解决方法 (感知型、主动型)与强调理解的材料(直观型、反思型);提供理论解释(感知型、归纳型)和理论形成(直觉型、纳型、顺序型)的具体例子, 展示如何验证理论并推断其结果 (演绎型、 顺序型)以及理论的应用情况(感知型、演绎型、顺序型);使用图片、图表、草图(感知型、视觉型)以及电影、音频等展示材料(感性型、视觉型、听觉型)。

在教学过程中,ATS 应激励学习者尽可能将所呈现的材料与先前学习的内容, 或是学生的个人经历(归纳型/全局型)联系起来。 并根据学习者情感状态呈现教学代理的情感,如,当学习者表现为高兴状态, 且该知识点内容已掌握, 教学代理应表达出高兴、欣慰等表情,并通过语音传达祝贺;当学习者表现为迷惑状态,且该知识点正处于学习中,代理应表现出同理心;当学习者表现沮丧状态,且该知识点未掌握,代理应以鼓舞的口吻,建议其从低难度知识点开始学习。

(2)实践。 在学习者练习过程中,ATS 应鼓励学习内容应从低难度、 高兴趣开始, 逐步过渡到高难度、低兴趣,即学习者在学习过程中,应先掌握基本知识点,后逐步过渡到攻克难点。 同时,还应给予学生选择任务难度的机会,或者提供更高难度的任务,从而激发学生的能力;在指导学习者时,赞扬学习者提交的答案,即使有时提交的答案存在问题。 同时,ATS 应能提供从不同角度解决问题的思路。

(3)测试。 在学习者进行测试时,ATS 提供多种难度测试的选项,并给出选择的建议;展示学习者的进步,并鼓励学习者去学习更高难度的内容;对学习者尚未掌握的内容,提供指示性的讲解;对学习者的进步给予充分的肯定与赞扬;当学习者表现不好时,给予激励与鼓舞,并提供有价值的建议。

五、ATS 未来发展走向与挑战

(一)采用多模态融合技术,提高情感识别精度

情感是一个融合面部表情、 身体姿势、 语音信号、生理信号等多模态融合的结果,因此对于情感识别也应是多模态融合识别问题。 单模态情感识别存在自身局限性,不能全面反映人的情感状态。大量研究表明,多模态情感识别准确率高于单模态。未来情感识别研究应融合面部表情、身体姿势、语音信号和生理信号等多模态情感信息, 多模态情感识别的关键在于融合各模态识别结果。 常用的信息融合层次包括像素层融合、决策层融合和特征层融合,当前常用的多模态情感识别主要采用多分类器组合的决策层融合和特征层融合。

(二)强化硬件设施装备,实时智能化情感反馈

现有的情感识别分析研究大多基于情感数据库的实验室研究,例如,FABO 表情和姿态双模态情感数据库、HUMAINE 多模态情感数据库、SEMAINE 试听数据库等, 情感采集与情感识别往往存在较大延时性。 多模态的情感数据处理给计算机信息处理性能带来挑战,传统计算机对实时处理诸如皮肤阻力、声音振动、 眼球运动等微妙特征的变化显得力不从心, 因此未来将需要更多相应的设备辅助运算。 由此,Sarrafzadeh 提出使用嵌入式处理器进行分布式网络计算, 对于不同的情感数据使用相应的嵌入式处理器并行运算的观点。

(三)实现深度人机交互,全面促进深度学习

智能导学专家格雷泽教授表示, 如果导学系统旨在帮助学习者进行浅层次学习, 那导学系统的作用将无从体现,甚至画蛇添足[51]。 未来导学系统应能够有效地帮助学习者从浅层次学习推向深层次学习。这需要提高学习者和导学系统的深度人机交互,在学习过程中,系统应能通过提问、讨论、反馈等功能充分促进学习者有效地思考与反思。

(四)融入具身认知理念,实现动态知识获取

具身认知理念认为, 生理体验与心理状态之间有强烈的联系,生理体验与心理体验能互相激活。已有研究表明,情绪、记忆、概念知识等具有具身特性。简言之,具身认知理念强调动作操作,强调与环境的互动。具身认知理念作为人机交互的指导理念,逐渐被引入导学系统的设计中。 学生通过与系统互动进行动态知识获取,比被动观察学习更加有效。

(五)注重伦理道德问题,健全隐私保护机制

人类已悄然迈入人工智能社会, 人工智能的迅速发展正深刻地改变人类生活、改变世界。人工智能与信息科技的进一步发展和升级, 使得智能机器人更加接近于“人”,由此产生不单是法律问题,同时也是深层次的伦理问题[52]。 装有摄像头、传感器的智能教学系统可记录学生的学习行为过程, 甚至是心理活动, 这些用以评估学习者认知水平和学习状态的数据可为个性化教学提供判断依据, 同时也可能产生伦理道德问题。如何更好地利用密码学、机器学等相关知识健全隐私保护机制, 制定相关法律法规将是未来的另一个挑战。

六、总结

新兴教育技术的更迭促进教育的变革。 21 世纪以来,随着信息科学的迅猛发展,网络学习、移动学习等无缝式学习环境、大数据、学习分析、云计算与人工智能等技术,已然颠覆了传统学习方式。然而无论技术如何更迭,对教育研究者而言目标只有一个:更好地促进教育,让技术回归教育本质。

随着科技的发展,神经科学、心理学与认知科学等对学习过程中情感的关注, 情感计算被纳入智能导学系统的发展中,出现了情感导学系统。本文基于文献研究梳理了情感导学系统的缘起与发展, 对情感导学系统的情感识别技术进行了概述, 并在社会认知理论及学习风格理论的指导下, 提出了基于学习者情感和认知风格的导学模型以及教学策略,模型旨在提供个性化、人文化的学习体验。值得注意的是, 该导学模型和教学策略仅是基于相关学习理论以及前人研究基础上,对融合学习者情感、学习风格和兴趣的情感导学系统,作理论上的研究与探讨,模型以及教学策略还需在未来通过不断的教学实践进行修正。由于情感导学系统技术要求高,情感识别难度大,目前相关研究仍然较少,国内在个性化系统中引入情感识别来提高系统的自适应性的研究更是少见[54]。 因此,积极对情感导学系统模型进行建构和探讨非常必要且意义重大。

随着5G 时代的来临, 基于5G 的物联网技术、传感器技术等与智能导学系统的结合有望进一步改善人机交互,助力智能化学习[55]。 “5G+AI”技术与智能导学系统的融合, 也有望进一步提高情感识别的准确性。 因此,随着科学技术的发展,我们对于未来智能导学系统能否扮演真正人类教师的角色, 持有积极的态度,相关研究有待进一步的深化。

猜你喜欢

导学学习者智能
你是哪种类型的学习者
三角函数考点导学
“概率”导学
十二星座是什么类型的学习者
青年干部要当好新思想的学习者、宣讲者、践行者
智能前沿
智能前沿
智能前沿
智能前沿
高校学习者对慕课认知情况的实证研究