APP下载

任务型对话机器人的设计及其应用

2021-04-06于丹闫晓宇王艳秋来关军肖鹏王宇

软件工程 2021年2期
关键词:在线教育

于丹 闫晓宇 王艳秋 来关军 肖鹏 王宇

摘  要:基于Agent代理技术的对话机器人技术已经广泛地应用于电子商务、在线教育和医疗服务等领域。不同领域对话机器人的功能既具有相似性,又具有差异性。本文首先介绍了对话机器人和机器人的区别与联系,重点分析了功能性任务型对话机器人的发展、应用和实现方式,探讨了对话机器人功能实现的理论基础和关键技术。在此基础上系统地探讨了教育领域中任务型机器人的设计思路、具体功能和对应的技术框架等。

关键词:任务型对话机器人;在线教育;智能导学

Abstract: Chatbot technology based on Agent technology has been widely used in many application fields such as e-commerce, online education and medical services. Functions of chatbot used in different fields have both similarities and differences. This paper first introduces the differences and connections between concepts of chatbots and robots, and then, analyzes the development, application and implementation of task-oriented chatbots. The theoretical basis and key technologies of realizing the functions of dialogue robot are discussed. After that, this paper describes the functions and corresponding technical framework of task-oriented chatbots in the field of education.

Keywords: task-oriented chatbots; online education; intelligent tutoring

1   引言(Introduction)

机器人对人类的发展起到了巨大的作用,可以帮助人类摆脱很多繁杂琐碎的工作,将时间和精力转移到一些更具有价值的事情上。随着人工智能的发展,人与机器的交互也越来越多,机器可以通过多种模式的交互过程帮助人们完成一些任务,其中人机对话系统,也称为“对话机器人”,是产业界最为关注的领域之一。这类机器人本质上是Agent代理技术,而不是指传统意义上的实物机器人,如机器臂、机器狗或运动机器人等[1,2]。

人机对话系统主要解决人与机器的对话与交流问题,借助自然语言进行信息的傳递。人机对话系统的最终目标是希望人与机器之间交流顺畅、自然,达到类似于人与人之间的语言交互[3]。由于人与人之间最重要的交流方式是对话,因此研究对话系统意义深远。随着人工智能理论和技术的飞跃发展和进步,对话系统将不断向前发展,潜力无限。人机对话系统的深入研究不仅是科学进步的时代诉求,也是社会生产力变革时期的重要机遇。

完整的对话系统涉及丰富的多学科理论和技术,如计算机科学技术中的语音技术、计算机视觉技术、自然语言处理、知识工程、认知与推理,也包括心理科学和语言学中的各种理论[4-6]。人机对话机器人的研究与发展,尤其是对任务型对话机器人的探索,将有助于提升人机交互模式下的社会工作效率。随着深度学习在各个领域的运用,其近期更是表现出对自然语言处理的显著效果,让对话机器人的发展有了新的突破方式。随着深度学习的相关技术不断创新和发展,对话机器人的助力作用将越来越显著[1,3]。

文章主要围绕任务型机器人功能实现所涉及的理论基础、实现流程和关键技术展开探讨,在此基础上系统地探讨教育领域中任务型机器人的设计实现框架、具备的功能和关键技术方案等。

2  相关研究和技术(Related research and technology)

2.1   任务型对话机器人

任务型对话机器人(Task-oriented Chatbot),也称任务型对话系统或多轮对话系统,本质是一个为了满足用户某些具体需求(也就是任务)而产生的多轮对话的人机交互系统。这个人机交互系统通过理解、澄清等方式来确定用户意图,继而通过答复、调用API等方式满足用户的需求,达成任务。为了完成这些任务,对话系统需要理解上下文信息并做出如澄清等行为,从而完成任务答复,或调用其他相关程序等待下一步的动作。系统利用各种各样的任务来驱动和实现多轮对话。任务型对话机器人通常在相对独立封闭的专业领域中使用,该类机器人需要在对话过程中理解、澄清、生成对话。

与任务型对话机器人相对,其他两类机器人分别是闲聊型对话机器人(Chatbot)和问答型对话机器人(QAbot)[1,3]。闲聊型对话机器人主要与用户进行没有边界限定的闲聊,目标是与用户进行有意义的、自然的多轮次对话,通过产生有趣、富有个性化的答复内容,与用户进行互动。相比于任务导向型对话机器人,闲聊型对话机器人主要以满足用户的情感需求为主,所涉及的问题或对话领域范围更大,用户意图更模糊难识别,因此技术要求更高,实现的困难性更大。问答型对话机器人主要实现一问一答的对话形式,机器人对用户提出的问题进行解析,在知识库已有的内容中查找并返回正确答案。对于机器人而言,每次问答均是独立的,与上下文信息无关。这类机器人主要是在购物等服务领域被广泛使用。

当然,一个对话机器人并非只包含一种类型的对话,通常是多种对话类型的组合。多轮对话的本质是围绕用户意图进行的,对于任务型对话系统的设计,则需要考虑意图跳转、多意图任务、指代识别、槽位继承等多种复杂的对话策略。

对于对话机器人来说,最核心的能力就是准确“感知”与正确“决策”。其中感知就是对问题的理解和逻辑推理,而决策就是根据对问题的感知进行的对话策略。用户提出的问题主要包括三种类型:事实型问题、计算型问题和逻辑推理型问题。任务型对话机器人的评价关键是帮助用户获取相关信息和辅助决策的能力,背后的基础是以知识库为基础资源的问答系统。

2.2   任务型对话机器人的实现方式

构建任务型对话机器人有两种实现方式,分别为流水线方式Pipeline(也被称为基于规则的实现方式)和端对端方式End-to-end[4,7-9]。

(1)流水线方式

基于规则的方式一般采用流程和模块化的结构,核心模块主要包括四个模块,分别为自然语言理解、對话状态追踪、对话策略学习和自然语言生成。基于规则的构建方式虽然容易实现、可解释性强,但各模块之间相互独立,不能灵活地进行联合调优,误差会逐层积累。随着选取的交互方式的不同,如仅基于文本自然语言对话系统、基于语音对话系统,或基于视频语音融合,模块和实现流程会有所变化或增减,如图1所示。图1给出了基于图像、语音和文字等多模态数据的对话系统流程样例。

表1归纳了不同对话系统的模块构成,基于文本的对话系统仅包括四个模块,随着互动信息类型的增加,即随着语音或视频的加入,对话系统变得更加复杂和多元化。

(2)端对端方式

任务型对话机器人的另外一个实现方式是“端对端”的实现方法,即基于深度学习的端到端模式,通过构建一个从用户端自然语言输入到机器端自然语言输出的整体映射关系,实现原始数据在输入端进入模型,在输出端得到结果的目标。这种方法的优点是扩展性强和灵活性高,缺点是需要高质量地标注数据且对数据的数量要求很高,可解释性也较差,因此使用的程度远远不及流水线方式。现在的方式更多是两种方式的融合,在流水线模式中融入很多子模块的“端对端”模式。

2.3   教育领域中的对话机器人

由于教育领域中存在大量与学习相关的问答和查询需求,相比于其他应用场景,对话机器人在教学领域的发展更广泛,应用场景也更多,不仅可以通过语音进行交互,也可以仅仅通过文字之间的交互起到辅助教学、及时回答问题、引导学习的作用。

现阶段教育领域的任务型对话机器人最热门的研究和应用就是在线教育的智能导学系统,它的雏形是20世纪中期出现的计算机辅助教学系统。随着人工智能技术的发展和其在教育领域的深入应用,到20世纪末期发展成为具有认知能力的智能教学系统。当前的智能导学以实现个性化教学为主要目标,并在人工智能技术的推动下逐步完善。

国外智能导学的理论和应用研究起步较早。1973年,美国的Hartley和Sleeman教授等人提出了三模型结构,核心组件包括领域知识模型、学习者模型和教学模型。马萨诸塞大学安姆斯特分校Woolf教授2018年又拓展出了人机接口模型,甚至还有专家将其发展到了五模型结构。与此同时,国外还开发了很多有影响力的应用产品,比如Meta Tutor、Protus、Andes和SimStuden等。

国内智能导学的研究主要集中在学生模型、知识表示、人机交互等方面,即从学习中具体问题的解决出发来探讨相关智能导学的实现方案,如对学生学习状态模型构建的研究、知识表示和知识库构建、基于不同软硬件下的人机交互等。有研究者基于深度学习技术、Agent技术和大数据技术,已经研发出了一些智能导学产品,具有代表性的有基于Web的日语导学系统、句酷批改网、Z+Z智能教学系统等。这些模型和系统普遍存在的问题是导学的个性化和智能化程度不高。

随着学习理论和科学技术的发展,智能教学系统的教学模式从一对一扩展到了一对多、多对一,甚至多对多的形式,其适应范围从学习者的认知性方面扩充到了情绪性和社会性方面。美国孟菲斯大学Graesser教授主持研发了智能导学系统AutoTutor,并以此为基础开发了一系列学习领域包括计算机素养、科学推理等应用系统。胡祥恩2018年还提出了一种人工智能教育应用的新理论框架:学习者与教育资源对称性假设,即学习者能够在与教育资源(教学内容、学习环境、互动机制和学习过程)的互动中实现知识结构的最优化,同时教育资源也能够在这一互动中得以改进。除此之外,美国Boulder语言科技公司Ronald教授正主持开发Interactive Books和MindStar Book,专门针对解决非英语母语国家的英语教学智能导学问题。美国陆军实验室的Sottilare博士研究通用智能辅导框架,它是一个开源原型,在美欧国家有近30个机构参与GIFT的研究合作。从事相关研究的主要机构如表2所示。

3.1   教育对话机器人系统功能设计

在线教育学习过程中,学生会遇到很多问题,如学习环境没有互动、没有反馈(难以感知自己的状态)、不满足个性化、趣味性低、没有竞争激励等。对于教师来说,在线教育时常遇到难以感知学习者学习状态、评价学生困难、资料管理耗时耗力、在线教学组织困难、难以发现教学存在的盲点、不能因材施教等多类问题。对于管理者来说,需要实时感知在线教育的质量,实施对在线教学进行综合评价、监督教学效果、发现教学管理中存在的问题等操作。

用对话机器人的方式,可以非常直接和显著地帮助学生、教师和管理者提升在线教育的效率。具体来说,对于不同用户,由于需求不同应该有对应匹配的机器人,而不是由同一类机器人实现。为了解决学生、教师和管理者在线学习中所遇到问题,本文在表3中归纳了三类教育对话机器人需要解决的问题和匹配功能。

这三类对话系统既相互独立,又紧密相关,本质上是一种能够赋能在线教育的辅助教学对话系统,本文将三类机器人统称为“教育对话机器人”。教育对话机器人可以实时感知在线学习行为(如学习内容、学习时长、学习频率、团队学习的参与程度等),并实时反馈到大数据平台进行学习行为分析和知识掌握程度分析。这一系统可以被植入任何一个开发系统中。

针对不同的用户(学生、教师、教学管理者),教育对话机器人会扮演不同的身份,不同身份的机器人具有不同的功能,如图2所示。

(1)伴读机器人的功能

伴读机器人为学生服务,主要提供知识问答、学习方案推荐等服务,实时向学生反馈学习过程中存在的问题,并提供个性化推荐。伴读机器人将及时向学生反馈课程完成状态、成绩等信息,也会将学生个人知识掌握情况与全局知识图谱融合,形成个性化的个人知识树,及时将学习状态反馈给学生。伴读机器人为学生提供学习全程的个性化智能导学服务,可以发现学生自己不知道的学习“盲点”,根据每个人的学习状态定制个性化学习路径,让学生看到自己的学习路径,也能看到他人的学习路径。例如,学生在学习完PCA(主成分分析)算法后,不清楚下一步应该再学习什么,伴读机器人就会根据學生的过去学习成绩、学习内容和学习状态,给出几个建议的学习路径计划,如其他同学的常用学习路径、适合他的最优路径或最短路径等,供学生选择。

群体学习时,伴读机器人会及时反馈小组学习进度、个人学习状态、对小组的贡献率等群体学习信息。

学生可以利用伴读机器人及时查询学习过程中不会的知识点,通过点击知识图谱中的盲点,直接开始学习。如学生在学习支持向量机(Support Vector Machine,SVM)时遇到一个不熟悉的概念“损失函数”,可以直接向伴读机器人提问“什么是损失函数”,伴读机器人立即回答出对应的答案;点击对应的盲点知识,系统就会展现与盲点相关的知识和对应的学习资源等。

伴读机器人智能化还体现在可以将具有相似问题的学生自动组建“学习小组”,并从优秀的学生中选出“助教”,构建学生群体学习社区,形成互帮互助的社群,促进学习氛围的良性循环。成绩优秀的学生可以直接在社区里建立学习小组,单独为学习效果不好的学生补课。

(2)助教机器人的功能

助教机器人的服务对象是教师,它能够协助教师完成教学资源的构建,并在教学过程中及时向教师反馈学生的异常学习行为。教师可以通过助教机器人快速地构建和修改知识图谱,实时了解每个学生的学习进度和知识掌握情况;可以从数据中发现教学中可能存在的漏洞,有针对性地优化教学内容。助教机器人可以自动回复学生的常见问题,在提高学生学习效率的同时又减少了教师的工作时间。

(3)质保机器人的功能

质保机器人主要为教学管理者服务,能够提供多维度、多层级的综合评估报告。质保机器人可以提供实时、多维度智慧综合评价,能够同时向学生、教师、教务管理人员提供学习行为大数据分析服务,反馈学习态度、学习进度、学习排名,从学校、学科等多个维度整体评价教师和教学单位的建设水平,通过大数据挖掘出可能存在的教学管理问题,辅助教学管理者制定教学改革方案。

通过整合为学生实时提供帮助的伴读机器人、为教师实时提供帮助的助教机器人和为学校管理者实时提供帮助的质保机器人,可以构建完整的智慧在线教育生态系统,极大地提高在线教育的效率。

3.2   教育对话机器人的算法流程设计

以上三类对话系统都依赖于大量的人工智能算法。对话机器人的算法流程(图3)中,意图分析、情绪分析等自然语言理解等方法能够抽取出用户所提问题的关键信息,基于这些关键信息可以完成对话状态追踪并选取合适的对话策略,实现上下文信息的融合。之后,根据问题的意图,机器人会从数据库中查询回答问题所必需的信息,通过自然语言生成方法得到通顺的回复句。此外,当用户向机器人寻求推荐或想查询评估报告时,对话机器人还可以与推荐系统和学习行为大数据分析算法联动,给出用户期望的回答。

3.3   跨模态语义融合理解及对话机器人的技术实现方案

对话系统使用最广泛的方法为BERT(Bidirectional Encoder Representation from Transformers)、Bi-LSTM(Bidirectional Long-Short Term Memory)和注意力机制。由于在线教学场景人机互动涉及多种类型的数据,如文本、语音、表情、动作等,对话系统的实现必须要完成多模态语义融合理解后才能制定合理的对话策略。此外对话系统的内容自动生成,常常依赖于各个学科的领域知识图谱和智能模糊查询等技术。

对话系统的自适应性是系统被广泛使用的前提和基础。通过构建深度网络模型,用样本完成网络训练。感知学习者的多模态信息通过技术模型的嵌入层(Embedding)实现多模态数据对齐与融合输入,再利用设计的跨模态BERT网络对多模态数据进行双向编码表达,利用Bi-LSTM实现对上下文相关的语义编码,然后再利用Self-attention网络对多模态特征进行自动加强处理,最后通过Softmax处理输出感知到的学习者跨模态特征。以基于深度网络输出的多模态融合语义特征为基础,通过一个预先训练好的浅层全连接神经网络,来实现对学科知识图谱的智能模糊查询,利用网络输出解决人机互动中应答内容的自动生成技术,如图4所示。

4   结论(Conclusion)

显而易见,随着人工智能技术的不断改进和提升,人机互动的对话系统对人类社会发展的推动作用会更加显著。由于人机互动对话系统对在线教育的发展起到了显著的助推作用,与其他领域相比,教育领域中的对话机器人系统将会以更加迅猛的速度发展。

任务型对话机器人的未来发展将会与人工智能、大数据深度融合,在人工智能+大数据的有力推动下,向混合智能、个性化情感关怀和虚拟化方向发展。自动生成知识库、减少知识库运维的成本、对话系统的自学习性实现、自适应性改进、定制复杂的对话机器人将成为对话系统的研发重点。

本文提出的教育领域中的任务型对话机器人系统既可以独立地作为智慧学习平台,用于在线教育使用,也可以嵌入其他已有的在线教育平台,用于其他教育平台的改造和升级,带动其他在线教育平台提升教学效果。这样的对话系统可以让教师准备资源、考核学生和师生互动变得简单实时,让管理者评价教学质量变得容易,让学习和教育变得智慧化。

参考文献(References)

[1] 王浩畅,李斌.聊天机器人系统研究进展[J].计算机应用与软件,2018,35(12):1-6.

[2] 赵阳洋,王振宇,王佩,等.任务型对话系统研究综述[J].计算机学报,2020,43(10):1862-1896.

[3] 杨晓珍.任务型对话系统[D].武汉:华中师范大学,2019.

[4] 王堃,林民,李艳玲.端到端对话系统意图语义槽联合识别研究综述[J].计算机工程与应用,2020,56(14):14-25.

[5] 吴雅婷.基于多任务学习和知识图谱的对话技术研究[D].廈门:华侨大学,2020.

[6] 侯佳腾,常薇,林冠峰.基于自然语言理解技术的智能客服机器人的设计与实现[J].电子技术与软件工程,2019(23):238-240.

[7] Hafezi Manshadi, Mohammad. Dealing with quantifier scope ambiguity in natural language understanding[D]. Rochester: University of Rochester, 2014.

[8] 夏艳辉,聂百胜,胡金凤.中文开放域问答系统的问题分类研究[J].价值工程,2019,38(016):147-149.

[9] 侯沐澜.面向自然语言理解的新槽值问题研究与应用[D].北京:北京邮电大学,2019.

作者简介:

于   丹(1976-),女,博士,研究员.研究领域:数据分析与挖掘,人工智能.

闫晓宇(1995-),女,硕士,初级研究员.研究领域:自然语言处理,对话系统.

王艳秋(1993-),女,硕士,初级研究员.研究领域:人工智能,数据挖掘.

来关军(1984-),男,硕士,中级研究员.研究领域:大数据分析,人工智能.

肖   鹏(1993-),男,硕士,初级研究员.研究领域:计算机视觉,自然语言处理.

王   宇(1994-),男,硕士,初级研究员.研究领域:自然语言处理,人工智能.

猜你喜欢

在线教育
基于微信公众号的交互式课堂及教学模式探索
教育出版数字化转型的务实之路
“互联网+”时代民办高校创新教学模式研究
高校在线教育探讨
“互联网+”时代在线教育模式创新研究
在线教育商业模式分析
在线教育商业模式分析
在线教育商业模式探究
提高机械原理教学质量的几点思考
混合学习模式及其实施要点 