校园服务智能应答机器人的研究与实现
2021-04-06陈凤朱峰
陈凤 朱峰
摘 要:随着智能终端和移动互联的流行与发展,移动应用深入人心。本文基于百度UNIT交互平台,创建了具有本校特点的专用知识库,并通过资源API获取如成绩、课表、消费、打卡和站群内容等动态信息,同时借助微信消息平台实现了信息的搜索与推送,最终构建了校园服务智能应答机器人。智能应答机器人为学校的师生员工提供各类校内咨询的智能应答,成为校园服务的入口和代言,开创了校园在线参考咨询的服务新模式。
关键词:智能应答机器人;百度UNIT;资源API;微信消息平台;搜一搜 中图分类号:TP242 文献标识码:A
Abstract: As the intelligent terminals and mobile networks finding their ways into people's everyday life, mobile applications are becoming more and more popular. Based on Baidu UNIT (Understanding and Interaction Technology) interactive platform, this paper proposes to create a specialized knowledge base with characteristics of a university. Dynamic information including grades, class schedules, consumption, check-in and station content can be obtained by an API (Application Programming Interface) interface. With the help of WeChat messaging platform, information seeking such as search and push is realized. Finally, an intelligent response chatbot for campus services is built. The intelligent answering chatbot provides services for teachers, students and employees with intelligent answers to various in-school consultations. As entrance and endorsement of campus services, it creates a new service model for campus online consultation.
Keywords: intelligent response chatbot; Baidu UNIT; resource API; WeChat message platform; Sou Yi Sou
1 引言(Introduction)
随着校园信息化建设的高速发展,高校的各类业务系统积累了越来越多的数据。同时,高校招生数量的持续增长带来的服务量的不断增大与有限的服务资源形成了难以调和的矛盾。传统人工服务的方式已经无法满足信息时代下校园内师生的咨询应答服务。
本文将学校管理服务与移动终端和移动互联相结合,在深入研究智能聊天机器人相关理论及技术的基础上[1],确定以百度UNIT平台为蓝本,利用学校现有的各类纸质、电子类静态资源形成具有本校特色的专用知识库,通过资源API来获取如成绩、课表、消费、打卡和站群内容等动态信息,共同构成了应答知识库;同时借助本校自研的微信消息平台实现了信息的搜索、规范和推送,最终构建了校园服务智能应答机器人[2],并实现了个性化的“搜一搜”功能。智能应答机器人旨在完成对师生员工的各类校内咨询的智能应答,使其成为校园日常服务的代言,深化数据内在价值,辅助决策、管理,将信息服务由面向管理转向面向师生的服务,从而进一步提升服务的效率与能力。
2 技术思路及相关知识(Technical ideas and related knowledge)
2.1 背景
在大数据时代下,师生在校内遇到的大多数问题都具有普遍性,并且存在类似和雷同的情况,诸如遗忘系统密码、查询信息(成绩、消费、课表、早锻炼等)、缴付费、遗失办卡等等。现有的咨询服务大多采用传统的电话、邮件、短信、QQ等一对一的人工交流方式,人工的应答服务通常无法确保24小时在线,同时还耗费了大量的时间、人力、物力和财力成本。并且对管理人员而言,长时间重复性回答容易产生疲惫感甚至厌烦感,从而导致服务质量下滑,甚至会带来其他的负面效果。另一方面,虽然高校通常都会建有纸质、电子等文字形式的导向性说明或服务手册,但这些手册往往散落在各自的业务部门内,并且一般都是长篇累牍,需要用户主动去搜索,在大量雷同的内容中筛选、判断,最终才能获得真正有用的信息,这对于本身就存有疑虑的师生来说根本无从下手。因此,面对信息时代下的海量数据,想要为校园用户提供所需要的信息,显然传统的人工服务方式已不切实际。而让机器替代人来完成语言分析工作,实现与师生的沟通,这种基于大数据的分析和语言处理相结合的方式,将实现以往人工服务无法达到的效果,此外还能发现学生群体的共性、师生心理倾向和个体特征等,从而有针对性地去扩展服务领域,深化服务的效能。
2.2 技术思路
在交互界面上,根据师生过去校内咨询的常用渠道,考虑师生的使用习惯,并结合移动应用的实际需求,校园服务机器人的界面以微信端的聊天对话为主要风格;在知识库上,综合分析历年积累的校内咨询记录,从师生的主要关注点出发,收集汇总师生经常咨询的问题,结合各业务部门现有的各类电子或纸质服务手册、指南等信息资源,同时通过学校已有的站群平台和校園卡、教务等业务系统来动态地获取资源,为构建具有本校特色且具有很强针对性的自定义词库奠定基础;在用户认证上,由于结合我校的微信公众号“理工微门户”来使用,用户不需要单独注册账户就可以进行对话咨询;在功能上,利用自我学习的功能,使用户获取的信息更简便、详尽和准确;另外,咨询应答可以不受时间和空间的限制,用户的体验感更佳。
2.3 对话机器人选型
对话机器人在本质上是用来模拟人类对话或聊天的计算机程序,在技术层面,主要分成闲聊、问答和任务三种类型。我们通过对科大讯飞、腾讯、微软和百度等多款对话机器人进行深入的研究对比,最终选定以百度UNIT作为校园服务应答机器人的蓝本。主要出发点是UNIT搭载了领先的需求理解与对话管理技术,具有多年积累的自然语言处理、机器学习、大数据等核心能力,并且可以向开发者提供开放的自然语言理解与交互技术支持[3]。
百度理解与交互技术平台(Understanding and Interaction Technology,UNIT)的整体框架包括两个主要模块:学习模块、在线服务模块。要建立人机交互的对话应用过程,需要从学习模块开始,通过定义场景、词槽等,同时提供一定量的训练样本,通过该模块学习出自己的对话模型。随后,推送到在线服务模块中,由在线服务模块来整体理解用户的当前需求和历史状态,从而完成意图和词槽的解析工作,最终生产出对用户的回应(应答)。语言理解中的重点在于“意图”和“词槽”。除此之外,UNIT还提供了面向问答匹配的对话能力,用于满足对用户提供的问答资源进行直接匹配检索的需求。对于一个完整的对话系统,问答匹配不仅仅是理解,还需要交互能力的配合。
基于百度UNIT平台的自然语言处理技术,我们从学校多年积累的各类业务数据中获取所需的数据,从而更好地完成训练模型、优化应答性能的任务,让智能应答机器人定制化的语言理解与交互功能越来越完善。
3 校园服务智能应答机器人的实现(Construction of intelligent chatbot for campus service)
3.1 校园服务智能应答机器人体系结构
校园服务智能应答机器人的体系结构主要由用户交互界面、数据I/O控制、自然语言智能问答引擎及校内资源知识库所构成[4],如图1所示。
用户通过访问公众号“理工微门户”与校园服务智能应答机器人进行对话,应答机器人根据用户的不同指令来提供相应的服务[5]。
(1)用户交互界面:主要完成与用户的应答交互,用户在应答机器人聊天对话框中输入想要咨询的话题或想要查询的内容。
(2)数据I/O控制:完成数据的接收和预处理,并过滤非法词和停用词,对用户输入的文本进行分类并转发到相应的处理引擎,等待智能应答机器人获取答案并返回给用户。其中包括资源API模块,主要用以完成校内动态资源的获取和传输。
(3)自然语言智能问答引擎:完成自然语言处理、指令识别、知识库检索和模型匹配等模块,其中也包含了校内个性化知识库,主要用于支撑智能问答引擎获取校内的静态知识。
由于普通用户与管理员角色的不同,所对应需要完成的功能也有所不同,用户层主要涉及数据预处理、资源API、自然语言智能问答引擎、学习模型匹配及知识库等模块功能;管理员层主要涉及知识库整理构建、训练生成模型等模块功能。
3.2 关键技术与实现
百度UNIT平台能够完成智能应答中的大部分工作,如中文分词、索引建立、模型匹配和搜索推理等任务,但要实现校园服务的智能应答,还需要完成以下几个关键技术。
(1)个性化知识库
将学校各个业务部门历年来所积累的各类电子、纸质资源及咨询记录等作为知识库的资料来源,通过人工添加、导入的方式构建知识库的静态资源,如图2所示。
(2)资源API
设计资源API用以满足师生对成绩、课表、消费、打卡以及站群搜索等动态资源的需求,成为另一种形式的知识库[6],如图3所示。
(3)微信消息平台
由于百度UNIT不支持图文、网页等形式,只支持单纯的文字,故而面对应答中的实际情况,即存在大量的图文和网页回复,为了规范应对智能问答引擎的回复格式,通过微信消息平台来对应答的格式加以处理,满足应答和视觉美化的需求,完成传递规范消息的功能,如图4所示。
(4)应答过程
校园服务智能应答机器人的应答过程描述如下:
用户打开微信公众号“理工微门户”的智能应答机器人对话框,输入想要咨询的问题,由百度UNIT平台对用户的问题进行接收并预处理,同时过滤非法文本,通过自然语言分析处理识别用户的意图,如进行常规的对话或日常提问,则由知识库检索和模型匹配等来返回自由知识库的回答,再通过数据输出到用户交互界面;若用户需要查询成绩、课表、消费、打卡等个性化的信息,则由资源API根据UNIT识别的用户问题搜索晨练、教务、校园卡、站群等业务系统,将所得答案返回给消息平台,由消息平台根据用户信息等返回格式化后的数据,最终经过数据输出到用户交互界面,获取所需要的应答内容。
3.3 校园服务智能应答机器人的主要功能
基于百度UNIT的校园服务应答机器人实现了与学校公众号“理工微门户”的整合,界面如图5所示。
校园服务智能应答机器人的主要功能如图6所示。
(1)具有日常对话闲聊的功能,如天气、心情等,对话内容轻松诙谐。
(2)对校内的各类日常事务给出解答,提供解决问题的流程方法,如网络开通报修、校园卡挂失解绑、账号开通、密码找回等等。
(3)快速应答校内各类个性化查询,如消費、晨练打卡、成绩、课表等。
(4)具有“搜一搜”功能,能够通过资源API接口快速查询业务系统及站群内容等动态资源。
(5)具有自我学习的能力,将群体普遍关注较多的内容优先推送,能够对用户的咨询行为展开联想,推送更准确的答案,且能够边交互边训练[7,8]。
校园服务应答机器人自推出以来,累计答复用户咨询一百多万条,受到了广大师生的喜爱和欢迎。在工作、学习乃至生活中的事都可以问一问应答机器人,不再出现不知道怎么办、不知道找谁的问题,或者需要等到特定的时间才能咨询和处理,真正成为校园服务小帮手。
4 结论(Conclusion)
将对话机器人应用于校园服务本身便是一个全新的案例,辅助管理的同时更重要的是拓展了服务的领域和深度,在提高学校服务水平的基础上,对学校教学、科研也能够起到促进作用,从而进一步提升学校的办学水平。
在今后的应用实践中,需要进一步深挖校园服务机器人在用户咨询推荐引导、建立个性化用户服务以及提供用户心理趋向等方面的功能。另外,将在如何快速准确地获取知识,如何更好地展现图文、网页等消息以增强其知识表达能力等方面加以研究。
参考文献(References)
[1] 贾熹滨,李让,胡长建,等.智能对话系统研究综述[J].北京工业大学学报,2017,43(09):1344-1356.
[2] Liang Yuejie, Yu Ying, Ouyang Wenhao. Intelligent chat robot in digital campus based on deep learning[J]. Journal of Physics, 2020(1629):1884-2021.
[3] 周志华.机器学习[M].北京:清华大学出版社,2016:113-114.
[4] 韓凯莉.基于主题信息的聊天机器人上下文理解模型的研究[D].长春:东北师范大学,2016:8-13.
[5]姚飞,纪磊,张成昱,等.实时虚拟参考咨询服务新尝试——清华大学图书馆智能聊天机器人[J].现代图书情报技术,2011(04):77-81.
[6] 陈飞,罗文广.基于Android的智能交互APP设计[J].广西科技大学学报,2017(02):29-34.
[7] 曹东岩.基于强化学习的开放领域聊天机器人对话生成算法[D].哈尔滨:哈尔滨工业大学,2017:41-50.
[8] 肖克聪.具有情绪识别能力的智能聊天机器人的研究与实现[D].北京:北京邮电大学,2017:29-33.
作者简介:
陈 凤(1980-),女,硕士,高级工程师.研究领域:数据仓库,人工智能.
朱 峰(1985-),男,本科,工程师.研究领域:大数据,数据挖掘.