基于智能语音的校园招生客服系统设计
2022-06-15付丽琴邢亚英侯佳丽
闫 硕,付丽琴,邢亚英,侯佳丽,马 玲
(北京经济管理职业学院 人工智能学院,北京 100102)
0 引言
随着数字技术智能化的发展,目前智能客服已经应用到生产生活的多个领域[1]。但是由于不同的场景有不同的需求,并且针对的用户群体特征也不同,因此特定领域的智能客服的系统设计需要更精细的研究[2-3]。
自2019 年国家首次提出对高职院校实施扩招以来,高职院校扩招规模逐年递增,高校招生工作日益繁重。伴随着招生咨询人数的激增,为了使有限的招生办公室人力从简单的接听电话的工作中解放出来,提升工作效率,减少学生或家长在电话咨询中的等待时间,建设一个智能客服系统,通过智能客服的智能问答方式提升效率,降低招生工作的压力迫在眉睫[4]。招生智能客服系统主要有以下几个目标:一是代替人工在线开展服务;二是增加机器人功能,实现招生相关问题回复;三是建设知识库,梳理和总结相关知识;四是建设招生智能咨询微信公众号,对招生相关问题进行智能回复。其整体流程如图1 所示。
图1 整体流程图
1 核心技术
智能客服系统的核心技术包含语音识别、自然语言处理(Natural Language Processing,NLP)、语音合成、对话管理以及知识库等。
语音识别技术是指自动语音识别,也就是将语音信号处理成机器能够读取的内容,过程包含语音特征提取、模式匹配及参考模式库等3 个步骤。即通过模数转换、量化降噪等方法,将输入的语音信号进行数据清洗,然后提取特征,并将其与已经建立好的语音特征库通过对比得到最优的识别结果。语音识别技术是校园招生客服系统实现的技术基础。利用语音识别技术使机器能够将招生咨询用户的语音数据实时识别成文本内容,是校园招生客服系统的第一步工作。
自然语言处理是计算机模拟人与人之间进行语言交互的过程,从而能够使机器理解人类语言的过程。同时使机器能够具备与人一样的交流和写作能力,生成一段自然语言文本。在校园招生客服系统中,机器利用自然语言处理技术对招生咨询用户的文本内容进行分析,从而更好地识别用户的意图。然后机器根据用户意图,结合知识库内容给出最佳的回复结果,当前结果为文本数据。自然语言处理过程是校园招生客服系统的技术核心,如何使机器更好地识别用户意图并反馈最佳结果,是评判智能客服质量好坏的直观指标。
语音合成是将文本内容转换为语音的过程。也就是将机器产生的或者从外输入的文本数据变成人类口语表达的方式输出的过程。在校园招生客服系统中,将机器反馈的最佳结果文本内容转化成用户能够直接听懂的语音内容,主要依赖语音合成技术。语音合成技术使机器能够具备和人一样能够说话的功能,除了需要能够将文本内容完成语音转化,好的智能客服系统需要对语音的韵律、语气等进行优化调试,使机器不仅从内容更要从表达都更接近于真实的人类。
对话管理是模拟人机对话的全过程,并对过程进行管理,主要包括以下几点。首先是对对话状态进行维护,实时对用户前后时刻对话状态和行为进行记录和更新;其次是对机器应对进行决策,也就是根据用户的状态和对话内容确定下一步的机器行为;再次是后端交互,实时反馈决策结果,并生成文本信息;最后是提供期望,根据用户的输入信息,判断用户的期望,对用户输出符合期望的回复,满足用户需求。此过程离不开训练师进行对话维护、管理及训练。
知识库主要存储和管理学校各个方面的基本信息和学校历届招生所获得的经验知识。知识库的好坏直接影响招生智能客服服务质量的好坏,不仅需要专人进行维护和积累,而且要求机器能够结合用户的信息反馈,自主更新和完善现有的知识库。
知识库主要用于检索,是智能客服系统的数据核心模块,需要详尽数据库的支持。在招生客服系统中,从学校到二级学院再到具体专业、从衣食住行到学习就业等等很多方面的问题都需要进行完整的收集和整理,并且按照不同的渠道和方式进行更加细致的定向分类。完善的知识库系统直接关系到对话管理的实际运行质量,可以帮助招生咨询的用户直观了解相关的信息,使对话更具人性化。
2 整体架构设计
校园招生智能客服系统相对于传统的统计学方法,数据分析采用了大数据分析挖掘技术和自然语言处理等技术[5];业务应用采用语音识别与语音合成等技术[6-7]。该系统进行服务过程中的数据可以实现自动采集,不需要人为统计,并且依托强大的算力,对数据采集来源实现全覆盖,保证数据完整性[8];利用语音对话实时转文本,可以进行语义分析,从而能够快速定位问题,提升问答效率。
校园招生智能客服系统支持学校官网、学校官方微信公众号、微信小程序等终端接入,整体体系架构分为数据源、语音技术、控制管理、业务服务及前端接入共五层,如图2 所示。
图2 体系架构
数据源层包含了多种类型的知识数据,如对话数据、问答数据、知识等,并且包含了对话服务数据、人工坐席人员数据、系统统计数据、分析处理数据、配置管理数据以及服务评价数据等。数据源层的核心是专家知识库。专家知识库提供大量的学校各个学院、专业等系统知识,支撑应用层高效问答。
语音技术层用于用户语音的识别、语义理解以及自然语言生成与回复,包含语音识别技术、自然语言处理技术以及语音合成技术等,依赖于服务基础层的能力,使应用层能够实现最精准、最高效的功能;将招生咨询用户的语音输入转成文本,并通过分词、标注、句法分析等自然语言处理技术实现对用户语义的理解。同时,语音技术层根据用户语义从专家知识库中匹配最佳话术,并通过语音合成技术将其转化为语音回复。
控制管理层用于对话管理以及在进行语义分析之后进行与专家知识库的匹配。招生咨询中,用户的交流不是单次的问答,经常是经过多轮的交互问答,因此需要通过控制管理层不断理解用户的真实意图,从而在专家库中找到与用户真实意图最相符的最优话术。
业务服务层直接面向招生咨询用户,包含了在线客服、智能语音客服以及运营分析等在内的应用,同时可以实现系统管理和统一门户,主要有自助服务和客服服务。自助服务是用户进入时的第一层服务方式,自动识别用户的问题和需求,匹配最佳话术,并进行语音回复;当自助服务没办法解决用户问题或者用户自主选择人工服务时,则接入人工服务。
前端接入层直接对接云平台和第三方入口,提供多种途径的客服入口,以方便不同的用户进行招生咨询;同时,为方便管理和维护,提供运营分析和平台后台管理系统。
3 交互系统设计与实现
本文基于讯飞开放平台进行校园招生智能语音客服系统的设计与实现。讯飞开放平台是科大讯飞提供的以语音交互为核心的人工智能开放平台,包括语音识别、自然语言处理及语音合成等核心技术模块。
用户进行招生咨询时,校园招生智能语音客服系统调用语音识别模块,将用户语音识别成文本数据,然后调用自然语言处理模块对文本数据进行处理,识别用户意图;根据用户意图结合知识库得到最佳回复结果,再次调用语音合成模块,将最佳回复结果转化成语音回复用户。该系统支持多轮识别和交互,并支持转人工等功能,以使用户得到满意的咨询体验,同时降低招生工作人员的工作负担。部分人机交互界面如图3 所示。
图3 部分人机交互平台实现界面
系统搭建完成后,进行电话测试,并将语音交互结果进行实时转写,部分测试情况如图4 所示。
图4 语音交互转写测试
系统完成后进行训练调试,根据测试结果对系统进行相应的优化,并进一步完善知识库。最后,由40 人评测小组分别对系统性能进行了全面的测试,总测试通话2 000 次,人机交互10 000 多轮,得到性能结果如表1 所示。
表1 性能测试结果
4 结语
基于智能语音的校园招生智能客服系统将智能语音、自然语言处理等多种前沿技术相结合并应用在校园招生服务业务中,有效地降低了学校招生工作的强度和难度,提升了整个招生咨询过程的效率和用户体验。