面向客户服务的聊天机器人系统设计
2019-11-14郭其鑫于卫红李朝辉
郭其鑫 于卫红 李朝辉
摘 要: 本文設计了一种分层结构的聊天机器人系统,在互联网上搜集与顾客服务相关的对话数据,设计电商顾客服务领域的知识库,构建基于LSTM的Seq2Seq模型用于生成回答,使用朴素贝叶斯分类模型来对不同类型的问题选择合适的回答策略,并在必要时转向人工客服。
关键词: 聊天机器人;电子商务;客户服务;智能问答模型
中图分类号: TP311.52 文献标识码: A DOI:10.3969/j.issn.1003-6970.2019.09.019
本文著录格式:郭其鑫,于卫红,李朝辉. 面向客户服务的聊天机器人系统设计[J]. 软件,2019,40(9):84-86
Design of Chat Robot System for Customer Service
GUO Qi-xin, YU Wei-hong, LI Zhao-hui
(School of Maritime Economics and Management of Dalian Maritime University, Dalian Liaoning 116026, China)
【Abstract】: This paper designs a hierarchical chat robot system, which collects conversational data related to customer service on the Internet, designs a knowledge base in customer service field of e-commerce, builds Seq2Seq model based on LSTM to generate answers, uses Naive Bayesian classification model to select appropriate answer strategies for different types of questions, and turns to human service when necessary.
【Key words】: Chat robot; E-commerce; Customer service; Intelligent question-and-answer model
0 引言
如今,网络购物由于其方便快捷、商品丰富等优点,成为了人们生活中必不可少的一部分。为了更好地服务客户,满足消费者的交互性,各大电商平台都使用了聊天机器人来提高工作效率与服务质量。聊天机器人是指使用自然语言来模拟人类交谈的计算机程序或机器人实体,它在众多领域都有着广泛的应用[1]。近年来人们对聊天机器人的需求不断增长,使得该领域成为了一个热门的研究方向。事实也证明在电子商务领域中,合理使用聊天机器人能够提高客户体验[2]。然而当前大多数商用系统在无法回答用户问题时会返回无意义的“安全回答”,这降低了顾客服务的质量。
本文提出以人机协作的方式来解决这一问题。设计的聊天机器人系统旨在辅助客服人员工作,从而使电商客户服务更加具有及时性、有效性和智能性。
1 相关技术
1.1 知识库
知识库指专家系统设计所应用的规则集合,包含规则所联系的事实及数据。作为知识元组的表示和管理平台,知识库在查询检索上有着优异的性能,它可以在水平和垂直两个方向上扩宽知识范围,从而提供给用户更加丰富的信息。目前知识库的最新形式是智能知识库,它具备原子化、图谱化、自主学习等特点[3],是企业客服聊天机器人使用的知识库的主要模式,让员工可以方便地获取和管理知识,从而使工作效率得到突变式的提高[4]。
1.2 Seq2Seq模型
Seq2Seq模型是一种能根据给定序列数据得到另一序列数据的模型,被广泛用于自然语言处理任务中,如机器翻译、自动摘要和问答系统等[5-7]。该模型由一个编码器和一个解码器构成,前者将长度可变的数据序列转换为固定长度的向量表达,后者将这个固定长度的向量变为可变长度的数据序列。编码器与解码器结构类似,都包含一系列的RNN单元,RNN的英文全称为Recurrent Neural Networks,即包含循环的网络,允许信息的持久化。而LSTM(Long Short Term)则是一种特殊的RNN类型,可以学习长期依赖信息[8]。Seq2Seq模型的结构如图1所示,其中w是向量化后的用户输入,传入编码器的LSTM单元后转换为固定长度的状态向量e,其中e可以直接取最后一个时间步上的输出,也可以通过注意力机制来得到[9]。解码器读取e并在每一个LSTM时间步上产生输出,在激活层计算并选择概率最高的结果作为下一个时间步的输入,最终得到回答向量。
如,编码器将用户输入(how are you,也可以是中文)向量化后(到)传入LSTM单元,经过一系列变化得到固定长度的状态向量e,解码器读取这个向量,在LSTM的每一个时间步上依次产生输出。上面不同的图形表示从不同的结果中选择概率最高的那一个传向下一个时间步(概率由softmax计算)。
2 系统设计
2.1系统总体设计
本文设计的面向顾客服务的聊天机器人系统,
通过搜集网上的客服问答数据来训练生成回答的模型,并建立相应的知识库,通过文本分类将用户的问题分为知识检索、闲聊和售后服务3个类别,以确定所采取的回答策略并及时转向人工服务。系统整体流程如图2所示。
在电子商务环境下,如果不具备必需的知识,再好的答案生成模型也难以给出令顾客满意的回复。因此对于知识检索类问题,系统在失配后立即转向人工服务;而售后服务类问题是顾客服务的关键,也适合交给人工客服处理。通过这种方式使机器与人工协同工作,发挥各自最大的作用。
聊天机器人系统的体系结构为分层风格,总共包括4层,自底向上依次为:数据层、语义层、应用层和表示层。其中数据层封装语料和知识的存储细节,语义层封装不具备业务价值的基础性nlp任务,应用层包括封装具备业务价值的复杂nlp任务,表示层封装人机交互。系统整体架构如图3所示。
2.2系统功能模块设计
(1)生成式回答模型
从互联网上搜集客服问答数据共3,593,155条,经过一系列处理得到能够被模型直接读取的序列化二进制向量。处理过程如图4所示。
Seq2Seq模型中的编码器和解码器采用三层LSTM的结构,每层包含512个隐藏层神经元。词向量的问题部分传入编码器,答案部分传入解码器,这一过程在多线程中进行,如图5所示。
(2)检索式回答模型
聊天机器人系统的检索式回答模型主要依靠知识库来构建。电子商务顾客服务的知识库可以将分散于各产品领域、各商家、各人员中的知识集中起来统一管理,通过知识地图和搜索引擎来方便用户查询[10]。构建好知识库后将用户提出的问题转化为相应的查询语句,例如查询某类产品、某个店铺的知识。这一过程如图6所示。
3 总结
本文设计了一种分层结构的聊天机器人系统,结合使用了检索式与生成式两种技术路线,通过文本分类为用户提出的不同问题选择不同的回答策略;提出以人机协作的方式来服务顾客,将不具备必需知识的问题、关键而复杂的售后问题及时转交人工处理。实验结果表明,所设计的聊天机器人能够有效地解决多数简单的问题,而客服人员也能将主要精力放在提高服务质量上。
此外,在对知识库进行更新、替换后,本文所设计的系统也可以用于其他应用领域,如舆情引导、心理疏导、课程答疑等。
参考文献
[1] 王浩畅, 李斌. 聊天机器人系统研究进展[J]. 计算机应用与软件, 2018, 35(12): 1-6+89.
[2] 杨燕. 面向电商领域的智能问答系统若干关键技术研究[D]. 上海: 华东师范大学, 2016.
- AMIT S. Introducing the knowledge graph[R]. America: Official Blog of Google, 2012.
- 徐国军, 杨建君. 企业间知识转移、知识库开发与突变式创新绩效[J]. 软科学, 2019, 33(3): 40-44.
- SUTSKEVER I, VINYALS 0, LE Q V. Sequence to sequence learning with neural networks[J]. Advances in Neural Inform a tion Processing Systems, 2014, 4(27): 3104-3112.
- CHO K, VAN MERRIENBOER B, GULCEHRE C, et a1. Lea r ning phrase representations using RNN encoder-decoder for statistical machine translation[J]. Computer Science, 2014(6): 1078.
- 董葉豪, 柯宗武, 熊旭辉, 孙玉霞, 夏端峰. 基于Seq2Seq的问答系统应用研究[J]. 福建电脑, 2018, 34(10): 122-123.
- Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural computation, 1997, 9(8): 1735-1780.
- Bahdanau D, Cho K, Bengio Y. Neural Machine Translation by Jointly Learning to Align and Translate[J]. Computer Science, 2014.
- 黄东欢. 面向电子商务领域的知识库构建技术研究[D]. 河北: 华北理工大学, 2017.