APP下载

电力行业智能客服关键技术设计与实现

2022-02-19广东电网有限责任公司客户服务中心刘振华康峰苏立伟谭火超苏春明

数字技术与应用 2022年1期
关键词:会话客服语义

广东电网有限责任公司客户服务中心 刘振华 康峰 苏立伟 谭火超 苏春明

传统电力客服会话正确复述次数较低,问题识别能力随之下降,设计电力智能客服实现技术。提取电力会话语义特征,分类识别各类语义;进行会话语义相似度计算,利用相似函数归一化处理语义相似度;纠正智能会话相似词汇,消除相似会话的识别误差。实验采用对比实验的方式,验证了电力智能客服实现技术的效果更佳。

随着互联网的发展,人们的生活方式不断受到影响,网络服务也已经成为现代人的主要服务模式,智能客服作为新时代下,网络的智能化产物,逐渐深入各个领域,在电力方向发展是研究者的新方向[1]。传统电力客服在识别问题方面较为复杂,正确复述次数较低,而造成这一现象的主要原因即为,传统电力客服对语义识别不清晰,相关语义分类不明确,相似度计算效果差等因素[2-3]。本文将就此,摒弃以上缺点,研究电力智能客服实现技术,首先,提取用户会话的语义特征,进行智能化识别;其次,计算用户会话中的语义相似度,保证智能客服对各个语义相似度进行精准地区分;最后,纠正会话中的相似度词汇,消除相似语句的识别误差(如图1所示)。根据以上方法,本文认为,可以满足用户需求,为提高电力用户的服务质量创造条件[4]。

图1 传统电力客服会话系统Fig.1 Traditional electric customer service conversation system

1 电力智能客服实现技术设计

1.1 提取电力会话语义特征

会话的语义特征,表示会话互动问答的类型。本文设计的智能客服重点在于:解决用户的电力问题,本文对会话语义特征结构进行提取,并作出说明。语义特征分类如表1所示。

表1 会话语义分类特征Tab.1 Conversational semantic classification characteristics

问题类由用户产生,用户进行信息咨询,答案类对应问题类,由智能客服问答系统提供,用于回答顾客问题,问题类主要分两种,一般问句和议价的问句。陈述类只是简单的观点陈述,因在信息咨询中,地位处于次要,所以不对其进行更深层的处理。陈述类目的多样,无明确问答关系,主要为情感或者观点的表述。反馈类对应称述类,由买卖双方在肯定或者否定对方情感或者观点产生,抑或者为虚拟词,无明显语义。祈使类于买卖双方请求或者要求对方产生某种动作时产生,招呼类产生于问答开始前相互致意或者问答结束时双方表示感谢,其他为噪声类,主要为软件自动答复类问题,或者严重偏离主题的对话内容。

由表1可知,本文设计的会话语义分类中,需要智能客服认可相关语义,进而识别、理解整个电力通话过程中的问题。本文设计的方法中,用户发送的问题,均会有一个相对应的答案,这个答案是通过智能客服对上下文的联系,得出相关答案。通过分类不同类型的会话语义特征,可以提高智能客服识别电力问题的能力,进而提高智能客服的识别能力[5]。

1.2 进行会话语义相似度计算

通过对会话语义的特征提取,基本可以提取出相似语义,进而计算会话中的语义相似度[6-7]。智能客服对语义有着不同的理解,需要对其下达一个短语指令,使其可以在不依赖其他词的情况下,了解用户提出的会话含义。因此在本文设计中,设计了智能客服训练部分,训练智能客服的词向量,如表2所示:

表2 智能客服训练的词向量Tab.2 Word vector of smart customer service training

如表2所示,根据此电力词向量的训练,基本可以得出电力语义相似度的词量,计算公式如下:

式(1)中,sigmoid(x)为语义相似度系数;e-x为相似词向量。基于此得出的函数关系如图2所示。

图2 电力词汇Sigmoid函数图像Fig.2 Image of Sigmoid function of power vocabulary

由图2可知,电力词汇Sigmoid函数图像可归一化到处理语义相似度,在[0.1-0.3]范围内,相似的语义判别效果较好。在[0.4-0.6]范围内,语义相似度的判定能力较弱。

1.3 纠正智能会话相似词汇

基于语义相似度计算,本文将纠正相似度词汇分为两部分。(1)相似电力文本预处理层,包括电力词汇的校正。集中的句子一般会成对出现,语义相近的词汇分别用Sentence L和Sentence S表示。为了减少相似词汇对智能客服的影响,本文通过分类校正方式,校正电力词汇结果。在纠正的电力词向量表中,每个词对应一个64维的电力词向量,通过电力词向量表,找到与其相对应的纠正答案[8]。(2)将电力词向量输入到智能客服的系统中,根据电力词汇的语义差异,将两个电力词汇合并,进而纠正相似度词汇,进一步提高电力智能客服的识别能力[9]。

2 实验

本次实验的数据集采用某电力公司提供的智能客服数据集,此数据集中共有5082对英文句子,分为相似语义与不相似语义两类,即为正负样本,正样本3902对,负样本1900对。此数据集是根据网络收集,包括电力热点话题,验证本文设计的智能客服正确复述效果。

2.1 实验过程

本文对电力智能客服的会话进行采样,采样得出样本30492对,其中正负样本数保持不变,按照6∶1的方式划分采样样本,分别提取出5082对英文句子,将这类句子列为测试集,并打乱顺序,剩余部分组成训练集,得出样本数据集的划分如表3所示。

表3 数据集划分表Tab.3 Data set partition table

如表3所示,将数据集划分为训练集与测试集,测试集即为本文的被测样本,训练集为训练样本。据此设置的实验参数如表4所示。

如表4所示,为本次实验的基本参数,实验指标包括实验环境、批次、实验轮次、词向量维度、激活函数、损失函数、优化器。根据此指标,设置相应函数,带入到实验中,得出结果如下[10]。

表4 实验基本参数Tab.4 Basic parameters of the experiment

2.2 实验结果

将5082个测试样本通过测试集,最终定位64位词向量,分为6轮次得到传统技术与本文设计技术的复述次数,结果如表5所示。

表5 两种技术复述次数结果Tab.5 Results of the number of repetitions of the two technologies

如表5所示,经过6轮次的实验,在两种智能客服的总复述次数相同的条件下,传统客服正确复述次数与总复述次数相差200-2000条,复述效果差,识别能力相应下降;而本文设计的智能客服正确复述次数与总复述次数相差仅在0-10条左右,复述效果更佳,识别能力较强,符合本文研究目的。

3 结语

近年来,网络的兴起,不仅带给人们新的音视频观感,并且带动智能化的发展,使智能化逐渐渗透进各个领域。由于传统客服识别效果不佳,导致客服行业与人们的矛盾增加。因此本文设计了电力智能客服实现技术,提取电力会话语义特征,对会话语义进行相似度计算,纠正了智能会话相似词汇,提高智能客服识别电力问题的能力。采用某电力公司提供的智能客服数据集进行对比分析,验证了本文设计的智能客服正确复述效果,为电力智能化发展创造价值。

猜你喜欢

会话客服语义
语言与语义
语音推销
敬业的客服
有意冒犯性言语的会话含义分析
汉语教材中的会话结构特征及其语用功能呈现——基于85个会话片段的个案研究
“上”与“下”语义的不对称性及其认知阐释
基于广东“一张网”对内客服模式的探讨
销售能手
认知范畴模糊与语义模糊
冲突语的会话分析研究