电商平台中自动问答客服系统的客户意图识别
2020-02-16廖美红广西工商职业技术学院
廖美红(广西工商职业技术学院)
在互联网技术、大数据技术、物联网技术飞速发展的今天,电子商务越来越成熟,人们对于电子商务也要求也越来越高。随着应用电子商务平台的人群数量快速增长,传统的人工客服已经无法满足当前的电商客户服务需求,所以自动问答客服系统因此产生,利用人工智能客服为客户提供更加快速优质的服务,例如京东的JIMI、阿里的旺旺机器人、苏宁的自主服务机器人等。电商客服机器人开发过程中,除了保证能够正常应对客户的问题以外,还应该积极开发能够识别客户意图的功能,进而为客户提供更加优质的服务,减少不必要的时间,直接找到客户想要的商品。
■ 电商平台自动问答客服系统的产生原因
我国自1996年开始互联网技术实现了蓬勃发展的状态,互联网能够为人们提供各种服务和产品,更新人们的网络生活方式。进入到21世纪以后,电子商务技术实现了跨越式的发展,网络购物已经实现了全民普及。网络技术将商品和消费者有机联系到一起,在网络上完成消费行为,选择性和快速性都得了有效实现,电子商务发展越来越快。对比传统购物方式,网络购物更加方便、快速、选择广、无地域限制、价格更低,具有诸多优势,而且消费者和商家通过网络都能够获取更高的利益。商家能够利用网络简化购物流程,节省人力物力,降低成本,提升利润,打破地域限制,获得更多的商机。消费者能够扩大选择空间,多个商家对比,不用出家门就能够完成购物。而且消费者进行网络购物的时候,能够通过和客服沟通获取更多的信息,完成售后服务,这就需要电子商务客服人员随时在线为客户提供服务。
电子商务在线人员为客户提供客服服务这种方式非常方便,但是有时候也会产生负面影响,例如网络商城相对较大,想要满足客户的服务需求,必须设计非常多的客服人员,这必然会导致成本大幅度上涨;再如网络购物客户咨询的问题很多事基本一致的,重复性的问题非常多,设置在线服务人员会造成明显的资源浪费;此外,在线客服人员也不是所有的都符合职业道德要求,综合素质良莠不齐。上述问题都可能导致电商平台上的商家遭到客户投诉,降低自身的信誉度。
随着人工智能技术不断发展进步,未来电子商务领域中的人工客服必然会被自动问答客服系统所取代,特别是简单重复性的工作,人工客服仅仅用于处理复杂敏感的问题,全面提升服务质量。而自动问答客服系统如何提升自身的服务水平,就需要有效识别客户的意图,从聊天中散碎的信息中获取有效信息整合处理,更准确快速的理解人类语言。
■ 电商平台自动问答客服系统客户意图识别相关技术
(一)中文分词技术
中文分词,指的是将一个句子或是文章分成独立的词语。自然语言处理中,中文分词技术是其中的基础,也是挖掘文本关系的基础,汉语这种语言本身存在着较为明显的复杂性、笼统性,所以分词技术存在着一定的难度。
汉语分词技术有多种方法,其中较常见的有词典分词方法、统计分词方法、混合分词方法。其中,词典分词,指的是通过文本和词典进行对照,二者匹配获得分词,这种方法简单、精确,但是机器的匹配原则、词条数量以及扫描顺序互怼分词精度造成影响;统计分词,通过统计语料库中的信息制定模型,通过字与字之间的共现信息表示紧密程度,计算两个字同时出现的频率,这种方法应用更广,不需要指定词典,但是需要大量的训练库和参数,需要大量的基础数据;混合分词,指的是将词典分词和统计分词结合到一起,混合两种方法的优势,解决分词中遇见的问题。但是目前分词仍然存在很多问题,还没有找到合适的方法解决。
自动问答客服系统在消费领域中,想要识别客户意图,自动分词的好坏将直接影响后续的词向量训练工作。中文分词技术从上个世纪70年代开始就已经投入了研究,而且是该领域的研究重点,发展至今已经开发出了多种分词系统,目前使用较多的分词系统是NLPIR系统。
(二)词语相似度计算技术
词语相似度计算,该技术也是文本处理领域中的基础技术,应用范围非常广,例如检索中,词语相似度计算可以帮助查找衡量和检索目标相似的程度。应用在自动问答客服系统中,词语相似度计算能够用于推荐答案语义的相似度计算。计算词语相似度有多种方法,按照类型区分可以分成两种类型,即语料库计算方法和语义词典计算方法。
语义词典计算方法。参考语义词典计算相似度,需要参考两个词汇在词典中的相关性,两个词语在词典概念网络上的联通路径距离可以计算二者的相似程度,如果只有一条通路,那么二者之间是存在语义方面的相关性的。
(三)关键词提取技术
关键词,指的是从文本中提取主要思想,能够概括文本的词语,提取关键词的准确性将直接影响到意图识别的准确性。关键词提取要求自动问答客服系统将每个人的聊天语句集合到一起进行文本整理,从文本的总数量确定表达文本主题的关键词提取数量。关键词提取需要基于两个条件:第一,所有的聊天词语关键词都是围绕着商品主题开展的,用户具有购买意图的商品;第二,聊天中的语句大部分都和主题词相近,不相干的词汇非常少。
关键词提取最早使用的方式是通过统计词语的出现次数进行词频权重计算,也就是词频更高的词语更容易成为关键词。但是这种方法准确度十分有限,需要在词频的基础上加入词长、词共现、逆向文件频率等因素,综合提取关键词。例如TF-IDF关键词提取方法,就是通过分析词频和逆文档频率的方式提取关键词。这种方法的思想为:词语的重要性不能单单考虑某个词语出现的次数,同时还需要考虑该词语在其它领域出现的次数,如果不同领域中的频率不同,差异较大,在本文档中的频率较高,说明该词语重要性更高。除了统计方法以外,关键词提取还可以采用基于语义的方法,这种方法需要参考语义词典和词语链。基于语义的关键词提取方法能够更符合自然语言的逻辑,准确度和语义信息质量都高于统计方法,但是这种方法对于词库的依赖性较高。基于机器学习的关键词提取方法是当前研究较多的方法,分成有监督学习和无监督学习两种方法,有监督学习的方法代表有朴素贝叶斯、SVM等方法,无监督学习方法代表有层次聚类、kmeans方法等等。基于机器学习的方法对比统计方法和语义方法能够更好地利用数据集信息,但是没有考虑语义的联系,例如同义词和反义词,所以工作效果并不理想。所以,关键词提取技术目前仍然在进一步深入开发。
(四)意图识别技术
随着通信技术不断发展,智能手机不断普及,网络交友购物已经成为了普遍现象,互联网能够通过用户信息记录海量的生活日志。所以用户在网络上的信息中会包括商品的购买倾向,商家如果能够充分利用此类信息,必然能够更好的完成客户意图识别。目前应用的技术具有代表性的就是情感分析技术,这种技术能够对用户在网络上记录的具有主观性的意见进行归纳总结,挖掘情感。学者们可以通过分析用户在网络上留下的信息分析用户的情绪,采用的方法包括语义分析方法和机器学习方法两种。语义分析是通过已有的词典进行情感匹配,机器学习是通过训练好的语言模型分类器进行文本情绪分类。情感分析技术如果发展得当,未来不仅仅能够用于电商平台,同时也能够应用到警方的舆论监督、重大事件的网络监控等,帮助维护良好的社会环境。
■ 结语
综上所述,网络购物发展越来越快,未来人工客服必然会被自动问答客服系统所取代,所以当前相关工作者的研究重点应该是提升自动问答客服系统对于客户意图识别的准确度,改善客户的网络购物体验。