APP下载

铁路12306线上智能客服系统方案研究

2020-03-28梅巧玲王思宇

铁路计算机应用 2020年3期
关键词:客服语义旅客

梅巧玲,王思宇,马 杰

(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)

随着人工智能及机器学习等技术的不断进步,智能应答和智能推送技术及系统日臻成熟,达到了商用的水平。微软、阿里巴巴、腾讯、移动、小i、苹果、谷歌等国内外的公司都对该领域进行了深入的研究,发展了自己的产品线,逐步向个人助理方向演进[1-3]。中国高铁正处于一个发展关键期,随着高速铁路“四纵四横”规划基本实现,高速铁路的发展影响并改变着人们的生活节奏和出行方式,广大旅客对铁路业务咨询的需求也日益增长。

目前,铁路12306互联网售票系统(简称:12306)客服热线客服人员1 232人,日均服务量7.25万人次,节假日日均服务量8.9万人次,寒暑假和节假日服务需求突增。随着客票业务种类的增多,客服工作遇到了很多问题,比如客服人员与服务需求严重失衡,热线一对一服务效率低,常见性问题占比大,人力耗费过多,制度类变更需及时让全体客服人员重新学习,整理回复模板,确保客服人员回复口径一致,回复模板、规章制度检索效率低等。微信公众号和小程序虽然提供了部分自动应答的功能,但只能解决少量的咨询问题。铁路12306线上智能客服系统的引入可以显著增加旅客服务的承载量,辅助客服人员快速准确地处理应答,在提高客服人员并发处理能力的同时替代部分客服人员,减轻人工客服的压力,为旅客提供更优质、更完善的体验和个性化服务。

1 系统架构

随着信息系统智能化水平的不断提高,以及传感技术、智能技术、网络技术和云计算技术的持续突破,智能客服系统逐渐兴起。在应用场景、应用模式方面更为多元便捷,已成为智能时代客服发展的新趋势。铁路12306线上智能客服系统较传统的客服系统而言,具有更为灵活的智能化特征和服务特性,能够实现感知、决策、执行等系列功能,是一种新型的智能信息系统。该系统的架构层级主要分为接入层、应用层和数据层3部分,如图1所示。

图1 系统架构图

1.1 接入层

接入层主要包括基础构件和接入管理2部分:基础构件主要由语义识别引擎和需求预测引擎组成;接入管理的作用是对请求进行分类、排队,并根据当前的系统情况进行合理请求分发,主要包括智能排队、分发策略和负载均衡3个子模块。

1.2 应用层

应用层主要包括后台管理和智能客服应用2部分:后台管理包括知识库管理、数据采集及分析和问题库管理;智能客服应用包含客服机器人、定制服务、智能规则引擎、营销推送、需求预测和语音语义识别等子模块,各子模块的具体功能如下。

(1)客服机器人:通过搭建知识库,形成智能问答系统,解决用户的问题。系统支持文字和语音信息类型,满足不同用户的需求[4-5]。

(2)定制服务:收集用户需求(如感兴趣的主题、喜好等),根据历史记录数据深入分析挖掘,为用户提供全方位、全行程定制化服务。

(3)智能规则引擎:常见问题可以在线申请反馈,处理问题。后台引擎对出现的问题进行归类统计分析,辅助客票系统升级优化问题答案。

(4)营销推送:根据旅客行程信息,给旅客推送相关城市的天气、酒店、热点新闻、景点、当地特产等信息。

(5)需求预测:通过对历史出行记录、最新搜索目的地等信息的大数据分析,结合地域、年龄、出行成员等信息,分析用户的出行需求,实现主动服务。

(6)语音语义识别:支持对语音语义的高准确率识别,从问题库中快速匹配出相应的问题。

1.3 数据层

数据层包含知识库、问题库和知识索引3部分,同时提供与客票业务系统、外部系统的数据接口。

知识库和问题库涵盖全路、全渠道的多媒体应答,包含规章制度、通告等知识,基于预采编的知识数据,自动生成语义标签,可快速对知识进行结构化组织。数据层和客票业务系统交互的数据包括列车基础数据和旅客出行轨迹等;与外部系统交互的数据包括天气、美食、旅游、航空等。

2 系统功能

2.1 多渠道服务方式

铁路12306线上智能客服系统以自然语言处理技术为基础,通过多媒体网关统一接入电话、邮件、短信、微信、支付宝等多种渠道,处理语音、文本、视频、图片等信息。多媒体网关通过媒体适配器屏蔽和卸载各种接口、加密串、协议等,并进行信息过滤筛选和预处理,统一传送到集中的排队服务器中;同时,与后台机器人引擎相结合,通过拟人化的方式与用户进行实时交互,为用户提供智能化的应答服务。

2.2 智能推荐

系统以用户属性数据、历史提问内容、业务数据为基础,自动采用结构化与非结构化分析方法。用户在各渠道(网站、微信、手机APP、支付宝)获取在线服务时,系统自动对接各业务接口,发现用户关注点,依据条件触发营销推送,主动向用户推送营销信息,如:天气、景点、土特产、列车最新正晚点信息、列车停运通知、失物招领、突发事件公告等,让旅客第一时间了解最新资讯,获取更好的服务。

该功能模块对用户交互数据进行业务分类、聚类、热词统计并提供报表,利用语义解析功能识别用户意图,将关键信息传递给业务系统,用于支撑完善知识库,对客票系统的业务优化具有参考意义。

2.3 智能应答

智能应答最早应用于电话的语音、短信增值业务,后来发展到在线客服接入网站等。现在无论是网站还是移动APP,例如微信、支付宝等各类有服务咨询功能的应用,均采用统一的在线客服智能应答服务引擎。智能应答服务引擎提供多种形式的接口,例如,SDK、API、嵌入页面等,并根据不同的渠道进行适配改造,实现接入。

智能应答流程有3个环节:开始环节,包括触发场景条件、场景开始提取信息规则;动态环节,包括进入环节条件、如何询问用户、环节内提取信息规则;结束环节,包括退出场景条件、成功时系统动作、失败时系统动作。系统对已有的大量数据进行特征提取,分析得出表示具有情感倾向性的特征词,再通过机器学习方法,对大量数据进行建模,判断当前用户的情感倾向性,再对用户进行针对性的回答,从而实现智能应答。系统还提供验证集回归测试机制,可以直观体现系统升级优化对应答的影响情况。该功能需要事先定义好由模拟问题和目标知识组成的验证集,在系统版本升级和知识变化后或定期巡查过程中,由系统自动模拟测试,得到准确率优化建议,这样可以不断优化智能应答的结果。

3 关键技术

铁路12306线上智能客服系统是12306与用户之间重要的沟通渠道,通过信息交流完成业务服务。自然语言信息的非结构化特点造成大量问题不能及时反馈处理,不能有效提高用户体验度,要解决这一问题,需要实现对语言信息的智能化和自动化处理,将原来主要由人工完成的工作交给系统自动完成,人工只需要进行辅助处理,这样既能减少人力资源的投入,又能提高客服处理效率和智能化水平,改善客户体验。

3.1 语义识别

语义识别技术可以分析网页、文件、社交媒体中的大量数据,通过接口技术应用于机器人、智能家居、智能语音交互等领域,涉及医疗、教育、金融、交通等行业[6-7]。在铁路12306线上智能客服系统中,语义识别作为接入层的重要组成部分,承担着与用户交互的工作。

语义识别可以分为自然语言处理(NLP,Natural Language Processing)技术层和底层数据层。NLP技术层主要分为词法句法分析和语义分析2部分,用于从给定数据中抽取重要信息。底层数据层是语义识别算法模型的基础,包括词典、数据集、语料库、知识图谱以及外部世界常识性知识等。本系统利用知识库和问题库提供底层数据,建立语义识别算法模型[8-9]。

3.2 大数据分析

准确地掌握旅客出行特征是获取铁路出行需求,优化铁路运行图,构建市场化铁路运营体系的基础,有助于规划管理部门制定科学决策。同时随着铁路交通网络规模的不断扩大和延伸,数据采集的深度和广度也不断增加。铁路系统在运营过程中积累了海量的数据,这为提取旅客的出行链和出行规律奠定了数据基础,为进行旅客出行特征分析提供了新的思路。大数据分析技术在数据量大、数据迭代快的场景下,对铁路系统在运营过程中积累的海量数据进行管理和分析,充分挖掘数据潜藏的价值。

3.3 知识图谱

知识图谱又称为科学知识图谱,主要以知识抽取、知识表示、知识融合、知识推理技术为基础。知识图谱是知识的元素组合和逻辑联系结构,每一个知识图谱包括对象、条件、属性、参数4个元素。其中,对象与属性可以决定一个知识图谱的结构,条件和参数可决定一个知识图谱的实例化。一个知识图谱可以有多个实例化结果,实例化结果与传统知识库的知识概念相似,每个实例化结果对应一个标准答案,这就将各个实体进行了关联。

传统的客服系统以中文分词和关键词为核心,通过语句相似度计算来实现自动问答,这种系统虽然在客户服务中起到不错的效果,但是存在准确率低、效率低、维护难等问题。在大数据、机器学习等新技术的影响下,铁路12306线上智能客服系统利用知识图谱技术构建一个庞大而精细的知识库,为每条知识设计足够多的相似问法,并完成关键词重要性标记,通过对海量数据的分析、标记,不断完善、优化知识库,使其成为智能客服的最强大脑。

3.4 智能搜索

铁路12306线上智能客服系统的智能搜索技术通过使用数据挖掘、机器学习等技术对列车运行数据、铁路出行数据、用户个性化数据进行综合分析建模,针对每一名旅客分别建立个性化的数据模型。系统在接收到旅客提出的问题时,会结合问题库中当前热点问题,智能分析旅客的真实意图,返回个性化的智能搜索结果,提高返回结果的相关性和正确性。智能搜索实现的具体流程如下:

(1)将铁路旅客多维特征(如年龄、出行规律、地域)进行抽取和统计;

(2)对出行数据进行聚类分析,按出行特征将旅客分为不同类型的旅客群体,属于一个类型的用户群体具有相似的属性,对铁路出行有相似的关注主题;

(3)系统分析计算各旅客群体对每个主题的关注度,获得用户群体和各信息主题相关性;

(4)根据问题类别、参与人数对当前旅客关注的热点进行动态计算,提取热度较高的主题形成热点主题,利用关联规则挖掘,将热点主题相关的热点问题提取出来,显著提高系统准确率。

4 结束语

本文结合当前铁路客票服务的现状,提出了铁路12306线上智能客服系统方案,系统以自然语言处理技术为基础,接入方式由单一接入向集电话、短信、微信、支付宝等多种方式接入转变,搭建了具有多方式接入、多渠道协同、多方位智能化应用的智能客服系统。客户能随时随地、便捷快速地获得丰富的产品信息和全面的业务指导,真正做到用用户喜欢的方式为用户进行服务。铁路12306线上智能客服系统方案的研究满足了移动互联网环境下用户和企业变革的需求,统一了服务内容和服务流程,提高了客服人员工作效率,为后续系统功能的进一步深化研究奠定了基础。

猜你喜欢

客服语义旅客
真实场景水下语义分割方法及数据集
非常旅客意见簿
候车大厅的旅客
语音推销
我是人
建议
“吃+NP”的语义生成机制研究
出大事了等
销售能手
情感形容词‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的语义分析