语音交互技术在城市轨道交通中的应用
2022-03-26付保明王永兴
梁 君,付保明,王永兴,王 帅,章 涛
(1.苏州市轨道交通集团有限公司,江苏苏州 215004;2.方正国际软件(北京)有限公司,北京 100080)
作为城市公共交通的重要组成部分,轨道交通具有运量大、速度快、自动化程度高等特点[1],乘客与自动售检票(Automatic Fare Collection,AFC)系统、运营人员等存在大量的信息交互。语音交互作为一种前沿的人机交互技术,在轨道交通乘客信息交互领域有着广阔的发展前景。根据《中国城市轨道交通智慧城轨发展纲要》,在2025年城市轨道交通乘客智慧服务将普遍采用语音购票、语音问询等功能[2]。万海川[3]探讨了语音交互技术在轨道交通广播系统中的应用场景,以提供面向乘客的个性化广播,但车站环境复杂,声音嘈杂,该使用场景的落地尚需其他系统的支持;艾文伟[4]等在分析语音交互技术功能需求的基础上,介绍了语音购票、语音问询等示范项目的应用情况,但各项应用相对独立,功能整合程度不高,尚未形成完整的应用体系。
根据乘客与轨道交通信息交互的现状,分析当前模式的不足,深入探讨语音交互技术在轨道交通乘客信息交互中的可行性,并将语音交互技术整合在轨道交通各乘客服务系统中,构建智能化的信息交互新模式。
1 需求及问题
1.1 信息交互需求
根据乘客的轨道交通出行过程,其与轨道交通的信息交互可分为主动式交互和被动式交互两大类。其中,主动式交互是指乘客根据出行需要,主动与轨道交通车站各系统进行人机信息交互或与运营人员进行沟通,解决出行过程中的各类问题;被动式交互是指为满足广大乘客出行需求,通过广播、乘客信息显示屏等,轨道交通主动、无差别地告知乘客有关出行信息,乘客根据出行需求,自主选择信息的接收。乘客与轨道交通信息交互类型具体如图1所示。
图1 信息交互类型Fig.1 Information interaction types
由图1可知,当被动式交互所提供的的信息不能满足乘客的出行需求时,乘客将通过问询等主动式交互获取相关出行信息。被动式信息交互模式下,乘客只需接收出行信息即可,与轨道交通并无复杂的交互过程;主动式信息交互模式下,乘客需求主要集中在票务处理、客运人工服务两方面,且需求因人而异,种类丰富,对票务设备及客运人员的要求较高。
1.2 存在的问题
自 助 售 票 机(Tiket Vending Machine,TVM)及客服中心作为乘客主动信息交互的重要窗口,与乘客进行信息交互时,面临流程繁琐、查询困难、防疫等难题。
1)购票流程繁琐,站点查询困难,最短路径不清。网络化运营条件下,TVM人机交互界面按键密集,操作流程繁杂。对购票流程、站点不熟悉的乘客,购票时需要进行摸索,且其选择的目的站点未必是距离出行目的地的最优站点,乘客购票时间长,出行体验差。
2)人力成本高,工作压力大。轨道交通车站客运人员采用三班轮流值守模式,人员编制较多,运营人力成本高。同时,客运人员需要耗费大量的时间及精力掌握业务知识,面对乘客多变的需求,当沟通不畅时,易产生负面情绪,影响轨道交通形象。
3)站外问询困难。当前,乘客站外问询、投诉的主要途径为客服电话、官网、公众号等[5]。但人工客服电话资源有限,占线情况严重,难以满足全线网乘客的问询需求;而官网、公众号等途径,乘客诉求需转交后台人工处理,流程较长,缺乏时效性。
4)新冠疫情防疫。无论是TVM购票,还是客运问询,乘客需与设备及运营人员面对面直接接触。轨道交通车站密闭环境,设备及运营人员面对大量的乘客,极易接触新冠病毒,并传播给广大乘客[6]。因此,在疫情防控常态化情况下,应在满足乘客信息交互的同时,尽量减少乘客与车站设备及客运人员的接触。
2 语音交互应用场景
2.1 语音交互
语音交互技术,是以语音作为主要的信息载体,使机器具备能说会听、学习思考的能力,从而实现人类与机器之间类似人类互相之间的自然语音交互过程[7]。语音交互包含语音识别(Automatic Speech Recognition,ASR)、自然语言处理(Natural Language Processing,NLP)以及语音合成(Text-To-Speech,TTS)3部分。
ASR技术可以将乘客的语音信息转化为文本信息;NLP技术进一步将文本信息转化为计算机语言,以便设备能够理解乘客的语音信息,而TTS技术则是将系统存储的文本信息合成为语音,并通过麦克风等传达给乘客。
2.2 场景分析
针对TVM购票处理流程繁琐等缺点,可将ASR、NLP等技术应用到轨道自动售检票系统中,为乘客提供语音交互购票环境,简化操作程序、减少人机触摸交互。通过人机对话,TVM可以准确地判断乘客的购票意图,有效节约了乘客的购票时间,提升单台设备售票能力,提升了乘客购票体验。
针对客运人工服务效率低、成本高、压力大等问题,可将ASR、NLP、TTS等技术应用到客服系统中,为乘客提供语音交互问询等服务。降低运营成本的同时,减少人员接触,提高服务效率,提高智能化服务水平。
3 实施方案
语音交互功能的实现既需要前端语音处理模块,也需要后端语音处理平台的支持。因此,在AFC系统及客服系统的基础上,通过搭建语音服务平台,并在终端设备上集成语音处理模块,构建语音服务系统,从而为AFC系统及客服系统提供语音交互服务。
3.1 系统功能
语音服务系统应具备ASR、NLP、对话管理、自然语言生成、TTS等全过程语音服务功能,为语音购票、语音问询服务等提供技术支撑。
语音购票:系统能支持中/英文、全过程无接触语音识别购票;能对轨道交通具体站点名称进行精准识别;能将乘客语音信号转换成文字,并在智能服务终端用户界面上进行显示;能根据地名或车站周边兴趣点[8](Point of Interest, POI)实现站点模糊搜索,准确提供最近地铁名称信息,提醒客户购买对应的地铁票。
语音问询服务:系统能够支持开放式语义环境下的问询输入,支持语音模糊问询、全局上下文分析处理、多轮对话处理,能够通过分析对话感知对话场景,预测对话意图,并基于城轨知识库返回拟人化的语音或文本文件,从而为乘客服务提供自助查询、自动应答、远程音视频对讲及站内/外地图导航等语音服务。
3.2 系统架构
作为AFC系统及客服系统的辅助系统,语音服务系统与AFC系统及客服系统深度融合,其系统架构如图2所示。
由图2可知,AFC系统及客服系统为语音交互技术的实现提供了应用环境。语音平台在既有语音交互技术的基础上,根据轨道交通语音交互场景,专门制定符合轨道交通业务需求的语音信号算法、站点/地名识别训练及轨道行业技能。地图软件、客服助手软件、城轨知识库等系统为模糊语音查询、地图导航、自助查询等语音交互功能的实现提供配套支持。
图2 语音服务系统架构Fig.2 Architecture of speech service system
3.3 城轨知识库
知识库是人机交互的“大脑”,为人机语音交互提供数据支撑。针对轨道交通人机交互场景及业务需求,需结合轨道交通相关数据,建立基于自然语言理解的城轨知识库,内容如图3所示。
由图3可知,城轨知识库分为车站数据、运行数据等结构化数据及票务政策、安全法规等非结构化数据两大类。城轨知识库应开放与轨交生产系统、服务系统的接口,实时更新运营信息、乘客失物报送信息、投诉信息等,也可由运营人员手动进行批量数据导入,快速修改发布知识问答,从而实现知识库的快速更新,以便不断优化、提升语音服务水平。
图3 城轨知识库内容Fig.3 Contents of urban rail knowledge base
3.4 既有系统调整
为实现语音交互功能,需对AFC系统及客服系统进行软硬件的调整,从而将语音交互整合在有关系统中。
在终端设备硬件方面,需增加语音控制模块、麦克风、摄像头等模块,以实现语音的采集、预处理及语音回复等终端语音功能。新增硬件应充分利用既有设备内部空间,实现设备整体美观的同时,采用抗噪语音识别技术[9],优化语音处理算法,有效地屏蔽左、右、后方的人声干扰,保证TVM流畅的语音交互体验。
在终端设备软件方面,需在增加语音模块与设备上位机数据接口的同时,根据语音交互场景,优化人机交互界面,调整人机交互流程,从而为乘客、后台客服人员提供人性化语音交互环境。
4 应用案例
苏州轨道交通积极探索语音交互技术在轨道交通的应用前景,在既有线试点语音购票功能,并在新线建设过程中全面推进语音交互技术在AFC、智能客服系统中的使用。
通过与传统购票方式对比,语音购票模式可极大的提高购票效率,且1 m范围内普通话的识别率可以达到95%,能够满足各类乘客的语音购票需求。为确保语音交互的准确性、人性化,系统采用任务型对话[10]、知识型问答等关键技术,给予乘客准确、详尽、专业的回答;为确保信息交互效率,除轨道交通车站智能客服等设备终端外,还将在电话、网页、APP等客户侧,为乘客提供语音自助服务,提高服务水平。
5 结束语
语音交互技术为轨道交通乘客信息交互提供了新途径。通过分析轨道交通乘客信息交互的现状,深入探讨了语音交互技术在乘客服务中的应用方向及实施方案。语音交互技术作为轨道交通智能化发展的重要方向,应进一步探讨其在设备智能化管理、运营管理等方面的应用,在乘客人机语音交互的基础上,实现运营管理人员与轨道交通各机电系统的语音交互,进而实现系统的智能化管理。