APP下载

基于智能语音的车辆售后技术文档需求分析与研究

2019-04-18陈美芳

汽车实用技术 2019年7期
关键词:售后文档检索

陈美芳



基于智能语音的车辆售后技术文档需求分析与研究

陈美芳

(上海汽车集团股份有限公司技术中心,上海 200041)

随着语音识别和自然语言处理技术的进步,车载等智能语音应用越来越广泛,传统车辆售后技术文档转化为适用智能语音的结构语言面临极大挑战。文章基于智能语言技术来分析车辆售后技术文档的多个基本需求,如支持对话形式的检索语言、分解场景和用户的操作意图等,以及研究支持智能语音的车辆售后技术文档语音基础词库、知识模型、数据结构化等要求。

智能语音;车辆售后技术文档;数据结构化

引言

提供产品信息、技术文档和客户支持内容的聊天机器人正在被广泛推进。

车载智能语音将AI技术和汽车相结合,其通过车载语音设备与人类直接交流。他可以为你提供车辆使用支持,提醒你即将可能发生的危险。这一切,会让你觉得自己不再是坐在一台冰冷的工业机器里,而是有一个好朋友的陪伴。

而应用在维修场景的智能语言则是为维修工程师提供服务的,维修过程中经常有这样的场景,维修人员因为需要查询某项操作或参数,而在查询设备和车辆零件维修操作之间切换穿梭,AR眼镜的应用可以使维修人员随时查看维修信息,而智能语音的介入又为他们提供了更为便捷的信息交互方式,售后维修工程师完全可以在维修操作的同时通过语音指令随时获取想要的信息。

传统的售后支持往往是一页一页的文件,要实现上述智能语言场景,离不开车辆售后技术文档的突破,而将传统文档转化为适用智能语音的结构语言将是文档内容管理人员面临的最大挑战。

1 车辆售后智能语言研究方向

车辆售后智能语言主要用于售后技术支持、客户服务及资讯获取。针对售后技术支持的研究方向还是基于查找、知识库、规则来的,即主要通过撷取关键字,再从数据库中找寻最合适的应答;而针对客户服务及资讯则需要构建类似聊天机器人的虚拟助理,除庞大的数据信息库外,还需语音情感应对等等。

智能语音作为人类助手的价值其主要为协助知识工作者提高效率,然而当前书面文字并非旨在以对话的方式提供,这就需要内容管理人员创建智能会话内容来实现目标。谨慎的会话单位,或者称为问题-答案(线程标题/回复),轻松的使用自然语言对话发现有用的相关内容,这种良好的体验可以促进参与并满足客户。

2 智能语音文档需求分析

2.1 支持对话形式的检索语言创建

智能语音相当于通过语音来建立搜索,经过自然语言→检索语言→自然语言的转换,类似“上下文关联帮助(context -sensitive)”,其主要目的是基于用户当前操作,提供和检索主题相关的帮助内容,同时又将复杂的专业化技术内容转化为适合会话的自然语言。

基于良好的智能语音系统,检索语言是技术文档适用智能语音的创建重点。用于智能语音的检索语言是根据语音检索的需要而创制的,需要能够区别标记技术文档信息,并支持系统排列,便于将标引语言和检索用语进行相符性比较。一般操作是依据一定的规则对自然语言进行规范,将售后技术文档中的关键检索分类、检索主题、检索结构等编制成表(表1),供信息标引以及检索时使用。

表1 维修信息检索分类举例

2.2 分解场景和用户的操作意图

场景相关性可以理解为用户的上下文,即收集关于用户想要实现的目标以及目标的参数信息,其包括可能有的各种变化的各种元素。结合场景和用户意图的智能语音文档非常具有挑战性。每个需求往往包含多个具体条件,当无法获取明确的需求时,需要通过语音提问来定位,以便获取完整的用户意图。当提取到的关键信息与数据库内容一一对应匹配时,智能语音才能准确提供相应的帮助。

(1)确定用户的使用场景

掌握用户的使用场景即意味着需要获取当前用户的相关状态和潜在需求,即明确需要解决用户在什么场景下的问题,可以通过询问的方式捕捉用户的需求,或者通过车联的相关数据自动获取用户潜在需求,例如车载模块故障报警、地理位置、车辆当前模式、设备配置交互历史等等。

简单的举个例子。问:保养时需要加多少机油?针对这个问题,不同的发动机答案是不同的,可能1.5T的发动机只需要5升,而2.0T的发动机则需要5.2升。对于用户体验来说,基于提问补充来提供相应的建议并不是很好的智能方法,因此智能语音要精确回答必须能够自动获取该车所搭载的哪款发动机。

(2)识别用户的意图

快速识别用户的意图,即确定用户想干什么或者想了解什么,这就需要将话题控制到一个较小的信息范围,即限定语音对话范围,以免答案非常复杂或出现偏差。语音对话的限定有两种。其中之一是有效控制问题的关键点条件(图1),或者通俗来说就是要问到点子上,通常也可以通过对话将信息范围缩小;其二限定智能语音的可对话范围(表2),即通过限定某些话题的方式,只要用户的提问不超出这个范围,智能语音就比较容易满足用户的需求。

图1 语音信息条件举例

如果采用对话来缩小范围,可以设计如下对话:

用户:你好!怎么开360全景影像?

聊天机器人:请问您是需要在倒车时开启么?

用户:不是,前进时能打开么?(识别,前进=D挡)

聊天机器人:可以,您可以设置起步或转向时开启该系统,也可触摸360开关直接开启。

表2 维修工程师语音对话限定范围举例

3 支持智能语音的车辆售后技术文档研究

3.1 语音基础数据信息库

精准提供智能语音服务的需要一个信息库支持,而如何组织这个信息库来满足用户需求的内容是我们当前面临的最大挑战。数据信息库的两个重要原则,其一是数据的易发布以及共享,其二是可支持高效的查询和搜索。而实现这两者并能支持智能语音则离不开支持智能语音的基础词库设计和知识模型的构建。

(1)专业术语基础词库建设

我们知道智能语音技术离不开两大基础建设:语音识别和语义识别。因此,支持车辆售后技术的智能语音词库建设主要方向是在专业术语库的基础上进行专业词汇扩展和语义扩展。

虽然使用机器学习技术结合多级融合算法,可以借助于每个请求之后的用户响应及上下文来确定预测是否正确,并通过考虑与用户对话所获得的分类结果改善了系统的决策性能。然而在某一智能语音的专项领域,其运用的初期必须对专业的基础词库进行研究。语义理解针对词汇级的研究主要有词性识别、专有名词、词重要性、同近义词、需求词、位置关系,这也是建设基础词库时必须要考量的6个维度。

(2)构建知识模型

知识模型的构建是后续智能语音应用的基础,与传统技术文档不同,构建前就需要考虑把相关特征数据从不同的数据源中抽取出来,并以结构化的方式存储,以便支持预处理并作为后续智能系统的输入。因此,知识模型的构建最重要的核心在于对业务(或者说用户意图)的深入理解以及对知识模型结构的设计。一个完整的知识模型构建一般包含:定义需求模型(图2)、知识模型特征设计、数据关系定义及存储。

图2 功能类知识模型需求图例

(3)精简知识模型数据

复杂场景的智能语音需要构建一个强大的信息架构来组织内容和知识,结合适当的智能语音技术来理解和精准快速反馈用户的目标需求。而要实现这一目标需要遵循效率原则(Efficiency Principle)、分析原则(Analytics Principle)、 冗余原则(Redundancy Principle),即让知识模型尽量轻量化、并决定哪些数据进行智能语言交互,哪些数据不需要。其核心在于把技术文档内容单元设计成小而轻的存储载体。我们仅需要把重点信息进行智能语音开发,而那些访问频率不高、对关系分析无关紧要的信息,以及部分高频反复记忆的信息可以放到传统数据库当中。

3.2 数据结构化

可能大多人会认为只要堆砌足够大的问答数据库,智能语音在回答问题方面就能反馈较为相近的正确率,这样就能达到更智能的目标,而这在我们的实践过程中印证单单凭借足够大的数据库是远远不够的。

“关键词匹配”方式是比较原始的,还需要有数据结构的概念。智能所体现的学习能力,其本质是通过算法将数据分配到相应的数据组织结构中。结构化内容就是将关联内容聚合到一起,从而为用户提供完整而自然的信息。

(1)结构内容以块的形式创建

从分解场景和用户的操作意图这一需求出发,作为内容幕后提供者需要模块化的思维方式,就像使用乐高基本单元块来构建各个子单元再组装成为一个庞大信息库,基于智能语音的售后技术文档也需要建立基本块信息,把较大的技术文档拆分成基本块,这些基本块赋予指定的检索特征信息后,通过特定的规则可集成不同的独立单元,从而构建结构化文档内容。

根据场景和用户意图分解而形成的不同内容块,对每个内容块做分类/打标签后赋予不同特征。比如轮胎应急场景提取出如下特征(表3)。

表3 轮胎应急场景内容块及特征分类

(2)结构内容集成提供

结构化内容是丰富了语义标记的内容,它提供了有关每个颗粒整体及其各部分含义的信息。粒度的、分散的内容块通过彼此之间的概念联系(即相关性),将给定的内容块组合连接,从而提供精确地智能语言服务。实现智能语音如果完全依赖于手动构建多个分支的决策树,将大大增加维护工作量,因此基于内容元数据块自动生成语言服务值得进一步深入研究。

图3 轮胎应急场景结构关系图

语义特征标记通过关系定义将内容块之间联系起来的。比如上述轮胎应急场景 (结构关系图见图3),当提示“胎压低”时,智能语言获取该问题所涉及的相关内容块模型,但是需要解决具体问题仍需要特定条件,智能语音可以提示用户从内容块中选择一种配备工具和相应轮胎外观情况,来推荐提供相应的操作和服务。

4 结语

适用于智能语音发布的售后技术文档内容应是语义丰富、不受格式影响的,简洁的结构化智能内容。技术时代和信息时代容不下一丝犹豫,企业需要从现在开始就做好准备,采用结构化的内容创作方式,并逐渐打通企业技术与售后信息内容存储的孤岛。

[1] 李鹏.中文分词在聊天机器人中的应用研究[D].中南大学,2009 (05).

[2] 黄际洲.聊天机器人知识库自动抽取算法的研究与实现[D].重庆大学, 2006.

[3] 王浩畅,李斌.聊天机器人系统研究进展[J].计算机应用与软件, 2018(12).

[4] 王磊,魏勇,邸建勋,et al.本体聊天机器人的设计与应用[J].自动化与信息工程,2016(4).

Demand analysis and research on vehicle after-sales technical documents based on intelligent voice

Chen Meifang

( Technology center of Shanghai automotive group co., LTD., Shanghai 200041 )

With the progress of speech recognition and natural language processing technology, intelligent voice applications such as on-board vehicles are more and more widely used. It is a great challenge for traditional vehicle after-sales technical documents to be converted into structural languages that are suitable for intelligent voice. Based on intelligent language technology, this paper analyses many basic requirements of vehicle after-sales technical documents, such as search language supporting dialogue form, decomposition scene and user's operation intention, and studies the requirements of basic vocabulary, knowledge model and data structure of vehicle after-sales technical documents supporting intelligent voice.

Intelligent voice; Vehicle after-sales technical documents; Data structure

U471

A

1671-7988(2019)07-175-04

陈美芳,就职于上海汽车集团股份有限公司技术中心。

U471

A

1671-7988(2019)07-175-04

10.16638/j.cnki.1671-7988.2019.07.058

猜你喜欢

售后文档检索
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
轻松编辑PDF文档
2020广州国际汽车零部件及售后市场展览会成功举办
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
英国知识产权局商标数据库信息检索
Word文档 高效分合有高招