APP下载

基于新一代人机对话技术的公安便民服务平台关键技术研究

2022-10-16金郁张建坤范海华施卫国浙江省嘉兴市公安局经济开发区国际商务区分局

警察技术 2022年5期
关键词:便民服务引擎警务

金郁 张建坤 范海华 施卫国 浙江省嘉兴市公安局经济开发区(国际商务区)分局

引言

公安服务与群众生活息息相关,随着公安“放管服”改革持续深化,便民新举措不断落地落实,使得群众满意度不断提升。便民服务的提升,不仅依赖机制的改革,更加依赖蓬勃发展的新技术,正是新型技术的不断引入,使得便民服务的革新存在新的可能。

人机对话技术是近年来人工智能技术的热点之一,其可以让机器理解人类语言并和人自由对话[1],这与公安便民服务的大量场景匹配度非常高。但是传统人机对话平台存在交互呆板和程式化问题,极度影响群众使用体验。

针对上述问题,本文利用新一代人机对话技术,以突出的多轮对话能力、大规模预训练对话模型带来的快速冷启动、低成本知识构建、自训练的语义模型等技术优势,借助在公安便民服务丰富场景下积累的领域经验和应用,创新探索新型智能便民服务模式,进一步提高为民办事的成效力度,降低警务人员工作强度,为公安“放管服”改革的持续深化提供相关参考。

一、传统人机对话技术面临的挑战

人机对话技术一直以来被认为是人工智能领域的核心挑战。国内外较多专家学者对此进行了相关深度研究。如XU J在2020年研究了开放领域中多回合对话策略的学习框架问题,LI R在2018年发表的论文中创新性采用人工标注构建出真实的对话推荐数据,使得人机对话系统可提供建议等[2]。然而遗憾的是,传统的人机对话平台大部分只能局限特定场景,很难适应复杂多变的公安便民服务需求。总结来说,传统人机对话技术的技术难点主要集中在如下几个方面:

(一)知识构建的成本高

要让机器听懂并理解人所说的话,那前提是机器要像人一样预先具备大量的知识,这些知识也需要是结构化的[3]。这里的结构化知识主要包括两类:以特定目标为中心的对话流程知识和知识图谱。要构建围绕给定场景的较完备的对话逻辑流程(动态知识)预计需要花费1~2周的人力,构建给定场景的Schema和知识图谱(静态知识)预计需要2周左右的人力,因此知识构建的成本是非常高的。

(二)机器人优化周期长

机器人从启动到符合上线标准需要进行多批次的优化打磨,每一批次都需要收集真实情况下的对话数据、标注数据、训练模型、调试模型、测试对话效果、分析问题背后的原因,然后再进行下一轮次的优化,前后预计需要2~3月;类似的,知识图谱问答效果迭代优化需要2周。

(三)从成熟场景迁移到小样本新场景的对话体验差

机器人在成熟场景下由于有较多的真实对话数据可供加工和利用,对话体验是可以不断优化的。但迁移到小样本和新场景后的对话体验就有非常明显的效果下降。比如目前电商的在线机器人、快递电话机器人等运用都不错,但在公安便民服务小场景下,传统的机器人会出现较差的对话体验[4]。

二、新一代人机对话技术平台

鉴于上文所述技术难点,新一代人机对话技术平台主要从如下三个层面进行突破:

(1)从知识层面,采用结构化知识的半自动构建技术,降低知识构建的成本;

(2)从对话模型层面,融入知识的预训练对话模型,从而缩短机器人从启动到符合上线标准的优化周期;

(3)从对话引擎层面,采用具备拓展和增强对话能力的引擎,使其具备不断学习演进能力。

新一代人机对话技术平台技术框架的其核心主要是5层(如图1所示):数据层、知识层、预训练对话问答模型层、引擎层、平台层。其中核心3层,分别为知识层提供可扩展性的知识图谱构建;预训练对话问答模型层包括预训练对话模型、预训练图谱问答模(KGBert)、预训练表格问答模型(TableBert);引擎层包括Dialog Studio多轮对话引擎、KBQA图谱问答引擎、TableQA表格问答引擎、FAQ问答引擎、MRC机器阅读引擎。

国1 平台技术架构国

(一)知识层

知识来源主要分为两类,一类是人人对话日志,另一类是工作文档。相对应的知识构建也分两个方面,一方面是基于人人对话日志的对话流进行构建,从传统的手工配置升级为自动挖掘意图,从人工标注变成自动的挖掘和半自动标注;另一方面是基于文档的知识图谱构建。文档本身就具备一定的结构化信息,做了结构化后可以让问答更加精准。围绕基于文档的知识图谱构建,笔者采用半结构化长文档的预训练文档模型、基于文档的粗粒度三元组抽取、针对文本的细粒度三元组抽取,设计了一套可扩展性的知识图谱构建方案,如图2所示。

图2 可拓展性的知识图滑构建

(1)文档预训练模型,将文档表示分为物理结构、逻辑结构和语义结构三个层次,使用百万级的无标文档数据,基于其文本语义、版面信息、视觉特征来构建自监督学习任务,使得模型能够更好地理解文档语义和结构信息;

(2)粗粒度三元组抽取,通过输入整篇文档的物理组件的有序序列,再将其物理组件如标题、正文识别出来,再根据这些信息生成文档树,最终根据一些简单的规则即可得到文档的所有粗粒度三元组;

(3)细粒度三元组抽取,基于双线性三维稀疏、损失函数等技术的细粒度三元组知识抽取,降低了模型复杂性,提高了鲁棒性。

(二)预训练对话问答模型层

设计了半监督预训练的方式来解决对话策略的建模难题,将对话动作预测任务改造成半监督学习任务,并设计出预训练模型。

(1)对于理解能力,采用回复选择作为预训练目标,即给定对话上下文和候选回复处进行二分类判决是否是正确的回复;

(2)对于生成能力,则使用常见的回复生成目标,即给定对话上下文生成正确回复语句;

(3)对于策略部分,采用半监督学习中十分高效的一致性正则方法来建模对话动作。

最终对于模型的预训练,笔者将整个模型的理解、策略、生成目标加在一起进行优化,整体提升对话策略的建模效率。

(三)引擎层

主要包括针对流程型知识的对话引擎,针对表格知识的问答引擎,针对知识图谱的图谱问答引擎等。其中,表格问答通过将自然语言直接转换为SQL查询语言,允许用户使用自然语言与表格知识直接交互,从而拓展了对话机器人的能力边界。针对表格的表格问答引擎,主要开拓并打造了从单轮到多轮的问答和从单表到多表的问答能力。

(1)关于多轮的表格问答,笔者提出了一种基于动态上下文模式图的框架,刻画多轮场景下的自然语言和表格之间复杂的语义链接关系。

(2)多表的问答,笔者利用句法关系建模了自然语言问题内部的关系,在句法距离的度量下,数据和数据的关系将被拉近,从而生成正确的SQL。

三、公安便民服务场景探索与实践

(一)便民服务业务分析

经过大量调研和分析,对人机对话技术有较大需求的便民服务场景包括如下两个方面;

1. 便民热线场景

当前较多地区热线服务电话分散,基层公安缺少统一的呼叫中心坐席人员支持,热线服务电话一般直接转给了窗口服务的警务人员,一方面给窗口警务人员带来了更大的压力,另一方面群众在非工作时间段的咨询不能有效的承接。

2. 疫情流调场景

近年来随着疫情常态化,各地公安民警都需要做好疫情的防范和控制。当疫情突发时,需要进行大量的流调来对相关人员进行摸排。然而常规流调的方式主要基于人工电话来实现,一方面耗费大量宝贵的人力资源,另一方面在在时效方面无法保障快速的摸排需求。

(二)场景技术融合路径

根据上文所述便民服务场景的聚焦,结合新一代人机对话技术平台,确定如下三条技术融合路径,即警务智能在线机器人、警务智能热线导航机器人和警务智能外呼机器人。

1. 警务智能在线机器人

智能在线机器人基于NLP和AI技术提供智能在线对话能力,可集成到网站、APP、小程序/微信/微博等渠道中,支持7x24小时提供智能在线服务,实现在线问答、在线智能导服、业务知识库等能力,如图3所示。

图3 警务在线机器人业务逻辑图

2. 警务智能热线导航机器人

在热线电话人工受理方面,需考虑智能语音交互功能。通过自助语音导航能力,分流一部分人工坐席的压力。

研究基于语音的人机交互应用,开发警务智能热线导航机器人,如图4所示,当群众电话呼入后,通过系统中的语音引导,以自由说的方式提交咨询要求,如群众提问“我身份证丢失了怎们办?”,机器人可识别理解用户表达的语义并作为正确的语音引导。

图4 警务智能热线导航机器人业务逻辑图

在出入境、户籍、交警等方面,热线导航机器人可将各个热线座机的统一集成,由机器人提供智能化的服务指引及问题解答,同时也能支持将机器人无法解答的问题转接到对应的窗口警务服务人员。在方便群众快速咨询问题的同时,也可以有效帮助减轻窗口警务服务人员的工作压力。

3. 警务智能外呼机器人

警务智能外呼机器人具备自动呼出能力的智能语音能力,能够根据业务方需求,在指定时间范围内,对指定的用户发起主动电话外呼任务。在外呼过程中,结合运用ASR、TTS语音引擎和机器人NLP能力,能够实现包含疫情流调、反诈预警、满意度调研回访等在内的各种复杂场景的外呼智能问答任务,同时还需支持将外呼过程中收集的信息和数据回流到工单或者其他应用系统,形成统计数据和日志。该机器人可以在应急时快速增加同时外呼的并发路数,从而进一步提升疫情流调的摸排效率,如图5所示。

图5 警务智能外呼机器人业务逻辑图

(三)部署要点

在网络承载方面,考虑到公安应用场景数据的敏感性等,该系统建议在公安信息网内进行部署。

在部署资源设计方面,资源需要在满足日常使用的基础上,预留一定的资源支撑疫情防控等高峰场景使用需求。

在业务扩展方面,系统需要能支持一定的扩展性,在后续业务量增加时进行扩展;

在业务打通方面,系统需要与公安信息网内其他业务系统之前具备打通的条件,实现外呼自动触发等场景的连通。

(四)某地实践案例

在某地实践中,基于上文的技术路径,根据各个场景的应用诉求进行统一的平台规划,以新一代人机对话技术构建公安便民服务场景中警务智能在线机器人、警务热线导航机器人、警务智能外呼机器人,并以支付宝、微信小程序的形式作为面向群众、企业、警民的用户界面,实现智能化在线办事、警务热线导航、电话热线服务以及在防疫、群众满意度等场景下的智能外呼等需求。

本节重点阐述各模块分阶段落地实施设计。

(1)建设警务智能外呼平台,并先后落地实现了引导申报外呼、实名申报外呼、满意度回访外呼、出警通知外呼、反诈通知外呼和疫情调研外呼等。实现了常用外呼通知业务的自动化和智能化,以及疫情调研类应急外呼能力的搭建,并沟通了应急智能外呼能力的扩展机制。

(2)落地警务智能在线机器人以及智能知识库。智能知识库主要是为满足智能在线机器人的知识管理需求,而搭建的一整套半自动知识构建、知识录入、知识编辑、知识运营的系统,能够帮助业务人员实现高效的知识管理和知识运营。知识库中涵盖户籍类、出入境、流动人口、治安、小程序申报、法律咨询等数百条公安政务知识,以及大量通用政务知识来满足群众日常咨询需求。智能在线机器人的前端是基于H5技术搭建的页面,如图6所示,可以方便的集成到网站、APP、小程序等渠道中,通过流程引导提供对于户籍类、出入境、流动人口、治安、小程序申报、法律咨询等公安政务知识的智能服务,用户可以通过直接点击图标按照分类查找自己想要咨询的问题,或者直接通过文字和语音的方式向机器人进行咨询。机器人会理解用户输入的问题,并给出解答,对于答案部分还能支持语音播报。

图6 警务智能在线机器人对外服务界面

(3)建设警务智能热线导航机器人,一方面实现多个派出所出入境、户籍等多个服务大厅电话号码的统一,实现一号通办,方便群众记录,同时基于智能导航机器人实现了对常见业务的智能咨询支持,目前建设覆盖的业务场景主要包括治安、户籍、出入境、流动人口几大场景。

该地通过上文所述的分布建设模式,有效的构建了基于新一代人机对话技术的公安便民服务平台,实践成效如下:

(1)大幅降低疫情流调等场景下警务人员的人工资源消耗量;

(2)通过智能导航机器人和办事窗口警务服务人员的有效协同,实现群众咨询100%响应或接听,服务好评率95%以上;

(3)真正实现了7×24小时不间断提供热线、在线等多渠道智能服务能力;

(4)提升服务效率,降低行政成本,节约办公成本,更有效引导群众“掌上办”“网上办”,实现公安政务服务全方位提升群众办事获得感和满意度。

四、结语

本研究将下一代人机对话技术应用于公安便民服务场景中,通过对警务智能在线机器人、警务智能热线导航机器人、警务智能外呼机器人三种技术路径的探索,构建出体系化的公安便民服务平台,实现了新一代人机对话技术在公安工作中的真正落地,提升了公安便民服务的智能化和在线化水平,切实为基层民警工作减负提供了有效的技术支撑。

在可预见的未来,人机对话会逐步从受限场景拓展到半开放场景,从单模态升级到“语音+语言+视觉+情感融合”的多模态,对话能力从预定义跨越到具备一定终身学习的对话机器人[5]。笔者将继续研究其与反电信诈骗、案件侦办等场景高效结合,进一步提升数字化转型对基层工作的赋能力度。

猜你喜欢

便民服务引擎警务
新海珠,新引擎,新活力!
便民服务
三生 三大引擎齐发力
环球警务专访
蓝谷: “涉蓝”新引擎
HIV感染的警务预防与处置
警务训练中腹痛的成因及预防
便民服务是根本
杜尔伯特蒙古族自治县 建立便民服务长效机制
“小卡片”传递大民生——恩施市推进社会保障卡便民服务点建设纪实