刍议语音识别在公安工作中的应用

2018-02-23厉鹏，李晔，王铭欣

科技创新与应用 2018年6期

厉鹏，李晔，王铭欣

摘要：语音识别在经历了近六十年的发展之后，在近几年的时间里呈现出井喷式的发展，给人们的生活和工作带来了巨大的改变。而正是由于语音识别具有的稳定性和唯一性、采集的便利性、处理的强大性、识别的智能性等独特的优势，使其在公安机关中获得了多方面的深度应用。公安机关应当尽快明确语音识别的定义，结合公安的具体工作和实际问题，积极探讨语音识别在信息录入、保密工作、侦查破案、审讯询问、便民服务等公安工作中的深入应用，才能进一步实现公安工作的创新，成为未来公安工作发展和变革的强大推力。

关键词：语音识别；公安工作；应用

中图分类号：D631.2 文献标志码：A 文章编号：2095-2945（2018）06-0132-03

Abstract： Speech recognition has experienced nearly 60 years of development. In recent years it has shown the development of blowout in bringing great changes to people's lives and work. And because of its unique advantages - stability and uniqueness， convenience of collection， robustness of processing， and identification of intelligence， speech recognition will be applied deeply in many aspects of the public security organ. The public security organs should follow the pace of the times and clarify the definition and characteristics of speech recognition as soon as possible. It should combine with the specific work and practical problems of public security， and actively explore the voice recognition in the information entry， confidential work， investigation and detection， interrogation， convenience services in order to further achieve the innovation of public security work and become a strong thrust for the public security work in the future development and transformation.

Keywords： speech recognition； public security organ's work； application

1 语音识别技术概述

1.1 语音识别的发展历程。语音识别技术依托人工智能技术的研究而不断取得进步。自计算机科学之父阿兰·图灵提出了人与计算机进行交流的设想开始，人类便开始了语音识别的研究。语音识别起始于20世纪50年代的Audry系统[1]。1952年，世界上第一个语音识别系统在美国贝尔研究所研制成功，这成为了语音识别技术的历史开端。1960年，计算机语音识别系统首先在英国研制成功。20世纪70年代，随着统计语言学在语音识别中的应用，语音识别的研究从微观转向宏观，从小数量转向大数量，从特殊转向一般。20世纪80年代中期，语音识别的研发借助HMM模型和人工神经网络（ANN）将纯数学模型工程化、程序化和简单化，掀起了新一轮的研究热潮。20世纪90年代以后，语音识别以人工神经网络技术作为突破点，促使语音识别真正的从理论走向了实际的应用。2006年，深度神经网络研究的巨大突破，使得人工智能迎来了第三次浪潮，而语音识别的也在此基础上，依托大数据技术、云计算技术不断的开拓创新。谷歌、微软、百度、科大讯飞等公司不断的强化了语言识别的新功能，将语音识别的精确性、迅捷性和智能性提高到了一个新的高度。语音识别的应用也在多国语音文字的智能转化、智能家居、金融服务、汽车导航等等方面开启了人机交互、万物互联的智能化语音识别时代。

1.2 音识别的概念。一般的语音识别是指将人发出的声音信号转化为文字或者其他指令的过程[2]。于瑞华认为，语音识别是凭借人发出的语音波形中能够反映发声人的生理、心理和行为等语音特性的参数，进一步识别和确认发声人身份的过程。[3]。声纹鉴定的概念是应用语言学、行为学、心理学等学科的知识，判断是否为同一声源，或者断定声音或声源的性质和特点的一种专门技术手段[4]。公安机关中语音识别的概念更接近于声纹鉴定，包括通过语音识别技术和语音数据库对语音信号的处理、分析、鉴别、类比，进行发声人的辨识和确认，进而为侦查破案提供侦查方向和线索、确定轨迹路线、固定证据材料等工作。而随着新理念和新技术的出现，语音识别的概念内涵和外延也会更加的丰富，从而更好的服务与不断变化的公安工作。

2 語音识别在公安工作中应用的可行性分析

2.1 稳定性和唯一性。语音是由人的声带作为声源振动产生的，而由于声带的长短、宽窄、厚薄等生理属性的不同，使得语音音调、音色和声强等特征也不尽相同。而且这些特征具有相对稳定性和唯一性。稳定性是指人的语音特征在固定的年龄断是基本不变的，除非受过专业训练，否则任何人说话都会带有母语腔，而随着生理和心理上的成熟，这种稳定性会更加突出。唯一性也叫差异性，是指因人的声带先天的生理构造的不同，以及后天形成的说话习惯、心理素质、知识水平的不同而具有特殊性，这是区分发声人，实行语音同一认定的重要依据。

2.2 采集的便利性。语音的传播和采集所需条件十分简单，入门门槛很低，相应的语音记录、存储整理和传输技术已经非常成熟。每个人的手机都是一个天然的语音采集器，语音的采集可以实现同步识别，并借助软件后台进行备份上传云端，从而大批量的进行语音数据的采集处理。语音识别的采集对于被采集对象没有过多的限制和要求，不需要直接接触，还可以对环境进行清零和降噪，可在大多数场景下进行语音的采集，大大提高了采集的可实施性和便利性。

2.3 处理的强大性。语音识别研究的不断突破，使得语音识别展现出了自身独一无二的强大性。第一，处理的及时性。语音识别的实时处理速度迅速，反馈时间很短，完全可以跟上普通人说话的速度，这便保证了系统的持续工作能力和识别的连续性。第二，转化的准确性。语音识别系统会自行进行相应学习和升级，语音的处理变得越来越智能化和准确化，最新研发的语音识别系统的词错率已降到了5.5%，达到专业记录员的水平。第三，多国语言的无缝对接。语音识别支持多国语言的实时翻译和同声传译，实现了不同语言之间的实时交流，像微软的Siri就会说36个国家的21种语言，这进一步提高了语音识别的应用领域。

2.4 识别的智能性。语音识别的智能性体现在其不仅仅可以充分准确的对语音信息进行快速的记录、存储和翻译，以及对形成的电子版文字进行人声的智能修改等传统语音识别工作，根据工作人员下达的语音指令，结合心理学、行为学等其他学科的模型体系，根据语速、语调和停顿对发声人的意图进行分析做出说话人意图的准确判断；自动对语音进行实时多点收集、大数据的智能化的分析，并通过将发声人的音调、音色和声强对发声人的身份进动态的分析和全天候跟踪、确认，并及时报警或者反馈给工作人员。

2.5 应用的广泛性。语音识别技术除了可以用在图像识别、机器翻译、智能家居、汽车导航、生产的自动控制、手机语音合成等多个技术和领域之外，也可以在公安、司法、医疗、商务办公等领域发挥作用。单就公安机关来讲，各个部门、各个警种的各项工作中都可以大量应用语音识别技术，来进一步提高公安工作的效率和能力，实现智能化警务的转变和发展。而大数据技术和云计算技术的深度应用，人与机器的耦合会不断加强，语音技术的应用也将会更加普及。

3 语音识别在公安工作中的具体应用

3.1 语音识别技术在信息录入工作中的应用。公安机关每天面临着大量的数据录入工作，尤其是基层工作单位，需要将海量的数据进行录入和整理。而这些信息是每天都需要动态录入的，总量巨大的信息占用了公安工作人员大量的时间和精力，而且还会由于计算机硬件设施和操作水平的缘故，造成相关工作的延误。而语音识别技术为这类工作带来了极大的便捷，采用语音自动识别录入技术，不仅可以快速进行语音到文字的转化，还能都及时的对语法错误、拼写错误进行检查和语音更正，根据需要对数据进行归档整理和存储，语音的搜索和提取方便快捷，公安工作的效率得到极大的提高。

3.2 语音识别在公安保密工作中的应用。传统的纸质保密存在一定泄露和丢失的风险，尤其是涉稳、涉毒和涉恐的信息，一旦泄露即会造成严重的后果。而语音识别的保密功能却可以很好避免此类事件的发生。对于一些重要的、涉密的会议在使用语音技术进行全程的文字转化的同时，还可以对语音进行全程加密，防止第三方的窃取和窃听。只有获得相应的权限才能查阅和听取相应的会议内容，不留纸质文件，直接形成电子版文件。一来便于信息的共享和携带，二来可以及时对文件进行加密处理和保存，更好地完成公安机关相关工作的保密工作。

3.3 语音识别在侦查破案中的应用。语音识别在侦查破案中早有应用，其根据对于收集的原始语音数据进行分析，可以确定嫌疑人的身份信息为侦查划定范围和提供方向。依据法律规定的相关程序，搜集案发时周边相应的语音数据，包括微信、QQ等社交软件中的语音信息、通话录音等，对留下的语音进行分析辨认。针对在逃人员，可以根据已经搜集的关于他的语音信息，与语音大数据库进行碰撞和关联，进行踪迹追踪和团伙深挖。同时，将其语音信息与社会中每天收集的语音信息进行动态对比，实现语音的全天候跟踪，并结合PGPS系统对其进行及时的定位，及时报警和反馈，发现其踪迹和隐藏地点，以便进行围堵和抓捕。

3.4 语音识别在审讯讯问中的应用。公安机关可以运用语言学、行为学、心理学等多门学科的理论设置相关参数和模型，对被讯问人的音色、音调以及配合说话时的微表情和肢体动作进行分析，抓住其语音中反映出的微妙变化，识破其谎言，抓住弱点进行突破。基于语音识别的深层语音情感评测技术更可以让内在的情感外在化、客观化、直观化、数据化，具有更强的应用性和操作性。讯问人员如能及时了解和掌握犯罪嫌疑人的心理活动和情感走向，就能找到其供述的薄弱点和障碍，从而帮助讯问人员及时把握和调整讯问方向。语音识别便成为了公安机关讯问方法的一种新的模式[5]。

3.5 语音识别在便民服务中的应用。而语音识别的应用，会提高公安机关的服务能力，改进服务方式，突破服务障碍，更好的营造良好的警民关系。首先，提高民警沟通能力。外籍或者异地的民警在与群众进行情况了解、案件调查和走访慰问时，只需携带轻便的语音识别装备，就可以迅速准确的将方言与普通话进行相互转换，及时化解语言不通带来的误解和矛盾。其次，打造智能警务服务模式。在公安行政部门、出入境部门和地方所队的户籍等服务部门，引入智能化语音识别机器人，根据用户的语音来进行相关业务的指导和办理，方便文盲或者年老者等少数群体，提高公安机关对于群众的服务质量。

参考文献：

[1]高新涛，陈乖丽.语音识别技术的发展现状及应用前景[J].甘肅科技纵横，2007（4）：13.

[2]中华人民共和国国家质量监督检验检疫总局.GB/T21023-2007中文语音识别系统通用技术规范[S].北京：中国标准出版社，2007.

[3]于瑞华.语音识别在公安工作中的应用[J].中国人民公安大学学报（自然科学版），2007（4）：96-99.

[4]王英利，李敬阳，曹洪林.声纹鉴定技术综述[J].警察技术，2012（4）：54-56.

[5]毕惜茜.侦查讯问方法研究[J].中国人民公安大学学报（社会科学版），2013（5）：55-59.