声纹识别及其在军事领域的应用研究
2018-03-21刘传忠惠州75240部队
刘传忠 惠州75240部队
1 声纹识别技术
声纹识别,是一种基于生物特征的身份识别技术,由计算机利用语音波形中所包含的反映特定说话人生理和行为特征的语音特征参数来自动识别说话人身份的技术。
1.1 声纹识别的原理
声纹,是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官——舌、口腔、喉头、声带等在尺寸和形态上每个人的差异很大。因此,在一般情况下,人们能够区别不同人的声音。
声纹识别技术通过对采集到的声音和已知声音进行听觉和频谱两方面特征的比对鉴别和综合分析,确定二者是否来之同一声源(即同一个人的声音),从而识别说话者的身份。声纹识别系统一般包括语音信号的预处理、特征提取、说话人模型的建立和模型参数训练等几个方面。
1.2 基于GMM-UBM的声纹识别系统
混合高斯-通用背景模型(GMM-UBM)是目前普遍采用的比较成熟的声纹识别模型,通过对大量训练语音特征数据的统计分布进行描述,可以较好地刻画说话者不同情况下的特点,使系统具有良好的鲁棒性。
基于GMM-UBM的声纹识别系统分为训练过程和识别过程两部分。在训练过程中,主要是为每个说话人建立模型。先采集大量的语音数据,经过预处理,然后提取特征参数,用期望最大化算法(EM)训练为每一位说话人确定一组UBM模型参数,并存储在数据库中。在识别过程中,用目标说话人的测试语音进行特征参数提取,然后与数据库中的说话人模型进行匹配,由UBM自适应得到目标说话人对应的模型,从而识别目标说话人的身份。 测试过程如图1所示:
图1 基于GMM-UBM的声纹识别系统原理图
1.3 声纹识别技术的应用前景
近年来人工智能技术有着不断的发展,深度学习在机器学习领域取得了巨大的成功。与此同时,深度学习在语音识别的应用已经成为一个热门的研究方向。基于深度神经网络(DNN)的声学模型逐渐替代了混合高斯模型(GMM)成为语音识别声学建模的主流模型,并显著地提高了声纹识别的准确率。但是深度学习技术的应用需要大量的数据支持,对硬件的运算能力也有很高的要求。
2 声纹识别技术在军事领域的应用
计算机、互联网技术的不断革新,为军队信息化建设提供了有力的技术支持。声纹识别技术目前已经在军事领域,特别是军事间谍和反间谍手段上得到了广泛的应用。
2.1 对我方指挥员身份进行确认
运筹帷幄之中,决胜千里之外。在现代战场,不同层级的指挥员可能相隔几十公里到上千公里,不能以面对面的方式下达命令,如何保证发出指挥命令的说话人就是指挥员本人,是身份识别技术需要解决的问题。以声纹识别为代表的基于生物特征的身份识别技术,是在信息化的军事指挥行动中确认指挥员身份的有效方法。如果说话人声称自己是某个指挥员,那么他的声音就被用来验证这个过程。这时身份验证是一对一的验证过程,首先从数据库中调用该指挥员的模型参数,然后与说话人的声音进行匹配计算,从而识别说活人是否是该指挥员。避免敌方间谍侵入我军指挥信息系统,发送假命令扰乱我军行动。
在通信指挥网络中,声纹识别也常常用于防止入侵安全系统。许多核心涉密场所和设备,可以在普通的加密手段上,增加声纹识别功能,提供身份信息多重交叉验证,进一步增强系统的安全性。
2.2 对敌方指挥员身份进行确认
声纹识别系统对敌方指挥员进行身份确认,主要用于电话侦听工作。1966年车臣叛军头目杜达耶夫使用卫星电话被俄情报部门侦听到,并锁定了他的具体位置。俄军战斗机立即向目标发射两枚导弹将其击毙。2013年斯诺登曝光的美国国家安全局“棱镜”项目,指认美国情报机构多年来在国内外持续监视互联网活动以及电话通信。其中,包括20国峰会上俄罗斯时任总统梅德韦杰夫打往莫斯科的卫星电话。以计算机为核心的电话侦听系统能够实时监听固定电话网络、移动电话网络和IP电话网络中特定对象的语音通信。通过声纹识别技术可以自动对大量的电话语音进行辨认,提取通话人的声纹特征,与目标人物的模型参数进行匹配,以此查询通话人身份。对重要人物的交谈内容进行记录和处理,搜集相关的军事情报。一旦判明说话人的身份,还可以结合全球定位技术,锁定目标人物,实施精确打击。
确认敌方指挥员的身份,难点在于获取敌方指挥员的声纹特征,需要事先采集到目标人物的真实语音用于系统的训练过程。
2.3 信息安全的挑战和防范
在信息化时代,没有绝对安全的网络,任何技术上的进步都会给信息安全带来新的挑战。包括声纹识别在内的生物特征识别的安全隐患在于,一旦生物特征信息在数据库或网络传输中被间谍盗取,敌人可以执行某种身份欺骗攻击,并且攻击对象会涉及所有使用生物特征信息的设备,给整个指挥信息系统的安全带来极大的威胁。
一方面,我们可以通过严格的保密制度和专业化的管理,充分利用新技术的同时防止敌方间谍的破坏,将潜在的危险降到最低。另一方面,随着人工智能技术的兴起,机器学习理论研究的深入,新的算法应用于声纹识别,处理后的声纹特征信息已经面貌全非,不易被人类解读,难以获取原始的说话人特征。
3 结束语
在网络化、智能化的时代,部队信息化建设日新月异,传统的身份识别技术由于安全和效率方面的原因已经不能满足未来战场环境,需要更加安全便利的身份识别手段,以声纹识别为代表的生物特征识别技术,在进一步发展成熟后,可以作为指挥员身份确认的主要手段。声纹识别技术的民用产品也不断推出,普遍用于刑事侦查、安全防范、电子银行等领域,有着良好的军民融合发展前景。
[1] 赵力.语音信号处理[M].北京:机械工业出版社,2003.
[2] Reynolds D A,Thomas F. Speaker Verification Using Adapted Gaussian Mixture Models. Digital Signal Processing,2000, 10(1-3):19-41.
[3] 戴礼荣,张仕良.基于深度学习的语音识别技术现状和展望[A].数据采集与处理,2017,2(3):221-231.