噪声环境下的语音识别算法研究
2019-12-10赵霞
赵霞
摘要:随着计算机技术的逐步发展,人与计算机之间的沟通方式有了更高的标准,这也进一步推动了语音识别这项技术的进步和发展,使之成为语音处理范畴当中的重要内容。语音识别目前在无噪音干扰的情况下,具有非常高的识别率,但是如果环境当中存在噪音,那么这种识别率就会大大降低,因为噪音会导致训练模板和待识别模板无法进行匹配。所以,对于语音识别技术来说,噪音是其发展过程中的重要阻碍,所以对于噪音环境下的语音识别算法进行研究是非常有意义的。
关键词:噪音环境;语音识别;功能分析
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2019)28-0224-02
在人们的工作和生活中,需要利用语言来进行沟通和交流,通过语言来传播多种信息。相比于文字来说,语言的传播效率更高。随着信息技术的不断发展,计算机已经成了人们生活和工作当中的不可或缺的部分。因此,人们除了相互之间的交流之外,也需要和计算机进行频繁的交流和沟通。在这样的背景之下,使得人们能够通过语言和计算机来进行沟通和交流,成了计算机发展过程中非常重要的内容,所以对于语音识别技术的研究和发展具有重要的意义。
1 语音识别功能分析
语音识别技术涉及的学科领域非常广泛,包括信号处理、语言学以及模式识别等等。这项技术目前被应用到了信息处理和计算机等领域当中,其具备的功能主要包括以下几个方面。首先是文本输入功能,所谓文本输入就是将人类语言转化为文本,从而使得文本的输入过程变得更加便捷。其次是语音控制功能,所谓语音控制就是通过语音来完成计算机的工作过程,从而有效提升人类的工作效率。最后是身份识别,这有点类似于指纹和人脸识别,是将语音来作为识别的对象。
2 噪声分类
2.1乘性噪声
具体来看,语音和噪声之间的关系实际上是相乘的,信号经过频谱后会出现衰弱现象,采集声音装置当中的和信号传输过程中的衰弱情况都属于乘性噪声。乘性噪声可以在某种情况下转化为加性噪声,而加性噪声则是平时的主要研究目标。
2.2加性噪声
在语音信号当中,噪音实际上是处于叠加状态中的,所以从语音信号的角度来看,这种噪声应该被称为加性噪声。加性噪声具体包括汽车声音、人们的说话声音、家具的声音以及风扇的声音等等。利用声音采集装置时,加性噪声和收集的语音两者之间属于相加的关系。这种噪声对于语音识别率的影响是最大的。
2.3平稳噪声
生活中的大部分噪声都属于非平稳噪声,但这种噪声研究起来较为困难,所以通常情况下是研究平稳噪声,因为这种造成属于非时变噪声。
2.4冲击噪声
所谓冲击噪声,是指在较短的时间当中出现剧烈变化的噪声,例如枪声,这种噪声随机程度较大,所以很难进行分析和研究。
2.5缓变噪声
缓变噪声是指在相应的时间当中缓慢进行变化的噪声,例如人群形成的噪声。
3 噪声对语音识别的影响
语音识别率下降,是因为训练模板和识别模板之间的匹配过程受到了噪声的影响,在平时的训练过程中,是处于安静的环境当中,且应用的都是纯净语音。而在具体的应用过程中,是一定的会存在噪音的。当处于噪聲环境下时,语音信号的参数会出现变化。而对于语音进行识别的过程中,会发现其参数与数据库中的内容无法形成匹配,从而导致识别率下降。为了解决这个问题,就必须去消除噪声对于语音参数的影响。
4 噪声环境下的语音识别算法研究
经过了近些年来的研发过程,使得语音识别技术得到了迅速的发展,但是在具体的应用过程中仍然存在一些问题,例如在噪声影响的情况下,语音识别率降低,因此对于噪声环境下的语音识别进行研究是非常重要的。现实环境中的大部分噪声都属于加性噪声,因此下面将会把加性噪声作为主要的研究内容。通常来看,噪声都是处于非平稳状态下的,通过增强语音信号来消除掉信号中的噪声从而获得了增强语音的效果。而在这个过程中,实际上增强语音的主要目的就是提升语音信号信噪比,从而提升声音的清晰程度。增强语音和加强噪声环境中的语音识别率是相同的。通常情况下,在系统前端来完成语音增强,消除冗余噪声,从而避免因为噪声的出现而使得训练和识别模板无法匹配。从目前的情况来看,语音增强算法的应用已经变得非常广泛,且应用的方式都十分系统。噪声的出处十分广泛,处于不同场合的情况下所面临的噪声也各有不同,根据噪声的不同,需要采取相对应的语音增强方式。具体来看,语音增强算法具体包括了噪音对消算法、谐波增强算法、语音短时谱估计增强算法、小波分析语音增强算法等等。
4.1噪音对消算法
噪音对消算法属于众多算法当中最为基本的算法之一,其原理是将噪声语音中的噪声直接去除掉,通常是采用双麦克风的方式来对信号进行采集,两个麦克风一个用来采集噪声语音,另一个用来采集噪声,并将这两个麦克风采集到的频谱分量相减,最后得到语音信号增强的效果。在这个过程中需要注意的是,保持好双麦克风的距离,避免相互之间形成干扰。当噪声背景较强时,较为适宜采用这种方式来消除噪声。另外一方面,在采集信号时,可以安装自适应滤波装置来提升采集效果。
4.2小波分析语音增强算法
通过小波分析语音增强算法,能够对于小波进行分解,从而完成信号的多分辨率分析。这种算法具有多种不同的特性,所以目前应用的较为广泛。小波分解后获得的各层系数表现出了不同分辨率当中信号的信息。由于语音和招生在各层系数当中有着不同的特性,所以可以利用这种特点来实现噪声去除。目前来看,最为常用的噪声去除方法包括相关性噪声消除法、模极大值噪声消除法等等。首先是模极大值噪声消除法,这种方法的原理是在各层小波系数中,语音信号和噪声的模极大值所呈现出的规律各不相同,根据这一特点而提出的这种噪声消除方法。当脉冲噪声点非常多或者信噪比较低的时候,这种消除方法是非常适用的。模极大值噪声消除方法主要应用于对高斯白噪声的消除,通过这种方式去除噪声会避免信号的震荡,从而保持语音质量的完好。但这种噪声消除方法的缺点在于计算速度非常缓慢。其次是相关性噪声消除方法,这种噪声消除法主要是利用小波系数之间的相关特性。对于噪声进行分解之后,所获得的小波系数之间不含有相关性,而这种造成消除方法正式基于这一特点而被研发的。噪声所产生的能量基本上在小尺度上进行分布,所以尺度逐渐变化后噪声的强度会降低,从而对噪声进行有效的滤除,进而将信号中的有用部分进行保留。
5 结束语
随着语音识别技术的高速进步和发展,当处于实践环境当中时,这种技术的识别功能非常好,但是想要让这种技术的实用性更强,就必须解决噪声的影响问题,因为在实际的应用过程中是不可能彻底避免噪声干扰的,因此,对于语音识别系统进行应用的关键在于该系统在噪声环境下所具备的性能。当处于噪声环境中时,本文提出的几种语音识别算法都能够有效的消除噪声,但是在其中仍然存在着一些不足,需要今后去不断的探索和完善。
参考文献:
[1] 曹晶晶,许洁萍,邵聖淇.多噪声环境下的层级语音识别模型[J].计算机应用,2018,38(6):1790-1794.
[2] 刘晶.基于盲源分离和噪声抑制的语音信号识别[J].计算机测量与控制,2018,26(12):140-144.
[3] 娄英丹,徐静林,黄丽霞, 等.MLLR和MAP在远场噪声混响下的语音识别研究[J].计算机工程与应用,2019.
【通联编辑:光文玲】