一种改进型谱减法在短波语音通信中的应用研究
2013-04-29张景云
张景云
摘 要:短波语音通信中往往混杂有很多干扰和背景噪声,为了尽可能减小这些噪声,在接收端还原出更为清晰的语音,文章通过对常见语音增强算法进行仿真对比,选用谱减法并进行实现后成功应用于短波语音通信系统。实际使用结果表明,文章提出的算法能有效抑制短波语音中的噪声干扰,显著提高了接收语音质量。
关键词:语音增强;改进型谱减法;短波;通信
中图分类号:TN924 文献标识码:A 文章编号:1006-8937(2013)29-0033-02
短波语音通信具有无可比拟的顽存性、机动性和灵活性等优越性,在广播和日常生活等多方面得到了广泛应用,但短波极易受到外界干扰,严重影响了语音通信质量。因此如何有效抑制或滤除背景噪声一直是人们研究的热点。
语音增强的目的是从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。语音增强的目的是改进语音质量,尽可能消除背景噪声、提高信噪比,同时提高语音自然度、可懂度和说话人的可辨度。
为了在短波语音通信中进一步减小噪声,还原出更加清晰的语音,有必要采取语音增强技术对接收端的语音进行进一步处理。
1 几种常见的语音增强算法的去噪效果比较
常见的语音增强算法有短时谱MMSE法、谱减法、维纳滤波法等,为了检测它们的去噪效果,我们对三种算法在不同输入信噪比下的输出信噪比进行了仿真比较:
从图1可以看到,三种常用的语音增强技术在不同噪声环境下对带噪语音的降噪效果不同。短时谱MMSE法在三种算法中似乎具有最佳的降噪效果,其实不然。短时谱MMSE法在大幅提高语音的SNR的同时也提高了噪声的幅度,因此很少进行实际应用。谱减法和维纳滤波法相比,在输入信噪比为-7 dB以下或8 dB以上时,谱减法具有更高的输出信噪比。在-7 dB到8 dB之间,维纳滤波法的性能更好一些。由于我们通常接收到的可辨短波语音信噪比都在8 dB以上,因此我们选用谱减法进行实现。
2 谱减法原理
谱减法又称谱相减法,即从带噪语音的频谱估值中减去噪声的频谱估值,从而得到“纯净语音”的频谱。由于人耳对语音频谱分量的相位不敏感,因而这种方法主要针对短时功率谱。所谓“谱相减”就是从输入信号的功率谱中减去估计得来的噪声平均功率谱,得到纯净语音的平均功率谱,开方后就得到纯净语音幅度估计,将其相位恢复后再采用逆傅立叶变换恢复时域信号。考虑到人耳对相位的感觉不灵敏,相位恢复时所采用的相位是原带噪语音的相位信息。其算法流程如图2所示:
由于语音是短时平稳的,所以在短时谱幅度估计中认为它是平稳随机信号,假设s(m)、n(m)和y(m)分别代表语音、噪声和带噪语音,SS(?棕)、Sn(?棕)和Sy(?棕)分别表示其短时谱。假设噪声n(m)是与语音s(m)不相关的加性噪声。于是可得信号的加性模型:
y(m)=s(m)+n(m)(1)
对(1)式两端分别加窗并做傅立叶变换,得
Yw(?棕)=Sw(?棕)+NW(?棕)(2)
对功率谱有
Yw(?棕)2=Sw(?棕)2+Nw(?棕)2+Sw(?棕)N*w(?棕)+S*w(?棕)Nw(?棕)(3)
可以根据观测数据估计Yw(?棕)2,其余各项必须近似为统计均值。由于s(m)和n(m)独立,则互相的统计均值为0,所以原始语音的估值为
■w(?棕)2=Yw(?棕)2-E[Nw(?棕)2](4)
通过(4)式可以得到纯净语音的谱估计,对其作反傅里叶变换:
■(m)=1FFT[【□■w】(?棕)ej?渍(?棕)](5)
就可以根据(5)式得到增强后的语音。如前面分析,利用人耳对相位不敏感的特点,在(5)式中可利用原带噪语音的相位恢复到时域语音信号,从而得到处理后的语音信号,完成整个基于谱减法的语音增强过程。
3 谱减法的改进与实现
由上述分析可知,在谱减法中噪声功率谱的估计至关重要,如果噪声估计偏差较大的话,将毫无疑问的影响语音增强质量。传统的噪声估计实现方法是截取发语音前一段的噪声,计算出功率谱,乘以一个因子作为固定噪声门限,这种噪声估计比较死板,当信号环境变化剧烈时,不能自适应精确调整噪声门限,进而降低语音增强的效果。我们对传统算法改进后采用了基于语音活性检测的噪声估计算法进行实现。通过对带噪语音进行端点检测,采用接收信号的短时能量,联合过零率等参数形成双门限进行判定,找出哪一段是语音,哪一段是噪声,进而精确估计噪声功率谱。图3所示:接收机的模拟输出在PC端进行A/D转换后,将采样数据按20 ms分帧,并计算初始噪声能量谱及过零率,给其乘以一个因子作为噪声门限,将短时能量和短时过零率算法运用于噪声起点的检测,如果大于门限,即认为该帧为语音帧、继续检测下一帧。如果小于门限,即认为该帧为噪声帧,将其值回馈给噪声能量的计算,以便实时的修正噪声门限,从而提高噪声估计的准确性,直到所有帧检测完毕。
4 改进型谱减法在短波语音通信的应用
我们利用谱减法对接收端的语音信号进行处理,图4的上半部分是接收机接收并采集到的带噪语音的时域图,下半部分是带噪语音的语谱图。图5的上半部分是经过谱减法处理后得到的“纯净信号”的时域图,下半部分是“纯净信号”的语谱图,对比处理前后的语谱图(图4和图5的下半部分),发现下面的语谱图对比度更高,语音能量更为清晰,说明谱减法对噪声的抑制十分明显,起到了很好的语音增强效果。
5 结 论
短波语音通信主要是利用电离层的反射进行远距离的传播,而电离层的高度和密度易受多方面因素的影响,导致电台接收到的短波语音往往呈现信噪比低、噪声复杂等特点,严重影响到短波语音通信的有效性和可靠性。本文通过仿真对比,选用谱减法并进行改进后将其成功应用于短波语音通信系统中对接收信号的处理,实际使用结果显示,该算法可以显著改善接收到的语音质量,抑制噪声,还原出更为清晰的语音,具有较高的实用价值,同时,本文给出的算法,也可以推广使用到其他通信系统用于对语音信号的增强处理。
参考文献:
[1] S.Boll,Suppression of acoustic noise in speech using spec-
tral subtraction,IEEE[J]. Transactions on Acoustics Speech and Signal Processing, ASSP-27,1979,(2):113-120.
[2] Y.Ephraim and D.Malah.Speech enhancement using a mini-
mum mean-square error short-time spectral amplitude esti-
mator,IEEE[J]. Transactions on Acoustics, Speech, and Signal Processing,1984,ASSP-32,(6):1109-1121.