APP下载

基于谱减法和变步长LMS语音增强算法

2015-04-14徐文超王光艳耿艳香

计算机工程与应用 2015年1期
关键词:步长信噪比滤波器

徐文超,王光艳,耿艳香,白 芳,费 腾

天津商业大学 信息工程学院,天津 300134

1 引言

语音增强技术是语音信号处理方向的课题之一,是在语音通信系统中语音传输受到噪声干扰时提高语音信号质量的技术,语音增强的一个主要目的是将尽可能纯净的有用语音从含有噪声语音信号中提取出来[1]。噪声的来源不同,应用的环境各异,其特性是千变万化的,因此,语音增强技术在语音通信系统传输过程中起着非常重要的作用。国内外的研究人员已取得了一些基础性研究成果,Boll假设噪声是平稳的加性噪声,原始语音信号和噪声不相关的情况下,提出了谱减法[2-4](Spectral Subtraction),此方法具有运算量小,易于实现和去噪效果显著的特点;利用人耳的听觉掩蔽效应的语音增强方法也取得较好效果;Lim和Oppenheim提出了提高语音信号质量的维纳滤波方法,但这是基于信号短时平稳的。在实际应用的语音环境中,语音信号中的噪声是随环境和时间发生变化的,并不能完全消除噪声,而LMS自适应滤波器[5-7]是利用前一时刻得到的滤波器参数来控制后一时刻的滤波器参数,来适应未知的信号和噪声,因此LMS自适应滤波成为有效增强语音方法之一。

传统的LMS自适应滤波算法步长因子固定,而步长的变化对提高收敛速度、跟踪能力和缩小稳态误差方面的要求是相互矛盾的。人们对各种改进的变步长LMS自适应滤波[8-13]做了大量的研究,文献[8]提出了改进的变步长的函数,但存在误差接近零时步长变化太快的不足;文献[12-13]提出的算法中引入了控制步长变化速度和取值范围的因子,但步长公式中会出现平方项,自适应算法不容易得到最优解,不能准确地反应算法自适应状态。本文在研究了各种变步长LMS自适应滤波算法的基础上,提出了对原始语音信号先进行谱减法后采用变步长LMS自适应滤波算法联合去噪的方法。该方法将步长公式作了进一步的改进,将误差的平方项e2(m)改为|e(m)×e(m-1)|来调节步长,即步长公式变为μ(m)=β(1-exp(-α|e(m)e(m-1)|)),以提高算法对不相关噪声的抑制能力,并且采用“先固定后变化”的原则,将步长公式在暂态时使用固定值μ1,在稳态时使用变化的值,信号的信噪比有了较大提高,降低了背景噪声干扰,PESQ[14-18]分值得到了提高,取得较好的增强效果。

2 基本谱减法的思想

基本谱减法的思想假设噪声是加性噪声(零均值的高斯白噪声)的,且与短时平稳的语音信号在相互独立的情况下,将含噪的语音信号y(m)进行傅里叶变换,然后取其幅度的平方和相位,语音信号s(m)的功率谱估计由含噪语音的功率谱减去噪声功率谱得到,然后语音信号的功率谱估计开方后得到语音幅度估计,将语音幅度估计重新插入相位,然后再采用逆傅立叶变换恢复时域信号。假设s(m)为纯净语音信号,n(m)为噪声信号,y(m)为带噪语音信号,则带噪语音模型有:

将信号y(m)、s(m)、n(m)进行傅里叶变换后得到Y(w)、S(w)、N(w),则

式(3)两边取数学期望得:

因为s(m)和n(m)相互独立,因此S(w)和N(w)也独立,由于假设噪声为零均值的高斯分布,所以2E{Re[S(w)N*(w)]}=0,即

所以对于一个短时平稳过程,可以有:

由于采用的模型是基于宽平稳假设,噪声是局部平稳的,发音前噪声的功率谱和在发音期间认为是相同的,噪声和在发音前的那段噪声具有相同的统计特性,所以根据发音前的“寂静段”可以来估计噪声的功率谱|N(w)|2,因此可以得到:

这样得到纯净语音的估计值为:

由于人耳对语音的感知主要是通过语音幅度谱获得的,而对相位谱不敏感,可以由估计后的语音信号的相位谱来代替原含有噪声的语音信号Y(w)的相位谱,这样处理后得到降噪后的语音时域信号。基本谱减法思想的算法流程图,如图1所示。

图1 基本谱减法算法流程图

3 算法原理

语音信号中的背景噪声是随环境和时间变化的,会很难滤除,在低输入信噪比时可经过谱减法后通过LMS自适应算法调整滤波器系数,使滤波器的特性随信号和噪声的变化而变化,联合进行去噪达到最优的滤波效果。

3.1 自适应噪声滤波

自适应噪声滤波的关键是对噪声求得最佳估计,利用前一时刻得到的滤波器参数来调整后一时刻控制参数,获得系统的误差函数e(m)来提高信噪比。在处理过程中为获得噪声信息增加一个参考噪声x(m),如参考噪声x(m)在其与信号中的噪声相关,可以较好地抵消噪声的随机性,完全消除噪声,但在参考噪声与信号中的噪声不相关或相关性很弱时,噪声不能完全被抵消,滤波效果不明显。

自适应噪声滤波原理如图2所示。

图2 自适应噪声滤波原理

图2中,带有噪声的语音信号y1(m)包括信号s(m)和噪声N(m),x(m)作为输入参考噪声,N1(m)和N(m)相关,N1(m)与s(m)不相关。

自适应噪声滤波的算法思想如下:

式(8)两端取数学期望从而得到:

因为s(m)与N(m)不相关,s(m)与N1(m)不相关,因此2E[s(m)·(N(m)-d(m))]=0 ,即

通过LMS自适应滤波器调整权系数,求得非线性函数E[e2(m)]的极小值点,式(9)左端E[e2(m)]值取最小时,式(9)右端E[N(m)-d(m)]2值也同时为最小,E[s2(m)]的值不发生变化,自适应滤波器的输出d(m)为N(m)的最佳估计,系统输出为:

这样LMS自适应滤波器的输出在d(m)值最接近N(m)值时,e(m)=s(m)。

3.2 变步长LMS算法改进

基本LMS算法的递归关系式为:

μ0是控制自适应速度与稳定性的常数,又称步长因子。步长因子μ0取值较小时,稳态失调噪声较小,算法收敛慢,精度高,但是会引起算法的收敛和跟踪速度的降低,所以采用固定步长μ0的算法是不适合的。人们提出各种不同的变步长的LMS自适应滤波算法,文献[9]提出的步长公式:

本文的改进中,将误差的平方项e2(m)修改为:|e(m)×e(m-1)|来调节步长,即步长公式变为μ(m)=β(1-exp(-α|e(m)e(m-1)|)),以提高算法对不相关噪声的抑制能力,并且采用“先固定后变化”的原则,将步长公式在暂态时使用固定值μ1(μ1的取值应符合0<μ1<λmax,λmax表示相关矩阵R的最大特征值),在稳态时使用变化的β(1-exp(-α|e(m)e(m-1)|)),即

在处理过程中,N0的取值根据处理语音信号的长度和实际情况中LMS算法收敛到稳态时的迭代次数来确定,当迭代次数m

将误差的平方项调整为|e(m)×e(m-1)|后进行算法分析。

LMS自适应滤波器的输出误差项:

期望得到的理想信号y1(m):

φ(m)是均值为零的独立干扰项,W*(m)为滤波器时变的最佳权系数。

使k(m)表示权系数的误差:

由此可以得到

将式(17)代入式(13),步长公式μ(m)中将出现φ2(m)项,这样不容易使自适应算法得到最优解,而且μ(m)不再准确地反应算法收敛前的自适应状态,只能在最优解的范围内波动,如果波动较大则会出现较大的失调。将误差的平方项e2(m)调整为|e(m)×e(m-1)|后,φ2(m)项就不会影响步长μ(m),滤波器自适应状态能得到更准确的反应,使权系数更加接近最优值。

4 实验结果分析与仿真

为了检验本文改进后的语音增强方法的效果,评估此方法的性能,在MATLAB仿真环境,不同信噪比下比较谱减法和先经过谱减法后采用变步长的LMS算法的实验效果,将SNR(输出信噪比)和PESQ(语音感知质量评价)作为评价语音质量的评价指标:

其中m为采样点数,d(m)为增强后的语音信号。

PESQ用来评价语音的主观听觉效果,是主客观相关性最高的评估算法,得分在 -0.5~4.5之间,分值越高说明语音音质越好。

采用一段标准的女生声音作为语音信号源,输入的内容是:“天津商业大学”,此信号源语速正常,在夜间实验室环境下录制,加入的宽带噪声相对平稳,进行了不同信噪比(10 dB,0 dB)下的实验,语音信号和噪声信号采样频率均为8 000 Hz,16bit量化,N0=200,使用Hamming窗对含噪信号进行分帧,每帧512个采样点,帧间叠加 128个采样点。图 3(a)、图4(a)为纯净的原始语音信号,图3为输入信噪比为10 dB时的实验结果对比,图4为输入信噪比为0 dB时的实验结果对比。不同的算法处理后的信噪比结果如表1。图3(c)、图3(d)分别为在10 dB时谱减法实验去噪效果和先经谱减法后采用LMS自适应滤波联合去噪后的效果;图4(c)、图4(d)分别为在0 dB时谱减法实验去噪效果和先经谱减法后采用LMS自适应滤波联合去噪后的效果。

表1是在不同信噪比下,带噪语音分别使用三种算法增强后的输出信噪比和PESQ得分。

图3 信噪比10 dB时实验效果对比

图4 信噪比为0 dB时实验效果对比

表1 不同算法处理后性能比较

从图3、图4的实验效果中可以看出:在信噪比10 dB及以下时先经过基本谱减法后再进行变步长的LMS自适应滤波算法对语音的增强效果要明显优于基本谱减法;在信噪比0 dB时本文提出的方法仍然有较好的效果,降低了背景噪声。由表1中可以看出,本文方法使信噪比得到了提高,PESQ评测上,本文方法PESQ得分有较大的提高,增强后的语音质量要好于分别单独使用谱减法和变步长LMS自适应滤波算法,表明本文所做的改进对提高语音质量有一定的效果。

5 结束语

在总结了前人变步长LMS自适应滤波语音增强的基础上,本文把谱减法和变步长LMS自适应滤波算法联合去噪的方法应用到语音增强中。算法中对步长采用先固定后变化的原则,在不同信噪比下经过大量的实验测试得到:本文提出的谱减法和改进后的变步长LMS自适应滤波联合去噪的方法降低了背景噪声,使信噪比得到较大的提高,PESQ分值也有较大的提高,主观听觉表现上取得较好的试听效果。

[1]易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2006.

[2]Boll S.Suppression of acoustic noise in speech using spectral subtraction[J].IEEE Trans on Acoustic,Speech and Signal Processing,1979,27(2):113-120.

[3]张满,陶亮,周健.基于实值离散Gabor变换的谱减法语音增强[J].计算机工程与应用,2012,48(29):109-113.

[4]洪晓芬.基于谱减法的改进语音增强方法[J].计算机工程与设计,2007,28(22):5453-5454.

[5]陈琪,郭英,张群,等.基于听觉感知的LSA-MMSE改进型语音增强方法[J].信号处理,2008,24(6):1037-1040.

[6]索忠伟,王建英,魏阳,等.一种基于LMS改进算法的语音增强方法[J].微计算机信息,2006,22(4):237-238.

[7]高榕,张仕凯,李靖.自适应滤波器消除语音信号中混合噪声[J].河南科技大学学报,2012,33(4):42-45.

[8]贾景繁,欧阳景正.一种新的变步长LMS自适应滤波算法[J].数据采集与处理,1997,12(3):171-174.

[9]高鹰,谢胜利.一种变步长LMS自适应滤波算法及分析[J].电子学报,2001,29(8):1094-1097.

[10]华强,夏哲雷,祝剑英.一种改进的变步长LMS自适应滤波算法及仿真[J].中国计量学院学报,2012,23(3):304-308.

[11]王丹,杨雷,普杰信.基于小波变换变步长LMS自适应信道均衡的新方法[J].电讯技术,2011,51(9):112-116.

[12]王俊峰.一种改进的变步长LMS算法及其DSP实现[J].仪表技术与传感器,2012(11):128-129.

[13]姜占才,孙燕,王得芳.基于谱减和LMS的自适应语音增强[J].计算机工程与应用,2012,48(7):142-145.

[14]李善姬.一种用于自适应噪声抵消的变步长LMS算法[J].电讯技术,2010,50(11):30-33.

[15]倪萍,魏芳.基于PESQ彩铃铃音算法的质量评估系统[J].计算机应用与软件,2012,29(10):145-147.

[16]徐岩,孟静.基于粉红噪声的语音增强算法性能评价研究[J].铁道学报,2011,33(4):53-58.

[17]冯流保.基于听觉掩蔽效应的小波包语音增强[J].通信技术,2010,43(3):139-141.

[18]周璐,邱小军,林志斌.PESQ测量语音增强算法性能不确定性的研究[J].电声技术,2010,34(1):71-73.

猜你喜欢

步长信噪比滤波器
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
基于深度学习的无人机数据链信噪比估计算法
从滤波器理解卷积
开关电源EMI滤波器的应用方法探讨
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
基于Canny振荡抑制准则的改进匹配滤波器
基于TMS320C6678的SAR方位向预滤波器的并行实现
保持信噪比的相位分解反褶积方法研究
基于逐维改进的自适应步长布谷鸟搜索算法