APP下载

基于动态谱估计的改进谱减语音增强算法

2014-09-26武,忠,陈琳,李

电子设计工程 2014年1期
关键词:谱估计估计值时域

陈 武, 朱 忠,陈 琳,李 强

(中国卫星海上测控部 江苏 江阴 214431)

语音增强就是对带噪语音进行处理,从噪声背景中提取、增强有用的语音信号,降低噪声干扰,以改善语音质量。最早由Steven Boll提出的谱减法[1]是一种发展较早且应用较为成熟的语音增强算法。谱减法结合其他算法产生了许多有效的语音增强方法[2-3],这些方法能在一定程度上解决谱减法残留噪声大的问题,有较好的语音增强效果。而多数语音增强算法,如谱减法等,都需要利用噪声的特性参数,噪声估计的准确性直接影响语音增强算法的效果。

Martin[4]提出的基于最小值统计的谱估计方法,通过跟踪一定窗长内语音功率谱的最小值来估计并更新噪声,该算法在非平稳的噪声环境下也能做出较好的估计结果,但该算法对窗长的选择比较敏感。在最小值统计方法基础上,Doblinger[5]提出的带噪语音子带平滑功率谱最小值追踪算法,通过逐帧追踪语音功率谱最小值来估计并更新噪声谱,该方法计算效率高,但在噪声功率谱的上升阶段,不能很好的适应噪声信号的变化。

本文在分析Doblinger方法基础上,提出了一种非平稳噪声环境下快速追踪噪声变化的方法,即动态谱估计法,使得噪声谱估计值既能快速适应噪声的变化又能保证其准确性,并对谱减法做出进一步的改进,以达到增强语音质量的目的。

1 最小值追踪算法

Doblinger的带噪语音子带平滑功率谱最小值追踪算法,通过比较前一帧带噪语音功率谱最小值和后帧带噪语音功率谱之间的大小,对每帧带噪语音功率谱最小值 进行追踪并更新, 具体如下:

其中,β,r为经验常数,分别为0.96,0.998。 为用一阶递归公式计算带噪语音平滑功率谱,具体为:

其中,a是自适应平滑因子,一般取值0.7~0.9,λ表示带噪语音分帧后的帧序号,k表示频率点。

图1为在船舶主机舱噪声干扰下SNR为-10 dB的带噪语音功率谱及其局部最小值,虚线表示带噪语音功率谱,实线表示带噪语音局部最小值。

从图中可以看到,在第70帧、170帧及250帧附近,当噪声突变时,最小值追踪方法已经不能很好的追踪噪声的变化,且在整个噪声谱的追踪过程中,噪声谱估计值要明显小于真实噪声谱。

图1 带噪语音功率谱及其局部最小值Fig. 1 Noisy speech power spectrum and local minimum

2 改进的动态谱估计法

具体的改进思路为:经过VAD检测以后,对于无语音段噪声谱直接更新即可;而对于语音段的噪声谱则要首先要判断噪声功率谱是处于上升阶段还是下降阶段,若处于上升阶段且变化率没有超过预定的门限,则可以采用步进递推法则进行噪声谱更新,并将结果与采用Doblinger方法跟踪到的最小值进行比较,若结果较之后者要大,则进行修正处理,并更改递推法则,这样可以保证噪声谱的更新速度,同时得到的噪声谱估计值也更加接近真实的噪声;若噪声功率谱处于下降阶段,按Doblinger方法更新噪声谱。

算法具体步骤如下:

通过VAD检测将带噪语音信号分成有语音帧和无语音帧,对不同类型的帧分别进行噪声谱更新。

对于非语音帧,更新噪声谱为:

其中ad的取值为0.95。

带噪语音功率谱上升的主要原因有两个:语音信号的出现和噪声信号功率谱的上升。假定噪声的变化速率不超过R(dB/s),并认为带噪语音功率谱变化速率超过R的情况均是由语音存在引起的。第 帧噪声谱的更新步骤包括:

1)跟踪前λ帧带噪语音子带平滑谱最小值变化速率r1(i=1,2,3……λ),统计最大值r0。

2)比较第 帧r与R的大小,判断含噪语音帧是处于语音功率谱的上升区间或是下降区间,并根据不同情况更新噪声谱。当r> 0 并且r>R时,此时噪声功率谱处于上升区间,噪声谱更新为:

其中Ci为递增系数,递增量:

将得到的谱估计值与经Doblinger方法得到的结果比较,若谱估计值大于后者k倍时,修改谱估计值为:

当r>R时,认为带噪语音功率谱的上升是由语音出现引起的,噪声谱估计值与前一帧保持不变,即:

当r〈 0时,带噪语音功率谱处于下降区间,噪声谱的更新与Doblinger方法保持一致,即:

图2为改进后算法的仿真结果,其中虚线表示表示在船舶主机舱噪声干扰下SNR为-10 dB条件带噪语音功率谱,实线表示更新得到的噪声谱估计值。

图2 带噪语音功率谱及噪声谱估计值Fig. 2 Noisy speech power spectrum and noise spectrum estimation

从图中可以看出,在大约60帧、175帧处,噪声功率突然增大,估计的噪声功率也随后增大,表明算法能够较好地追踪突变噪声,但也可以看到个别帧存在噪声过估计。

3 改进的谱减法语音增强

基本谱减法在减去噪声谱后,会有较大功率谱剩余,在频谱上呈现出随机的尖峰,在听觉上形成残留噪声。为解决这一问题,Udrea[6]等人在基本谱减法基础上引入过减系数 进行改进:

由上式可以看出,降噪的关键在于对噪声谱λn(k)的准确估计和确定合适的过减系数k。

噪声谱λn(k)采用文中改进后的噪声动态谱估计方法进行实时追踪和估计,逐帧更新噪声谱。

Udrea等人提出根据带噪语音与噪声的信噪比(Noisy Speech to Noise Ratio,NSNR)分段计算过减系数的方法[7],该方法能根据信噪比变化对过减系数进行调整,但在信噪比较低的条件下效果并不理想。

噪声谱减量的跟噪声的变化情况直接相关,因此定义反映噪声变化趋势的惯性量Gi:

惯性量Gi能在一定程度上反映噪声的变化趋势,当Gi>1时,可以多减去一些噪声;当Gi〈1时,可以少减去一些噪声。由此,根据噪声变化趋势对过减系数k进行调整:

式中k0取NSNR为0 dB时的初始值,根据文献[7]取k0等于4。改进后的谱减法原理框图如图3所示。

图3 改进的谱减法原理框图Fig. 3 Improved spectrum subtraction principle diagram

为了验证算法对低信噪比信号的改善情况,进行了降噪实验。采用的噪声样本是不同航速下在船舶主机舱录制的噪声,采样频率为8 kHz,噪声与语音经Matlab线性叠加后产生SNR=-10 dB的带噪语音信号。

4 仿真结果及分析

对比图4至图7可以看出,在低信噪比环境下(SNR为-10 dB),基本谱减法和改进谱减法均能起到语音增强的作用,处理后的语音信号噪声幅度明显减小,能够提高输出信噪比。但基本谱减法处理后仍残留有大量噪声,而改进谱减法得到的时域波形更加接近原始语音,只在幅度上略小于原始语音。

图4 原始语音时域波形图Fig. 4 Raw speech time-domain waveform

5 结束语

文中抓住噪声谱估计值的准确性是影响语音增强效果的关键因素,研究了一种快速追踪噪声变化的动态谱估计方法,进而提出了改进的谱减语音增强算法。仿真结果表明,该算法在低信噪比的环境下能快速、准确估计噪声谱,提高了输出语音信噪比,达到了改善语音质量的目的。

图5 SNR=-10dB的带噪语音时域波形图Fig. 5 Noisy speech( SNR=-10dB) time-domain waveform

图6 基本谱减法处理后的时域波形图Fig.6 Basic spectrum subtraction processed time-domain waveform

图7 改进谱减法处理后的时域波形图Fig.7 Improved spectrum subtraction processed time-domain waveform

[1]BOLL S F. Suppression of acoustic noise in speech using spectrum subtraction [J]. Acoustic speech and Signal Processing IEEE Transaction,1979,27(2):113-120.

[2]钱国青,赵鹤鸣.基于改进谱减算法的语音增强新方法[J].计算机工程与应用,2005,41(3):42-43.

QIAN Guo-qing,ZHAO He-ming. New speech enhancement algorithm based on the improved spectral subtraction[J].Computer Engineering and Applications, 2005,41(3):42-43.

[3]翟士奇,卢晶,邹海山.一种基于最小能量统计的语音增强改进算法[J].电声技术,2012,36(9):41-43.

ZHAI Shi-qi,LU Jing,ZOU Hai-shan.An improved speech enhancement algorithm based on minimum statistics [J].Audio Engineering, 2012,36(9):41-43.

[4]Martin R.Spectrum Subtraction Based on Minimum Statistics[J].European Signal Processing, 1994:1128-1185.

[5]Doblinger G.Computationally Efficient Speech Enhancement by Spectrum Minima Tracking in Sub-band[J]. Eurospeech,1995(2):1513-1516.

[6]Udrea Radu M, Ciochina S. Speech Enhancement Using Spectrum Over-subtraction and Residual Noise Reduction [J]. Signals Circuits and Systems,2003,4(1):165-168.

[7]Udrea Radu M,Vizireanu D N, Pirnog I.A perceptual approach for noise reduction using nonlinear spectrum subtraction[C].Proceedings of 8th International Conference ,Serbia, 2007:649-652.

猜你喜欢

谱估计估计值时域
一道样本的数字特征与频率分布直方图的交汇问题
基于MATLAB的无线电信号功率谱仿真与分析
基于时域信号的三电平逆变器复合故障诊断
2018年4月世界粗钢产量表(续)万吨
基于多窗谱估计的改进维纳滤波语音增强
基于极大似然准则与滚动时域估计的自适应UKF算法
基于时域逆滤波的宽带脉冲声生成技术
基于时域波形特征的输电线雷击识别
高维随机信号THREE功率谱估计及其仿真
Welch谱估计的随机误差与置信度