基于麦克风阵列的语音增强算法研究

2019-10-09权建军

自动化仪表 2019年9期

闫姝,权建军

(兰州石化职业技术学院电子电气工程学院,甘肃兰州 730060)

0 引言

随着通信技术的快速发展，语音作为人类和机器之间的一种自然、便捷交流方式，被广泛认定为智能家居和物联网的入口。然而，在语音识别系统中，噪声的引入会严重影响通信质量。如汽车、道路、话筒、商场以及公众的喧闹声等产生的冲击性噪声，使得有用信号完全淹没在噪声背景中，严重影响着信息沟通。在这种情况下，使用语音增强系统，可以抑制背景中的噪声，从而提高语音通信的质量[1-3]。

所谓语音增强，是指在含有许多无用信息的复杂环境中找到与自身相关且有用的信息，抑制和降低噪声的干扰。而在实际生活环境中，对于不同的噪声，可采用的语音增强技术是多种多样的，并不是单一的固定算法[4]。近年来，麦克风阵列语音增强技术被广泛应用到电话会议、电视技术及多方通信等场合，而且应用范围一直在不断拓宽。麦克风阵列是指按照一定的形状对多个麦克风进行排列,对所需要处理的声场空间特性进行采样。麦克风阵列中的各个传感器所接收到的信号反映了声音在空间传播中的不同信息。麦克风阵列可以通过这些信息，解决噪声抑制、回声抑制、去混响以及源分离等实际问题。因此，研究基于麦克风阵列的语音增强技术，具有非常重要的意义[5-6]。

1 麦克风阵列语音信号模型

麦克风阵列语音増强所处理的主要是短时平稳和具有宽带特性的信号，所以很多时候并不适用于远场模型。这时，需要把语音信号的传播看作是球面波[7]。麦克风阵列语音增强系统模型如图1所示。

图1 麦克风阵列语音增强系统模型

从图1可以看出，麦克风阵列语音增强系统前置部分主要是采集硬件和纯净语音及干扰发生器，其组成了语音拾取部分。与传统系统相比，该系统的不同点主要体现在语音拾取和语音增强两个部分[8-12]。

2 麦克风阵列语音增强算法

2.1 广义旁瓣抵消语音增强算法

广义旁瓣抵消(generalized sidelobe canceller,GSC)是一种波束形成技术。它通过在所谓的约束条件下利用特定方法达到最大信噪比，以减少失真率[10]。GSC将波束形成问题转化成约束问题和最小化问题两部分，原理框图如图2所示。

图2 GSC原理框图

为了提高GSC的稳定性，本文对信号子空间投影算法进行了改进。设B为GSC的阻塞矩阵，R为阵列协方差矩阵，期望信号的方向矢量为水平方向，即可表示为r=θ0。由于B可以和约束子空间形成一个正交基，则B的正交矩阵为零。为了阻止在高信噪比的情况下出现信号相消的情况，需对B进行改进，并对R进行特征分解得到信号子空间，进而计算得到正交补阻塞矩阵Bp。信号子空间由期望信号和干扰信号子空间U组成。矩阵Bp具有比矩阵B更好的阻塞能力。

GSC对相干噪声有很好的抑制作用，但是对于非相干噪声作用则不是很明显。所以GSC一般只适用于相干噪声的抑制和消除。

2.2 维纳滤波算法

维纳滤波是常用的后置滤波算法。采用维纳滤波语音增强的目的是最大限度地抑制噪声,得到原始语音的最佳估计。采用不同的最佳准则,得到的估计结果可能不同[11]。在传统的维纳滤波算法中，若带噪语音的信噪比较高，则经过维纳滤波后的信号的先验信噪比也比较大。也就是说，信噪比的取值是不确定的，它会随着带噪信号中噪声的变化而发生变化[12]。为了避免这种不确定性，需要让先验信噪比保持在一个相对稳定的状态，所以用前一帧的先验信噪比决定当前帧的先验信噪比，从而对维纳滤波算法进行改进。

(1)

式中：pd(k,t-1)为噪声能量；Ak(t-1)为第(t-1)个分帧中第k个谱分量的语音频谱幅度；α为系数,0≤α≤1。

p(x)为：

(2)

(3)

令J对系数α的偏导数为零，则有：

α=1-f(ξk-1,γk)

(4)

当ξk-1、γk同时为零，α可取[0,1]之间的任意数值，最终可得：

(5)

(6)

式中：ps(t)和pd(t)分别为信号与噪声的能量；yt为带噪语音信号。

由于人耳是有阈值的，所以并不需要完全消除语音中的噪声，只需将噪声降低到人耳阈值之下，这样噪声就不会被人耳所感知。这在某种程度上等价于消除了噪声，可以最大限度地避免语音信号增强后的失真。

3 GSC和维纳滤波相融合的增强算法

3.1 GSC与维纳滤波融合的增强算法

由于GSC语音增强算法，对相干噪声具有较好的抑制作用，然而维纳滤波算法对非相干噪声具有较好的抑制作用。但在实际应用环境中，所面对的噪声环境并不只是单纯的相干噪声或者非相干噪声，在大多情况下噪声情况是复杂的。它既可能存在相干的部分，也可能存在非相干的部分。单独的GSC自适应滤波算法和维纳滤波算法都存在着很大的局限性，因此本文研究了GSC语音增强算法和维纳滤波算法融合的增强算法。

融合算法先进行GSC语音增强，后进行维纳滤波语音增强。融合的增强算法如图3所示。

图3 GSC与维纳滤波融合的增强算法

3.2 算法仿真与分析

原始信号波形如图4所示。

图4 原始信号波形图

将3个麦克风，取间距为1 cm，均匀直线分布构成麦克风阵列，来波方向和阵列的夹角为30°，语音入射方向为45°。采用该接收信号来进行算法仿真。仿真假设滤波器的阶数为W=7，采样点数n=1 024。

在原始信号中加入信噪比为3 dB、均值为零的高斯白噪声后，所得到的输入信号波形图如图5所示。

图5 加噪后的输入信号波形图

加入噪声后，输入信号经过维纳滤波后的输出信号波形如图6所示。通过仿真发现，维纳滤波对于噪声的抑制效果较好，能抑制大多数掺杂的噪声，但是并不能完全抑制所有的噪声。维纳滤波的局限性就在于，它需要知道原始信号的许多参数信息。这一条件在实际应用中往往是不能满足的。

图6 维纳滤波后输出信号波形图

加入噪声后，输入信号经过GSC自适应滤波后的输出信号的波形如图7所示。从图7中可看出，由于自适应滤波是通过调整自身滤波器参数的变化来追踪信号，以找到输出信号的最小时间差，因此去噪效果良好，抑制了大部分噪声。

图7 自适应滤波后输出信号波形

GSC自适应滤波算法和维纳滤波算法相融合后的输出信号波形如图8所示。

图8 算法融合后的输出信号波形

从图8可知，该改进算法很好地抑制了噪声，不管是在相干噪声环境，还是在非相干噪声环境中，都有很好的效果，基本能和图4原始信号波形保持一致。

4 结束语

在复杂的噪声环境中，研究和改进麦克风阵列语音信号的增强方法，使其具备更好地去噪能力，是本文的研究目的。在深入研究了GSC自适应滤波算法、维纳滤波算法后，本文对GSC阻塞矩阵和维纳滤波算法中信噪比取值的不确定性进行了改进，并尝试将两种算法融合。通过建模、仿真与分析，证明融合后的增强算法具有更好的去噪能力和噪声环境适应能力，可广泛应用于多种场合，为进一步研究麦克风阵列语音增强算法提供了新的解决思路。