语声通信降噪研究

2020-03-03田玉静左红伟

应用声学 2020年6期

田玉静左红伟王超

0 引言

语声是人类通过发声器官发出[1]、具有特定意义、用来进行信息交换的声音，是人类相互沟通最重要的工具。信息交换往往需要远距离传输，信号在传输过程中信道弥散造成码间串扰(Inter-symbol Interference, ISI)，同时受到噪声污染。自适应均衡技术[2]能消除ISI，进行噪声控制，有效提高信号质量，但在语声通信系统应用中要预先得到期望信号，对系统进行训练，这是不切实际的，所以不得不采用盲均衡[3]。自适应盲均衡算法能在信道畸变相当严重的条件下不借助训练信号序列，仅根据信道输出信号序列统计特性来获得信道响应信息，补偿期望响应序列信息，通过自适应均衡算法消除ISI 和噪声。自适应盲均衡技术研究在语声通信、数字通信、无线通信系统中具有深远意义。

自适应盲均衡算法能有效消除ISI 补偿信号畸变，但其噪声控制效果不佳。小波包分析能利用听觉掩蔽特性，降低噪声，拟合听觉感知，恢复语声细节信息，有效提高语声通信保真度。本文将自适应盲均衡技术引入语声通信系统与小波包掩蔽阈值降噪算法联合使用，形成了一种语声通信基带噪声控制新方法。文中分析了两种自适应盲均衡算法。常数模(Constant modulus algorithm, CMA)盲均衡算法算法简单、收敛性好，得到了广泛应用，但其在干扰噪声严重的传输情况下均衡信号失真严重。改进算法降低了稳态误差，在最小化均方误差(Mean squared error, MSE)下，获得ISI 与噪声抑制间的最佳平衡；在强干扰噪声下，有效提高误码率，减少信号失真，算法的有效性和稳健性都有所增强。仿真研究表明，在语声信号ISI和畸变严重情况下，该方法在白噪声及有色噪声的不同噪声环境中都具有稳定的降噪能力，消噪同时可获得汉语普通话良好的听觉效果。

1 自适应盲均衡算法

自适应盲均衡滤波器结构见图1虚线框部分。自适应盲均衡算法[4]如下：设an为输入序列，信道系统函数为h(n)，均衡器系数初始估计值为c(n)，假定信道和均衡器脉冲响应的卷积分解为

其中，hISI(n)是产生ISI的分量，均衡器输出为

其中，hISI(n)∗an是ISI 残留；c(n)∗v(n)为附加噪声，通过运用中心限定定理，卷积噪声(n)可用高斯白噪声模拟，且an与(n)是统计独立的，则an的最小MSE估计z(n)为

图1 语声通信系统降噪新方法Fig.1 A new method of noise reduction in speech communication system

由于an是非高斯分布，ˆy(n)为非线性函数，则先验误差为

式(5)为均衡输出。由此导出盲均衡的先验随机梯度算法：其中，µ为自适应步长。根据MSE 原则或强制零原则，算法性能取决于c(n)接近最佳值c0的程度。如果c(0)近似于c0，ISI 就会大大减少，即眼图是张开的，判决设备会以低错误率得出正确判别，算法会收敛于c0；相反若c(0)离c0较远，码眼闭合，误差曲面是多模的。式(4)～式(6)就是最小均方(Least mean square, LMS)型盲均衡算法。下面从成本函数重新推导式(6)，得到

其中：

求非线性函数φ的导数：

φ的非线性导致成本函数对于(n)和an的高阶统计量依赖性。式(7)不需要输入序列an，反映当前ISI 的大小，为均衡参数的二次非凸函数，其最小值对应ISI 或MSE 的最小值。非线性函数的不同选择就会产生各种盲均衡算法。

正交振幅调制(Quadrature amplitude modulation, QAM)信号星座图算法(Godard算法)[5]

其中，p为正整数；Rp为正实常数，

其中，Rp即为p阶散射。p=2时，Godard算法即转变为CMA算法[6]，成本函数为

式(12)取最小值时的系数值接近MSE最小值。

CMA 自适应算法简单，能独立于载波恢复系统与其同时运行，其性能依靠输入信号的二阶统计量平稳度。当存在信道噪声v(n)时，理想均衡不可能实现，通过研究高阶统计量，致力于寻求在最小化MSE 下，获得ISI 与噪声抑制间的最佳平衡。改进的盲均衡自适应算法[7]如下：

其中，TB为字符时长，当t=nTB/2时，其离散信号x(n)为

其中，hr(n)为等价离散冲击响应，v(n)为等价高斯白噪声，定义(M+L-1)×M阶信道均衡输出为

其中，cek=c2k，c0k=c2k+1，xe(n)=x(2n)，x0(n)=x(2n+1)。

从发送字符an，到输出ˆy(n)的复合脉冲响应(n)的时域表达式为

定义信道矩阵为He，子均衡矢量≜[Ce0Ce1···CeM−1]T，相应的矩阵为H0和C0；利用矩阵形式表达式(21)的卷积，有=Hc，其中。若无噪声v(n)且满足δn0=HC≜[0···010···0]T, 系统就会免于ISI，实现理想均衡。当信道噪声v(n)存在，延迟n0满足0 ≤n0≤M+L-1，最小化数据字符误差率见式(22)：

定义an≜[anan−1···an−(M+L−1)]T，V(n)=[v(n-1)···v(n-2L+2)]T均衡输出可得

差错率e(n)的均方值为

用线性MSE估计，推导出相对于ˆC的最小化MSE：

通过对式(26)矩阵对角元素求最小值，可得到最佳值。

自适应盲均衡算法能有效去除语声传输系统的ISI，但输出信号对语声细节信息处理欠佳，残留噪声比较严重。为了获得更好的语声通信效果，实验对盲均衡滤波输出的基带语声信号做二次增强处理，进一步消除均衡滤波增强语声信号中的残余噪声。

2 结合听觉感知的小波包降噪算法

小波分析算法简单，其能利用人耳听觉掩蔽特性拟合声道发声[8]，选其作为语声增强二级处理算法，详细算法见参考文献[9-10]。简述算法如下：将含噪信号小波包五级分解，得到二尺度方程，推广二尺度方程，得到前后两个尺度之间的子波系数关系，见式(27)：

含噪语声经小波包分解化为

根据人耳听觉感知特性[11]，对结点划分不同Bark子带，将临界带中每层小波变换后的系数由小到大排列，构成向量P，求各子带风险序列，找到风险最小值：

计算风险向量R= [γ1,γ2,··· ,γN]，以R元素中最小作为风险值求出对应的Pi。

估计子代噪声的方差δ2n：

其中，di为子代分解细节信号，=mean(di)。

计算每个小波包树终端结点k处的噪声标准差σ2nk：

其中，[MAD]k,j是小波包树终端结点k处在尺度j上小波系数中值绝对值。

计算阈值T：

其中，γmin为γi的最小值。

通过子代噪声方差估计，设置参数λ，实时跟踪各尺度噪声水平，自适应调整阈值T，重构各尺度的剩余系数，经小波反变换重建信号，尽可能在抑制残留噪声的同时，保留语声高频信号和弱特征分量，减小语声失真。

3 语声通信系统消噪新方法仿真研究

语声通信的信息处理速度日益提高，码速率越高，ISI问题越严重，加之信道干扰的突变随机性，常规增强算法已无力处理复杂干扰。本文引入了自适应盲均衡技术来消除ISI 和信号畸变，考虑到自适应盲均衡技术在噪声控制方面能力有限，将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用，形成一种语声通信系统基带消噪新方法，该方法的完整系统模型见图1。传输函数模拟信道，混入加性噪声v(n)，混噪信号通过自适应盲均衡滤波，去除ISI 和畸变，过滤部分噪声，再用小波包听觉掩蔽阈值做二次增强。纯净语声信号选用16QAM调制[12](16QAM 每符号4 bit 信息，相同码元速率下，QAM的传输效率高，在通信新技术中广泛应用)。通过提取信号二阶及高阶统计量多算法融合，接收端信号盲处理，实验验证算法可对语声通信系统噪声有效稳健去除。

3.1 自适应盲均衡算法性能测试

首先测试盲均衡算法的抗干扰能力。用16QAM 调制模块建立仿真，仿真16QAM 数据传输系统，模拟图1中的自适应盲均衡系统，信道系统函数为H(Z)= 0.2+0.5Z−1+Z−2-0.1Z−3，信道背景噪声为高斯白噪声，输入信噪比设定SNR=0 dB，均衡器M=8。

自适应盲均衡算法收敛后星座图对比见图2。图2(a)为盲均衡器输入端接收到的信道噪声附加信号的星座图，很明显ISI 和噪声的复合影响使得信号质量恶劣，几乎无法检测；图2(b)为CMA自适应算法下盲均衡输出端的信号星座图；图2(c)为改进自适应算法下盲均衡输出端的信号星座图，对比可见采用改进自适应盲均衡算法有很强的去除ISI能力。

自适应盲均衡技术对信道噪声和大量ISI 都能有效抑制，算法收敛稳定，对采样相位不敏感，在严重噪声干扰的情况下自适应均衡性能良好。CMA算法迭代5000 至12000 次左右收敛，改进算法迭代8000 至20000 次左右收敛，收敛速度取决于输入信号的平稳性。CMA算法均衡速度快，实现复杂度低，改进算法复杂度稍高。仿真结果显示，采用自适应盲均衡技术可以降低均方误差，使得星座图变得清晰而紧凑，有效消除ISI，提高通信系统性能。由星座图呈现效果可见改进算法对ISI 的抑制能力更强，工程实际应用时可按需选择。

图2 自适应盲均衡算法收敛后星座图对比Fig.2 Comparison of constellations after convergence of adaptive blind equalization algorithm

3.2 新系统语声增强仿真实验

利用如图1所示的语声消噪方法，进行基带语声通信系统语声消噪仿真研究。噪声数据取自The Signal Processing Information Base (SPIB)数据库，选取白噪声(White Noise)、餐厅内嘈杂噪声(Speech Babble)、粉红噪声(Pink Noise)、工厂车间噪声(Factory Floor Noise)、高频信道噪声(HF Channel Noise)。实验语声来自LibriSpeech 学术语声数据库，播音员男声标准普通话朗读宋词“赤壁怀古”语料，仿真实验语声时长1.6 s。信号的采样率为8 kHz，帧长L= 256 (32 ms)。自适应盲均衡输入端信噪比为0 dB、5 dB、10 dB、20 dB。

图3为信道输出混高斯白噪声、自适应盲均衡滤波输入端信噪比均为0 dB 条件下，算法噪声消除性能语声波形对比图。图3(a)是纯净语声信号波形图；图3(b)为混高斯白噪声，混噪波形；图3(c)为白噪声下CMA盲均衡算法自适应滤波输出波形；图3(d)为白噪声下改进盲均衡算法自适应滤波输出波形；图3(e)是白噪声下小波包二次增强输出。

图4为同一语声信号混合噪声换成餐厅内嘈杂噪声时，算法噪声消除性能语声波形对比图。图4(a)是纯净语声信号波形图；图4(b)为混Speech Babble 噪声，混噪波形；图4(c)为Speech Babble 噪声下，CMA 盲均衡算法自适应滤波输出波形；图4(d)为Speech Babble 噪声下改进盲均衡算法自适应滤波输出波形；图4(e)是Speech Babble 噪声下小波包二次增强输出。

由波形图可以直观看出CMA 盲均衡算法在高斯白噪声下性能尚可，但其在非高斯噪声下，语声波形失真严重。改进盲均衡算法在高斯白噪声及非高斯噪声下，算法的有效性和稳健性都有所增强。小波包二次增强能有效恢复语声细节信息。

对仿真实验结果进行量化客观性能[13]评价：

(1)分段信噪比(SNRseg)[14]：计算语声信号每一帧信噪比，取其平均值，SNRseg越大，则消噪效果越好。定义形式为

其中，f(m,n)为纯净语声信号幅值，f∧(m,n)为消噪后的信号幅值，m为帧号，N为帧长，m= 1,2,··· ,N,n= 0,1,2,··· ,N -1，M为总帧数。算法增强后的语声SNRseg结果比较见表1。

图3 混白噪声输入信噪比为0 dB 时算法噪声消除语声波形对比Fig.3 Comparison of speech waveforms when the input SNR of mixed White Noise is 0 dB

图4 混Speech Babble 噪声输入信噪比为0 dB 时算法噪声消除语声波形对比Fig.4 Comparison of speech waveforms when the input SNR of mixed Speech Babble noise is 0 dB

(2)语声质量感知评估(Perceptual evaluation of speech quality, PESQ)[15]：采用ITU-TP.862 标准，可评价降噪输出语声的听觉效果。该分值为4.5～-0.5之间，得分越高则输出语声音质越好。算法增强后的语声PESQ得分结果比较见表2。

通过分段信噪比数值和算法增强后的语声PESQ 分值，可以看出CMA 盲均衡算法滤波输出残留噪声严重，听觉效果差；改进的盲均衡算法自适应滤波输出信噪比有所提高，但在人耳听觉效果方面仍有待提高；通过小波包二次增强，信噪比有效提升，语声听觉清晰度和可懂度进一步改善，获得良好的听觉效果。将自适应盲均衡技术引入语声通信系统与小波包掩蔽阈值算法结合进行噪声控制，研究表明该方法在语声信号ISI和畸变严重情况下，在白噪声及有色噪声的不同噪声环境中都具有稳定的降噪能力，消噪同时可获得汉语普通话良好的听觉效果。

表1 不同算法SNRseg 比较Table 1 SNRseg comparison of different algorithms(单位:dB)

表2 不同算法PESQ 比较Table 2 PESQ comparison of different algorithms

4 结论

通信系统中信号通过传输，ISI 和信号畸变严重，自适应盲均衡技术能有效去除ISI，提高通信系统性能。本文分析了两种自适应盲均衡算法：CMA盲均衡算法和改进盲均衡算法，在语声通信系统中引入自适应盲均衡技术能有效对语声信道失真进行补偿，减小ISI，由于自适应盲均衡技术在语声噪声控制方面能力有限，本文将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用，形成一种基带语声增强新方法。采用小波包掩蔽阈值听觉拟合二次增强，恢复语声细节信息，有效提高语声通信保真度。仿真研究证实该方法在语声通信ISI和信号畸变严重情况下，在白噪声和有色噪声的不同噪声环境中都具有稳定的消噪能力。其在语声通信、无线通信、数据通信等领域具有实际应用价值。