基于全相位陷波器解析设计的啸叫去除
2021-10-31黄翔东
黄翔东 高 月
(天津大学电气自动化与信息工程学院 天津 300072)
1 引言
陷波器能从有用信号的频谱中去除某一干扰频率成分,因而广泛应用于各种数字信号处理系统中,如扩频通信系统、肌电信号处理系统[1]、控制工程[2,3]、雷达、电子对抗、工业测量[4],其中还有一个重要应用领域就是回声消除系统,例如在助听器中去除啸叫[5,6]等。因为助听器集成度高、体积较小,麦克风与扬声器距离很接近,从扬声器输出的信号很容易从耳塞与耳道之间的缝隙或助听器的气孔泄露出去,然后再次被麦克风重新拾取,从扬声器再次输出以形成正反馈,产生回波,严重时候产生刺耳的啸叫[7],不仅会损伤人耳听力,而且极易损坏助听器,因此去除啸叫是数字助听器中必不可少的部分。但是现在多为耳内式助听器,这就要求元件设计简单,功耗低,效率高,且性能优良,对陷波器的设计提出了严峻的要求。
本文认为,一个理想陷波器应满足以下5个条件:(1)为保证输出波形不会出现较大的幅值畸变,陷波器传递值的通带要足够平坦;(2)为保证最终语音不存在相位畸变,陷波器应具有线性相位特性;(3)为了保证助听器在啸叫发生时能有效工作,陷波滤波器的设计也应具有较低的复杂性;(4)为保证啸叫得到妥善处理,陷波频率应在任意频率位置实现;(5)为保证啸叫的频率成分被显著去除,陷波滤波器在陷波频率处应具有较大的衰减。
然而,现有的陷波器设计并不令人满意。如Parks-McClellan技术、Zahradnik等人[8]提出的最大平坦(the Maximally Flat,MF)方法和等纹波(the EquiRipple,ER)方法,其不能任意设定陷波频率,内存需求大,收敛速度慢,计算时间长;对经典Remez算法增加约束条件来设计FIR陷波器[9],但其进一步增加了算法复杂度;自适应滤波器[10]可以跟踪回波路径进行抵消以实现抑制,但实际环境中的语音信号变化随机性大,其迭代收敛受到限制;IIR陷波器[11]具有阶数低、运算量少的特点,但是IIR陷波器的相位特性往往是非线性相位,不可避免地产生相位失真,对滤波后的波形产生很大的失真,要想使相位线性化,必须对相位特性进行物理补偿校正,加大设计的复杂度,并有可能增加滤波器的体积;将自适应滤波与陷波相结合的自适应陷波器(Adaptive Notch Filter,ANF),克服了传统基于离散频谱校正的频率估计方法具有的频谱泄漏严重、计算复杂、抗噪性能差等缺点[12],完全从时域角度进行频率估计,不仅可估计频率恒定的时不变信号,避免了传统方法的局限性,特别是基于梯度下降算法的2阶ANF,具有结构简单、计算量小的特点,可以进行在线实时估计,但缺点是ANF频率估计精度对参数的选择较为敏感、算法收敛速度偏慢等[13,14]。
本文在文献[15]引入的全相位滤波基础上,提出闭式FIR陷波器的设计方案,无需复杂迭代即可实现衰减值可达–330 dB的陷波频率点的任意位置控制,且最终可用简化公式来设计,克服了上述方法的不足,具有较高应用价值。
2 全相位FIR滤波器的一般设计步骤
正如文献[14]中设计的,给定一个N长度频率向量H,使其满足
然后,按照下述3步法可以很容易地得到一个(2N–1)长的线性相位FIR滤波器g=[g(-N-1),g(-N),...,g(-1),g(0),g(1),...,g(N-1)]。
步骤 1 对一特定频率向量H进行IDFT以获得h=[h(0),h(1),...,h(N-1)],然后复制h(1),h(2),...,h(N-1)并插入到h的左边来获得扩展向量h′=[h(-N+1),h(-N+2),...,h(0),...,h(N-1)];
步骤 2 对常用的N长窗f(n)和N长矩形窗进行归一化卷积以获得(2N–1)长窗wc;
步骤 3 将h′和wc对应的元素进行相乘,生成最终的滤波器g(n),-N+1≤n ≤N-1。
理论上,滤波器系数g(n)为
应该强调的是,正如文献[15]中证实的,FIR滤波器的传输曲线g(n)通 过频率设置点H(0),H(1),...,H(N-1),即g(n)的采样傅里叶变换满足
3 基于中心频率可控的闭式FIR陷波器设计
3.1 闭式FIR陷波器设计原理
第2节的3步法是基于卷积窗的FIR滤波器的一般设计。然而,作为一种特殊的滤波器,这种方法不能直接设计出具有可控陷波频率的滤波器。因此本文提出一种名为“反相移组合”的措施来改进这一方法,从而使所需要的陷波器能够以一种闭式的方式有效地设计出来。
因为全相位滤波器的传输曲线通过H的频率点(令Δω=2π/N为频率单位),所以本文旨在设计一个陷波频率在mΔω的陷波器(相对应的频率是f0=mfs/N),设置H为
要强调的是,H实际上拥有点通传输特性,而不是陷波传输特性。这种转换可以通过下面的“反相移组合”措施以及与全通滤波器相减来实现。
该措施要求H分离为两个向量H1,H2,两者满足H1(k)=H2(N-k)[15],即
将式(7)代入式(4),并联合式(2)可进一步获得两个子滤波器
一般来说,因为m是[0,N–1]范围内的一个整数,只能实现上述3步法中的N个陷波频率,这不符合陷波频率点随机的要求。所以为了实现陷波频率f0能灵活移动到任一点,对子滤波器进行反相移操作
其中,(·)*表示共轭。
因此,为了得到实值系数,将两个子滤波器相加,即
图1 子滤波器g1′ 和g2′的传输曲线(N=16,m=3)
结合式(11)、式(12)和式(13)能得到一个最终的陷波器系数g(n)的闭式表达式
将N=16,m=3,λ=0.3和wc(n)代入式(14),并对g(n)进行傅里叶变换,其传输曲线如图3所示。从图3中可看出,陷波频点准确地落在期望点3.3Δω和1 2.7Δω上。
图3 陷波器传输曲线(N=16,m=3,λ=0.3)
3.2 数据延拓
因为助听器中的语音信号是实时存在的,所以为了提高陷波器的工作效率,对语音信号进行分段处理,但是这带来了非线性相位效应。因此,本文提出了使用数据延拓来避免这一副作用。
图2 点通滤波器传输曲线(N=16,m=3,λ=0.3)
将长度为2N–1的陷波器抽头系数g(n)与拓展分段进行卷积得到P+4N–4个样本,然后去掉前2N–2和后2N–2个暂态过程,取中间P个样本作为当前稳态输出。因此,连接所有P长稳定状态输出序列的整个拼接波形不会表现出明显的截断效应。从而保证了该陷波器的线性相位特性。
3.3 陷波器性能分析
从陷波器的设计原理上分析,本文提出的陷波器具有以下性能:
(1)由于陷波器所有的抽头系数都是根据闭式公式计算的,因此该设计的复杂度非常低,能对语音信号中突发的啸叫做出快速响应,实现实时抑制啸叫。
(2)由于提出了“反相移组合”技术,这确保了陷波频率可以指定为任意位置,只需设置整数m和小数偏移λ,满足陷波频率的随机性。
(3)因为全相位滤波器的传输曲线通过了频率设置点,这就保证了与“反相移组合”技术相结合,陷波器的衰减值可以达到–330 dB,能完全地移除啸叫成分。
(4)本文提出的陷波器的系数对称以及数据延拓操作保证了生成的语音不包含非线性相位失真,佩戴者能接收到一个舒适的语音信号。
这些性能正好满足了引言中提出的对助听器中陷波器的要求。
4 仿真实验
含陷波器去啸叫的助听器模型图如图4所示。
图4 含陷波器的助听器模型图
其中,s(n),x(n),y(n)分别表示为原始语音、啸叫混合语音和经本文陷波器滤波的输出语音。指定采样率为fs=16 kHz,子段长度P=2000。本文使用的是一段时长7.625 s(含L=fsT=122000个样本)、包含几句中文的男性语音。对于本文所提方案,滤波器阶数设为N=32,将卷积窗式(9)中涉及的N长窗f设为汉明窗。为了简单起见,将前向反馈增益设为G(z)=1。
在上述参数化的基础上,在时刻t=1.5 s,即第(Lt=fst=24000)个样本处添加了频率f0=1590 Hz,振幅A=1的啸叫分量,利用信噪比(SNR)来评价该方案的性能。
4.1 与传统IIR陷波器的对比
参考2阶IIR模型设计IIR陷波滤波器[16–18],公式为
这里将rz=1,rp=0.8,ωc=2πf0/fs=0.1988π代入式(17)生成IIR陷波器,其衰减曲线和相位响应曲线如图5所示。
相同地,根据3.2节的步骤,将m=3,λ=0.18(由f0=1590 Hz计算出),N,wc(n)代入式(14)生成本文所提陷波器g(n),其衰减曲线和相位响应曲线如图6所示。
此外,将经过IIR陷波器滤波的波形和经过本文提出的陷波器滤波的波形进行了对比,如图7和图8所示,绿线为原始语音信号,蓝线为啸叫信号经过滤波后的信号。
由图5、图6可以得出以下结论:
(1)如图5(a),图6(a)所示,IIR陷波滤波器的通带衰减曲线完全偏离0,因此存在一个明显的直流电(Direct Circuit,DC)恢复波形偏差,如图7(b)所示;而该闭式FIR陷波器的通带衰减曲线完全落在0,因此没有直流偏差出现在其滤波后的波形中,如图8(b)所示。
图5 传统陷波器频率响应图
图6 本文提出的闭式FIR陷波器频率响应图
(2)IIR陷波滤波器的过渡带比本文提出的滤波器宽,这不可避免地会损伤陷波附近更多有用的频率成分。
(3)针对陷波位置,IIR滤波器的衰减值只有约–40 dB,而本文提出的陷波器的衰减值低于–330 dB。因此,在前一个滤波后的波形(见图7(b))上仍有啸叫分量,而在后一个恢复波形(见图8(b))上无啸叫分量。
图7 经IIR陷波器滤波的信号波形图
图8 经闭式FIR陷波器滤波的信号波形图
4.2 比较不同的啸叫频率
为研究所提陷波器对不同啸叫频率的滤波质量,本文使啸叫频率从1290 Hz至3390 Hz变化,并将其对应的SNR列在了表1中。
由表1可以发现,不同啸叫频率所对应的SNR仅在22 dB左右的小范围内波动,说明本文所提陷波滤波器对啸叫频率不敏感。这种鲁棒性反映了陷波器性能稳定,对任何啸叫频率工作良好。
表1 啸叫频率f0与SNR(N=32)
4.3 比较不同的滤波器阶数
为了研究所提方案的滤波质量与陷波器阶数N之间的关系,使陷波器阶数N从32到1024变化,并将其对应的SNR列在表2中。
由表2可以发现,这些SNR也在22 dB左右的小范围内波动,说明本文提出的陷波滤波器对滤波器的阶数不敏感。这种鲁棒性一方面在于,随着陷波器阶数N的增加,过渡带一定会变窄,有利于提高SNR;另一方面,这些陷波器阶数的增加也增大了FIR陷波滤波器的暂态过程,使恢复质量下降。由于这种补偿效应,SNR几乎保持不变。因此,实际上,为降低系统成本和处理时间,我们选择较低阶的陷波器。
表2 陷波器阶数N与SNR(f0=1590 Hz)
4.4 线性相位特性证明
为了证明本文所提陷波器的线性相位特性,随机选取第21子段和22子段连接处的放大图,来观察滤波后的信号在相邻子段的边缘是否出现明显的跃变,如图9所示。
图9 经闭式FIR陷波器滤波的信号波形图及子段放大图
从图9可以明显看出,连接第21子段和第22子段的边缘几乎没有跳变。实际上,我们也研究了所有子段边缘,均没有发生阶跃,这证实了所提方案的线性相位特性。
5 结束语
本文提出了一种闭式FIR陷波器设计,该设计引入整数部分m和小数部分λ实现陷波频率的精确控制,并对语音信号进行分段、延拓和拼接来保证线性相位。将其应用于助听器中,对含啸叫的语音信号进行滤波来判断其性能的优劣。该设计从根本上解决了啸叫抑制不足、直流偏置、相位失真等问题,而且由于陷波器可以用简单的解析公式设计,复杂度较低。此外还进行了一系列的数值实验来验证这些优点。在健康产业蓬勃发展的今天,助听器的相关技术对于大量的老年人和聋人来说至关重要,因此本文的设计拥有较大的应用潜力。