APP下载

数字助听器中多通道响度补偿算法的研究

2016-02-27张玲华

计算机技术与发展 2016年6期
关键词:响度频段增益

沐 城,张玲华

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

数字助听器中多通道响度补偿算法的研究

沐 城,张玲华

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

目前数字助听器中用的较多的响度补偿方法,通常是对语音的高频部分进行高增益,但由于听损患者在高频段的听觉范围比较小,直接对高频部分进行高增益容易超出听损患者的听觉范围。文中引进了宽动态压缩技术,首先将整个语音的动态范围按一定比例均匀压缩到患者的残余听力中,然后将频带非等宽划分,再在不同频段进行响度补偿和增益控制,最后对信号进行重构,并利用小波阈值去噪技术去除部分噪声。实验结果表明,该方法能够使补偿后语音的响度完全映射到听损患者的听觉范围内,从而有效提高患者的听力水平,特别对高频部分语音的辨识,具有较好的效果。

响度补偿;宽动态压缩;正交镜像滤波器组;增益控制

0 引 言

在听力损失的情况下,听阈普遍下移,从而造成听觉动态范围减小、分辨语言的能力下降等问题。响度补偿是数字助听器的关键算法之一,也是其核心任务之一。为了对声音进行压缩放大,将正常听力范围内的声音映射到听损患者的听力范围内[1],就需要用到响度补偿。目前,大多数数字助听器都已实现多通道响度补偿功能[2],但多数响度补偿方法主要用于处理等宽频率间隔。其实人耳对声音频率的感受与实际的频率高低不是线性关系,而是接近对数关系,所以等宽频率间隔的补偿方法不能满足人耳的听觉特性。虽然不同患者的听力损失是不一样的,但基本上具有低频听力损失较小、高频听力损失较大的特点。有研究表明,大脑通过相对比率[3-4]来感受频率,而不是绝对频率。由于语素的频谱间存在一定位置关系[5],通过按比例压缩可以保持这种关系。

考虑到上述情况,文中将宽动态压缩技术[6]应用于响度补偿。首先将整个语音信号的动态范围按一定比例均匀压缩到患者的残余听力中,再让信号顺次通过宽动态压缩模块、响度补偿模块以及增益控制模块,经过这一系列处理后,语音信号处于听损患者听阈范围内,再利用小波阈值去噪技术去除部分噪声。实验结果表明,该方法具有较好的效果。

1 多通道响度补偿原理及系统设计

1.1 多频段语音信号响度补偿原理

一般来说,人耳能感觉到频率在16~20 000 Hz间的声音。在这个范围内,可引起人的听觉的最小声音强度被称为听阈。如果振动强度继续增加,当达到一定限度时,将会引起鼓膜疼痛,这个限度称为痛阈。对于不同频率,人耳的感觉是不同的,对正常听力者和听损患者进行声强测试,可以分别得到正常人和听损患者的听力检查曲线图。听损患者的听力测试曲线与正常人相比是不同的,他们对声强的敏感度更低,所以他们的听阈要比一般人高,而痛阈却比一般人低,因此听力范围比普通人小。一般通过多次测试特殊频点的阈值,求各频点阈值的平均值作为听损程度,连接各阈值所得曲线图作为听损患者的听力检查图。图1是一个听损患者的听力检查曲线图。

图1 听损患者的听力检查曲线

从图1中可以看到,听损患者在不同频率损伤情况是不一样的,一般来说,在低频区域损伤较小,听阈值也较小,在高频区域的听力损失更为严重,使得在高频区域阈值较大,导致高频区域听力范围较小。就算是同一患者,在不同频段上也会有不同程度的听力损伤,因此使用单通道响度补偿方式是不合适的。

对听损患者进行响度补偿,不仅要考虑不同频率信号的听力敏感,还要考虑患者可以承受的信号强度。因此,在对声音进行响度补偿的同时,还要根据声音的强度进行控制,以确保小信号能被病人听清楚,同时保护病人的耳朵在强信号下不受伤害[7]。

图2是增益控制曲线。其中,UCLn和UCLu分别为正常人和患者的痛阈值,THRn和THRu分别为正常人与患者的听阈值,MCLn和MCLu分别为正常人和患者的最适阈值。这些参数的值并不是固定的,不同患者在不同频率上的值都是不同的,因此需要根据各患者的具体情况来测定听力测试曲线(见图1)。根据图2的增益控制曲线对响度补偿后的语音进行增益调节,正常听力范围内的声音被映射到听障者的听力范围上。

图2 增益控制曲线

1.2 宽动态压缩方法

所谓宽动态压缩,意思是将整个声音按照一定的比例进行均匀压缩,最终压缩到患者的残余听力中。由于声音具有特殊性质,语素之间存在一定关系,语素之间的联系可以通过按比例压缩来保持。将语音按比例压缩到患者较好的听力范围内,可以使患者更好地听到声音的高频部分,有助于改善患者的语音识别率[8]。

首先根据患者的听力情况,选择要进行压缩的频段和目标频段,然后计算出高频部分的压缩比[9]。设压缩比为γ,则:

(1)

其中:ftmax和ftmin分别为目标频段的最高频率和最低频率;fomax和fomin分别为原频段的最高频率和最低频率。

压缩后信号频谱表达式为:

(2)

图3为从实验语音中截取的一帧语音,采用了宽动态压缩方法,选择压缩比γ=2,获得压缩前后的频谱比较图。其中,压缩前原始语音的频段为0~8 000Hz,压缩后的目标频段取0~4 000Hz。实线表示原始语音的频谱,虚线表示压缩后语音的频谱。

1.3 基于QMFB的多通道子带滤波器组设计

从图1可以看出,不同频段上的听损程度是不同的,因此需要将语音划分为多个频段,不同频段使用不同的补偿因子。还可以看出,听损患者在4 000~8 000 Hz频段上的听力范围较小,而在0~4 000 Hz频段上的听力范围较大。因此先将信号整体压缩到0~4 000 Hz频段上,这样使得4 000~8 000 Hz频段上的信号对应到2 000~4 000 Hz频段上,这时的信号处于患者的残余听力中,最后再使用正交镜像滤波器组(QMFB)对信号进行非等带宽划分[10-12]。

图3 原频谱及压缩后频谱

信号经过QMFB的分析,滤波器组被分成若干子带信号,各子带信号经过处理后,再经过合成滤波器组输出合成信号。假设分析滤波器组的低通滤波器为H0(ω),高通滤波器为H1(ω);合成滤波器组的低通滤波器为G0(ω),高通滤波器为G1(ω)[13]。若H0(ω)=H(ω),由于H0(ω)和H1(ω)关于ω=π/2对称,两者频响关系满足:

H1(ω)=H(ω-π)

(3)

(4)

合成滤波器组跟分析滤波器组的差别只是因子不同,两者结构基本相同。因此合成滤波器组的低通滤波器G0(ω)=2H(ω),高通滤波器G1(ω)=-2H(ω-π)。

对于滤波器而言,一般来说,阶数提高了,可以使过渡带变窄,阻带波动变小,当然滤波效果更接近理想情况,缺点是成本较高。经过综合考虑,文中选取阶数N=99,归一化截止频率fp=0.45π的滤波器。由于QMFB是线性相位的,可以消除混叠失真,能够完美重构信号[14]。

1.4 系统结构框图

首先对原始语音进行响度衰减,模拟患者听到的语音,然后对该语音进行宽动态压缩,将语音按一定比例均匀地压缩到目标频段,再使用分析滤波器组对语音进行非等带宽划分,并对各子带信号进行响度补偿和增益调节,最后使用合成滤波器组将子带信号合成为最终补偿后的语音。

系统框图如图4所示。

图4 系统框图

具体步骤如下:

第1步:根据图1听力检查曲线图模拟患者听到的声音。听力曲线图是分段曲线,先计算各分段点的声压级,相邻分段频率点之间是线性关系,可以计算各频段声压级的衰减曲线,然后在各频段内依据得到的衰减曲线进行幅度衰减,从而得到患者听到的声音。声压级计算公式为:

(5)

其中:x是采样信号;N是信号长度;P0是基准声压级,一般取20μPa。

第2步:对语音进行分帧。帧长取20ms,帧移为10ms,加窗为汉明窗。

第3步:对分帧后的语音进行压缩。从图1听力检查图可以看到,患者在4 000~8 000Hz上的听觉范围较小,而在0~4 000Hz上的听觉范围较大,可以取压缩比γ=2。根据式(1)将语音进行压缩,压缩到目标频段0~4 000Hz,这样原始语音在4 000~8 000Hz的频段就映射到了2 000~4 000Hz频段上。要根据不同患者的具体情况来选取原频段与目标频段。

第4步:对语音进行分频处理。使用四通道QMFB分析滤波器组将压缩后的语音帧分频,语音被分成0~500Hz,500~1 000Hz,1 000~2 000Hz以及2 000~4 000Hz这四个频段。

第5步:对子带信号进行响度补偿和增益控制。子带补偿的方法跟第一步的过程相反。语音经过补偿后,再对其强度进行增益调节。先根据式(5)计算输入信号的声压级,再确定各子带的增益调节因子,也就是a与b两段直线的斜率,如图2所示。假设a,b两段直线的斜率分别为CRa=和CRb,则:

(6)

(7)

由图2可知,当THRn≤SPLin

(8)

当MCLn≤SPLin

(9)

第6步:将子带信号进行合成。先用QMFB的合成滤波器组将子带信号合成为一帧完整的信号,再将各帧信号叠加得到响度补偿后的语音,并利用小波阈值去噪技术去除部分噪声。

2 实验与仿真

录制一段语音作为实验使用语音。先对语音进行分帧,帧长取20ms,帧移取10ms。再根据图1的听力曲线对语音进行衰减,获得患者听到的声音。然后根据图4的系统框图,将衰减语音依次通过宽动态压缩模块、QMFB分析滤波器组、补偿控制模块以及QMFB合成滤波器组,最终获得符合听损患者听觉特性的语音,并利用小波阈值去噪方法去除部分噪声。

图5为其中一帧语音经过衰减以及响度补偿后的波形图。

从图5可以看出,衰减后的语音在大多数频段内的响度值都远低于听损患者的听阈值。信号处于低频段时衰减相对较小,处于中高频段时的衰减较大。经过响度补偿后,原先衰减的语音大部分都处于患者的听觉范围,虽然有少部分处于听阈以下,但是经过增益控制后,所有频段的语音都被调节到患者的听觉范围内,有效实现响度补偿。

如图6所示,这是原始语音、经过衰减后语音、经过增益控制后语音的时域波形图。

从图6可以看出,衰减后的语音幅度非常小,并且波形发生变化,甚至无法分辨出原始语音。而由增益控制后语音波形图可以看出,经过响度补偿和增益控制后的语音与原始语音的波形基本相同,不仅如此,语音的幅度也有了明显的增强,从而实现了对语音进行响度补偿的目的。

图6 原语音、衰减语音、增益后语音时域波形图

3 结束语

上述实验表明,使用宽动态压缩,可将患者听觉范围较小的高频区域信号移动到患者听觉范围较大的低频区域,同时对该低频区域的语音进行响度补偿,这样可使患者获得较好的听觉效果。补偿后,语音信号基本上与原来的信号相同,而且声音的强度明显增强。再经过增益调整,将处于患者听阈以下的信号调整到患者听阈以上,同时将幅度过大的信号进行适当削弱,这样既可以使声音映射到听损患者的听力范围内,又能防止声音过大对患者造成二次伤害。实验结果表明,该方法能有效实现响度补偿,改善听觉效果,有效提高患者的听力水平。

[1] 赵 力,张昕然,梁瑞宇,等.数字助听器若干关键算法研究现状综述[J].数据采集与处理,2015,30(2):252-265.

[2]ChongKS,GweeBH,ChangJS.A16-channellow-powernonuniformspacedfilterbankcorefordigitalhearingaids[J].IEEETransactionsonCircuitsandSystemsII:ExpressBriefs,2006,53(9):853-857.

[3]Miller-HansenDR,NelsonPB,WidenJE,etal.Evaluatingthebenefitofspeechrecodinghearingaidsinchildren[J].AmericanJournalofAudiology,2003,12(2):106-113.

[4]StelmachowiczPG,PittmanAL,HooverBM,etal.Theimportanceofhigh-frequencyaudibilityinthespeechandlanguagedevelopmentofchildrenwithhearingloss[J].ArchOtolaryngolHeadNeckSurg,2004,130:556-562.

[5]GoldbaumSM,HalpinC.Exploringthedamagedear:theNIDCDnationaltemporalboneregistry[J].ASHA,1999,41(1):29-33.

[6] 陈广飞,应 俊.数字助听器宽动态压缩算法研究[J].北京生物医学工程,2006,25(5):454-456.

[7] 雍雅琴.数字助听器中主要语音信号处理方法研究[D].北京:北京协和医学院,2013.

[8] 王青云,赵 力,赵立业,等.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835.

[9] 张宝琳,张玲华.数字助听器中多通道响度补偿方法的研究[J].信号处理,2013,29(5):656-661.

[10]RothweilerJH.Polyphasequadraturefilters-anewsubbandcodingtechnique[C]//ProcofIEEEICASSP.[s.l.]:IEEE,1983.

[11] 张 晨,李双田.设计QMF组的一种新算法及基于GA的优化[J].信号处理,2005,21(2):120-125.

[12] 孟 君.基于DSP的数字助听器多通道响度补偿方案[J].南京信息工程大学学报:自然科学版,2010,2(5):420-425.

[13] 李 丽.非均匀滤波器组的研究[D].西安:西安电子科技大学,2009.

[14]HuangJ,GuGX.AdirectapproachtothedesignofQMFbanksviafrequencydomainoptimization[J].IEEETransactiononSignalProcessing,1998,46(8):2131-2138.

Research on Multi-channel Loudness Compensation in Digital Hearing Aids

MU Cheng,ZHANG Ling-hua

(College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

Loudness compensation algorithm is a key technique in digital hearing aid.At present,digital hearing aid in multi-channel loudness compensation method,is usually high gain for the high frequency part of speech.However,because of the relatively small range of hearing loss in the high frequency range,the high gain of the high frequency part is easy to exceed the range of hearing loss.Wide dynamic compression technique is introduced in this paper.First the dynamic range of the speech according to a certain proportion is uniformly compressed to patients with residual hearing,then the band is partitioned with non equal width,and loudness compensation and gain control is carried out in different frequency band.Finally,the signal is reconstructed,removing partial noise by wavelet threshold denoising technology.Experiment shows that the method makes the loudness of speech after compensation completely mapped to range of hearing loss in patients,effectively improving the patient’s hearing level,especially on speech identification of high frequency part with good effect.

loudness compensation;wide dynamic compression;quadrature mirror filter bank;gain control

2015-08-26

2015-11-27

时间:2016-05-05

江苏省高校自然科学研究重大项目(13KJA510003);江苏高校优势学科建设工程资助项目(PAPD)

沐 城(1990-),男,硕士研究生,研究方向为现代语音处理与通信技术;张玲华,教授,博士,博士生导师,研究方向为传感器和语音。

http://www.cnki.net/kcms/detail/61.1450.TP.20160505.0831.102.html

TP301.6

A

1673-629X(2016)06-0123-04

10.3969/j.issn.1673-629X.2016.06.027

猜你喜欢

响度频段增益
基于增益调度与光滑切换的倾转旋翼机最优控制
5G高新视频的双频段协同传输
gPhone重力仪的面波频段响应实测研究
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
响度在节目制作和播出中的应用
数字时代中节目响度平衡浅析
推挤的5GHz频段
台内音频响度控制方式
自增益电路在激光测距中的应用