频率降低技术在助听器验配中的应用
2015-03-17黄运甜段吉茸
黄运甜段吉茸
·技术与方法·
频率降低技术在助听器验配中的应用
黄运甜1△段吉茸1
很多感音神经性听力损失(sensorineural hearing loss,SNHL)患者的听力图呈下降型,而言语中大部分关键信息恰恰体现在高频,如:英语中的擦音/s/、/z/、/θ/、/ð/、/f/、/v/、/∫/、/ʒ/,塞擦音/ʧ/、/ʤ/,塞音/t/、/d/;汉语中声母/s/和/sh/等。有些听力损失患者即便选配了助听设备也无法从声放大中获益;如果高频听力损失为极重度的陡降型听力损失患者通常无法从传统声放大技术中获得对中等强度言语声的可听度。很多原因会导致此现象的出现,如助听器声反馈、增益不足和患者存在耳蜗死区;前两种原因可以通过提升助听器的反馈抑制技术和功率来解决,而后一种原因来源于听力损失患者本身[1],通过传统的助听器放大技术不但不能改善该类患者的语言理解力和分辨力,反而可能产生无谓的失真、不适及反馈等副作用;因此,在这种情况下可使用助听器的频率降低(frequency lowering,FL)技术,以避免耳蜗死区频率的声放大。另外,部分使用传统放大技术的高频听力损失患者,由于高频可听度的强度和带宽不足,即使高频听力损失是轻度至中度,患者的言语感知力也没有提高,此情况下也可以使用频率降低技术。本文就频率降低技术在助听器验配中的应用进行概述。
1 频率降低技术的概念和研究现状
频率降低技术又称为移频技术,起源于半个世纪以前[2],主要适用对象是高频听力损失的SNHL患者,将其无法接收的高频声信号移转至残余听力较好的中低频区域。
一项关于FL技术的最新研究结论显示,该技术对言语识别的获益主要体现在擦音的识别方面[3],如/f/、/s/、/∫/。儿童或女性发/s/的共振峰频率为6 300~8 300 Hz[4],声强为57~68 dB[5],高频陡降型听力损失患者无法从传统助听器放大技术中获得高频言语声的可听度。高频听力损失严重的患者,尤其是处于听觉语言发展关键期的儿童,能听到这些辅音非常重要[6]。Moeller等[7]对10名12个月大的婴儿进行了长达1年的纵向跟踪,这些儿童出生即被诊断为感音神经性听力损失(SNHL)并选配了适合的助听器(平均5月龄),经探管麦克风测试确保助听器输出与DSL v4.1公式目标值匹配;结果发现,尽管进行了早期干预,这些儿童仍然很难正确发出擦音和塞擦音,这10例患儿中有6例8 k Hz听阈≤65 d B HL,提示即使是轻度至中度听力损失,高频听障患儿从常规放大技术中获得的可听
度仍然很有限。相同条件下,听障儿童的言语识别力比成人差很多,因为成人可以利用语言学及上下文来弥补缺失的信息,而听障儿童则没有此优势,且噪声环境下聆听言语需要更高的信噪比[8];因此,听障儿童比成人更需要FL技术,但不能说听障儿童比成人更适合FL技术。已有研究证明FL技术对听障成人的益处[9,10],但既包含儿童也包含成人受试者的研究不多,各研究结果间尚缺乏一致性。Glista等[11]在对陡降型高频中重度至极重度SNHL的儿童和成人的比较中,发现在复数词(擦音)识别上使用FL技术的儿童进步更大,但同时作者也提到,无法明确此差异是由于发育的差异还是由于DSL公式多补偿的5~10 dB增益。Kopun等(2012)在对轻度至重度SNHL的成人和儿童的研究中发现,使用FL技术的儿童和成人的单音节词识别率都显著提高,而儿童和成人之间并无明显差异。
目前,全世界有一半以上的主流助听器生产厂家生产FL助听器[3],但关于FL助听器的适用人群和获益度仍然存在较大争议,主要有两点原因:第一,有关现代FL助听器的研究报道有限;第二,各研究结果间缺乏一致性,有时即使是同一项研究,由于FL参数的设置不同,受试者的获益度亦不同[12]。因此,研究人员必须找到“金标准”来评估FL技术的获益度,验配师应明确FL技术的原理、适用人群以及软件操作,使得FL技术为患者带来最大的收益。
2 频率降低技术分类
目前,助听器FL技术主要有三类:线性频率移转、频率压缩和频率平移,其中频率压缩又包括线性频率压缩和非线性频率压缩。无论哪种FL技术,都离不开以下几个术语:①源区域:FL的原始频域;②目标区域:FL的目标频域;③起始频率:源区域的最低频率。图1代表了几种不同的FL技术,图1a代表频率分布,红色代表低频,粉色代表高频,即从1 Hz(红色)至8 000 Hz(粉色);这里假设中频区域(绿色)以上不可听。
2.1 线性频率移转(linear frequency transposition,LFT) 线性频率移转技术可将部分源区域的高频信号降低至低频目标区域。这种算法持续搜索源区域是否存在最强的峰值信息,若存在,复制该信息并将其频率降低至二分之一原始频率处,即降低一个倍频程,如图2所示。为了避免影响低频信息感知,系统只选择部分信号进行处理。线性(linear)是指不改变被降低频段内容的频谱分布,因频谱内容只是被移转而并未被压缩,所以移转后言语相关频谱间的特征依然被保留。但是,被降低的频谱内容会与原始信号的部分频谱内容相互重叠,所以言语特征会发生改变,重叠的高、低频信息可能会导致低频言语信息被转移过来的高频信息所掩蔽。如图1d所示,原始频段中最大的峰值与邻近的部分被转移至目标区域后,目标区域既包含原始频段的峰值,也包含原始声[12],只有最重要的频谱信息被降低(红色峰值)。
2.2 频率压缩(frequency compression,FC) 频率压缩技术可以比喻成幅值压缩技术。频率压缩的起始频率好比幅值压缩的压缩拐点,频率压缩发生在起始频率以上,起始频率以下的信号不受影响。与幅值压缩后动态范围缩小类似,频率压缩后源信号带宽也被缩小,压缩后目标区域的频率范围只限于起始频率以上。频率压缩分为线性频率压缩和非线性频率压缩,二者的区别在于起始频率的位置。如图1a所示,线性频率压缩始于最低频率(1 Hz),而非线性频率压缩的起始频率要更高,仍保留一部分低频区不变,另一部分中高频区频率被压缩,如图1b所示。
2.2.1 线性频率压缩(linear frequency compression,LFC) 线性频率压缩如图1b所示,压缩后的频率与压缩前的频率成简单的线性函数关系:f输出=α(f输入),其中f输入代表FL前的频率,f输出代表FL后的频率,α为一值为0.2~0.5的分数。如果用线性或对数坐标表示,输入-输出关系是一条直线,其斜率为α。
线性频率压缩并不是一直发生,如果总是处于压缩状态,言语声听起来就会不真实且不易理解。由于共振峰的重要性,大多数情况下只对2 500 Hz以上的高频声进行FL。所以,线性频率压缩技术要么对全频声信号进行压缩,要么不启动。而非线性频率则一直处于频率压缩状态。
2.2.2 非线性频率压缩(non-linear frequency compression,NLFC) 非线性频率压缩将高频频谱内容压缩至低频区域,如图1c所示。非线性频率压缩的输入-输出关系为:f输出=(f输入)α,α代表“压缩比”或“CR”。如果用线性坐标(Hz)表示,输入-输出关系为一指数曲线,若用对数坐标表示,输入-输出关系即为一直线:log(f输出)=α×log(f输入)。耳蜗的频率分布关系也是对数关系。在某频率以下的内容不会受影响,此频率为F小,F小以下的信息被完好地保留,F小以上的信息被压缩且被降低至低频范围,信号压缩改变了F小的言语相关频谱特征的比值。通过压缩助听器高频通道的能量到低频去,高频信息被移至低频,最高的频率被移转并压缩至最
大程度,而较低的频率信息移转程度较小。
与LFT不同的是,NLFC不会影响预设截止频率以下的频率内容,而截止频率以上的全部高频信息将被压缩至降低的低频范围内。该压缩行为不会影响重要的共振峰频谱,元音信息与音质会被保留。在优化频率降低技术的放大目标时,截止频率若降至含有共振峰信息的区域内,可能会损失原本和谐的频谱关系,降低言语音质。如图3所示,NLFC选择原始区域的若干最高峰值进行频率压缩。但应注意,只有最重要的频谱信息被降低(红色峰值)。
这两种FL技术均将信号的高频部分移动至低频。对于那些使用传统放大技术刺激耳蜗高频区而产生不适的患者来说,这种刺激不会对耳蜗产生伤害[13~17]。然而,频率压缩策略是以牺牲高频信号带宽和/或影响低、中频信号为代价,患者听到的声音与之前所习惯的声音存在一定区别,需要一段时间适应。
2.3 频率平移(frequency translation/spectral envelope warping) 频率平移(frequency translation)又称为“spectral envelope warping”或“spectral iQ”,与LFT的原理类似,不同的是它只将一部分高频信息移至低频,如图1e所示。频率平移是一种自适应算法,该算法只在探测到输入信号中存在突出的高频言语信息时才启动。它靠频谱特征识别(spectral feature identification)这一过程来监测助听器的输入声信号。频谱特征识别对声信号的高频声进行识别并分类,系统一旦探测到符合要求的高频特征,频谱平移便采用一种复杂处理技术(调整源频谱包络)将高频特征复制(或平移)到低频可听频率范围内,并保留原有高频信号。若输入声中不存在高频信号,系统不会激活频率平移,直到探测到符合要求的高频声才激活[18]。
图1 各种FL技术比较[12]
图2 线性频率移转
图3 非线性频率压缩示意图
图4 频率平移示意图[18]
与其他几种FL技术不同的是,这项技术不会产生高频滚降(5.7 k Hz以上响应幅度降低)。按照源区域的频宽,软件共有7个级别可调,级数越高代表患者听力损失越重;同时可以调节增益控制,以改变平移后频谱的强度。如图4[18]所示,A代表原始助听器频响;B代表识别到高频言语信息/s/后新产生的/s/;C代表未识别到高频言语信息时维持原状。
Alexander对以上几种FL技术进行了分类[3],如图5所示:横坐标代表算法激活条件,纵坐标代表技术特点。频率压缩的特点是:①目标区域包含在源区域内;②源区域带宽被缩窄;③起始频率不改变。频率移转/平移的特点是:①源区域和目标区域的重叠较少;②源区域带宽不变;③起始频率移向低频,FL信号与非FL信号混合。
图5 FL技术的分类[3]
3 影响频率降低技术获益度的相关因素
FL助听器的获益度与许多因素有关,这些因素大体可以分为两类:外因和内因。外因是指决定声信号信息量的因素,具体包括:①言语声和背景噪声;②FL技术的种类和参数设置;③患者耳蜗死区情况。内因是指影响患者能否适应FL后改变了的言语声的因素,如患者的选配年龄、听力损失时间、佩戴FL助听器的经验等。可能影响个体从FL技术中获益多少的因素如图6所示。
图6 影响FL技术效果的因素
无论是否属于频率降低技术的适用人群,Alexander[3]建议助听器验配师首先关闭FL功能,在对助听器精细调节后利用探管麦克风测试获取患者最大可听频率值;然后激活FL功能,确保可听带宽不受FL影响的前提下进行调节。
4 应用频率降低技术的几点建议
频率降低技术是现今唯一针对难以从传统声放大方法中获得听力补偿的高频极重度听力损失患者的可行助听器技术。因为高频增益对于成人言语理解、儿童言语理解与言语发展至关重要,所以该方法可以大大提高患者的助听器获益度与满意度。
低频信号对保证言语的自然感知和言语理解至关重要,而频率压缩技术可以在不损坏低频信号的前提下很好地利用听障人士的残余低频听力。过弱的压缩并不会给言语识别带来任何真正的益处,而过强的压缩会导致言语可懂度与音质的衰减。
频率降低技术能否成功用于助听器选配的影响因素有:①明确各种算法的原理,掌握其中异同;②根据患者听力损失程度、听力图分型、使用经验、年龄等因素把握好使用时机;③了解各助听器厂家频率降低技术的参数和调节范围,找到最佳的参数设置,最大程度地平衡言语理解度和音质;④采取合理的测试方法和评估方法:如测试耳蜗死区的TEN测试、测试可听频率范围的探管麦克风测试等;⑤考虑患者的认知能力,适应一段时间后及时调整频率降低技术的参数[19];⑥需要适应和一定的听觉训练,频率降低程度越高,越需要学习适应新的声音。
1 Moore BCJ.Dead regions in the cochlea:Conceptual foundations,diagnosis,and clinical implications[J].Ear and Hearing,2004,25:98.
2 Mazor M,Simon H,Scheinberg J,et al.Moderate frequency compression for the moderately hearing impaired[J].J Acoust Soc Am,1977,65:1273.
3 Alexander JM.Individual variability in recognition of frequency-lowered speech[J].Seminars in Hearing,2013,34:86.
4 Stelmachowicz PG,Lewis DE,Choi S,et al.Effects of stimulus bandwidth on auditory skills in normal-hearing and hearing-impaired children[J].Ear&Hearing,2007,28:483.
5 Behrens S,Blumstein SE.On the role of the amplitude of the
fricative noise in the perception of place of articulation in voiceless fricatives[J].Journal of the Acoustical Society of America,1988,84:861.
6 Kuk F,Keenan D,Peeters H,et al.Critical factors in ensuring efficacy of frequency transposition part 2:facilitating Initial adjustment[J].The hearingreview,2007,4.http://www.hearingreview.com/2007/04/critical-factors-in-ensuring-efficacy-of-frequency-transposition-part-2-facilitating-initial-adjustment/.
7 Moeller MP,Hoover BM,Putman CA,et al.Vocalizations of infants with hearing loss compared to infants with normal hearing.Part 1:Phonetic development[J].Ear and Hearing,2007,28:605.
8 Hall JW,Grose JH,Buss E,et al.Spondee recognition in a two-talker masker and a speech-shaped noise masker in adults and children[J].Ear and Hearing,2002,23:159.
9 Kuk F,Keenan D,Korhonen P,et al.Efficacy of linear frequency transposition on consanant identification in quiet and in noise[J].Journal of the American Academy of Audiology,2009,20:465.
10 McCreery RW,Brennan MA,Hoover B,et al.Maximizing audibility and speech recognition with nonlinear frequency compression by estimating audible bandwidth[J].Ear and Hearing,2012,20:1.
11 Glista D,Scollie S,Bagato M,et al.Evaluation of nonlinear frequency compression:clinical outcomes[J].Int J of Aud,2009,48:632.
12 Alexander J.20Q:The highs and lows of frequency lowering amplification.Audiology Online,Article ID:11722.http://www.audiologyonline.com/,2013.
13 Baer T,Moore BCJ,Kluk K.Effects of loss pass filtering on the intelligibility of speech in noise for people with and without dead regions[J].Journal of the Acoustical Society of A-merica,2002,112:1133.
14 Preminger JE,Carpenter R,Ziegler CH.A clinical perspective on cochlear dead regions:intelligibility of speech and subjective hearing aid benefit[J].Journal of the American Academy of Audiology,2005,16:600.
15 Vickers DA,Moore BCJ,Baer T.Effects of low-pass filtering on the intelligibility of speech in quiet for people with and without dead regions at high frequencies[J].J Acoust Soc Am,2001,110:1164.
16 Gordo A,Lorio MCM.Dead regions in the cochlea at high frequencies:implications for the adaptation to hearing aids[J].Rev Bras Otorinolaringol,2007,73:299.
17 Cox RM,Johnson JA,Alexander GC.Implications of highfrequency cochlear dead regions for fitting hearing aids to adults with mild to moderately severe hearing loss[J].Ear&Hear,2012,33:573.
18 Galster JA,Valentine S,Dundas JA,et al.Spectral IQ:audibility improving access to high-frequency sounds.2011. http://www.spectraliq.com/pdfs/spectral-iq-wht-paper.
19 Glista D,Scollie S,Sulders J.Perceptual acclimatization post nonlinear frequency compression hearing aid fitting in older children[J].J Speech Lang Hear Res,2012,55:1765.
(2014-07-24收稿)
(本文编辑 周涛)
10.3969/j.issn.1006-7299.2015.04.019
时间:2015-3-3 14:40
R764.5
A
1006-7299(2015)04-0405-05
1 西万拓听力技术(苏州)有限公司(苏州 215021)
△现在尔听美医疗器械(上海)有限公司工作
黄运甜(Email:alps85918@sina.com)
网络出版地址:http://www.cnki.net/kcms/detail/42.1391.R.20150303.1440.038.html