人工耳蜗术后听觉康复主客观评估方法概述
2019-01-14张力新郑琪倪广健
张力新郑琪倪广健,2*
1天津大学精密仪器与光电子工程学院生物医学工程神经工程与康复实验室(天津300072)
2天津大学医学工程与转化医学研究院(天津300072)
在发达国家,大约每一千名新生儿中就有一位患有遗传性重度先天耳聋;而在发展中国家,由于宫内感染患先天耳聋的比例还要高一些[1]。重度听力损失也可能由后天的诸多因素造成,导致每几百名幼儿中就有一个严重耳聋者。据中国卫生部的数据显示,7岁以下患有重度至极重度耳聋的儿童约有115000名,并且每年出生时有听力障碍的婴儿约3万名[2]。新生儿听力筛查自1999年开始在中国实施,截止到2010年,我国已经有20个省实施了新生儿听力筛查[3]。随着新生儿听力筛查和诊断听力技术的日益普及,助听器(Hearing aid,HA)和人工耳蜗(Cochlear implant,CI)等各种辅助听力设备不断改进,越来越多的先天耳聋可以在相对较短的时间内得到准确诊断和治疗[4]。
人工耳蜗是治疗重度至极重度感音神经性耳聋的一种成功方法,也是目前世界范围应用最为成功和广泛的一种神经假体。不同于助听器对声音的放大处理,人工耳蜗是一种神经修复设备,通过电脉冲直接刺激听觉神经来实现对大脑的听觉输入[5],可以帮助听障尤其是先天耳聋患者恢复部分听觉并促进其语句感知、发声及语言能力发展。
1995年至2012年以来,我国有超过1万人接受了人工耳蜗植入,其中85%的植入者是7岁以下的儿童[2]。目前我国每年约有19000名儿童患有重度到极重度听力损失[2],因此预计未来几年人工耳蜗的植入数量将以惊人的速度增加。虽然人工耳蜗是基于健康耳蜗的结构设计而成,但电极数量目前限于12至22个,无法完整代偿健康耳蜗中毛细胞的功能[6],因此电声听力并不能和正常听力相比。人工耳蜗工作时,有时会出现电极位置和最佳耳蜗位点不匹配的情况[7]。人工耳蜗的信号也通常缺乏时域精细结构信息,影响用户对音调以及旋律的感知[8,9]。特别对中国CI儿童而言,学习语言期间对音调识别的不敏感往往会导致其语言发展水平低于正常儿童[10]。通常CI用户在安静的背景环境下可以良好地感知语音,但在嘈杂的背景环境下感知语音或者辅音、元音则存在困难[11,12]。此外,人工耳蜗用户的个体差异(例如听力损失的持续时间和程度,内耳有无畸形或病变等)与设备的影响因素(例如电极相对于神经元的位置,电极的设计以及声音处理的策略等[13]),也均对CI植入后的听觉恢复效果和时间有重要影响。
临床上,为了评估CI植入后的听力恢复水平,多采用主观听力测试,通过在短时间内收集大量数据以及植入者的日常听力状况进行评估[14,15]。但目前CI植入者的年龄越来越小,以至于这类患者无法准确回应主观评估中的问题;另一方面,CI调机时医生很难判断是否调整至舒适阈[16]。因此,无需主观配合的客观测听十分必要,且其在音调测量和语音识别上更加可靠[17]。
本文综述了人工耳蜗术后听觉康复主观和客观两大类评估方法的相关研究工作。根据CI植入者的不同年龄,总结了主观评估测试的相关研究以及局限性。在客观评估方面,主要针对听觉感知、听觉识别以及听觉理解的听觉康复过程,侧重于介绍无需注意力调制的客观评估方法,因为这些方法可以为CI调机提供更准确的参考依据且更适合低龄儿童。在此基础上,分析了将脑电应用于临床客观评估所面临的挑战,最后展望客观评估方法的多样性,提出脑电与多种工程技术相融合的一些想法。
1 人工耳蜗术后主观评估方法
主观测试是让受试者对听到的声音信号进行主观表达,或是根据受试者的听觉行为由测试者进行判定,临床常用的主观测试的方法及内容如表1所示。本节将分别描述适用于儿童、成年CI用户的康复效果主观评估方法,包括各种方法的形式以及考察侧重的内容,随后针对中文普通话这种声调语言的康复评估方法进行了描述,最后对主观测评的局限性提出了一些看法。
1.1 CI儿童术后主观评估方法
对于低龄儿童来讲,主观评估方法主要有问卷评估和言语评估两种形式。例如考察2岁以下儿童的听觉行为的小龄儿童听觉发展问卷(LittlEARS Auditory Questionnaire,LEAQ)[18],考察3岁以下儿童听觉识别能力的婴幼儿有意义的听觉整合量表(Infant-toddler Meaningful Auditory Integration Scale,IT-MAIS/MAIS)[4]。当需要考察听说及言语能力时,常使用有意义言语使用量表(Meaningful Use of Speech Scale,MUSS)[4]和父母评估孩子听说能力量化表(Parents Evaluation of Aural/Oral Performance of Children,PEACH)[19]进行评估。上述评估方法虽各自侧重的评估指标不同、适用年龄略有差别,但均需要家长根据孩子日常听力状况作出评价从而得到量表得分。
在安静环境下考察儿童词句识别能力时,可以采用早期语音感知测试(Early Speech Perception,ESP)方法。ESP是具有单词的简单语音感知任务测试,分别为语音检测、语音模式感知、单词识别和一致的单词识别[20]。在ESP测试中得到3或4类评分的3岁以上儿童可使用小儿言语清晰度测试(Pediatric Speech Intelligibility test,PSI)[21],PSI在 ESP测试基础上出现竞争声音[22,23]。更进一步,在PSI测试中得到及格的儿童可使用开放式单词识别的词汇相邻测试(Lexical Neighborhood Test,LNT)[24]。在噪声环境下考察儿童词句识别能力时,对于5岁以上通过LNT测试的儿童可使用噪声下言语测试(Hearing In Noise Test,HINT)进行评估,其本质为在安静或有噪音的环境下遵循LNT的自适应开放式句子测试[25]。
1.2 CI成年人术后主观评估方法
区别于CI儿童用户,CI成年用户的术后主观评估方法在考察词句识别能力等生理功能的基础上增加了对心理功能和社会功能方面的听觉能力考察。例如,采用言语、空间和质量的听觉量表(Speech,Spatial and Qualities of Hearing Scale,SSQ)可以评估安静、存在背景噪声、共振环境以及电话等不同情况下的语音理解程度,空间听觉问题及有关听力质量问题[30]。采用Nijmegen人工耳蜗问卷(Nijmegen Cochlear Implant Questionnaire,NCIQ)则可以从生理、心理和社会三个方面对CI成年人进行综合评价,评估其日常生活中的基本和高级的声音感知、自信心及社交活动中听力情况[31]。
1.3 基于中文普通话的术后主观评估方法
中国人工耳蜗植入者的数量在世界范围内几乎最多,但是由于中文为声调语言,且相同辅音和元音组成的不同音调组合代表了不同含义,因此其评估方法、素材应区别于国际通用的以英语为基础的量表。音调的不同体现为多种物理属性的不同,包括持续时间、幅度、语音的频谱包络和视觉提示等,但是音调的感知很大程度上取决于基频(F0)的轮廓[32]。对于植入者来讲,通过CI传递的F0信息并不完全[33,34],因此需要学习和使用中文的CI用户在识别音调变化时存在诸多困难,此外他们的词汇感知也不好[35],进而影响了他们对句子含义的理解。经过我国科研人员的努力,目前已经开发了中文版的主观评估问卷,例如,在英文版ESP基础上开发了普通话版的ESP(MESP)[26],主要考察了扬扬格词、多音节词的识别能力。但值得注意的是,从英文版直接翻译为中文版会失去扬扬格词的重音平衡。为此,解放军总医院的郗昕教授团队编辑了与英文版具有同样制式的普通话扬扬格词表,包括牛奶、工人、气球等音节轻重一致的双音节词[36]。除此之外,我国学者也相应开发出适合不同年龄的普通话测试材料,在保证与英文版具有相同制式的基础上,加入了普通话中词汇音调的变化[37,38]。
1.4 术后主观评估方法的局限性
研究表明,目前已有的CI用户术后主观评估方法具有良好的可信度[39]。但主观评估方法的实质是依靠主观加以判定的测听,易受各种因素影响,故此测试结果存在着一定的不准确性和不确定性。许多研究者针对五种人口统计学变量(术前听力水平,植入年龄,人工耳蜗使用时间,母亲教育水平,以及孩子是否在植入前使用过助听器)对主观评估结果的影响进行了统计[31,40],发现术前听力水平较好、植入年龄较小、CI植入时间长且母亲教育水平较好的儿童对词汇的感知以及句子的理解更好,植入前使用过助听器且残余听力较高的CI儿童在噪音中识别句子的能力更好。
表1 层级化人工耳蜗术后主观评估方法Table 1 Hierarchical subjective assessment.Methods for cochlear implants
在对CI成年用户进行主观测听时,受试者虽然认知能力成熟,但仍易受各种因素的影响,例如心理、精神智力、环境和身体因素等。相比于CI成年用户,CI儿童用户进行主观测听时,测试结果的准确性容易受到更为明显的影响。首先,由于患者年龄过小或配合度低等问题,主观测试难以进行从而无法评估,并且儿童极大程度上会存在“白大褂心理”。其次,在医院环境下,患者处于测试评估的状态,其结果不能全面准确的反映他们日常生活中的听力状况。此外,儿童在给出反应的时候存在假阳性,且测听结果的判定必须依赖测试医生的经验,上述诸多因素均会影响测听结果。主观听力问卷需由其家长根据CI儿童生活中的听力表现代为填写,但由于家长常常对孩子的期望值较高,填写问卷时则存在了一定的虚假性。因此,主观评估方法虽然一定程度上能够反映日常生活中的一些听力状况,但评估结果易受各种因素干扰,因此客观评估方法的存在对人工耳蜗的康复评价至关重要。
2 人工耳蜗术后客观评估方法
客观评估方法可规避上述诸多因素的影响,更易于实现评估过程无需受试者配合、评估结果不受主观意识影响等目标。目前应用于临床的客观评估方法多用于CI术前评估,可对耳聋发生部位、性质以及鉴别诊断提供依据,但是临床尚无标准化的CI术后客观评估方法,因此客观预测、评价人工耳蜗植入后的语音识别性能一直是研究人员和临床医生关心的热点和亟待解决的问题。本节将描述听觉电生理在客观评估方面的应用,重点描述以脑电信息作为客观评估工具的研究进展。
2.1 临床客观评估方法
由于客观评估方法一般不需要主观注意力调制,因此客观评估方法的适用人群不需要区分成年人和儿童。临床上的听性脑干反应(Auditory Brainstem Response,ABR)仅可应用在术前评估上,用于检测听力阈值。术中为了判断CI是否已成功植入,则可利用电诱发听性脑干反应(Electrically Evoked Auditory Brainstem Response,EABR)[41]进行术中听功能的监测,具体来讲是通过人工耳蜗用户的CI处理器及电极进行刺激,反映CI电刺激下脑干对声音的处理情况,根据波形分化状态确定CI植入是否发挥效用,如图1(a)所示。但需要指出的是,该方法无法判断更高一级听觉中枢完整性。与EABR相比,电诱发中潜伏期反应(Electrically Evoked Middle Latency Response,EMLR)具有更高级的神经起源,王子健等人认为其可为术后调机提供一定的指导[42]。神经反应遥测(Neutral Response Telemetry,NRT)是目前临床最为常用的一种术中客观评估方法,在手术结束时记录CI用户耳蜗内电极诱发听神经产生的复合动作电位,判断有无听神经病谱系障碍,并为植入者初次开机的刺激量提供参考。上述听觉电生理评估方法均为临床上已经使用的评估手段,但尚不能评估到更高级的听觉中枢,因此仍需能够评估听觉皮层对声音响应的客观评估方法和手段。例如,Oh和Kim等人通过氟代脱氧葡萄糖正电子发射断层扫描(18F-FDG-PET)评估皮层代谢状态来预测人工耳蜗的植入结果,他们认为代谢区域越广泛的个体,其语音感知能力越好[43],但利用类似大型设备评估对实验环境要求高,实现难度大。
2.2 脑电图在CI术后客观评估的研究
耳蜗内的毛细胞将外界声音信号转化为电信号引起神经冲动,传递到大脑中枢听觉系统进行处理,从而实现听觉感知[44]。当声音出现或撤销时所产生的脑区电位变化可以连续精确地反映大脑对声音与反应之间的加工过程[45,46]。CI用户的脑响应通常可以用脑电图(EEG)这种非侵入式技术反映[47,48]。与脑磁图(MEG)、功能磁共振成像(fMRI)和正电子发射断层扫描(PET)相比,EEG可以直接记录到这种声刺激所诱发的具有高时间分辨率的神经元反应。且不存在诸如磁共振成像中严禁携带金属的局限性。上述特点以及同人工耳蜗的兼容性使得EEG有可能成为检查CI用户神经反应最为合适的手段[49]。EEG放大器通过电极记录到头皮上来自神经元集群的放电活动,可以反映大脑内源性或外源性电位变化,例如与听觉事件相关的听觉皮层诱发电位(Cortical Auditory Evoked Potential,CAEP)。通过对EEG信号的处理和特征提取,便可以分析得到反映不同意义的脑电成分,如失匹配负波(Mismatch Negativity,MMN)[50]、P300、N400 等。但是P300主要反映与认知相关的皮层电生理活动,且P300的诱发需注意力调制[51],并不适合用于无需注意力的听觉康复效果评估,因此本文在此不再赘述。成年人和儿童可采用相同的方法记录听觉刺激所诱发的事件相关电位(Event-related Potential,ERP),但随着年龄的增加,事件相关电位各组分的潜伏期和幅值会发生改变,相关内容将在下面详细阐述。
2.2.1 利用CAEP评估听觉感知能力
当给予声刺激后,大脑在对声音察觉、识别和记忆的过程中会产生CAEP[52,53],通常反映了皮层-丘脑环路的皮层活性,其主要包含P1、N1和P2三个组分。其中P1来源于初级听觉皮层和丘脑,是CAEP的外源性成分[54],波形如图1(b)所示。
P1潜伏期的变化证明,在听觉敏感期内植入人工耳蜗的儿童的中枢听觉系统成熟度在CI开机后6个月即可接近正常水平[55],成熟速度与听力正常儿童类似,只是延迟了相应的听觉剥夺时间[56]。其他研究人员也得到了相似结论,通过分析人工耳蜗植入术前和术后3个月P1-N1-P2组分形态及潜伏期的变化,观察到植入后3个月P1组分潜伏期显著减少,即接受人工耳蜗手术时年龄越小,P1组分潜伏期的缩短程度越大,表明了电刺激后听觉通路可以快速成熟[57]。为研究超过最佳发育期再植入人工耳蜗是否还可促进皮层发育,单侧CI植入平均年龄为9.86岁的儿童在植入前、植入后3个月、8个月、14个月的CAEP变化表明,与对侧正常耳对比,患侧CAEP的N1、P2组分在植入后6至8个月才显现出来,证明了在9.86岁植入后听觉皮层仍然具有很高程度的神经可塑性[58]。其它研究同样强调了P1可以作为生物标记物来评估中枢听觉通路的发育程度[59,60],在康复过程中可以提供与行为测试相关的信息,为预测康复效果提供客观依据。
研究发现,患有感音性听力损失和听神经病的患者中,仅在表现出良好言语感知能力的儿童中存在P1-N1-P2组分[61]。通过CAEP各组分的形态,听力师可以确定人工耳蜗是否提供了适当的刺激,并将其作为评估工具调整听觉康复计划。当CAEP中缺少某一组分时,调机至CAEP各组分均明显诱发,从而优化CI用户的舒适度[62],快速客观地验证CI的适用性。目前这种方法仅应用在成人CI用户中,但可以预测,若在植入后早期阶段使用CAEP作为评估工具,有望帮助CI用户在听力康复过程中获得更大的益处。
图1 (a)波II,III和V的EABR记录示例[63];(b)从上至下依次为成人(n=9),4-6岁(n=20),1-3岁(n=19),新生儿(n=8)在Cz处对单词“bad”响应的CAEP,新生儿CAEP通常缺乏P1和N1组分,常通过观察P1波的潜伏期长短和幅值大小判断听觉感知能力如何[64];(c)左侧为1000Hz标准刺激(实线)和不同频率偏差刺激(虚线)所诱发的ERP,右侧为从不同偏差刺激的ERP中减去标准刺激的ERP而获得的MMN,常通过观察MMN的有无、潜伏期长短和幅值大小考察听觉识别能力[65]。Fig.1(a)An example of EABR recording of II,III and V waves;(b)CAEP responding to the word“bad’’at Cz in adults(n=9),4-6 year olds(n=20),1-3 year olds(n=19),newborns(n=8)from top to bottom.Newborns typically lacks P1 and N1.The auditory perception ability is determined by observing the latency and amplitude of the P1 wave;(c)left side is ERP to 1000 Hz standard(solid lines)and deviant stimuli of different frequencies(dashed lines),and right side is the MMN obtained by subtracting the ERP caused by the standard-stimulus from those caused by different deviant stimuli.The auditory recognition ability is examined by observing absence,latency,amplitude of the MMN.
2.2.2 利用MMN评估听觉识别能力
MMN是事件相关电位ERP中一种负波的成分,最早由Näätänen等人提出并证实[65],如图1(c)所示。听觉MMN的诱发是在频繁的标准刺激中嵌入不常见的偏差刺激而产生的,偏差可以体现为刺激强度、频率或持续时间的差异[66]。大脑对刺激偏差的加工是自动的,与主观选择性和注意无关[54],受试者在观看静音视频或阅读书籍而忽略听觉刺激的情况下依然可以记录到MMN响应,因此即使是婴幼儿和失语人群,也可用MMN进行听觉识别能力的客观评估。
目前MMN相关的研究方向主要是用MMN检测CI成年用户的语音感知情况。研究发现MMN峰值的潜伏期和幅值同CI成年用户的言语识别效果有关[67,68]。不同语音识别能力的CI用户具有不同形态的MMN,具有良好语言识别能力的CI用户的MMN表现出较大的幅值,与听力正常被试相似,而中等到低语言成绩者则表现出较小幅值甚至不存在MMN[69]。此外纵向比较发现,CI植入后3到6个月的过程中,MMN潜伏期的缩短与主观听觉能力发展分数显著相关[70]。
中文同其他语言相比最值得注意的一个特点是音调,音调中包含了词汇的不同含义,对于中国儿童来说,不同音调的辨别对于词汇的理解及发展正常沟通能力来说非常重要。对于正常儿童的MMN,音调范式与纯音范式相比具有更高的幅值和更长潜伏期,但CI儿童并没有显示出这种效果,与正常听力同龄人相比,CI儿童表现出更长潜伏期和更低幅值,表明CI儿童的听觉系统并未完全发育,虽然尚可以辨别非语言对(例如1000 Hz和1500 Hz纯音)和语言对(例如/ba/和/ka/)刺激的差异,但听觉系统仍存在时间延迟[68]。
2.2.3 利用N400评估语义理解能力
上述研究主要强调了语音感知与识别,但听觉康复中更为深层次的是语义理解,这也是研究人员关注的一个热点。儿童行为学问卷评估主要依赖于父母对其听觉行为的评价,测试结果极易受父母期望值过高的影响。且需儿童配合的言语评估方法设有最低适用年龄,然而以ERP作为评估手段,不仅不存在年龄限制,而且能直接反映语义识别的潜在过程。已有研究证明婴儿能够在6个月的时候暂时建立词汇和对象之间的语义关系,但是这种效果第二天就消失了,直到第二年才能建立有效的语义关系[71]。
目前还有研究检验了N400成分在语义处理上的响应。最初,N400在语义处理上的响应是在一名6岁儿童上被发现和定义的[72]。随后,研究人员将被试扩展为CI组、助听器组和正常对照组三类,研究了5到7岁儿童的语义理解能力,采用视听联合刺激的方式,词汇在听觉通道呈现,图片在视觉通道呈现,提出类别间和类别内两种词汇-图片的不匹配,三组均出现N400,但并未检验三组是否存在统计学差异[73]。有研究人员近期在上述实验的基础上,对38名开机年龄在9至50个月的语前聋CI儿童,采用呈现了词汇-图片匹配和不匹配两大类刺激的实验范式,并分别在CI植入后12、18、24月记录了被试脑电图,发现在词汇-图片不匹配时语言测试成绩低于标准范围的儿童几乎没有表现出N400效应,但语言测试成绩达到标准及以上的儿童表现出了逐渐发展的N400[74]。因此可以推断N400有可能可以作为语义理解的生物标记物,但目前相关研究尚少,无法得出确切结论。
3 脑电应用于CI术后康复评估的挑战与展望
脑电技术已经在听觉和语言的相关研究中得到了大量的应用[53,58],对分析听觉中枢发育、神经可塑性等也提供了极有利的帮助。作为一种非侵入式的技术,脑电同CI的兼容性也使其有望成为CI术后评估最为合适的手段。但是将脑电应用于临床仍存在挑战,一是由于听觉诱发电位是一种微弱的信号,实验过程中过多动作引起的肌电伪迹会对特征波形产生干扰;二是将脑电技术用于CI用户听力康复评估时,脑电记录中包含了CI产生的电声伪迹,但是特殊的刺激选择或实验设置会一定程度减弱EEG数据中与CI相关的电声伪迹。一种方法是使用非常短的刺激(小于50 ms),将CI伪迹限制在早期时间窗口,最大程度减少对皮层目标特征的干扰[75],但大部分实验刺激材料很少小于50 ms;另一种方法是由于CI伪迹在两种条件下保持恒定,选择需要减去两种条件下ERP的实验范式,例如MMN实验范式,但实验中可能还存在非CI产生的生物或环境噪声。大部分研究会使用独立成分分析(ICA)观察各个独立成分的头皮分布,将认为是CI伪迹的独立成分手动去除,但该过程不仅耗时且需要专业知识,因此高效提取有效特征是脑电技术走向临床CI用户听觉康复客观评估的一大难点和挑战。
目前大部分相关研究局限于横向,但是植入后个体及组间的听觉康复发展轨迹的纵向研究更具研究价值,这样才可以建立ERP潜伏期与幅值年龄层级化的临床标准,将脑电技术真正应用于临床术后评估。此外,声学实验需要保证刺激材料的多样性,才能尽可能接近日常听力交流的需要。言语矫正是听障儿童听力康复的核心,听觉理解是听觉康复过程最重要的目标。目前大部分研究强调了语音感知与识别,在未来的实验研究中,可以将脑电实验与其他技术相结合并应用到言语识别更深层次,为CI用户的听觉康复评估提供更多可能,例如,功能性近红外技术(fNIRs)具有空间分辨率高的特点,而EEG具有时间分辨率高的特点,如果将EEG与fNIRs两项技术相融合,则可以取长补短,将高时间分辨率和高空间分辨率相融合,从而提高源定位的准确性。同样具有高空间分辨率特点的技术还有脑磁图(MEG),它可以用来探测复杂CI病例听觉皮层功能区的病变情况,且由于脑磁信号具有在传导过程中介质影响小,可以对信号进行源定位等特点,与EEG结合时或可探测复杂CI病例的内在机理。
4 结语
本文主要综述了人工耳蜗植入术后主观和客观评估方法的相关方法及研究成果,目前临床主观评估材料被证明具有良好的可信度,但由于易受诸多因素的存在而影响结果,不受被试主观意识影响的客观评估则能够为术后人工耳蜗调机提供更为准确的参考依据。越来越多的研究证明,非侵入式脑电技术为听觉和言语康复评估提供了有力的工具和手段。高效提取脑电有效特征、脑电多模态融合将进一步提高CI听觉康复客观评估的准确性和实用性。