听配能的神经生理学基础*
2019-07-23张敏CatherinePalmer阮清伟段吉茸保志军
张敏 Catherine V. Palmer 阮清伟 段吉茸 保志军
全面评价听觉功能,不仅要测量个体听见了多少,即可听度(显性维度),还要关注其如何听,即聆听策略(隐性维度),前者由常规的听觉任务表现来反映,比如言语理解度和阈值等;而后者则由听配能(listening effort)的调控来反映。听配能是认知听力学领域的一个重要概念,是认知心理学中广义配能(effort)的一种特殊形式,特指在完成听觉任务以达到语言理解的过程中,由听者主观支配使用的各种形式的资源,包括躯体行动资源、认知资源和情绪资源;换言之,指聆听者从自身有限的认知资源中分配给听觉任务的那部分精力和能量。
听者花费听配能以取得一定的言语理解度,不同个体在达到同样的言语理解度时投入的听配能可能会不同,这说明个体“听”的能力不能仅依靠某一个维度来衡量。目前已知听配能是一种综合的、特殊的认知资源,包括听觉注意、听觉记忆和听觉执行功能,然而,它的认知神经生理学基础尚不明了。越来越多的研究表明,主观配能(effort)调控行为由前扣带回(anterior cingulate cortex,ACC)为中心的边缘系统驱动和控制。前扣带回实时监控任务难度和任务所需的配能投入,并将该信息转化为成本效益净值来指导行动或策略的选择。本文将介绍配能调控相关的神经生理理论模型及其实验数据支持,并探讨其对未来研究听障人士听配能调控的中枢神经网络机制的指导意义。
1 配能(effort)的神经解剖生理基础
1.1海马学说 Pirbrand等提出,配能的主要神经解剖学结构是控制注意力的三个神经系统之一。该模型中,有一个以海马为中心的边缘系统环路(包括扣带回、隔核、后下丘脑和丘脑前核)负责配能的调控,由它制定原则去协调唤醒(杏仁核回路)和激活(基底神经节回路)的活动,参与解决问题和做出决策。海马回路和配能的因果关系通过研究海马部位损伤的动物在辨别反转任务中的异常习惯化,以及使用微电极和宏电极精准电刺激海马回路来获得。Bland等(1972)通过记录自由运动大鼠的颅内和头皮脑电图发现,海马回的θ节律电活动(4~8 Hz)几乎只出现在大鼠自发运动的情况下。海马神经元的长时程特征表明在海马激活之前有一段长时间的信息总和,据此,Pirbrand等提出海马是探测和分析输入信号间误差(失匹配)评估机制的一个重要部分。
1.2前扣带回(ACC)学说 神经生理学和神经影像学研究发现,位于额叶前内侧表面并与胼胝体相邻的前扣带回皮质可能才是配能调控的主要区域。前扣带回与前额叶和皮质下边缘结构均有联系[1]。学者们认为这一区域编码与配能有关的信息[2, 3]。
1.2.1应答冲突监测机制 有学者提出,前扣带回是参与配能投入的决策和认知控制的神经生物学基础[4]。前扣带回参与了应答冲突监测,并将其作为一个调节信号传递给其他执行区域,如:背外侧前额叶皮层,决定是否需要加强或减少执行注意力,以及是否需要调用更多的配能[5]。神经影像学研究为这一假说提供了支持,Carter等[6]观察到受试者因任务激发产生应答竞争时,前扣带回血流量增加;Braver等[7]发现,在加速任务中,当错误的应答和迟来的正确应答之间存在冲突时,前扣带回血流量增加;相反,在完成简单的听觉分辨任务、不涉及做决策的情况下,前扣带回的血流量减少。因此,前扣带回的应答冲突监控理论的重点在于启动机制,以促进认知控制的部署,随着应答冲突的增加,自上而下的控制强度也增加。
1.2.2强化学习机制 Brown等[8]通过计算模型发现,前扣带回可能并不检测冲突或误差本身,而是在持续暴露于任务环境条件下自适应地预测产生误差的可能性;为了证明这一观点,他们分别改变应答冲突和误差概率,让受试者在看到“变换”信号后,用左右反向按钮作答,变换信号延迟(change-signal delay,CSD)代表了不同水平的误差概率,短和长的延迟分别对应于4%的低误差概率条件和50%的高误差概率条件;受试者对这两种条件并不知情,但它们与两种颜色关联,随着时间的推移,受试者能够通过负强化的学习找到颜色的规律,并通过强化学习自适应的调整他们的行为。一个关键的发现是,由误差相关负性(ERN/Ne)和功能磁共振成像反映的前扣带回活动度在50%误差概率条件下明显高于4%误差概率条件,无论有没有应答冲突;此结果表明,与误差概率成比例的前扣带回活动度决定了配能的投入量。
1.2.3认知控制机制 另一个将前扣带回与主观配能调控活动相关联的理论是基于公认的前扣带回基本神经功能以及对无动性缄默症的临床研究。无动性缄默症是一种前扣带回受损后出现的运动能力保留但自主言语和躯体动作显著减少的神经病理症状[9]。该理论提出,在目标驱动的运动产生之前,除了决定相关肌肉收缩模式的认知控制之外,还有额外的认知控制;这部分认知过程主要来自前扣带回对骨骼和内脏运动系统、应答选择、短期记忆提取的直接控制,这有助于确定是否需要实施动作以及什么是正确的响应模式。
1.2.4应答选择机制 还有一些研究者将前扣带回与前运动功能相关联,认为它在应答选择中扮演积极作用。在Turken等[10]的实验中,1名从右大脑半球前扣带回的中央至尾部延伸的局灶性ACC病变患者与6名年龄匹配的正常对照受试者参加了三项研究,旨在研究注意力和运动控制,包括:注意力选择性和分配任务、Stroop反应冲突任务和应答准备任务;实验中需要受试者用肢体行动或言语应答,与对照组相比,当需要肢体行动应答时,ACC病变患者在所有任务条件下都表现不佳,但她言语应答的表现与正常对照受试者相当。该研究显示,任务表现水平取决于应答模式,双侧前扣带回尾部的完整性是运动反应控制所必需的。
上述几个主流理论提示,前扣带回和配能调控之间的相关性可能由冲突监控机制、认知控制机制、强化学习机制和应答选择机制所介导,这些过程都需要花费配能,但是关于配能本身的动机机制仍然很模糊。关于误差监控和强化学习机制,越来越多的病变研究和神经生理学研究得到不一致甚至矛盾的结果[11],因为人类前扣带回病变通常导致普遍功能放缓和应答变异性的增加,而不是控制受限或缺乏从反馈中学习的能力。
1.3分层强化学习理论(hierarchical reinforcement learning theory) 由Holroyd等[12]提出的分层强化学习理论整合了之前关于前扣带回功能的各种学说,强调前扣带回实际上并非参与决策和认知控制的部署,而是激励配能的调控。在该分层强化学习(hierarchical reinforcement learning,HRL)理论中,人的行为是分层组织的,相互关联的状态和行动被组合在一起形成更高级别的行为选项,每个选项包括了达到子目标所需的一系列行动,而最终目标就是这些子目标的集合。
强化学习(即:优于预期的结果得到加强)可并行发生在同层和跨层间,使最终目标得以高效地实现。将这些认知概念映射到大脑区域,前扣带回和基底神经节在不同层级的结构中并列执行,前扣带回负责选择、维护和学习高层级选项,而基底神经节负责处理低层级的动作。前扣带回将单个行动值整合成一个总任务值,并根据该值决定是否维持最佳任务表现。前扣带回通过关联和比较预测值(通过腹侧纹状体对长期回报的估算)与其它备选项来最终确定最佳选项,并对其维护(任务表现监控);同时,前扣带回基于预测值来决定执行策略的配能水平。高预测值对应于由前扣带回引导的背外侧前额叶皮层(dorsal lateral prefrontal cortex,DLPFC)所施加的自上而下控制,背外侧前额叶皮层和背侧纹状体中的运动结构通过发信号给基底节来执行这些选项。上述分层强化学习的行为和神经实现方案与举例见图1。分层强化学习理论结合了先前理论的关键要素,简化了学习过程。此外,前扣带回的选项确定、维护、成本-效益整合等核心功能也符合前扣带回病变引起的配能失用和配能感受丧失的神经生理和神经心理学证据。
2 配能最优分配的神经生理学实验依据
2.1前扣带回神经活动为主导 研究表明,前扣带回对配能的最优分配是必要的。永久性或短暂性前扣带回病变的实验动物不能最大限度地利用高努力高回报选项,并且无法策略性地投入配能以获得最大收益[13~15]。在一项成本收益实验中,实验者向大鼠前扣带回注射6-羟基多巴胺或喹啉酸[16],大鼠可以选择越过障碍获得高奖励,或无需越过障碍获得低奖励。结果表明,前扣带回完整的大鼠优先选择越过障碍获得高奖励,而前扣带回受损的大鼠则倾向于无障碍低回报的选项。这说明前扣带回对评估特定奖励所需的配能起到重要作用。
Kennerley[14]通过选择性损伤大黄猴前扣带回发现,ACC在强化行为中的关键作用既不是检测误差,也不是纠正误差,而是根据已完成的行动和结果指导决策,作者发现,ACC损伤的猴子在试验中没有比对照组猴子犯更多错误,然而,ACC受损的猴子明显减少重复被奖励的行为,并且需要更长的时间才能摸索出最佳行动策略以获得奖励。由此表明,前扣带回对维持受奖励行为的选择至关重要。
图1 分层强化学习机制的实现方案与举例(引用自Holroyd和Yeung[12]) 图左:每个组成部分相关联的抽象功能。任务选择机制位于强化学习的标准行动-批判体系结构的顶端。它根据外部环境状态来决定执行的任务,并定义成功完成任务的目标状态。所选择的行动策略通过两个交互模块实现:行动体系中的高级模块通过偏置低级模块来实现任务集,该低级模块根据给定的环境状态执行与策略匹配的行动。与此并列,批评体系中的高级模块将任务的终止状态与子目标相关联,向低级模块提供准奖励和情境信息,该低级模块评估向任务终止状态的行动进展。批判体系输出一个与平均奖励相关的缓慢变化的信号,和一个代表事件比预期更好或更坏的快速奖励预测误差信号。置于顶端的选择机制利用这些信号以及配能感受信息(未标出),学习任务选项的价值、选择并维持所选择执行的任务。图中:分层强化学习的神经结构。图右:一个说明性的例子。当你正准备做晚餐时,发现缺少一种关键调料:盐。你大脑的前扣带回选择并计划了一系列行动选项:驱车去附近的超市,买盐,回家(而不是打电话点外卖)。背外侧前额叶(DLPFC)管理与每个选项相关的策略,包括通过偏置背侧纹状体(dorsal striatam,DS)和运动中枢中的神经活动,实现“驱车去超市”所需的一系列行动步骤,比如绿灯时加速。值得注意的是,背外侧前额叶(DLPFC)和背侧纹状体(DS)一起工作来执行策略,但是DLPFC输入对于非常规的任务尤其重要,比如在国外道路的错误侧行驶。同时,眶额皮质(OFC)编码任务的终止状态———安全到达市场。腹侧纹状体(ventral striatum,VS)利用这些信息来确定行动是否与目标一致。最后,多巴胺系统告知前扣带回,任务的当前状态是否与高预测值相符(紧张性多巴胺),还是事件突然好于或比预测差(相位性多巴胺)。因此,如果背外侧前额叶暂时失去对任务集的控制,使得运动系统转向错误的动作,批评体系可以通过降低多巴胺水平来警告前扣带回,该动作与目标不一致,从而促进背外侧前额叶(DLPFC)激活适当的任务集并纠正错误
Hillman等[17]通过记录自由运动大鼠的前扣带回神经元发现,ACC负责编码任务奖励和配能消耗的最优比例,即成本效益净值;人类的影像学研究同样表明,基于配能的成本效益净值越大,前扣带回活动度越高[18~20]。Croxson等[20]请年轻受试者完成一系列难度不等的任务并同时扫描他们的大脑,每项任务分别对应一个低的和高的奖励,总共形成8个成本效益净值;实验者选取岛叶/后眶额皮质(orbitofrontal cortex,OFT)、腹侧纹状体、多巴胺能中脑和前扣带回,观察其在受试者完成任务以获得奖励的过程中fMRI血氧水平依赖性(blood oxygen level dependent,BOLD)信号变化;结果显示,虽然腹侧纹状体、中脑和ACC均受到成本效益净值的调制,但只有ACC在受试者通过支出配能得到奖励的整个过程都保持高水平活动,表明ACC对持续计算成本效益净值和保持最佳目标起重要作用。在随后的行为确认实验中,受试者始终选择成本效益净值高的任务选项,这与fMRI得到的结果一致;可见,Croxson[20]和Kennerley[14]的研究均支持ACC在分层强化学习理论中具有选择和维护最佳目标的功能[12]。
临床上,前扣带回结构或功能的改变与人类对配能的调控和感知障碍相关。Devinsky等[9]观察到,前扣带回活动亢进的患者常表现出抽搐和强迫行为,有时甚至是精神变态或反社会行为。相反,因手术或梗死等导致前扣带回活动减少可产生自我意识减弱、抑郁、运动启动受损、对疼痛的反应减少和异常的社会行为。Naccache等[21]对左内侧额叶皮质病变包括左ACC受损的一例患者和对照组进行Stroop范式的病例研究,作者最初预期该患者可能会出现控制障碍,但出乎意料的是,在不同模式的Stroop任务中患者的控制能力被惊人地保留;且令他们意外的是,患者在这些任务中完全无法体验对照组自述的配能消耗的主观感受。对配能感知的缺失不能简单地解释为情景记忆障碍或对任务的错误理解,因为当患者回忆先前试验中刺激的一致性时,其准确度高于随机猜测水平。故Naccache据此推测,这种缺失可能与左内侧额叶皮质(包括ACC)产生的错误躯体信号(例如心率、瞳孔扩张、皮肤电导)有关。来自临床神经心理学和脑成像研究的数据均指出额叶皮质系统对躯体信号的产生以及躯体反应与认知评价的耦合至关重要[22]。
在另一个Stroop实验中,Naccache等[21]增加了Stroop任务的持续时间以记录皮肤电导反应。正常对照组表现出事件相关的皮肤电导反应(skin conductance responses,SCRs),其反应幅度与支出的配能显著相关。相反,患者虽然在Stroop任务表现上与对照组相当,但皮肤电导反应没有发生变化。该患者并不是不能产生皮肤电导反应,因为在接受包含情绪的图片刺激时,患者仍然能够产生明显的皮肤电导反应并报告情感感受。对该患者系统性的实验结果表明,认知控制能力的保留和配能主观感受的缺失在左侧前扣带回受损的患者中存在分离,这种分离可能是由于大脑无法将实际的配能消耗转化成生理情感信号,从而形成有意识的配能感受。认知控制能力的保留可能是幸存的右侧ACC作用结果,因为其事件相关电位(event-related potentials,ERP)仍然随配能的支出而变化。
2.2多巴胺生理调控为主导 研究表明,多巴胺在调解与配能有关的行为中扮演重要角色[12, 13, 16, 23]。中脑多巴胺系统通过多巴胺神经元活动携带并向前扣带回的锥体细胞传输预测奖励误差信号(阳性误差表示比预期奖励高,阴性误差表示比预期奖励低)[23]。由多巴胺神经元放电引起的瞬时或相位性多巴胺释放编码阳性误差,多巴胺神经元放电的短暂停顿或紧张性多巴胺释放编码阴性误差。当受试者在完成认知任务中发生错误时,多巴胺的变化(下降)会引发事件相关电位(ERP),称为错误相关负电位(error-related negativity,ERN)。ERN不仅是一个错误或冲突检测机制,其相对幅度与学习避免不适应反应有关。Frank等[24]支持这一假说。他们选取了对多巴胺水平敏感的强化学习任务范式,发现那些倾向于从决策的负面后果学习的受试者,其错误相关负电位幅度较大。与此相反,紧张性多巴胺释放被认为是通过编码一段时间内的平均回报概率,来激励配能支出行为,因为多巴胺引起的ACC病变严重削弱了配能支出行为[2, 16]。因此,在分层强化学习(HRL)理论框架内,相位性多巴胺信号与最优选项的选择相关联,而紧张性多巴胺信号与最优选项的维护相关联。由于多巴胺在配能支出行为中的重要作用,一些研究者提出了以腹侧纹状体为中心的配能网络,腹侧纹状体是中脑多巴胺系统的作用目标[25]。Schmidt等[26]采用功能磁共振成像研究腹侧纹状体的激活与认知和精神配能支出的相关性,提出腹侧纹状体是驱动认知和运动系统的共同动机中枢。然而,目前尚没有证据表明前扣带回在基于配能的成本效益选项决策和维护方面优于腹侧纹状体。
3 听配能的中枢神经网络机制
在噪声环境下听清楚言语是十分耗能的过程。目前还没有专门解释听配能的神经生理和心理模型,因而国内外关于听配能神经网络机制的研究尚未开展。但由于言语理解是认知任务的一种,故而听配能可被视为配能的特殊分支,在较大程度上可与其共享神经生物机制。越来越多的证据表明,配能的调控行为是由以前扣带皮层为中心的边缘系统驱动和控制的。ACC可以监控误差或冲突作为任务难度和/或所需配能的指标,将其转化为成本效益分析来指导行动或策略选择,然后把一段时间内的任务选择情境、预测结果和实际结果整合,并确定哪些行动值得实施和维护以保障实现目标。前扣带回与中脑多巴胺系统紧密联系,并接收来自腹侧纹状体的相位性和紧张性多巴胺携带的奖赏预测误差(reward prediction error,RPE)信号。
虽然文献显示前扣带回在激励配能支出行为中有重要贡献,但是这些理论是否可以用来解释由周围感觉障碍(例如听力损失)引起的配能调控行为改变尚不清楚,因为解剖上尚未发现有感觉神经直接投射到前扣带回,但是可以间接地通过高级感知路径或额叶到达[27]。神经解剖学证据表明,与正常听力人群相比,听力损失患者采用不同的大脑激活过程以保持相当水平的语音理解度[28],他们表现出更广泛的皮层激活模式,涉及与工作记忆和执行功能相关的皮层区域,反映了依赖情境(即自上而下信号处理)补偿听声困难的策略[29]。从脑干到听觉皮层,乃至跨感觉模态的神经重组经常出现在外周感觉器官受损的情况下,如耳蜗损伤[30]。因为外界的声音信号并没有被这些受损的感觉神经元和神经带到大脑,所以大脑的听觉部分由于缺乏刺激导致功能废用。当听者动用大脑认知资源弥补听觉缺失时,分层强化学习模型中边缘系统的各个结构可能都会参与,这需要采用头皮诱发电位或脑成像技术来证实,但迄今为止尚缺乏系统的实验研究。
今后的研究需要在配能神经理论框架和特定听觉感觉通路之间建立一个桥梁,以回答以下科学问题:大脑配能网络中是哪些结构负责检测周围听觉输入或响应之间的误差或冲突?通过花费听配能得到回报的短期和长期统计概率是如何计算出来以生成有效的聆听技巧的?在皮层和皮层下听觉区域及大脑额叶区域的连接中,配能调控的中介机制是什么?长期听力受损引起的压力和持续的听觉疲劳是否会对多巴胺系统的功能产生不利影响,从而削弱学习和调动配能的动机?大脑配能网络在何种程度上对补偿听力下降有多大程度的灵活性?研究这些问题,将有助于了解听力下降背后听觉认知补偿的神经和行为机制,为最终制订更有针对性的个体听力康复方案提供科学依据,不但让听障患者听得见,听的清,还要让他们学会高效地管理听配能,避免听觉疲劳,使聆听变得有效和轻松愉悦。