APP下载

听觉距离感知的主观评价及脑电事件相关电位实验研究

2025-01-22杜诗沁林志斌

南京大学学报(自然科学版) 2025年1期

关键词:听觉距离感知,听觉主观评价,听觉事件相关电位,声源定位

中图分类号:O429 文献标志码:A

听觉距离感知主观评价对于深入理解人类听觉系统的运作机制至关重要. 该评价揭示了个体在听觉距离感知方面的差异,并评估不同环境因素对感知能力的影响. 这些发现对于城市规划和建筑设计具有重要的参考价值,能促进更为先进的音频系统的开发,或准确评估新提出的声音距离重构算法.

随着立体声技术的不断进步,研究者可以借助耳机或扬声器复现不同的声学场景,并开展多样化的主观听音实验[1]. 虚拟听觉技术在精确操控直达声场与混响声场的同时,能实现对房间环境声音的高度自然模拟[2]. 在进行相关主观评价实验时,头部相关脉冲响应(Head ⁃ Related Im⁃pulse Responses,HRIRs) [3]和涉及环境因素的双耳房间脉冲响应(Binaural Room Impulse Re⁃sponses,BRIRs)[4-5]是虚拟听音研究最常见的技术手段. 一些研究者提出了创新性算法来重构声音距离,并通过主观听音实验来验证这些算法的有效性. 除了通过耳机重构的虚拟声外,使用扬声器播放的声音也是一种普遍的做法. 在评价过程中,为了模拟不同的声源距离,扬声器被同时摆放在多个预定位置[6],或借助电动滑轨系统来实现在同一实验中对不同距离点的连续变换[7].

在进行听觉距离感知的主观实验时,选择的声音刺激通常会根据实验的具体目标而有所不同. 在单纯的距离听音实验中,可以直接使用噪声[5-6]或点击声[5]作为刺激. 当选择不同的刺激时,实验结果存在一定的差异. 以语音作为刺激的实验也很常见. 语音实验研究可以引入更多的变量,如不同语言[8]、对说话者和环境的熟悉程度[4,9]、说话力度[10]等,以探究不同因素对听觉距离感知的影响. 同样,可以针对音乐的不同属性进行相应的听音实验,也可以直接选择音乐信号进行距离重构算法评价或其他主观评价.

听觉距离感知主观评价的实验方法大致分四类:识别任务、辨别任务、绝对量度任务、等分任务. 在听觉距离感知的主观评价中,识别任务相对简单,被试只需选择所感知的距离[11],辨别任务要求被试判断两个连续呈现的刺激是否存在差异. 在听觉距离感知领域,最小听觉距离分辨(Minimum Audible Distance Discrimination,MADD)任务十分常见[6],还可以计算不同距离和方向处的可辨差(Just Noticeable Difference,JND)[7]. 绝对量度任务要求被试对单一刺激进行量化评估,如强度或大小,听觉距离感知的绝对量度任务可以通过多种方式记录数据,例如在触摸屏上使用视觉模拟量表(Visual Analog Scales,VASs)[3]或垂直滑块[4]来表示感知到的距离,也可以直接使用数字记录[12]的方法获得结果. 在听觉距离等分任务中,A,B,C 三种声音在不同距离条件下呈现,B 被放置于A 和C 之间,被试需要判断B 更接近A 还是C[5-6].

在认知科学和心理学领域的研究中,EEG(Electroencephalography)技术是一项广泛应用的神经生理测量工具,它通过安置在头皮上的电极,检测并记录大脑的电活动. 听觉诱发电位(Audi⁃tory Evoked Potentials,AEPs)是由听觉刺激呈现而诱发的大脑反应,而大脑反应通常不仅仅反映由感官刺激引起的活动,因此被称为事件相关电位(Event⁃Related Potential,ERP). ERPs 是与特定事件同步的大脑反应,该事件可能发生于单一感觉模态内,或跨越多个模态,可以是一个物理刺激、一系列刺激的变化、一个缺失的刺激,或者被指定为“目标”刺激的刺激[13]. 目前,ERP 技术被广泛运用于听觉方位定位[14-16]、动态声源定位[17-18]等听觉定位领域.

在听觉距离感知的ERP 实验研究中,有研究者采用了“真实环境”和“虚拟环境”(BRIRs),以模拟2 m( 近偏差)、4 m( 标准)和8 m( 远偏差)三种不同的声源距离. 此外,考虑了“自然”和“匹配”两种不同的响度条件. 通过将位于FCz,Cz,C1,C2,FC1,FC2 六个电极位置的信号进行平均处理,研究者着重分析了MMN,P3a 和P3b 三种ERP 成分的变化情况[19]. 值得注意的是,与声音定位的方位研究相比,针对听觉距离感知的研究较为有限.

本研究采用主观评价(包括识别任务和绝对量度任务)和ERP 分析技术(考虑无注意力状态和引入注意力状态),通过行为学实验和EEG 生理测量,探究了听觉距离感知的现象及其潜在机制. 本研究旨在揭示听觉距离感知的心理物理关系、影响因素和听觉距离感知背后的认知和神经机制,以及探究个体差异、注意力状态和声音特性对潜在机制的影响.

1方法

1. 1实验

1主观评价识别任务 主观评价识别任务在南京大学声学研究所的试听实验室进行,其建筑特性如下:体积为123. 75 m3,高3. 0 m,长7. 5 m,宽5. 5 m,穿孔饰面板,平均混响时间约为0. 3 s. 采用10 只扬声器,经测量,它们的频响曲线相似,实验开始前均通过声压级校准. 实验中使用的声卡型号为Antelope Audio Orion32,功放型号为Anty PA 3002. 试听人员共30 人,其中女19 人,男11 人,均为在校学生,年龄19~27岁,平均年龄23 岁. 其中,有6人曾参与其他类型的听音实验,但所有人员均未有过距离相关的听音经验. 刺激是频率为20~20000 Hz 的宽带粉红噪声,采样率为44. 1 kHz,持续时间为3 s,在1 m 距离处A 计权声压级为65 dB.

在识别实验中,选择0. 5~5 m 的距离区间.将10只扬声器在被试坐下时的双耳高度处摆放成一条直线,两两间隔为0. 5 m,地面处标注编号(1~10)以进行视觉指引,具体实验系统如图1 所示. 在整个实验过程中,被试需集中注意力识别音频的距离,避免大幅度地移动头部或身体.

在正式实验开始前,被试首先进行一个训练过程. 在训练中,声源刺激从距被试最远的位置处开始播放,并逐步向被试移动,从远到近,再从近到远,重复两次. 完成训练后,主试将随机播放三只扬声器的声音,被试需口头回答扬声器的位置,即在近区(编号1~3)、中区(编号4~7)或远区(编号8~10). 回答正确则完成训练,否则将重复训练过程. 训练完成后,首先进行三条不计入数据统计的听音,帮助被试熟悉正式实验的过程. 在正式实验中,声源刺激将随机播放. 每种距离的声源刺激重复10 次,总计100 次听音. 正式实验中的每个音频时长为3 s. 每次播放完一个刺激后,被试有5 s 的时间填写他们感知到的扬声器编号(1~10). 每完成10 次听音,被试可以休息一次. 被试若觉得没有出现听觉疲劳的现象,可示意跳过休息,进行下一组听音. 正式实验的总时长约为20 min.

1. 2 实验2:主观评价绝对量度任务 主观评价绝对量度任务也在南京大学声学研究所的试听实验室中进行. 使用识别实验中的一只扬声器,通过借助电动滑轨系统,实现对不同距离点的连续变换. 声卡型号为Yamaha Steinberg UR242,功放型号为Anty PA 3002. 试听人员共15 人,其中女11 人,男4 人. 他们均参与了之前的识别实验,并且识别实验中的数据符合以下条件:幂函数拟合方差R2 大于0. 85;在2 m 内识别准确率超过50%. 刺激选择与识别任务相同.

在绝对量度实验中,根据识别实验的结果,选择准确率较高的0. 5~2 m 的距离区间. 实验中主试借助电动滑轨将扬声器移动至不同的距离. 只有一只扬声器,所以在扬声器和被试之间添加帘幕以防止视觉影响. 具体实验系统如图2 所示.

绝对量度实验的训练过程相对简单. 主试在最远处(2 m)与最近处(0. 5 m)分别播放三次刺激,以告知被试本次实验涉及的距离区间. 在0. 5~2 m 的距离区间内,每隔0. 2 m 设置一处距离,以随机顺序播放. 在正式实验中,共进行76 次听音. 每听完一个刺激,被试记录感知到的扬声器距离(以m 为单位,保留两位小数,末端保留至双数). 每个音频时长3 s,每组包含10 次听音. 被试在每组实验结束后,自行选择休息时间. 实验时长约为20 min.

1. 3实验3:无注意力状态ERP 实验 无注意力状态ERP实验在南京大学声学研究所的试听实验室进行. 使用与先前实验相似的三只扬声器.声卡型号为Rstech2232,功放型号为Anty PA3002. 脑电帽使用Emotiv 公司的EPOC Flex(32通道),采样率为128 Hz,通道定位如图3 所示(10~20 系统). 试听人员共15 人,其中,11 人参与前期两次实验(女8 人、男3 人),1 人只参与识别实验(女),1 人参与前期两次实验的预实验(女),2 人是本次新招募的人员(均为男性). 刺激时长为200 ms,其余设置与主观评价任务相同.

实验开始前,主试协助被试正确佩戴脑电帽,并为每个电极注入生理盐水来降低阻抗和确保信号采集的质量. ERP 实验中使用oddball 实验范式,标准刺激的距离为1 m,近偏差刺激的距离为0. 5 m,远偏差刺激的距离设为2 m. 为了防止视觉影响,使用帘幕隔离被试和实验系统. 实验系统如图4 所示,包括扬声器的位置和被试的位置.实验中采用的刺激为持续200 ms 的粉红噪声,每次刺激间的起始间隔设为1 s,即刺激呈现的间隔时间(Interstimulus Interval,ISI)为800 ms.

每次实验随机播放500 次刺激,其中标准刺激出现的概率为0. 84 (即420 次),远、近偏差刺激出现的概率各为0. 08( 即各40次). 此外,每次偏差刺激出现之前,至少存在三次标准刺激. 实验中被试观看无声电影并被要求不要注意声音,因此本次实验被称为被动实验. 此外,实验中被试被要求放松并尽量保持静止,以防止肌电等伪迹对实验结果造成负面影响. 数据记录采用EmotivPRO 软件. 脑电数据的处理分析通过MATLAB 中的工具箱EEGLAB[20]进行.

1. 4 实验4:引入注意力状态ERP 实验 引入注意力状态ERP 实验同样在南京大学声学研究所的试听室中进行. 实验设备、试听人员、刺激均与无注意力状态ERP 实验相同. 该实验在上述忽视声音刺激的实验之后进行. 在上述实验完成后,被试短暂休息,期间主试对脑电帽中的电极进行补充生理盐水的操作,以确保数据采集质量.

实验刺激的相关设置与上述实验相同,两次ERP 实验只存在是否引入注意力的差异. 本次实验中被试需要关注声音刺激并辨别偏差刺激. 主试会给被试提供一个键盘,在听见偏差刺激后,被试需要通过按键作出响应. 在听见近偏差刺激时按数字键“1”,在听见远偏差刺激时按数字键“2”,在听见标准刺激时不作出响应. 此外,被试同样被要求放松并尽量保持静止,以防止肌电等伪迹对实验造成负面影响. 本实验中被试需要关注声音刺激并对偏差刺激作出响应,因此本次实验被称为主动实验.

2 实验结果和讨论

2. 1实验1:主观评价识别任务 图5 展示了不同距离条件下被试的感知结果. 图5a 为一位对听觉距离感知较为敏感的被试的结果(Sub 24),图5b 为一位对听觉距离感知较为不敏感的被试的结果(Sub 25). 横坐标为扬声器实际距离,纵坐标为被试感知到的扬声器编号对应的距离. 红色圆圈的大小表示被试在某一扬声器位置处感知到不同编号的次数的多少,圆圈越大,表示次数越多. 对角线上的圆圈表示被试正确感知到目标扬声器的编号(距离).

由图可见,图5a 的圆圈较大且集中,表明对于同一扬声器发出的声音,被试多次作出相同的反应,对听觉的距离感知较为敏感. 图5b 的圆圈较小且分散,表明被试在不同时间听到同一扬声器的声音时,感知到的距离不一致,对听觉的距离感知不敏锐. 此外,在近距离条件下,对角线上的圆圈更大,整体分布也更加集中于对角线上,说明被试听觉距离感知更为准确;在较远的距离条件下,圆圈较小且分散,说明被试难以正确感知到发声扬声器的距离.

在听觉距离感知较为敏感的被试的数据中,可以在远距离条件下观察到目标声源被近估的现象,这符合听觉距离感知的心理物理关系. 部分研究人员认为,这种近估现象可能预示着听觉边界的存在,代表了最大的感知距离[2,21]. 也有研究人员认为,低估更远的声源距离可能是由于适应性调整,可以在自然环境中为人们避让物体提供额外的“安全边际”[2,22].

箱线图如图6 所示. 图6a 为一位对听觉距离感知较为敏感的被试的结果(Sub 24),图6b 为一位对听觉距离感知较为不敏感的被试的结果(Sub 25). 横坐标为扬声器实际距离,纵坐标为被试感知到的扬声器编号的距离. 箱体上边缘线代表第75 百分位数(P75),下边缘线代表第25 百分位数(P25),中间线代表中位数(P50). 箱体外的上下缘表示去除离群值/极端值后的实验结果的最大值和最小值. 离群值定义为超出箱体1. 5 倍四分位距(Interquartile Range,IQR) (gt; P75 +1.5 倍箱体,或lt; P25 - 1.5 倍箱体)的数据点,图6 中的数字标注了这些离群值在数据中的具体位置. 这些数据在后续分析中被排除,以防止对总体结果的解释产生误导.

如图6 所示,对听觉距离感知较为敏感的被试的数据离群值较少. 此外,较为敏感的被试在近距离条件下去除离群值后,距离判断准确性逼近完全准确. 在远距离条件下,观察到与气泡图相似的更为不集中和近估的现象.

人类估计声源距离的能力通常比确定声源角度方向的能力要低得多,听者通常会显著地低估远处声源的距离,并且会高估距离1 m 以内的声源的距离[2]. 相关研究人员研究了物理声源距离和感知距离之间的心理物理关系,并证明了这种关系可以很好地近似为一个压缩幂函数,如下式所示[2,23]:

r= kra

其中,r ′是估计的感知距离,r 是声源的物理距离,k 和a 是幂函数的拟合参数.

图7展示了30 名被试幂函数拟合的参数与方差统计. 由图可见,本实验中大部分的拟合函数的指数a 处于0. 8~1,仅有一位被试的a 大于1;拟合常数值k 整体接近1,平均值略大于1;R² 整体较高,接近1. R² 越大,a和k 越接近1,表明拟合幂函数越接近y =x的直线,感知结果越准确. 与其他统计结果相比,本实验中被试感知的距离更接近实际扬声器的距离,这一现象可归因于本研究所设定的距离区间整体上不远,因此在远距离条件下的距离低估倾向没有表现得特别突出.

图8展示了30名被试平均的识别准确率图像,包括完全准确的结果、允许前后一只扬声器(前后0. 5m)偏差的结果和允许前后两只扬声器(前后1m)偏差的结果. 由图可见,除了0. 5 m处,被试感知完全准确的概率较低,并且随着源距离的增加,准确率快速下降. 在允许前后有轻微误差的情况下,准确率会明显升高. 当允许前后0. 5 m 的误差时,30 名被试平均的准确率在所有位置均超过75%;当允许前后1 m 的误差时,30名被试平均的准确率在所有位置均超过87%.

图9展示了不同编号的扬声器播放刺激时被试处感知到的声压级,其中,AM为中央传声器记录结果,AL和AR为仿真人工头记录的左耳和右耳结果. 由图可见,2m内前四只扬声器的声压级变化较为明显,直达声占据主导地位. 而较远的区域受房间混响的影响,整体声压级变化不是很大. 主观识别实验的准确率在2 m 后明显下降,表明人耳对声音距离的感知受到声强因素的强烈影响,而其他影响听觉距离感知的声学线索如直达声与混响声能量比(Direct⁃to⁃Reverberant Ra⁃tio,DRR)的变化,对于没有相关听音经验且对声源和环境均不熟悉的被试来说难以明显感知. 远处扬声器的声压级与中间区域扬声器的声压级相似,因此,被试倾向于认为远处扬声器与中间区域扬声器处于相似的距离处,从而出现了远处的声源距离被近估的现象.

2. 2 实验2:主观评价绝对量度任务 在绝对量度实验中,将被试数据进行幂函数拟合,并统计拟合参数与方差的结果,如图10所示. 本实验中拟合函数的指数a 的平均值为1. 06,标准差为0. 09,常数k 的平均值为0. 86,标准差为0. 068,即绝大多数的a接近1,k 略小于1,这说明在绝对量度实验中,感知到的距离整体没有显示出明显的高估、低估倾向(整体轻微近估). 该结果符合我们的预期,这是由于在绝对量度实验中,选择了在识别实验中较为准确和小规模的距离区间.

此外,k 的值在整体上小于1,即在1 m 处出现了听觉感知距离被近估的现象. 这可能与听音环境有着密切的关系,本次实验虽然在试听室中进行,存在一定的混响,但混响相对较小,混响时间约为0. 3 s. 由图9 可见,0. 5~1 m 的距离加倍的声压级衰减量接近6 dB,这类似于消声室自由场的情况. 这表明在较近的距离区间内,被试感知到的声音几乎由直达声主导,而直达声占比越大,DRR 越大,被试感觉声音越近.

与识别任务相比,绝对量度任务对被试来说更具挑战性,因此R² 相对较低. 其中一名被试的R² 只有0. 6 左右,小于本次实验中R² 的平均值减去一个标准差的数值. 后续分析中将这位被试的数据舍弃,其他被试的R² 均大于0. 7.

本研究将被试感知到的距离D 减去扬声器实际距离D0的值称为误差. 图11 展示了两位R²较大的被试(Sub 04,Sub 06)的误差,横坐标为实际扬声器的距离D0,纵坐标为误差D - D0. 由图可见,远距离的误差比近距离的误差更大,当声源距离增加到大约1 m及以上时,误差明显增大.图12 展示了14 名被试(去除Sub 01)感知距离与实际距离误差的平均值. 由图可见,平均误差几乎都小于0,这表明在几乎整个距离区间(0. 5~2 m)内均表现出了声源距离被低估的现象,即被试认为声音整体离自己较近. 在14 名被试76 个距离的1064 个数据中,误差大于0 的有267 个,二项检验结果的p = 2.2e-16,表明正数显著较少,即在此距离区间内,被试明显倾向于低估听觉距离. 这可能是因为本研究的听音环境混响相对较小(混响时间约为0. 3 s),直达声占据主导,DRR 较大,被试感觉声音较近. 也可能是由于实验处于安静环境,在没有其他声音干扰的情况下,被试更容易感觉到声音距离较近. 这与上述幂函数拟合结果(整体上k lt; 1)一致.

2. 3 实验3:无注意力状态ERP 实验 由于Sub07 的脑电数据质量较差,在后续分析中被舍弃.图13 是14 名被试32 电极平均的ERP 波形(负波向上). 横轴为时间,覆盖刺激前200 ms 至刺激后800 ms 的区间,纵轴表示脑电波的幅度.

如图13 所示,标准刺激(红线)的ERP 波形幅值明显较小,而近偏差刺激(黑线)与远偏差刺激(蓝线)的幅值明显增大. 偏差刺激的幅度的增大主要受对变化敏感的ERP 成分的影响,如MMN和N1. 由于MMN 和N1 均表现为负波,因此远、近偏差刺激的波形整体处于横轴的上方.

与近偏差刺激相比,尽管远偏差刺激的曲线趋势与近偏差刺激相似,但出现了更显著的负波增强的现象. 近偏差刺激的声音强度更大,应当表现为N1 的时延减小、幅度增大,但实验结果没有表现出近偏差刺激的ERP 波形在N1 时延处更负,这可能是由于认知负荷的影响. 虽然被试被要求忽略声音刺激,但无声电影也许并不能完全转移被试的注意力,安静的听音环境使得声音刺激较为突出. 此外,即使在无注意力条件下,被试可能仍能识别声源的大致位置,因为即便在不需有意识注意的情况下,大脑也可以自动处理声源的空间信息. 这种能力会受到认知负荷的影响,对于较难识别的声音(例如远处或声强较小的声音),个体的认知负荷会增加,自动化处理的效率可能下降,导致声源定位能力减弱. 对心理声学资源加工需求的增加可能导致ERP波形中的一些成分(如N1,N2或MMN)的幅度增大或时延增加,使ERP波形中出现更加显著的负波. 尽管没有具体案例直接表示认知负荷会导致ERP 的负波增强,但已经有研究显示,认知负荷的变化会影响脑电频谱活动,如导致不同波段功率的变化,这些变化可能与ERP 的某些成分相关.

如图13 所示,在约50 ms 处,无论是对标准刺激还是远、近偏差刺激,在ERP 波形中均可观察到一个轻微向下凹陷的正波,即P1.P1 主要反映了大脑对初始刺激的基本响应,与后续ERP 成分相比,刺激的偏差对P1 的影响相对较小. 虽然某些条件下的刺激特性变化,如强度和注意力状态,也可以影响其幅度.

由于生成器的不应期,刺激的重复会导致N1振幅减小. 对于标准刺激,100ms 左右向上的负波N1 的幅度明显小于偏差刺激. 对于远、近偏差刺激,在100 ms 处可以观察到一个向上的较大的负波N1. N1成分被认为是对声音变化敏感的听觉皮层反应[24-25],可由声强、频率或空间位置的变化引发,因此,它对远、近偏差刺激的出现尤为敏感. 虽然N1 成分是进行声音辨别的必要条件,也确实提供了“潜在可辨别”的信息到达听觉皮层的证明[30],但其出现本身并不直接等同于已经完成了声音的辨识过程[26-29].

随后,大约在200 ms 处,无论是对远偏差刺激还是近偏差刺激,在ERP波形中均可观察到一个比P1更明显的向下凹陷的正波P2,而由标准刺激引发的P2 波相对较弱. 在听觉领域,P2 波通常与基础的感知处理相关,反映对刺激特征的注意. P2 成分也会受到声音变化的影响,虽然不如MMN 明显,不是用来直接反映听觉偏差检测的主要ERP成分,但P2 的变化可能反映了对这些偏差的高级感知处理.

在听见刺激后的早期时间段内,本研究观察到P1⁃N1⁃P2复合体的存在,Martin et al[29-31]称这些为“ 声学变化复合体”(Acoustic Change Com⁃plex,ACC).

除此之外,对于远、近偏差刺激,ERP 波形还存在MMN 成分. MMN 是由重复(即标准)的听觉刺激或听觉刺激特征序列的不频繁变化(即偏差刺激)引起的[32-33],通常在N1 峰之后和P2期间的时延区域显示出负性增强,在刺激开始后的100~300 ms 达到峰值,可以看作是放大的N1 波、第二个负峰或P2波的衰减[13]. MMN 与行为上的刺激辨别紧密相关,其产生表明听觉皮层中的变化检测系统已经能区分标准与偏差刺激,可能表明个体具备分辨不同刺激的能力. 然而,MMN 的出现并不意味着个体已经有意识地感知到这些变化,这还需要激活注意力触发机制[13,34].

在近偏差刺激的ERP 波形中,大约在300ms处,还可观察到一个向下凹陷的正波P3a,此波可能表明刺激已被注意到( 即注意力的转换)[13,35-36]. 当被试忽略标准刺激和偏差刺激时,只有在偏差的幅度相当大的情况下,才能观测到P3a 成分. 因此,在标准刺激和远偏差刺激的ERP 波形中,没有出现P3a 成分.

2. 4实验4:引入注意力状态ERP 实验 表1 统计了行为学实验的相关结果. 其中,“NR” (NoResponse)表示应该响应而未响应的情况,“ER”(Erroneous Response)表示进行了错误的响应. 15名被试近偏差刺激和远偏差刺激的trials 各600次,标准刺激的trials 为6300 次.

统计结果表明,被试对近偏差刺激未进行响应的概率为0. 67%,进行错误响应(即选择了远)的概率为0. 83% ,总错误率为1. 50%. 其中,有一名被试因为不熟悉实验流程,对声音序列最开始的两次偏差刺激(均为近)没有进行任何响应,若考虑这一点,实际错误率应更低. 对于远偏差刺激,未进行响应的概率明显增高,达到了4. 33%,没有被试进行了错误响应,总错误率为4. 33%,明显高于在近距离条件下的总错误率.对于标准刺激,按照要求被试应当不进行响应,而被试错误进行了响应的概率为0. 10%.

ERP分析只考虑被试在2 s 内正确按下按键的偏差刺激数据与没有进行按键的标准刺激数据. 在进行脑电相关分析前,所有错误响应与未响应的trials 均被删除. 因此,最终进行脑电分析的数据包括近偏差刺激591次trials( 占原始近偏差刺激数据的98. 50%)、远偏差刺激574 次trials(占原始远偏差刺激数据的95. 67%)、标准刺激6294次trials( 占原始标准刺激数据的99. 90%).

反应时间定义为被试按下按键的响应时间与刺激发出的时间的差值. 表2 汇总了15 名被试对近偏差刺激与远偏差刺激的平均反应时间(avg )与中位数(med).

本研究对总体的反应时间进行了统计分析. 15 名被试对近偏差刺激的平均反应时间为0. 58 s,中位数为0. 55 s;对远偏差刺激的平均反应时间为0. 74 s,中位数为0. 69 s. 通过方差分析(Analysis of Variance,ANOVA)进行统计检验,发现被试对于远偏差刺激和近偏差刺激的反应时间存在显著差异( plt; 0.001),具体表现为被试对于远偏差刺激的反应时间显著长于对于近偏差刺激的反应时间. 这一结果验证了远偏差刺激引起的认知负荷较大的假设.

Sub 07 和Sub 09 的脑电数据因为质量较差,在后续分析中被舍弃. 图14 是13 名被试32 电极平均的ERP 波形(负波向上). 横轴表示时间,覆盖刺激前200 ms 至刺激后800 ms 的区间,纵轴表示脑电波的幅度.

如图14 所示,与无注意力状态的实验相同,标准刺激(红线)的ERP 波形幅值明显较小,而近偏差刺激(黑线)与远偏差刺激(蓝线)的ERP 波形幅值明显增大. 同样,与近偏差刺激相比,远偏差刺激产生的ERP 波形出现明显的负波增强的现象,这可能是由于认知负荷的增加.

N1( 100 ms)成分和MMN( 100~300 ms)成分与在无注意力状态的实验中有相似的存在. 但在引入注意力后,虽然远偏差刺激产生的ERP 波形整体处于横坐标的上方,但近偏差刺激产生的ERP 波形正波较为明显. 与无注意力状态的实验相比,远偏差刺激和近偏差刺激产生的P1( 50ms)幅值更大(更向下),近偏差刺激产生的P2(180~200 ms)幅值也更大,这反映更多的神经资源被分配到处理相关刺激上. 由于注意过程中会出现一些令人困惑的重叠成分如N1,P2,P3a 等,MMN 在引入注意力后的观测中并不显著.

对于近偏差刺激,在引入注意力状态的实验中也观察到了P3a (200~250 ms)成分. 但在引入注意力的条件下,对于远偏差刺激,P3a 也能被观测到. 只是与近偏差刺激相比,由于远偏差刺激的辨别难度更高,P3a 的时延较大,约为300~400 ms. P3a 的出现可能表明刺激被某些注意力触发机制注意到,也可能反映注意监控的重新定向[37],它并不一定表明“有意识”地感知到变化.

当注意力被引入,被试被指示去识别偏差刺激时,在P3a 之后,可以在ERP 波形中观察到一个负波N2b 和一个明显的正波P3b. N2b可能代表刺激变化的前意识知觉登记,也可能是刺激评价和分类过程的早期阶段,通常发生在注意力参与的条件下,几乎总是紧随P3a[35,38].

P3b 波也被称为P3 或P300,它是最明显的波,也可能是第一个既反映刺激为偏差又识别刺激是目标的ERP 波[13,39]. P3b 时延通常独立于(尽管相关)响应选择时间,且通常发生在反应时间之后,因此有研究人员认为,它反映了在一系列标准刺激中对偏差刺激的决策后评价,并且可能反映了终止过程[36,40]. 有研究提出,P3b 时延可以用来评估刺激分类/评价过程的相对时间,包括辨别、识别和分类等认知任务[41],并且通常与认知效率相关[42]. 由图14 可见,近偏差刺激的P3b 时延较短,约为400~800 ms,而远偏差刺激的P3b 时延约在600 ms 以后. 这与表2 中被试对近偏差刺激与远偏差刺激反应时间的统计相符. 此外,实验观察到近偏差刺激产生的P3b 的振幅较大,而远偏差刺激产生的P3b 振幅较小. 这表明P3b 时延的增加和P3b 振幅的下降会伴随刺激强度下降显现,同样会由任务难度的增加导致.

2. 5 大脑半球特异化 声音的定位与识别等听觉过程是大脑处理听觉信息的一个复杂过程,依赖于双侧听觉皮层的共同努力,涉及多个大脑区域的协作. 但在许多情形下,在处理空间位置信息的任务中,大脑的左右半球展现出不同的激活模式. 这种大脑半球特异性在个体中也可能有所不同,会受到任务类型、声音刺激的特点以及个人的神经解剖结构等因素的影响.

Mathiak et al[43],Kopčo et al[44],Altmann etal[45]关于功能性磁共振成像(Functional" MagneticResonance Imaging,fMRI)和脑磁图(Magnetoen⁃cephalography,MEG)的研究均表明,右半球特别是右侧颞叶,更善于感知声强和混响等声学线索的变化,在处理分析空间听觉信息如声源的方位和距离时,可能更加活跃[43-45]. 为了探究大脑左右半球在处理听觉距离信息时的差异,本研究将脑电帽的32 个电极按照奇数与偶数平均分成两个部分,即左半球与右半球(各16 个电极),并绘制左、右半球的ERP 波形图,如图15 所示. 其中,图15a 和图15b 分别为无注意力状态右半球和左半球的结果,图15c 和图15d 分别为引入注意力状态右半球和左半球的结果.

由图15 可见,无论在有无注意力的情况下,右半球ERP 分量的幅值比左半球的幅值均更为显著,这表明右半球对于距离相关的听觉刺激有更强的反应. 此外,除了认知负荷的增加导致的远偏差刺激产生的ERP 波形的负波增强,左半球对近偏差刺激与标准刺激的反应在有无注意力的条件下均不太明显,这意味着左半球对于听觉距离相关的感知没有那么敏感. 这与大脑分区的基础认识一致,即左半球更擅长处理语言和逻辑任务以及顺序和分析性任务,而右半球则对于空间关系和整体图像处理更为敏感.

尽管本研究的实验结果显示右半球在处理听觉距离感知方面发挥着较为重要的作用,但要注意的是,大脑处理听觉信息的系统相当复杂,通常涉及多个脑区的协作. 因此,不同的任务可能会激活不同的脑区,对于声音距离的识别也并不是右半球某一区域的独立功能.

3 结论

本研究通过识别实验与绝对量度实验进行了听觉距离感知主观评价研究,并在无注意力和引入注意力两种条件下进行了ERP 相关研究. 主观评价结果表明,被试在近距离条件下的距离感知较为准确,而在远距离条件下,感知准确性下降,呈现出与幂函数拟合一致的低估现象. 行为学实验结果表明,与近偏差刺激相比,被试对远偏差刺激的响应错误率与反应时间均显著增加. 在ERP实验结果中,观察到了P1⁃N1⁃P2复合体的存在.在无注意力条件下,P3a 成分仅在偏差更明显的近偏差刺激处出现;在引入注意力后,无论远偏差刺激还是近偏差刺激,P3a成分均有显现. P3b 成分仅在引入注意力的条件下显著,并且随着刺激强度降低和任务难度增加,其时延增加且振幅下降. 此外,ERP 图像揭示了大脑半球特异化的现象,结果表明右半球对于距离相关的听觉刺激更为敏感.

本研究发现人耳对声音距离的感知受到声强因素的强烈影响,但声强、DRR等因素的影响权重尚未明确,这需要实施更严格的变量控制. 在绝对量度实验中,每个指定距离只在实验过程中出现一次,因此,本研究暂未去除被试内部可能异常的数据. 此外,为了减少头部运动产生的伪迹,在实验过程中要求被试尽量保持静止. 然而,头部的运动能提供额外的双耳线索,如ITD,从而帮助被试进行距离判断. 已有研究表明,与听觉感知相关的ERP 成分与大脑中的具体区域有关,例如,N1 在额中央电极处记录得最大,MMN 生成器在听觉皮层内的确切位置取决于正在处理的声音的感觉特征(如强度、频率、持续时间等),各种P3 波的头皮分布在不同的实验中也有所不同,因此,对大脑具体脑区的分析需要进一步细化和完善,以更精确地理解ERP 成分与脑功能的关联.

(责任编辑 高善露)