听觉的声学现象和原理(3)
2018-07-28莫福源
莫福源
4.1.3掩蔽曲线测量方法 掩蔽曲线都是通过测听实验得到,是在有无掩蔽音的情况下,测量能听到声音的极限,掩蔽曲线和掩蔽音及被掩蔽音的性质有关。图13是典型的掩蔽曲线,下面的锯齿状曲线是没有掩蔽音时的听觉域值,上面的锯齿形曲线是存在掩蔽音时的听觉域值;其掩蔽音是1 000 Hz、声压级60 dB的纯音,当被掩蔽音也为1 000 Hz纯音时最大听觉域值约比掩蔽音低15 dB,随着频率偏离掩蔽音频率,掩蔽效果迅速下降,低频下降速度比高频快[3]。
图13 实测的掩蔽曲线
4.1.3.1窄带噪声掩蔽纯音 图14是一个纯音被窄带噪声掩蔽的测量曲线,窄带噪声中心频率分别为250、1 000和4 000 Hz,带宽分别为100、160和700 Hz,图上部水平虚线为掩蔽噪声声强级60 dB,中部实线表示刚好可听到的纯音声级,下部的虚线是听觉安静域值。从图中可以看出,被掩蔽纯音的频率偏离掩蔽噪声中心频率越大掩蔽效应下降越快;因为是平滑以后的数据,故而不呈锯齿状。信号分量和掩蔽域值之间的声级差,称信号掩蔽比(signal to mask ratio,SMR),SMR越大,掩蔽效果越小。图14中,250、1 000和4 000 Hz的最小SMR分别为2、3和5 dB,最小SMR是设计音频编码器很重要的参数[3]。
图14 窄带噪声掩蔽纯音实测曲线
掩蔽曲线的形状(即掩蔽效果)与掩蔽音、被掩蔽音的声级也有关,图15是实测1 000 Hz不同声级窄带噪声掩蔽纯音的掩蔽曲线,在两者声级较高时,掩蔽曲线发生弯曲,出现非线性。图14 显示测量得到的掩蔽曲线对不同的掩蔽音形状各异,给设计一个音频编解码器带来很大麻烦,因为计算的数学表达式随频率改变,计算机编程也十分琐碎。如果用临界带的Bark刻度作为频率座标,掩蔽曲线形状完全一致,如图16所示。(临界带的概念将在后面介绍)。
图15 不同声级1 000 Hz窄带噪声掩蔽纯音时的掩蔽曲线
图16 Bark刻度掩蔽曲线
4.1.3.2纯音掩蔽纯音 纯音掩蔽纯音的实验较噪声掩蔽纯音难做,因为两个纯音会发生拍频;测听者除了听到这两个音外,还能听到一个额外出现的拍频音,拍频音大多在掩蔽音附近,但它又和掩蔽音声级有关。图17是1 000 Hz不同声级的纯音作为被掩蔽音时测得的掩蔽曲线,为了避免在两个音频率相等时发生拍频,被掩蔽音和掩蔽音之间有90度的相位差;在图中可见被掩蔽音声级低时,掩蔽域值向低频扩展(斜率小),在高声级时则相反,当掩蔽音声级90 dB时,掩蔽曲线峰值75 dB,信号掩蔽比15 dB,较噪声掩蔽纯音的SMR大,这意味噪声比纯音有更好的掩蔽效果。
图17 纯音掩蔽纯音的掩蔽曲线
4.1.3.3窄带噪声或纯音掩蔽窄带噪声 通常一个信号的量化噪声谱比纯音复杂,对一个音频编码器而言,从实验数据总结出来最适当的掩蔽模型应该是窄带噪声被窄带噪声或纯音掩蔽的模型。很遗憾,文献报道的这样实验数据很少,原因是在窄带噪声掩蔽窄带噪声情况下,两者相位关系影响实验结果,Hall等[12]建议宽带噪声掩蔽窄带噪声时,最小信号掩蔽比SMR约为26 dB。对纯音掩蔽窄带噪声情况下,Zwicker[13]、Schroeder[14]等建议最小SMR约20~30 dB;一般而言,纯音的最小SMR要高于类噪声的最小SMR[3]。
4.1.3.4临界带(critical bandwidth) 测量掩蔽曲线时,科学家发现了十分有意义的现象,称为临界带的现象。在测量两个纯音掩蔽一个窄带噪声时,两个纯音的频率间隔在某个范围内掩蔽曲线很平坦,一旦超过这个间隔,掩蔽曲线急剧下降,这个频率间隔称为临界带。图18是纯音掩蔽窄带噪声时的临界带,两个50 dB声级的纯音掩蔽一个中心频率2 kHz的窄带噪声,当两个掩蔽纯音从2 kHz中心频率逐渐向两边移开时,掩蔽域值无变化,都是33 dB;在它们离中心频率各超过150 Hz时,掩蔽曲线急剧下降,它们的频率间隔即为临界带带宽300 Hz。
在噪声掩蔽纯音时也出现同样的现象,图19是两个50 dB声级的窄带噪声掩蔽一个2 kHz纯音,在窄带噪声的间距小于300 Hz(各离纯音频率150 Hz)时,掩蔽曲线很平坦,为46 dB;当间距超过300 Hz时,掩蔽曲线也是急剧下降。
图18 纯音掩蔽窄带噪声时的临界带
图19 窄带噪声掩蔽纯音时的临界带
科学家H.Fletcher将此间隔定义为临界带[15],并认为临界带是听觉器官分析声音很合理的滤波器组。对临界带作为划分人耳滤波器组的带宽和形状,因不同的实验方法不同有些争议。Zwicker等[13]认为中心频率fc在500 Hz以下,临界带宽约为100 Hz;fc在500 Hz以上,带宽约为中心频率的1/5,并给出如下公式:
Δf(Hz)=25+75[1+1.4(fc(kHz))2]0.69
由于实验方法不同,Greenwood[16]、Moore[17]等对耳分析滤波器的形状和带宽划分有另一种提法,他们认为Zweicker等[13]的临界带划分公式不精确,提出了等效矩形带宽(equivalent rectangular bandwidth,ERB)的公式:
ERB(Hz)=24.7(4.37fc(kHz)+1)
上述两种方法从20世纪60年代到90年代争论了20~30年,莫衷一是。由于实验方法不一致,难以判定何者更正确或更优,这和实验方法有关,也与需要设计和应用的信号处理系统有关。然而在耳蜗基底膜上进行频谱分析是不争的事实,实验证明临界带划分基底膜为24份,每份约100 Mel音高间隔,并包含大致相同的神经纤维,足以说明临界带的划分有较强的科学依据。Bark 刻度划分临界带的中心频率、上下截止频率和带宽见表1[3,10]。
(待续)