APP下载

民族乐器的多通道可听化研究

2020-10-21王鑫郝欣言王元中

关键词:混响指向性声源

王鑫,郝欣言,王元中

(中国传媒大学,北京市100024)

1 引 言

随着计算机仿真技术的不断发展,可听化技术已经广泛的应用于声场建模及VR音频。可听化技术首先对声场以及声源建立物理模型,通过声学仿真获取双耳房间脉冲响应函数(BRIR),并与消声室信号进行卷积而实现对声学厅堂音质的预听功能。在可听化技术中,声源指向性对可听化效果有很大的影响。饶丹通过对比不同声源指向性对可听化的影响,发现采用与实际声源指向性较为接近的声源会提升可听化效果[1]。许多国外的学者也都得出类似的结论[2-4]。因此如何采用有效的方法表征声源指向性,提升可听化质量,成为许多学者研究的热点。有些学者采用定义声源指向性的方法,例如Giron提出逆球谐函数变换(ISHT)的方法仿真声源的指向性特征[5]。而Ridel等人在2004年开始研究多通道可听化的方式来表征声源的指向性信息[6-8]。多通道可听化技术首先通过Odeon等声学仿真软件进行声场建模,然后将声源声辐射区域划分成多个通道,分别获取相应的双耳脉冲响应函数(BRIR),再与对应区域录制的消声室信号进行卷积,并最终混合成多通道可听化信号。该方法不再使用每件乐器时不变的指向性数据,而是采用在消声室不同位置录制的多通道声频信号来采集声源的指向性信息。与之前的技术相比,该方法可以捕捉声源在旋律进行中指向性的时变信息,表征的指向性数据更加真实。Ridel等人对单簧管、长笛和小提琴进行了单通道、四通道和十三通道的可听化实验,结果表明随着声道数量的增加,所有乐器的真实感都在增加,但是感知到的声源宽度并不一致。该论文在讨论部分提出采用声源感知宽度作为评价术语可能不够准确,而且在消声室录制不同方向的乐器音色时,仅考虑到水平面和垂直面,覆盖的空间不够全面。

这种多通道可听化技术是否适用于中国乐器,实验结论是否存在差异呢?本论文将以中国民族乐器二胡和梆笛为研究对象,采用Ridel等人提出的多通道可听化技术,通过对比单通道、五通道、十通道和十五通道的可听化信号,探究该方法是否可以提升中国乐器的真实度及声源指向性音色,并与以西方乐器为研究对象所得结论进行对比分析。

2 多通道可听化实验信号的获取

2.1 厅堂建模

本实验仿真的厅堂是中国传媒大学综合楼报告厅,可以容纳1500人左右,主要用于学校大型文艺演出与大型会议。本文采用Odeon 9对该厅堂进行建模,整个模型包含270个面,总表面积为5758.87m2,如图1所示。吸声材料的设置以厅堂实际材料为基准,并根据多个不同测试点的平均实测混响时间T30进行调整。图2显示了多个测试点的位置,声源位于舞台中心。表1显示了在厅堂中实测T30与Odeon中仿真值的对比结果。从对比结果可以看出,除了125Hz和8kHz频段的混响时间偏差略大,其他频段的仿真结果都较为理想。

图1 中国传媒大学报告厅Odeon模型

图 2 多个测试点的位置

表1 实测混响时间T30与仿真结果的对比

2.2 消声室录制多通道素材

本实验在消声室录制了梆笛和二胡的34通道信号。实验在中国计量科学研究院力学与声学计量研究所消声室中进行。测量采用了同期多轨录音的方式,以乐器的几何中心为球中心,设置一个半径为1.5米的传声器球型阵列支架,传声器数量为34支,传声器距离声源的实际距离为1.4米,传声器的空间方位角见表2。表中传声器空间方位采用垂直角(-22.5°≤φ≤90°)和水平角(-120°≤θ≤120°)表示。在水平面上(φ=0°),θ=-90°,0°和90°分别表示乐器的正左、正前和正后方。鉴于传声器数量有限,多通道信号并未全部覆盖360°三维空间,主要缺少乐器后部及底部的信息。测试的详细过程请参见文献[9]。在接下来的可听化实验中,分别采用了长度约为15s的梆笛和二胡旋律进行听音实验。

表2 34支传声器的空间方位角设置

之所以选取二胡和梆笛作为实验信号,是因为这两个乐器的声辐射特性存在较大差异,分别如图3和4所示。从每个图例右侧的变化范围条形带可以看出,梆笛的最大值与最小值之间的差距更大,梆笛的声辐射特性更加尖锐,二胡的声辐射特性更加平缓。

图 3 梆笛的声辐射特性

图4 二胡的声辐射特性

2.3 可听化实验信号的制作

根据在消声室得到的多通道实验素材,在Odeon软件中对声源的辐射区域进行单通道、五通道、十通道及十五通道的均匀区域划分,用于获取双耳脉冲响应函数(BRIR),并最终合成可听化信号。不同通道声源的辐射区域范围及对应的消声室信号如表3所示。

在Odeon软件中根据表3对不同声源的声辐射区域进行设置,图5至图8分别显示了单通道、五通道正前方、十通道正前方、五通道正前方的声源指向性图。设置好声源的辐射特性后,在Odeon中获取BRIR,需要分别设置房间脉冲函数的计算参数和选取头部相关函数(HRTF)。在进行房间脉冲响应函数计算时,Odeon采用虚声源法处理早期反射,声线跟踪法计算更高阶反射声的混合算法。本实验在计算时,采用的转换阶数为二阶。根据用户手册,脉冲响应的长度应该至少达到混响时间的2/3,因此根据表1中混响时间的数据,采用了Odeon精细计算模式下默认的冲击响应长度10000ms。同时最大反射次数的设置也是软件默认值2000,保证了仿真过程中判断停止的首要条件为冲击响应的长度。声线数量的设置与房间的几何形状和容积大小有关,本实验使用了Odeon给出的默认声线数量24525。关于HRTF函数,本实验使用了软件默认的Subject_021,这是封闭耳道Kemar仿真头测试的结果。在Odeon中,还根据听音实验所使用的监听耳机型号进行了修正。

表3 不同通道声源的辐射区域划分

续表

图5 单通道声源辐射图

图6 五通道正前方声源辐射图

图7 十通道正前方声源辐射图

图8 十五通道正前方声源辐射图

BRIR的声源及接收点如图9所示。图中圆点6是接收点的位置,位于略微偏离正中央的位置,蓝色十字光标为声源的位置,位于台唇后两米处。

图9 声源及接收点位置

3 多通道可听化听音实验及结果

3.1 听音实验过程

听音实验要求被试分别对梆笛和二胡单通道、五通道、十通道和十五通道可听化实验信号的真实度和声源指向性音色两个参数进行打分。真实度是指听感上与乐器在厅堂中演奏的相似程度。声源指向性音色来自于英文“Directional Tone Color”(DTC),是Vigeant在文献[9]中推荐用DTC取代声源感知宽度。理论上来讲,由于乐器的声辐射特性不均匀,在不同的位置拾音会得到不同的音色。将这些不同的音色进行叠加,可以使乐器整体的声音变得更加立体。因此DTC可以解释为乐器的立体感。主观实验方法借鉴了MUSHRA的方法[10]。被试针对每个实验信号在0到100之间评分,评分区间被均等分成五个等级,分别是优、良、中、差、劣。被试参照等级标准,给出相应的分值。所有被试年龄都在20-30岁之间,均有一定的音乐学习背景且经过专业的音质主观评价训练,共20人,其中13位男生,7位女生。所有实验采用重复测试来进行一致性信度检验,如果被试两次评分结果超过10分则认为信度不合格。

在正式实验前,所有被试都接受了简单的辅导说明,能够正确了解实验的过程,清楚评价术语的含义。听音实验分为两组,第一组为二胡,第二组为梆笛。可听化素材的格式均为Wave文件,笔记本ThinkPad T430u外接声卡Focusrite 2i4,通过监听耳机Sennheiser HD6重放,重放声压级控制在75dBA左右。实验的测试界面采用幻灯片的形式,可听化素材以插入的形式对应于带有序号的按钮,被试可以随时切换不同序号的音频并在不同的时间点进行播放。被试完成每个素材听辨后,在被试表格上给出相应的分值。在所有听音实验完成后,对被试进行实验后问卷调查,写明真实度和DTC评分较高或较低的原因。

3.2 实验结果

经过重复信度检验后,对有效数据进行统计分析,实验结果如图10-11所示。从图10的结果可以看出,二胡的真实度随着通道数的增加始终呈上升的趋势。其中单通道到五通道,五通道到十通道的变化幅度基本相同,而十通道到十五通道则基本保持不变只有很小的上升。在DTC方面,除了五通道,其余通道的DTC均高于单通道,整体上DTC呈上升趋势。从图11的结果可以看出,梆笛的真实度和DTC随通道数的增加都呈现先上升再下降的趋势。除了五通道的真实度和DTC在单通道基础上有所提升以外,其他多通道可听化信号并未呈现出优化的趋势,甚至出现裂变的情况。

图10 二胡主观评价结果

图11 梆笛主观评价结果

4 实验结果分析及讨论

4.1 梆笛与二胡实验结果的对比分析

对比梆笛与二胡的实验结果发现,二者差异较大。为了究其原因,对不同通道的可听化信号进行分析。多通道可听化信号是由不同辐射方向的声源生成的BRIR与对应消声室信号卷积叠加而成,通道数量越多,采用BRIR越多。通过对比发现,声源的辐射区域越偏离接收点,得到的BRIR混响越大,表4列出了五通道、十通道和十五通道指向接收点和偏离接收点90°时,BRIR倍频程T30结果。从表格中可以看出,正向和侧向声源辐射导致BRIR的T30参数会有0.2s~0.3s的差异。因此通道数量越多,混响时间较长的BRIR使用越多,导致可听化信号的混响感越大。

表4 不同通道正向与侧向声源生成BRIR的T30结果对比

有学者对中国乐器的最佳混响感做过相关研究,发现不同乐器的最佳混响感存在差异,即使相同乐器不同乐曲的最佳混响感也存在差异[11,12]。对于本实验的二胡多通道可听化信号,随着通道数量的增加,混响感随之增强,可能正好符合二胡的听音感受。而对于梆笛而言,五通道的信号可能刚好既保证一定的混响感,又不影响清晰度,因此真实度得分最高。而随着声道数量的增加,混响感过大,影响清晰度,导致真实度下降。对被试问卷调查结果的分析也证实了这一点。大多数被试指出随着通道数量的提升,混响太大,失去了梆笛原有的音色和辨识度,会丢失音色的细节。因此多通道可听化技术确实可以提升乐器的真实度,但是不同乐器的最佳可听化通道数量存在差异,可能与乐器的最佳混响感有关。

对于DTC,虽然梆笛和二胡在获得最佳DTC时,使用的通道数量不同,但是都能发现多通道可听化技术会比传统的单通道获得更好的DTC。通过对被试问卷调查的分析发现,被试主要从音色清晰度和体积感两个方面对DTC进行评价。梆笛随着通道数量的增加,混响感增大,清晰度降低,因此DTC的得分也相对较低。此外,由于不同乐器在不同频率的指向性变化程度不同,通路增加时,会使声辐射变化尖锐的乐器在某个频段的信息增加过多而导致乐器体积过大或过小,过远或过近。由前文分析可知,梆笛的声辐射变化更加尖锐,可能会更容易影响乐器的体积感,从而影响DTC的判断。从本实验的DTC结果可以看出随着通道数量的增加可以改善乐器的立体感,因此今后可以尝试将多通道可听化技术应用于虚拟现实中,增加声音的三维效果。

4.2 与西洋乐器实验结果的对比分析

图12和图13分别显示了Vigeant等人对小提琴、长笛和长号的可听化实验结果。从他们的结果可以看出,三种乐器的真实度都随着声道数量的增加而提升。但是通道数量对不同乐器的声源宽度感知影响不同,没有统一的结论。将本实验的结果与西洋乐器的结果比较发现,二胡真实度的结果与西洋乐器结果较为一致,都随着声道数量的增加而提升,且与小提琴的趋势十分接近。但是梆笛真实度的结果存在较大出入。

图12 真实度感知结果

图13 声源宽度感知结果

Vigeant在实验中采用了声源宽度作为评价术语,由于实验结果不存在明显规律,因此在论文中建议采用DTC作为评价参数来代替声源感知宽度和清晰度。结合西洋乐器声源宽度实验结果与本实验DTC的结果,发现被试能清楚的感受到不同指向性声源所带来的音色感知,且这种感知程度随着通道数量的增加而更加明显。但是DTC与通道数量关系的规律还需更多的实验进行验证。

5 结 论

本文以梆笛和二胡为研究对象,探究了多通道可听化技术可否优化乐器的听感。实验结果表明对于梆笛和二胡而言,多通道可听化技术可以提升乐器的真实度,但是不同乐器最佳真实度的通道数量存在不同,可能与不同乐器的最佳混响感有关。多通道可听化技术也可以提升这两个乐器的立体感,但是最佳立体感的通道数量也存在差异,可能与乐器声辐射特性的尖锐程度有关。今后可以考虑将多通道可听化技术应用于虚拟现实中,增加声源的三维立体感。此外,多通道可听化技术对乐器真实度的改变是否与最佳混响感有关,以及通道数量与DTC的关系,都还需进一步的实验来进行验证。

猜你喜欢

混响指向性声源
虚拟声源定位的等效源近场声全息算法
声源指向性仿真研究
利用声压有效值信息进行白噪声声源识别
非完全深海声道环境下混响强度建模与分析
刍议小学指向性提问写作教学——以《慈母情深》为例
浅谈在混音中混响插件的组合使用
基于GCC-nearest时延估计的室内声源定位
人大专题询问:增强监督“指向性”
海洋混响特性分析与建模仿真研究∗
圆柱阵特征波束分解与综合超指向性波束形成方法