APP下载

古典音乐的三维声拾音
——三维声重放与三维声拾音阵列

2022-08-11周朔然

演艺科技 2022年2期
关键词:时间差传声器指向性

曹 勐 ,周朔然

(1.中国音乐学院,北京 100101 ;2.麦吉尔大学,加拿大蒙特利尔)

近年来,沉浸式(immersive)成为一个热门词汇,出现在各个领域。对音频技术领域而言,沉浸式主要指三维的声音重放及其相关的拾音和制作技术,简称“三维声”。三维声技术最早出现在电影声音的制作领域,近两年开始在音乐录制的领域应用,很多在线音乐平台如Apple Music、Sony Hi-Res等,已经相继开始支持三维声格式音乐资源的解码播放,特别是针对古典音乐的三维声拾音技术,从理论研究到实践探索都取得了大量成果。

古典音乐录音领域从双声道立体声开始到平面环绕声再到现在的三维声技术,始终走在音频技术发展的最前沿,不断追求重放音响空间的拓展。近年来,古典音乐的三维声重放与拾音技术无论在理论研究领域还是录音实践领域都取得了大量成果。为了让更多的录音师和音乐家了解三维声技术及其在古典音乐录音艺术创作中的运用,有必要对目前的古典音乐三维声录制技术进行梳理和讨论,以下着重从三维声重放与三维声拾音阵列两个方面进行论述。

1 三维声重放对古典音乐录音的作用

讨论音频技术对于音乐录音的作用时,往往需要以实际重放的音响效果和创作手段、思路的开拓作为主要的衡量标准。三维声技术的运用不仅极大拓展了音乐录音作品重放音响的临场感、空间感和包围感,而且使重放的整体音质获得明显改善。此外,三维音响空间还推动了录音师音响创作思路的突破。

1.1 重放音响空间的拓展

人类的听觉系统天然地具备感知三维空间的能力,且在人们的听音习惯中,从斜上方和上方而来的声音承载了更多有助于辨识声场环境的重要信息,如户外自然环境中的各种声音或者厅堂内的各种反射声、混响声等。但录音重放系统从单声道、双声道到环绕声始终局限于水平的二维平面重放,其音响空间的重放效果与人类的自然聆听经验之间存在很大差异。三维声重放通过增加垂直方向的扬声器重放上方和斜上方的音响信息,为聆听者塑造出一个真正的三维音响空间。虽然三维声重放与真实声场相比仍有不小的差距,但已经很大程度上与人类的自然聆听体验接近,相对于双声道立体声和环绕声重放,具有更真实的临场感和更好的沉浸感与包围感。

1.2 整体重放音质的改善

三维声重放对重放音响的整体音质也有明显改善。单声道时代,所有声音信息被挤压在空间中的一个点重放,原始声源在重放时相互间的声染色、相位抵消、掩蔽等现象极其严重。随着重放声道数量的增加,原始声源在重放的三维音响空间中被定位于不同的位置,相互间的掩蔽作用明显减弱,音色辨识度、清晰度和定位的准确度都明显提高。

不仅如此,混响感也有所增强。这也源于掩蔽作用的减弱,直达声更加清晰可辨,在不影响声音的清晰度的情况下,相应的混响能量的拾取和重放可以更大。甚至实际录音制作时,有些双声道立体声录制时需要反复调整人工混响器来解决的空间感问题,在三维声录制中变得不再必要[1]。

德国Fraunhofer研究院的相关测试结果也显示,添加上层扬声器的三维声重放系统比两声道立体声系统在整体音质方面有了大幅提升,如图1所示[2-3]。

图1 从两声道立体声到三维声的整体音质评比

1.3 音响创作思路的扩展

三维声的重放方式还推动了古典音乐录音音响创作的多样化发展。古典音乐录音在音响艺术上通常追求乐队整体的平衡、稳定和融合,强调呈现与聆听者在实际音乐厅聆听体验接近的“假定性真实”效果。因此,一般都以音乐厅观众欣赏音乐会的聆听视角(即音乐表演在聆听者前方)进行音乐录制。

三维声重放不仅可以改善重放音响的临场感和包围感,甚至可以在一定程度对上方和后方重放的空间音响进行艺术性夸张,使“假定性真实”被进一步强化,录音作品的情感带入效果更好。

另外,增加了上层扬声器可以实现重放声像垂直方向的定位,重放声像可以在前、后、左、右、上、下的三维音响空间中相对自由和连贯地运动。古典音乐的录音师和音乐家可以尝试突破传统舞台再现式的重放音响模式,利用上层和后方扬声器制造被声源包围的沉浸式的音响效果,进一步丰富音乐音响的艺术表现力。

实际上从声音录制技术进入环绕声开始,一些古典音乐的音乐家和录音师们就已经开始尝试突破传统的聆听习惯,将聆听位置前移至乐队中,产生聆听者被乐器环绕的音响效果,三维声技术的发展使这种效果变得更加“逼真”。当今,以Morten Lindberg和Mick Sawaguchi为代表的一些录音师按照这种创作思路进行了大量的录音实验活动,并且获得越来越多听众的认可和喜爱。

2 古典音乐的三维声重放系统

在古典音乐录音技术发展中,无论是双声道立体声、环绕声或是三维声,所采用的拾音制式都与扬声器重放系统有着紧密关联。因此,讨论三维声拾音阵列前,有必要对常见的三维声重放系统的扬声器布局进行说明。

目前用于音乐录制监听的三维声重放系统通常有两层和三层两种扬声器布局方式(垂直方向)。两层扬声器布局以Auro 3D(家庭格式)(如图2)和杜比全景声(Dolby Atoms)(家庭格式)(如图3)重放系统为代表,三层扬声器布局以日本NHK22.2 多声道三维声系统为代表。

图2 Auro 3D重放系统中的5.1.4(Auro 9.1)扬声器布局 (图片来源:www.auro-3d.com, Auro-3D Home Theater Setup Guidelines)

图3 杜比全景声重放系统中的5.1.4扬声器布局(增加7.1.4)(图片来源:www.dolby.com, Dolby Atmos Home Theater Installation Guidelines)

2.1 两层扬声器系统布局

两层扬声器系统布局是以传统5.1或7.1的环绕声扬声器布局为基础增加4只上层全频扬声器,组成5.1.4或7.1.4的扬声器布局方式。Auro 3D和Dolby Atoms的区别主要在于上层扬声器的位置选择。

Auro 3D推荐将上层扬声器放置于听音者位置向上30°仰角的方向,设计者认为人们对生活场景、空间的判断主要来自上层的声音,而这个上层并非来自头顶,大多来自斜上方。以30°仰角设置的上层扬声器,使Auro 3D系统的上下两层重放的信息关联性更加密切,更适合塑造斜上方的声场,使聆听者听到更多的环境声音细节,以及较准确的高度信息。在音乐节目录制领域,一些录音师在不同场合也都表达过类似的观点,即30°的提升角度是一个更合适、声音更“自然” “真实”的设置角度[4]。

杜比全景声的上层扬声器放置得更高,位于聆听者头上45°以上的仰角方向。相比于Auro 3D音的扬声器布局,杜比方案更接近听者头顶,能够相对分明地呈现位于上层的声音事件,如创造性的音乐元素、影视中的头顶音效等。但上下层间的衔接、垂直方向的声像定位受到一定影响。

2.2 三层扬声器系统布局

三层扬声器系统布局以日本NHK22.2 多声道三维声系统为代表,其目的是用于匹配超高清视频系统(8K)的沉浸声重放系统。该系统由22只全频和2只超低扬声器组成,22只全频扬声器分为上中下三层布局,其中中层(与人耳齐平)为10只,上层为9只,下层为3只扬声器,具体布局如图4所示。

图4 NHK22.2多声道重放系统的扬声器布局(图片来源:K. Hamasaki, K. Hiyama, and R. Okumura, “The 22.2 Multichannel Sound System and Its Application,” in AES Convention 118, Barcelona, Spain, 2005)

该系统实现5个目标[5]:

(1)声源在超大屏幕中定位;

(2)重放所有方向的声音;

(3)重放自然高保真的三维声场;

(4)扩大最佳听音区域;

(5)与现有多声道系统兼容。

由于使用的扬声器过多,布局较复杂,增加它的使用门槛。

3 三维声拾音阵列

通过对目前音乐三维声录制相关文献的查阅和对大量古典音乐三维声拾音案例的分析,目前古典音乐的三维声录制和监听大部分是基于杜比全景声和Auro3D的两层扬声器布局,因此,文中所讨论的拾音方案也主要针对5.1.4和7.1.4两层扬声器布局的三维声重放系统。

3.1 三维声拾音阵列的分类

古典音乐三维声录音中,三维声场的拾取主要通过三维声拾音阵列来完成。从拾音原理上,目前的三维声拾音阵列可分为两类,第一类是使用传统传声器组成的三维声拾音阵列,且传声器与重放扬声器数量一一对应;第二类是基于球谐函数展开的Ambisonics声场重构技术进行拾音的三维声拾音阵列。

3.1.1 传声器扬声器对应的三维声拾音阵列

传声器扬声器对应的三维声拾音阵列是从传统立体声拾音方式中发展而来的,利用传声器指向性、夹角和间距变化拾取声源到各传声器间的时间差、强度差信息,构建三维重放声场。此类拾音阵列大都遵循传声器与重放扬声器数量一一对应的关系。目前,此类阵列绝大多数多由8~11支传声器组成,传声器摆放位置、角度等与5.1.4和7.1.4的重放扬声器布局相对应。

为了更好地理解此类阵列中的传声器选择和摆放规律,参考立体声拾音方式的分类原则,可以按照各传声器间拾取信号的隔离方式差异进行细分,将其分为三类:时间差或偏向时间差阵列、偏向强度差阵列、时间差强度差复合阵列。

时间差或偏向时间差阵列是指阵列中传声器间拾取信号的差异为时间差或以时间差为主。这类阵列大多使用全指向传声器,且传声器间距较大(1~2 m甚至更大)。其代表性拾音阵列有2L Cube、AMBEO Cube(传声器指向性调整为全指向或接近全指向时)、LDK Cube等。

偏向强度差阵列是指阵列中传声器拾取信号的差异以强度差为主。这类阵列大多使用比较尖锐的指向性(如超心形)传声器,且传声器间无间距或间距很小(十几厘米或更小)。此类代表性拾音阵列有ORTF 3D等。

时间差与强度差复合阵列是指阵列中传声器间拾取信号的差异既有时间差又有强度差。这类阵列大多使用心形传声器,且传声器间距适中。此类阵列是目前三维声阵列中最常被选择的一种,代表性阵列很多,如PCMA 3D、OCT 3D、Ambeo Cube(传声器指向性调整为心形或超心形)、Hamasaki Cube等。

3.1.2 Ambisonics三维声拾音阵列

Ambisonics技术是基于电子手段进行声场拾取、创建和播放的特定技术,声场重构再现整个球形声场。随着球谐函数阶数的增加,球型传声器阵列的通道数从一阶的4个通道增加的多阶的(M+1)2个通道(M为阶数),如图5所示。并且随着阶数的增加,声场的解析度更高,重放声像定位也更加准确。

图5 Ambisonics球谐函数从由一阶到三阶的示意图(图片来源:M. Narbutt, J. Skoglund, A. Allen, M. Chinen, D. Barry, and A. Hines, “AMBIQUAL: Auditory Localization Towards in a Quality Metric for Ambisonic Headphone Scenes Rendered Compressed Ambisonic Spatial Audio”, Applied Sciences, 2020)

与传声器扬声器对应的三维声阵列不同,Ambisonics技术的拾音方式可以理解为一种声场采集的通用格式,即拾音阵列不对应任何重放通道,必须通过解码转换为特定扬声器重放格式所需的音频信号,因此它对应扬声器的数量和位置是可变的。这种编码/解码方案具有非常便携和灵活的优点,它不受特定扬声器设置的限制,可以根据所选解码方式在多种不同扬声器布局上重放,兼容从双声道立体声、环绕声到三维声等各种格式,还可以配合头部跟踪技术,创建360°三维声景。该拾音阵列被广泛运用于声景和环境声场拾音,VR音频、游戏音频等领域。

但是,对古典音乐录音而言,现有研究显示,通过实际聆听和主观音质评价,该拾音阵列在音色表现、空间印象(声场横向和纵深宽度、空间感、包围感)和听感的自然程度等方面都远不及传统方式的传声器阵列[6-7]。因此,笔者后续论述主要针对传统传声器组成的三维声拾音阵列即传声器与重放扬声器数量一一对应的三维声拾音阵列。

3.2 古典音乐拾音中常见三维声拾音阵列举例

3.2.1 2L Cube

2L Cube是最具代表性的偏向时间差三维声拾音阵列之一,由 2L唱片公司的录音师Morten Lindberg所设计,通常由9支全指向传声器组成,传声器间隔根据拾音场地和乐队规模进行调整,一般不超过1 m,如图6所示。由于传声器选择全指向性,2L Cube拥有更延伸的低频响应以及较好的离轴频率响应。从 2L 唱片的录音案例中可以看出,Morten Lindberg通常选择声学条件极佳的录音地,让演奏者环绕着传声器阵列,通过改变乐队摆位获得理想的声音平衡,形成一种乐团包围聆听者的新奇声音体验。他还会根据不同的声源和环境,为上层传声器加装声学压力均衡器(APE,acoustic pressure equalizer)①,从而增强全指向传声器的高频指向性,并提升高频响应。此法可以减少上层传声器对高频直达声的拾取,增强上下层传声器之间的强度差隔离度,从而减小重放声像的向上偏移量,使听觉感受更接近真实。

图6 2L Cube三维声拾音阵列(图片来源:www.2l.no)

3.2.2 AMBEO Cube

AMBEO Cube现作为森海塞尔沉浸式录音技术中基于扬声器重放的拾音解决方案,是在 Gregor Zielinsky 提出的Zielinsky Cube的基础上发展而来的,且原先是针对Auro 9.1重放系统所设计的三维声拾音阵列。该阵列由 8或9支森海塞尔MKH800 TWIN 传声器组成(Zielinsky Cube没有下层中间传声器)。各传声器间距为2 m左右,根据声源体积和场地因素调整变化,阵列内所有传声器主轴均指向声源,如图7所示。此阵列显著特点就是选择了MKH800 TWIN传声器,该传声器具有前后双振膜分别独立输出的特性,能够通过改变两个通道电平比例和极性的方法在后期混音时变换传声器指向性和指向方向。因此可以更加灵活地控制声源的清晰度、定位准确度,调整重放三维声声场的宽度和空间感、包围感。

图7 AMBEO Cube三维声拾音阵列

3.2.3 PCMA 3D

PCMA 3D是由Hyunkook Lee教授提出的强度差时间差复合的三维声拾音阵列,包含下层的5支心形传声器和上层的4支超心形传声器。下层间距约为1 m,其中间的传声器稍稍向前突出25 cm;上层超心形传声器主轴垂直指向上方,如图8所示,上下层传声器相互重叠,仅通过强度差实现上下层的声道隔离。该阵列基于Lee教授相关理论研究(上下通道之间9.5 dB的强度差能保证直达声被定位在下层扬声器,且上层信息不会被下层直达声完全掩蔽)[8],其主要设计目标在于保证较好的三维空间感和包围感的前提下,让声源成像稳定地定位在下层。另外,由于上下层传声器重叠放置,对上下层重放信号间的梳状滤波问题有较好的规避,也更利于进行向5.1环绕声格式的下变换。

图8 PCMA 3D三维声拾音阵列示意图

3.2.4 ORTF 3D

ORTF 3D是由Helmut Wittek和Günter Theile提出的偏向强度差的三维声拾音阵列,该阵列由8支超心形传声器组成,舍弃了中间传声器,下层左右传声器间距20 cm、夹角80°,前后传声器间距10 cm、夹角100°;上下层传声器也是重叠放置,夹角90°,如图9所示,仅通过强度差进行垂直方向的声道隔离。由于此阵列较为紧凑,Schoeps公司设计了被整体防风罩包裹的一体化结构,使其适用于室内外各种场合,如图10所示,且安装更加便捷。当然,由于选择了超心形指向性和较小的间距,ORTF 3D在空间感和整体音质方面均有所欠缺。

图9 ORTF 3D (室外版本)三维声拾音阵列布局示意图(图片来源:schoeps.de, Stereophonic multichannel recording techniques for 3D-Audio and VR)

图10 ORTF 3D (室外版本)三维声拾音阵列

3.2.5 OCT 3D

OCT 3D是由Helmut Wittek和Günter Theile提出的时间差与强度差复合的三维声拾音阵列。OCT 3D阵列的设置是在OCT-Surround阵列的基础上,在上方1 m处添加了4支垂直指向上方的超心形传声器,如图11所示。其延续了每支传声器负责拾取指定方向的声音,以获得最小化串音和梳状滤波的理念,上层传声器主要用来拾取来自天花板的反射声,规避了声源的直达声、侧方和后方的反射声。该阵列在清晰度和定位明确度上的表现较好,但由于均选用有指向性较尖锐的传声器,在整体音色和空间感方面表现较差。

图11 OCT 3D三维声拾音阵列示意图(图片来源:schoeps.de)

3.2.6 Hamasaki Cube

Hamasaki Cube是由Hamasaki和Wilfried Van Baelen所提出的针对拾取厅堂环境声的三维声拾音阵列[9]。它是在Hamasaki Square环绕声拾音阵列的基础上添加了4支指向上方的超心形传声器,如图12所示。Hamasaki建议阵列的长宽高间距为2~3 m,以达到足够的低频去相关性。下层的八字形传声器主要用于拾取侧向的反射声,并很好地抑制直达声能量。上层超心形传声器主要用于拾取来自天花板的反射声,同样也能很好的抑制直达声能量。

图12 Hamasaki Cube三维声拾音阵列示意图

3.2.7 LDK Cube

LDK Cube是由李大康教授提出并已使用多年的专门针对拾取环境声的三维声拾音阵列。其下层包含4支全指向传声器,上层包含4支指向上的心形或全指向传声器,如图13所示。该阵列采用了相当大的传声器间距,建议的阵列长宽高在5 m以上,间距也可以根据不同场地进行灵活调整,甚至可以利用厅堂中观众席的反射面设置界面传声器组成。相比于其他使用小间距、尖锐指向性的阵列,LDK Cube更倾向于从多个位置捕获整个声场的空间信息。采用如此大的传声器间距,目的是尽可能减少全指向传声器间的信号相关性,并凸显全指向传声器在音质和声音自然感方面的优势。LDK Cube不仅适用于原声乐器的环境声场拾取,同时也适用于扩声条件下的环境声场拾音[10]。

图13 LDK Cube三维声拾音阵列示意图

3.3 传统传声器组成的三维声拾音阵列的拾音效果分析

上文介绍的常用的三维声拾音阵列都是传统传声器组成的传声器与重放扬声器数量一一对应的三维声阵列。由于每种具体方式采用了不同指向性的传声器和摆放间距,因此在拾取的实际效果方面存在很大的差异。根据器传声器指向性选择和具体拾音效果可以从声像定位的准确度、音色自然程度和整体空间印象等方面进行比较。

定位的准确度主要与直达声到达双耳的强度差(包含音色差)和时间差(包含相位差)相关,而且由强度差引起的定位感知准确度明显好于时间差,垂直方向的定位特性更是突出了这一特点[11]。由指向性传声器构成的偏向强度差的拾音阵列和时间差强度差复合阵列的声像定位准确度均好于偏向时间差的阵列。另外,反射声和混响声能量过大也会影响声像定位的准确度。偏向时间差的阵列由于使用全指向传声器,可以拾取更多的反射声和混响声,而且传声器间距较近时多支全指向传声器均会拾取声源的直达声,信号间相关性高,容易加大相互串扰,影响定位准确度。而偏向强度差阵列和时间差强度差复合阵列拾取的混响能量则相对较少,拾取的直达声能量相对较多,致声源的定位更清晰[12]。

人耳对音色的感知与频响有紧密关系,一般全指向传声器比指向性传声器音质更加柔和、松弛,其低频响应、离轴响应和频响的平直度等方面都更好,因此选用较多全指向传声器的偏向时间差的拾音阵列在音色的自然程度上优于其他类阵列 。实际使用中,OCT 3D阵列为下层左右两侧的超心形传声器增加2支全指向传声器,并进行低通滤波来弥补指向性传声器低频响应的缺陷,低频拾取效果有明显的改善,但整体音质仍明显不如使用全指向传声器的组合方式。

整体空间印象包括空间环境大小、空间活跃程度、包围感等因素,对空间的感知主要与直达声混响声的比例关系、反射声的入射角度、低频信号的能量和相关性等因素有关[13]。为了重放出更好整体空间感和包围感,三维声拾音阵列应充分拾取混响声和侧向反射声能。另外还应考虑各传声器拾取信号的低频能量和低频相关性问题,尽可能做到充分拾取低频能量和较低的通道间低频信号相关性。因此对于偏向强度差的拾音阵列而言,由于其选用了较强指向性的传声器且传声器间距很小,既不能保障低频能量的充分拾取也很难保障提供足够的低频去相关性,整体拾取音质显得干瘪、不自然,包围感和空间感也较差。时间差强度差复合阵列大多使用具有大间距的心形传声器,在直达声混响声比例、低频能量和相关性方面获得了相对均衡的拾取效果,因此具有较好的整体空间重放效果。而大量使用全指向传声器的偏时间差阵列具有最好的低频拾取能力,但由于传声器间的信号串扰较多,信号相关性较指向性传声器更大,因此为了获得更好的空间感和包围感需加大传声器之间的间距以减小各通道低频信号间的相关性[7]。

综上,将三类三维声阵列拾音效果差异总结见表1。

表1 不同类型三维声阵列拾音效果差异对比

4 结语

实现古典音乐三维声拾音的基础是三维声拾音阵列,录音师不仅要熟悉现有三维声拾音阵列的设计思路和音响特点,更需要在实践中根据特定的环境和声源特点灵活地运用。文中从三维声重放对古典音乐的作用入手,对古典音乐的三维声重放系统和三维声拾音阵列进行梳理和总结,并对不同拾音阵列的拾音效果进行了分析比较。后续文章中,笔者将会结合具体拾音案例对古典音乐的三维声拾音技术进行梳理总结,并对阵列选择、传声器指向性、上层传声器使用等问题进行深入讨论。希望以此抛砖引玉,促使更多的专家学者和资深录音师广泛参与到古典音乐三维声录制技术的研究之中。

注释:

①APE(acoustic pressure equalizer),声学压力均衡器,运用于传声器的一种球形附件,利用球形表面的衍射来改变传声器膜片附近的声场,从而提升传声器的中高频、高频响应,并增加高频指向性。

猜你喜欢

时间差传声器指向性
正确选择传声器的响应类型
一种接收换能器指向性凹陷方法
表面传声器校准技术研究
量子定位系统中符合计数与到达时间差的获取
人大专题询问:增强监督“指向性”
声波测井圆环阵指向性设计
基于BP网络的GIS局部放电声电联合检测故障定位方法
立体声音乐节目后期制作中声像定位的探讨
忽逢桃林 落英缤纷——我的“指向性写作”教学点滴谈
厘米级室内无线定位方法研究