自制3D环绕声录音制式与定位的可行性
2021-06-06刘扬李马科
刘扬 李马科
【摘要】 自VR技术在80年代被提出发展至今,视觉3D已日趋完善。听觉3D立体声应用于双声道立体声中的立体声声场扩展技术以期待达到可以模仿人耳听感真实定位与立体相位的信号。然而现如今影院及家庭广泛普及的所谓5.1或7.1的环绕声并不是参照这种被人耳反相信号的真实听感,其原理与计算公式与3D环绕声相悖[1]。现如今,市面上已出现较“科学”的厂牌在做3D录音前期及后期解码的技术,但因为技术小众,造价太高,很多录音师选择放弃尝试。本此实验尝试利用相同的技术原理通过四只小振膜电容传声器输入信号,在平台中进行声音解码以达到听感3D的效果。经过这样的实验及分析,通过尝试为传统录音到3D录音的民用化做了有利的数据依据与理论依据。对本专业录音技术及未来教学方面提供更加具有方向性和理论依据性。
【关键词】 3d 全息 解码 ambisonic 定位
随着VR技术(Virtual Reality 即虚拟现实技术)与全息投影技术的日渐完善,人们对声音的需求也同步提升。3D制式的进步让人们追逐完全真实听感的想法变为可能。
3D格式不同于其他的多声道环绕格式,它的传输通道不携带扬声器信号。相反,它们包含一个独立的扬声器再现声场称为Format-B,然后解码听者的扬声器设置。Format-B的组件可以被模拟成虚拟传声器的任何一种模式(全方位、心形、超心形,或任何关系)指向任何方向。几个传声器的不同参数可以同时导出,最终解码成立体声或环绕声。
虚拟的传声器设置是全息解码的理论基础,这意味着它具有恒定增益多条轴线上声音的可能。我们所需要的声音能够被挑选出来,更大程度的解决了反相与声音的掩蔽效应,并直接和实际空间多维度的反射声混合,以達到最终的还原度。
扬声器的信号是通过将分量信号的线性组合得到,其中每个信号是依赖相互关系的一个假想球体的表面。但在实践中,稍微不规则的扬声器的距离就可能会出现延迟。所以,更需要真正将解码信号考虑到人耳在空间均衡和低频声音的定位机制。进一步细化听众的距离从扬声器到人耳的近场补偿。
3D录音技术在二十世纪八十年代出现,发展到今天,主要运用在VR技术上。3D音频主要是通过利用3D环绕声录音制式来进行录制,再通过解码利用3D环绕声系统行回放。传统的环绕声系统,是通过一个音响的信号递减到另一个音响信号递增来实现,然而现实中的声音并不只是如此,所以这时需要将经过矩阵组合的录音制式音频,通过Ambisonic[2] Format B进行解码,得出一个全息音频。
以下是市场上常用的的3D录音传声器。左一的Sound-Field传声器,是由四个相同的
振膜组成,每一只传声器之间形成ortf立体声录音制式, Ambisonic技术通过收集若干个声音的信号,经过算法形成一个3D的全息“场”。此类使用4个声道的是 第一阶段(First Order Ambisonic,FOA)。这种Ambisonic传声器上有四个心形指向的振膜,指向左前LF、左后LB、右前RF、右后RB四个方向,这4个声道的信息被称为Ambisonic A-Format。通过4个声道的叠加或反相叠加,我们可以得到Format-B,如下图所示:
它的优势在于,每一只传声器的角度都经过了精密的计算,所以采样精度也会相对较高,而且可以与便携式录音机配合适用,携带方便。它是以ortf录音制式为基础,拾取多个面的声音信号,此时的格式为Format A。再通过Ambisonic Format B进行解码,此时的声音信号不只是有X和Y轴,更多了一个纵向的Z轴,形成了具有垂直信号的3D信号[3]。
它的缺点在于角度不可调,由于四个传声器的振膜是已经固定的,所以当我们需要调整四个振膜的角度时是不可行的,并且,如果其中一个振膜损坏,那么整只传声器就因此无法工作。
自制3D录音制式,首先我们得准备4只型号一样的传声器,如se1a,和相对应的麦夹,如图:
将麦克固定在麦架后,mic A,mic B,mic C ,mic D ,相互形成ORTF制式如图所示:
这样,一个简单的自制Format-A制式传声器完成。与市面生产的Format-A 传声器相比,自制的Format-A 传声器可调性更高,但这也是它的缺陷,自制的3D录音制式的精确度低于Format-A传声器,所以需要我们不断得去调整角度,尽管如此,我们依然能利用自制的3D录音制式录制出Format-A的音频,通过Format-B解码形成3D立体环绕声。
自制的3D录音制式,与Format-A录音制式相比,携带不方便,我们自制3D录音制式时,需要注意的是,四个传声器的型号要相同,四个传声器所使用的麦夹,信号线,增益也要相同,也就是说,这四个传声器相关的变量[4]必须是一模一样的。
自制3D环绕声录音制式所录制的音频,可以通过B-Format解码成各种各样的环绕声系统,如5.1,7.1等立体声系统。
虚拟的传声器设置是全息解码的理论基础。这意味着它具有恒定增益多条轴线上声音的可能[5]。我们所需要的声音能够被提取出来,更大程度的解决了反相和声音的掩蔽效应,并直接和实际实践多维度的反射声混合,以达到最终的还原度。
自制3D传声器越多,能拾取到声音的精度就越高,同理,回放3D录音制式拾取的声音信号,音箱越多,则回放地更精确。自制的3D传声器,可以在Format-A的制式中进行改良,使自制3D录音制式更加地精确的3D环绕声。虽然自制的3D环绕声录音制式由于无法达到工业标准化并不能与专业的Format-A录音传声器媲美,但是自制3D环绕声录音制式和定位是可行的,它们形成的球面是一样的,同样最后也可以使用Format-B去解码生成全息环绕声信号。
3D环绕声在当代运用越来越广泛,且发展迅速,包括VR游戏,电影院等也用到了3D全息的技术。未来3D环绕声也还会让人们与电影或者游戏形成交互,人们不再是被已经设定好的剧情去欣赏一部电影或玩一部游戏,而是通过3D全息技术、“捆绑”视觉与听觉去选择自己感兴趣的剧情,致使人们的娱乐方式逐渐从共享变成了个享。研究3D的录音制式与回放系统,符合时代的发展的需求,在有限的条件下我们依然可以自制一个3D环绕声录音制式,去还原真实的场景。
参考文献
[1]Alexander, Robert Charles (2008). Michael Gerzon: Beyond Psychoacoustics. Dora Media Productions. ISBN 978-0-9560160-0-3. OCLC 663423066.
[2] 3D Sound Field Recording with Higher Order Ambisonics Objective Measurements and Validation of Spherical Microphone. Authors: Bertet, Stéphanie; Daniel, Jér?me; Moreau, Sébastien Publication Date: May 1, 2006
[3]M. Noisternig, T. Musil, A. Sontacchi, and R. H?ldrich. A 3D real time Rendering Engineer for binaural Sound Reproduction. In ICAD, vol- ume 9, pages 107-110, 2003.
[4] D. Menzies. W-panning and O-format, tools for object spatialization. In Proceedings of the 22nd International Conference of the AES on Virtual Synthetic and Entertainment Audio, Espoo, Fin- land, 2002.
[5] Warusfel, O. Listen hrtf database. http://recherche.ircam.fr/equipes/ salles/listen/index.html, 2003.
劉扬:1994.07;女;民族:汉;籍贯:安徽省淮北市;学历:硕士; 研究方向:新媒体艺术。