三维声(3D Audio)音频技术方案与标准测试探讨
2018-02-08陈宇海
文/陈宇海
引言
从工业时代至今,对声音技术的探讨,一直贯穿在社会发展过程中。声音技术在发展过程中经历了以麦克风、扬声器为代表的单声道音频、双声道立体声音频,再到之后的5.1环绕声,7.1环绕声音频等,声音技术日趋成熟,直至发展到今天的三维声(3D Audio)技术,从而使声音技术达到炉火纯青的地步。三维声技术的应用推广,使广播电视业和新闻业进一步发展创新。
1.三维声的相关概述
1.1 三维声的含义
所谓三维声,是指借助音箱阵列或耳机等,继而为听众创造出别样的声音影像,这些声音影像兼具三维空间感和方位感,从而使听众在虚拟的场景中保持清醒的头脑,对于发声的位置可以做出准确判断,而这些声音,则与人们在现实世界中所听到的方式符号一致,从而满足人们对声音感知的需求。
1.2 三维声的分类
一般来讲,三维声通常分为三层空间。第一层空间则为人耳高度,也就是说,声音所能达到的高度,则为环绕声音箱所在的高度。第二层空间则是指与人耳位置从30度仰角的高度,鸟鸣声、风吹声,则表现得尤为明显,是这一层空间高度的典型代表。第三层空间高度则表现为人耳正上方所听到的声音,当然,这一层高度也被称为“上帝之音”,飞机飞过的轰鸣声,暴风雨来临之前的雷鸣声等,则是这一层空间高度的典型例证。
2.三维声技术分析
2.1 声道的实现方式分析
为了对三维声进行全面了解,需要对三维声的发声技术进行探讨。三维声这一技术的实现,依托三种形式,第一种则为基于声道的方式,第二种属于声传床+对象的方式,第三种方式也为基于场景,从而使三维声这一技术得以凸显和应用。首先要探讨基于声道的实现方式,这种方式表现为要对声道配置进行预先设定,进而将每个声道的音源可以直接映射到其指定的扬声器位置中。这种声道方式制作的音频可以确保声音达到预期的效果,但是为了确保声音可以在听众因为范围之内,需要听众对位置进行准确选择,基于声道方式制作的音频声音传播范围小,需要在特定的扬声器布局里重新播放,继而使其声音效果更为完美。
2.2 声床+对象的实现方式分析
三维声(3D Audio)是通过音箱阵列或耳机为听众创造具有三维空间感、方位感的声音影像,使听众在虚拟的场景中获得与人们在真实世界中心理听觉方式相符、与临场相似的听觉感受的声音系统。三维声技术在发声过程中也需要用到声床+对象的实现方式,声床对基本环境声起到承载的作用,属于基本声场的音频信号。声道和特定扬声器位置紧密相连,因而,要想使声床+对象这一方式实现,需要对元数据定义的声音场景进行预先设定。
2.3 场景的实现方式分析
现如今,民众对音频技术的要求越来越高,为了满足民众的需求,基于场景的实现方式在三维声音制作中受到追捧和青睐,基于场景的实现方式技术的应用和推广,声音在捕获方面和音频选择方面得到很大的突破。在这种发展模式下,声音作为压力波进行传递,对于给定时间的声音场景,每个点都需要借助数个压力函数得以体现,也就是说,每个点的压力值在声音技术方面发挥着重要作用。倘若获知该空间中每个点的压力值,便可对空间中的声音进行完美重构。当然,为了对每个点的压力值进行捕获,需要借助一些方法对其进行处理。其中,包括基于球面谐波变换的高阶精度系数,进而对三维空间所有点的压力值进行表述。空间中每个点的压力和其邻近的点存在一定的关系,因而,可以借助麦克风阵列对声音进行全方位收集,应用数学原理和公式对其进行计算,进而将上述系数进行有效推导。与此同时,为了使基于场景的音频制作方式的优势得以充分发挥,需要对HOA系数进行准确获取,提高生产空间系数的编码质量,克服音频制作方式的难点,从而使基于场景的实现方式的效能得以最大发挥。设计基于VBAP基本原理的三维音频编解码框架,以3个声道为一组合成虚拟声源及下混信号,编码时增添时间差参数,在解码端提出基于线性方程组求解的虚拟声像重分配方法,获得与原始声道配置一致的重建信号。
2.4 三维声重放环境分析
三维声重放环境在三维声音频制作中发挥着重要作用,这种技术在日本电台表现得尤为突出。日本电视台的22.2多声道音频采用重放环境这一技术,有22个宽频扬声器和2个低频扬声器构成,当然,也可以使用较少的扬声器对声音进行重放。扬声器使用数量的多少在很大程度上影响着最佳听音的区域范围,也就是说,扬声器数量少,最佳听音的区域范围也就越小,两者呈正相关。近年来,这种技术在我国音频制作中也得到普遍应用和推广,电影院也在采用这一技术,从而使音频质量不断提升。
2.5 双耳渲染技术
虚拟现实(Virtual Reality,VR)的兴起使三维音频技术得到进一步的应用。VR中三维音频的回放一般采用基于双耳的方式,目前,VR中应用较多的三维音频技术有基于物理声场重建和球谐分解的Ambisonics技术、基于自然双耳录音(Binaural recording)的技术,以及基于头相关传递函数(Head Related Transfer Function,HRTF)重建的技术。双耳渲染技术是指三维声的重放可以依托扬声器和耳机得以实现,为此,为了使这一技术的性能和优势得以充分发挥和体现,需要对事先制作好的音源成品编码文件进行解码,从而使普通立体声耳机可以聆听三维声音频。双耳渲染技术的诞生和应用,使三维声这一技术更为成熟,满足了民众的精神需求,顺应了时代发展潮流,从而使这一技术更为成熟。
3.三维声在我国的标准
3.1 三维声专题组的成立
为了使三维声这一技术在我国进一步推广和应用,我国于2012年3月成立了AVS技术应用联合推进工作组,这一工作组主要是由工业和信息化部电子信息司与国家新闻出版广电总局科技司共同成立的,这一工作组的成立,有利于我国广播电影电视新业务的进一步发展,从而使我国自主创新技术更为成熟。2016年2月19日,我国成立了三维声专题组,三维声专题组的牵头单位是中央电视台。这一专题组的成立,使广播电视领域的三维声节目制作、传输分发和重放技术工作进一步开展。
3.2 三维声在我国的发展
近年来,立体声、多声道音频编码技术发展迅速,在许多领域都获得了广泛应用。三维声在我国发展过程中需要经过一定的时间考证。三维声专题组完成需求制定工作的时间是2016年4月15日,之后于4月16日三维声技术提案征集得以启动。在此之后,三维声专题组召开第一次工作组会议。各提案方提交三维声的最终提案时间为2017年1月19日,2017年10月完成标准的测试验证工作。当前,三维声专题组正在进行测试总结,并开展标准的撰写工作。
3.3 三维声在我国广播电视行业标准的探讨
从目前发展情况来看,我国的三维声广播电视行业标准现阶段基本上采用基于声床+对象的实现方式,也就是说,需要在视音频压缩编码端和接收终端进行测试。因而,需要对支持的对象进行明确,具体表现为三维生产中的坐标定位、音量大小、对象声音有无等。同时,也需要对下方控制、声道描述、节目相关信息描述等工作进行有效开展。此外,在后期制作中也需要对支持对象进行明确,在后期制作环境中,至少需要支持64个对象,在直播环境中最少需要支持四个对象,从而营造良好的环境氛围,进而满足听众更高层次的声音享受。
结语
三维声的声音传播方式使声音效果发生极大变化,由最初的静态传播转变为动态传输。同时,三维生可以营造良好的声音环境,从而满足听众对声音的高层次需求。三维声技术的应用推广在很大程度上促进了广播电视业的发展,从而使科技更好地为人类社会发展服务。
[1]汪芮,覃毅力,张建东,等.三维声(3D Audio)音频技术方案与标准测试[J].广播与电视技术,2017(12):28-32.
[2]廖传奇,涂卫平.基于空间位置信息的三维音频编码技术研究[J].计算机工程,2017,43(1):303-308.
[3]张阳,赵俊哲,王进,等.虚拟现实中三维音频关键技术现状及发展[J].电声技术,2017,41(6):56-62.
[4]黄益超.立体声及多声道音频编码技术的发展[J].科研,2016(17):00011-00011.