观演环境声场声效控制技术的研究与应用

2019-03-25孟子厚戴璐李志雄徐伟掌张婧颖何穆

演艺科技 2019年3期

孟子厚戴璐李志雄徐伟掌张婧颖何穆

[摘要]综述国内专业音响行业对声场控制技术的研究现状，包括中国传媒大学的理论和实验研究、音王公司基于物理仿真的声场控制技术研发和声场声效补偿和调谐技术、励丰公司基于闭环控制的声场控制技术的研发、飞达公司的电影音响低音增感技术的试验研究，以及传媒大学、音王公司、飞达公司等在电影全景声声场和声效技术上的应用研究等。

[关键词]观演环境;声场控制技术;可变混响技术;实验研究;应用

文章编号：10.3969/j.issn.1674-8239.2019.03.006

1引言

随着中国经济社会的发展，文化设施的建设也纳入了社会基础建设的范畴，除了大型的地标性的文化设施，地区性、社区性的文化观演设施的建设是未来文化设施建设的主要任務。根据国家文化设施建设规划的要求，在未来一段时间内，县级以上的建制地区都要建成“四馆”设施，这其中就包括演艺场馆的建设。这类文化演艺场馆建设中，综合性的多功能场馆是未来基层演艺场馆建设的主要形态，但是多功能演艺场馆所需要的声场声效控制技术严重滞后于建设需求。针对这种情况，需要研究在多功能场馆中用重放声构建音乐厅、歌剧院、戏剧场、影院等演艺空间的声场和声效的技术;需要研究创新性的、适用的声场构建和声效控制技术理论、方法和关键系统设备，从而推动相关行业技术进步，打破国外在此技术领域的垄断，推动中国专业音响制造业从“大”向“强”的转变，为各类声音艺术观演提供更加灵活、适用、新颖、生动的艺术科技创作手段。

为了配合国内文化设施建设的需求，专业音响行业的相关企业和研究机构早在十几年前就开始在跟踪消化国外相关技术的基础上开展适合国情的声场控制技术研究。其中主要的工作有华南理工大学建筑物理专业（简称“华南理工”）、中国传媒大学传播声学研究所（简称“传媒大学”）、音王电声股份有限公司（简称“音王”）、广州励丰文化科技股份有限公司（简称“励丰”）、广州飞达音响股份有限公司（简称“飞达”）等。在前期工作中，传媒大学、华南理工、音王、励丰等开展了声场构建原理性仿真和实验研究。在实验研究基础上建立了具有自主知识产权的声场构建模型、低音增感模型，场景视觉心理对声效感知的影响模型等。励丰开展了声场和电声系统的智能化检测与调试研究，音王与传媒大学进行了声场补偿和非线性调谐技术的研究。传媒大学和飞达公司进行了低音增感的机理试验，在此基础上设计研发低音增感的核心技术和处理器。传媒大学广播电视数字化工程中心研发了用于声场处理的多通道实时卷积处理器，开展了对声场声效综合处理和复用的关键设备和系统平台的研发。

经过十几年的自主研发工作，国内专业音响行业的相关企业在多功能演艺场馆的声场控制技术上已经取得了明显的进步，产生了多项成果，研发了多项声场控制系统和关键设备，并有了初步的工程应用。从技术水平和初步的应用效果来看，目前国内在声场控制系统上的技术水平正在逐渐赶超国外类似系统，既有自己的技术创新，且针对国内文化设施建设的适用性，性价比是国外类似系统所无法相比的。当然，这项技术的全面推广应用，还有一些技术问题需要继续研究解决。预计未来5年至10年，多功能演艺场馆的建设和对声场声效控制系统和技术的需求将迎来一个高潮。为了使得社会和行业了解国内相关技术的水平和现状，笔者对该领域的主要工作做以下综述，供相关建设、设计等单位参考。

2国外相关技术概况

声场控制任务的核心是控制声场的混响时间，早后期反射声的构成比例，用重放声的手段模拟出不同演出环境所需要的混响时间和空间感等。通过电声手段改变厅堂声场环境的方法已经使用了几十年，早在1965年，AR系统利用赫姆霍兹共振方法改变了一座厅堂的混响时间，之后有电声公司或研究机构根据不同的声学原理开发了数种基于重放声的可变混响系统，并一直改进优化至今。目前市场上主流的声场控制系统有：

·MCR（Multi-Channel Reverberation）多通道混响系统，Franssen（Philips），1969

·ACS（Acoustic Control Systems）声学控制系统，DeVries，1987

·LARES fLexicon Acoustic Reinforcement andEnhancement System），Griesinger，Barbar，1988

·VRAS（Variable Room Acoustic System）可变室内声学系统，Poletti，1993

·VIVACE多功能创新声学引擎，Muller BBM和Sallzbrenner Stagetec，2008

其中，VRAS是将MCR和ACS两种系统的优势结合并进行优化而来，并在2005年被Meyer Sound收购，改名为Constellation;LARES为E-Coustic的前身。各类系统的主要原理如下：

（1）ACS（声控制系统）

以原信号与系统脉冲响应的卷积来附加混响主要是传声器拾取舞台、乐池多点位的信号，信号进入前置放大器，进行通道均衡，输出信号进入前期反射声处理矩阵。再进入混响声处理矩阵，分别分送给对应的扬声器。每只传声器覆盖5m²～10m²的舞台面积。扬声器的大体布局为：用于音乐会演出的舞台反射罩扬声器在舞台空间的上空或四周，前期反射声场扬声器在观众厅前半部的上空或侧墙，混响声扬声器在观众厅的后半部上空或侧墙，舞台返送扬声器靠近台口并朝向舞台。

（2）MCR（多通道混响系统）

以“扩散声场”为对象，主要原理是运用大量的放大通道有效地提高混响声能，从而改变或者延长混响时间。如果声源的声功率保持不变，改变混响声场的声压级，混响时间将会发生变化。混响时间的增加与声压平方的增加成正比，系统增益的大小取决于放大声道的数目。通过需要的混响时间的变化，可估计出所需通道的数目。

（3）VRAS（可变室内声学系统）

利用电声耦合，以一个专门设计制作具有单一性质的“数字式电子混响器”代替“真实的耦合空间”信号处理器：输入交叉耦合矩阵、多通道混响器、反馈交叉耦合矩阵、输出交叉耦合矩阵。传声器信号馈送给输入交叉耦合矩阵，输出一路直接连输出，另一路接入混响器网络，经过环路增益调节反馈到输入，产生输入信号的再生混响，最后送回室内扬声器。

（4）VIVACE（多功能创新声学引擎）

采用卷积算法，系统中包含在许多著名厅堂所采集的室内声学特性参数，利用所采集的参数将项目厅堂卷积为目标厅堂的声学特性参数。系统可以有多个独立处理引擎可以对大厅多个不同的声学区域进行声学优化。（混响时间、混响电平、频率特性、反射密度、瞬态响应的调整以及对早期反射声、混响声進行独立控制。）传声器数量比较少，一般有4支～12支。

（5）E-coustic（电子声学系统）

通过时变人工混响改进室内声学，推出专有的声学算法，可以精确模拟“房间”所有关键声学参数。系统的硬件采用声学处理器和矩阵处理器，声学处理器有4个独立的声学处理引擎，每个声学处理器对直达声、反射声及混响的声音能量进行独立的控制，同时能够调整所有的关键声频参数。此系统的优点是：传声器和扬声器可以放置在彼此较近的地方，不会出现声反馈带来的声染色;同时，系统可以减少传声器的使用数量。

如上所述，目前市面上比较常见的国外团队开发的电子可调混响系统，其技术和产品都已经经历了十几年的沉淀和更新换代，各项技术趋于稳定，且在国外多个厅堂里使用。

国内目前已经有数座大型剧场安装有国外声场控制系统，典型的有青岛影都大剧院、敦煌大剧院、天桥艺术中心、大连国际会议中心、广西文化艺术中心等。这些进口的系统虽然技术比较成熟，但是造价昂贵、操作复杂，在国内大多水土不服，很多系统从竣工之日开始就基本成了摆设，很少使用。而且昂贵的造价不适合国内大量的基层中小型多功能剧场的实际情况和演出需求。因此，立足国内文化设施建设的特点和需求，在消化参考国外技术的基础上，自主研发适合国内剧场建设需求的声场控制系统是十分必要的。

3声场控制技术总体研究概况

声场控制技术的核心是环境的混响控制，也就是可变混响技术。可变混响技术有两个途径，一是通过物理手段进行混响控制，但是成本太高，除非超大型的演出场馆可以承担，一般的演出场馆难以承担高额的造价。二是通过电声重放的手段进行混响的模拟，这种技术比较切实可行，易于推广，也是未来多功能场馆声场控制的主流。通过物理手段进行混响控制主要有三种方法：调节室内的吸声量、改变空间体积、利用耦合空间。第一种方法的改变量有限，早期北京建筑设计院的项端祈先生等在这方面有过研究和实际的工程案例。第二种方法实际的可行性不大，国际上也只有一、两例成功的案例。第三种利用耦合空间来改变混响的办法，国际上有许多成功的案例，最显著的就是新加坡滨海艺术中心的音乐厅，混响时间的调节可以从1s到4s以上。国内目前还没有建成的成功案例，但是新建的北部湾大学音乐厅的声学装修拟采用耦合空间控制混响的方案。

对利用耦合空间调节混响时间的研究，国内最早是由华南理工大学的吴硕贤院士开展的，并得到了国家自然科学基金课题的支持。王福津在2000年前后开始对国外声场控制技术的研究和应用进行了考察，介绍了相关的技术。浙江大学建筑系张三明在国内最早尝试利用电声重放模拟厅堂早期反射声，进行了原理性试验研究。中国传媒大学传播声学研究所自2003年开始就开展了有关混响感知、设计和控制等方面的研究，并得到了数项基金课题的支持，十几年的研究取得和积累了一定的研究成果。国内专业音响企业中，开展声场控制技术研发，并已经有原型系统和初步工程应用的主要是广州励丰文化科技股份有限公司、音王音响股份有限公司、广州飞达音响股份有限公司等。其中，音王和励丰各自推出了原理不同的声场控制系统，飞达开展了利用低音增感技术来控制声场感知效果的技术研究。综合国内相关的企业和院校在声场控制技术上的研究格局，如图1所示。

国内声场控制技术的研究可以大致归纳为四个方面：声场构建的创新原理研究、声场智能感知与调谐控制技术研究、声场信号综合处理平台与关键设备研发、视听场景声效补偿与控制技术研究等。除了前述提到的吴硕贤院士、王福津老师、张三明教授等的研究工作，对声场构建的原理与方法研究主要有中国传媒大学传播声学研究所的理论研究，和音王公司、励丰公司的实验和工程研究。传媒大学在声场效果和混响感知方面的研究得到两项国家自然科学基金课题：“10474005中国民族器乐最佳听闻的室内声学研究”和“10874155主观混响感的因素分析及听觉心理研究”的资助，十几年来投入了数十名研究生资源在此方向上，以这些工作的成果为核心编撰成《混响的感知与设计》（孟子厚，戴璐著，中国建筑工业出版社，2018年2月），这对声场声效理论和技术研究具有实用参考价值。

基于不同的声场构建的理论模型，励丰和音王分别独立推出了自己的声场控制系统：基于闭环控制的声场控制系统，和基于物理声场仿真和多通道实时卷积技术的声场控制系统。在混响感的生成技术上，低音部分是个比较困难的问题，音王和励丰公司也分别独立进行了低音混响的技术研究。结合电影院的声场效果感知的特殊需求，飞达公司和传媒大学和作进行了低音增感的原理性试验研究，并在此基础上开发了低音增感处理器。

4基于物理仿真的声场控制系统——CDC.Revb

音王推出的声场控制系统CDC.Revb，在2017国际电影电视声音技术高端论坛（IFTT）上，受到行业内外专家的好评，荣获首届IFTT-CC国际“劁·兿”大奖。这套系统的技术原理是基于物理仿真和多通道实时卷积技术的，其算法是在大量的实验研究基础上形成的，其基本原理是利用舞台上空悬挂的传声器阵列拾取舞台上表演的声音，通过声场仿真算法计算出原有物理厅堂在不同吸声处理情况下各个声音重放位置处的传递函数，然后通过多通道实时卷积将舞台上各区域的声音与传递函数卷积重放，以此来模拟物理厅堂的几何构造不变化的情况下，厅堂在不同的吸声处理条件下的混响时间。同时，该系统也可以等比例放大物理厅堂的尺寸，围护结构造型不变，以此来改变厅堂的虚拟体积。

这种算法有别于国外类似的基于卷积技术的算法，最大限度地保持了原来物理厅堂的特性，虚拟出原来物理厅堂的等比例变形和不同的声学装修所营造出的声场效果。它所基于的原创研究基础和技术特点如下：

原创研究基础：

·混响感控制因素研究

·音乐听闻的最佳室内声学研究

·混响与清晰度关系的研究

·虚拟空间生成方法研究

·混响感的频率特性研究

·低频混响感与处理技术研究

·自定义阵列分区拾音技术研究

·物理空间与虚拟空间耦合技术研究技术特点：

·自主知识产权

·专利核心声学算法和信号处理技术

·用于对音乐环境有较高要求的场合

·与全景声重放系统的复用

·基于物理声学并运用了心理声学的原理

·有效增强混响感、空间感和声场的艺术表现力

·较高的集成度和灵活的扩展能力

·营造虚拟声学环境

CDC.Revb在声学功能上的特点，除了控制混响时间，还可以增强清晰度满足会议和话剧表演的需求，可以控制空间感和视在声源宽度（ASW），满足各类不同的观演需求，可以调节混响感的频率特性，并自由进行声场模式之间的切换。CDC.Revb在技术和工程上的创新特点包括基于物理声学和心理声学试验的自然听感，可以在不改变混响时间的条件下控制混响感，吊挂在舞台上方可以自由升降的传声器阵列，以及声场分区控制、个性化参数和数据库等都是此系统特有的技术。

图2所示是CDC.Revb的系统组成，包括舞台拾音传声器阵列、扬声器系统、核心处理器（卷积器）、功率放大器、接口箱、以及按需求选配的调音台、PC端控制软件、移动终端控制App等。核心处理器是由处理能力可达每秒10¹²次浮点运算（TFLOPS）的FPGA构建的48路的实时卷积处理器，并带有常规的音频处理功能（滤波、延时、增益控制、矩阵分配等）。CDC.Revb的基本配置是48路声音通道，在大型场馆或需要增加扬声器数目时，可以将三台核心处理器联机使用，通道可以增加到144路，并且由软件统一控制。CDC.Revb的移动终端控制界面，可以快速在已经设定好的声场模式间切换，并且可以调节系统的增益和直达声与后期混响声的比例，以快速调节混响感。

CDC.Revb已经完成初版系统的开发，并且安装了数套试验和工程应用系统。目前还在做进一步的深化完善，进行系统的全数字化提升和扬声器系统的小型化，未来的改进版将更加功能丰富，控制和安装也会更便捷，也可以适用于在户外快速搭建虚拟的生态剧场和音乐厅等。信号的传输将全部实现基于AES67的网络化传输。

5基于闭环控制的声场控制系统-LemuseREAS 3000

励丰是国内最早在跟踪消化国外技术的基础上独立自主开展声场控制系统研发的专业音响企业。其推出的数字声学环境系统“Lemuse REAS 3000”是基于闭环控制原理来模拟形成虚拟混响，并控制声场的其他参数，基本原理如图3所示。Lemuse REAS 3000的研发经历了十几年的时间，如图4所示。2010年推出第一版，2014年推出改进了的第二版，目前推出了最新的第三版。最新版的特点是核心处理器与10分离设计，实现了全网络数字音频信号传输、新的控制软件、快速模式切换等。目前，Lemuse REAS 3000的稳定陛、可靠性、集成度等已经达到甚至超过了国外同类的系统，其性价比远远高于国外同类系统。

Lemuse REAS 3000核心处理器的最大输入输出可以到128×128，且有实时热备份传输接口，充分保证系统的可靠性。图5是Lemuse REAS 3000的控制软件的界面。经过十几年、三代产品的改进提升，励丰公司的这套声场控制系统日臻成熟，也积累了多个剧场的实际安装使用的工程经验，如泰州大剧院、新加坡茨园民众多功能俱乐部等。其中，最近安装的廊坊壹佰剧院，不论从实际测试和听感上来看都比较成功，声场控制效果明显。根据现场演出过的艺术家和专家的评价，总体效果上难以区分与国外类似系统的差别，而且有自己的特色。励丰公司目前还计划继续改进提升此套系统，主要的研究工作包括：提升声效生成自然度问题、在有限扬声器数量下提高混响增益、降低声染色、进一步提升不同场景下的声效模式切换速度、改进早后期混响声能量独立控制功能、增设传输频率特性调整功能等。可以期望，这些进一步的工作完成后，Lemuse REAS 3000的更新一版的技术水平、可靠性、实际的听感效果将会达到同类系统中的国际领先水平。

6声场声效低音增感技术

在声场声效的生成与控制中，低音是一个比较困难和特殊的问题。其困难在于物理和听感两个方面，物理上低音的产生和激发是相对比较困难的，也难以达到声场的均匀。在听感上，低音的作用可能会导致正反两个方面的生理和心理效应。次声和可听低音对人生理和心理的影响研究已经有多年的经验和大量的结果，但是所研究的低音主要是侧重于人不想听到的声音，从主观层面上希望消失的声音，而对于电影声以及专业扩声领域中的低音是人们在看到视觉信息时想要听到和期待听到的声音，这种低音对人感知的正面效应的试验研究较少。虽然虚拟低音技术利用了心理声学方法从应用层面对低音进行改善，但是效果并不是很理想。在音王和励丰的声场控制系统的研究中，都对低音作了特殊的处理，低音的混响感难以直接根据中高频同样的算法来产生，需要根据试验结果采取不同的处理。通常，低音音量的提升自然会使人感觉到混响感或空间感的增加，即使实际的低频混响时间并没有增加。飞达和传媒大学对在剧场和电影院里如何利用低音来增加人的听觉感知效果方面，进行了大量的试验研究，并开发了用于低音声场控制的增感低音处理器。

低音增感技术的原理是基于低频声对人的生理和心理影响机制，试验研究通过控制低音的声压级以及频率等特性，观察低音刺激下大脑不同功能区的能量变化情况，比较低音的物理参数与脑电波能量激发和抑制变化之间是否存在规律性来验证低音增感技术的可行性。通过主观听音试验获得不同主观情感增量与低音的频率范围、特征参数等物理参量之间的相关性，得到以不同增感为因变量，低音的物理参数为自变量的算法关系。目前已经完成了低音刺激下的脑电波诱发实验，得到了在不同频率特性的低音环境中人的大脑额叶和颞叶区的功率谱密度诱发和抑制的规律性，与情感感知有关的导联位置易收到刺激信号的激活和增强，Gamma波的能量有抑制的趋势，20Hz及其倍频关系的低音可能用于低音增感的頻段。表1所示是前期试验研究中得到的在60%阈限条件下低音刺激对脑电波的激活/抑制关系，其中s1到S10是10种不同组成成分的低音刺激。

低音的主观听感试验中以15Hz～120Hz范围内的低频多频声和1/3倍频程窄带噪声为低音信号进行愉悦度、唤醒度、优势度、烦恼感、空间感和带入感6个主观参量的等级评价。系列范畴法的结果表示：低音可以增强被试的唤醒程度、提高注意力;使被试感觉到受到低音信号的影响和支配、自身的优势度下降;以及可以引起较为明显和强烈的烦恼感觉;增强被试对空间感知的判定;以及由于低音的存在使被试更容易被带入某种情景或感觉中。男女被试在评价低音引起的愉悦程度和受到信号影响、控制的程度有显著的差异性，这个差异性可能与不同性别对愉悦感以及对自我优势程度级别设定不同有关。1/3倍频程窄带噪声信号的结果可以大致以31.5Hz和63Hz进行划分，由于人耳对低音的敏感性较低，120Hz以下的窄带低音信号对主观情绪感知的影响可能大致分为3个范畴。图6所示是20种低音刺激信号引起的带入感的主观感知试验结果。试验结果证明了低音可以增强主观情绪感知，可以应用于已有这些情绪感知的场合中，起到进一步增强的作用，或者通过低音来制作想要体现这些主观情绪感知的音效。

图7是飞达推出的增感低音处理器的结构设计逻辑。目前，该增感低音处理器主要针对电影院的声场声效控制应用，需要对电影的视觉场景和所要表现的情感场景进行检测匹配，当然也可以直接应用于其他的观演场所和环境。飞达和音王在国内电影音响市场上占据了大半的份额，有数万个银屏的存量市场和每年数千个银屏的增量市场，增感低音技术的技术经济效益十分可观。

7非线性与谐和性音质调适技术——Pytha-88处理器

扬声器系统的非线性失真是影响重放音质和声场效果的一个关键因素，也是音响领域研究中的一个难题。传统的处理手段是在扬声器单元的材料、结构和工艺上进行改进，但这会受到其他相关行业发展水平的限制以及经济成本的大幅递增。所以，目前工程上基本都是采用均衡器对系统的线性幅频响应进行信号补偿，而这种方法本质上無法纠正系统的非线性失真，难以真正改善音质的失真，会影响声场声效的最终听感。在专业音响领域，除了录音监听，人耳听觉更多的是追求声音悦耳好听，极端的原声真实感往往是不切实际的。要使得声音好听，就要保持或增加声音的乐感，使其具有乐音的特点，其中的核心要素就是协和性，主要表现为声音谐波结构的规律性，而这一点与谐波失真等非线性问题在物理和听觉心理层面上具有内在关联性。因此，随着数字音频信号处理算法和DsP技术的日趋成熟，以及国内外在“数字预失真”和“声音协和性”等方面的研究积累，通过信号处理的手段进行系统非线性的调谐，从而提升重放声音的悦耳感，将为演出用音响系统的音质听感改善提供一种新的思路和技术方向。

传媒大学在多年声音谐和性研究的基础上，与音王合作推出了新的非线性与谐和性音质处理器Pytha-88。新的处理器针对音响系统中的声源拾取、扬声器系统以及听音环境三大核心环节，设计了“声音谐和性数字调制”、“扬声器系统非线性补偿”以及“声场音质自适应均衡”三个音质处理功能模块，它们既可以独立使用，也可以调谐适配级联。每个功能模块针对专门的处理对象，分别设计了独创性的音频信号处理核心算法，并通过软硬件系统实现。

（1）声音谐和性数字调制模块依据人声和乐器声这类具有谐波特征的声学模型，提出了一种声音谐和性数字调制算法，对舞台声源（语言声/歌唱声/乐器声等）的传声器拾音信号进行预处理，实现对声源本身的音色增强和听感协和性调制。

（2）扬声器系统非线性补偿模块设计了利用多项式模型和神经网络等非线性系统辨识方法的扬声器非线性建模，并采用数字预失真技术设计对应的非线性控制器，实现对扬声器系统的非线性失真听感补偿。

（3）声场音质自适应均衡模块设计了基于重放扬声器与听音位置的声传输通道自动化测试，并根据测试反馈分析提供用户自定义的声场均衡模式和听感补偿效果预置，满足听音者对环境声场的实际听感需求。

Pytha-88从音响系统的非线性失真与人的听觉心理属性之间的内在关联性出发，结合工程实践中音频传输核心环节的突出问题，提出了一套非线性音质和声效调谐技术，其中涉及的核心算法实验研究和基于DsP的系统实现，既体现了学术研究的价值，同时也为演艺场景的音响应用关键问题提供了实际可行的解决方案。目前，国内外还没有见到类似的新概念技术产品。图8到图11分别是Pytha-88的设计外观、处理器结构设计、功能模块设置以及Pytha-88的应用场景和可以实现的效果等。

8电影全景声声场效果生成技术研究

近年来，沉浸式音频技术的发展给国内电影产业也带来变革，数字影厅沉浸式声音或全景声放映已成为当今影院的热门配置。然而全景声技术一直长期被国外少数几个生产厂家掌握。国外主流的沉浸式音频系统主要有杜比全景声（Dolby Atmos）、DTS-x和Aur03D。近几年国内涌现出的沉浸式音频还音系统主要有中国多维声（13.1）、WANOS全景声系统、音王5228全景声系统、飞达六面全景声系统和Holosound全息声等，但国内的沉浸式音频系统在沉浸式音频的制作、编码、打包、解码、音频水印和现有系统的兼容性等方面还未有统一的技术规范，各家系统的实现方案各具特点、很难在专业影院进行推广。随着SMPTE 2098系列国际电影相关标准的发布，为制版的统一，系统间的兼容提供了技术标准指导。中央宣传部电影技术质量检测所目前计划联合相关厂家对SMPTE 2098-1、SMPTE 2098-2和SMPTE 2098-5标准的兼容性、技术专利壁垒、国产化可行性等关键问题进行研究，探索尽早打破国外技术垄断、统一制版、系统间互操作和与国际技术标准兼容，形成具有中国自有知识产权的全景声数字影院沉浸式音频标准化体系。未来的自主标准体系将给目前国内已有的全景声技术和系统提供一个统一的平台。

按SMPTE 2098的定义，全景声电影的声音技术主要有三个关键环节：

●沉浸式音频元数据：沉浸式音频由音频通道和/或音频对象组成，内容创建者可以利用它们来设计具有听众上方和周围的声音。元数据是沉浸式音频的核心，它能够将在声轨上的音频对象和音频通道成功的渲染到多个扬声器设备上。

●沉浸式音频比特流：沉浸式音频文件需要特殊的比特流和专门的通道进行传输，沉浸式音频比特流是用于传输沉浸式音频文件的工具。

●沉浸式音频渲染：沉浸式音频渲染将与画面相关的“声床”和对象元数据适当地渲染到可用的扬声器上，使得声音和相关的视觉元素在空间上匹配。

在前两个技术环节上，国内目前还没有自主知识产权的技术，如果按SMPTE 2098的标准体系来制定国内的全景声标准的话，在这两个方面也基本上是要采用国际上通用和成熟的技术，所以，国内企业可以有所作为的就是在第三个技术环节上，做沉浸式音频渲染，也就是全景声声场声效处理技术和设备的研究。

虽然目前国内有数家企业和创业公司推出了所谓的全景声处理器，但是真正有自己的全景声放音制式、有自己生产配套的全景声电影音响系统的只有飞达和音王，而这两家公司在国内国产电影音响市场上的份额占了70%以上，是专业音响行业的规模化公司。飞达的主流全景声电影声音处理器FCQA-9631已经安装了数百个影厅，与之配套的增感低音处理器型号为FCQA-9631s。目前，飞达正在FCQA-9631的基础上研发新一代的全景声处理器，新一代的全景声处理器除了具有增感低音功能外，输出的通道数将大幅增加，以满足更精细、更生动的声场声效渲染的需求。

音王推出了自己的5228全景声放音制式。这种制式有四层放音扬声器，顶层5只、高度层11只、水平层11只（包括3只主扬声器）、底层4只、还有4只超低音扬声器。这种设置可以全兼容目前市场上已有的各种全景声的放音制式，而且有利于后续的声音效果的生成与渲染。图12是5228全景声系统的配置。音王的5228全景声处理器技术的研发分为三个阶段第一代是一个声道兼容扩展式处理器，可以兼容市场上已有的各种全景声放音制式，转换到5228的放音制式下回放，并强化了回放声场的空间感和包围感，可以将平面环绕声变换到三维空间重放，产生一定的虚拟3D效果。5228处理器的第二代和第三代则是完全的真3D全景声，第二代是根据电影场景或声音元数据在传媒大学和音王的大量试验研究基础上发明的3D声效生成算法制作全景声音效果，然后通过5228放音系统重放，其性能和处理逻辑如图13所示。第三代处理器则是在录音制作阶段就运用了自己的特定的3D录音技术，也就是产生了自主的声音元数据制式。

9总结

以上综述了国内在声场声效生成与控制技术领域的基础研究和应用研发的概况，表2归纳了有关这方面研究工作的企业和院校具体涉及的研究领域。各院校主要是开展了许多基础性和原理性的研究工作，各企业主要是开展了应用研究和系统设备的研发。

国内的专业音响行业一直以来是劳动密集型的企业，技术含量较低。而声场控制技术的研究和应用是带动和促进相关企业技术转型和提升的一个很好的平台，励丰很早就看到了这一点，战略性地布局了声场控制技术和其他相关演艺技术领域的应用基础研究，通过十几年的努力，取得了明显的效果，也是国内最早开展声场技术研究的企业。音王近年来依托国家企业技术中心、博士后工作站并且与有关院校合作，大力投入高新技术领域的研发，不但推出了完全自主创新的声场控制系统，也独创性地推出了新概念声效处理器技术…一非线性谐和性调适技术，这项技术不但在国内独创，目前为止在国际上也还没有见到类似的技术和产品。音王公司也自主推出了目前放音通道数最多的全景声系统以及相应的声效处理器。通过这些战略性的研究计划，音王公司已经从劳动密集型的代工厂，到收购国外技术和品牌，正在向着自主创新、技术先导的技术型企业转型了。飞达是国内最大的电影音响设备制造商，占据国内电影音响市场的半壁江山，飞达最早推出了自己的全景声效果处理器，并在不断的改型和提升中，同时依托飞达的博士后工作站與有关院校合作，进行了低音增感技术的原理性试验研究，在此基础上开发低音增感处理器。这项技术和设备在国内外都还未见类似的技术和产品，飞达的研究工作是非常有专业特色和行业领先技术的。

基础性研究的成果要转换为应用技术和企业的市场经济效益，离不开关键设备和系统的研发。各企业也投入了相当多的力量进行关键设备和系统的研发，但是，目前国内专业音响企业的数字音频设备的研发能力还都很薄弱，需要一段时间来建设和培养，与相关的院校和专业公司合作也是一条可行的路线。传媒大学传播声学研究所不但在声场控制技术领域的基础研究上进行了多年的全面的研究，近年来由传媒大学的（教育部）广播电视数字化工程中心与相关企业合作，承担、参与、指导了多项关键设备的研发，包括声场控制的关键设备、声场检测和调谐的关键设备、低音处理关键设备、数字传输设备、音频通讯设备和技术等，在此方面积累了相当的经验，也正在推进声场控制设备和系统的标准化和规范化工作。关键设备的标准化和规范化工作也是整合协调专业音响行业的技术资源，更有效地提升和推进国内声场控制技术、赶超国际水平的必由之路。

经过十几年的研究和研发工作，国内声场声效控制技术的水平已经有了长足的进步和提升，不但在基础研究上有独创性的理论和算法，也推出了颇具特色的设备与系统。虽然目前的设备和系统的稳定性、可靠性、操作性等与国外类似系统相比还需要改进，但是已经可以基本满足国内基层演艺场馆建设的需求，且性价比是国外设备和系统所无法替代的。相信经过行业内真正从行业技术进步的角度出发扎扎实实进行相关技术的理论和应用研究的企业和院校的努力，在政府管理部门、行业协会，以及场馆建设和设计部门的支持下，国内声场控制技术和相关设备系统的水平，一定会完全满足国内场馆建设的需求，并达到国际领先水平。