音频系统中云技术的应用

2015-04-21

信息化视听 2014年12期

关键词：调音台音频架构

云，已经不再是高高在上了，在我们生活中有很多地方都能看到、用到，比如通过手机上网、收发邮件，利用网盘进行存储等。咱们专业AV行业中同样也有大量有关云的应用，在这里主要针对音频扩声领域进行说明。

音频技术中的云究竟是什么？是不是因为我们需要云，才有云这么一个结果呢？我想不是这样的。

用户需求下的音频技术发展

扩声技术从诞生到现在，已经历经多种变革。除去各种设备对声音处理的不同功能，从架构关系上，大致可以分为五代：

1.1.1. 第一代音频架构

第一代：纯模拟架构。体现为模拟连接、模拟处理。

纯模拟的第一代技术包括从调音台、均衡器、延时器、压缩器、分配器、分频器等多种声音处理的设备，从设备本身解决了声音的控制和处理，缺点是连接复杂、调试数据保存不易等。

1.1.2. 第二代音频架构

第二代：数模结合架构。体现为：数字处理、模拟连接。

第一代技术的缺点催生了新技术的诞生：数字周边和数字调音台，即第二代音频技术：数模结合架构。它们的出现解决了第一代的连接复杂，容易误操作的缺陷。

同时，随着社会对扩声技术的需求增加，以及数字技术的发展，很多不需要专门调音师固定安装的扩声环境，提出了另外的需求，即结合调音台与周边处理功能的基础上，增加更多的矩阵节点，将信号进行无损分配，此即第三代技术全数字架构。

1.1.3. 第三代音频架构

第三代架构：全数字架构。体现为：数字处理、数字连接。

此架构取消了调音台、数字周边和数字功放之间的模拟连接线，有的产品甚至取消了三者的概念，只有一台全功能数字音频矩阵，整合了调音台、周边处理和功放。此架构最大的优点是内部的数据交叉利用达到过去没有的条件，轻易做到64×64路甚至更大路数以上的矩阵（目前最高为256×256），并且可以在DSP资源许可的范围内，无限制地模拟出无数的音频处理模块。因为此技术，催生出了中央机房的概念。很多酒店或会议大楼在设计时，利用一个中央机房就完成了全部的设备管理。

1.1.4. 第四代音频架构

然而，社会的需求是不断进步的，第三代技术的优点使得用户在使用此技术时，极大地节约了技术人员的数量，并提高了整体运行的稳定性。但它的局限性是核心音频矩阵之间的连接关系只能在一间机房内完成，向外延伸的还是模拟线路。设备之间的数字连接不能支持公有协议。在应用这些技术的同时，人们希望将高品质的声音和系统处理能力传输到模拟线路不能到达的地方。此需求催生出了第四代技术：在第三代技术的基础上集成网络传输的能力，将高品质的声音和对整个系统的管理工作延伸到了过去无法到达的区域。最有名的应用就是ConbraNet。这些技术应用在大型扩声项目中，比如整栋大楼的广播系统、大型公共环境扩声等等。这就是第四代音频架构：数字网络架构。体现为：数字处理、数字连接、网络扩展。

第四代技术解决了高品质声音的远距离传输和对整个系统的整合管理的问题。将工作人员从每间会议室解放出来，在确保品质的同时甚至减少了系统的整体投入。

整个系统的核心是建立在DSP程序的基础上，DSP处理器可以同时进行多项任务的计算。比如一套系统不同端口独立工作，可以同时支持多个会议室的工作，或者不同的广播分区。全部的程序都是保存在一套音频处理系统中（有很多时候不是独立一台主机完成的），并且，用户的调试数据如音量、EQ、路由关系等是一个随时可能调整的变量。这些参数变量与系统程序一起构成了整个系统稳定运行的要素。

1.1.5. 第五代音频架构

第四代技术极大地方便了音频工作。随着大型网络化DSP系统的应用，又有了新的需求。大型项目对DSP的稳定要求也越来越高，一旦DSP主机出现故障，则意味着整个系统将停止工作。即便能够利用原始保存的程序恢复，但日常工作中经常调整的变量参数也难以恢复到最终的状态。不仅如此，由于第四代系统的DSP管理大型多分区系统时，无论哪个分区需要重新修改程序——即上传的时候，全部的系统都会停止工作，直到程序传完。这又将对整个系统的工作造成一次严重的伤害。

还有，一个大型项目往往不是同时竣工，需要在建设过程中不断增加功能。而第四代技术的DSP资源是在设计之初确定了的，无法扩展（多台主机分别处理不同的区域的方法不属于一个系统）。这又是大型系统建设的一个死穴。

随着社会的发展，IT行业推动了云技术的应用，云技术包括云计算、云存储、云备份等。云计算的特点是终端用户无需关注云端的主机工作状态，只需要考虑本地自己的工作要求即可。这些技术在比如电子邮件、微信、网盘等技术上已经获得了成熟的应用，得到社会的认可。

由于网络音频技术可以组建大型的扩声系统，并极大解放管理人员的工作压力，因此得到很广的应用。在第四代音频技术发展过程是体现出来的缺点是大型重要用户不能接受的。结合目前云技术的特点，诞生了第五代音频架构技术的需求。

第五代音频架构的特点

现在回顾开头所探讨的内容，音频技术中的云究竟是什么？现在大家想必已经有了答案，就是第五代音频架构的内容。其特点如下：

1. 系统架构为云架构：系统之间的连接为网络连接，输入模拟信号直接转换成了网络信号，输出端亦由网络信号直接输出成模拟信号，即AN/NA连接；中央服务器来完成全部的计算工作，终端用户无需考虑云端的工作状态；

2. 系统资源可以动态分配：每个终端分区可以自由申请资源分配。并且在授权分配的资源内可以自由上传或修改程序而不会影响其他任何分区的工作；

3. 云端资源可无限扩展：核心DSP数量可以无限量添加。添加方案可以是在服务器内部增加DSP模块硬件，或者是增加网络服务器；

4. 具有稳定机制：核心服务器必须能够在线热备份。热备份的内容包括程序和用户调整的数据；

5. 传输延时小：必须确保模拟语音输入至中央服务器处理完成，回到本地扩声过程不会引起用户的任何感觉。目前技术为十个中间环节总传输延时小于2ms。

6. 具有安全机制：确保系统内音频信号只能在指定的终端出现，不会出现泄密现象。

7. 兼容性好：同时兼容目前主流的公有协议，如AVB、Dante、ConbraNet等。

第五代音频架构的优势

基于以上的特点，我们可分析得出采用这种技术的优势主要有两点，即核心资源自由分配和核心资源可无限扩展。

先看核心资源自由分配。

在DSP资源当中，有的用得比较多，有的用得比较少，有的经常用，有的不经常。按照过去的概念，我们是否要建立完整的DSP资源给每一个房间的用户呢？假如说现在有三个项目，很简单，各取所需就可以了。但是如果在实际应用过程中增加或者退出怎么办？当然是希望系统能够动态分配。假如说现在有20个会场，但是肯定不会同时使用，我们在资源配置上只需要准备一部分，保持适当的冗余量就可以了。但是资源是否能够满足使用时的分配呢？假如说20个房间都是高峰使用怎么办？这时就需要对资源做拓展。

再看核心资源可无限扩展。

我们可以做一个音频的演示模拟，比如说在一场演讲中，我们模拟台下听众的声音变得比较高，这种情况就需要提高演讲人麦克风的音量，通常的办法是操作人员去调音台提高音量。但是还有没有什么别的办法呢？

第一种情况，外界的声音提高了，但是话筒声正常，外界声音的变化对它没有影响；第二种情况，我们转用另外一种算法，外界声音提高了，话筒的声音也很迅速地提高，外界声音降低，话筒的声音则同步降至正常水平。这意味着很多东西可以用智能的算法来完成，而不需要用人力去解决。我们演示的是很简单的功能，但是这个功能是否到此为止了？是否以后就只需要配备这个功能的会议室就够了？当然不！我们不敢想象未来科技的发展会到一个怎样的高度，未来肯定还会有更优秀的解决方案，这就要求我们的资源能够无限量地扩展。

用人力手动操作，可以用来解决一些问题，但是如果项目到了20个、50个、80个的时候还可以这样解决吗？显然解决不了，只能用速度和算法来解决。智能化算法的加入，带来了不少的便利：第一是不需要操作技能；第二是不需要太多的人员数量；第三是不那么强调专注能力。在以前，假如音响师不专注，就无法和演讲者互动配合；以前有很多音频的处理是需要专业知识的，不具备这种技能的人很难胜任设备的操控使用。

算一笔设备与人力支出的账

当今社会，人的技能朝设计端和应用端两个方向发展，应用端的人才似乎更难找了。就好比企业用户、酒店、政府单位等，招聘到一个合格的音响控制师比招到一个客户经理难得多。我们并不是提倡不用技术人员，只是在条件有限的情况下可以酌情减少，这对于成本控制是大有裨益的。

假如说我们减少一个普通的工作人员，他的底薪按照5，000元计算，10年要投入75万。假如说觉得这个人还不错，想培养他，每隔三年左右有一次升值加薪的机会，就要114万。如果把这个钱省下来，一部分用于培养核心技术人员，另外一些钱买智能化的设备，岂不是更好的结果吗？

稳定机制，备份是最重要的手段之一

下面讲稳定机制。

我们看到第四代系统，都集中在中央服务器上，它要保留两种数据。我们通常做一个项目的时候，往往会有一个竣工数据，但是这并不是客户最终所需要的数据。例如我现在在演讲，演讲过程中话筒的音量不一定是竣工时期空场时调的最好音量。这显然也不是我们要的结果。我们现在要的是能够稳定地保持数据状态，备份就是最重要的手段之一。

我们一般建议备份有两种机制，一种是集中式的架构。如图所示，上面是主机，下面是各种终端。可能有人会问，你刚才不是提到了网络的问题，如果网络中断怎么办？假如说有一个很保密的内容，不传输数据到云终端去，不希望给第三方人接触到，怎么办？

这里还有另外一种方法，叫做分布集中式架构。每一个子单元有一个独立的运算系统，通常情况下，云端由主机来完成。或者说当我们需要保密的时候，或者不需要这个信息泄漏到会议室之外的时候，希望信息以云系统完成。

随着IT行业巨头如微软、因特尔、赛灵思、谷歌等纷纷将目光投向音视频市场，随着AVnu组织宣布他们的时间同步协议AVB免费开放给任何需要的机构，随着云技术在音频领域的更深入的应用，随着IPv6的发展以及新一代高速网络的发展，随着社会发展过程中，传统靠经验来完成工作的音频工作者的退出，未来的音频系统必定会改变成类似IT行业的可量化的工作模式。量化的要求为：过程量化、结果量化、学习量化。音频系统的核心资源投资也由过去的计划资源与使用资源1：1变成了1：3或更低，极大地节约总体成本支出。因此可以认为，使用云架构的第五代音频技术，它使得大型系统更安全、更便宜，系统的建设也将更灵活，将是未来大型音频扩声系统的主流方向和必然的选择。