基于Dante低延时网络化公共广播系统
2022-10-25郭远林
郭远林
(广州市迪士普音响科技有限公司,广东 广州 510450)
目前,公共广播工程已经普遍采用IP网络技术,这种类型的公共广播系统具备OSI的七个协议层,能较好地兼容标准化网络设备,可以满足对音频延时和质量要求不高的场景应用,但是由于缺乏同步机制,且延时在数百毫秒级,对音频指标要求较高,尤其是有低延时需求的应用场景就难以达到要求。针对这一问题提出基于Dante网络音频传输协议的公共广播系统解决方案,在具有一般网络化公共广播系统应备功能的基础上,引入Dante网络音频传输协议,具备专业扩声工程的低延时、同步性等优点,可以满足高标准公共广播项目的需求。
1 传统网络化公共广播系统
基于计算机网络搭建的公共广播系统一般称为网络化公共广播系统(IP公共广播系统),公共广播系统中最基本的海量音频节目库、远距离的传输和控制、大范围的矩阵交互等方面通过计算机和网络技术而化解。网络化公共广播系统将音频信号数字化后封装到IP数据包传输,相比采用模拟线路的公共广播系统的音频信号传输,性能显著提升,传输距离即是网络所覆盖的范围,音频质量可达到CD级别。
1.1 基于x86架构计算机平台的网络化公共广播系统
早期IP公共广播系统的硬件是基于x86架构的计算机平台,典型系统如图1所示,音频信号传输链路如图2所示。由x86架构服务器构建的公共广播系统,以x86架构服务器的主机作为系统核心,实现系统逻辑处理、节目存储管理、定时管理、系统控制界面交互等功能。终端也是x86架构的计算机,分为信号输入类终端和信号输出类终端,输入类终端包括模拟音频信号输入、告警信号输入、控制信号输入等;输出类终端包括模拟音频信号输出、告警信号输出、控制信号输出等,音频信号输出的终端就是广播分区设备;此外,还有混合类终端同时具有输入输出功能。
图1 早期网络化公共广播系统原理
图2 网络化广播的音频信号传输链路
早期的网络化系统由于主机和终端都采用x86架构硬件,本质上就是由通用计算机网络组成的系统,只是主机性能相对于终端更好一些,而终端因为功能单一配置相对低很多,但即便如此,终端成本还是比较高昂,而且体积较大。主机对所有的终端在任何时候都能进行独立的音频选择播放、音量控制、开关等功能,也可以批量对若干数量的分区进行控制,即所谓的分组功能,也可以进行双向的互动操作,如终端点播服务器的音频内容,与主机或其他终端进行音频对讲等。系统的分区数量规模取决于服务器主机的性能和网络的带宽,一般可以很容易实现过千分区的功能。
1.2 基于ARM架构处理器的网络化公共广播系统
得益于ARM架构处理器的快速发展,新一代网络化公共广播系统的终端硬件核心也逐渐改由ARM嵌入式系统,产品体积和成本均大幅减小,一个典型的基于ARM架构处理器的网络化公共广播系统如图3所示。主机采用x86架构的硬件+Windows/Linux操作系统的服务器,也有采用ARM架构服务器+Linux操作系统的服务器,各终端设备通常采用ARM嵌入式SoC或者其他类型的MCU作为核心。
图3 新一代网络化公共广播系统原理
该类公共广播系统涉及的设备类型较多,本文中不讨论完整系统,仅讨论与音频相关部分的功能。从信号源类型来看,通常系统的音频信号源主要有两类。
1)从服务器硬盘播放的音频文件,格式有MP3、MP4、AAC、WAV、WMA、APE等,通常采用流媒体技术,用UDP协议由主机发送到广播分区终端,一个文件可以被同时播放到所有分区终端或者若干个分区终端,终端接收数据后实时解码成模拟音频信号,并送往下级信号处理设备(功率放大器、扬声器)。
2)由音频输入类终端(传声器、播放机、线路输入)实时采集的模拟音频信号,需要经过A/D转换为数字信号,为保证实时性和音频质量,一般不经过压缩处理,直接封装成IP数据包,并通过UDP协议发送到广播终端,终端处理过程与处理服务器传送文件音频流类似。
1.3 网络化公共广播系统的延时与同步
网络化公共广播系统具有服务器向每个分区终端同时播放不同音频文件的能力,而采集类信号源则以一对多或多对多的方式完成分区实时广播,总体来看类似于网络化的音频交叉矩阵。
公共广播系统工程本身属于扩声工程,除常规的频响、失真度、声压级等衡量电声性能指标外,音频信号的延时和同步指标也非常重要。这里的延时是指信号源进入到系统输入设备,再经过系统传输与处理,最终由输出设备输出,全链路整个过程的时间差,如图4,这个值越小越好。同步是指当两个以上设备输出同一个信号时,彼此之间存在的时间差,如图5,这个值也是越小越好。
图4 网络化公共广播的延时
图5 网络化公共广播的同步
当前广泛使用的IP公共广播系统一般基于OSI 7层架构及完整的来自操作系统的协议栈,设计编程以顶层应用为主,具有开发技术难度较低,可以广泛兼容常规局域网、广域网的特点,但是由于缺乏网络及媒体时钟同步机制,以及针对时间敏感数据传输的底层优化措施,对于实时传输音频信号而言,延时和同步的问题比较明显。目前各公共广播产品都有自己的一套协议组合,采用不同的技术路线,如A/D的采样率、IP数据包的载荷长度、缓存的大小等,对于延时和同步的指标会带来较大差异;除产品本身的硬件与软件算法、协议有关外,还与设备使用的网络环境有关。目前,网络、系统理想状态下,延时普遍能达到的实测值是100~400 ms,在实际项目的应用中,很多时候各种网络信息设备混用在一个局域网中,通常延时要大于这个数值,使公共广播系统的电声指标会大打折扣。以网络化公共广播系统中音频信号源的播放为例,对于直接播放存于播放服务器的音频文件,无需信号处理,延时小;对于实时采集的信号源,尤其是传声器输入延时最敏感,其他类型的相对不太敏感,因为听众可以同时听到讲话者的直达声和由传声器拾取经网络广播还原的电声信号,如果延时过大将明显影响听音质量,甚至听到两个声音。而在声音同步方面,同步性能对所有的信号类型都有影响,同步不好时会劣化声场分布,降低语音清晰度,不同程度地影响到听音效果。
2 基于Dante的网络化公共广播系统
2.1 系统原理
为实现IP公共广播系统低延时的音频传输,一个有效的解决方案是选用专业扩声领域使用的网络音频协议,目前主流的传输协议有CobraNet、EtherSound、Dante、AVB等。其中,Dante具有完备的软、硬件的解决方案,包括专用芯片和接入模块(硬件)、控制管理软件(API接口以及Dante Controller,见图6)、虚拟声卡(软件,见图7)等。目前,在各种类型的专业扩声、会议系统中有着广泛的应用,其延时低、同步性好、支持点对点和点对多点应用等特性决定了在公共广播系统也具备很好的实用性。Dante虚拟声卡能安装在通用计算机系统中,通过计算机本地网口,直接将计算机中录放音文件数据流与Dante协议控制流进行对接,极大方便了IP公共广播系统的音频文件播放及传输。图8就是基于Dante数字音频传输协议的低延时网络化系统方案。
图6 Dante Controller
图7 Dante虚拟声卡
图8 基于Dante的网络化公共广播系统工作原理
由于Dante协议是一个实时的网络数字音频传输协议,与通常意义的网络流媒体传输机制不尽相同,因此基于Datne网络协议的公共广播系统必须将系统中的两类音频信号源(见前文1.2节)统一到Dante的传输方式和协议格式上。对于传声器、线路输入、调音台等输入类设备的信号,可以直接采用Dante SoC硬件模块进行采集。对于服务器音频文件库的输出则有以下两种方式。
1)通过服务器的音频播放软件从声卡输出音频信号,再由DanteSoC硬件模块封装成Dante协议数字音频数据包。这种方式由于采用硬件声卡,在服务器信号源通道少的情况下,比较容易实现,而当服务器信号源通道达到几十上百以上时面临硬件复杂、成本高的问题,即使采用USB声卡也是如此。
2)采用纯软件实现广播服务器音频库文件转换为Dante网络数据流。如采用Dante VirtualSoundcard软件,兼容ASIO驱动,可以实现多通道虚拟声卡,音频播放器输出的数据流可以通过ASIO接口与虚拟声卡耦合,将虚拟声卡的音频信号封包成Dante协议网络数据包。这就意味着可以实现多通道Dante协议数据流,具有16×16、32×32、64×64,甚至更多通道。
2.2 系统构成
采用Dante协议实现低延时网络化公共广播系统的拓扑图如图9所示。主机是系统的管理控制中心,自带音频文件库,可根据终端的播放需求动态开启播放器,再由Dante虚拟声卡封装成Dante格式音频数据流后进入网络。终端设备分为信号输入、信号输出、输入输出混合3类,信号输入类设备包括寻呼器、CD、收音机、传声器等,信号输出类设备包括解码器、有源扬声器、功率放大器等,输入输出混合类设备主要是有交互功能的对讲终端。公共广播系统除基本的音频传输功能外,还必须具有系统管理和控制的功能,所有的控制功能均由服务器实现,操作界面可以通过服务器的显示屏、远程控制计算机、移动终端APP等方式实现。
图9 系统拓扑
基于Dante的网络化公共广播系统相较于传统网络化公共广播系统,在硬件构成上,只需把各终端核心从ARM SoC替换成DanteSoC模块,就可实现Dante通信功能;在软件方面,主机可以沿用传统网络化公共广播系统的定时管理和分区管理等基础功能,只需将原来音频文件流媒体传输方式转换成基于Dante虚拟声卡的多通道音频播放方式,分区管理由服务器调用DanteAPI接口进行,通过Dante网络发送指令数据来完成流的切换,以及对各终端的DanteSoC芯片的控制。在千兆以太网条件下,系统可以达到1 024通道以上的分区规模。
2.3 延时及同步的测试
对网络化公共广播系统的音频延时和同步时差的测量方法如图10所示,测试信号由音频播放器产生,内容为自行制作的WAV音频文件,总时长为5 s,前2 s空白,接着10 ms是10 kHz/-10 dB正弦音频信号,最后是2 900 ms的空白,这样设计的测试信号易于示波器捕捉。使用上述方法分别对一套低延时广播系统和两套不同品牌的网络广播系统进行测试,结果显示:
图10 第三组吊挂主火炬示意图
图10 同步和延时的测试方案
1)基于Dante数字音频传输协议的网络化公共广播系统,延时低于6 ms,同步时间偏差低于0.5 ms,两项指标达到比较理想的状态,详见图11;
图11 基于Dante数字音频传输协议公共广播系统的同步和延时测试结果
2)普通协议的网络化公共广播系统1,延时达到415 ms,同步时间偏差5 ms,详见图12;
图12 普通协议的网络化公共广播系统1的同步和延时测试结果
3)普通协议的网络化公共广播系统2,延时达到276 ms,同步时间偏差5 ms,详见图13。
图13 普通协议的网络化公共广播系统2的同步和延时测试结果
3 基于Dante网络化公共广播系统的应用
某音乐学院因为专业特点对公共广播系统的音质有寻呼讲话低延时、分区声音同步、语言清晰度方面的高标准要求,校方对目前的传统网络化公共广播系统不满意,经综合对比后选用基于Dante网络化公共广播系统,系统拓扑如图14,设备安装调试后校方非常认可本系统的音频低延时和声音质量。
图14 基于Dante的网络化公共广播系统应用拓扑图
4 结语
公共广播系统的信号延时是一项重要指标,对于有传声器信号输入需求的现场扩声系统尤其重要,文中介绍的基于Dante协议的网络化公共广播系统在音频延时和同步性等指标上具有明显优势,同时具备公共广播系统的应备常用功能,可以满足实际项目的应用需求。