基于8K超高清制播三维声端到端解决方案的测试
——以8K版央视春晚为例
2021-07-30杨奇
杨 奇
(中央广播电视总台技术局,北京 100010)
近年来,中央广播电视总台(以下简称“总台”)以北京冬奥会8K转播为目标,全面推进8K超高清电视的制作和播出,现已研发了制作、播出、传输和呈现全链路试验系统。随着《超高清视频产业发展行动计划(2019-2022年)》中“4K先行、兼顾8K”总体技术路线[1]的提出,总台充分发挥在视音频制播领域的技术优势,以2021年春节联欢晚会(以下简称“央视春晚”)为契机,通过8K超高清实验频道为观众提供8K版的央视春晚。借此机会,音频制作团队在8K音频直播系统下,对在用、在研的三维声(3D Audio)制播技术在全IP环境下进行了端到端的全链路测试。
1 8K超高清音频制播环境概况
由于8K视频系统对带宽的要求,以交换机为核心的IP架构成为8K超高清演播室系统的必然选择,音频系统相应地也实现了完全IP化管理和信号交互共享。
8K超高清直播除了在画面分辨率方面比传统的高清电视有了很大提升之外,更加真实的沉浸式三维声听感体验也是一大特色,可完成5.1环绕声及5.1.4三维声制作和监听[2]。三维声作为下一代音频制作规范,其标准已经在多个国家确立。目前,中国广播电视行业三维声的相关行业标准正在积极推进,并已经完成了多次全链路验证;2018年初发布了GY/T316—2018《用于节目制作的先进声音系统》行业标准,规范了三维声制作的监听布局;2018 年底,压缩编码部分的草案文本已提交,目前还在按照国家广播电视总局科技司的要求进一步修改[3]。在消费者的终端体验方面,三维声音频技术已经有了相当广泛的设备支持,大量家庭终端具备MPEG-H、Dolby Atmos(杜比全景声)、DTS:X、Auro-3D等多种解码能力。例如本次作为测试重放环境的功率放大器(马兰士AV8805)和Soundbar(索尼HTST5000)等设备均支持上述三维声解码功能。
2021年8K版央视春晚采用的8K超高清制播系统通过全链路IP化传输,采用无损调度和分发方式,全链路支持 SMPTE ST2110 标准;与视频系统适配的音频系统是一套全IP化移动外场音频系统,统一在8K超高清IP化制作流程下,进行了从音视频系统制作端到主控、播出系统的传输端,及有线电视机顶盒的重放端的全流程功能性测试,如图1所示。
图1 8K版央视春晚音频系统各端点的测试
8K版央视春晚制作的音频系统是以EFP形式部署在总台复兴路办公区的第九演播室的音控室内。由于空间物理位置限制,本次采用System T S300调音台作为混音调音台,华为的CE6865系列交换机作为音频系统的核心路由设备。所有音频信号通过调音台混合处理后,采用符合SMPTE ST2110-30标准格式的组播流推送至视频系统,如图2所示。
图2 三维声全链路测试系统示意图
其中,Junger的MPEG-H渲染器MMA通过MADI方式与Junger AIX pressor接驳,后者作为硬件接口设备通过SMPTE ST2110组播流方式与8K版央视春晚音频系统核心交换机互通。杜比的DP591作为三维声编码器与8K版央视春晚音频系统的MADI网关设备连接,输出的Dolby Digital Plus with Atoms码流通过AES3方式送至数字接口箱。
2 主流三维声编码的关键技术及实际应用
为了能够更好地完成2021年8K版央视春晚三维声全链路测试工作,首先对MPEG-H和Dolby Atoms这两种目前主流的三维声技术进行前期技术调研,充分了解其实际应用的场景和特点,为后续测试奠定理论基础。
2.1 MPEG-H三维声音频标准
由Fraunhofer IIS推出的MPEG-H三维声音频标准,目前已被DVB和ATSC标准采纳,能够为超高清广播电视、流媒体和VR用户提供沉浸式和交互式的多维度视听体验。在家庭影院、Soundbar或者手机等多种重放环境下,MPEG-H三维声音频标准进行自定义对象元素和三维声重放,通过一系列音频实时制作工具,从音频信号采集、信号传输、元数据生成、编码到终端重放,将整个三维声制作链路打通。终端用户除了能够听到真实沉浸的三维声听感,还能够享受到个性定制化的体验。
目前,Junger的MMA和Linear Acoustic的AMS均支持MPEG-H,可实现配置三维声通道、进行对象的交互性设置等功能。MMA和AMS均基于服务器架构,物理接口支持SDI、MADI或者AES67多种音频格式。通过预先配置描述MPEG-H场景信息的元数据,可以让终端用户选择各种不同语言、对白的音量等个性化的重放效果。同时,依托于MMA或者AMS,系统工程师可以在渲染配置中使用不同的扬声器布局进行质量监听,检查各个版本(5.1.4/5.1/2.0)渲染输出的电平及响度。
2.2 Dolby Atmos技术
Dolby Atmos是杜比实验室于2012年4月24日发布的三维声技术,是基于音频对象(Object Based)的音频技术,使用时可以灵活地选用、组合音频对象。Dolby Atmos会通过元数据记录各个音频对象在不同时间点的相对位置、距离远近以及音量,每个对象都作为独立的信号源进行存储。在重放时,终端设备会根据回放听音的环境进行渲染,基于音效相对位置的信息,来决定交给哪个扬声器或哪几个扬声器播出。
Dolby Atmos对下混兼容性也非常好,如果终端设备不支持5.1.4的重放环境,则会依靠元数据下混信息,将三维声信号下混为环绕声或立体声进行播放,这样就不需要在前端制作系统再额外制作环绕声或立体声的母带版本。制作域中,杜比升级了Professional Metadata(PMD),添加支持了三维声音频相关描述,如沉浸式音频、对白增强、多语言、评论/对白的选择和音量调整、音频对象的移动和耳机虚拟功能等。
直播传输时,DD+码流可按照SMPTE 337规范,以非PCM的数据形式,传输于一对立体声声道中。该音频信号可以被数字音视频系统透传,需要注意的是,传输链路上不能对SMPTE 337音频开启采样频率自适应功能(SRC),同时也不能对SMPTE 337音频信号进行电平增益调整,否则会破坏其中的数据信息,如图3所示。
图3 Dolby Digital Plus码流被破坏
3 基于C3DA和Dolby Atmos的三维声全链路制播方案测试
本次测试重点分为两个部分,第一部分是测试基于MPEG-H LC和华为增强层编码的C3DA三维声技术信号在重放终端的各项功能性的实现情况;第二部分是测试杜比DP591渲染的Dolby Digital Plus(DD+)音频码流在基于全IP化制播流程的透传可行性。
3.1 基于Fraunhofer MPEG-H的元数据功能性测试
第一部分基于MPEG-H的测试重点关注MPEG-H的元数据。在前端制作域可以“预设”Object内容,如图4所示,以指导末端的对象渲染,形成不同对象元素的组合或者调整不同对象在位置和音量上的关系,可以让重放终端选择不同的声音体验,实现制作者和用户间的内容交互。
图4 在前端制作域进行Object内容预设
整个测试主要分为制作端和重放端这两个维度。在制作端,音频信号通过三维声制作工具MMA,将三维声音频信号及元数据等16轨音频信息,通过8K版央视春晚音视频系统传递给主控、播出系统。通过部署在播出系统的数码视讯编码器,利用MPEG-H LC和华为增强层的编码算法进行编码,形成AVS3的8K视频编码格式及C3DA的三维声音频编码格式,最后由主控IPDM系统交付给有线电视进行分发。在重放端,通过配有海思芯片的浪潮机顶盒、功率放大器及Soundbar等设备进行解码测试,如图5所示,进而验证三维声信号能否正确还原播放,以及元数据是否可以正确读取识别,从而为终端用户提供个性化的声音效果。本次重点测试在机顶盒UI界面中自由切换语言的功能,以及通过电视遥控器对解说音量和对象元素在重放中声像定位进行控制的功能。经过测试,元数据透传解析正常,可以正常实现终端用户交互功能。
图5 MPEG-H功能性测试
3.2 基于Dolby Atmos的透传能力测试
Dolby Atmos的测试重点放在全IP化制播环境的DD+码流透传能力,测试流程如图6所示。传测试中,Dolby Atmos经DP591编码DD+JOC,DD+JOC码流携载于ST 2110-30中,从音频系统输出至视频系统,再由主控系统分发至播出系统进行AVS3视频编码(音频透传),最后通过主控IPDM系统以组播方式交付至有线电视机房,最终由浪潮机顶盒输出至终端设备功率放大器和Soundbar进行重放。
图6 杜比DD+透传测试流程
本次测试主要模拟当电视信号需要照顾立体声、环绕声和三维声时,如何解决多种不同版本音频PGM声道排布问题。由于2021年央视春晚除了有标清、高清和4K、8K频道的立体声和环绕声播出信号外,还需要制作新媒体版本的三维声音频信号。按照现有声道排布要求,音频轨的前8声道内容为5.1+2。当再增加三维声版本的16声道时(Bed+Object+元数据),立体声、环绕声和三维声版本的音频轨道总数已经超过16轨,势必对现有演播室音视频系统提出更高的要求(加嵌器通常只支持16轨音频声道加嵌)。
现阶段的做法是,将16轨的三维声版本信号在前端制作域进行压缩编码,以保证送至视频系统加嵌器的声道数量保持在可用范围以内。本次8K超高清透传杜比测试的16轨音频PGM输出信号通过DP591编码后(码率格式为448 Kb/s的DD+JOC音频信号,占用两声道数字音频)放置在音频PGM信号的9/10路送至视频系统。通过验证机顶盒终端解码重放的音频格式和内容,与前端制作域传输编码的格式和内容一致,如图7所示,证明8K超高清制作链路对Dolby Atmos三维声节目透传无误。
图7 杜比DD+透传至终端解码的测试
4 总结
2021年8K版央视春晚节目制作调试期中,对包括基于MPEG-H LC和华为增强层编码的C3DA三维声技术,以及基于DD+编码的Dolby Atmos三维声技术分别进行了验证测试。经过1个月的测试工作,可以看到目前三维声制播技术全链路已打通,两种三维声编码信号均能被正常透传、解码,并且正确读取元数据信息。另外,本次测试还成功验证了C3DA三维声技术通过元数据提前预设相关参数,在机顶盒UI界面中自由切换声音对象、调节对白音量、改变音频元素在重放环境中的位置等,可以为终端用户提供个性化声音效果的交互功能。
通过探索合理的三维声制播方案,联合芯片研发、平台服务,解决有线终端和移动终端的超高清三维声传输及呈现,为观众呈现更加精彩的沉浸式观看体验。