APP下载

大型国际会议的跨平台网络与音视频融合会议系统

2022-03-09高玉阳

电视技术 2022年1期
关键词:参会者主会场分会场

高玉阳

(云南广播电视台,云南 昆明 650000)

0 引 言

在全球疫情爆发之前,网络会议的技术及应用一直处在“够用”的范畴内,即能满足小范围群体实时交流即可,多用于跨部门协作、与客户的日常沟通等非正式交流场合,主要解决工作效率问题。这些网络会议的特点是接入点少,几十人的规模最多见;设备简单,一般使用笔记本电脑或者手机,通过设备的前置摄像头和麦克风就能采集音视频信号;通用性强但安全性较低,参会者注册登录进入房间即可参会,信号质量受当地网络影响较大。但鉴于这种会议往往是临时性、非正式的,用户并不太在意使用体验,可以接受偶尔的延迟或断线。

然而近年来,随着全球疫情的持续,人们逐渐意识到,无论正式还是非正式,很多时候网络会议是沟通的唯一可用方式。一时间,全球对网络会议的需求激增,各种大小活动都开始依托于网络,其中也包括如国家领导人会晤、跨国论坛之类的高级别会议。一旦这类活动在网络上举办,网络会议就由一种单纯的技术形式,升级为一套服务于高级别政治活动的仪式,这对整套系统都提出了更高、更新的需求。由于没有先例,技术上需要一套全新的解决方案来支撑,毕竟靠之前单一的平台、简单的设备以及不可控的网络已经无法满足此类需求[1]。基于此,本文以某次大型国际会议为例,介绍实现全球高级别网络实时会议的解决方案及技术支撑系统,可为类似项目的方案设计提供参考。出于保密需要,文中省略了部分细节。

1 会议平台及网络状态的评估与测试

本次会议的规模及需求:会议主会场设在中国,参与国家近170个,有500多位政党和地区组织领导人参加会议,超过1万名代表通过视频连线或者网络直播的方式参与会议,共约160处国内外分会场远程集体参会,20多名国外政党领导人需要线上发言,100多个国家的驻华使节在主会场线下参会。会议需要一套会议系统将以上需求整合,在保证安全的前提下完成大会所有议程。

在确定技术方案前,首先需要评估和测试意向性使用的会议平台。一般而言,会议主办方会有一个或多个倾向性意见,希望尽量使用他们期望的会议软件来构建系统,这样可以避免每个参会者重复熟悉新软件。由于全球会议平台多种多样,最理想的方案应该是一种跨平台的融合架构,即无论参会者使用哪个平台都能加入会议,这点会在后文详细论述。在此之前,需要对每个融合进来的平台做评估和测试,以确定其是否适合这个技术环境。一般来说,测试项目主要针对应用功能和技术架构两大方面。以下介绍部分需要重点评测的要素。

1.1 应用功能方面

1.1.1 支持的最大接入点数量

这个数据指标不仅影响会议的规模,更直接决定了搭建融合系统时使用的网络终端数量。如果参会者超过单一平台的接入量,需要增设更多网络会场,意味着需要更多的网络终端进行信号转换,进一步影响矩阵、周边设备的规模,这直接关系到系统的整体设计[2]。同时,也可以利用此数据评估每个会议房间的适合人数。

1.1.2 画廊模式最大显示数量

画廊模式最大显示数量决定了信号源和画面分割信号的数量,直接影响系统的规模。所谓画廊模式,顾名思义就是在一个屏幕内,将众多参会者的小画面排列分布,像画廊展示一样。一般的网络会议往往只需要观看发言人,普通参会者并不露面。但高级别的网络会议仍然需要遵守传统线下会议的礼节,凡是参会的嘉宾都要在形式上出席,如同线下会议时在席位上就坐,因此每个人的画面都需要呈现。画廊模式显示数量决定了信号输入量,例如,ZOOM会议软件支持最大显示25个画面,假如有100人参会,则至少需要4页画廊信号,相应地用4台网络终端,形成4路输入源,以此类推。另外,还需要测试在会议进行过程中,假如某位参会者掉线或关闭摄像头,其他布局内的画面是否会移动。如果排序布局会受参会者的操作而改变,就需要使用单画面选看功能。

1.1.3 是否支持单画面选看功能

平台是否支持单画面选看功能,涉及到礼宾排序的问题,需要为每个重要的参会者建立独立的信号通道,再在视频特技台上进行手动布局拼成画廊模式,这点后文会单独论述。

1.1.4 是否有强制静音功能

有些会议平台可以检测是否有语音输入来自动触发发言,甚至自动将发言者的画面全屏。这个功能会对高级别会议产生严重干扰。除非有需要,画廊模式不允许随意全屏某位参会者,也不允许发言人之外的参会者随意开启麦克风插话。如果会议系统不支持强制静音和禁止全屏,那在会议控制系统端的处理会比较麻烦。这种情况下,该会议平台评估不能通过评估。

1.2 技术架构方面

1.2.1 单画面的最大清晰度与网络带宽需求

对于高级别会议,可以接受的画面分辨率至少为720 P,某些平台在降低帧速率的情况下可以传输1 080 P,此时建议最低帧速率在10~15 f·s-1。 由于会议图像的变化区域很小,低帧率不会造成太大不适,特别适合那些如H.263及更高标准的基于DCT变换和运动估计与预测技术的视频编码,往往在1.5 Mb·s-1时仍有较好的质量。不过对于国际 会议,建议至少保证10 Mb·s-1的上下行带宽。

1.2.2 会议平台支持的框架协议

会议平台支持的框架协议涉及到可以接入的设备选型。例如,支持SIP或者H323的会议平台,可使用相应的网络设备搭建系统,如使用SIP电话作为会议信号的备份,在图像信号断线的时候及时启用,可至少保证参会者的发言声音传递到大会。

1.2.3 会议平台服务器的跳转方向

会议平台服务器的跳转方向主要评估对于国内而言,该网络的出口是否可能成为瓶颈。很多会议平台在全球都部署有服务器,需要弄清跨国信号跳转的网络路径,至少需要知道亚太地区的服务器分布和访问延迟量。例如,本次会议使用的其中一种会议平台由欧洲某国开发,基于亚马逊云AWS的服务,其对于中国的跳转方向是新加坡。而新加坡是亚太地区的网络枢纽,到我国有大出口的带宽,双向CN2线路一般延迟在30 ms,最大不超过100 ms, 完全可以满足会议需求,实际测试结果也符合这个情况。而如果是国产会议软件,往往对国内和发达国家支持较好,则需要了解其在海外的服务器分布状况,特别是在第三世界地区。

1.2.4 会议平台的安全性

作为国际会议的主办方,一定要对所使用会议软件的安全性进行评估,需重点评估对于高强度网络攻击的防范能力,包括防止DDOS攻击、域名劫持等[3]。例如,本次会议使用的几种会议平台基于亚马逊云,其AWS shield托管式服务可以有效防范DDOS攻击,同时使用AWS Route 53云域名系统,总体而言安全性比较高。

1.3 其他方面

除以上项目外,还需要掌握其他可能影响会议体验的性能指标,如是否支持电脑客户端,在网络不稳定且发生抖动的情况下,画质如何变化(自动降低清晰度、降低帧速率、或降低分辨率等);是否支持低带宽时只传送音频,是否可以自行关闭画中画功能,是否可以隐藏未开启摄像头的参会者,平台能够覆盖哪些国家,平台针对本次会议的运维保障方案,是否满足数据主权需求等。

一个理想的会议系统应该满足以上所有需求,然而目前全球尚没有这样完美的平台。使用单一平台,不仅接入点不全、功能有短板、安全性和可靠性较低,还存在数据主权的政治问题。经过测试与评估,本次会议最终确定使用华为云会议、腾讯会议、ZOOM视频会议平台,共同进行会议保障。

2 技术方案详述

技术方案需要围绕需求制定。本次会议的呈现要求是:主会场设在人民大会堂,主席台有9位领导就座;国外驻华使节于就近分会场参会,其他所有人员通过网络远程参会;发言人一共22人,我国领导人一人,其余21人在国外;同声传译有14个语种,加原声一共15路;主会场、6个国内分会场、200个国外分会场及500多位个人参会者之间,使用的3种不同会议平台需要完全音视频互通(包含所有同传信号)。主会场设置5组LED大屏幕,中间的1号主屏幕显示主会场及21位国外发言人画面;两侧的2、3号屏幕既显示国内外分会场画面,也显示特写画面,还会播放一些会议相关的视频短片;再两侧的4、5号屏幕显示其他500多位个人参会者。大屏幕布局示意图如图1所示。大会还需要备播视频、照片备份、电话备份等手段以提高安全性。这些信号及每个大屏幕上的画廊模式信号不仅要在现场呈现,还需传送至线上,供每位参会者观看。

图1 主会场大屏幕布局示意图

2.1 视频方案

常规的广播电视系统一般是单向架构,即从信号源开始,经过各种设备逐级传送至末端。网络会议平台混合后,系统则是多向的,每个接入点既是信号源也是终端,大家互为外来信号。这种系统没有先例,只能根据需求逐步摸索。设计时,需先将系统的整体逻辑关系理顺,再细化各部分细节,系统逻辑如图2所示。

图2 系统逻辑图

这是一个由信号源、现场大屏及线上会议平台组成的三方系统。上百个信号源经过切换调度系统送至画面拼接器,根据会议需求进行指定位置、指定大小布局的礼宾排序上屏。而信号源大多来自融合后的会议平台,经过一系列信号处理后,形成类似传统PGM的会议信号再返回融合会议平台,同时拼接后的大屏画廊模式也返回会议平台,这样在任何地方使用任何一种参会方式都能在形式上实现线上线下结合,满足了会议需求。该三方系统的信号源主要包括以下类型。

(1)摄像机拍摄的画面。在主会场面对主席台的大屏下方设置广播级摄像机若干台,拍摄发言人镜头。为了避免摄像机遮挡大屏幕、影响线上交流,大屏幕高度建议在5 m以上,主席台不做地台,与摄像机保持在一个水平面。

(2)国内分会场画面。国内分会场使用华为云会议接入网络,音视频信号通过主会场的华为终端输出。

(3)22位发言人画面。21位国外发言人在各自的国家使用华为云会议接入网络,同样通过主会场的华为终端输出。而主会场需要将摄像机信号转换成网络视频,成为第22路发言人信号,作为线上平台的信号源,这也是多向系统的特点。

(4)画廊信号。其他分会场及个人参会者不提供单独画面,以画廊模式集体展现。按照每屏5×5布局,每个画廊信号显示25位参会者,再将两组画廊信号上下拼接,形成50个窗口的大画廊,显示在主会场4、5号大屏上。画廊模式的获取方法是使用参会者身份加入会议房间,设置屏幕为画廊模式,通过HDMI或DP接口将屏幕信号采集出来。这种方式只适合安全要求较低的画面,对于重要嘉宾,必须使用专业的网络终端采集信号。

(5)提取单人信号。会议中有部分参会者不是发言人,但也需要提供全屏的单人信号,实现方式同上。

(6)视频短片信号。由主会场的视频播放器播放,除了播放会议相关短片,还作为某些重要嘉宾的信号备份。

本次会议将3种网络平台进行融合,形成一个大虚拟会议室,音视频信号、同声传译信号跨平台传输。不同平台使用的协议及软件接口千差万别,无法在网络应用层融合,即平台之间不可能打通,只能通过在链路层进行设备到设备的连接实现。融合系统的原理如图3所示。

图3 系统流程

图3 融合系统的原理图

融合系统的原理就是将会议音视频信号通过HDMI、SDI、DP、TRS、XLR之类的物理接口进行交互,通过格式转换器统一到某个单一平台,进行一系列处理后再返回各自系统。这种方式的优点是不受平台限制,只要有音视频接口即可,并且可以防范部分网络攻击[4];缺点是所需设备种类复杂,数量巨大。因为从信号处理逻辑上说,融合系统就是一台没有现成接口的矩阵,每个输入、输出口都需要根据会议平台、账号类型、接口类型及画面内容等自行“DIY”设备来实现,再加上备份的需求,设备规模往往既庞大又松散,但这是目前唯一可行可控的、能将任意音视频平台或系统整合的方式。

基于以上系统逻辑及技术方式,本次会议搭建的视频系统架构如图4所示。

图4 视频系统架构图

该系统将安全性放到最高优先级。在物理层面上,链路和设备均做了多重交叉备份。

首先,主会场大屏由两套完全独立的路由提供信号,包括两套切换系统和两套屏幕拼接系统,两者之间互为备份,作为大屏主信号;另外还有两套提供线上平台的调度系统和画面拼接系统也接入了主链路,作为大屏的备用信号。同理,两路大屏主信号也接入了线上平台的信号链路,作为线上备用信号;而上面提到的两路提供线上平台主信号的系统内部也互为备份。

其次,重要嘉宾均使用至少两种会议平台接入。主会场、21个国外政党发言人及6个国内分会场使用华为作为主系统,腾讯做备份系统;国外分会场除了50个使用ZOOM外,全部使用华为系统;500多位政党和地区组织领导人使用ZOOM或者华为参会。华为广泛且完善的全球业务网络及服务体系为这次会议提供了强大保障。

最后,每个子系统内的设备也做了充足备份,不仅常规的摄像机、矩阵、切换台及画面特技台等都是双备份,重要的线上信号均使用多台网络终端或笔记本电脑进行采集。

除此之外,在运维层面上也采取了多种手段以保证安全性。首先,作为网络会议,使用的所有计算机设备必须系统干净、补丁齐全,关闭自动更新和屏保,无关软件一律清除。其次,进行应用层的隔离。融合系统有两个层面,一是不同平台间的融合,这源于技术上的限制;二是同一平台不同房间的融合,这源于会议安全上的考虑。例如,22位重要发言人和其他分会场虽然使用同样的平台、技术、线路及设备,但必须分成不同的虚拟会议房间,再通过融合系统合并。

本次会议使用了约500台笔记本电脑、120台华为网络会议终端CloudLink Box 500/700/900系列。与直接通过笔记本电脑采集信号相比,该系列可以外接显示设备、摄像机、麦克风及扬声器,丰富的 I/O接口可以为本会议系统提供更稳定、更规范的信号源,主要部署在重要嘉宾及会场的链路上。而大屏拼接系统使用了BARCO的系列产品,包括EC-210 Large Event Controller控制面板、C3控制面板以及E2-Gen Event Master信号处理器等。

2.2 音频方案

音频系统框架如图5所示。

图5 音频系统框架图

音频系统的烦琐之处在于,要将14路翻译和原声从不同平台的各个会议房间采集出来,再送回到不同平台的各个房间,使每个参会者都可以从15个声道中选择收听。每个房间都要通过翻译员账号上传一种语言,例如一台笔记本用“英语翻译”身份登录某房间,其通过音频采集卡上传的信号就成为整个房间“英语频道”的音频。而每个房间都需要15路这样的链路,系统规模就随房间数量和备份需求不断翻倍。本次会议的翻译员均在会议现场,翻译信号相对比较好获取。如果会议采用线上翻译,即翻译员也是通过加入会议房间在异地参与工作,则每个房间都需要一路参会者账号采集某一种翻译语言,系统规模要再翻倍。除此之外,需要提前对会议平台的音频进行输入输出的环路测试,在回声消除、自动增益控制、噪音抑制等方面也需加入干预,而这些工作所需的经验性会更强一些[5]。

本次会议音频系统主要使用了DiGiCo系列产品,如DiGiCo SD12等。

3 结 语

对于高级别的会议而言,安全性永远都是第一位,本次会议系统设计处处体现了这一点,网络安全、系统安全及运维安全等都是要重点考虑的方面。系统设计要为最终呈现形式服务,要跳出传统设计思路中的行业界限和技术界限,重新评估规模与成效之间的平衡关系。另外,“媒体融合”是未来发展的必然趋势,不仅是广播电视行业狭义的“媒体”,更是指全球化的、通用化的可视信息交互。疫情只是初步激发了这个需求,未来还有更广阔的应用前景,相关业界应给予重视。本次会议采用的系统方案受限于目前的技术,虽然烦琐但却唯一可行,希望今后随着技术发展,整合度更高、安全性更强的解决方案可以加快实现。

猜你喜欢

参会者主会场分会场
科技活动周主会场掠影
科技活动周主会场掠影
云南省2021年“文化和自然遗产日”暨“七彩云南·非遗购物节”主会场活动在玉溪市精彩开幕
数字人民币亮相消博会
中国生态经济学学会第十次会员代表大会暨2020年学术年会
世界粮食日主会场掠影
美玩协线上办展助玩企纾困
2019农民丰收节罗源分会场活动举行
31年后重现日本3000人交流团访华
小策略 助死角展位变焦点