浅析5G泛在低空应用下的视频流媒体协议
2022-08-01刘牧洲仇剑书
刘牧洲 关 蕾 周 晶 仇剑书 于 希
中国联通研究院 北京 100176
引言
低空空域是指真实高度一千米及以下的可飞行区域[1]。低空空域的使用和管理如同我国中高空空域一般,需要遵循严格的审批与报备流程[2]。低空经济是以低空空域为依托,以通航产业为主导,涉及低空飞行、航空旅游、支线客运、通航服务、科研教育、跳伞、空中体育运动等众多行业的经济概念[3]。
低空经济正式出现于今年年初由中共中央、国务院印发的《国家综合立体交通网规划纲要》中。该纲要指出“发展交通运输平台经济、枢纽经济、通道经济、低空经济”,其中低空经济首次上升到国家规划层面,堪称意义重大。
无人机是低空应用中极具代表性的载体之一,其已在诸如农业植保、物流运输、应急安防、能源巡检、水域巡查、娱乐直播等行业场景中作为革新替代方案频频出现,并已逐步催生出“无人机+行业应用”的全新产业发展模式,有望为泛在低空市场经济注入新活力。然而,在无人机结合典型行业应用的整体良好发展背景下,以测控、监管、数据闭塞等为首的旧有痛点问题也持续为其商用发展带来不可忽视的负面影响,因此亟需通过技术创新予以解决。
第五代蜂窝通信技术(5G)具备了大带宽、低延时、抗干扰、广接入、多波束指向等鲜明特点,可天然赋予网联化无人机包括高清实时数图传输、远程低时延控制、全生命周期监管、精准位置定位在内的四大实际应用级能力。
可以预见,5G网络技术与无人机创新业务的融合,将有利于两者互惠互哺式的共同发展。5G网络技术凭借自身特性,可将无人机核心的测控及数据传输服务带至全新高度上,并有助于无人机创新业务向垂直行业和特定场景进行渗透。相应地,无人机创新业务必将成为5G网络技术应用的重要分支,为5G网络未来发展注入新动能。
无人机应用数据可大致分为视频和测控两类。其中,视频数据作为无人机行业应用的最主要价值之一,其能否可靠有效传输一直备受关注。在传统无人机作业时,所采集的视频数据通常是借助微波通信链路或存储至SD卡中待任务完成后导出的方式。在5G网络广覆盖的大环境下,无人机在视频业务传输上的需求与日俱增。其中,实时视频传输对于要求低至毫秒级的远程控制技术将起到有利的辅助作用,因此对视频传输的实时性也愈发严苛。由于5G网络大带宽特性,无人机对于实时视频的清晰度要求已经达到了1080p以上。在5G通信链路串联的网联无人机体系中,传统无人机存在的时效性差、传输质量低等固有问题已得到了明显的改善。本文所论述的相关流媒体协议正是决定了在“互联网公路”上以何种方式运输的根本策略,流媒体技术水平的高低决定着整个过程中用户体验的好坏,其将最终确保视频数据的流转可以实现应用需求下的最理想效果[4]。
1 流媒体协议介绍与优劣浅析
流媒体是指在Internet/Intranet中使用流式传输技术的连续时基媒体,如:音频、视频或多媒体文件。流式媒体在播放前并不下载整个文件,只将开始部分内容存入内存,流式媒体的数据流随时传送随时播放,只是在开始时有一些延迟。流媒体实现的关键技术就是流式传输。流媒体具有明显的优点:由于不需要将全部数据下载,因此等待时间可以大大缩短;由于流文件往往小于原始文件的数据量,并且用户也不需要将全部流文件下载到硬盘,从而节省了大量的磁盘空间;由于采用了实时传输协议,更加适合动画、视音频在网上的实时传输。
1.1 RTMP协议
RTMP(Real Time Messaging Protocol)是一种版权归属于Adobe公司、建立在TCP传输层协议之上、默认使用非公共端口1935的TCP/IP体系内的应用层协议[5]。通常,在终端与服务器侧建立TCP链接完成后,RTMP协议会要求这两端建立“握手式”的RTMP Connection链接,并在传输中将协议规定的基本数据单元消息拆分成若干可动态变更大小的消息块,这些分割后的消息块最终借助TCP链接通道进行传输,并在末端被按序拼接成流媒体数据,通过Flash插件进行播放。
RTMP在传输时延表现上要好于基于HTTP的流媒体协议,且其稳定性较为可靠,并有广泛的实施基础,国内多数平台和编解码设备均支持RTMP流格式。
然而,随着Adobe公司停止更新Flash,以及越来越多的游览器不再支持或弃用Flash,导致RTMP的泛用性开始逐步降低。基于TCP底层传输协议也会存在连接态较差时的缓存累积所造成的时延增加问题。此外,其所采用的非公用1935端口亦有难以通过防火墙的缺陷。在正式版本中,RTMP协议不能支持HEVC(H.265)/AV1等新一代视频编码标准。
如表1所示,RTMP协议也存在多个变种方案。
表1 RTMP协议的多个变种协议
1.2 RTSP协议
RTSP(Real Time Streaming Protocol)是一种全公开可建立在TCP或UDP(RTP)传输层协议之上的TCP/IP体系内的应用层协议。RTSP协议的工作原理是限定已构建的TCP握手链接或RTP(在TCP/IP体系内高于UDP传输层协议,但默认配合RTCP控制协议采用UDP传输)通道,交织传送其保障信息与流媒体数据到服务器侧。但因RTSP协议规定保障信息要与数据分至不同信道进行传输,其对实施的环境要求尤为苛刻。
1.3 HLS协议
HLS(HTTP Live Streaming)是由美国苹果公司提出的一种基于HTTP的流媒体协议[6]。HLS协议的工作原理是将完整的流媒体数据分割成一些固定大小的片流以及可以索引下载这些片流的以m3u8为后缀的播放列表。在播放时,终端会率先下载m3u8后缀的播放列表信息,然后根据其中描述按序下载片流并播放。在直播时,由于m3u8播放列表信息会实时更新,因此终端需要重复获取该列表并按照最新内容找到对应片流进行下载并播放。因此,在直播情况下,HLS协议所产生的时延要远超其他非HTTP链接方式的流媒体协议。
基于此,美国苹果公司在HLS协议基础上提出了低时延版本的LHLS协议(Low-latency HLS)。该协议的最主要变化在于m3u8播放列表的更新部分会以单独增量信息形式被下载,免除了HLS协议对m3u8播放列表的重复下载情况。另外,LHLS协议采取片流实时封装形式,减少了HLS协议下片流完整封装后才可按序下载所产生的时延,使得直播延时进一步被降低。
1.4 SRT协议
SRT(Secure Reliable Transport)是由跨国网络视频技术巨头Haivision公司开发的一种新式开源流媒体协议,是一种新兴的流媒体协议[7]。SRT协议的原理是基于UDP传输层协议,并加入ARQ、FEC等数据纠错恢复机制,充分实现了稳定和快速的传输效果,并可进一步兼容对称加密(AES-128/256)来实现数据安全。其中,SRT协议的ARQ机制为选择性重传方式,当网络带宽出现抖动,丢包率上升时,该机制才会被触发,相较于TCP丢包恢复机制极大节省了带宽资源。
此外,SRT协议规定每10毫秒就会向数据发送方报送RTT(数据往返时延)、新增数据、数据包接收率及可用缓冲区大小等信息,来帮助判断连续两个数据包的间隔是否突破时延设定限制,若超过该限定值,则从传递列表中将其舍弃。
在拥有诸多优点的同时,SRT协议由于其双向点对点传输的特性,只适合于两端间的高质量低时延数据交互,而不适用于针对大数量级终端做流媒体数据分发。
1.5 RIST协议
RIST(Reliable Internet Stream Transport)是一种面向公网数据丢包问题而被提出的通用性流媒体协议。该协议可支持双向传输,但依旧延续了RTP传输协议的大部分特征,采用RTCP协议作为可靠传输的保障机制。因此,RIST协议的初始版本需要建立两路信息通道,一条用以传输RTCP控制信息,另一条则传输媒体流数据。同时,由于RIST协议沿用RTP协议的传输方式,使用IP地址和端口作为会话,导致服务端要通过不断增加端口数量才能匹配更多的客户端,且RIST并未定义视频流标识。
随后,RIST协议进行了大改,在初期版本基础上增加多路数据复用传输信道、DTLS加密、数据空包删除、可支持高比特率高延迟场景等功能,增加了该协议的可用性,但却不能兼容初始版本。
1.6 QUIC协议
QUIC(Quick UDP Internet Connection)是基于UDP传输层协议的流媒体协议,有别于TCP链接的三次握手,其通过建立单个RTT的低时延链接,且在此之后的连接可复用实现无RTT的数据可靠传输。在拥塞控制机制上,QUIC协议在TCP协议基础上进行改进,可做到拥塞控制的灵活调整,并适用严格递增的数据包序号代替字节序号和ACK确认机制,改善重传歧义问题[8]。QUIC协议不似TCP协议那样,在终端IP地址和端口变更的时候,可以完成连接迁移,而无需新建链接。此外,QUIC协议采用FEC机制来实现数据纠错恢复,加强了数据传输的可靠性,但亦会对带宽资源造成负担。
1.7 WEBRTC协议
WEBRTC(Web Real Time Communications)是一种由美国谷歌公司研发的公开流媒体协议。该协议可分别采用TCP或UDP协议进行媒体流数据传输。但无论是哪种方式下的数据传输,WEBRTC协议都需要在发送端与接收端建立链接,并借助第三方信令服务器来进行数据交互。WEBRTC协议支持AV1/HEVC(H.265)等新一代视频编码标准[9]。
另需说明的是,WEBRTC协议的最大缺点在于其不支持多路并发媒体流数据至对端。
1.8 小结
依前所述,参照TCP/IP体系,可在传输层将所有流媒体协议分成基于TCP协议和基于UDP协议的两大类别,并结合其在应用层控制策略的异同及独有功能特点详细区分。如表2所示,以下为相关流媒体协议的分类及特征简述。
表2 主要流媒体协议分类及特征
2 泛在低空网络环境及流媒体协议适用方案
在网联无人机的系统架构中,网联无人机的终端模组和地面控制需均通过5G网进行数据传输和控制指令传输,并通过云平台服务器加载各类应用场景。如图1所示,5G网络需提供从无线网到核心网的整体网络解决方案,以适配各种复杂应用场景的网络实现。
图1 网联无人机系统架构
服务趋于多元化的泛在低空应用场景的5G蜂窝网络可分为以下四种组建方案:1)公共网络;2)专用网络;3)地空同频混合网络;4)地空异频混合网络。但是,泛在低空环境下的5G网络,通常会出现带宽抖动,站点间信号频繁切换等问题。因此除了区分不同的网络环境,还需要对上述问题进行综合考虑,提出与之相适应的流媒体方案。
在依托地面5G蜂窝网络为泛低空应用提供接入和数据传输服务的公共网络方案中,首要遵循以服务地面用户及应用为主的原则,这就决定了所有地面基站设施的天线朝向优先针对地面做信号覆盖。此方案能够解决绝大多数的无人机行业应用诉求,实现其在低空300米以下的蜂窝接入,从而进行各类数据低时延可靠回传。但在这种方案下,要着重考量无人机行业应用所占5G蜂窝带宽资源的多少。综前所述,宜采用以下优先级排序:SRT>QUIC>RIST>WEBRTC>其他。
在专用网络方案中,因无需考虑5G蜂窝带宽资源分配问题,所以采用基于UDP或TCP传输的流媒体协议各有利弊,难以给出确切的优先级排序。
地空同频混合组网是指针对地面的蜂窝覆盖与低空的蜂窝覆盖采用相同频段资源。在这样的方案中,要首要解决地空间的信号互干扰问题,因此所选用的流媒体协议应以对带宽资源影响较少为主,支持低时延稳定传输为次。宜采用的优先级排序与公共网络方案中的结果类似。
地空异频混合网络,即地面使用现有公共蜂窝网络信号进行覆盖,而空中则使用频率相异的专用蜂窝网络信号建立通信区域。终端在这样的环境中,将不可避免地频繁进行网络切换。由于网络选择计算复杂性高、网络服务时间短、目标网络拥塞等原因,导致切换延迟高、切换次数多和切换中断,严重影响流媒体服务的质量和流畅度[10]。该方案下,需要考虑优先采用基于UDP传输的流媒体协议,并且要具有一定的自适应调整和抗干扰能力。优先级排序大致如下:SRT>QUIC>RIST>WEBRTC>其他。
基于以上研究,在中国联通5G(安阳)泛在低空测试基地,依托地面移动网络基础设施搭建的5G测试环境进行了流媒体协议技术指标验证工作,具体验证方案如下:
①在拉流过程尝试平台侧所支持的不同流媒体协议(QUIC/SRT/RIST/WebRTC/RTMP);
②将视频源数据通过HDMI接口传输到5G机载终端,由后者完成编码压缩(H.264)和输出清晰度调整(4K-3840×2160/1080P-1920×1080);
③将分别验证经由安阳云服务器/阿里云服务器完成数据流转,并在不同网络连接方式下测试多组不同流媒体协议下的拉流效果,完成传输时延比对记录。
验证结果表明:
1)在传输同等4K清晰度视频条件下,各流媒体协议时延基本符合上述研究结论。
2)在传输同等1080P清晰度视频条件下,各流媒体协议时延基本符合上述研究结论。
3 结语
随着我国低空环境的逐步开放,低空经济活动的不断多样化和频繁化,无人机应用市场有望迎来飞速增长。在这样的背景下,视频实时传输效果将成为衡量绝大多数5G网联无人机应用价值的主要指标之一。选择与5G网络组建形式相适宜的流媒体协议,可有效保障实时流数据的可靠传输,实现最根本行业应用的需求。一言以蔽之,流媒体协议会是控制5G网络下的泛在低空应用实现流媒体数据自传输到呈现的最有利抓手。