APP下载

ATSC3.0关键技术介绍

2015-05-05何大治徐异凌史毅俊徐洪亮朱林林管云峰

电视技术 2015年16期
关键词:物理层信令数据包

何大治,赵 康,徐异凌,史毅俊,徐洪亮,朱林林,管云峰

(1.上海交通大学,上海 200240;2. 数字电视国家工程研究中心,上海 200125)

ATSC3.0关键技术介绍

何大治1,赵 康1,徐异凌1,史毅俊2,徐洪亮2,朱林林2,管云峰1

(1.上海交通大学,上海 200240;2. 数字电视国家工程研究中心,上海 200125)

2013年,ATSC向全球征集下一代数字电视系统物理层方案。经过2年多ATSC3.0专家组的技术评估和交叉验证,2015年3月,中国提案的5个技术模块在众多技术提案中脱颖而出,被ATSC3.0标准采纳,这是中国数字电视标准技术首次直接导入国际标准体系。在这一背景下,对ATSC3.0标准以及中国提案的情况进行介绍显得十分有意义。先介绍了ATSC3.0的基本情况,然后简介了ATSC3.0系统中物理层、协议层和应用层的关键技术。其中,物理层重点介绍Bootstrap、LDM、BICM和ALP技术,协议层重点介绍rout-dash、MMT以及数字水印技术,应用层重点介绍Audio Codec。最后,简要描述了中国提案的情况。

ATSC;关键技术;物理层;应用层;协议层;中国提案

2013年初,ATSC组织向全球征集下一代数字电视系统物理层方案[1],由此拉开了美国下一代数字电视标准研究的序幕。2013年5月,数字电视国家工程研究中心、中科院上海高研院、上海交通大学组成联合工作组,并征询了国内其他科研机构的意见,确定向ATSC提交物理层提案,力争在ATSC3.0标准中出现“中国元素”。

中国提案由输入数据格式、比特编码调制、信令及帧结构、分布式多天线和双向回传等内容组成。提案支持建设大容量的覆盖网络,支持高速移动接收,具有高度的业务灵活性,支持多元化的业务组合,适应广播电视新型生态系统建设的需求,在功能上和性能上均超出了征集公告的要求。特别从多元化综合广播电视服务着眼,创新设计了不依赖外部资源提供回传通道的模块,进一步提升了广播电视网络的业务承载能力。

经过2年的努力,由全球数十个科研机构和企业共同参与的ATSC3.0方案设计和比选工作取得了阶段性成果,2015年,中国提案的5个技术模块在方案竞争中脱颖而出,被ATSC3.0标准方案采纳,这是中国数字电视标准技术首次直接导入国际标准体系。根据笔者全程参与ATSC3.0方案技术比选的经历,本文着眼于ATSC3.0总体以及各主要分层的特点,对物理层、协议层和应用层的关键技术进行介绍,并且对中国提案的发展历程进行介绍。

1 ATSC组织与ATSC3.0标准

1.1 ATSC组织简介

1.1.1 ATSC组织机构与运行

ATSC(Advanced Television System Committee)是一个非营利性质的全球性组织,成立于1982年,发起组织包括社会协作联合委员会(JCIC)、电子产业协会(EIA)、电气电子工程师学会(IEEE)、北美广播电视协会(NAB)、北美有线电信协会(NCTA)以及电影电视工程师协会(SMPTE)。ATSC致力于数字电视标准的研发,其成员代表来自广播电视、广电设备、动态图像、消费电子、计算机、有线电视、卫星电视、半导体等多个行业。

ATSC在不同的通信媒介中协调电视标准的应用与发展,主要关注数字电视、互动电视系统、宽带多媒体通信等。与此同时,ATSC还研究数字电视的战略部署,并针对ATSC标准开展研讨会。1995年ATSC发布了A/53数字电视标准,该标准在1996年被美国联邦通信委员会(FCC)采纳为美国国家标准。此后,ATSC又发布了若干标准以完善和升级第一代数字电视标准。目前,全球范围内使用ATSC标准的国家包括美国、加拿大、多米尼加共和国、萨尔瓦多、瓜地马拉、洪都拉斯、墨西哥和韩国。

ATSC面向全球开放会员申请资格,接受任何关心ATSC及受到标准成果影响的企业、机构和个人申请成为ATSC的会员或观察者(个人仅具有申请观察员资格),会员和观察员根据收入缴纳一定的会费。会员能够在专家组、技术标准组及全会等多个层面参与标准的起草与制定,对候选标准具有投票权,能够收到ATSC提供的标准部署与实施的相关信息,参加ATSC的技术研讨会,分享其他标准制定机构的信息。

ATSC的管理与运行由理事会负责,理事会成员必须来自于成员单位,由全体成员单位提名和选举产生,任期3年,主要职能是制定ATSC标准发展规划。ATSC理事会现有14人,来自包括广播商与电视播出机构FOX Networks、Univision Television Group、LIN Media、PBS、Capitol Broadcasting Company、NBC、CBS、Cox Media Group,制造商SONY、LG,以及行业协会CEA、NCTA、SMPTE。ATSC组织内部设立了联络工作组(Liason)、下一代广播电视规划小组(Planning Team)、技术与标准组(TG1)。理事会的目前主席为来自NBC环球的Glen Reitmeier。

1.1.2 ATSC的利益分配机制

ATSC作为一个非盈利机构,其本身的运行主要依靠企业赞助。在标准竞争环节,除提供会议场所外,所有的相关费用均由提案方各自承担。各提案方所提交的技术方案都包含了自身的专利,希望标准化后面向制造企业收取专利费来获得经济回报。按照ATSC目前的专利政策,提案方需要签署专利权声明,在申请中选择包括免费授权、在一定范围内根据合理无歧视原则有偿授权,或者完全自主定价的有偿授权方式。ATSC规定专利权人必须在提交技术提案及标准制定完成时披露所有专利,因此在提交专利权声明时需一并提交技术方案中已有的专利,避免ATSC标准的技术落入了第三方(非ATSC标准制定者)的专利保护范围内,只有在参与者与第三方先签订了保密合同,对部分专利信息进行披露会违反保密合同时,参与者才可以不披露该专利。

1.1.3 ATSC3.0的标准制定计划

2011年11月,ATSC成立了ATSC3.0技术组(TG3),其任务是专门研究制定下一代数字电视广播标准ATSC3.0,并在成立时规划了标准的5年计划,到2016年完成标准制定。ATSC3.0按照3个主要步骤进行工作:

1)应用需求征集与分析

首先在全球范围内征集下一代广播的应用需求,在需求征集的基础上进行分析和研究,根据分析结果进行系统架构设计(分层),并根据该结果进行分组,在TG3内部成立系统需求(S31)、物理层(S32)、管理与协议层(S33)以及应用与表述层(S34)4个专家组。

2)系统需求定义

根据收集到的应用需求,需求组(S31)确定了系统需求定义,撰写并发布系统需求报告,并明确各项系统需求与各小组之间的关系。

3)提案征集、评估和系统开发

根据系统需求定义,各小组确定工作范围和计划时间表,并按照计划时间表进行各个小组的提案征集、技术评估和系统开发工作。

目前已经形成的计划时间表如图1和图2所示。

图1 物理层、管理与协议层时间表

图2 应用与表述层时间表

其中,在物理层方面,主要的工作流程为:

1)小组讨论工作计划,将各个技术模块进行分解,讨论并确定各模块计划完成的时间。

2)对各个模块进行评估方法的讨论。该阶段的讨论充分发扬民主,考虑各方的意见,并选取科学性且可操作性的评估方法,在衡量和比较时优先考虑可操作性。

3)请各提案方提交模块提案和自测结果,并要求提案各方互相进行交叉验证。

4)汇总交叉验证结果,按照评估规则进行选择。

在此过程中,ATSC通过电话会议和见面会议进行多轮次的讨论,由ATSC指派的小组主席会充分听取各方的意见。但是在会后确定评估方法过程中,如果未能达成一致,则由主席根据会议讨论情况自主决定。

1.2 ATSC1.0~3.0标准的演进

从ATSC组织成立至今,陆续发布了ATSC1.0和ATSC2.0标准,现在,ATSC3.0标准也即将发布。在ATSC1.0标准中,支持高清视频、多播、5.1声道环绕立体声、电子程序导览、视频字幕、移动数字电视等功能。在其后发布的ATSC2.0标准中,能够后向兼容1.0标准,支持非实时传输、高级的音/视频压缩、加强的业务指南,增强了交互性。ATSC3.0标准将是一个全新的系统,不会进行后向兼容,但将会提供更好的性能和新的业务(见图3)。

图3 ATSC1.0~3.0的演进

相比于以前的系统,ATSC3.0提出了新的需求:1)实现无线三网融合,把地面数字电视广播发送端 “升级” 为新添无线宽带互联网网站功能(增加回传信道,把单向广播改造为双向交互的);2)除大屏幕电视机传统用户群体外,优先面向平板PC和智能手机的新用户群体;3)采用各种新技术,数字传输、音频/视频编码和传送等,以更有效利用地面电视频谱,其中明确要求OFDM调制;4)可发送4K- UHDTV和3D多声道音频;5)可融合各种新技术和其他有关标准等。

ATSC3.0的初衷在于制定一个自愿遵守的技术标准,并且为下一代数字地面电视广播系统提供建议。在ATSC组织中,ATSC3.0由技术组3(Technology Group 3,TG3)进行制定。同时,ATSC3.0成立了专门的专家组TG3/S1来进行系统需求的规划。

通过TG3/S1的规划,将ATSC3.0的系统需求划分到13个应用场景中,而从这13个应用场景,细分出了70个使用情景。这13个应用场景包括频谱的复杂使用、系统健壮性、移动接收、超高清、混合业务、多屏幕、3D视频、立体声等。频谱的复杂使用关注点在于低信噪比下,室内外的固定和便携设备能够得到高鲁棒性的信号接收;系统健壮性是指在信道衰落的影响下,仍然能够保证高质量的宽带业务;移动接收的目的是为智能手机等移动设备提供随时可接入的高清电视业务;超高清旨在为固定和移动接收用户提供4K甚至更高分辨率的视频业务;混合业务指不同业务的数据能够进行组合,并且能够动态地选择是在广播还是宽带信道传输;多屏幕指能够在一块屏幕的不同部分展示不同的视频内容;3D视频重点强调用户能在接收机处控制接收的3D内容的深度;立体声指系统支持高质量的音频表现,同时能够针对声场中的特定点提供更好的环绕声体验。由于篇幅所限,其他的应用场景在此就不一一介绍。

ATSC3.0系统是一个分层结构,主要是为了利用分层结构易于升级和扩展的特点。图4所示是ATSC3.0系统的3个广义的系统分层,应用层、管理和协议层、物理层。其中物理层由S32专家组进行规划,管理和协议层由S33专家组进行规划,应用层由S34专家组进行规划。物理层主要负责数据传输所需的链路创建,比如复用技术、星座映射、编码方式等;管理和协议层主要负责数据传输的协议控制以及各种业务的管理;应用层主要负责应用程序、播放器、UI、编解码器等的设计和开发。

图4 ATSC3.0广义系统分层

2 ATSC3.0物理层关键技术

2.1 物理层概要

ATSC3.0的物理层标准的目标是比ATSC A/53标准更灵活、鲁棒性更强、操作更加高效,因此,ATSC3.0标准并不会后向兼容A/53标准。这种物理层标准允许广播公司从各种各样的物理层参数中进行选择,进行内容的个性化定制,从而能够满足不同广播公司的需求;在相同的发射功率下,能够在高容量/低鲁棒性和低容量/高鲁棒性的模式间进行切换。对于ATSC3.0标准来说,在特定的使用情况下,比如单频网络、MIMO信道、绑定的信道等,可以选择不同的技术而不仅仅是使用单个发射塔。对于数据保护来说,有非常多的选择,这些选择包括不同长度的保护间隔、不同的前向纠错编码的码长以及码率等。

ATSC3.0系统显著的灵活性使得物理层的信号结构具有这样的特点:能够随着时间的变化,动态地改变使用的技术,同时保证与其他ATSC3.0系统的兼容性。这种变化的出发点是物理层能够提供高的频谱利用率,同时在不同的操作模式下,系统能够具有强鲁棒性。

对于ATSC3.0的物理层来说,除了传统的下行链路,还包括了一个上行链路。其中,上行链路使用回传信道,进一步扩展了数字电视的交互功能;下行链路通过输入格式化、信令等的合理使用,达到了支持4K、8K等未来超高清晰度电视传输的功能。图5显示了物理层的系统结构,可以看出ATSC3.0系统是一个支持双向交互的广播系统,能够在不依赖其他网络基础设施的条件下,同时支持广播业务和交互式业务。

图5 物理层框架结构图

图6显示了ATSC3.0物理层上行系统的结构框图。上行链路发送机的输入包括控制流和用户流量。控制流和用户数据都需要经过帧调节器和加扰器;然后,控制流通过接入信道生成器。用户数据经过二进制编码调制(BICM)和DFT之后,与通过接入信道生成器的控制流共同经过帧调节器进行组帧。最后,帧调节器的输出通过OFDM生成器将帧数据转化为物理层的上行链路输出。通常来说,上行链路发射机的输出也是在一个RF回传信道上传输的单个信号。

图6 上行子系统结构框图

在上行链路中,用户的需求以及信道的状况能够通过回传信道传回服务中心。服务中心收到用户的需求后,即能够调整发送的内容,满足用户的需求,提升服务质量;服务中心收到信道状况的信息后,动态地对发送功率、调制方式等参数进行调整,从而提升传输质量。

2.2 层分复用(Layered Division Multiplexing,LDM)技术

当信噪比较低时,单层系统无法实现高速率的数据传输。在ATSC3.0的物理层中,为了实现所需的数据传输速率,使用了层分复用技术[2]。LDM的基本思想是进行多层数据的同时传输,其频谱的层分复用结构如图7所示。

图7 LDM频谱层分复用结构

在LDM中,数据流A称为上层信号,主要用于鲁棒性要求较高的移动接收;数据流B称为下层信号,其功率比上层信号低5 dB,用于传输数据率要求较高的UHDTV、HDTV等业务;扩展层可根据业务需求进行添加,与上层和下层信号具有兼容性。通过这样的分层设计,达到了在同一信道带宽的前提下传输更多数据的目的。

对于物理层中的LDM,其结构框图如图8所示。主要由输入格式化、BICM、LDM插入模块、组帧和交织、波形生成等部分组成。从图8中可知,上层和下层数据均从输入格式化模块输入,并且被格式化。接着,数据在BICM模块进行纠错编码和星座映射。在这之后,根据系统设定进行上层和下层数据的混合,并且进行能量归一化处理。接着,对上下层数据混合产生的一路数据进行组帧和交织,其中包括了时域和频域的交织,最后,在波形生成模块产生输出波形。

图8 物理层LDM结构框图

与TDM/FDM系统相比,LDM系统与两者具有相同的大部分模块,从而整体上,ATSC3.0物理层使用LDM并不会增加很大的系统复杂度。同时,通过LDM插入模块,能够支持具有不同功率、不同编码方式和不同调制方式的多个物理层数据流,从而可以极大地提高频谱的利用率和使用灵活性。正是由于LDM具有这样的特点,故被选为了ATSC3.0物理层的基本技术。

2.3 Bootstrap

在ATSC3.0系统中,Bootstrap被用来实现时频同步、系统检测和信令传输等功能。与DVB-T2的P1相比,Bootstrap在信令传输上具有更强的灵活性。由于P1的信令信息由正交互补序列集合中的元素决定,因此具有较弱的灵活性,而Bootstrap信号由多个PHY Format Control Channel(PFCCH)符号(或称Bootstrap符号)组成,每个Bootstrap符号携带一定比特的信令信息,可以通过串联多个Bootstrap符号来提高信令传输能力。同时,Bootstrap采用Zadoff-Chu序列与PN序列相结合的方式,使得能够通过改变Zadoff-Chu(ZC)序列的根和伪随机(PN)序列的生成多项式达到版本控制的功能,ZC序列的根用来表征主版本号,PN序列的寄存器初始状态和生成多项式用来表征相应主版本下的子版本号。在典型的应用信道下经过仿真测试,得到Bootstrap可以在恶劣的信道环境下实现系统检测和信令传输功能。

对于Bootstrp来说,主要由3个步骤生成:首先生成频域序列,然后进行信令信息加载,最后进行时域信号的生成。

Traffic Organization of Large Vessels Entering Yangshan Port Phase IV

每个Bootstrap符号首先在频域上由ZC序列和PN序列相结合的方式产生,FFT窗的大小为2 048。ZC序列的长度为1 499,表达式如

(1)

其中:q表示ZC序列的根,用来表征主版本号。PN序列由长度为16的线性反馈移位寄存器产生,由寄存器初始状态和生成多项式系数组成的序列种子(seed)表征子版本号。

将生成的PN序列转换为双极性后与ZC序列相乘,得到频域上的初始Bootstrap符号。由于每个Bootstrap信号由不定个Bootstrap符号组成,因此为了表征Bootstrap信号的结束,将最后一个Bootstrap符号的相位旋转180度。当与本地序列相关得到一个负峰值时,则表示当前符号为最后一个Bootstrap符号。

Bootstrap的信令信息由循环移位量表征。当版本一定时,第一个Bootstrap符号为固定值(初始Bootstrap符号),用来实现时频同步,对应循环移位量为0。第N个Bootstrap符号由第N-1个Bootstrap符号相对循环移位M产生,因此每个Bootstrap符号至多能够携带11(lb2 048=11)bit信息。因此增加Bootstrap符号数目能够增加信令信息的传输比特,从而增加信令传输容量。

每个Bootstrap符号的时域结构由A、B、C这3部分组成,其中A部分为主体结构,是加载信令信息后信号的时域表示,B、C部分则是通过A尾部经过固定频移后得到。第一个Bootstrap符号为C-A-B结构,其余符号为B-C-A结构。将多个Bootstrap时域符号串联后得到一个完整的Bootstrap信号。

2.4 BICM

ATSC3.0的编码调制部分采用了与DVB-T2与DVB-NGH类似的比特交织编码调制方式(Bit-interleaved Coded Modulation),主要包含信道编码、比特交织与星座映射3部分。

为了能够支持高可靠性的业务需求,ATSC3.0提供了一组码长为64 800的LDPC码。同时、为了支持低功耗、低复杂度接收设备的实现,ATSC3.0还提供了一组码长为16 200的LDPC码。

为了能够支持深度覆盖的业务需求,ATSC3.0所采用的LDPC编码的码率最低可能达到2/15,而最低阶的星座映射为QPSK。同时,为了能够支持大吞吐量、高传输效率的业务需求,ATSC3.0所采用的LDPC编码的码率最高可能达到13/15,而最高阶的星座映射可能为1 024QAM甚至更高。

为了在现有数字电视地面传输标准的基础上进一步提高传输效率,ATSC3.0采用了非规则星座映射。16QAM、64QAM与256QAM采用了二维非规则星座映射,而 1 024QAM 以及更高阶采用一维非规则星座映射以平衡性能与实现复杂度。以256QAM为例,非规则星座映射相较于规则星座映射在AWGN信道下能够提供高至 1 dB 以上的增益。

为了增强系统的可靠性,ATSC3.0还可能将LDPC码与BCH或CRC码配合使用,从而进一步降低编码调制部分的误码平层。

2.5 ALP

对于ATSC3.0的物理层来说是一种交互式的系统结构,如图9所示,其中主要包括3个部分:下行广播,上行系统和服务中心。所有的交互数据都被封装为IP数据,因此这种结构适用于有线系统以及无线系统。如果使用的是有线网络,IP数据直接传送到服务中心。否则,将IP数据封装成帧,并通过无线媒体传输。而在无线网络中,需要加入控制信息,比如用来测量时间提前的时间戳等,来维持整个无线系统的运行。

图9 交互系统结构

在确定IP中心(IP centric)的技术路线之后,基带帧封装技术也应适应IP流。相比TS传输流,IP流的最大特征是数据包不定长,以及码流速率不恒定。同时,为了实现包括服务层信令(Service Layer Signaling,SLS)在内的其他类型数据的复用传输,ATSC3.0标准中重新设计了新的基带帧结构,输入数据处理模块,以及链路层协议。

在ATSC3.0中,输入数据处理模块对输入的数据进行封装以生成特定长度的基带帧,帧长取决于随后的编码调制(BICM)参数。每个生成的基带帧包括了包头和负载两部分,包头用于承载数据包在基带帧之间的分割信息,同时还可用于承载额外的控制字段;负载即为需要发送给用户的业务数据包,该数据包格式为由ATSC组织最新制定的ATSC链路层协议(ATSC Link-layer Protocol)。ALP协议与物理层的接口如图10所示。

图10 ALP协议与物理层接口

ALP协议可以将IP、TS及传输层信令等内容封装于同一个ALP数据流中,由此可以使得物理层输入数据处理模块在传输不同格式的数据内容时使用相同的接口和方法,以简化物理层设计难度、使协议栈各层之间的分界更明确。

为了降低待传输数据包中的冗余信息、提高传输效率,ALP协议提供了多种数据压缩功能。对于IP数据包的压缩使用了由IETF定义的强健包头压缩(RoHC)中的单向模式RoHC-U[3]。对于TS协议,ALP协议提供了较为复杂的数据压缩方式:ALP协议可以将多个TS数据包封装在一个ALP数据包中并去除内容为0x47的同步字节;为了获得更高的压缩效率,若一个ALP数据包内所有TS数据包的包头相同且计数器连续变化时,还可以去第二个及其后TS数据包的包头;ALP还具有与DVB-T2类似的空包删除功能,能够去除不包含实际内容的TS空包,并插入一个删除标志。上述各类数据压缩方法,在提高传输效率的同时,均能够保证收端可以准确无误地恢复出与待传输数据包完全一致的数据流。

除了目前已经定义的IPv4、IP包头压缩、TS、链路层信息等各类数据包外,ALP提供了足够的数据类型扩展能力,预留了一个16 bit的数据类型字段。

ALP数据包本身也具有充分的灵活度和可扩展性。ALP数据包包头可从2 byte扩展为3 byte,并还可容纳额外数据,以适应不同的数据包长度和配置。当三层数据包(例如IP数据包)被分割为多块并分别承载于不同的ALP数据包时,ALP包头中可以携带1个5 bit的计数字段标志分块顺序,以协助收端正确地重建原始数据。

通过对ALP协议的介绍和分析可以看到,ALP协议相比GSE、TLV等二层封装协议具有相当程度的改善,增强了对IP数据包的处理能力,提升了封装效率,扩展了传输功能[4]。

3 ATSC3.0协议层关键技术

图11显示了管理和协议层S33组的内部构成划分情况。共分为S33-1,S33-2,S33-3和TG3-4四个部分。其中,S33-1组主要负责业务传送和同步,具体包括传送、同步、信令、错误恢复和紧急状况警报;S33-2组主要负责业务声明和个性化,具体包括通知、个性化、目录和用量报告;S33-3组主要负责交互服务和多屏协作,具体包括多屏幕、交互、重新分配支持和APP信令。TG3-4主要是提供数据保护。

图11 管理和协议层S33组内部功能划分

协议层是上层与物理层之间的桥梁。协议层根据上层的需求和物理层的特点将数据包映射到物理层。协议层对于上层来说,主要负责数据传输和无线资源的配置。同时,协议层将会从物理层请求数据、业务需求以及信道测试状况的结果。

对于ATSC3.0的协议层来说,相比于1.0和2.0标准,着重加强了用户的个性化设置以及多屏幕,这是与ATSC3.0优先面向平板PC和智能手机新用户群体的需求相对应的。

ATSC3.0系统的协议栈如图12所示。ATSC3.0的协议层采用全IP协议,由于双向信道的支持,不仅能支持广播服务,也能够支持交互式服务,其中广播服务主要基于UDP/IP,交互式服务主要基于TCP/IP。在广播服务传送方面使用了两种方法,分别是基于MPEG媒体传输协议(MPEG Media Transport Protocol, MMTP)和单向实时对象传输协议(Real-time Object delivery over Unidirectional Transport,ROUTE)。MMTP用来传输媒体处理单元(Media Processing Unit,MPU)和MMT特定信令,其中MPU为MPEG媒体传输(MMT,ISO/IEC 23008-1)标准中基于ISO基本媒体文件格式(ISO BMFF)的基本封装单元,MMT特定信令包括用于消费和呈现两种信令。ROUTE用来传输DASH段(Segment)、ROUTE特定信令以及一些非时序内容,其中DASH段为基于HTTP的动态自适应流(DASH,23009-1)标准中的基于ISO基本媒体封装格式,非时序内容可以包括非时序媒体内容、EPG数据和其他文件。当然,非时序内容也可以通过UDP直接进行传输。ATSC3.0广播系统的信令可以通过MMTP和(或)ROUTE进行分发,而bootstrap信令信息以服务列表(SLT)的形式提供。

图12 ATSC3.0系统协议栈

为支持异构服务的提供,其中一个或多个节目元素通过宽带路径传输,在宽带端ATSC3.0系统采用ISO/IEC 23009-1 MPEG DASH通过HTTP/TCP/IP的协议层级,同时基于ISO BMFF的媒体文件被用来作为广播、宽带提供传输、封装和同步的格式。

3.1 MMT协议

3.1.1 MMT信令信息

当使用MMT协议会话来携带一个ATSC3.0的流服务时,MMTP包采用ISO/IEC 23008-1[1]中的信令信息模式来传输MMT信令信息。拥有MMT_package_id的MPT(MMT Package Table)信息应该在服务列表(Service List Table,SLT)中指示的MMT协议会话中传输。每个MMTP会话需携带特定的MMT信令信息及其传输的每个Asset。

每个MMT协议会话可能传输的MMT协议信令包含以下几个方面:

1)媒体呈现信息(Media Presentation Information,MPI)信令:该信令携带一个MPI表,其中包含了呈现信息的全部或部分文件。与MPI表相关联的MPT也可以通过该信令传输(参见ISO/IEC 23008-1的9.3.3节)。

2)假设接收机缓冲模型信令:该信令携带了接收机用来管理其缓冲区的信息(参见ISO/IEC 23008-1的9.4.2节[1])。

3)接收机缓冲模型移除信令:该信令携带了接收机用来管理其MMT解封装缓冲区的信息(参见ISO/IEC 23008-1的9.4.9节)。

除了MPT信息,下述MMT信令信息应由物理层管道(Physical Layer Pipe,PLP)信令传输。

4)时钟相关信息(Clock Relation Information,CRI)信令:该信令携带一个CRI表,其中包含了时钟相关信息,用于NTP时戳与MPEG-2 STC之间的映射(参见ISO/IEC 23008-1的9.3.5节)。

3.1.2 基于MMT的广播流传输

每个内容组件都可以看做是一个MMT Asset。每个MMT Asset都是有相同Asset ID的一个或多个媒体呈现单元(Media Processing Unit,MPU)的集合,并且MPU在呈现时间上没有重叠。一个MMT package是一个或多个Asset的集合,而一个ATSC3.0服务则是由一个或多个MMT package组成,并且MMT package在呈现时间上也是不重叠的。

单一的MMT协议会话上可以传输多种Asset,而每个Asset在该MMT协议会话范围内都有一个独一无二的Packet_id,这使得能够滤除携带特定Asset的MMTP(MMTPacket)数据包。需要注意的是,MMT package与MMT协议会话之间的映射信息是由MMT信令信息传递给接收端的。

图13和图14展示了一个MMT package与一个MMT协议会话之间映射的示例。图中,MMT package有3个Asset,分别为:Asset A,Asset B,Asset C。尽管所有用来消费和发送MMT package的MMT信令信息都需要传送给接收端,但出于简化,图中只显示了一个单一的MPT信息。图13中,MMT package的所有MMT Asset及其相关的MPT信息都被复用到一个单一的MMT协议会话中。而图14中,一个MMT package是通过两个MMT协议会话传送的。

图13 通过单个MMTP会话传送的一个Package

图14 通过两个MMTP会话传送的一个Package

3.1.3 MPU的封装

MMT协议所传送的文件是增加了一个“mmpu”Box的ISO BMFF(ISO Base Media File Format)格式的MPU。MPU是由元数据和媒体数据组成,因此传输时将其分成两种类型的MMTP包,即元数据包和媒体数据包。

将MPU分成不同类型MMTP包传送的媒体感知的分组形式允许数据包的交叉存取,以便接收端在遇到传输网络存在带宽限制时,减少初始化服务的延迟。同时,媒体感知的分组形式也能使接收端更高效地处理传输错误。

携带MPU元数据的MMTP包包头的FT字段应设置为0或1。需要注意的是,包含媒体数据的“mdat”Box的头部也应当作为MPU元数据处理。

携带MPU媒体数据的MMTP包包头的FT字段应设置为2。该类型MMTP包应当明确指示出媒体样本或子样本的边界,同时必须携带用于恢复媒体数据与元数据之间关联的最小信息,例如电影片段序列号和样本序号。

图15展示了单个MPU的媒体感知的分组示例。其中,视频数据的每个GOP都映射为单一的电影片段,当视频数据被封装到MPU中时,一个MPU含有多个电影片段。而当MPU被分段传送时,“ftyp”Box、“mmpu”Box及“moov”Box中的数据由FT取值为0的MMTP包携带;“moof”Box及其后面的“mdat”Box的头部数据由FT取值为1的MMTP包携带;“mdat”Box中的一个NAL单元由FT取值为2的MMTP包携带(一个NAL单元可以分成多个MMTP包,多个NAL单元也可以聚合成一个MMTP包)。

图15 单个MPU的媒体感知的分组示例

3.2 ROUTE/DASH协议

3.2.1 ROUTE/DASH服务层信令

服务层信令(SLS)提供了详细的技术信息给ATSC3.0接收端,能够发现和接入ATSC3.0用户服务和他们的内容组件。它包含了一套XML-编码的元数据片段,这些元数据片段被携带于一个专用的LCT会话里。该LCT会话可以通过包含在SLT中的bootstrap信息获取。SLS被定义在每个服务层级,描述了服务的特征和接入信息,如它的内容组件的列表,如何获取他们,以及接收端将服务呈现出来所需的能力。在ROUTE/DASH系统里,为了线性服务交付,SLS包括下面元数据段:用户服务绑定描述(USBD)、服务层级传输会话实例描述(S-TSID)和DASH媒体呈现描述(MPD)。SLS段应该以TSI为0的专用LCT传输会话被传输。应用于线性服务的SLS段的数据模型,用UML表示如图16所示。

图16 应用于线性服务的SLS段数据模型

ROUTE/DASH服务层信令包括用户服务绑定描述(USBD)和基于服务的传输会话实例描述(S-TSID)元数据段。这些服务信令段可以应用于线性服务,也可以应用于基于应用的服务。USBD段包含服务标识、设备能力信息、接入服务和构成媒体组件所需的其他SLS段的参考,以及使接收端能够决定服务组件传输模式(广播/宽带)的元数据。S-TSID段,通过USBD引用,提供一个或多个ROUTE/LCT会话的传输会话描述和在这些LCT会话中携带的交付对象的描述,其中传输会话描述中一个ATSC3.0服务的媒体内容组件被传输。

3.2.2 基于ROUTE/DASH的流传输

ISO/IEC 23009-1,MPEG DASH规定了格式和方法使标准HTTP服务器能够提供流服务给DASH客户端。同时MPEG DASH通过一个媒体呈现描述(MPD)文件指定了一批媒体段和辅助元数据(通过HTTP URL引用)的描述。

ROUTE协议用来广播传输DASH格式的流内容给大量接收端用户,如线性电视服务。它能够通过LCT会话中一个或多个源数据流传输任意数量的不同类型的媒体对象。此外恢复数据流可以用于某些场景,如对于移动设备,在某些地理区域等。

ROUTE协议的范围是交付对象和使用LCT包的关联元数据的可靠传输。图17展示了ROUTE会话的基本概念。一个ROUTE会话被建立用于传递LCT包。这些包可能携带源对象或者FEC恢复数据。从上到下,一个源协议包含一个或多个LCT会话,每个都携带关联对象和相应元数据。这些元数据作为实体模式的一个复合对象或LCT包头的扩展头,可能在信令元数据中被静态传送,也可能动态传送。数据包使用特定FEC机制携带于ALC中,允许对象以任意字节边界灵活分片。此外,传输对象可能单独或者捆绑使用FEC进行保护。无论哪种情况,绑定的对象被编码,只有恢复包被传送。对比于源数据包,这样允许传输对象集的恢复。注意一个或多个恢复数据流可能被生成,每个都有不同特征,例如支持不同潜在需求、不同保护需求等。

图17 ROUTE会话基本概念

这种架构支持多种源数据的保护和传输机制。同时支持所有现有非时序数据传输的用例,因为它可以以向后兼容的模式部署。

3.3 数字水印

ATSC3.0在协议层中考虑了增加数字水印来实现版权保护和内容协同两个功能,数字水印的原理图如图18所示。

图18 数字水印原理

ATSC3.0的原始广播内容通过水印的嵌入技术,增加一些数据载荷,通过内容传送系统(包括信源的压缩和信道的传输)发到接收机端,接收机通过数字水印检测技术来将原始广播内容提取并呈现出来,同时,接收机可以利用数字水印中内嵌的信息进行版权保护和内容协同。ATSC3.0的数字水印对于内容传送系统来说是一个透明的内容,内容传送系统会完整不变地将内嵌水印的内容传送给接收机。

ATSC3.0已经规定了在原始广播内容的音频和视频上分别增加数字水印。在视频水印上采用的是Sony的技术方案,即在每帧的第一行亮度上调制一个30 byte或者60 byte的信息。在音频水印上采用的Verance的方案,即在声音中内嵌一个单音用于水印信息的传输。

通过数字水印的内嵌,可以给接收机提供带有时间戳的内容的识别号,信道识别号和一个内容协同网址等,接收机通过这些信息可以给用户提供与内容相关的信息交互、动态广告、业务使用统计等应用。例如:接收机通过一个视频节目的数字水印中的内容协同网址,连接相关内容所在的服务器,获取该视频节目的不同语言字幕,提供给用户选择。除了内容协同的功能,数字水印还给ATSC3.0提供了版权保护功能,广播运营商可以很容易地通过数字水印找到其他非法的内容提供者。例如:广播运营商提供给某用户的节目,而该用户将其通过分发渠道解码后再次分发给其他用户用于牟利,广播运营商只要录制了其他用户接收的非法分发节目就能通过数字水印找到该用户。

4 ATSC3.0应用层关键技术

如图4中ATSC3.0系统的分层结构所示,应用层主要负责播放器、UI和编解码器等的设计。在本文中,重点对Audio Codec的设计进行介绍。

音频是ATSC3.0在应用层中比较重要的一个技术改进,音频标准目前还集中在两家技术方案中选择,一家是Dolby提出的以AC-4为核心的下一代广播电视音频方案,强调端到端的解决方案,该方案还是以传统的基于音频通道的编码(Channel-based)为核心技术方案,增加了一个音频元数据(Metadata),支持多个音频通道之间和音频效果的灵活呈现。而另外一家方案是以Fraunhofer、technicolor和Qualcomm为核心的MPEG-H联盟方案,该方案除了支持传统的基于音频通道的编码方案,还进一步支持了基于目标的音频编码(Object-based)方案和基于场景的音频编码(Scene-based)方案,该方案也增加了一个音频元数据,方便音频的灵活呈现和个性化选择。

目前,这两个方案各有特点,Dolby的方案强调其端到端的解决方案和成熟度,以及和AC-3的兼容性,而MPEG-H的方案强调技术的先进性和多样性。2015年10月—11月将在两个方案中选择一个成为ATSC3.0标准支持的音频解决方案。

5 中国提案的发展历程

2013年3月,ATSC向全世界发布征集下一代数字电视系统物理层方案的公告,要求新的系统采用国际化的核心技术。这对中国数字电视标准研究人员来说,是冲击国际标准的绝好机遇。

2013年5月,数字电视国家工程研究中心、上海交通大学、中科院上海高研院组成联合工作组,向ATSC组织提交物理层提案,与来自欧洲数字电视标准组织、日本广播公司、韩国电子通讯研究院、加拿大通讯研究中心、美国辛克莱尔广播集团等全球数字电视标准组织,以及高通、索尼、三星、LG、爱立信、Harris等国际知名企业的提案进行竞争。

2013年10月16日,ATSC在华盛顿审议标准提案,“中国提案”不但因为拥有支持未来8K、4K超高清晰度电视的链路传输能力,同时支持建设大容量的覆盖网络和高速移动接收,开创性地扩展了数字电视网络的上行功能等特点,受到全球数字电视技术研究同行的广泛关注。

从2013年底至2015年3月,联合工作组按照ATSC3.0专家组的要求,积极参与相关标准提案的各项评估工作。在一年半的提案评估阶段里,ATSC3.0的专家组对中国技术提案进行了多次研讨和交叉评估,通过多次的方案修订、技术研讨、结果论证和性能测试,中国提案的5个技术模块在众多技术提案中脱颖而出,被ATSC3.0标准采纳,这是中国数字电视标准技术首次直接导入国际标准体系。这5个技术模块分别是信令码、星座映射、比特交织、Bootstrap和回传信道。图19显示了中国提案从提出到被ATSC3.0采纳的历程。

图19 中国提案发展历程

6 标准展望

目前,ATSC3.0标准中的大部分技术方案已经确定了。通过近两年时间近百位国际顶尖专家技术评估和交叉验证,从物理层、管理协议层和应用层的大部分技术提案中选择了最符合用户需求、最具有技术含量的标准方案。

2015年5月,该标准方案在美国华盛顿正式对外进行技术方案的介绍,各个层的专家组主席分别就各层技术的特点向美国广播运营商、日韩消费电子商和全球主流研究机构介绍ATSC3.0标准,得到大会各方的高度评价。

2015年10月,将在上海进行ATSC3.0样机的联调联通测试(Plug Fest),围绕该标准的主要欧美设备厂家和日韩消费电子厂家纷纷报名参加该次活动,希望能通过这次联调联通测试,加快ATSC3.0标准相关产品设备的市场进入。

根据ATSC管理委员会的计划,ATSC3.0标准将在2016年完成所有标准文本工作并正式对外发布。与此同时,ATSC3.0标准的商业试播也会在2016年开展,FCC已经同意了ATSC3.0标准试播的频率申请。预计2016年和2017年是ATSC3.0标准商业化推广的重要阶段,也是标准设备厂家和消费电子厂家积极为市场相关产品做准备的重要阶段。可以预期,2018年将是ATSC3.0标准全面进入商用的时间,届时广播运营商、设备厂家和消费电子厂家会迎来ATSC3.0标准商业化的高峰时期。

除了在美国的ATSC3.0商业推动,ATSC3.0也积极在全球进行标准推广,希望成为和DVB-T2抗衡的一个数字电视的国际标准。北美的加拿大基本确定会采用ATSC3.0标准,亚洲的韩国、日本也很可能会选择采用ATSC3.0标准,南美的巴西、阿根廷都在观望和考虑中。

7 总结

在ATSC3.0系统中,通过合理设计上行链路和下行链路,达到了支持未来8K、4K超高清晰度电视的链路传输能力,同时,通过交互系统结构的设计,扩展了数字电视网络的上行功能。对ATSC3.0标准来说,虽然不会进行后向兼容,但将会提供更好的性能和新的业务,是新一代的数字电视技术标准。同时,在一年半的提案评估期间,数字电视国家工程研究中心、上海交通大学和中科院上海高等研究院组成的技术工作组,通过大量的技术研讨、算法仿真和评估论证,向ATSC3.0专家组提交并报告了30多份研究工作汇报,成功将具有多个自主知识产权的5个重要技术模块导入了ATSC3.0的标准,为我国信息、家电等行业在未来的标准竞争、产业化应用和专利布局奠定了重要技术基础。

[1] ARLAND D. ATSC receives 10 initial physical layer proposals for next-generation TV broadcasting technologies[EB/OL].[2015-06-28].http://atsc.org/news-release/atsc-receives-10-initial-physical-layer-proposals-for-next-generation-tv-broadcasting-technologies/.

[2] WU Y,RONG B,SALEHIAN K,et al. Cloud transmission: a new spectrum-reuse friendly digital terrestrial broadcasting transmission system[J]. IEEE Trans. Broadcasting,2012,58(3):329-337.

[3] BORMANN C,BURMEISTER C,DEGERMARK M. Robust header compression (ROHC):framework and four profiles: RTP, UDP, ESP, and uncompressed[EB/OL].[2015-06-28].https://tools.ietf.org/html/rfc3095.

[4] ITU-R BT.6/200,Multiplexing scheme for variable-length packets in digital multimedia broadcasting systems[S]. 2010.

责任编辑:许 盈

ATSC3.0 Key Technology Introduction

HE Dazhi1,ZHAO Kang1,XU Yiling1,SHI Yijun2,XU Hongliang2,ZHU Linlin2,GUAN Yunfeng1

(1.ShanghaiJiaoTongUniversity,Shanghai200240,China; 2.NationalEngineeringResearchCenterofDigitalTelevision,Shanghai200125,China)

In year 2013, ATSC declared that the physical layer scheme of the next generation of digital TV system is to collect around the world. After two years, by ATSC3.0 specialist group’s technical assessment and cross validation, five technology modules in Chinese proposal come to the fore and are adopted by ATSC3.0 standard in March 2015. This is the first time that Chinese digital television standard technology directly imported to the international standard system. In this paper, the ATSC3.0 standards and the situation of Chinese proposal are introduced. Firstly, the basic situation of ATSC3.0 is introduced, and then focuses on the key technology of the physical layer, protocol layer and application layer in ATSC3.0 system. Among them, Bootstrap, BICM, LDM and ALP technology in the physical layer, rout-dash, MMT and digital watermarking technology in the protocol layer, and audio codec in the application layer are mainly focused on. Finally, the situation of Chinese proposal is described briefly.

ATSC; key technology; physical layer; application layer;protocol layer;Chinese proposal

国家自然科学基金项目(61420106008);“111”引智计划项目(B07022);国家“863”计划项目(2013AA013503);上海市数字媒体处理与传输重点实验室,上海交通大学科技创新基金项目(Grant No.AF0300021);上海市科技创新行动计划项目(15DZ1100100);国家发改委创新能力建设项目(发改办高技[2011]2512号)

TN929.5

A

10.16280/j.videoe.2015.16.026

2015-07-29

【本文献信息】何大治,赵康,徐异凌,等.ATSC3.0关键技术介绍[J].电视技术,2015,39(16).

猜你喜欢

物理层信令数据包
基于K-ML-MPWFRFT的物理层安全传输技术
公路联网电子不停车收费系统路侧单元物理层自动测试软件研发
SLS字段在七号信令中的运用
移动信令在交通大数据分析中的应用探索
SmartSniff
基于信令分析的TD-LTE无线网络应用研究
LTE网络信令采集数据的分析及探讨
多天线物理层安全传输系统性能分析
基于Libpcap的网络数据包捕获器的设计与实现
1Gbps电力线载波通信物理层算法设计