基于IPTV的动态媒体封装技术研究及应用
2017-09-03陈戈陈麒海锦霞
陈戈,陈麒,海锦霞
(中国电信股份有限公司广州研究院,广东 广州 510630)
基于IPTV的动态媒体封装技术研究及应用
陈戈,陈麒,海锦霞
(中国电信股份有限公司广州研究院,广东 广州 510630)
针对现有的IPTV在个性化、互动性的媒体封装局限性,研究和分析了目前已经存在的以及正在发展的动态媒体封装技术。为使动态媒体封装技术易于大规模推广,提出通过把标签信息加入信源中进行MPEG-2标准编码,再利用TS封装技术传输,最后通过解码器解码的解决方案,并利用该技术实现了九屏最热业务系统,得到了实际应用。
IPTV;动态媒体;个性化标签编码
1 动态媒体业务与技术概述
近年来,以宽带电视有线网为依靠的 IPTV(internet protocol television,互联网协议电视)[1-3],通过互联网以 IP(internet protocol,互联网协议)形式传送音视频节目,使客户可便捷地收看和点播电视、电影,并提供包括数字电视在内的多种交互化、可定制的电视服务和信息服务。
随着人们生活品质的不断提高,IPTV用户数量呈现指数式增长。与此同时,用户对于视频内容的高质量、多元化以及自身个性化的消费要求与千篇一律的媒体内容之间的矛盾日益突出,而且随处可见的手机、平板电脑以及运营商对4G网络的投入,使人们能更加便捷地浏览丰富多彩的媒体内容,IPTV正面临激烈的竞争。因此,IPTV系统急需通过引入给用户提供个性化服务的能力,满足不同用户的个性化需求,这意味着对内容的简单耦合和单一组织转变为复杂耦合和个性化组织,由此引发了内容组织的爆炸性增长。
为满足面向用户提供个性化服务需求,动态媒体可面向用户实现媒体与媒体、媒体与用户、媒体与网络、媒体与终端的内容动态耦合,从而可提供丰富的动态媒体业务。为此,动态媒体业务需通过多个维度采集数据,包括用户基本数据、业务订购数据、用户行为数据、终端信息等,并基于用户分类、时间状态、内容资源、地域分布等层次进行动态的内容关联和耦合,进而形成多维动态媒体元数据知识库。
动态媒体业务使传统数字媒体产业向跨网络融合、交互化方向演进,带动新的数字媒体产业的发展,在产业链各个环节催生新市场,将带动媒体内容、广告等增值运营业务。动态媒体的应用使得广大用户能够享受到高质量、便利的满足个性化需求的跨终端、跨网络、跨媒体的视听媒体服务,促进产生个性化与强互动相结合的媒体消费新模式,进一步推动信息化消费,具有显著的社会效益与社会作用。
本文针对媒体内容的动态形式,采用压缩表示和组织结构,并且对其进行个性化标签的编码。在媒体关联分析的基础上,通过对广播推送内容关联动态耦合信息,优化组合内容,通过高效的查询、检索和聚合算法,在终端通过内容与设备耦合,有效地组织和表示内容并高效地提供给不同的用户,实现媒体的动态智能分发,最终满足大容量用户的个性化需求,并在此基础上,实现了九屏最热业务系统。
2 动态媒体封装技术
2.1 动态媒体封装需求
动态媒体相对于传统的静态媒体而言,综合了视频、音频、动画等多种媒体以及互动性的富媒体体验,在人们消费或者创作媒体的时候,它能发生实时的变化。需要实现对动态媒体内容的高效内容分发、码率和协议自适配的服务以及为多网多屏动态媒体服务提供高清、高质、流畅的流媒体服务的能力,传统的视音频传输封装格式与方法已无法满足动态媒体的需求。
因此,动态媒体封装除需要封装传统的视频、音频信息外,还需包含图片、文本等内容,而且动态媒体需支持与用户的互动,并实现个性化内容传输。ATSC(Advanced Television System Committee,先进电视制式委员会)提出下一代的媒体封装技术应满足个性化、互动化、浸入式服务这几方面的要求。
动态媒体封装层次如图1所示。
图1 动态媒体封装层次示意
由图1可以看出,动态媒体封装应可封装多种媒体内容,封装后的内容应可在移动数据网、宽带数据网、广播电视网同时应用,支持单向广播,同时也应支持双向的互动服务。动态媒体内容还应易于在不同终端上移植。
目前,IPTV、广播电视都使用TS(transportstream,传送流)封装[3],从结构上来说,TS流由分组头和分组数据组成,扩充过的TS流还包含时间戳。这样不管是什么格式的音频,都很容易通过时间戳来同步图像,这样就不会产生音像同步问题。TS流携带的视频信息被分割成许多小分组,损坏一个分组,别的分组还可以播放,并且从视频流的任一片段开始都可以独立解码,由于这个原因,它易于传输,随着容错/纠错技术的提高,加上它良好的网络传输能力,很快成为了世界标准并广泛应用于手机、数字电视和IPTV等各个领域。
但是,现有TS技术在支持动态媒体方面还存在以下不足:
ATSC3.0[4,5]提出的动态媒体封装不再使用TS格式,其提出的内容封装如图2所示。
图2 ATSC3.0示意
ATSC3.0使用ISOBMFF(MP4)作为视音频的流媒体封装,对于互动化的动态媒体内容则使用HTML5来表述。ATSC3.0不向后兼容,因此近期在现有平台与系统中应用非常困难。
2.2 TS扩展的动态媒体封装技术
由于 TS封装支持数据广播技术已经比较成熟,为易于在现网大规模动态媒体业务,通过扩展 TS封装实现动态媒体业务的承载是近期实现动态媒体业务推广的较为可行的方案。
现有数据广播方案没考虑互动化内容的承载,对多种终端、多种网络的承载也缺乏描述。扩展TS封装时,考虑到TS的小分组(188 byte)封装,不适合传输大量的数字信息(如HTML5)。针对TS封装动态媒体内容,可使用以下方案:
本方案TS扩展支持动态媒体扩展字段如下。
(1)TS_program_map_section()(ISO/IEC 13818-1: 2000 2.4.4.8):需要添加对private_section()的描述信息。
(2)private_section()(ISO/IEC13818-1:2000 2.4.4.11),具体描述信息如下:
对于 private_section()在 TS分组中出现的频率,规定在动态媒体内容出现期间内必须出现一次完整的 private_section(),这样可以防止因为分组丢失引起数据缺失。动态媒体内容消失后,private_section()不会出现。
另外需要注意的是,private_data_byte很有可能超过188 byte,意味着,private_section()可能由多个188 byte组成,按照13818-1的规范描述,对于第一个 private_section(),TS 头的payload_unit_start_indicator为 1,且 PES头带有pointer_field(规定该值为 0),对于每个在private_section()需要指定 section_number以及section_number。
图3所示为一个XML的样本。
图3 XML的样本示例
XML形式定义如下。
Element为一个根节点,描述整个图文信息,其中,num属性描述共有多少个基本元素。
Element为一个基本图文元素的描述,有如下属性:
3 九屏最热业务系统的动态媒体内容封装示例
3.1 现有九屏最热系统流程
九屏最热业务是指在 IPTV上,将目前最多观众同时观看的9个频道列出来,并可根据用户的观看记录,把该用户最常看的频道放在前列。
现有九屏最热业务系统是在大数据分析技术的基础上,将频道信息和统计出的频道观看人数作为输入源,通过在EPG(electronic programme guide,电子节目菜单)上画出九宫格,进而面向用户提供最热频道的信息。
九宫格频道示意如图4所示,九宫格EPG界面包含各类供用户浏览的动态或静态的多媒体内容。在用户移动焦点的同时切换音轨,此时如果按确认键,可以全屏播放。
图4 九宫格频道示意
基于EPG的九屏最热业务流程如图5所示。首先在当前时段,通过大数据分析技术生成9个收看人数最多的频道,并把它们的音频数据存储于MEM(media entertainment mediakey,媒体娱乐中间键)中,同时设定每N s更新这9个频道;再把9个频道的音频数据发送到编码器中,按照约定的时间点生成九宫格频道发送到 CDN[6](content distribution network,内容分发网络);当用户从 STB(set-top-box,机顶盒)或者 EPG中访问九宫格频道时,需要从MEM中获取各九宫格频道的音频数据,此时用户选择小格对应的频道,切换音轨;最后选择确定键,进行全屏播放。
图5 基于EPG的九屏最热业务流程
图6 编码时间和播放时间示意
3.2 现有九屏业务系统存在的问题
现有九屏业务系统存在的最大问题就是由于EPG更新与视频编码时延不同步,会引起用户未能播放正确频道的问题。
图6所示为编码时间和播放时间示意,在t1时间点,用户获得的九宫格频道数据与播放的九宫格频道一致;当九宫格频道由图 4更新为图 7时,在 t2时间点,用户获得马赛克数据与播放的马赛克频道不一致,此时选择CCTV-5大屏播放,结果却播放广东嘉佳卡通。
图7 更新后的九宫格频道示意
对图5的时延进行分析,该时间包含较为固定的编码时间、解码时间和按键时间以及受网络影响比较大从而不固定的传输时间。假设时延为L=8 s,每N s编码器切换一次Top9频道的数据,九宫格频道中频道位置变换为 60%,那么,用户选择全屏播放时错误几率可以用式(1)计算:
由式(1)可得,当N=3 600、L=8、E=0.001 3时,准确率约为 99.9%;当N=3 600、L=8、E=0.001 3时,准确率约为99.9%。
在实际应用中,如果正巧在时延的过程中进行切换,不准确率还会下降一半;而如果在时延的过程中对切换的动作不做出反应,不准确率可下降到约为0,但是此时系统的可用性降低,且对用户不友好。
3.3 基于TS扩展的九屏最热业务系统的动态媒体内容封装示例
为解决现有九屏最热系统的同步问题,通过前面介绍的动态媒体TS封装技术,把九宫格的最热信息封闭封装在TS流中,使TS视频与九屏的信息变化同步,从而解决现有的同步问题。
基于 TS扩展的九屏最热业务系统的动态媒体内容XML的封装定义如图8所示。
图8 基于TS扩展的九屏最热业务系统的动态媒体内容XML的封装定义
Elements num=9,再通过Element描述9个格子的信息,第一格信息示例如下。
Element idx=0,其属性如下:Idx=0,type=txt,href=多播地址,top=10,lef=10,width=300,height=200,font=20,color=blue。
基于TS扩展的九屏最热业务流程示意如图9所示。
九屏最热实际应用如图10所示。
图9 基于TS扩展的九屏最热业务流程示意
图10 九屏最热实际应用
4 结束语
本文介绍了目前已经存在以及正在发展中的动态媒体传输的封装技术,分析了各自的优缺点和适用场景,结合大数据平台,通过改进的动态媒体TS封装技术,实现了九屏最热业务系统,并进行了实际的应用。基于动态媒体编码的视频能实现智能呈现,通过广播和宽带网络的协同传送,为用户提供高度个性化和高质量的视听媒体服务,并通过规模化应用示范进一步创新互动媒体业务形态,促进数字媒体的共振消费,最终提升未来媒体智能化服务水平与质量。
[1]XIAO Y, DU X, ZHANG J, et al. Internet protocol television (IPTV): the killer application for the next-generation internet[J]. IEEE Communications Magazine, 2007, 45(11): 126-134.
[2]黄颖波. 广东 IPTV播控平台的设计与实现[D]. 广州: 华南理工大学, 2016. HUANG Y B. Design and realization of Guangdong IPTV broadcasting control platform[D]. Guangzhou: South China University of Technology, 2016.
[3] 聂祥. 浅析现阶段 IPTV 业务的应用及运营[J]. 电信科学, 2005, 21(5): 39-42. NIE X. Discussion about application and operation of IPTV business of the present stage[J]. Telecommunications Science, 2005, 21(5): 39-42.
[3]朱明海. 流媒体服务器 TS流封装的实现及流控的研究[D].北京: 北京邮电大学, 2011. ZHU M H. Realization and flow control of TS stream encapsulation in streaming media server[D]. Beijing: Beijing University of Posts and Telecommunications, 2011.
[4]CHERNOCK R, WHITAKER J C. 美国新一代数字电视ATSC 3.0标准技术体系介绍[J]. 广播与电视技术, 2015, 42(s2): 11-19. CHERNOCK R, WHITAKER J C. ATSC 3.0 system update[J]. Radio & TV Broadcast Engineering, 2015, 42(s2): 11-19.
[5]何大治, 赵康, 徐异凌, 等. ATSC3.0关键技术介绍[J]. 电视技术, 2015, 39(16): 105-114. HE D Z, ZHAO K, XU Y L, et al. ATSC3.0 key technology introduction[J]. Video Engineering, 2015, 39(16): 105-114.
[6]杨明川. 内容分发网络关键技术分析[J]. 电信科学, 2005, 21(8): 13-17. YANG M C. Key technology researches of content distribution network[J]. Telecommunications Science, 2005, 21(8): 13-17.
Research and application of dynamic media packaging technology based on IPTV
CHEN Ge, CHEN Qi, HAI Jinxia
Guangzhou Research Institute of China Telecom Co., Ltd., Guangzhou 510630, China
For the limitations of existing IPTV system in personal service, interactive service, the existing and developing dynamic media packaging technologies were studied. In order to make dynamic media packaging technologies easy to apply in the IPTV system, a method that adding the label information to the source for MPEG-2 standard encoding was proposed, and TS package technology was used to transmit, and finally decoding was achieved by the decoder. This technology had been used in realizing the system of nine screens hottest business system and had achieved practical application.
internet protocol television, dynamic media, label encoding personality
The National High Technology Research and Development Program(863 Program)(No.2015AA015803)
TP393
A
10.11959/j.issn.1000-0801.2017232
陈戈(1973−),男,中国电信股份有限公司广州研究院高级工程师,主要研究方向为IPTV、CDN关键技术。
陈麒(1992−),男,现就职于中国电信股份有限公司广州研究院,主要研究方向为动态媒体视频编码。
海锦霞(1983−),女,中国电信股份有限公司广州研究院工程师,主要研究方向为CDN技术。
2017−07−15;
2017−07−26
国家高技术研究发展计划(“863”计划)基金资助项目(No.2015AA015803)