H.265关键技术研究
2016-11-15张萍刘晓玲
[张萍 刘晓玲]
H.265关键技术研究
[张萍 刘晓玲]
H.265是新一代视频编码标准,沿用了H.264的混合视频编码框架,但又有新的技术亮点。对比H.264标准,H.265的压缩效率有了显著提高,编码同等质量的视频较H.264可节省约一半的码流,并增加了更多的并行机制和网络传输机制。对H.265的关键技术进行综述,着重分析编码结构、帧内/帧间预测、自适应补偿、并行编码及对H.264的关键改进。
H.265 H.264 视频编码
张萍
硕士,中国电信股份有限公司广州研究院,研究方向:视频编解码算法、云视频转码、互联网应用、云计算。
刘晓玲
硕士,中国电信股份有限公司广州研究院,研究方向:视频编解码算法、视频云转码,自然语言处理、知识管理。
1 背景
伴随高清、超高清4K乃至8K视频的兴起,海量的高清、超高清视频数据对存储提出新要求,其传输及点播应用对网络带宽也提出了诸多挑战。当前普遍采用的H.264视频压缩标准已无法满足需求,亟需一种更高分辨率、更高压缩率、更高质量的编码标准。
2013年ITU-T视频编码专家组与ISO/IEC动态图像专家组联合成立了视频编码联合协作组(JCT-VC),并推出H.265/HEVC标准[1]。相比H.264标准,H.265的压缩效率有了显著提高,编码同等质量的视频较H.264可节省40%~50%的码流,并增加了更多的并行机制和网络传输机制。例如,采用H.264标准需4M码率才能保证图像质量的1080P视频,采用H.265标准码率可降到2M左右,显而易见采用H.265能有效降低高清视频的存储成本和传输时对网络带宽的要求。此外,H.265还支持4K、8K等超高清视频格式。
2 H.265的技术亮点
H.265沿用了H.264的混合视频编码框架[2],但又有新的技术特点,如图1所示,其核心编码模块包括:帧内/帧间预测、变换及量化、去块滤波器、熵编码等。针对超高清清视频的编码及并行处理,H.265定义了灵活的块结构,同时对各个编码模块进行了优化和改进,又增加了新的编码模块(如SAO),使得压缩效率得到显著提高。
图1 H.265编码框架
2.1 树型编码结构
类似H.264宏块,H.265把一帧图像分割成互不重叠的编码树单元(CTU)。与传统宏块不同,CTU的大小可从16x16扩展到64x64,在高分辨率视频编码中,大尺寸的CTU可获得更好的压缩效率。CTU可通过四叉树递归分解成多个编码单元(CU),如图2所示编码树单元的四叉树分解[3]。四叉树结构使得H.265能够根据当前块的局部特性自适应地进行分块处理,在平滑区域采用较大的编码单元,而在纹理细节区域采用较小的编码单元。
图2 编码树单元的四叉树分解
在帧内/帧间预测模式下,一个CU又可划分成多个预测单元(PU),在变换和量化模式下,一个CU同样可以划分成多个转换单元(TU)。CU、PU和TU三个单元的相互独立,使得编码、预测、变换及量化各环节可分别优化,整体更加灵活高效。
2.2 帧内预测技术
帧内预测是利用已编码的相邻块的重构图像预测当前块,H.265扩展了帧内预测模式,提供了33种方向性帧内预测方式,以及DC和Planar两种平面预测方式[3]。与H.264相比较,H.265中方向性帧内预测的角度划分更细,可以增加预测的精度,减小图像残差数据的产生,增加数据压缩效率。
2.3 帧间预测技术
运动补偿是帧间预测的重要方法,插值方法用于计算运动补偿中非整数位置的像素值。H.264对1/4像素采用二次插值,先通过6阶插值滤波器计算1/2像素值,再采用线性插值得到1/4像素值。而H.265对1/2像素的插值采用对称的8阶滤波器,对1/4像素采用非对称的7阶滤波器。H.265这种采用高阶滤波器的单次插值方法,避免了中间过程的取整操作,提高了插值运算的精度。
H.265利用时域/空域运动向量的相关性,设计了更为复杂帧间预测模式,定义了Skip、Merge、Inter三种模式,其中Skip模式和Merge模式的每个预测单元(PU)的运动参数可直接由相邻的已编码块导出,因而只需编码一个指向参考块位置的索引。
2.4 采样自适应补偿
与H.264类似,H.265在编码环路内采用了去块滤波器减少块效应、振铃效应,但在去块滤波器之后引入了采样自适应补偿(SAO)技术。SAO对重建并经环路滤波后的图像进行处理,对不同类别的像素加上一个偏移值,从而降低原始图像与重构图像间的整体失真,提高压缩率并减少码率。
2.5 并行编码技术
为增强并行处理能力,H.265标准引入了Tile并行、错峰并行(WPP)、Slice并行等新特性。Tile并行中,图像按水平和垂直两个方向划分成很多矩形区域,即Tile,Tile间相互独立并可实现并行处理。Slice并发,一个Slice允许划分成多个子条带,每个子条带可独立编码。WPP并行,上一行的第二个LCU处理完毕,允许对当前行进行编码操作,从而进一步提高编码器的并行处理能力。
2.6 对H.264的关键改进
针对视频高清化和编码并行化,H.265对各模块进行了大幅改进,提高了算法复杂度以获得更好的压缩效率,对H.264的关键改进如表1所示[4]。
表1 H.265对H.264的关键改进
3 应用展望
H.265是继H.264之后的新一代视频编码标准,具有优良的网络适应性、并行处理能力及压缩效率。但H.265的算法复杂度相比H.264提高了2~10倍,采用H.265的实时编码对计算机硬件性能提出更高要求。
目前国内外主要的编码设备厂商正在积极参与H.265标准的研究,随着H.265编解码芯片的推出,H.265标准将逐渐取代H.264广泛应用到高清、超高清视频的压缩编码、网络传输,促进高清、超高清电视节目、网络视频的普及。
1High Efficiency Video Coding,Rec.ITU-T H.265 And ISO/ IEC23008-2,2013 G.J.Sullivan,J.Ohm,W.Han,T.Wiegand,“Overview of
2the High Efficiency Video Coding,” in IEEE TCSVT,vol.22,no.12,pp.1649-1668,2012
3新一代视频编码标准HEVC的关键技术.数据采集与处理.Vol.29,No.01,2014
4下一代视频编码标准H.265的核心技术研究.计算机技术与发展.Vol.24,No.04,2014
10.3969/j.issn.1006-6403.2016.10.011
(2016-09-14)