一种快速HEVC帧内预测模式决策算法
2014-08-05雷海军袁梅冷
雷海军,危 雄,杨 张,袁梅冷
(1. 深圳大学计算机与软件学院,广东 深圳 51 8060;2. 广东省普及型高性能计算机重点实验室,广东 深圳 518060;3. 深圳市服务计算与应用重点实验室,广东 深圳 518 060;4. 深圳职业技术学院,广东 深圳 51806 0)
一种快速HEVC帧内预测模式决策算法
雷海军1,2,3,危 雄1,2,3,杨 张4,袁梅冷4
(1. 深圳大学计算机与软件学院,广东 深圳 51 8060;2. 广东省普及型高性能计算机重点实验室,广东 深圳 518060;3. 深圳市服务计算与应用重点实验室,广东 深圳 518 060;4. 深圳职业技术学院,广东 深圳 51806 0)
高性能视频编码(HEVC)标准是视频编码联合小组提出的新的视频编码标准。针对HEVC帧内预测模式决策的高计算复杂度问题,提出一种基于边缘方向强度检测的快速帧内预测模式决策算法。将35种帧内预测模式根据5个基本方向分为5个预测候选模式集合,每个集合中有11种预测模式。分别计算预测单元(PU)的5个方向的方向强度,以及每个方向所占比例,选择比例最大的方向所对应的候选模式集合为该PU块的候选预测模式,有效减少帧内预测的计算复杂度。实验结果证明,与HM8.0相比,该算法能够以保证视频质量为前提,在高效率条件和低复杂度条件下平均节省15%和18%的编码时间。
视频编码;高性能视频编码标准;帧内预测;预测单元;模式决策;边缘方向检测
1 概述
高性能视频编码(High Efficiency Video Coding, HEVC)标准于2010年4月在德国德累斯顿召开的JCT-VC第一次会议上提出。该标准主要面向高性能高清视频应用,提供从QVGA(320×240像素分辨率)到1 080p甚至超高清(7 680× 4 320)分辨率的视频应用。HEVC的核心目标在于:相比于H.264视频编码标准,大幅提高视频压缩效率,即在相同视频质量前提下,视频流码率减少50%[1]。
相比H.264标准,HEVC依然采用混合编码框架[2],但在很多方面做出了改进来提高压缩效率。具有代表性的技术方案有:基于大尺寸的四叉树分割结构[3]和残差编码结构,多角度帧内预测[4],运动估计融合技术等。其中,多角度帧内预测,HEVC的预测方向数从H.264标准中的9种增加到33种[4],很大程度上提高了帧内预测的精度,但同时也带来了很高计算复杂度的负面效果。
针对H.264帧内预测的高计算复杂度,已有众多学者提出了优化改进的方法。文献[5]提出了一种基于二维直方图的快速帧内预测算法,在帧内预测之前对宏块预判,减少预测算法复杂度,提高视频压缩编码效率。文献[6]利用预测图中相邻模式及次优模式与最优模式的相关性特点,对帧内预测模式进行选择,提出了一种基于Intra4×4的快速模式选择算法,减少了帧内预测的候选模式数。文献[7]通过对前4×4块帧内预测方向度量,利用相邻块和相邻方向预测模式的相关性进行帧内模式预测。文献[8]利用帧内预测模式与视频图像块纹理方向的相关性提出了一种快速帧内预测算法,使用Sobel算子计算出视频图像中纹理最强的方向,在纹理最强方向和与该方向最接近的2个方向以及DC方向模式搜索最优的预测方向,将H.264中的9种帧内预测方向减少为4种预测方向,从而大量节省计算时间。
同样,针对HEVC帧内预测的高计算复杂度问题,文献[9]采用反向预测顺序进行色度分量预测生成深度图和候选预测模式集合,再进行亮度分量帧内预测,以降低HEVC帧内预测计算复杂度。文献[10]利用HEVC四叉树编码的特点,缩短预测像素与参考像素之间的距离,提高帧内预测精度。这种短距离帧内预测方向能大幅提高细节丰富的图像的帧内预测精度,从而提高编码效率。
本文使用一种新的方法,对帧内预测模式进行优化,减少参与率失真优化(Rate Distortion Optimization, RDO)计算的帧内预测模式,将HEVC中35种帧内预测模式减少为11种预测模式来实现快速帧内预测模式决策过程,从而降低帧内编码时间,提高编码效率。
2 HEVC帧内预测
HEVC标准定义了3种单元块:编码单元(Coding Unit, CU),预测单元(Prediction U nit, P U)和变换单元(Transform Unit, TU)[11]。编码单元是HEVC视频编码的基本单元,类似于H.264编码中的宏块,CU块是正文形,并且CU块的最大尺寸为64×64(即Largest Coding Unit, LCU),最小尺寸为8×8(即Smallest C oding U nit, S CU)。对于每个CU块,HEVC使用PU块实现该CU块的预测过程。PU块支持多种分割类型,对于帧内预测,PU块的分割类型只能为2N× 2 N和N×N这2种类型。TU块可支持对4×4至32×32基本单元的编码变换和量化。图1所示为CU与PU的分割关系。
图1 C U、PU分割关系
HEVC软件测试模型HM8.0[12]中的帧内预测共有33种角度预测模式,如图2所示,另外还包括2种非方向性预测模式:直流预测模式(Intra_DC)和平面预测模式(Intra_ planar)。PU块的大小共有5种,分别为64×64,32×32,16×16,8×8,4×4,这5种尺寸PU块所对应的帧内预测模式数分别为4,35,35,35,18。当前PU块的帧内预测值是从相邻PU块的参考像素矩阵中通过线性内插得到。该预测过程中,每个像素预测值需要大量的算术计算,增加了预测过程的计算复杂度。
图2 帧内预测模式方向
在HEVC软件测试模型HM8.0中,首先根据当前PU块的大小得到当前PU块的可用帧内预测模式,再通过对预测残差哈达曼变换计算出各个模式下的残差绝对值总和(Sum of Ab solute Transformed D ifference, SA TD),选出SATD最小的前n种预测模式为率失真优化(Rate Distortion Optimization, RDO)候选预测模式。帧内预测过程中为保证预测的准确性,最可能预测模式(Most Pr obable Mode, MPM)始终包括在RDO候选预测模式集合中。最后对各RDO候选预测模式进行率失真优化计算,得到帧内最优预测模式。
3 快速帧内预测模式决策算法
3.1 P U块边界方向检测
在HEVC的帧内预测模式中,有33种方向性预测模式,若某个PU块选中某一预测模式则说明该PU块的纹理方向与该预测模式方向具有相似性。因此,可以首先计算出各PU块的纹理方向,对帧内预测模式进行快速搜索。如图3所示,对4×4的PU块,可以划分为4个2×2的子块。
图3 用于边缘方向检测的PU块4分割
每个子块可以用其中包含的4个像素的平均值表示。各子块的计算过程如下。
4×4的PU块的各像素值为:p(m, n), m, n=0,1,2,3;则被分割后的各子块的灰度值为:
对于该4×4的PU块,若块内无明显边界,则(S00+S11)/2 与(S01+S10)/2的差将会很小;若块内存在一个明显的水平边界,则(S00+S01)/2与(S10+S11)/2将有明显的差值,垂直方向类似;若块内存在一个明显的45°对角线边界,则S00与(S01+ S10+S11)/3或S11与(S00+S01+S10)/3有明显差值,135°对角线边界类似。
本文将PU块划分5种边界方向,分别是无明显边界、水平边界、垂直边界、45°对角线边界、135°对角线边界、如图4所示。
图4 P U块的5种边界方向
这5种边界方向的强度值Eθ(θ∈{ND,0,π/4,π/2,3π/4})的计算如表1所示,则PU块的边界方向即为Eθ最大值所对应的边界方向。
表1 边界方向强度计算
以上为4×4的亮度块的边界方向检测过程。对于8×8,16×16,32×32的PU块,将其分割成4×4的PU单元,再进行边界方向检测。如图5所示,将16×16的PU块分割成16个4×4的PU块,计算这16个4×4的PU块的边界方向,则16×16的PU块的边界方向由16个4×4的PU块边界方向中占比例最大的方向决定。由于尺寸较大的PU块被检测为无边界方向的可能性更大,为避免将有边界方向误判为无边界方向,特别设定只有在无边界方向的4×4块所占比例超过75%时,当前PU块才被检测为无边界方向。
图5 16×16 PU块分割成4×4 PU单元的方向检测
3.2 帧内预测模式的划分
由于帧内预测模式与视频图像块内的边缘方向是密切相关的,因此可根据上述5种边缘方向将33种帧内预测模式划分为5类。
(1)无边界方向预测模式:END={0,1,3,4,5,6,7,8,9};
(2)水平方向预测模式:EH={1,7,8,15,16,28,29,30,31};
(3)垂直方向预测模式:EV={0,4,5,11,12,20,21,22,23};
(4)45°对角线方向预测模式:E45°={5,6,9,13,17,24,25, 32, 33};
(5)135°对角线方向预测模式:E135°={5,6,9,13,17,24,25, 32, 33}。
为保证帧内预测的准确性,Intra_DC和Intra_planar预测模式将加入到上述5个预测模式集合中,每个PU单元的可用预测模式数从33种减少为11种。若检测到当前PU块的边缘方向无明显边缘方向,则当前PU的可用帧内预测模式为集合END,对于其他方向的选择过程与此类似。由于每个PU块的可用帧内预测模式数减少,本文所用方法中将4×4和8×8大小PU块的候选帧内预测数设定为5。
4 实验结果及分析
为了验证所提出方法的效率,本文以HEVC的软件测试模型HM8.0为参照进行实验。实验平台为Inter(R)酷睿双核CPU,主频2.83 GHz,内存3 GB,操作系统Windows XP。实验所用的序列的测试条件来自文献[13],量化值分别为22、27、32、37。实验结果如表2所示。比较编码效率的参数指标有PSNR增量(ΔPSNR)、码率增量(ΔBitrate)和编码时间增量(Δtime),分别用以下公式进行计算:
表2 实验结果对比
从表2中可以看出,在高效率条件下本文提出的算法的码率与HM8.0相比有明显提升,视频编码质量仅提高了0.14 dB,但是编码时间节省了约15%。,在低复杂度条件下本文算法的码率与HM8.0相比有明显提升,视频编码质量仅提高了0.12 dB,但是编码时间节省了约18%。
5 结束语
本文通过检测各PU块的边缘方向强度,将帧内预测模式数从35种减少为11种,简化了对不必要的预测模式的率失真优化(RDO)计算,从而降低视频编码的计算复杂度,节省编码时间,提高编码效率。实验结果证明本文所提出的快速帧内预测模式决策算法是正确和有效的。但是所提出的算法仅优化了HEVC帧内预测的粗选模式决策过程,并未考虑帧内预测模式的率失真优化计算过程,有待进一步研究以提高帧内预测的编码速度。
[1] Sullivan G J, Ohm J, Han W J, et al. Overvie w of the High Efficiency Video Coding(HEVC) Standard[J]. IEEE Transactions on Circuits and S ystems for V ideo Technology, 2012, 22(12): 1649-1668.
[2] Wiegand T, Ohm J R, Sullivan G J, et al. Special Section on the Joint Call for Proposals o n High Ef ficiency V ideo Coding(HEVC) Standardization[J]. IEE E T ransactions on Circuits and Sys tems for V ideo Technology, 201 0, 20(12): 1661-1666.
[3] Kim I K, Min J, Lee T, et al. Block Partitioning S tructure in the HEVC S tandard[J]. IEEE T ransactions on Circuits and Systems for Video Technology, 2012, 22(12): 1697-1706.
[4] Lainema J, Bossen F, Ha n W J, et al. Intra Coding of the HEVC S tandard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(12): 1792-1801.
[5] 谢 晶, 贾克斌. 一种基于二维直方图的H.264/AVC快速帧内预测判决算法[J]. 电子与信息学报, 2005, 27(7): 1053-1057.
[6] 王维哲, 周 兵, 张行进. H.264 编码中的帧内预测模式选择算法[J]. 计算机工程, 2008, 34(2): 226-228, 231.
[7] 王启文, 黄东军. H.26 4中4×4块的快速帧内预测算法[J].计算机工程, 2010, 36(2): 217-219.
[8] Pan F, Lin X, Rahardja S, et al. Fast Mode Decision Algorithm for Intra Predict ion in H.264/AVC V ideo Coding[J]. IEEE Transactions on Circuits and Systems for V ideo Technology, 2005, 15(7): 813-822.
[9] Chen Weijing, Su Jia, Li Bin, et al. Reversed Intra Prediction Based on Chroma Extraction In HEVC[C]//Proc. of International Symposium on In telligent Signal Processing and Communications Systems. [S. l.]: IEEE Press, 2011: 1-5.
[10] Cao Xiaoran, Lai Changcai, Wang Yunfei, et al. Short Distance Intra Coding Scheme for HEVC[C]//Proc. of Picture Coding Symposium. [S. l.]: IEEE Press, 2012: 501-504.
[11] Han W J, Min J, Lee T, et al. Improve d Video Compression Efficiency Through Flexible Unit Representation and Corresponding Extension of Coding Tools[J]. IEEE Transactions on Circuits and Systems for V ideo Technology, 2010, 20(12): 1709-1720.
[12] JCT-VC. The Reference Software of HEVC[EB/OL]. (2012-11-10). https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/ tags/HM-8.0.
[13] Bossen F. Common Test Conditions and S oftware Reference Configurations[Z]. 2011.
编辑 顾逸斐
A Fast Mode Decision Algorithm for Intra Prediction in HEVC
LEI Hai-jun1,2,3, WEI Xiong1,2,3, YANG Zhang4, YUAN Mei-leng4
(1. College of Computer Science & Software Engineering, Shenzhen University, Shenzhen 518060, China; 2. Key Laboratory of Affordable High Performance Computer in Guangdong Province, Shenzhen 518060, China; 3. Key Laboratory of Service Computing and Application at Shenzhen, Shenzhen 518060, China; 4. Shenzhen Polytechnic, Shenzhen 518060, China)
High Efficiency Video Coding(HEVC) is a kind of new standard of video coding developed by the Joint Collaborative Team on Video Coding(JCT-VC). For the problem of high computational complexity of intra prediction in HEVC, a fast intra prediction alg orithm based on edge direction detection is pro posed. The proposed method divides 35 intra prediction mo des into 5 sets o f candidate modes according to 5 basic directions, and each set contains 11 intra prediction modes. The edge direction strength of Prediction Unit(PU) in 5 directions are calculated. The proportion of each direction is calcul ated and the candidate modes are selected to set corresponding edge direction with the lar gest proportion as best ca ndidate modes for PU to reduce computational complexity effectively. Experimental results show that the proposed method saves encoding time of 15% and 18% on average compared with HM8.0 in high efficiency and low complexity.
video coding; High Efficiency Video Coding(HEVC) standard; intra prediction; Prediction Unit(PU); mode decision; edge direction detection
10.3969/j.issn.1000-3428.2014.05.056
国家自然科学基金资助项目(60972037);广东省部产学研基金资助项目(2012B091100495, 2009 B090300267);深圳市基础研究基金资助项目(JCYJ20120613113419607);深圳大学校重点基金资助项目(2213k3190007)。
雷海军(1968-),男,副教授,主研方向:图像处理,网络多媒体技术;危 雄,硕士研究生;杨 张,硕士;袁梅冷,副教授。
2013-01-28
2013-04-01E-mail:yangzhang120@163.com
1000-3428(2014)05-0270-04
A
TP301.6
·开发研究与工程应用·