基于RDO和SSIM的AVS帧内模式选择算法
2013-01-31杨俊斌武淑红
杨俊斌,武淑红
(太原理工大学计算机科学与技术学院,山西太原030024)
AVS是我国具备自主知识产权的第二代信源编码标准,又称为数字音视频编解码技术。它以H.264标准为参考,在编码效率与H.264基本相同的基础上,明显降低了编码复杂度[1]。在AVS的帧内模式选择中,通常采用SAD或RDO来计算失真代价,同时利用PSNR衡量视频图像编码质量。利用RDO和PSNR对原始图像和预测图像进行纯数学计算,这种方法易于理解,但缺点是没有考虑人眼视觉系统的主观性。SSIM作为一种新的图像质量评价方法,计算简单,能更好地反应人眼视觉感知[2-3]。本文提出一种基于RDO和SSIM的AVS帧内模式选择算法,将RDO和SSIM组合共同作为代价函数用于AVS帧内模式选择。
1 原AVS帧内模式选择算法
1.1 AVS的帧内亮度预测模式
在AVS帧内编码器中,每帧图像被均匀划分为若干个非重叠的16×16的宏块(MB)。AVS帧内预测与H.264/AVC的帧内预测类似,对亮度、色度分量分别进行预测;区别在于AVS帧内预测以8×8宏块为基本单位进行编码,而且在AVS帧内亮度编码过程中共有5种预测模式[4]。AVS帧内亮度的5种预测模式如表1所示。
表1 AVS帧内亮度的5种预测模式
1.2 原AVS帧内模式选择算法
率失真优化技术RDO是AVS引入的一种非标准技术。RDO的值是经过模式预测、运动估计与补偿、变换、量化、反量化、反变换、熵编码等步骤以后得到的,故可以大幅度地提高压缩效率和编码性能。在帧内模式选择中,先用RDO代价函数算出每种可用预测模式的代价值(rd_cost),从得到的rd_cost中选出最小的一个作为当前编码块的最优预测模式(rd_cost值相同时选预测模式编号较小的作为最优预测模式)。RDO计算如下
式中:SSD(误差平方和)为当前块与重建块的差值;λ是拉格朗日因子;rate为当前预测模式下的残差块编码比特数,由熵编码给出。
2 结构相似度(SSIM)
结构相似度SSIM是近些年来被提出的一种新的图像质量评价标准,包括亮度、对比度和结构信息3个方面的计算,故SSIM较符合人的视觉主观评价标准[5]。SSIM定义如下
式中:l(x,y)是亮度比较函数,函数中用到原图像和评估图像的均值μx和μy;c(x,y)是对比度比较函数,函数中用到原图像和评估图像的方差σx和σy;s(x,y)是结构信息比较函数,函数中用到原图像和评估图像的协方差σxy。这3个函数分别定义为
式中:参数C1,C2和C3是为避免分母为0而加上的小常数,分别定义为C1=(K1L)2,C2=(K2L)2,C3=C2/2;L是图像中像素灰度的变化范围(如灰度值为8 bit,L取255);K1和K2是很小的数(本实验取K1=0.01,K2=0.03)。从以上计算公式可知SSIM值域为[0,1],且SSIM越大,评估图像和原始图像越相似[6]。
3 基于RDO和SSIM的AVS帧内模式选择算法
率失真方法对每一种预测模式都要进行预测、变换、量化和变长编码,并进行反量化和反变换,再比较各预测模式的编码码率和重建图像质量,代价最小的一种模式被选择作为最优的预测模式[7]。RDO方法可以得到更高的编码性能和更好的编码效率,但是它并没有考虑到人眼视觉系统的主观性。文献[8]提到误差平方和SSD能够很好地衡量平坦区域的图像质量,而SSIM能更好地评价图像的边缘纹理区域[8]。因此将SSIM和RDO结合在一起作为模式选择的代价函数,同时兼顾数学方法科学性和人视觉系统的主观性。改进的代价函数为
式中:rd_cost是原RDO算法求出来的率失真代价值,见式(1);SSIM为当前块与重建块的结构相似度值。因为RDO值与SSIM值不在一个数量级上且评价方向不一致,故增加一个因子k来进行平衡,用1-SSIM来使二者评价方向相同。经过大量的实验数据发现k值在不同QP下有所不同,其取值如表2所示。
表2 不同QP下k的取值
新的帧内预测模式选择流程图如图1所示。
图1 基于RDO和SSIM的帧内预测模式选择流程
4 实验结果分析
实验测试了3个具有代表性的YUV(4∶2∶0)序列(news_cif,foreman_cif和flower_cif),量化参数QP,分别取28,36和42。实验结果如表3所示,其中Δbr是用改进算法与原RDO算法在不同QP下码率变化的百分比;ΔPSNR是平均亮度的信噪比变化量,单位为dB;ΔMSSIM是整个视频序列的平均结构相似度值变化量。数值上带“-”号的表示减少量,不带“-”号的表示增加量。
表3 不同序列、不同QP下的测试结果
从实验数据可以明显的得到:在不同QP、不同序列条件下,采用本文的AVS帧内模式选择算法的亮度信噪比(PSNR)、平均结构相似度(MSSIM)都有不同程度的提高(得了更好的编码质量);同时码率都有不同程度的降低(更高的视频序列压缩比)。也就是说在算法复杂度增加不多的情况下,SSIM算法的引入使AVS视频编码器的性能有了一定的提高。为了观看效果选取6帧图像(见图2~图7),其中图2和图5是原始YUV视频序列的一帧,图3和图6是使用原AVS帧内模式选择算法的编解码视频序列的一帧,图4和图7是使用新AVS帧内模式选择算法的编解码视频序列的一帧。foreman_cif序列(图3和图4)编码时取QP=28,flower_cif序列(图6和图7)编码时取QP=42。
图7 使用新算法(第100帧)
由图可知:图4比图3更接近图2,图7比图6更接近图5。也就是说使用了新的模式选择算法得到的重建图像质量更好。
5 小结
本文在原来率失真优化算法(RDO)的基础上引入了结构相似度算法(SSIM),提出了一种基于RDO和SSIM的AVS帧内模式选择优化算法。新的算法在保留RDO算法的优异性能的同时兼顾了人的主观感受。大量实验数据表明,新的算法取得了更好的编码质量和更高的视频序列压缩比。
[1]邵娟,张卫宁,魏磊,等.AVS中帧内预测模式的快速选择策略[J].计算机工程与应用,2009,45(25):163-165.
[2]杨春玲,肖冬琴.基于SSE和SSIM的H.264帧内预测模式选择改进算法[J].电子与信息学报,2011,33(2):289-294.
[3]WANG Z,BOVIK A C,SHEIKH H R,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Trans.Image Processing,2004,13(4):600-612.
[4]游娜,彭玉华,刘微,等.基于AVS的帧内预测模式快速选择算法[J].计算机工程与应用,2009,45(14):185-187.
[5]崔子冠,朱秀昌.基于结构相似的H.264主观失真性能改进机制[J].电子与信息学报,2012,34(2):433-439.
[6]陈云善,高慧斌,苏宛新,等.结构相似度在AVS帧间模式选择中的应用[J].光电子·激光,2011,22(3):435-439.
[7]马宏兴,张伶.H.264/AVC率失真优化技术综述[J].电视技术,2010,34(6):19-22.
[8]YANG C L,LEUNG R K,PO L M,et al.An SSIM-optimal H.264/AVC inter frame encoder[C]//Proc.IEEE International Conference on Intelligent Computing and Intelligent Systems.Shanghai,China:IEEE Press,2009:291-295.