基于宏块相关性的帧间预测模式选择策略
2014-11-20牛丽君王园园
牛丽君,宋 娜,张 刚,王园园
(太原理工大学信息工程学院,山西太原030024)
1 AVS标准
AVS(Audio Video Standard)为中国自主知识产权的第二代信源编码标准。帧间预测编码是视频编码的核心技术,其性能优劣直接影响编码效率。选择合适的帧间预测模式可以改善运动补偿的精度,更好地实现运动隔离,提高图像质量和编码效率。为了获得最佳预测模式,AVS标准对所有候选模式计算代价值,并依据最小代价值选择最佳模式。由于运动图像相邻帧中的景物存在一定相关性,因此最小代价值下的宏块模式并不一定是最佳模式。本文结合参考块的预测模式提出了基于宏块相关性的帧间预测模式选择策略,实验表明,本文算法能提高PSNR与SSIM。
2 宏块相关性
帧间预测模式对运动矢量选择及图像压缩效果有极大影响,由于活动图像邻近帧中的景物存在一定的相关性,因此当前块模式选择与邻近块模式有着密切联系。一般对于运动平缓、处于同一运动物体的区域选择较大尺寸块,对于运动剧烈、细节较多的区域选择较小尺寸块。本文结合实际需求,若满足以下条件时当前宏块可能处在运动平缓或同一运动物体区域,即具有宏块相关性。
条件一:当前块的左边块A与上边块B的帧间预测模式一致。
条件二:A的运动矢量MVA_X、MVA_Y与B的运动矢量MVB_X、MVB_Y方向近似(即在同一象限)。
不同码流宏块相关性的统计结果如表1所示。
3 AVS帧间预测模式选择算法
AVS帧间预测模式采用了16×16、16×8、8×16和8×8四种块尺寸分割模式。模式选择时,首先判断当前块是否满足skip条件,若满足则结束循环。其次,将16×16和8×8预测模式作为候选模式对当前块进行预测,并计算其率失真代价值,若16×16块的代价值小于8×8块的代价值,则选择16×16块做为最佳预测模式,并退出帧间预测模式的循环;否则继续预测16×8、8×16两种模式,选择代价值最小的模式为最佳预测模式。流程如图1所示,其中cost_16×16、cost_8×8分别为模式16×16、8×8的率失真代价值。
表1 宏块相关性的概率
图1 原有AVS帧间模式选择流程
4 基于宏块相关性的帧间预测模式选择策略
4.1 阈值选取
选择不同尺寸块的帧间预测模式,目的是为了更好地刻画物体运动细节,提高运动搜索的准确性。若使当前块的预测模式在率失真代价值差别不太大的前提下选择与相邻块相同的模式,则会使图像的块尺寸分布更均匀,更能准确地表达物体运动状态。本文在大量实验基础上提出用于权衡代价值与相邻块预测模式的阈值κ,具体过程如下:
根据宏块相关性调整代价值Cost=D+λ×R中λ的值从而调节Cost的值,即当左边块A与上边块B的预测模式相同则对当前块代价值中的λ乘以系数κ(κ=3.5为实验所得经验值),否则代价值不变。经过实验分析发现视频信噪比PSNR略有下降,原因在于调整λ的同时提高了码率R在Cost中的权重,间接降低失真度D的权重,因此所选模式不是最佳模式。
为了不影响D与R在原有Cost中的权重,将公式调整为Cost=D+λ×R-κ,κ=(D+λ×R)×x%。该方法虽然保证了D与R在原有Cost中的权重不变,但是由于κ=(D+λ×R)×x%不是自适应的,对不同码流x的选择不同,此算法亦不可行。
为使所选阈值适合所有码流将其改为自适应阈值,κ与当前块各模式最小代价值cost_min以及QP有关。最终选择
4.2 实现流程
基于宏块相关性帧间预测模式选择流程见图2。
图2 基于宏块相关性AVS帧间预测模式选择流程
具体流程如下所述:
1)首先,判断当前块是否符合skip模式的判决条件,若是则结束预测;否则转2)。
2)计算16×16、16×8、8×16和8×8各预测模式代价值,最终得出最小代价值cost_min。
3)判断代价值最小的预测模式是否与上边块A的预测模式相同,若相同,当前块最佳预测模式为代价值最小的模式;否则转4)。
4)判断代价值最小的预测模式是否与左边块B的预测模式相同,若相同,当前块最佳预测模式为代价值最小的模式;否则转5)。
5)判断与A相同的预测模式的代价值是否小于阈值κ,若小于,则该模式为当前块最佳预测模式;否则转6)。
6)判断与B相同的预测模式的代价值是否小于阈值κ,若小于,则该模式为当前块最佳预测模式;否则转7)。
7)仍然选择代价值最小的预测模式为最佳预测模式。
5 实验结果
为了验证算法的合理性与可行性,对不同运动特点的测试序列进行了编码实验,其中包含QCIF格式(176×144)、CIF格式(352×288)和D1格式(704×576)。算法在QP=36的条件下测试,从图像的峰值信噪比(PSNR)、码率、结构相似度(SSIM)、帧率4个方面考察了实验结果,并与AVS官方开源代码进行比较,结果见表2。
表2 实验结果对比
表2中PSNR的数据是优化后与优化前的差值;Δ码率、ΔSSIM、ΔFPS均为变化率=(优化后-优化前)/优化前×100%。“-”表示降低、“+”表示提高。
结果表明:与原有算法相比,本文算法在PSNR上平均提高了0.29 dB,SSIM平均提高了0.522%,码率平均降低了0.186%。该算法增加了一定的条件判断,使帧率有所降低,平均降低了7.68%。
6 结论
本文提出基于宏块相关性的帧间预测模式选择算法,其特点是结合相邻宏块的预测模式选择当前宏块的预测模式,可以更好地符合人眼的视觉效应。本算法创新点在于判断宏块模式时,不只单纯地计算代价值而是结合宏块间的相关性,充分利用相邻宏块的预测模式,使当前块的预测模式判断更加准确、合理。
[1]彭琛,耿剑锋.基于自适应门限的快速AVS帧内预测算法[J].计算机工程与设计,2009,30(18):4235-4238.
[2]陈云善,高慧斌.结构相似度在AVS帧间模式选择中的应用[J].光电子·激光,2011,22(3):435-439.
[3]俞力克,代锋,张勇东,等.基于纹理和亮度感知特性的率失真优化策略[J].中国图象图形学报,2012,17(1):54-61.
[4] BHAT A,RICHARDSON I,KANNANGAR S.A new perceptual quality metric for compressed video[C]//Proc.ICASSP 2009.[S.l.]:IEEE Press,2009:933-936.
[5] LUO Y,FU Y.Fast H.264 inter-predictionmode decision based onmacroblock inner complexity[C]//Proc.ISKE 2008.[S.l.]:IEEE Press,2008:50-54.
[6]杨齐,李子印.一种改进的UMHexagonS运动估计算法[J].电视技术,2012,36(5):15-17.