基于直流系数相关性AVS预测算法
2013-10-26王玉清
王玉清
(山西工程职业技术学院 计算机工程系,太原 030009)
AVS视频压缩标准是国内最新的视频压缩标准,特点是低码率、高清晰度和强抗误码性能[1],其编码只对预测残差进行。由于残差在量值上小于实际的像素值,因而熵编码后占用的码字也较少,有效地减少了表达一幅图像所需的比特数,达到了压缩的目的[2]。
AVS 8×8块数据经过预测、变换、量化和ZIGZAG扫描后,非零系数主要集中在低频部分,而高频系数大部分是零;DC系数及其附近的非零系数值较大,而高频位置上的非零系数值大部分是+1和-1[3]。提高DC直流系数编码效率,会大大提高整个编码器编码效率[4]。8×8块预测残差仍具有很强的空间相关性,其经过整数DCT变换后,直流成分也具有很强的空间相关性。目前,AVS标准并没有考虑AVS直流系数的相关性,而是直接对AVS直流系数进行编码。笔者提出利用预测残差直流系数相关性来改进编码效率的方法,不直接对当前块直流系数进行编码,取其与左边块和上边块差值及本身绝对值的最小值,对其最小值对应的差值进行编码。
1 AVS编码算法分析
AVS视频标准采用8×8整数DCT变换,故其变换后的DC系数值较大[5]。量化与变换归一化相结合,同时可以通过乘法和移位来实现,对于量化步长的设计,量化参数每增加8,相应的量化步长扩大1倍[6]。具体的量化公式为:
式中:|Zij|为相应的量化值;f为改善图像视觉效果的偏移量,帧内编码时1,帧间编码时2;Mij为Y矩阵中对应元素的缩放系数表;TQP的值是16位的无符号数,在程序中通过查表提前得到。
AVS标准采用ZIG-ZAG扫描,游程和幅值(Run,Level)是把量化后的64个系数按照一定的扫描模式得到的序列对,幅值Level为非零系数的幅度,游程Run为该非零系数前0的个数[7]。AVS采用游程和幅值进行联合编码,并为了适应局部的差异性设计了19个VLC码表[8]。
2 基于直流系数相关性预测算法
DCT整数变换本身并不能进行码率压缩,因为64个样值仍然得到64个系数。只是在经过量化和ZIG-ZAG扫描后,非零系数主要集中在低频部分,而高频系数大部分是零;DC系数及其附近的非零系数值较大,而高频位置上的非零系数值大部分是+1和-1。因此,提高DC直流系数编码效率,会大大提高整个编码器编码效率。
8×8块预测残差仍具有很强的空间相关性,其经过整数DCT变换后,直流成分也具有很强的空间相关性,可以利用左边块和上边块的DCT变换域的直流系数来预测当前块的直流系数。
假定当前块上边块残差经DCT变换后直流系数为Top0,左边块为Left0,当前块为Cur0。分别计算CT=Abs(Cur0-Top0),CL=Abs(DC-Cur0-DC-Left0)和C0=Abs(Cur0),取CT、CL和C0的最小值。不直接对直流系数Cur0进行编码,如果CT最小,将对Cur0-Top0值进行编码;如果CL最小,将对Cur0-Left0值进行编码;如果C0最小,将对Cur0值进行编码。
编码端预测流程如图1所示,仅增加了CT、CL和C0的计算和取三者最小值计算,编码复杂度增加很小。此算法并没有改变编码流程,也不需要改变AVS标准的语法和语义。
图1 编码端预测流程图
解码端预测流程如图2所示,仅增加了CT、CL和C0的计算和取三者最小值计算,解码复杂度增加很小。此算法并没有改变解码流程。
3 实验结果及分析
为了验证本研究基于直流系数相关性AVS预测算法,对典型的试例 Foreman、Akiyo、Children、Bridge-far进行了一系列的测试。图像为CIF格式(352×288);量化参数 QP分别为20,24,28,32,36,40;编码100帧,Y∶U∶V为4∶2∶0。测试平台为主频1.60GHz的Pentium Dual E2140,内存为1.93 GB的PC机。表1—表4分别为4个测试序列的实验结果。其中,bitrate为使用本文提出算法与AVS工作组官方软件不同QP下,码率下降的百分比。
图2 解码端预测流程图
表1 Foreman序列测试结果
表2 Akiyo序列测试结果
表3 Children序列测试结果
表4 Bridge-far序列测试结果
从表中可以看出,使用笔者提出的算法,对于不同编码序列,编码码率都有下降,平均下降1.09%,最好情况下降2.00%。
4 结论
根据经过整数DCT变换后预测残差的直流成分具有很强的空间相关性,利用左边块和上边块的DCT变换域的直流系数来预测当前块的直流系数。不直接对直流系数进行编码,取其与左边块和上边块差值及本身绝对值的最小值,对其差值进行编码。笔者提出的算法在不影响编码质量的前提下,编码码率降低1.09%。下一步,可考虑直流系数差值的特性,对熵编码码表进行调整,进一步降低编码码率。
[1]GB/T 200090.2-2006信息技术 先进音视频编码,第2部分:视频[S].2006.
[2]徐士麟,喻莉,朱光喜.基于概率更新机制的自适应混合熵编码[J].通信学报,2008,29(5):43-49.
[3]Wang Qiang,Zhao Debin,Gao Wen.Context-Based 2D-VLC Entropy Coder in AVS Video Coding Standard[J].Journal of Computer Science and Technology,2006,21(3):315-322.
[4]喻莉,徐士麟,崔春晖,等.AVS1.0中熵编码技术的研究[J].电视技术,2005(10):8-10.
[5]刘宇,田晓华.AVS视频标准中块变换系数熵编码器的优化设计[J].微电子学与计算机,2004(10):27-31,35.
[6]高文,王强,马思伟.AVS数字音视频编解码标准[J].中兴通讯技术,2006,12(3):6-9.
[7]Zhang Cixun,Lou Jian,Yu Lu,et al.The Technique of Pre-Scaled Integer Transform[C]∥Proc of IEEE International Symposon Circuits and Systems(ISCAS 2005),2005(1):316-319.
[8]文斌,何明华,黄敏琪.一种新的 AVS指数哥伦布码算法[J].计算机工程.2011,37(15):218-220.