基于视觉特性的小波零树图像编码压缩
2010-03-16魏玉芬野金花丁艳清
魏玉芬,野金花,丁艳清
(黑龙江八一农垦大学文理学院,黑龙江 大庆 163319)
嵌入式零树小波编码(Embedded Zerotree Wavelets Encoding,EZW)是基于比特连续逼近的图像编码方法:按位平面分层进行孤立系数和零树的判决和熵编码,而判决阈值则逐层折半递减,又称之为多层(或位平面)零树编码方法,这种编码方法十分有效。近年来,在EZW算法的基础上,出现了许多新的改进算法,如集合分裂嵌入块编码、可逆嵌入小波压缩算法、最优截断嵌入式块编码等,其中最优截断嵌入式块编码算法,更是成为新图像编码标准JPEG2000中所采用的算法[1~3]。
EZW算法简单,无需任何训练,支持多码率,具有较高的信噪比和较好的图像复原品质。然而实验结果表明,该算法由于不能完全利用小波系数的特点和充分考虑人眼视觉特性(HSV),导致编码时间过长,编码效率低,影响图像复原品质。本文提出视觉加权小波零树编码方法,通过对高频子带进行视觉加权,修改高频子带系数扫描策略和量化阈值等方法进行编码,对低频子带采用无损预测编码方法,进一步提高图像复原的品质和编码效率。
1 EZW编码算法
EZW算法利用小波系数的特点,较好地实现了图像编码的嵌入功能,主要包括以下3个过程:零树预测,扫描方法,逐次逼近量化[4]。
1.1 零树预测
在变换编码中,变换系数矩阵经过量化后,产生大量零符号。编码的后续过程,就是有效地表示那些非零符号,包括非零符号的位置和大小。表示量化后非零值位置的过程,也就是表示有效值位置的过程,称为有效值映射(significance map)。
为了构成一个完整的有效值映射,除了定义零树根(ZTR)外,还需定义其他3个符号:
(1)孤零(IZ),表示当前系数值是无效值,但它的子孙系数中至少有一个是有效值;
(2)正有效值(POS),表示当前系数是一个正的有效值;
(3)负有效值(NEG),表示当前系数是一个负的有效值。小波树结构示意图如图1所示。
1.2 扫描方法
EZW算法对小波系数进行编码的次序叫做扫描。有了上述4个符号,可以按一定的顺序扫描小波变换系数矩阵,从而形成一个符号表,它就是要得到的有效值映射。扫描过程中,各子带按图2所示的次序扫描。
图1 三级小波分解和树结构示意
图2 子带扫描顺序
1.3逐次逼近量化
为了使零树表示构成一个有效的嵌入式码流,结合逐次逼近量化技术,来依次确定有效值和有效值映射,门限值之间满足依次减半。
2 视觉特性(HVS)控制
通过对人眼某些视觉现象的观察,并结合视觉生理、心理学等方面的研究,发现恢复图像的视觉失真,不仅取决于整体均方误差,而且还取决于这个失真空间频率上的分布。由于人眼具有视觉阈值效应和掩盖效应,因此人的视觉分辨率力有限,可以容忍一定的图像失真,但是人眼对不同频率视觉信号的敏感度是不一样的:
(1)人眼对图像边缘区信息的失真很敏感;
(2)人眼对图像平滑区信息的失真比较感敏;
(3)人对图像纹理区信息的失真不敏感。
长期以来,人们试图建立人类视觉系统的数学模型,本文采用Ngan[5]提出的模型,即
其中,
a,b,c为常数;
f为视频率,单位为周/像素(cycle per pixel,简称CPD)。
根据Ngan的研究,人眼对3~6 CPD的空间频率分量最为敏感。利用上述视觉模型对小波系数进行加权,可把空间频率f的单位变换为小波系数域(付氏域)的单位周/像素(cycle per pixel)。表1给出三级小波高频系数的视觉加权值。
3 人眼视觉特性小波零树编码算法(HVEZW)
如图3所示编码流程图,是将最低频子图和其他子图分开处理的方法,用无损预测编码对最低频子图单独编码,而对高频图像的编码采用如下的改进方法:
(1)小波分解高频系数进行视觉加权,对传统的扫描顺序进行改变,扫描不是从最后一级低频系数开始,而是从最后一级高频系数最大值开始,且按先水平方向高频、垂直方向低频,然后水平方向低频、垂直方向高频,再对角线方向高频;
(2)选择阈值的时候,是先在LHi最后一级分解的高频系数中选择,然后在LHi最后一级的高频系数中选择,最后是HHi中选择;依然按照2的整数幂从高到低排列量化阈值。根据阈值选取的子带顺序不同,产生的零树编码码流分别采用自适应算术编码、Huffman编码。
(3)如果第j层(三级小波变换,2≤j≤3)高频子带中的一个系数及其所有后代为零,定义该节点为j-1级ZTR(零树根),然后依此类推。如果同一关系树中有数个ZTR,则只对最高级ZTR进行编码。解码时,根据ZTR的级数,确定开始补零的层以及具体的起点;
(4)根据给定的阈值T做出一轮扫描后,将高频子带系数分成了3类:非零点、ZTR(零树根))、IZ(孤立零)。显然,要表现这3种情况都需要消耗额外的比特数,由于IZ的产生是因为第j层子带的一个系数无意义,但其后代中有非零点。将IZ的量化值重新恢复进来,与非零点一并进行编码,这时所有的高频子带系数就只有两类了:非零点、ZTR(零树根)。这样在有效减小图像失真的同时,提高了编码效率。
(5)对除LL3子带外的每一个高频子带,都建立一个编码信息表,用来表明对应系数的分类情况。如果值为1,则表示对应系数为非零点,参与量化编码;如果值为0,则表示对应系数为ZTR,不需要参与量化编码。
图3 HVEZW编码流程图
4 实验结果与分析
为了验证上述算法的正确性,对MPEG-4标准测试序列图像Claire第15帧灰度图像进行EZW编码压缩和HVEZW编码压缩。如表1得出在不同的压缩比下,得到的重构图像的PSNR及MSE。
表1 EZW和改DFEZW对Claire图像编码结果
通过对比能够得出下面的结论:在相同的压缩比下,应用HVEZW算法,能够提高重构图像的PSNR、降低图像的MSE,明显地提高了图像编码的效率,即在较低码率的情况下仍能很好的恢复图像。这主要是因为HVEZW算法在进行零树量化之前,对最低频子带进行单独处理,对高频子带进行视觉加权,这样在不影响图像整体压缩比的情况下,提高了编码效率和恢复图像的品质。如图4,从视觉效果上来讲,采用HVEZW算法重构图像的视觉效果,要比采用EZW算法的重构图像效果稍好。
图4EZW编码与DFEZW编码结果比较
5 结束语
基于视觉特性的小波零树图像编码压缩方法,充分利用了小波系数的特点和人眼视觉特性,重建图像的主观效果比较好,达到了压缩比高而失真度减少的目的。
[1]张旭东,卢国栋,冯 健.图像编码基础和压缩技术-原理、算法和标准[M].北京:清华大学出版社,2004.
[2]沃焱,韩国强,张 波.基于视觉特性的静态图象压缩编码[J].中国图象图形学报,2003,10(10):248-302.
[3]王 娜,贾传荧.一种改进的无表零树编码的图像压缩方法[J].电子学报,2003,31(6):879-881.
[4]沈兰荪,卓 力,田 栋,汪孔桥.视频编码与低速率传输[M].北京:电子工业出版社,2001.
[5]Kunt M,Kocher M.Second generation image coding techniques[J].Proceedings of the IEEE,1985,73(4):549-575.