APP下载

基于HVS的DWT图像压缩混合编码算法

2013-03-20王丹丹

郑州大学学报(理学版) 2013年4期
关键词:掩膜子带人眼

李 明, 张 华, 王丹丹

(西南科技大学特殊环境机器人技术四川省重点实验室 四川绵阳621010)

0 引言

数字图像小波变换的优异时频域特性及良好的去相关特性在图像压缩领域得到了广泛应用.小波变换图像压缩的基本思想是把图像分解成不同空间、不同分辨率子图像,然后再对子图像系数进行编码.目前各种基于小波变换的图像压缩方法不断涌现,其中基于小波系数零树结构的EZW算法和基于小波系数空间方向树结构的SPIHT算法[1]被认为是比较优秀的编码算法,并在实际应用中得到进一步的改进和发展.由Taubman等[2]提出的分层树编码(layered zero coding,LZC)算法引入了算术编码算法进行上下文预测编码.为了进一步提高编码效率,Li等[3]提出了率失真优化嵌入式(rate distortion-optimization embedding,RDE)算法.在此基础上,Taubman[4]提出了最佳截断嵌入式编码(embedded block coding with optimized truncation,EBCOT)算法,该算法已经被IEEE引入到JPEG 2000标准中.以上算法均是以一种单一编码策略来提高编码效率,没有充分考虑多种编码方法的融合,更没有考虑图像的主观质量.

为了更好地提高图像压缩率,改善图像的主观质量,目前很多先进的图像压缩算法中引入了利用人眼视觉特性,主要包括:①利用人眼在不同空间频率上的敏感度,结合小波分解各子带特性加权处理后进行编码.②利用人眼视觉对图像不同区域的敏感度,将图像划分为各种不同的视觉重要性区域,根据任意时间系统对不同区域响应的相互独立和不同敏感度的特性,对不同区域进行不同的视觉加权、量化.

作者结合小波变换系数的数据结构特性提出一种混合编码方法,通过综合分析人眼视觉特性,推导计算出基于小波系数不同子带的掩膜表对小波系数进行加权处理,使其在提高压缩效率的同时合理地反映HVS在不同空间频率上的敏感度,从而更好地改善了图像的主观质量.

1EZW与SPIHT算法

EZW算法是一种非常有效的小波图像压缩编码算法.它通过不同频带间小波系数数据结构的空间相似性构造零树,按照比特连续逼近的图像编码方法,对小波系数的位平面分层进行零树和孤立零点的判决及熵编码,其判决方法采用阈值逐层折半递减方法.它主要依据小波图像的树状数据结构特点有效地组织编码小波系数,但EZW算法存在以下不足:①EZW编码算法所采用的是快速小波编码(Mallat)算法,需做大量的卷积运算,运算量比较大,严重影响压缩算法的实时性.②对所有频域进行同等重要编码,没有有效利用HVS对不同频率敏感度不同的特性.③不同的小波系数具有不同的数据特性,而EZW编码把所有子带系数做统一处理,这必然影响图像的压缩质量和压缩效率.④该算法主要利用不同频带相同空间位置的零树结构,没有充分利用其塔式数据结构以及子带间系数相关性.⑤为了防止输出已被标识过的零树小波系数,该算法必须进行有效的跟踪操作,这无疑要延长图像编码时间,并且要占用大量的存储空间,不利于硬件实现.

Said等[5]根据Shapiro零树小波编码算法提出了SPIHT编码方法.该方法利用子带间不重要系数的相关性,采用空间树分层分割方式,在编、解码阶段采用与EZW算法相同的规则对小波系数按照幅值分布区间进行重排.SPIHT算法在EZW算法的基础上采用更高效的集合划分和重要性信息的紧凑性排序,使得在没有后续熵编码的情况下也同样可以取得良好的图像压缩效果.然而SPIHT算法也存在一些不足:①SPIHT算法没有充分考虑HVS对不同频率敏感度不同的特性,压缩图像存在基于HVS的频率冗余.②该算法对低频子带和高频子带系数采用相同的编码方式,没有考虑不同子带的数据差异性,这将严重影响图像的压缩质量和压缩效率.

上述两种经典的小波变换图像压缩算法,结构都相对简单,压缩编码效率也相对显著,但在图像压缩方面还有相应的改进空间.在此基础上,作者提出了基于HVS的DWT图像压缩混合编码算法.

2 混合小波图像压缩算法

2.1 人眼视觉特性分析

HVS是最复杂的图像处理系统之一,心理学研究发现,HVS在频率方面具有一般的带通特性.人类视觉特性在不同的频带范围内是不同的,可以结合人类视觉的这一特性进一步提高图像压缩的质量和效率.在图像压缩传输过程中提高人眼比较敏感频带信息的权重,降低人眼不敏感频带信息的权重,从而进一步去除基于HVS的频率冗余.

HVS的研究为人类提供了如何看世界的数学模型——对比敏感度函数(contrast sensitivity function,CSF),一般认为对比敏感度在很大程度上依赖于色彩、空间、频率等刺激特征.设空间频率为f,人眼对频率的检测门限可以通过实验测得,设为Cr(f),则CSF可以表示为

随着对HVS研究的深入,研究人员提出了多种关于CSF(f)的模型,其中比较通用的模型为

式中,p,q,r,s,t为参数,f为空间频率.f也可以表示为

其中,fx和fy分别是空间频率在水平方向和垂直方向的分量.基于式(2)模型,Mannos等[6]提出如下CSF模型:

为了更加直观地描述CSF特性,采用归一化空间频率fn来表示视觉敏感度H,其中fn=f/fs,fs为归一化因子.

经不同频率方向的信号测试表明,人眼对不同频率方向的激励对比敏感度不尽相同.由于式(3)水平和垂直方向的频率分量对CSF模型作用比较敏感,随着信号方向与水平轴夹角的增大敏感度逐渐降低,当角度达到45°时,对比敏感度达到最低,而经小波变换各频率子带被分为水平、垂直和与水平成45°角方向.图1、图2为CSF归一化曲线以及上述3个不同方向频率作用的CSF归一化曲线,可以看出,CSF曲线相当于一个带通滤波器,中低频处出现最大值,当频率升高或降低时敏感度呈下降趋势.

图1 CSF归一化曲线Fig.1 CSF normalized curve

图2 不同方向CSF归一化曲线Fig.2 CSF normalized curve in different directions

2.2 基于HVS小波系数加权

由CSF模型分析,人眼对图像具有频率选择性,而图像经多级小波变换后被划分为不同分辨率下的不同方向的多个高频子带和一个低频子带,如何将CSF模型引入到小波变换系数中是必须要解决的问题.为了在图像压缩中充分利用HVS特性,根据CSF曲线在不同分辨率下创建CSF掩膜度量各子带小波系数的重要性.综合分析多种掩膜方法,作者采用在小波变换图像压缩中具有更好视觉效果的峰值均值掩膜,经试验验证,峰值CSF掩膜更加符合人眼主观视觉特性.原始图像经5级小波分解,根据CSF曲线分析CSF掩膜具有6个不同频带的视觉加权值[7],如图3所示.

然而根据小波分解特性,除最低频子带外,每一级分辨率下均有3个不同方向的高频子带,结合公式(3)分析CSF模型中频率存在方向性,而6权重CSF掩膜并没有体现不同方向频率上的敏感度差异.根据CSF函数HnLn与LnHn的加权值相等并处于Hn-1Hn-1和Hn+1Hn+1的加权值之间.因此对于5级小波分解来说,6权重CSF掩膜可以扩展到11权重CSF掩膜,计算过程如下:

(1)图3中的分别处理不同频率等级的6个加权值由低频到高频分别记为P6、P5、P4、P3、P2、P1.

(2)HnLn与LnHn的加权值相等,记为Qn.

计算5 个 Qn值(n=1,2,3,4,5).

由以上过程计算得11权重CSF掩膜的加权值与各子带的对应关系,如图4所示.由于DWT系数中最低频子带的特殊性,为实现更有效的后续编码操作,采用最低频子带为单位1的子带权重系数.

图3 DWT系数CSF 6权重系数Fig.3 DWT coefficient CSF 6-weighting factor

图4 DWT系数CSF 11权重系数Fig.4 DWT coefficient CSF 11-weighting factor

2.3 混合压缩编码算法描述

原始图像经小波变换后,低频子带的小波系数幅值相对比较大,有统计表明低频子带小波系数携带了整幅图像超过90%的能量[8],而高频子带的小波系数幅值较小,并且与低频子带间系数的相关性不大.研究发现低频子带系数的行列相关性较大,因此,为了充分利用低频子带与高频子带系数相关性较小和低频子带行列相关性较大的特点,采用单独对低频子带编码的方式对小波系数编码.通过实验发现,低频子带系数经DPCM编码后行列相关性均有所降低[9],因此,为了降低子带系数内部的空间冗余,对低频子带采用DPCM编码.经DPCM编码后得到的预测误差值相对较小,再将其码流经过一次Huffman编码以进一步提高图像压缩效率.

由于小波系数的低频子带要进行DPCM编码,在SPIHT编码时就不需要对低频小波系数进行二次编码,也就是说,与传统SPIHT编码主要的不同是对链表的初始化.小波树的树根为最后一级小波系数子带,由于低频子带无子孙节点,不重要子集表的初始化是最后一级小波分解的3个方向的高频子带.不重要系数表的初始化中需要屏蔽掉最后一级小波分解的低频子带,只取最后一级小波分解的3个方向的高频子带.

改进的编码方法首先根据CSF的加权系数对DWT各子带系数加权,由于小波变换良好的去相关性,使小波系数的低频子带与高频子带的相关性较弱,因此,将小波系数的低频子带和高频子带分开处理,不仅能够充分利用小波系数在图像压缩方面的良好特性,而且可以提高图像编码的质量和运算速度.作者根据不同频率下的小波系数的特性分别采用SPIHT编码和DPCM编码以进一步提高图像的压缩性能.图像压缩步骤如下:

1)根据小波函数特性[10]选择合适的小波函数,通常情况下Biorthoginal小波相对于图像压缩适用范围比较广,作者选择双正交小波函数Bior 3.7作为小波变换的基函数.

2)对图像进行5级小波分解,得到16个不同系数子带.

3)对不同的小波子带按照相应CSF掩膜系数进行加权处理.

4)对最低频子带进行DPCM编码,同时对其他子带小波系数按照SPIHT算法进行编码.

5)为了进一步提高图像的压缩效率,分别对DPCM码流和SPHIT码流进行Huffman编码和熵编码,最终组织码流输出.

图像解码是图像编码的逆向操作,如图5所示,这里需要指出的是,由于在图像编码前对小波系数基于CSF掩膜系数进行加权处理,为保证重构图像的真实性,在图像解码端也必须将解码的小波系数进行逆向的CSF反加权操作.

图5 算法编、解码框图Fig.5 Codec algorithm block diagram

3 实验结果分析

为了验证改进后小波变换图像压缩算法的压缩效果,选择运行Windows XP操作系统的PC和Windows XP版本的Matlab 7.1测试仿真软件,分别选择3幅大小为512×512的8 bit且具有不同纹理的lena、bridge和aerial灰度图像,进行实验对比评价分析.在图像评价中通常使用峰值信噪比(PSNR),它表示的是到达噪声比率的顶点信号,但它对于评价图像相对于人眼视觉特性的指标有很大的局限性,不能够准确地体现出人眼主观看到图像的视觉效果.由于图像的最终“消费者”是人眼,采用一种更加接近人眼视觉特性的评价方法才能更加真实地反应图像质量.作者采用更接近主观视觉效果的评价指标——视觉信息保真度(visual information fidelity,VIF)[11-13],衡量各种算法重构图像的实际主观质量,VIF值越大则重构图像的主观效果越好.对lena、bridge和aerial图像分别采用EZW、SPIHT和改进算法在不同比特率下进行压缩,并对重构图像进行VIF值分析,结果如表1~3所示.

表1 lena图像不同算法下的VIF值Tab.1 The VIF of each codec algorithm compression of the“lena”

表2 bridge图像不同算法下的VIF值Tab.2 The VIF of each codec algorithm compression of the“bridge”

通过对比可得,改进算法在同一比特率下重构图像的VIF值相对SPIHT、EZW算法均有显著提高,在不同压缩率下改进算法的重构图像的主观质量均有有效提升.实验证明,引入HVS到图像压缩中并采用混合编码方法,在相同压缩率下相比一般的基于SPIHT算法的DWT图像压缩编码方法,重构图像的VIF值提升0.05~0.1.由此可见,改进算法在有效去除图像视觉冗余信息的同时,提高了图像压缩效率,增强了图像的对比度,显著改善了图像的主观质量.

4 结论

表3 aerial图像不同算法下的VIF值Tab.3 The VIF of each codec algorithm compression of the“aerial”

通过分析研究现有流行小波图像压缩算法,围绕当前亟待解决的高压缩比下重构图像质量差的问题,将HVS特性的CSF曲线引入到图像压缩中,提出了一种混合的小波变换图像压缩算法.通过对VIF性能的实验验证,证明了基于HVS对小波图像进行加权,并采用多种编码方法协同编码的算法能够很好地提高图像的压缩效率,其重构图像的主观效果得到有效提高.由于图像压缩领域的需要,为了进一步提高图像压缩的效率和重构图像的质量,结合人眼视觉特性的以及多种编码算法相结合的混合编码方式将成为图像压缩的主要研究方向.

[1] 邓宸伟,赵保军.一种快速改进型SPIHT算法[J].北京理工大学学报,2010,30(4):478-482.

[2] Taubman D,Zakhor A.Multirate 3-D subband coding of video[J].IEEE Transactions on Image Processing,1994,3(5):572 -588.

[3] Li J,Lei S.An embedded still image coder with rate distortion optimization[J].IEEE Transactions on Image Processing,1999,8(7):913-924.

[4] Taubman D.High performance scalable image compression with EBCOT[J].IEEE Transactions on Image Processing,2000,9(7):1158-1170.

[5] Said A,Pearlman W A.A new,fast,and efficient image codec based on set partitioning in hierarchical trees[J].IEEE Transactions on Circuits and Systems for Video Technology,1996,6(3):243 -250.

[6] Mannos J L,Sakrison D J.The effects of a visual fidelity criterion on the encoding of images[J].IEEE Transactions on Information Theory,1974,20(4):525 -536.

[7] Singh P,Singh P.Implementation of SPIHT and WDR algorithms for natural and artificial images using wavelets[C]//The Fourth International Conference on Computational Intelligence and Communication Networks.Mathura,2012:359 -363.

[8] 张砺佳.基于小波变换的图像压缩编码研究[D].西安:中国科学院研究生院,2007.

[9] 武永红.基于小波变换的图像无损压缩算法研究[D].重庆:重庆大学,2012.

[10]朱玉清,卫艳荣,程正兴.具有整数伸缩因子的多变量向量值双正交多小波包[J].郑州大学学报:理学版,2012,44(3):61-65.

[11] Sheikh H R,Bovik A C.Image information and visual quality[J].IEEE Transactions on Image Processing,2006,15(2):430-444.

[12]Senapati R K,Pati U C,Mahapatra K K.A novel hybrid HVS based embedded image coding algorithm using DTT and SPIHT[C]//International Conference on Devices and Communications.Mesra,2011:1-5.

[13]华东,余宏生.基于视觉信息保真度的图像增强质量客观评价方法[J].微计算机信息,2012,28(1):173-175.

猜你喜欢

掩膜子带人眼
利用掩膜和单应矩阵提高LK光流追踪效果
超高分辨率星载SAR系统多子带信号处理技术研究
一种基于奇偶判断WPT的多音干扰抑制方法*
基于Mask R-CNN的回环检测算法
子带编码在图像压缩编码中的应用
清溢光电:掩膜版产业国产化的领军者
人眼X光
高分辨率机载SAR多子带合成误差补偿方法
国内首条G11光掩膜版项目在成都高新区启动
闪瞎人眼的,还有唇