基于零树编码的票据图像压缩编码算法
2013-12-29赵法林李飞鲍旭东
摘要:票据图像是一种广泛应用于人们生活及工作的图像,由于票据图像中主要包含文字、数字及线条等信息,其细节和边缘信息极其重要。一般的压缩方法,如JPEG压缩,已经不适用于票据图像的压缩,会造成边缘细节信息的损失。因此针对票据图像的特殊性,经过颜色聚类和多分辨率分解后,应用改进的零树编码进行压缩编码。实验结果表明,该文方法比JPEG压缩标准具有更高的压缩比和更好的图像阅读质量。
关键词: 票据图像;多分辨率分解;零树编码;JPEG压缩标准;边缘细节信息
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)16-3856-03
票据图像作为人们生活和工作中广泛应用的图像,在许多多媒体系统中都需要存储和传输的,例如医院信息系统和电子金融管理系统。长期以来,数字图像压缩编码技术主要采用JPEG压缩标准[1]来进行压缩。对于一般的自然图像来说,JPEG压缩标准在保证图像质量的前提下具有较高的压缩比。但是对于JPEG压缩标准中主要利用离散余弦变换DCT(Discrete Cosine Transform, DCT)技术完成图像的变换编码,然而经过DCT处理的图像编码在大的压缩比下存在着严重的块状效应,这非常不利于票据图像的压缩及存储。因为票据图像中包含了丰富的边缘细节信息,这些都是票据图像中的重要信息,需要完整的保留下来。所以出现了一些基于二值化分割算法来获得高的压缩比[2-6],但是这些方法不仅要面对图像分割的挑战,而且有时对图像重要的信息在压缩以后已经丢失了。
为此,该文通过对Shapiro提出的嵌入式零树小波编码算法EZW(Embedded Zerotree Wavelet, EZW)[7]分析的基础上,实现了针对票据图像的零树编码,并进行了仿真试验,仿真结果与JPEG压缩标准作了比较,在大的压缩比下,票据图像的边缘细节信息得以保留,保证了阅读质量。
1 算法设计
本文方法是是针对票据图像进行压缩编码,票据图像与普通自然图像有着明显的区别,因此首先要了解票据图像有如下特点:
1)票据图像颜色单一,从视觉效果上,一幅票据图像有4-5种颜色就可以显示整幅图像的信息。
2)票据图像在一个小区域内像素颜色一致(不包括背景颜色)。
3)票据图像存在着大面积的背景区域。
根据票据图像特点(1)和(2),可以将票据图像进行颜色聚类,得到调色板和颜色位图。每幅颜色位图代表调色板中的一种颜色,而颜色位图可以用一幅二值图像来表示,黑色代表背景,白色代表前景,即前景信息就是原始图像中代表该颜色的信息。根据特点(3),可以判断出每幅位图中都包含大面积的背景区域,对每幅颜色位图进行二值图像的多分辨率分解得到金字塔结构图,在分析EZW算法的基础上对每幅位图的金字塔结构图进行改进的零树编码。在解码端,根据解码得到的金字塔结构图,重构颜色位图,根据对应调色板的颜色得到解压缩的图像。
1.2 改进的零树编码
EZW方法是基于小波变换之后进行编码的,经过小波变换后的图像具有多分辨特性,EZW算法就是利用不同分辨率子带中同一空间位置的数据构成一棵树,利用树中的低频数据的幅度值大、高频数据的幅度值小的特点,生成零树,从而达到压缩的目的。
原始位图经过多分辨率分解后的金字塔结构图,在不同分辨率层级中同一空间位置的数据具有相关性。以图3所示的金字塔结构图为例,将金字塔结构中最低分辨率层级中的每个像素点作为“父亲”,那么该分辨率层级上每个像素点都有4个“儿子”存在于下一分辨率层级,在最高分辨率层级中有16个“孙子”。根据原始位图多分辨分解算法,可以得知其金字塔结构图中不同分辨率层级中同一空间位置的数据有如下特点:
1)每个分辨率层级中的“1”,其子孙后代全为0;
2)每个分辨率层级中的“0”,其子孙后代中可能全为0或者含有1。
EZW算法中从最低分辨率的系数开始扫描,判断扫描到的系数是否为“正显著系数”、“负显著系数”、“零树跟”和“孤立零点”,然后进行编码输出。因此,根据EZW的编码思想及上述特点,改进的零树编码算法如下:
1)扫描整个金字塔结构图,按照自上至下,自左至右的顺序扫描;
2)若扫描到“1”,则认为该点为正的零树跟,标记其子孙节点都无需扫描编码,将该点编码为“p”;
3)若扫描到“0”,判断其子孙节点是否全为0。
① 若其子孙节点全为0,则认为该点为负的零树跟,标记其子孙节点都无需扫描编码,将该点编码为“t”;
② 若其子孙节点有1,则认为该点为孤立零点,编码为“z”。
2 实验验证
为了检验本文对于票据图像的压缩编码算法,本小节对票据图像分别进行了本文的压缩编码算法和JPEG压缩编码,并给出实验结果对比。为了验证本文算法的有效性,同时给出了二者之间峰值信噪比、视觉效果和细节保留的对比。
3 结束语
本文研究了一种针对票据图像有效的压缩编码算法。首先,针对票据图像的特殊性进行了预处理,其次对零树编码进行了改进以适用于票据图像的编码,不仅仅提高了压缩比,而且还保留了票据图像中重要的边缘细节信息。实验表明,该文方法在同等压缩比下,解压缩后的图像在峰值信噪比和视觉效果上,尤其是在边缘细节信息的保留上都要优于JPEG压缩标准。
参考文献:
[1] http://www.jpeg.org/jpeg/index.html[S].
[2] Shapiro, J.M.: ‘Embedded image coding using zerotrees of wavelets coefficients’[J].IEEE Trans. Signal Process., 1993, 41:3445–3462.
[3] Howard P G.Text image compression using soft pattern matching[J]. The Computer Journal, 1997(40):146-156.
[4] Seropian A, Vincent N.Writers authentication and fractal compression[J].Proceedings.8th International Workshop on Frontiers in Handwriting Recognition,2002:434-439.
[5] Howard P G.Lossless and lossy compression of text images by soft pattern matching[J].Proceedings Data CompressionConference, 1996:210-219.
[6] Ye Y, Cosman P.Fast and memory efficient text image compression with JBIG2”[J].IEEE Transactions on Image Processing, 2003, 12(8):944-956.
[7] Y. Ye, and P. Cosman, “Dictionary design for text image compression with JBIG2”[J].IEEE Transactions on Image Processing, 2001, 10(6):818-828.
[8] 杨万全.二值图像的金字塔表示和最佳级联方块编码[J].四川大学学报:自然科学版,1992, 29(4):504-508.