APP下载

多媒体压缩编码技术研究

2009-09-29刘玲媛

新媒体研究 2009年14期

刘玲媛

[摘 要]多媒体技术的发展使图像信息逐渐成为交互的主要内容之一。解决图像存储与传输问题的压缩编码技术一直以来是国内外研究的热点,从数据各种编码方法的发展方向反映图像压缩编码技术的飞速发展。主要介绍各种压缩编码技术的必要性、可能性、压缩的过程,分类及各自的优缺点。

[关键词]数据压缩 图像压缩 编码方法

中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2009)0720041-02

一、多媒体数据压缩的必要性

进入信息时代,人们将越来越依靠计算机获取和利用信息。多媒体计算机系统是现代计算机发展一个主流方向。数字化后的视频和音频等媒体信息具有数据海量性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距。这样,就对多媒体信息的存储和舆造成了很大的困难,成为阻碍人们有效获取和利用信息的一个瓶颈。以一个陆地卫星的为例:其水平、垂直分辨率分别为2340和3240,四波段、采样精度7位,它的一幅图像的数据量为2340*3240*7*4=212Mbit,按每天30幅计,每天数据量为212*30=6.6Gbit,每年的数据量高达2300Gbit。

二、多媒体数据压缩的可能性

图像压缩的目的是为了减少需要保存或传输的数据量,但这应以不破坏原有图像的信息为根本原则,否则,这种压缩就失去了数据压缩的意义。研究发现,图像数据表示中存在着大量的冗余。通过去除这些冗余数据可以使原始图像数据极大地减少,而不会对图像品质产生很大影响,从而解决图像数据量巨大的问题。而图像数据冗余情况常见的有以下几种:空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余。图像数据压缩技术就是采取一定的策略从原始信息中找出并去掉这些冗余中的一种或几种,以达到压缩的目的。

三、图像压缩的一般过程

图像压缩处理一般是由两个过程组成的:一是编码过程,即将原始数据经过编码进行压缩,以便于存储与传输;二是解码过程,此过程对编码数据进行解码,还原为可用的数据。

四、压缩的分类

多媒体数据压缩方法根据不同的依据可产生不同的分类。第一种,根据质量有无损失可分为有损编码和无损编码。第二种,按照其作用域在空间域或频率域上分为:空间方法、变换方法和混合方法。第三种:根据是否自适应分为自适应性编码和非适应性编码。

五、多媒体数据编码分类

六、常用的图像压缩技术编码方法简介

(一)脉冲代码调制(PCM)

它实际上是连续模拟信号的数字采样表示。PCM编码器和解码器位于一个图像编码系统的起点和终点。它们实际上分别是A/D转换器和D/A转换器。其它的编码方法都是在多媒体数据模拟信号经过PCM编码后再进行的压缩编码方法。

(二)预测编码

编码器记录与传输的不是样本的真实值,而是它与预测值的差。这一方法称为DPCM方法。预测编码方法原理,是从相邻像素之间有强的相关性特点考虑的。比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一切预测值I估计值)将实际值与预测值求差,对这个差值信号进行编码、传送。预测编码主要是减少了数据在时间和空间上的相关性,因而对于时间序列数据有着广泛的应用价值。在数字通信系统中,例如语音的分析与合成,图像的编码与解码,预测编码已得到了广泛的实际应用。

预测编码方法分线性预测和非线性预测编码方法。线性预测是预测器中预测系数是固定不变的常数。基于预测技术的帧间预测编码技术处理的对象是序列图像(运动图像)。利用帧间的时间相关性进一步消除图像信号的冗余度,提高压缩比。它也有两种编码方法是:条件补充法和运动补偿技术。

(三)变换编码

变换编码不是直接对空域图像信号编码,而是首先将空域图像信号映射变换到另一个正交矢量空间,产生一批变换系数,然后对这些变换系数,进行编码处理。变换编、解码过程示意图:

变换编码技术已有近30年的历史,广泛应用于各种图像数据压缩,诸如单色图像、彩色图像、静止图像、运动图像,以及多媒体计算机技术中的电视帧内图像压缩和帧间图像压缩等。

正交变换的种类很多,如傅里叶变换、沃尔什变换、哈尔变换、斜变换、余弦变换、正弦变换、K-L变换等。最佳的正交变换是K-L变换。次最优的正交变换是DCT变换。变换编码方案把N*N像素的图像分割成n*n像素的子图像,然后对每个子图像的进行单位变换。单位变换是一种可逆的线性变换。变换的目的是去除原始信号中像素间的相关性。这种去除相关的操作一般会乱信号能量仅在一小组传输系数上重新分布,利用这种方法,许多数可以在量化之后,可以借助于对比度敏感函数达到视觉上的无损压缩。

在图像压缩中应用变换,应有如下的特性:

1.减少图像相关:理想的变换是将完全消除图像块中数据的相关。

2.基本函数与图像无关:由于图像间的统计特征变化大,最佳的变换通常依赖于图像本身,所以一般用于图像无关的基本变换函数来替换最有性能变换。

3.快速实现:n点的变换所需的操作一般是O(n2)。一些变换有快速实现的算法,其操作次数可以减少为O(nlogn)。

(四)统计编码

如果要求在编码过程中不丢失信息量,即要求保存信息熵,这种信息保持编码又叫做熵保存编码,或者叫熵编码。熵编码是无失真数据压缩,用这种编码结果经解码后可无失真地恢复原图像。

信息量和信息熵。信息是不确定性的量度定义的。一个消息的可能性越小,其信息量越多;而消息的可能性越大,则其信息量越少。所谓信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。例如:要从64个数中选定某一个数,可以先提问“是否大于32”,不论回答是或否都消去了半数的可能事件,这样继续问下去,只要提问6次这类问题,就能从64个数中选定某一个数。这是因为每提问一次都会得到1bit的信息量。因此在64个数中选定某一个数所需要的信息量是:log264=6(bit)。如果将信源所有可能事件的信息量进行平均,就得到信息的“熵”,熵就是平均信息量。

香农信息论认为,信源所含有的平均信息量(熵)就是进行无失真编码的理论极限。低于此极限的无失真编码方法是找不到的,而只要不低于此极限,那就总能找到某种适宜的编码任意地逼近熵。信源中或多或少的含有自然冗余度,这咱冗余既来自于信源本身的相关性,又来自于信源概率分布的不均匀性中。只要找到去除相关或改变概率分布不均匀的方法和手段,也就找到信息熵编码的方法。因此,如何利用信息熵理论减少数据在传输和存储时的冗余度,就是信息熵编码所要解决的问题。

利用信息熵进行编码的方法有多种,有:哈夫曼编码(利用概率分布特性);行程编码方法(利用相关特性);算术编码(利用概率分布)。前两种方法广泛用于数据编码压缩系统中,并被JPEG列入推荐算法的一部分。

哈夫曼编码的理论依据是变字长编码理论。在变字长编码中,编码器的编码输出汉字是字长不等的码字,按编码输入信息符号出现的统计概率,给输出码字分配以不同的字长。对于编码输入中,出现大概率的信息符号,赋以短字长的输出码字;对于编码输入中,出现小概率的信息符号,赋以长字长的输出码字。

行程编码是相对简单的编码技术,主要思路是将一个相同值的边疆串用一个代表值和串长。在进行图像编码时,可以定义特定方向上具有相同灰度值的相邻元为一轮,其延续长度称之为延续的行程,简称“游程”。游程的终点位置由前一游程的绺位置确定,这样就可以由串来表示图像数据。

算术编码比哈夫曼编码、行程长度等熵编码方法都复杂,但是它不需要传送像哈夫曼编码的哈夫曼码表,同时算术编码还有自适应能力的优点,所以算术编码是实现高效压缩数据中很有前途的编码方法。它是将被编码的信息表示成实数0和1之间的一个间隔。这种编码方法的实现要比哈夫曼编码能提高5%左右的效率。

七、结束语

压缩技术的发展同社会的需求息息相关,压缩标准也是越来越多,基于知识的编码和语义编码将是压缩编码的发展方向,随着数学理论、信息论以及计算机视觉理论等的发展,必然会有一些更新的、功能更全面的,效率更的高的压缩编码方法出现。