多媒体数据压缩算法及其实现研究

2023-07-10薛佳

电脑知识与技术 2023年14期

关键词：压缩算法研究

薛佳

关键词：多媒体数据；压缩算法；研究

中图分类号：TP311 文献标识码：A

文章编号：1009-3044（2023）14-0096-03

0 引言

当今发展数字信息产业，已成为人们首要关注的目标。其中以计算机技术为主的现代信息技术与其他学科结合而形成的一门新型技术——计算机多媒体技术，更是得到了迅猛发展。目前多媒体技术已经广泛地应用于社会生活的各个领域中，如电视、广播、电影、音乐等方面，并取得了良好的效果。但是，在网络高速发展的今天，多媒体数据亦逐步呈现爆发式增长态势。由于多媒体信息具有丰富而复杂的特性，因此在数据传输时必然会遇到各种干扰因素，从而影响整个系统的性能。多媒体数据量大，一方面是因为人们追求更高质量的数据信息，另一方面数據中所承载的冗余信息庞大。从这两方面来看，它成了信息传播和应用中的一个烦恼。因此，在数据存储、传输过程中需要尽可能地减少不必要的重复操作，以降低整个系统所需的资源。由此可以看出，数据压缩已经成为了解决庞大数据信息量的必然途径，也是多媒体技术的重要组成部分。

1 数据压缩技术概括

1.1 数据压缩的原理和步骤

数据压缩的实质就是一种数据编码技术，它可以使计算机能够快速地处理大量的数据，它的基本原理非常简单，简单地说就是要发现数据中重复的信息，再用较为简短的信息进行表示。在这个过程中，数据作为一种信息载体，进行交换数据时，希望得到的实际上就是信息，而数据压缩技术通过在资料交换时进行重新定义和编码，使得数据传输更为简便和迅速。对多媒体数据信息进行的缩小通常包括编码和解码2个步骤，编码是指将原来数据信息进行一连串的加工，最后转换成压缩编码符号，解码过程和编码过程正好相反，是指将压缩编码后的符号还原成原始信息。因此，本文提出一种新的编码方法——基于内容的编码方式，它利用多媒体系统中大量具有相似特性或类似特征的对象来描述不同类型的图像及视频信息[1]。通过对编码和解码进行运算，能够让信息处于处理环节中、在传输环节中采用“简略”形式表示。这种方式将各种不同形式的数据资料进行统一管理，便于用户对其进行有效的分析利用。

1.2 计算机数据压缩的可行性

与重要性多媒体信息的结构是复杂的，对存储和传输需求十分苛刻。因此，如何高效地将各种多媒体数据压缩成符合用户需求的形式成为亟待解决的问题[2]。多媒体数据中一般都含有较大冗余，如何减少这些冗余就成了压缩领域研究的重要问题之一。由于多媒体数据具有很多独特的性质，因此在实际应用时必须考虑到它们之间的差异，即所谓多余性。

多媒体数据可以被压缩的原因，是因为视频、图像、声音这类信息可压缩性大。以当前普遍采用位图格式存储为例，在该图像数据形式下，像素和像素在行方向和列方向上都有较大相关性，因而整体上数据的冗余度很大。在容许一定范围失真情况下，能够在较大范围内压缩图像数据。因此，为了减少冗余的信息量，提高传输速度，就必须将图像或文本信号变换成一种可以被解码的数字信号。就多媒体计算系统而言，信息由单一媒体向多种媒体转移，同时，各种媒体也可以相互转换，需要把不同的媒体转换成一个或多个相同类型的数据文件来显示和传输。需要对海量数字化的声、图、像视频信息进行表达、传递与加工等，数据量十分庞大。如果用传统的静态图像压缩算法，其运算速度将受到严重限制。比如一张中等分辨率的真彩色图像（640×480像素）（24位/像素），其数据量在7.37Mb/帧左右。如何提高多媒体计算机的速度就成为一个重要问题。如果想实现25帧/秒全动态显示，每秒钟需要184Mb数据量，并要求该系统数据传输速率为184Mb/s，以现在的带宽水平很难达到这么高的传输速率。

选取多媒体数据中的图像数据作为对象，人们所看到的静态图像似乎规律并不一致，但实际图像数据的光强、颜色与饱和度却在很大程度上都是相同的，而这些冗余被叫作空间冗余。也就是说，在不同时间段内拍摄出来的图像都存在着一定程度的差异[3]。另外，由于图像数据包含了大量运动信息，对图像进行处理时会产生一些不必要的运算开销。所以在实践中，可以根据“局部取代整体”，以少量资料显示总体，从而有效降低图像数据的初始数据。

2 数据压缩算法

2.1 数据压缩算法的类型

根据多媒体数据中冗余的类型，可以采用各种压缩方法。根据被压缩数据解码后的原始数据是否发生了变化，压缩的方式可以分为无损压缩和有损压缩。

有损的压缩使解码后的数据和原有数据之间存在一些偏差，这种偏差是人们可以接受的。有损压缩以牺牲一部分信息细节为代价，获得了相当大的压缩比，由于进行压缩后不能通过解压缩恢复其原有的信息细节，所以又被称为不可逆编码。为了提高可信性和恢复性能，通常会将一些重要的数据进行无损处理，比如对图像中的噪声、纹理等做必要的去噪处理。有损压缩是通过增加某些参数来降低原始信号所具有的冗余或相关性，从而使重建出的图像质量得到提高，这也是有损压缩技术最基本和核心的原理[4]。有损压缩编码是以图像为基础，声波具有频带宽、信息量丰富等特征，被人类视、听觉不能灵敏地观察。它通过使用一些特殊的技术将原始信号从高维、低维向一维方向进行分解和重构。它主要通过将原始信号分解成多个不同频率和带宽的分量来达到目的，并且可以利用一些简单的技术实现无损传输。同时相比较无损压缩有更高压缩比例，有损压缩技术在语音、图像和视频等多媒体数据传输过程中被广泛使用。

无损压缩以信息熵原理为基础，具有可逆性，不破坏初始数据等特性。在压缩比相同时，信息丢失率就会随信息量增加而增大，所以冗余度的理论极限通常在2：1～5：1[5]。此类压缩方式虽然压缩比相对较低，但是可以确保完整还原、不会造成丢失。分析无损压缩的基本思想及实现技术，是基于熵编码的无失真图像复原算法。此法用于对自然图像进行压缩，结果不理想，多用在电子表格、文档数据上，珍贵照片的挤压等。目前，无损压缩技术还未被广泛应用到其他领域中去。与有损压缩相比，无损压缩存在占用内存空间较大、压缩比不高等问题，但是在硬盘容量成本不断下降的情况下，它没有改变数据，可以无损还原这一特性而被发展起来，未来应当会有比较好的发展前景。

2.2 压缩算法的分析

2.2.1 哈夫曼编码的文本数据压缩算法

哈夫曼编码属于无损压缩算法的范畴。尽管压缩率有限制，但是可以完全无损地恢复压缩之前的数据，用于文本压缩时特别适用。

哈夫曼编码步骤为：按照给定权值，构建仅有根节点二叉树以及设置初始权值。通过对每一棵树上各边权系数进行计算，得到每棵树的最短路径长度。选择2棵权值最低的树木作为子树，构建新的二叉树[6]。对新生成的叶子进行排序后再将其分成若干个大小不同的小区间，分别计算每一个小区间内各树元节点的权重，从而得出每个大区间的权值，把森林里的两棵树删掉，最新二叉树根节点权值是其子树节点权值的总和。如果有两个以上节点时，将这些节点分别作为父节点和子树，重复前一步，就可以获得哈夫曼树。这种编码方式可以根据不同情况选择相应的方法，这种类型的编码方式将评价原来的符号，为了获得较低的成本，使用更短的编码来表示发生概率更大的标志，且发生概率较小采用较长编码。对于给定初始树形结构，提出了一种基于最大似然准则的快速搜索算法来计算出最佳候选节点数与最小生成树数目之间的关系，旨在减少对编码原有符号长度的期望，由此实现数据压缩。

2.2.2 LZW压缩算法

LZW编码以扫描文本为主，在不改变原信息表结构和内容的前提下，根据不同类型字符所占比例，选择相应的扫描模式[7]。在LZW编码中，每出现一个符号，就需做出一个判断，看看它和前向符号是否能构成在这之前就已经存在的符号串。若不能组成符号串时，就会重新计算该字符是否属于前向符号，对可以构成符号串，继续往后扫；相反，前向符号需要转换成索引，并向输出文字中输入索引[8]。考虑到字符串在文字上反复呈现的频率较高，能获得更好的压缩性能，其核心在于不重复，把即将呈现过的字符串重新反映在向记号上，并借此使用较短的编码时间来表达更长的字符串。因此LZW编码经常运用于文字信息的浓缩，对反复产生较长的符号串，文字压缩效果比较好。

LZW编码的核心思想是将显现的符号串与记号进行映射，以此用更短编码表达更长符号串。这种编码方法可以在一定程度上减少对输入文档进行解码时，需要耗费大量时间和精力去寻找一个合适的匹配符号或相应长度的代码。这使得它以相应索引取代了原来较长文本写在输出文件上，实现了对原有巨大信息进行压缩的目的。在此过程中，使原始文件变成了一个符号库，提高了压缩比。LZW编码经常被用于文本数据压缩中，对重复符号串数量多，文本压缩效果更佳。

3 压缩算法的运用场景

多媒体数据在发送或者存储之前，一般要先经过压缩处理，它可以根据不同的数据格式，不同的质量要求，能够实现对文字信息、声音数据的处理，影像信息和图像数据的有损压缩和无损压缩。

对于文字资料的压缩，需要确保数据在压缩前后不能发生改变，所以必须采用无损压缩，针对该问题，可以使用基于特征匹配技术的数据文件压缩算法，并在保证数据安全性的基础上，实现了对信息无损失压缩，具体可采用哈夫曼编码与LZW词典编码相结合的方法。

针对音频类别的数据压缩技术已开发的相当完善，但主要在波形编码上、参数编码和混合编码上的问题格式，其中基于人耳蜗结构及生理特征的波形编码方式得到了广泛关注与研究。波形编码方式根据人耳听力特点，对声音信息波形加以采样与量化的基本原理，尽量和原始信息的波形相符，并具备在宽码率条件下可获得较高精度声音信息的功能。参数编码将所有音频信息都表示为某一个模型的原始数据，再经过特征提取，获得所要模型数据和激励信息数据，以及编码中所述数据，然后，再对数据端的原始信息进行整理，融合了这两种编码技术的混合编码算法，能有效地降低音频数据的复杂度，提高音频质量[9]。不过使用这种方式进行数据压缩时会丢失更多的数据细节，这种音频压缩技术不适用于高保真的话音和高品质音乐。

图像数据压缩在国际上有静态图像压缩JPEG标准和运动图像压缩MPEG标准，压缩数据的方法有很多，静态图像压缩主要应用于视频、音频及动画等方面，而在其他领域也具有广泛的应用前景，用JPEG标准处理单张静止画面，MPEG标准是对一系列画面构成的移动图像进行处理。由于这两种编码方法都使用了不同类型的系数来表示像素之间的关系，因此它们在编码效率上并无本质差异。静态图像压缩旨在去除了一些图像中人眼不灵敏的地方，就是对空间信息进行压缩，不影响视觉观赏。运动图像压缩可以在保持视频内容不变的情況下提高传输速率，并能保证一定的传输质量。对于静态图像文件，使用JPEG压缩的结果非常明显，在压缩率为20：1的情况下，人眼几乎看不到它的失真。

利用数据压缩算法进行数据压缩，属于信息高效传输与存储技术之一，旨在使计算机具备处理海量多媒体数据，最大限度地降低了由于网络数据传输速率造成的障碍[10]。在大数据飞速发展的当下，多媒体也开始融入人们日常生活的方方面面，爆炸式递增的信息，给多媒体的压缩算法也带来了源源不断的新问题。在这个过程中，数据的规模变得越来越巨大，而这些海量的数据往往具有非常高的复杂性以及不确定性，这就要求数据压缩算法必须能够立足于当前的现有资源，快速且有效地完成数据压缩任务。

4 结束语

基于以上研究进行分析，压缩方法应从采用各种编码方法开始，以适当的方法去除了信息中多余问题。同时通过采用多种方法进行数据编码优化，提高了数据传输效率，对于多媒体设备，音频的应用、动画制作引起了翻天覆地的变化。计算机多媒体编码是一个由计算机技术、信息技术、通信等技术多个领域交叉综合而形成的新兴学科。随着视频音频质量要求的不断提高，以及更多与之相关方面的发展，计算机多媒体压缩势必要提高到新的水平，成为处理数据必不可少的一种数字化技术。