基于 JPEG 标准的 16 bit图像有损压缩应用

2016-06-13徐妮妮李晨光

电信科学 2016年4期

关键词：编码器比特分值

徐妮妮，李晨光

（天津工业大学电子与信息工程学院，天津 300387）

基于 JPEG 标准的 16 bit图像有损压缩应用

徐妮妮，李晨光

（天津工业大学电子与信息工程学院，天津 300387）

给出了 16 bit 图像有损压缩的原理和详细流程。由于 16 bit 图像数据量大而 JPEG 并不支持 16 bit图像的压缩，这使得其在存储和传输方面有很多不便。在 JPEG 压缩方案的基础上，对统计模型进行了扩展（分别对 DC 差分值编码的统计模型表和 AC 系数编码的统计模型表进行了一定的改变和扩充），使其能够处理位深度为 16 的数据，从而实现了 16 bit图像的有损压缩。图像量化过程中所使用的量化表是基于 JPEG 默认的 8 位亮度图像量化表生成的。所采用的编码器为 QM 算术编码器，解压后的图像质量评价标准采用客观评价标准 PSNR。

16 bit 图像有损压缩；DC 差分值编码的统计模型；AC 系数编码的统计模型；QM 算术编码器

1 引言

随着数字图像技术的发展以及数字图像在各领域应用的日益广泛，在一些领域中人们对图像质量的要求也越来越高。这时传统的 8 bit图像已经不能满足要求，使用16 bit图像能够更好地满足所需的图像质量要求。如在医学成像领域中 dicom（digital imaging and communications in medicine）格式［1］的 CT 图像就是 16 bit灰度图像。16 bit图像在医学领域的广泛应用提高了图像的精确程度，方便了医生对疾病的诊断。然而相比于 8 bit图像使用 1 byte 来存储 1 个像素，16 bit图像存储 1 个像素时使用 2 byte。这使得 16 bit图像在能够满足人们对图像质量要求的同时也存在着数据量大的问题。16 bit图像庞大的数据量使其在存储和传输方面有很大的不便［2］。通过图像压缩技术可以在一定程度上降低其数据量，在压缩过程中通过对质量因子的选择，可以使解压后的图像满足所需要的质量要求。

由于目前的显示系统通常只能显示位深度为8的图像，因此图像压缩算法主要是针对 8 bit图像，对 16 bit 图像的压缩研究较少。孙中柏［2］提出了一种基于霍夫曼编码的16 bit灰度图像的无损压缩方法，但该方法只能获得 2.5 左右的压缩比，并不能有效地减少 16 bit图像的数据量。相比于无损压缩，有损压缩的压缩比更高。2014 年 1 月 IJG 组织发布的 JPEG 的新版本 JPEG9a［3］中给出了 8 bit 和 12 bit 图像的有损压缩方法，却没有给出 16 bit图像的有损压缩方法。针对 16 bit图像的有损压缩，本文在 JPEG 标准中压缩方法的基础上对量化策略和统计模型进行了扩展，提出了新的方案 extend-JPEG。该方法在压缩过程中使用 DCT（discrete Cosine transform，离散余弦变换），编码器选择 QM算术编码器。

2 16 bit图像压缩方案

2.1 压缩流程

基于 JPEG 标准的 16 bit 图像压缩方案 extend-JPEG的流程［4，5］主要分为如下 3 个步骤：

（1）对原始图像数据进行 DCT；

（2）依据 DCT“能量集中”的特性以及人类视觉的特性，对变换后数据进行量化；

（3）量化后的数据经扫描后进行熵编码（本文使用的编码器为 QM 算术编码器）。

图1 给出了 16 bit图像压缩方案的流程，该方案和JPEG 标准的 8 bit图像压缩方案基本相同，只是在量化和熵编码部分进行了一定的扩充和改变。

2.2 DCT

DCT 是一种实数域变换，是一种简化了的 Fourier变换。基于分块 DCT 的压缩编码技术是已有图像和视频压缩标准的核心技术。这主要是因为 DCT 具有良好的去相关性和能量压缩特性并且 DCT存在快速算法。

由图 1的编码过程可知，先将图像分割成若干个大小为8×8 像块的集合 MCU。然后对块内的二元数据进行 DCT。

DCT的计算式如下：

其中，syx（y，x=0，1，… ，7）为块内像素值，Suυ（u，υ=0，1，… ，7）为 DCT 后的变换系数。

对于一个 MCU 经过 DCT 后得到 64 个 DCT 系数 Suυ，其中，S00称为 DC（直流）系数，剩下的 63 个称为 AC（交流）系数。因为变换后图像的能量主要集中在低频的直流部分，这使得 DC 系数往往很大，为了提高压缩率在编码 DC系数时并不是直接进行编码而是采用差分编码的方法。当前块的 DC 系数与相邻的前一个像块的 DC 系数作差，差值用 Diff表示。得到的差值 Diff取绝对值后减 1 赋给变量Sz，即：Sz=|Diff|-1。Sz 的值是需要编码的数值。表 1 中分别给出了 8 bit、12 bit、16 bit图像各参数的取值范围，其中 S代表原始图像像素值。

由表 1 中数据可以看出相比于 8 bit和 12 bit图像的 Sz，16 bit图像 Sz参数的取值范围要大得多。在对 Sz进行编码时，JPEG 标准的编码方案中的统计模型只能处理取值范围在0～32 759 的数据，即 JPEG 最大只能编码 12 bit图像。因此需要对统计模型进行扩展才能进行 16 bit图像的压缩编码（本文的统计编码部分将详细介绍统计模型的扩展过程）。

图1 16 bit 图像压缩流程

2.3 量化

量化是使编码数据量下降的一个有力工具，即将 DCT后的数据除以量化矩阵对应位置的量化系数。量化系数越高，图像压缩率越高，但相应的图像质量会越差。这就要求选择合适的量化系数，在满足图像质量要求的同时达到最好的压缩效果。JPEG 规定的 Annex K 方针中有对于亮度分量和色差分量量化表的例子。由于本文所压缩的图像主要针对的是灰度图像，所以只分析亮度分量的量化表。图2为 JPEG 默认的 8 bit亮度图像量化表 8_Y_Q。通过观察量化表中的数据，可以看出量化表左上角的量化系数值明显小于右下角的系数值。这主要是因为图像的像素块经过二维 DCT 后，像素块的低频数据集中在二维矩阵的左上角，高频数据集中在右下角，而人类视觉具有难以感觉高频率失真的特点，所以在低频区域选择较小的量化系数以满足人类视觉对图像质量的要求，而在高频区域选择较大量化系数来尽可能的提高压缩率。

表1 参数取值范围

图2 亮度分量用量化表 8_Y_Q

基于 8 bit亮度图像量化表可以得到 16 bit亮度图像量化表。定义质量因子 Q，Q 的取值范围为 1～100。当 Q=1时，解压图像质量最差；当 Q=100 时，解压图像质量最好，此时相当于没有量化，解压图像的失真完全由 DCT 的精度引起的。定义缩放因子 S_Q，S_Q 与 Q 的关系为：

最后，由 M_Q 生成 16 bit亮度图像量化表 16_Y_Q，16_Y_Q 的每个元素由式（5）计算

可见，当 Q=50 时，16 bit亮度图像量化表与 8 bit 亮度图像量化表相等；当 Q=100 时，16 bit亮度图像量化表的值都为 1。

2.4 统计编码

由于 DC 差分值和 AC 系数是多值数据，而本文所使用的 QM 算术编码器的输入数据要求是“0”或“1”的二值数据。因此在编码前需要将多值数据二值化，在二值化过程中，为了提高二进制算术编码的编码效率，对 DC 差分值和 AC 系数采取统计编码的方法（DC 差分值和 AC 系数所进行的统计编码是不同的）。此方法需要分别用 DC 差分值索引（见表 2）和 AC 分量索引（见表 3）根据各自不同的判定条件，将“0”或“1”输入各自对应的编号处，生成二进制信号。

表2 DC差分值编码的统计模型

DC 差分值 Diff是根据表 2（表 2 是经过扩展后的统计模型）的统计模型来附加条件的。其中，前后关系索引为区分二值信号的概率状态推断机的索引，根据编码判断条件输入“0”或“1”时，进行独立的 MPS／LPS 出现概率的优化。例如前后关系索引中 S0，当 Diff为零时输入 “0”，非零时输入“1”。并且 S0、SS、SP、SN 根据前一像块的 DC 差分值大小（Da）分为负的大振幅（-L）、负的小振幅（-S）、零附近（／0／）、正的小振幅（+S）、正的大振幅（+L）5 种情况。针对这 5 种不同状态可以规定 S0 的索引值分别为 0、4、8、12、16。

Sz（Sz=|Diff|-1）的值与表 3（表 3 是扩展后的表）中的最大边界值 M 由小到大进行顺序比较，Sz＞Mi（i=0，… ，19）时，前后关系索引 Xi为“1”；Sz＜Mi时，为“0”。并且各组编号内的具体值需要追加补充比特。不同的 Sz会有不同的补充比特位数与之对应，表 3 列出了 Sz 的所有可能值，以及 Sz在不同取值范围时所对应的补充比特的 bit数。

表3 系数成组化的大小范畴

相比于表 2，IJG 标准中的 DC 差分值编码统计模型表中没有前后关系索引值为 X16～X19 以及 M16～M19 这 8 行。这意味着 IJG 标准中只能处理 Sz＜32 768 的数据。对比表1 中分别列出的 8 bit、12 bit、16 bit图像 Sz 的取值范围 0～2 039、0～32 759、0～524 271，可以得出 IJG 标准最大只能编码 12 bit图像。而本文中经过扩展的 DC 差分值编码统计模型能够处理 Sz＜524 288 的数据，因此能够对 16 bit图像数据进行统计编码。

根据该统计模型可以将 DC差分值变换成成对的CX 和 D（其中，CX 为前后关系索引，D 为“0”或“1”的二值数据）。

下面列举一个 DC 差分值 Diff为 -20 时生成 CX 和 D值的例子。

假设 Da 的大小在零附近，则 S0=8，Diff≠0，所以D=1；

Diff为负数，所以：

对应的补充比特为 M5=38，补充比特数为 4。19-24= 3，所以 4 位补充比特为 0011。

AC 系数编码的统计模型见表 4，该表为扩展之后的表，扩展部分为前后关系索引值为 X16～X19 和 M16～M19这 8行。它的判断与 DC差分值相同。表 4中的 k值表示的是二维的 AC 系数经过“之”字扫描变为一维数据后的顺序值。通常规定一个固定的 k 值 Kx（Kx 的默认值为 5）来将 AC 系数分成低频率和高频率两种情况，因此 X2，…，X19，M2，…，M19 有两种状态。EOB 表示 AC 系数段的结束（即由 AC 系数末尾开始全为零的段）。

表4 AC系数编码的统计模型

2.5 QM 算术编码

QM 算术编码器如图 2（a）所示，其输入为上下文索引CX 和比特 D，CX 和 D 成对压入编码器，生成以字节为单位的压缩码流。其中，上下文索引 CX 和比特 D 的产生是DC 差分值和 AC 系数经过上面的表“DC 差分值编码的统计模型”和表“AC 系数编码的统计模型”得到的。

图2 QM算术编码

QM 算术编码基本原理：根据输入的每个（CX，D）确定MPS 编码或 LPS 编码，按 MPS 或 LPS 编码划分区间宽度A（A 的取值范围为 0x8000～0xFFFF），区间宽度 A 分为 Qe和 Pe 两部分（Qe 为小概率区间在上面，Pe 为大概率区间在下面）。MPS 编码后区间宽度 A 被更新为 Qe 和 Pe 中较大的一个。LPS 编码后区间宽度 A 被更新为 Qe 和 Pe 中较小的一个。当更新后的区间宽度 A 小于 0x8000，A 和 C 寄存器需要归一化处理，保证 A 值不小于 0x8000。因为 C 寄存器的位宽度有限，当其值大到一定程度时必须输出高位比特，高位比特按字节输出形成压缩码流。

QM算数解码的过程是编码的逆过程这里不再赘述。

3 16 bit图像压缩的仿真实例

仿真实验中的测试图像为人体肺部的 CT 图像，测试图像如图 3所示。图像的压缩实验数据见表 5。压缩图像的质量评价标准采用客观评价准则。最常用的方法为均方误差（MSE）和峰值信噪比（PSNR）［6］。PSNR 的值越大，压缩图像质量越好，压缩过程造成的失真越少。二者的定义如下。

给定一幅原始图像，图像上的像素点值以 S（x，y）（0≤x≤M-1，0≤y≤N-1）表示，而解压后的图像像素点值以R（x，y）（0≤x≤M-1，0≤y≤N-1）表示，图像的尺寸为 M×N。

均方差定义如下：

峰值信噪比定义如下：

图3 16 bit 测试图像

表5 16 bit测试图像压缩数据

其中，Smax=65 535。

分析表5中数据可知，压缩过程中质量因子Q值越小，图像的压缩比越大，但相应的 PSNR 值越小，即解压后的图像失真越严重。当 Q=100 时压缩过程相当于不进行量化处理，压缩与解压缩过程中的数据损失仅发生在 DCT和反 DCT 时的计算精度的损失，解压后的图像质量最好，然而此时的压缩比只有 2左右，不能满足有效降低数据量的要求。当 Q=5 时虽然压缩比能够达到 20 左右，但由于量化步长太大，解压后图像失真会比较严重。通常情况下，PSNR 值在 70 dB 左右时解压恢复的图像不会有太大的失真，足以满足人们提取图像中信息的要求。由表 5中的实验数据可以看出在此峰值信噪比时图像的压缩比大约在6 左右，已经能很大程度地减小 16 bit图像的数据量，便于图像的存储与传输。

4 结束语

本文详细地介绍了 DCT、量化、QM 算数编码的原理，给出了完整的 16 bit图像压缩方案。本文按照 JPEG 压缩方案的流程，对量化和熵编码部分进行了一定的修改和扩充，从而实现了 16 bit图像的有损压缩。由仿真实验可以看出，运用本文的压缩方法对 16 bit图像进行压缩可以得到很好的压缩率。通过选择不同的质量因子 Q可以获得满足一定要求的 PSNR 值，从而保证解压后的图像质量能够满足实际的需要。

随着 16 bit图像应用的日益广泛，关于 16 bit图像的压缩研究也将会日益增多。高压缩比、低损失永远是人们在图像压缩领域中所追求的。把在 8 bit图像压缩中广泛使用的小波分析［7］以及视频压缩中帧内编码［8］等比较先进的方法，应用在 16 bit图像压缩中，以提高压缩比，将成为未来 16 bit图像压缩发展的趋势。

［1］ National Electrical Manufacturers Association（NEMA）.Digital imaging and communications in medical（DICOM）［S］.2003.

［2］孙中柏. 一种 16 位灰度图像无损压缩和解压缩方法［D］. 西安：西安电子科技大学，2012. SUN Z B.A method of16-bitgrayscale imagelossless compression and decompression ［D］.Xi’an：Xidian University， 2012.

［3］ CCITT.ISO／IEC 10918-1，T.81（09／92）［Z］.FRENCH：CCITT，1992.

［4］小野定康，铃木纯司 .PEG 技术［M］.叶明，译 .北京：科学出版社， 2003. ONO JoKang，JUNJI Suzuki.JPEG technology［M］.Translated by YE M.Beijing：Science Press，2003.

［5］小野定康，铃木纯司.JPEG2000 技术［M］. 增强福，译. 北京：科学出版社， 2004. ONO JoKang， JUNJI Suzuki.JPEG2000 technology ［M］. Translated by ZENG Q F.Beijing：Science Press，2004.

［6］徐世寅.以 MQ 算术编码器为核心技术的静态图像压缩［D］.天津：天津工业大学，2013：55-56. XU S Y.The static image compression based on MQ arithmetic coder as the core technology ［D］.Tianjin：Tianjin Polytechnic University，2013：55-56.

［7］郑伟，崔跃利，王芳. 基于小波变换的图像压缩编码研究综述［J］.通信技术，2008，2（41）：85-96. ZHENG W，CUI Y L，WANG F.A review of image compression coding based on wavelettransform ［J］.Communications Technology，2008，2（41）：85-96.

［8］毕厚杰，王健 .新一代视频压缩编码标准 —H.264／AVC［M］. 北京：人民邮电出版社，2009. BI H J，WANG J.A new generation of video compression coding standard-H.264／AVC ［M］.Beijing：Posts and Telecom Press，2009.

Application of 16 bit image lossy compression based on the JPEG standard

XU Nini，LI Chenguang
School of Electronics and Information Engineering，Tianjin Polytechnic University，Tianjin 300387，China

The principle and detailed process of 16 bit image lossy compression were given.The data of 16 bit image is large and JPEG does not support the 16 bit image compression，which makes it inconvenience in 16 bit image’s storage and transmission.Based on the scheme of JPEG compression，the statistical model was expended（improving the tables of statistical model for DC coefficient coding and statistical model for AC coefficient coding respectively）.This made it can deal with the data of 16 bit and realized the ideal of the compression of 16 bit static images.The quantization table used was generated based on the Luminance quantization table in JPEG.The encoder adopted was QM arithmetic encoder.An objective evaluation standard PSNR was chosen to evaluate the quality of the decompressed images.

16 bit image lossy compression，statistical model for DC coefficient coding，statistical model for AC coefficient coding，QM arithmetic encoder

TN911.7

：A

10.11959／j.issn.1000-0801.2016106