APP下载

基于 JPEG 标准的 16 bit图像有损压缩应用

2016-06-13徐妮妮李晨光

电信科学 2016年4期
关键词:编码器比特分值

徐妮妮,李晨光

(天津工业大学电子与信息工程学院,天津 300387)

基于 JPEG 标准的 16 bit图像有损压缩应用

徐妮妮,李晨光

(天津工业大学电子与信息工程学院,天津 300387)

给 出 了 16 bit 图 像 有 损 压 缩 的 原 理 和 详 细 流 程 。 由 于 16 bit 图 像 数 据 量 大 而 JPEG 并 不 支 持 16 bit图像的压缩,这使得其在存 储和传输方 面有很多不便。 在 JPEG 压缩方 案的基础上,对统计模型 进行了扩 展 (分别 对 DC 差分值编码的统计模型表和 AC 系数编码的统计模型表进行了一定的改变和扩充),使其能够处 理 位深 度 为 16 的 数 据 , 从 而 实 现 了 16 bit图 像 的 有 损 压 缩 。 图 像 量 化 过 程 中 所 使 用 的 量 化 表 是 基 于 JPEG 默 认的 8 位 亮度 图 像 量 化 表 生 成 的。 所 采 用的 编 码 器 为 QM 算 术 编 码器 ,解压 后 的 图 像 质 量 评 价 标 准 采 用 客 观评价标准 PSNR。

16 bit 图 像 有 损 压 缩 ;DC 差 分 值 编 码 的 统 计 模 型 ;AC 系 数 编 码 的 统 计 模 型 ;QM 算 术 编 码 器

1 引言

随着数字图像技术的发展以及数字图像在各领域应用的日益广泛,在一些领域中人们对图像质量的要求也越来 越 高 。这 时 传 统 的 8 bit图 像 已 经 不 能 满 足 要 求 ,使 用16 bit图 像 能 够 更 好 地 满 足 所 需 的 图 像 质 量 要 求 。如 在 医学 成 像 领 域 中 dicom(digital imaging and communications in medicine)格 式[1]的 CT 图 像 就 是 16 bit灰 度 图 像 。16 bit图像在医学领域的广泛应用提高了图像的精确程度,方便了医 生 对 疾 病 的 诊 断 。 然 而 相 比 于 8 bit图 像 使 用 1 byte 来存 储 1 个 像 素 ,16 bit图 像 存 储 1 个 像 素 时 使 用 2 byte。这使 得 16 bit图 像 在 能 够 满 足 人 们 对 图 像 质 量 要 求 的 同 时也 存 在 着 数 据 量 大 的 问 题 。16 bit图 像 庞 大 的 数 据 量 使其 在 存 储 和 传 输 方 面 有 很 大 的 不 便[2]。 通 过 图 像 压 缩 技术可以在一定程度上降低其数据量,在压缩过程中通过对质量因子的选择,可以使解压后的图像满足所需要的质量要求。

由于目前的显示系统通常只能显示位深度为8的图像 , 因 此 图 像 压 缩 算 法 主 要 是 针 对 8 bit图 像 ,对 16 bit 图像 的 压 缩 研 究 较 少 。孙 中 柏[2]提 出 了 一 种 基 于 霍 夫 曼 编 码 的16 bit灰 度 图 像 的 无 损 压 缩 方 法 ,但 该 方 法 只 能 获 得 2.5 左右的压缩比,并不能有效地减少 16 bit图像的数据量。相比于 无 损 压 缩 ,有 损 压 缩 的 压 缩 比 更 高。2014 年 1 月 IJG 组织发 布 的 JPEG 的 新 版 本 JPEG9a[3]中 给 出 了 8 bit 和 12 bit 图像 的 有 损 压 缩 方 法 ,却 没 有 给 出 16 bit图 像 的 有 损 压 缩 方法 。针 对 16 bit图 像 的 有 损 压 缩 ,本 文 在 JPEG 标 准 中 压 缩方法的基础上对量化策略和统计模型进行了扩展,提出了新 的 方 案 extend-JPEG。 该 方 法 在 压 缩 过 程 中 使 用 DCT(discrete Cosine transform,离 散 余 弦 变 换 ),编 码 器 选 择 QM算术编码器。

2 16 bit图像压缩方案

2.1 压缩流程

基 于 JPEG 标 准 的 16 bit 图 像 压 缩 方 案 extend-JPEG的 流 程[4,5]主 要 分 为 如 下 3 个 步 骤 :

(1)对原始图像数据进行 DCT;

(2)依据 DCT“能量集中”的特性以及人类视觉的 特性,对变换后数据进行量化;

(3)量化后的数据经扫描后进行熵编码(本文使用的编码器为 QM 算术编码器)。

图1 给 出 了 16 bit图 像 压 缩 方 案 的 流 程 , 该 方 案 和JPEG 标 准 的 8 bit图 像 压 缩 方 案 基 本 相 同 ,只 是 在 量 化 和熵编码部分进行了一定的扩充和改变。

2.2 DCT

DCT 是 一 种 实 数 域 变 换 , 是 一 种 简 化 了 的 Fourier变换。 基于分块 DCT 的 压缩编码 技 术 是已有图 像 和视频压缩标准的核心 技术 。这主要是 因 为 DCT 具有 良 好的去相关性和能量压缩特性并且 DCT存在快速算法。

由图 1的编码过程可知,先将图像分割成若干个大小为8×8 像块的集合 MCU。然后对块内的二元数据进行 DCT。

DCT的计算式如下:

其 中 ,syx(y,x=0,1,… ,7)为 块 内 像 素 值 ,Suυ(u,υ=0,1,… ,7)为 DCT 后的变换系数。

对 于 一 个 MCU 经 过 DCT 后 得 到 64 个 DCT 系 数 Suυ,其 中 ,S00称 为 DC(直 流 )系 数 ,剩 下 的 63 个 称 为 AC(交 流 )系数。因为变换后图像的能量主要集中在低频的直流部分,这使得 DC 系数往往 很大,为了提 高 压 缩率在编 码 DC系数时并不是直接进行编码而是采用差分编码的方法。当前 块 的 DC 系 数与 相 邻 的 前 一 个 像 块的 DC 系 数 作 差,差值 用 Diff表 示 。得 到 的 差 值 Diff取 绝 对 值 后 减 1 赋 给 变 量Sz,即 :Sz=|Diff|-1。Sz 的 值 是 需 要 编 码 的 数 值 。表 1 中 分 别给 出 了 8 bit、12 bit、16 bit图 像 各 参 数 的 取 值 范 围 ,其 中 S代表原始图像像素值。

由表 1 中数据可以看出相比于 8 bit和 12 bit图像的 Sz,16 bit图像 Sz参数的取值范围要大得多。在对 Sz进行编码时,JPEG 标准的编码方案中 的统计模型只能处理取值范围在0~32 759 的数据,即 JPEG 最大只能编码 12 bit图像。因此需要对统计模型进行扩展才能进行 16 bit图像的压缩编码(本文的统计编码部分将详细介绍统计模型的扩展过程)。

图1 16 bit 图 像 压 缩 流 程

2.3 量化

量化是使编码数据量下降的一个有力工具,即将 DCT后的数据除以量化矩阵对应位置的量化系数。量化系数越高,图像压缩率越高,但相应的图像质量会越差。这就要求选择合适的量化系数,在满足图像质量要求的同时达到最好 的 压 缩 效 果 。JPEG 规 定 的 Annex K 方 针 中 有 对 于 亮 度分量和色差分量量化表的例子。由于本文所压缩的图像主要针对的是灰度图像,所以只分析亮度分量的量化表。图2为 JPEG 默 认 的 8 bit亮 度 图 像 量 化 表 8_Y_Q。通 过 观 察 量化表中的数据,可以看出量化表左上角的量化系数值明显小于右下角的系数值。这主要是因为图像的像素块经过二维 DCT 后,像素块的 低频数据集中 在 二维矩阵 的 左 上角,高频数据集中在右下角,而人类视觉具有难以感觉高频率失真的特点,所以在低频区域选择较小的量化系数以满足人类视觉对图像质量的要求,而在高频区域选择较大量化系数来尽可能的提高压缩率。

表1 参数取值范围

图2 亮度分量用量化表 8_Y_Q

基 于 8 bit亮 度 图 像 量 化 表 可 以 得 到 16 bit亮 度 图 像量化表。定义质量因子 Q,Q 的取值范围为 1~100。当 Q=1时,解压图像质量最差;当 Q=100 时,解压图像 质 量 最好,此时相当于没有量化,解 压 图像的 失 真 完全由 DCT 的 精度引起的。定义缩放因子 S_Q,S_Q 与 Q 的关系为:

最 后 , 由 M_Q 生 成 16 bit亮 度 图 像 量 化 表 16_Y_Q,16_Y_Q 的每个元素由式(5)计算

可 见 ,当 Q=50 时 ,16 bit亮 度 图 像 量 化 表 与 8 bit 亮度 图 像 量 化 表 相 等 ; 当 Q=100 时 ,16 bit亮 度 图 像 量 化 表的值都为 1。

2.4 统计编码

由于 DC 差分值和 AC 系数是多值数据,而本文所使用的 QM 算术编码器的输入数据要求是“0”或“1”的二值数据。因此在编码前需要将多值数据二值化,在二值化过程 中 ,为 了 提 高 二 进 制 算 术 编 码 的 编 码 效 率 ,对 DC 差 分值和 AC 系数采取统计编码的方法(DC 差分值和 AC 系数所 进行的统计 编 码 是不同的 )。此 方 法 需要分 别 用 DC 差分 值索引(见表 2)和 AC 分量 索引(见表 3)根 据 各自不同的判定条件,将“0”或“1”输入各自对应的编号处,生成二进制信号。

表2 DC差分值编码的统计模型

DC 差 分 值 Diff是 根 据 表 2(表 2 是 经 过 扩 展 后 的 统 计模型)的统计模型来附加条件的。其中,前后关系索引为区分二值信号的概率状态推断机的索引,根据编码判断条件输入“0”或“1”时,进行独立的 MPS/LPS 出现概率的优化。例如 前 后 关 系 索 引 中 S0,当 Diff为 零 时 输 入 “0”,非 零 时 输 入“1”。并 且 S0、SS、SP、SN 根 据前一像 块 的 DC 差 分 值 大 小(Da)分 为 负 的 大 振 幅 (-L)、负 的 小 振 幅 (-S)、零 附 近 (/0/)、正的 小 振 幅(+S)、正的大振幅(+L)5 种情况。针对这 5 种不同状态可以规定 S0 的索引值分别为 0、4、8、12、16。

Sz(Sz=|Diff|-1)的 值 与 表 3(表 3 是 扩 展 后 的 表 )中的 最 大 边 界 值 M 由 小 到 大 进 行 顺 序 比 较 ,Sz>Mi(i=0,… ,19)时 ,前后关系索引 Xi为“1”;Sz<Mi时,为“0”。并且各组编号内的具体值需要追加补充比特。不同的 Sz会有不 同 的 补 充 比 特 位 数 与 之 对 应 ,表 3 列 出 了 Sz 的 所 有可能值,以及 Sz在 不 同 取 值 范 围时 所 对 应的 补 充 比特的 bit数 。

表3 系数成组化的大小范畴

相比于表 2,IJG 标准中的 DC 差分值编码统计模型表中没有前后关系索引值为 X16~X19 以及 M16~M19 这 8 行 。这 意 味 着 IJG 标 准 中 只 能 处 理 Sz<32 768 的 数 据 。对 比 表1 中 分 别 列 出 的 8 bit、12 bit、16 bit图 像 Sz 的 取 值 范 围 0~2 039、0~32 759、0~524 271,可 以 得 出 IJG 标 准 最 大 只 能编 码 12 bit图 像 。而 本 文 中 经 过 扩 展 的 DC 差 分 值 编 码 统计 模 型 能 够 处 理 Sz<524 288 的 数 据 ,因 此 能 够 对 16 bit图像数据进行统计编码。

根 据该统 计模型 可以将 DC差 分 值 变 换成成对的CX 和 D(其中,CX 为前后关系索 引,D 为“0”或“1”的二值数据)。

下 面 列 举 一 个 DC 差 分 值 Diff为 -20 时 生 成 CX 和 D值的例子。

假 设 Da 的 大 小 在 零 附 近 ,则 S0=8,Diff≠0,所 以D=1;

Diff为 负 数 ,所 以 :

对应的补充比特为 M5=38,补充比特数为 4。19-24= 3,所以 4 位补充比特为 0011。

AC 系数编码的统计模型见表 4,该表为扩展之后的表,扩展部分为前后关系索引值为 X16~X19 和 M16~M19这 8行。它的判断与 DC差分值相同。表 4中的 k值表示的是二维的 AC 系数经过“之”字 扫描 变为一 维数据 后的顺 序 值 。通 常 规 定 一 个 固 定 的 k 值 Kx(Kx 的 默 认 值 为 5)来将 AC 系数分成低频率 和高频率两种情况,因此 X2,…,X19,M2,…,M19 有 两 种 状 态 。EOB 表示 AC 系 数 段 的 结 束(即由 AC 系数末尾开始全为零的段)。

表4 AC系数编码的统计模型

2.5 QM 算术编码

QM 算术编码器如图 2(a)所示,其输入 为 上 下文索 引CX 和比特 D,CX 和 D 成对压入编码器, 生成以字节 为单位的压缩码流。其中,上下文索引 CX 和比特 D 的产 生是DC 差分值和 AC 系 数 经过上面 的 表“DC 差 分 值 编码的 统计模型”和表“AC 系数编码的统计模型”得到的。

图2 QM算术编码

QM 算术编码基本原理:根 据 输 入的每个 (CX,D)确 定MPS 编 码 或 LPS 编 码 ,按 MPS 或 LPS 编 码 划 分 区 间 宽 度A(A 的取值范围为 0x8000~0xFFFF),区 间宽度 A 分 为 Qe和 Pe 两 部 分 (Qe 为 小 概 率 区 间 在 上 面 ,Pe 为 大 概 率 区 间在下面)。MPS 编 码 后 区 间 宽 度 A 被 更 新 为 Qe 和 Pe 中 较大的一个。LPS 编 码 后 区 间 宽 度 A 被 更 新 为 Qe 和 Pe 中 较小的一个。当更新后的区间宽度 A 小于 0x8000,A 和 C 寄存器需要归一化处理,保证 A 值不小于 0x8000。因为 C 寄存器的位宽度有限,当其值大到一定程度时必须输出高位比特,高位比特按字节输出形成压缩码流。

QM算数解码的过程是编码的逆过程这里不再赘述。

3 16 bit图像压缩的仿真实例

仿真实验中的测试图像为人体肺部的 CT 图像,测试图像如图 3所示。图像的压缩实验数据见表 5。压缩图像的质量评价标准采用客观评价准则。最常用的方法为均方误差(MSE)和 峰 值 信 噪 比 (PSNR)[6]。PSNR 的 值 越 大 ,压 缩 图 像质量越好,压缩过程造成的失真越少。二者的定义如下。

给 定 一 幅 原 始 图 像 ,图 像 上 的 像 素 点 值 以 S(x,y)(0≤x≤M-1,0≤y≤N-1)表示,而解压后的图像像素点值以R(x,y)(0≤x≤M-1,0≤y≤N-1)表 示 ,图 像 的 尺 寸 为 M×N。

均方差定义如下:

峰值信噪比定义如下:

图3 16 bit 测 试 图 像

表5 16 bit测 试 图 像 压 缩 数 据

其 中 ,Smax=65 535。

分析表5中数据可知,压缩过程中质量因子Q值越小,图像的压缩比越大,但相应 的 PSNR 值 越小,即解压 后的图像失真越严重。当 Q=100 时压缩过程相当于不进行量化处理,压缩与解压缩过程中的数据损失仅发生在 DCT和反 DCT 时的 计算精度 的损失,解压 后 的 图像质 量 最 好,然而此时的压缩比只有 2左右,不能满足有效降低数据量的 要 求 。当 Q=5 时 虽 然 压 缩 比 能 够 达到 20 左 右 ,但 由 于量化步长太大,解压后图像失真会比较严重。通常情况下,PSNR 值 在 70 dB 左 右 时 解 压 恢 复 的 图 像 不 会 有 太 大 的 失真,足以满足人们提取图像中信息的要求。由表 5中的实验数据可以看出在此峰值信噪比时图像的压缩比大约在6 左 右 ,已 经 能 很 大 程 度 地 减 小 16 bit图 像 的 数 据 量 ,便 于图像的存储与传输。

4 结束语

本文详细地介绍了 DCT、量化、QM 算数编码的原理,给 出 了 完 整 的 16 bit图 像 压 缩 方 案 。本 文 按 照 JPEG 压 缩方案的流程,对量化和熵编码部分进行了一定的修改和扩充 ,从 而 实 现 了 16 bit图 像 的 有 损 压 缩 。 由 仿 真 实 验 可 以看 出 ,运 用 本 文 的 压 缩 方 法 对 16 bit图 像 进 行 压 缩 可 以 得到很好的压缩率。通过选择不同的质量因子 Q可以获得满足一定要求的 PSNR 值,从而 保 证解压后 的 图 像质量能 够满足实际的需要。

随 着 16 bit图 像 应 用 的 日 益 广 泛 ,关 于 16 bit图 像 的压缩研究也将会日益增多。高压缩比、低损失永远是人们在 图 像 压 缩 领 域 中 所 追 求 的 。把 在 8 bit图 像 压 缩 中 广 泛使 用 的 小 波 分 析[7]以 及 视 频 压 缩 中 帧 内 编 码[8]等 比 较 先 进的 方 法 ,应 用 在 16 bit图 像 压 缩 中 ,以 提 高 压 缩 比 ,将 成 为未 来 16 bit图 像 压 缩 发 展 的 趋 势 。

[1] National Electrical Manufacturers Association(NEMA).Digital imaging and communications in medical(DICOM)[S].2003.

[2] 孙 中 柏. 一 种 16 位 灰 度 图 像 无 损 压 缩 和 解 压 缩 方 法 [D]. 西安:西安电子科技大学,2012. SUN Z B.A method of16-bitgrayscale imagelossless compression and decompression [D].Xi’an:Xidian University, 2012.

[3] CCITT.ISO/IEC 10918-1,T.81(09/92)[Z].FRENCH:CCITT,1992.

[4] 小 野 定 康 ,铃 木 纯 司 .PEG 技 术 [M].叶 明 ,译 .北 京 :科 学 出 版社, 2003. ONO JoKang,JUNJI Suzuki.JPEG technology[M].Translated by YE M.Beijing:Science Press,2003.

[5] 小 野 定 康 ,铃 木 纯 司.JPEG2000 技 术 [M]. 增 强 福 ,译. 北 京 :科学出版社, 2004. ONO JoKang, JUNJI Suzuki.JPEG2000 technology [M]. Translated by ZENG Q F.Beijing:Science Press,2004.

[6] 徐 世 寅.以 MQ 算 术 编 码 器 为 核 心 技 术 的 静 态 图 像 压 缩 [D].天津 :天 津 工 业 大 学 ,2013:55-56. XU S Y.The static image compression based on MQ arithmetic coder as the core technology [D].Tianjin:Tianjin Polytechnic University,2013:55-56.

[7] 郑 伟 ,崔 跃 利 ,王 芳. 基 于 小 波 变 换 的 图 像 压 缩 编 码 研 究 综述[J].通信技术,2008,2(41):85-96. ZHENG W,CUI Y L,WANG F.A review of image compression coding based on wavelettransform [J].Communications Technology,2008,2(41):85-96.

[8] 毕 厚 杰 ,王 健 .新 一 代 视 频 压 缩 编 码 标 准 —H.264/AVC[M]. 北京:人民邮电出版社,2009. BI H J,WANG J.A new generation of video compression coding standard-H.264/AVC [M].Beijing:Posts and Telecom Press,2009.

Application of 16 bit image lossy compression based on the JPEG standard

XU Nini,LI Chenguang
School of Electronics and Information Engineering,Tianjin Polytechnic University,Tianjin 300387,China

The principle and detailed process of 16 bit image lossy compression were given.The data of 16 bit image is large and JPEG does not support the 16 bit image compression,which makes it inconvenience in 16 bit image’s storage and transmission.Based on the scheme of JPEG compression,the statistical model was expended(improving the tables of statistical model for DC coefficient coding and statistical model for AC coefficient coding respectively).This made it can deal with the data of 16 bit and realized the ideal of the compression of 16 bit static images.The quantization table used was generated based on the Luminance quantization table in JPEG.The encoder adopted was QM arithmetic encoder.An objective evaluation standard PSNR was chosen to evaluate the quality of the decompressed images.

16 bit image lossy compression,statistical model for DC coefficient coding,statistical model for AC coefficient coding,QM arithmetic encoder

TN911.7

:A

10.11959/j.issn.1000-0801.2016106

徐妮妮(1974-),女,博士,天津工业大学副教授、硕士生导师,主要研究方向为静态图像压缩、视频编码等。

李 晨 光 (1990-), 男 , 天 津 工 业 大 学 硕 士生,主要研究方向为静态图像压缩、视频压缩编码。

2015-10-18;

2016-03-11

猜你喜欢

编码器比特分值
融合CNN和Transformer编码器的变声语音鉴别与还原
一起来看看交通违法记分分值有什么变化
体育考核新方案出炉 项目分值变化大
按病种(病组)分值结算:现状、做法和评价
基于双增量码道的绝对式编码器设计
比特币还能投资吗
比特币分裂
比特币一年涨135%重回5530元
应用旋转磁场编码器实现角度测量
基于数字信号处理的脉冲编码器