基于失真-扩展代价的JPEG图像可逆数据隐藏

2020-11-10王洋洋和红杰张善俊

计算机研究与发展 2020年11期

王洋洋和红杰陈帆张善俊

1(信号与信息处理四川省重点实验室(西南交通大学) 成都 611756)

2(神奈川大学理学部信息科学科日本神奈川県平塚市 2591293)(wyy.wang@foxmail.com)

可逆数据隐藏(reversible data hiding, RDH)[1]是一种特殊的数据隐藏方法，允许用户将附加数据嵌入到载体图像中，且授权用户能够完全可逆地从含密图像中提取嵌入的附加数据并恢复出原始载体图像.RDH要求嵌入数据后可以无差错恢复出原始载体和附加数据[2]，且嵌入的数据对人眼是不可见的，已被应用在数字图像版权认证[3]、存档管理[4]及内容敏感载体，如军事图像、医学图像的内容安全和隐私保护等领域[5].

联合图像专家组(joint photographic experts group, JPEG)是目前互联网上最流行的图像格式之一[6]，其文件小、兼容性好且可通过可变的压缩比控制文件大小，在网络传输和云存储中可节约带宽与存储空间.目前，JPEG图像的RDH有3种常用方法：基于量化离散余弦变换(discrete cosine transform, DCT)系数修改的RDH[7-10]、基于量化表修改的RDH[11-13]和基于霍夫曼表修改的RDH[14-15].其中，第2种方法修改量化表破坏了JPEG文件大小和视觉质量之间的平衡，会导致含密图像的文件大小显著增加；第3种方法能保持较小的JPEG文件，但隐藏容量有限；第1种方法通过修改量化的DCT系数选择一些特定系数用于嵌入附加数据，在保持较小的含密图像文件大小的同时实现较高的隐藏容量和良好的视觉质量，且随着嵌入数据的增加，视觉质量和文件大小能达到很好的平衡.因此，基于DCT系数修改的RDH受到关注，直方图平移(histogram shifting, HS)作为空域RDH的主要嵌入方法之一，在JPEG图像的应用成为DCT系数修改RDH的研究热点[16].下面对JPEG图像的HS算法详细描述.

基于直方图平移的JPEG图像RDH首次由Huang等人[16]提出.在该方案中，量化后的DCT直流(direct current, DC)系数保持不变，生成量化后的DCT交流(alternating current, AC)系数直方图，通过直方图平移技术，将值为“±1”的AC系数作为峰值点扩展以嵌入附加数据，同时保留零AC系数不变.由于“±1”AC系数的高峰值性，该算法最大隐藏容量较其他方案有显著提高.当附加数据长度小于最大隐藏容量时，为减小图像的失真，该算法提出一种嵌入图像块选择策略，根据附加数据的长度自适应选取零AC系数较多的DCT块嵌入数据.基于Huang算法[16]的块选择策略，Wedaj等人[17]提出改进方案，通过直方图平移嵌入附加数据，在嵌入数据达不到最大隐藏容量时，为减少失真，设计一种嵌入频率选择策略.首先计算63个频率的最大隐藏容量与相应的估计失真(即总移位AC系数数量之和与相应位置的量化表元素平方之积)的比值，记为嵌入效率，然后根据嵌入效率对频率排序，优先选取嵌入效率较高的频率嵌入数据.基于上述方案，Hou等人[18]综合考虑嵌入不同频率和DCT块对失真的影响，提出基于模拟失真的嵌入块选择和频率选择策略.嵌入频率选择策略首先计算63个频率的单位模拟失真，然后根据单位模拟失真将所有频率按从小到大排序，嵌入数据时优先选择单位模拟失真较小的频率.选择频率后，从量化DCT块中根据选择的频率提取子块并计算每个子块的模拟失真，具有较小模拟失真的子块将优先用于嵌入数据.

在嵌入数据长度小于最大隐藏容量时，上述基于直方图平移的JPEG图像RDH方案从嵌入不同频率和DCT块的角度分别提出不同的嵌入块和频率选择策略，在保持高隐藏容量的同时能有效减小嵌入数据引起的图像失真，提高了含密图像的视觉质量.但这些方案未考虑嵌入附加数据而导致图像文件大小扩展代价问题.为保证高隐藏容量的同时兼顾含密图像的文件增量和视觉质量，本文提出一种基于失真-扩展代价的JPEG图像RDH算法.在数据嵌入过程中，嵌入频率选择从图像文件增量角度模拟并计算不同频率的单位文件增量并优先选取单位文件增量较小的频率嵌入数据.嵌入块选择时首先根据每个量化DCT块中的零AC系数数量从大到小排序，然后对具有相同零AC系数数量的DCT块再计算其平滑度并依此重排序，并优先在平滑块嵌入数据.实验结果表明，本文算法兼顾文件增量和视觉质量，在降低图像文件增量的同时保持较高的视觉质量.

1 基于失真-扩展代价的JPEG图像RDH

本文算法主要包括2部分：1)基于自适应频率和块选择的数据嵌入;2)数据提取与图像恢复.

1) 基于自适应频率和块选择的数据嵌入.重点研究如何根据嵌入容量自适应选择嵌入频率和图像块，以最小化数据嵌入引起的含密图像视觉失真和文件增量.原始JPEG图像Io解码得到DCT块，根据频率选择策略和块选择策略对频率和块排序得到嵌入频率排列Pe和嵌入块排列Be，根据嵌入容量按Pe和Be的排列顺序选择频率和块通过直方图平移嵌入数据，JPEG编码后生成含密图像Ie.

2) 数据提取与图像恢复.含密JPEG图像Ie解码得到DCT块，直方图平移提取嵌入数据并恢复原始DCT块，JPEG编码后恢复原始图像.下面对算法按2个部分详细描述.

1.1 基于自适应频率和块选择的数据嵌入

数据嵌入过程，对量化DCT系数执行3步操作：根据嵌入频率选择策略选取数据嵌入的频率；根据嵌入块选择策略选择数据嵌入的图像块；通过HS根据嵌入容量实现自适应选择频率和块嵌入数据.上述3步骤具体操作描述为：

1) 根据文件增量模拟选择嵌入频率

Fig. 1 Comparison of DCT block before and after embedding data

基于HS在非零AC系数中选择±1AC系数嵌入数据，此时±1AC系数被扩展携带附加数据，其他非零AC系数移位1，而其他非零AC系数的移位是无效移位，选取无效移位小的频率嵌入数据可降低含密图像的视觉失真和文件增量.非零AC系数通过HS嵌入数据不影响(RS,V)(中间格式)的数量，且游程R不变，仅AC系数值V可能变.尺寸S为V的VLI编码码长，S可能发生变化，在V=±(2N-1)，N=1,2,3…时嵌入数据后S+1.

为了更详细说明数据嵌入前后的JPEG比特流变化，下面通过一个例子说明.如图1(a)表示一个原始8×8DCT块，zigzag扫描后AC系数游程编码的中间格式为(01,1),(12,3),(03,4),(41,-1),(EOB).其中，EOB表示块的结束.嵌入数据后，部分AC系数被修改，如图1(b)所示，此时中间格式变为(01,1),(13,4),(03,5),(42,-2),(EOB).可看出当V为3和-1时，S由2变为3，由1变为2.熵编码阶段对RS执行霍夫曼编码，V执行可变长度编码.通过分析可看出是(13,4)和(42,-2)导致JPEG比特流增长，(03,5)不会.因此，JPEG比特流增长与2个因素有关：当V=±(2N-1)时V变化引起对V进行可变长度编码时的增长和S变化引起对RS进行霍夫曼编码时的增长.

熵编码阶段RS执行霍夫曼编码，R(0≤R≤15)取不同值嵌入数据时引起的比特流增长不同，这与AC系数熵编码有关.基于AC系数霍夫曼编码表及VLI编码表设计实验，计算当游程长度R不同，且AC系数值V增加导致尺寸S变化时的熵编码长度差值.通过实验测试，不同游程时的比特增长统计如表1所示:

Table 1 Statistics of Bitstream Increase in Different Run

表1中R表示游程长度，|V|表示VLI编码时不同S的临界值的绝对值，V=±(2N-1)，对于256级灰度图像1≤N≤8，游程长度为R，且AC系数值处于临界时，值V增加会导致尺寸S变化，熵编码后比特长度发生变化，表1中数据即表示S变化时导致的比特增长.可看出，在嵌入±1AC系数时，R越大，比特流增长越多，因此，嵌入数据时应优先选择R较小的系数.

上述分析从JPEG编码方面解释了数据嵌入引起比特流增长的原因，下文将提出基于文件增量模拟的频率选择策略.频率选择时，首先根据表1的统计结果模拟嵌入数据到所有DCT块中不同频率处引起的文件增量G(u,v)，然后计算单位文件增量UG(u,v)，最后优先选择单位文件增量小的频率嵌入数据.

Fig. 2 Image block distribution with the same number of zero AC coefficients of Lena image with QF=70

假设嵌入数据全为“1”，第n个DCT块中频率(u,v)由于嵌入数据引起的文件增量In1(u,v)表示为

(1)

其中，1≤n≤num，num为8×8 DCT块数量，u和v为DCT块的频率且满足0≤u≤7，0≤v≤7，L[R(S+1)]表示值为±1的AC系数嵌入数据后RS经霍夫曼编码后的比特流长度，L(RS)表示值为±1的AC系数原始RS经霍夫曼编码后的比特流长度，1为嵌入到±1AC系数时VLI编码引起的比特增量.在AC系数值为±1时，S=1，In1(u,v)可用1+[L(R2)-L(R1)]表示.

In1(u,v)为嵌入数据引起的文件增量，第n个DCT块频率(u,v)无效移位引起的文件增量In2(u,v)表示为

(2)

其中，N=±2,±3,±4……表示除±1之外的其他非零AC系数.

根据In1(u,v)和In2(u,v)可得到不同频率的模拟文件增量G(u,v)

(3)

根据所有DCT块中不同频率的有效载荷C(u,v)和模拟文件增量G(u,v)，计算单位文件增量UG(u,v):

(4)

不同频率的UG(u,v)计算完成后，根据UG(u,v)从大到小的顺序对63个频率排序，数据嵌入时优先选择UG(u,v)较小的频率.

2) 根据块平滑度选择嵌入图像块

嵌入块选择时，首先根据每个DCT块中零AC系数数量从大到小排序；然后再针对相同零AC系数个数的块计算不同块的平滑度并根据平滑度进行重排序；最后优先选取较平滑的图像块嵌入附加数据.

Huang算法的嵌入块策略时仅根据每个DCT块中的零AC系数数量排序，再根据嵌入量确定阈值选取零AC系数数量大于该阈值的块嵌入数据.这种方法未考虑到零AC系数数量相同的图像块有很多的情况，选取平滑图像块不精确.如图2表示质量因子为70的Lena图像中零AC系数个数相同的图像块的个数分布，可看出零AC系数数量为59的图像块最多有400个，因此仅通过零AC系数数量判断平滑块是不准确的.针对这个问题，本文提出一种更加精确的图像块平滑度计算公式.

由于原始图像经DCT变换后能量大部分集中在左上角DC系数上，其他频率变得很小，且直方图平移嵌入仅在AC系数中嵌入数据，DC系数不发生变化，因此为保证算法的可逆性，每个DCT块中的DC系数被用来计算图像块(i,j)的平滑度S(i,j):

(5)

其中，DC(i,j)表示图像块(i,j)的DC系数，N表示(i,j)的4个相邻块(UP，RT，DW和LF)个数，具体4个相邻块位置如图3所示.N(i,j)分别对应UP坐标(i-1,j)，RT坐标(i,j+1)，DW坐标(i+1,j)和LF坐标(i,j-1).DC(i′,j′)为对应位置图像块的DC系数.

Fig. 3 Adjacent block diagram of smoothness calculation

3) 数据嵌入步骤

CCUS（碳捕集、利用和封存）是近年来国际社会应对气候变化的热点问题。数据显示，近150年左右，大气中的二氧化碳含量大幅度增长，由工业革命前的280mg/L上升至目前的396mg/L，导致全球气温上升。全球碳捕集研究院发布报告预警称，如果碳排放没有大幅度减少，预计到本世纪末全球升温超过2℃，极端天气和自然灾害将更加频发。

数据嵌入时，首先对原始JPEG图像Io解码；然后分别根据嵌入频率和块选择策略选择嵌入频率和图像块；最后通过HS嵌入数据后编码生成含密JPEG图像Ie.具体操作描述为：

步骤2. 嵌入频率排序.根据嵌入频率选择策略计算不同频率(u,v)的单位文件增量UG(u,v)；然后根据UG(u,v)从大到小的顺序对全部频率排序得到频率排列Pe.

(6)

其中，F(u,v)表示频率为(u,v)的原始DCT系数，F′(u,v)为嵌入数据后的系数，b∈{0,1}为附加数据.

1.2 数据提取与图像恢复

步骤2. 提取辅助信息.从JPEG头文件APPn字段提取辅助信息，包括附加数据长度L、选取的最后一个嵌入块在Be中的排列位置Plb和嵌入频率Pec.

(7)

(8)

其中，F′(u,v)表示频率为(u,v)的含密图像DCT系数，F″(u,v)为恢复的DCT系数.

2 实验与结果

Fig. 4 Four test images

本节通过实验分析本文算法性能.实验中秘密数据随机生成，测试图像从图像库[19]选取4幅大小为512×512的JPEG灰度图像,如图4所示：Lena,Baboon,Airplane和Man，质量因子(quality factor,QF)分别取70,80,90，使用IJG工具箱[20]优化的霍夫曼表压缩.主要从含密图像的文件扩展、视觉质量和算法时间复杂度3方面对本文算法对比分析.其中，通过计算原始图像和含密图像之间的峰值信噪比(peak signal to noise ratio，PSNR)作为评估含密图像视觉质量的度量，单位为dB；文件扩展用含密图像文件增量(increased of file size，IFS)和单位数据嵌入增量(unit increase of file size，UIFS)衡量，IFS计算为

IFS=Se-So，

(9)

其中，Se为嵌入C位数据后的JPEG图像Ie的文件大小，So为原始JPEG图像Io的文件大小.因此单位数据嵌入增量UIFS为

(10)

2.1 图像文件扩展

JPEG图像RDH方案中，含密图像的文件增量是一个重要的算法性能评估指标，文件增量越小，说明嵌入数据前后载体图像的文件尺寸变化越小，利于网络传输的同时也可提高数据隐藏的安全性，相应算法性能越好.为验证本文算法性能，选择Huang算法[16]和Hou算法[18]进行比较分析.4幅测试图像在不同质量因子和嵌入容量时的性能对比如表2所示.图5～7以Lena,Baboon,Airplane图像为例，给出不同质量因子和嵌入容量的单位增长量对比图.其中横坐标表示嵌入容量C，纵坐标表示单位文件增长UIFS.可以看出，本文算法能够有效降低含密图像的单位文件增长，在降低图像文件扩展方面，优于Huang算法和Hou算法，且嵌入数据越多，文件增量越大.另外，随着质量因子的增加，本文算法优势更大，质量因子为90时本文算法的单位文件增长平均值较Huang算法和Hou算法降低0.15～0.25.主要原因是，Huang算法选择嵌入图像块时仅根据每块中零AC系数数量对所有块排序，根据提出的自适应块选择策略选取零AC系数较多的块嵌入数据，但忽略了每块中不同频率的修改成本不同问题，选择在全部频率嵌入数据必定会使嵌入数据引起的视觉失真增大，也会增大含密图像的文件增量.而本文算法根据频率选择策略对不同频率的失真扩展代价进行模拟，嵌入数据时优先选取模拟文件增量较小的频率嵌入，而不是全部频率嵌入，因此本文算法文件增量更小；另外，Hou算法的块选择和频率选择策略仅从视觉失真的角度对嵌入不同块和频率造成的视觉失真进行模拟，嵌入数据时优先选取单位模拟失真较小的块和频率位置，却没有考虑图像文件扩展代价问题.而本文算法的频率选择策略模拟不同频率的单位文件增量，且嵌入块选择时引入更精确的平滑度计算公式，优先选取单位文件增量较小的频率和较平滑的块嵌入数据，因此本文算法文件增量更小.

Table 2 Performance Comparison of Four Test Images with Different Effective Embedding Payloads

Fig. 5 Comparison of UIFS of marked Lena image under different embedding payloads

Fig. 6 Comparison of UIFS of marked Baboon image under different embedding payloads

Fig. 7 Comparison of UIFS of marked Airplane image under different embedding payloads

Fig. 8 Comparison of UDIR of marked Lena image under different embedding payloads

Fig. 9 Comparison of UDIR of marked Baboon image under different embedding payloads

Fig. 10 Comparison of UDIR of marked Airplane image under different embedding payloads

2.2 视觉质量与文件增量的平衡

含密图像的视觉质量是衡量算法性能的重要指标之一，通常用PSNR度量.PSNR越高，说明含密图像视觉质量越好，数据隐藏的安全性也越高，相应的算法性能越好.从表2可以看出，嵌入容量越大，含密图像的PSNR越小；质量因子越大，含密图像的PSNR越大.由此可见，用户可通过嵌入较少的数据或采用质量因子较高的JPEG载体图像以获得较好的含密图像视觉质量.

一个好的JPEG图像可逆信息隐藏算法，应该综合考虑含密图像的视觉质量和文件增量.为定量比较算法兼顾视觉质量和文件扩展的性能，定义单位失真-增长比(unit distortion-increase ratio，UDIR)为

(11)

其中，Io和Ie分别为嵌入数据后的JPEG图像和原始JPEG图像.分子用来评价嵌入数据后载体图像的质量或失真(即PSNR)，其值越小表示含密图像失真越大，分母UIFS是根据式(10)计算得到的单位数据嵌入增量.视觉失真越小(即PSNR越高)，单位文件增量越小，对应的UDIR值越大，说明视觉质量和文件扩展之间的兼顾性越好，相应的算法性能越好.

图8～10以Lena,Baboon和Airplane图像为例，给出不同质量因子和嵌入容量的UDIR，并与Huang算法和Hou算法对比.其中横坐标表示嵌入容量C，纵坐标为单位失真-增长比UDIR.可看出，本文算法UDIR高于Huang算法和Hou算法，说明本文算法在含密图像视觉质量和文件增量之间的兼顾性能更好.主要原因是，Huang算法仅通过每块中零AC系数数量对所有块排序并根据嵌入容量自适应选取，而本文算法在Huang算法的基础上引入平滑度计算公式，提高了图像块平滑度衡量的精确度，同时在模拟文件增量较小的频率嵌入数据，减少了直方图平移无效移位引起的失真，因此本文算法兼顾性能更好.另外，Hou算法的嵌入块选择和频率选择策略都是根据模拟数据嵌入数据引起的视觉失真选择模拟失真较小的块和频率嵌入数据，仅考虑降低视觉失真，在文件增量方面未进行有效控制，因此本文在文件增量方面和含密图像视觉质量和文件增量的平衡兼顾方面均优于Hou算法.

2.3 算法时间复杂度

JPEG图像RDH算法主要包括数据嵌入和数据提取与图像恢复2个阶段，算法的运行速度决定了该算法的现实意义，时间复杂度低的算法更适用于现实的应用场景.本文算法采用直方图平移的数据嵌入方法，下面对本文数据嵌入算法的时间复杂度分析，并选取同样采用直方图平移嵌入方法的Huang算法和Hou算法作对比.实验运行环境如下：软件系统为Windows10操作系统(家庭中文版)、MATLAB 2016a；硬件配置为Intel®CoreTMi7-8700 CPU@3.2 GHz 3.19 GHz，8.00 GB内存(7.9 GB可用)，64 b操作系统.

实验测试图像为大小512×512的pgm灰度图像，采用IJG工具箱[20]压缩，取质量因子为70,80和90，嵌入10 000 b数据，运行时间统计10次求取平均值，实验结果如表3所示.

可以看出，Huang算法运行时间最短，主要原因是Hou算法是通过穷举所有频率的方式求最优解，而Huang算法则是一次求解.本文算法是对Hou算法的改进，在质量因子为70,80和90时的平均运行时间为5.01 s,5.1 s和5.29 s，另外在纹理图像数据嵌入运行时间比平滑图像长，平均运行时间较Hou算法降低71.66%.

Table 3 Comparison of Time Complexity of Data Embedding Algorithms

3 总结

本文提出一种基于失真-扩展代价模拟的JPEG图像可逆信息隐藏算法.本文算法的嵌入频率选择策略从图像文件扩展代价方面计算不同频率的单位模拟文件增量并优先选取单位模拟文件增量较小的频率嵌入数据；嵌入块选择时考虑视觉失真问题首先根据每块中零AC系数数量排序，对于具有相同零AC系数数量的块计算其平滑度并重排序，优先选取平滑块嵌入数据.实验结果表明：本文算法在含密图像的文件增量和视觉质量的兼顾性能优于现有算法，有效降低含密图像文件增量的同时保持较高的视觉质量.