APP下载

简洁的JPEG图像隐写DCT系数选择方案和安全性增强策略

2016-11-03王康刘琲贝刘烁炜胡永健

网络与信息安全学报 2016年9期
关键词:子块容量框架

王康,刘琲贝,刘烁炜,胡永健

(华南理工大学电子与信息学院,广东 广州 510641)

简洁的JPEG图像隐写DCT系数选择方案和安全性增强策略

王康,刘琲贝,刘烁炜,胡永健

(华南理工大学电子与信息学院,广东 广州 510641)

根据图像JPEG压缩的特点,提出了一种简洁有效的DCT系数选择方案,不仅充分利用了非零交流DCT系数,而且还用到部分零值DCT系数;此外,通过改变系数的嵌入顺序,优先考虑低频系数,改善了算法的安全性。实验表明,将2种典型的空域隐写算法(EPES和APPM)应用到所提出的算法框架,获得了比3种经典压缩域隐写算法(JSteg、F5和nsF5)和新近提出的基于STC框架的DCT域隐写算法(LPD)更大的嵌入容量及更好的安全性。所提出的DCT系数选择和嵌入框架可有效提升嵌入容量和抗隐写分析的性能,且所提方案具有通用性,可应用于不同隐写算法。

图像信息隐藏;JPEG;低频优先;嵌入容量;安全性

1 引言

JPEG图像是目前使用最广泛的图像格式,也是隐写术最实用的载体之一。例如,经典的JPEG域隐写算法JSteg直接将非零DCT系数的最低位替换为密信序列。虽然这种算法嵌入方式简单,但含密图像的DCT系数存在值对现象,容易被隐写分析算法检测出来,安全性较低。F5算法[1]是一种基于汉明码的矩阵编码算法,通过减小DCT系数的绝对值来嵌入密信,同时引入矩阵编码和随机置乱的思想,将密信均匀嵌入到不同的单元中,提高了算法的安全性。不过F5算法在嵌入密信的过程中会减少DCT系数的绝对值,使DCT系数的分布整体下沉,0值DCT系数大量增加,给算法的安全性带来了一定的影响,同时该算法还存在无效收缩(shrinkage)的现象,降低了算法的性能。Fridrich[2]在F5算法和湿纸编码的基础上提出了nsF5(no shrinkage F5)算法,利用湿纸编码算法通信信道不对等的特性消除了F5算法存在的无效收缩现象,获得了更好的嵌入安全性。Filler等在文献[3]中提出了一种伴随式网格编码算法(STC, syndrome trellis coding),可在编码的过程中结合损失函数来嵌入密信,在最小化整体嵌入损失的前提下获得接近理论上限的嵌入效率。目前已有不少基于STC框架的DCT域隐写算法,如文献[4]提出一种基于优化模型(MOD, model optimized distortion)的嵌入损失设置方式;文献[5]利用DCT分块内相邻系数和相邻块间同位置系数来对系数值进行线性预测,并将预测误差作为嵌入失真的依据,预测误差越大的系数,嵌入损失越小(LPD, linear prediction distortion),获得比MOD算法更好的安全性。Holub等在文献[6]中提出UNIWARD(universal wavelet relative distortion)算法,利用载体图像的小波系数来设置嵌入损失。文献[7,8]提出为了使隐写前后DCT系数的统计特征变化最小,应在均匀选择不同幅值的系数进行嵌入。此外,文献[9]借助未压缩图像的辅助信息来设计隐写损失函数。

虽然基于STC编码框架的DCT域隐写算法获得了较好的嵌入效果,但是这种框架下的算法一般具有较高的运算复杂度。本文提出了一种新的简洁有效的DCT系数选择方案,在保证图像质量的前提下,不仅充分利用了非零交流DCT系数,而且还用到部分0值DCT系数,因此具有更多的嵌入位置;此外,为提高算法的安全性,通过修改密信嵌入顺序,采用低频优先的嵌入策略,改善算法的安全性。为了验证本文系数选择和嵌入顺序方案的普适性,本文将2种流行的空域隐写方案(EPES[10]和APPM[11])应用于所提出的算法框架,获得了比JSteg、F5、nsF5以及LPD更大的隐写容量和更好的安全性,与以UNIWARD为代表的基于STC编码框架的隐写算法相比则有更低的复杂度。

2 方案1:新的DCT系数选择方案

传统的DCT域隐写算法,如JSteg、F5等,仅在非零交流DCT系数上嵌入密信(以下简称为传统系数选择方案)。由于自然图像经过JPEG压缩后大部分交流DCT系数值为0,往往会导致传统系数选择方案下的隐写算法容量相对较小。此外,为保证正确抽取密信,不少DCT域隐写算法也会损失一部分可用DCT系数,如F5算法的收缩现象和JSteg算法不在值为1的DCT系数上嵌入密信,这些做法进一步降低了隐写算法的容量。

考虑到JPEG压缩对交流DCT系数采用的是行程长度编码,DCT子块会有很多连续的零值,修改零值交流DCT系数会对JPEG压缩算法的压缩效率造成一定的影响。但分析图1发现,量化后的DCT系数块中较长的连续0值一般只分布在高频部分,JPEG行程长度编码主要对这部分系数有较好的压缩效果,而低频部分的零值DCT系数一般比较分散,因此修改低频部分的零值系数对JPEG压缩的影响较小。

据此,本文提出一种新的DCT系数选择方案(以下简称为方案1),通过对载体图像进行预扫描来获取载体图像所有可嵌的DCT系数。为了将现有的典型空域隐写算法直接扩展到DCT域上,提出分别利用正负DCT系数的原码和补码来嵌入密信。方案1具体描述如下。

图1 图像某个8×8子块的DCT系数

1) 对载体图像第i个8×8子块的DCT系数,按zigzag扫描找到最后一个非零交流 DCT系数iB(如图1(b)所示,iB为第8行第3列斜体的-1)。

2) 根据图1(c)中DCT系数在zigzag扫描顺序下的对应下标,记录iB对应的下标id(如图1(b)中的iB对应的下标id为48),并将子块中下标小于id的交流DCT系数抽取出来,作为该子块的可嵌DCT系数。

3) 对每个子块重复步骤1)和步骤2),得到载体图像所有的可嵌DCT系数。

4) 利用选定的隐写算法,将密信嵌入到可嵌DCT系数的原码和补码上。

值得注意的是,在步骤2)中,为了保证接收方提取密信的系数位置和发送方嵌入密信的系数位置一致,在嵌密时不修改最后一个非零DCT系数iB的值,以确保iB的位置在嵌入密信和提取密信时保持一致,即总是抽取子块中下标小于id的交流DCT系数来嵌入和提取密信。

与传统系数选择方案相比,方案1除了有更多的可嵌DCT系数外,还不会出现无效嵌入的情况,以JSteg算法为例,方案1利用了JSteg抛弃1以及部分的0值交流系数。

3 方案2:低频优先的DCT系数嵌入方案

为提高算法的安全性,本文提出改变密信嵌入的顺序,即选择同一频率下的交流系数进行嵌入,且从最低频率位置开始(以下简称为方案2)。具体方案如下。

1) 对图像每个8×8子块的交流DCT系数按照zigzag扫描的顺序从低频到高频分配63个不同的嵌入优先级P( P=1,2,…,63),如图2(a)所示,P越小优先级越高。

2) 取出所有子块中优先级P=1的非零DCT系数。

3) 继续依次取出优先级P=2,…,63的所有子块的非零DCT系数,得到图像最终的待嵌系数序列。

4) 利用选定的隐写算法,将密信嵌入到待嵌DCT系数的原码和补码上。

图2 DCT系数优先级分布图(低频优先)

4 方案1和方案2的融合

根据第2节和第3节的分析,将方案1和方案2进行融合,得到完整的DCT系数选择和嵌入框架。

4.1 嵌入密信过程

嵌入密信过程如下:

1) 读取载体图像量化后的DCT系数;

2) 根据密钥k以 8×8子块为单位进行混洗,块内系数不混洗;

3) 找到每个8×8子块在zigzag扫描顺序下的最后一个非零DCT系数Bi和下标di;

4) 依次取出优先级P( P=1,2,…,63)的所有子块的可用系数(若子块i最后一个非零交流系数Bi在zigzag扫描顺序下的对应下标di有di>P,则该子块中优先级为P的系数可用,否则系数不可用),得到待嵌序列S;

5) 利用选定的嵌入算法在待嵌序列S的原码和补码上嵌入密信M,得到含密序列S′;

6) 利用含密序列S′恢复DCT系数矩阵,得到含密图像。

4.2 提取密信过程

提取密信过程如下:

1) 读取含密图像量化后的DCT系数;

2) 根据密钥k以8×8子块为单位进行混洗,块内系数不混洗;

3) 找到每个8×8子块在zigzag扫描顺序下的Bi和di;

4) 依次取出优先级P( P=1,2,…,63)的所有子块的可用系数(和嵌入过程相同),得到含密序列S′;

5) 利用提取算法在含密序列S′的原码和补码上提取密信M。

5 实验结果与分析

5.1 2种典型空域隐写算法介绍

为了证明本文系数选择和嵌入顺序方案的普适性,选择2种流行的空域隐写方案EPES (efficient high payload ±1 data embedding scheme)[10]和APPM(adaptive pixel pair matching)[11]进行实验。下面首先简单回顾这2种算法。

1) EPES算法

EPES算法是Omoomi等[10]于2011年提出的一种LSBMR改进算法,原文直接用于空域图像。在DCT域上使用时,可以利用长度为l的DCT系数的最低位和次低位之间的关系来嵌入密信,其中负DCT系数通过补码来找最低位和次低位,主要过程如下。

负整数的补码和正整数原码类似,负奇整数补码的最低有效位为1,负偶整数补码的最低有效位为0,假设bi( x)表示x(x为正DCT系数的原码或负DCT系数的补码)的第i+1个比特,则bi( x)有以下3个性质。

为了能够利用l个交流DCT系数之间的关系来嵌入l位密信,和文献[7]类似,定义一个描述系数次低LSB位和最低LSB位关系的二值函数B( u, v)。

由性质1和性质2,可以推出B(u, v)函数具有如下2个性质。

嵌入密信:将(x1, x2,…,xl)修改为(y1, y2,…, yl)使式(2)成立。

提取密信:利用式(2),从(y1, y2,…,yl)中提取密信(m1, m2,…,ml)。

2) APPM算法

APPM算法是Hong等[11]于2012年提出的一种像素对自适应匹配嵌入方法,可以嵌入任意进制表示的密信,具有较高的嵌入效率和嵌入容量,其嵌入算法对DCT系数同样适用,主要过程如下。

首先对于给定的进制B和已知预嵌密的系数对(x, y),定义特征函数f( x, y)=(x+CBy)mod B ,采用最小均方差的标准,利用最优化问题获得最优的CB和ΦB(x, y)(用ΦB(x, y)表示B个系数对(xi,yi),即代表(x, y)的邻域集)

嵌入密信:通过特征函数f( x, y)计算菱形特征值(DCV, diamond characteristic values),搜索ΦB(x, y)邻域里的每一个DCV值,当满足f( x′, y′)=sB时,ΦB(x, y)邻域中的坐标(x′, y′)将代替(x, y),从而完成一个B进制密信的嵌入。

提取密信:采用嵌入过程同样的顺序,对各个系数值扫描。系数值对(x′, y′)的DCV值便是需要提取出来的密信。

如果通信电缆沟中布设的人孔井数量较少,在实际作业期间,可以在原观测点处,完成相应的埋设,也可以通过现浇的方式,制作独立水泥观测墩,通过对其进行应用,完成相应的观测工作[6]。

5.2 方案1的实验

为了验证方案1的合理性,分别利用传统系数选择方案和方案1来选择待嵌系数,然后进行密信嵌入,分析嵌密图像的差异。

1) 对嵌入容量的提升

在NRCS图像库[12]中随机选取100幅 TIF格式的图像,将其压缩成JPEG图像(质量因子Q=80),分别计算所有图像在传统系数选择方案和方案1下可修改DCT系数的个数。然后以5.1节中的EPES算法为例,分别计算2种方案下算法的嵌入容量。

由图3可知,与传统系数选择方案相比,本文提出的方案1可修改的DCT系数个数大大增加,隐写容量也相应地大幅度提高。同时,在传统系数选择方案下,当EPES算法将绝对值为1的交流系数修改为0时会出现无效嵌入,这时必须对密信进行重复嵌入,造成了系数值的浪费,降低了算法的容量;而在方案1下不会出现这样的现象。

图3 2种系数选择方案下可修改DCT系数、隐写容量比较

2) 对安全性的增强

对NRCS图像库中1 574幅大小为512×512的TIF图像,将其压缩成JPEG图像(质量因子Q=80),在2种系数选择方案下,利用EPES算法以0.1 bpnz、0.2 bpnz嵌入率嵌入密信,然后利用Chen486[13]特征进行攻击,检测的ROC曲线如图4所示。由图4可知,方案1具有更好的隐写安全性,这主要是因为方案1不会出现无效嵌入,故在相同的嵌入率下修改的系数个数要少。

图4 传统系数选择方案和方案1的安全性对比

5.3 方案2对算法安全性的提升

同样选取NRCS图像库中的1 574幅图像作为隐写载体,在0.1 bpnz和0.2 bpzn嵌入率下分别采用传统系数选择方案和方案2来选择待嵌序列,并同样以EPES算法为例来嵌入密信,然后利用chen486算法对含密图像进行分析,结果如图5所示。由图5可知,方案2修改嵌入顺序的做法确实提高了算法的安全性。

5.4 与代表性算法的比较

将5.1节中2种现有的典型空域隐写算法(EPES算法和APPM算法)直接应用于4.1节所描述的算法框架,与JSteg、F5、nsF5及LPD这4种DCT域隐写算法进行比较,考察其一般性能。此时,EPES的参量4l=,APPM采用5进制。

1) 算法容量的比较

实验随机选取NRCS图像库中50幅尺寸为512×512、存储为TIF格式的灰度图像,取质量因子为80,分别计算JSteg、F5、nsF5、LPD、本文框架下EPES(以下称Adopted-EPES)和APPM(以下称Adopted-APPM)算法的嵌入容量。

图5 传统系数选择方案和方案2的安全性对比

由于JSteg算法仅在值不为1的非零交流DCT系数上嵌入密信,F5算法在满嵌时退化为F4算法,在绝对值为1的交流系数上嵌入密信时会有50%的概率出现收缩现象,如图6所示,这2种算法的容量大致相等且均相对较低。nsF5算法和LPD算法类似,在所有非零交流DCT系数上嵌入密信,且不存在收缩现象,因而算法的容量比JSteg和F5大。而Adopted-EPES算法和Adopted-APPM算法均有更大的嵌入容量。Adopted-APPM算法的嵌入容量要大于Adopted-EPES算法,这主要和APPM算法的特点相关。

图6 6种DCT域隐写算法的容量比较

2) 抗隐写分析攻击能力评估

安全性是评估隐写算法性能的重要指标之一。选用Chen486(486维)和CF(7 850维)[14]这2种常用的DCT域通用隐写分析算法来评估隐写算法的安全性。隐写分析算法Chen486通过计算DCT系数块内和块间的转移概率矩阵来提取特征,是一种针对JPEG图像强有力的通用型隐写分析算法。CF7850是Kodovsky等[14]提出的一种较高维度DCT域通用隐写分析算法,对含密图像有着更好的检测效果。实验在NRCS图像库中进行,包含1 574幅大小为512×512的TIF格式的灰度图像,JPEG压缩的质量因子设置为80。

图7 不同嵌入率下Chen486算法检测的ROC曲线

图7显示了Chen486对6种隐写算法(JSteg、F5、nsF5、LPD、Adopted-EPES和Adopted-APPM算法)检测的ROC曲线。在图7(b)~图7(d)中,本文Adopted-EPES和Adopted-APPM算法ROC曲线都偏向于右下,即使在嵌入率为0.1 bpnz的图7(a)中也只有LPD算法的ROC曲线与本文2种算法基本重合,其他算法的ROC曲线均偏于左上,说明在本文隐写算法框架下,2种算法抗隐写分析攻击能力优于其他4种算法。尤其在嵌入率为0.1 bpnz和0.2 bpnz时,Chen486的检测曲线差不多是45°的斜线,说明检测几乎失效。至于Adopted-EPES和Adopted-APPM本身,两者在嵌入率为0.1 bpnz和0.2 bpnz时抗攻击性能相当;而在嵌入率为0.4 bpnz和0.8 bpnz时,Adopted-APPM性能要优于Adopted-EPES,这主要和APPM及EPES本身的工作原理有关。

图8显示了CF7850对5种隐写算法检测的ROC曲线。无论是图8(a)还是图8(b),本文框架下的2个算法的ROC曲线都偏向于右下,依然说明本文隐写算法框架下的2个算法其抗隐写分析攻击能力优于其他3种算法。此外,由图7(b)和图8(b)对比可知,CF7850比Chen486具有更优的检测性能。

本文也和基于STC编码框架的UNIWARD隐写算法进行了比较。表1显示UNIWARD算法的安全性很高,在5种嵌入率下基本上都优于本文的Adopted-EPES和Adopted-APPM算法。然而,本文方法与UNIWARD相比主要优势在于计算复杂度大大降低。在硬件配置为RAM 8 GB、主频为3.3 GHz、软件平台为Matlab 2015b时,在大小为512×512的载体图像上以0.4 bpnz的嵌入率嵌入密信,UNIWARD算法平均每幅图像需要4.86 s,而本文算法仅需要约0.11 s。

图8 不同嵌入率下CF7850算法检测的ROC曲线

表1 UNIWARD、Adopted-EPES和Adopted-APPM算法在chen486攻击下的正检率

6 结束语

针对目前DCT域隐写算法在容量和安全性方面的局限,提出了一种扩容和增强安全性的DCT系数选择框架。为了验证这个框架的有效性,将2种现有的空域算法(EPES和APPM)应用到这个框架。实验证明,可获得比其他经典隐写算法更大的嵌入容量和更好的安全性,且与最新的基于STC编码框架的隐写算法相比仅需极小的运算量。本文的2个隐写范例也表明,所提出的框架具有广泛的适用性,可以较容易地把针对空域像素嵌入的方案直接推广到这个框架。

[1] WESTFELD A. F5-A steganographic algorithm high capacity despite better steganalysis[C]//The 4th Information Hiding International Workshop. 2001: 289-302.

[2] FRIDRICH J, PEVN T, KODOVSKY J. Statistically undetectable jpeg steganography: dead ends challenges, and opportunities[C]// The Workshop on Multimedia & Security. 2007:3-14.

[3] FILLER T, JUDAS J, FRIDRICH J. Minimizing additive distortion in steganography using syndrome-trellis codes[J]. IEEE Transactions on Information Forensics & Security, 2011, 6(3):920-935.

[4] FILLER T, FRIDRICH J. Design of adaptive steganographic schemes for digital images[C]//SPIE Electronic Imaging, Media Watermarking, Security, and Forensics XIII 2011: 1-14.

[5] WANG C, NI J, WANG C. New distortion metric for efficient JPEG steganography using linear prediction[J]. Journal of Signal Processing Systems, 2015, 81(3): 389-400.

[6] HOLUB V, FRIDRICH J, DENEMARK T. Universal distortion function for steganography in an arbitrary domain[J]. Eurasip Journal on Information Security, 2014(1):1-13.

[7] GUO L, NI J, SHI Y. Uniform embedding for efficient JPEG steganography[J]. IEEE Transactions on Information Forensics and Security , 2014: 814-825.

[8] GUO L. Using statistical image model for JPEG steganography:uniform embedding revisited[J]. IEEE Transactions on Information Forensics and Security ,2015,10(12): 1.

[9] HUANG F, et al. Distortion function designing for JPEG steganography with uncompressed side-image[C]//The first ACM Workshop on Information Hiding and Multimedia Security. 2013.

[10] OMOOMI M, SAMAVI S, DUMITRESCU S. An efficient high payload ±1 data embedding scheme [J]. Multimedia Tools and Applications, 2011, 54(2): 201-218.

[11] HONG W, CHEN T. A Novel data embedding method using adaptive pixel pair matching[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(1):176-184

[12] United States Department of Agriculture. Natural resources conservation service photo gallery[EB/OL]. http://photogallery.nrcs. usda.gov.

[13] CHEN C, SHI Y. JPEG image steganalysis utilizing both intrablock and interblock correlations[C]//IEEE International Symposium on Circuits and Systems. 2008: 3029-3032.

[14] KODOVSKY J, FRIDRICH J, HOLUB V. Ensemble classifiers for steganalysis of digital media[J]. IEEE Transactions on Information Forensics & Security, 2012, 7(2):432-444.

王康(1992-),男,湖南常德人,华南理工大学硕士生,主要研究方向为多媒体信息隐藏。

刘琲贝(1980-),女,广东广州人,博士,华南理工大学讲师,主要研究方向为多媒体信息隐藏、多媒体信息取证。

刘烁炜(1991-),男,湖南郴州人,华南理工大学博士生,主要研究方向为多媒体信息隐藏。

胡永健(1962-),男,湖北武汉人,博士,华南理工大学教授,主要研究方向为多媒体信息隐藏、多媒体信息取证、图像处理、模式识别。

Succinct scheme of DCT coefficient selection towards
enhanced security of JPEG image steganography

WANG Kang, LIU Bei-bei, LIU Shuo-wei, HU Yong-jian
(School of Electronic and Information Engineering, South China University of Technology, Guangzhou 510641, China)

Based on the characteristics of JPEG compression, a succinct and effective scheme of DCT coefficients selection was proposed, in which not only the non-zero AC coefficients but also part of the zero coefficients were exploited. Moreover, the scheme embedded messages in a different order than the conventional practice and gave priority to the low frequency coefficients so as to achieve enhanced security. The embedding manners of two typical steganographic algorithms (EPES and APPM)were extended from the spatial to the compression domain and the proposed scheme was applied to them for coefficient selection and embedding. Experimental results showed that larger capacity and better security were achieved compare to three classical steganographic algorithms (JSteg, F5 and nsF5) and one current steganographic algorithm based on STC framework (LPD). The proposed coefficient selection and embedding scheme can effectively improved the performance of some classic DCT domain steganographic methods in terms of capacity and security. The scheme was general and could be easily applied to different steganography methods.

image data hiding, JPEG, low frequency priority, embedding capacity, security

s: The Research and Development Fund for Applied Science of Guangdong Province (No.2015B010130003),The Science and Technology Program of Guangzhou (No.201510010275), Guangzhou Key Laboratory of Human Data Science(No.201605030011)

TP309.7

A

10.11959/j.issn.2096-109x.2016.00094

2016-07-08;

2016-09-02。通信作者:刘琲贝,eebbliu@scut.edu.cn

广东省应用型科技研发专项基金资助项目(No.2015B010130003);广州市科技基金资助项目(No.201510010275);广州市人体数据科学重点实验室基金资助项目(No.201605030011)

猜你喜欢

子块容量框架
基于八叉树的地震数据分布式存储与计算
框架
基于特征值算法的图像Copy-Move篡改的被动取证方案
水瓶的容量
广义框架的不相交性
基于两层分块GMM-PRS 的流程工业过程运行状态评价
基于波浪式矩阵置换的稀疏度均衡分块压缩感知算法
IQ下午茶,给脑容量加点料
小桶装水
关于原点对称的不规则Gabor框架的构造