基于邻域像素差分矩阵的彩色空域图像隐写分析特征
2016-10-14韩涛陈熹祝跃飞
韩涛,陈熹,祝跃飞
基于邻域像素差分矩阵的彩色空域图像隐写分析特征
韩涛1,2,陈熹1,2,祝跃飞1,2
(1. 信息工程大学网络空间安全学院,河南郑州450001;2. 数学工程与先进计算国家重点实验室,河南郑州450001)
通过分析灰度空域图像隐写直接扩展至彩色空域图像潜在的安全问题,提出了针对彩色空域图像隐写的隐写分析特征。首先,计算颜色通道内邻域像素差分矩阵的Markov转移概率矩阵,提取颜色通道内特征并进行融合;然后,计算颜色通道间邻域像素差分矩阵的Markov转移概率矩阵,并将水平和垂直共4个方向与对角和反对角共4个方向的转移概率矩阵分别进行融合,作为颜色通道间特征;最后,颜色通道内特征与颜色通道间特征构成最终的隐写分析特征,并使用集成分类器作为特征训练和测试工具。实验结果表明,该隐写分析特征可有效检测彩色空域图像隐写,并且颜色通道间特征能有效捕获内容自适应隐写对彩色图像的颜色通道间相关性的影响。
隐写分析;彩色空域图像;内容自适应隐写;邻域像素差分矩阵;隐写分析特征
1 引言
隐写术研究如何将秘密信息嵌入到公开的多媒体数据中以实现隐蔽通信,即第三方无法察觉正在通信这一过程。对隐写术的攻击,即隐写分析,主要研究如何检测、提取、恢复或破坏隐藏的秘密信息,目前大部分研究只针对隐藏信息的检测。隐写术和隐写分析的大部分研究目前都只关注灰度图像,都默认假设针对灰度图像的隐写术和隐写分析可以直接扩展到彩色图像上,即将一幅彩色图像看作是3幅灰度图像进行处理。显然地,所有针对灰度图像隐写的隐写分析方法都可以通过以下2种方式直接应用于彩色图像:一是将彩色图像看作是3倍大小的灰度图像进行隐写分析;二是分别对每个颜色通道进行隐写分析,然后融合各个颜色通道的隐写分析结果。然而,上述2种应用方式忽略了彩色图像颜色通道间的相关性,并没有考虑利用颜色通道间的相关性来构造隐写分析特征以改进隐写分析方法的性能。
文献[1]最早专门设计针对彩色图像的隐写分析方法,该方法仅适用于调色板图像。文献[2]分析了在高颜色深度的图像上嵌入秘密信息的最低有效位(LSB, least significant bit)隐写的安全性,提出了针对基于彩色图像的LSB替换和LSB匹配的隐写分析方法。文献[3]最早利用颜色通道之间的相关性,基于噪声残差的高阶矩提出了针对彩色图像隐写的隐写分析特征。文献[4]基于图像的三维颜色立方表示提出了一种针对彩色图像LSB匹配的隐写分析方法,使用邻域数量的相对频率作为隐写分析特征,该方法检测JPEG解压缩图像的效果较好,而检测原始未压缩空域图像或者裁剪的空域图像的效果较差。文献[5]基于彩色立方的思想提出了一种检测彩色图像LSB隐写的隐写分析方法。文献[6]分别从彩色图像的亮度和色度选择特征,提出针对彩色图像隐写的隐写分析方法。文献[7]提出了基于净图描述的彩色图像隐写分析方法,在3个颜色通道分别提取纹理特征和虚特征值特征。文献[8]通过分析彩色图像隐写噪声模型,提出了基于噪声模型和通道融合的彩色图像隐写分析方法。根据隐写术导致RGB彩色图像颜色梯度的变化,文献[9]提出一种基于颜色梯度矩阵的RGB图像隐写分析方法。文献[10]通过考虑彩色滤波阵列插值算法引入的像素之间和颜色通道之间的依赖性,使用更加精确的预测模型改进了针对LSB匹配的带权重载密(WS, weighted-stego)隐写分析方法。上述隐写分析方法一般都只针对彩色图像LSB隐写,并未考虑近年来发展迅速的内容自适应隐写在直接扩展到彩色图像时可能存在的安全问题。
针对基于原始未压缩彩色空域图像的隐写术,本文提出了基于邻域像素差分矩阵的彩色空域图像隐写分析特征。首先分别在3个颜色通道内提取邻域像素差分矩阵(SPAM, subtractive pixel adjacency matrix)特征[11],并进行融合;然后,根据Markov过程,考虑颜色通道间的相关性,基于3个颜色通道的邻域像素差分矩阵提取颜色通道间的隐写分析特征;最后,将颜色通道内的融合特征和颜色通道间的特征进行组合,获得最后的隐写分析特征。注意到本文思想可以直接推广到高维的空域隐写分析特征,比如说基于共生矩阵的空域富模型(SRM, spatial rich model)特征[12]及投影SRM (PSRM, projection SRM)[13]特征。
2 相关工作
文献[11]通过使用Markov链对邻域像素差分矩阵进行建模,提取转移概率矩阵的子集作为特征,提出了基于邻域像素差分矩阵的空域隐写分析方法,即著名的SPAM隐写分析特征,可有效检测LSB隐写。
其他7个方向上的转移概率矩阵可按照类似的计算方式获得,即可获得所有8个方向上的一阶和二阶转移概率矩阵,分别记为和,其中,。为了降低特征维数,文献[11]进行如下合理的假设:自然图像的统计特性关于镜面反射和翻转映射是对称的。因此,首先将水平和垂直共4个方向的转移概率矩阵通过计算平均值的方式进行融合,然后将对角和反对角共4个方向的转移概率矩阵也通过计算平均值的方式进行融合,最后形成一阶和二阶SPAM特征和。
(4)
(6)
3 基于邻域像素差分矩阵的彩色空域图像隐写分析
首先计算3个颜色通道在8个方向上的差分矩阵。例如,对于红色通道,从左至右的水平方向()上的差分矩阵为,其中,,其他7个方向上的差分矩阵的计算方法类似,即总共可得到红色通道在8个方向上的差分矩阵,其中方向。绿色和蓝色通道在8个方向上的差分矩阵也可类似获得,分别设为和,其中方向。
然后根据第2节中SPAM特征的构造过程,分别提取3个颜色通道内的SPAM特征,分别记为B-SPAM(blue SPAM)、G-SPAM(green SPAM)和R-SPAM(red SPAM),分别使用,,表示这3个特征,并按照计算平均值的方式将3个颜色通道的SPAM特征进行融合:,,融合后的特征记为M-SPAM(merged SPAM),其维数也为。另外,将3个颜色通道的SPAM特征的组合记为A-SPAM(all-SPAM),其维数为,其特征集合构造为:,经过特征组合得到的A-SPAM特征主要用于后续的性能对比实验。
由于自然彩色空域图像的3个颜色通道之间有着强相关性(3个颜色通道间的相关系数为:-: 0.78;-: 0.98;-: 0.94)[14],即与、与的相关性更强,而目前彩色图像空域隐写通常分别在颜色通道、和上嵌入秘密信息,秘密信息的嵌入除了对颜色通道内相邻像素的相关性产生影响,也必然对颜色通道之间的相关性产生影响。图1给出了彩色Lena图像各个颜色通道的修改像素位置及同时修改至少2个颜色通道的像素位置,其中,载体图像为的彩色Lena图像,隐写算法为空域通用小波相对失真隐写方法 (S-UNIWARD, spatial-universal wavelet relative distortion)[15],嵌入率为0.4。从图1可以看出,在使用内容自适应隐写S-UNIWARD分别在3个颜色通道上以嵌入率0.4嵌入消息后,Lena各个颜色通道的修改像素所在的位置均属于图像纹理复杂区域,并且出现了大量同时修改至少2个颜色通道的像素。此外,Markov转移概率矩阵是一种常被用于描述图像相邻数据间相关性的统计特征,并且文献[16]指出,相对于反映单个数据分布特性的独立同分布模型,尽管基于Markov转移概率矩阵的统计特征较为复杂,但其在捕捉相邻数据间相关性方面是具有最小复杂度的分布模型。因此,根据3个颜色通道的邻域像素差分矩阵之间的Markov转移概率矩阵,下面构造可捕捉颜色通道间相关性的隐写分析特征作为颜色通道间特征,主要步骤如下。
(a) 红色通道
(b) 绿色通道
(c) 蓝色通道
(d) 同时修改至少2个颜色通道
图1 彩色Lena图像各个颜色通道的修改像素位置及同时修改至少2个颜色通道的像素位置
第1步,按照如式(7)所示的方式计算Markov转移概率矩阵
第2步,为了降低特征维数,将水平(horizontal)和垂直(vertical)共4个方向的Markov转移概率矩阵通过计算平均值的方式进行融合,即
第3步,将对角(diagonal)和反对角(anti-diagonal)共4个方向的Markov转移概率矩阵通过计算平均值的方式进行融合,即
第4步,式(8)和式(9)所代表的特征值构成颜色通道间的隐写分析特征,用C-SPAM(color SPAM)表示,易知其维数为,记为,即。
综上,本文提出的隐写分析特征集合包含融合3个颜色通道内SPAM特征的维M-SPAM和维颜色通道间的特征C-SPAM,总维数为
记为MC-SPAM(merged and color SPAM),用表示。注意到本文中提取颜色通道间特征的思想可以推广到更高维的空域隐写分析特征,此处只是选择SPAM特征用于表明基于颜色通道间相关性提取隐写分析特征的思想的有效性。
4 实验结果与分析
4.1 实验设置
使用典型的未压缩彩色空域图像库UCID (uncompressed color image database)[17]作为实验图像库,该图像库包含1 338幅未压缩的原始彩色TIF图像,包括人物、风景、建筑、植物以及动物等,图像大小为或。选择4种典型的隐写方法用于对比隐写分析方法的性能:非自适应的LSB匹配(LSBM, LSB matching)、基于图像内容自适应的边缘自适应改进LSB匹配方法(EALMR, edge-adaptive LSB matching revisited)[18]、权重获得小波隐写方法(WOW, wavelet obtained weights)[19]和S-UNIWARD[15],其中,LSBM使用修改率作为失真度量,EALMR使用单个方向上邻域像素差分值的绝对值作为失真度量,WOW和S-UNIWARD使用小波系数修改量的总和作为失真度量,并根据其对应的率失真界进行模拟嵌入。10种测试嵌入率为0.1~1.0,间隔为0.1,单位为bit/channel pixel,将彩色图像的每个颜色通道看作是一幅灰度图像,分别使用以上4种隐写方法在每个颜色通道上嵌入相同嵌入率的二元随机秘密信息。根据给定的嵌入率,使用伪随机数发生器生成二元随机秘密信息,用于模拟加密后的秘密信息。另外,使用Matlab自带的rgb2gray函数将UCID图像库转化为灰度图像库,也使用以上4种隐写方法在灰度图像库上嵌入10种测试嵌入率对应的二元随机秘密信息。最后所有图像库的图像数量共计(1+2×4×10)×1 338=108 378幅。
根据文献[11]中关于SPAM特征的参数取值的讨论可知,本文特征的参数和越大,意味着特征维数越高,检测错误率将会越小,即准确率越高。在实验中,为了合理地比较各个隐写分析特征的性能,取SPAM特征的参数,C-SPAM特征的参数,即R-SPAM、G-SPAM、B-SPAM、M-SPAM和C-SPAM特征的维数为686,A-SPAM特征的维数为,MC-SPAM特征的维数为。此外,文献[6~8]的方法只针对基于彩色空域图像的LSB隐写或随机调制隐写,并没有根据内容自适应隐写在直接扩展到彩色空域图像时可能产生的安全问题来设计隐写分析特征,为了合理地对比隐写分析方法的性能,选择文献[6~8]的方法作为对比方法来检测LSB匹配,其中,文献[6~8]中特征的维数分别为49、150和40。
使用集成分类器(ensemble classifier)[20]作为特征训练和测试工具,测试结果最小平均分类错误率表示,,其中,表示虚警率,即将载体图像判断为载密图像的概率,表示漏检率,即将载密图像判断为载体图像的概率。集成分类器的基础学习器使用Fisher线性分类器,随机子空间的维数和基础学习器数量通过最小化测试误差的OOB(out-of-bag)估计量(即)来寻找。训练测试过程重复10次,每次随机选择实验图像库中50%的载体/载密图像用于训练,剩余50%用于测试,取10次测试结果的平均值作为最后的分类结果。
4.2 性能比较
为了对比颜色通道内隐写分析特征的性能,下面进行第1个实验。分别从实验图像库中彩色图像的3个颜色通道提取SPAM特征,获得R-SPAM、G-SPAM和B-SPAM特征,分别通过第3节描述的融合和组合方式获得M-SPAM和A-SPAM特征。另外,从灰度图像库中的灰度图像提取SPAM特征,得到Gray-SPAM特征。所有隐写分析特征都使用集成分类器进行训练和测试。
表1列出了隐写分析特征R-SPAM、G-SPAM、B-SPAM、M-SPAM、A-SPAM和Gray-SPAM检测LSBM(0.1 bit/channel pixel)、EALMR(0.4 bit/channel pixel)、WOW(0.4 bit/channel pixel)、S-UNIWARD (0.4 bit/channel pixel)的实验结果,其中,表中第1列括号里的数据表示当前隐写分析特征的维数。从表1中可以看出,在4种隐写方法和3个颜色通道的嵌入率相同的条件下都表明,红色通道抵抗隐写分析的能力最强,蓝色通道次之,绿色通道最弱,这主要是因为红色通道通常是图像纹理最复杂的颜色通道,而绿色通道的图像纹理最简单。根据文献[21]中图像像素的纹理度量函数,首先分别计算实验图像库中所有图像的3个颜色通道像素的纹理度量值,分别记为,,,其中,,,,为实验图像库的图像数量,然后通过求平均值计算整个实验图像库的3个颜色通道的纹理度量值
表1 6种隐写分析特征检测4种隐写方法的实验结果
为了测试引入颜色通道间隐写分析特征的性能变化,下面进行第2个实验。分别从实验图像库中的彩色图像提取C-SPAM和M-SPAM特征,进而组合得到MC-SPAM特征。所有隐写分析特征都使用集成分类器进行训练和测试。图2~图5分别给出了隐写分析特征A-SPAM、C-SPAM、M-SPAM和MC-SPAM检测10种测试嵌入率条件下的LSBM、EALMR、WOW和S-UNIWARD的实验结果。从图2~图5均可以看出,MC-SPAM特征在10种测试嵌入率条件下检测4种隐写方法的性能优于其他3种特征。从图2和图3中可以看出,对于检测LSBM和EALMR,相对于M-SPAM特征,MC-SPAM特征改进错误率的幅度并不大。然而,从图4和图5可以看出,对于检测WOW和S-UNIWARD,相对于M-SPAM特征,MC-SPAM特征改进错误率的幅度更大,这主要因为相对于非自适应的LSBM和只使用简单失真度量的EALMR,内容自适应隐写WOW和S-UNIWARD的失真度量更为精确,更能将嵌入修改集中于图像的纹理复杂区域,更可能同时修改某个像素的2个甚至3个颜色通道,更可能会影响彩色图像颜色通道间的强相关性,这一点正好说明了本文提出的颜色通道间特征C-SPAM能够有效捕获颜色通道间相关性的变化。图6给出了文献[6~8]的方法和MC-SPAM特征检测LSB匹配的实验结果。从图6可以看出,本文提出的MC-SPAM特征检测LSB匹配的性能优于文献[6~8]的方法。此外,注意到图3中,嵌入率为1的错误率高于嵌入率为0.9的错误率,这是因为EALMR以2个相邻像素为嵌入单元使用LSBMR(LSB matching revisited)[23]进行消息的嵌入,其中,LSBMR的修改方式为加1或减1,即像素的最大修改幅度为1,当嵌入率为0.9时,根据EALMR的过程,为了保证嵌入单元的纹理复杂度不降低,会出现大量像素需要重新调整的情况,即会出现很多像素的修改幅度超过1的情况,会降低EALMR的安全性;而当嵌入率为1即每个像素都要承载1 bit消息时,EALMR即为LSBMR,并不需要重新调整像素。
5 结束语
本文基于邻域像素差分矩阵提出了一种针对彩色空域图像隐写的隐写分析特征,由颜色通道内和颜色通道间2部分特征构成。实验结果表明,本文所提出结合融合的颜色通道内特征M-SPAM和颜色通道间特征C-SPAM的MC-SPAM特征能够有效检测基于彩色空域图像的LSBM和内容自适应隐写,并且针对内容自适应隐写WOW和S-UNIWARD,相对于M-SPAM特征,MC-SPAM特征改进的效果更加明显。本文的思想可以直接扩展至高维的空域隐写分析特征,另外,根据本文所得的结论,在设计基于彩色图像的内容自适应隐写时,显然不能将针对灰度图像的隐写方法直接扩展至彩色图像,必须要考虑对颜色通道间相关性的影响。下一步研究的工作就是考虑如何针对彩色JPEG图像隐写设计有效的隐写分析方法。
[1] JOHNSON N F, JAJODIA S. Steganalysis of images created using current steganography software[C]//The 2nd International Workshop on Information Hiding. Portland, Oregon, USA, c1998:273-289.
[2] FRIDRICH J, LONG M. Steganalysis of LSB encoding in color images[C]//The IEEE International Conference on Multimedia and Expo(ICME). New York, NY, USA, c2000: 1279-1282.
[3] LYU S, FARID H. Steganalysis using color wavelet statistics and one-class support vector machines[C]//SPIE 5306, Security, Steganography, and Watermarking of Multimedia Contents VI. San Jose, CA, USA, c2004:35-45.
[4] WESTFELD A. Detecting low embedding rates[C]//5th International Workshop on Information Hiding. Noordwijkerhout, Netherlands, c2002:324-339.
[5] LEE K, JUNG C H, LEE S J, et al. Color cube analysis for detection of LSB steganography in RGB color images[C]//International Conference on Computational Science and Its Applications(ICCSA). Singapore, c2005:537-546.
[6] 陈丹, 陈原, 王育民. 一种针对彩色图像的泛盲掩密分析方案[J]. 电子与信息学报, 2005, 27(10): 1542-1549.
CHEN D, CHEN Y, WANG Y M. A universal blind steganalysis for color images[J]. Journal of Electronic and Information Technology, 2005, 27(10): 1542-1549.
[7] 毛家发, 林家骏. 基于净图描述的通用隐写分析技术[J]. 计算机学报, 2010, 33(3): 569-579.
MAO J F, LIN J J. A novel general steganalysis technique based on cover image describing[J]. Chinese Journal of Computers, 2010, 33(3): 569-579.
[8] 綦科, 谢冬青. 基于噪声模型和通道融合的彩色图像隐写分析[J]. 计算机研究与发展, 2013, 50(2): 307-318.
QI K, XIE D Q. Steganalysis of color images based on noise model and channels integration[J]. Journal of Computer Research and Development, 2013, 50(2): 307-318.
[9] 綦科, 谢冬青. 基于颜色梯度矩阵的通用型RGB图像隐写分析[J]. 计算机应用, 2013, 33(10): 2868-2870.
QI K, XIE D Q. Universal steganalysis for RGB images based on color gradient matrix[J]. Journal of Computer Applications, 2013, 33(10): 2868-2870.
[10] KIRCHNER M, BOHME R. Steganalysis in technicolor: boosting WS detection of stego images from CFA-interpolated covers[C]//The IEEE International Workshop on Acoustics, Speech and Signal Processing (ICASSP). c2014:3982-3986.
[11] PEVNY T, BAS P, FRIDRICH J. Steganalysis by subtractive pixel adjacency matrix[J]. IEEE Transactions on Information Forensics and Security, 2010, 5(2): 215-224.
[12] FRIDRICH J, KODOVSKY J. Rich models for steganalysis of digital images[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(3): 868-882.
[13] HOLUB V, FRIDRICH J. Random projections of residuals for digital image steganalysis[J]. IEEE Transactions on Information Forensics and Security, 2013, 8(12):1996–2006.
[14] STEPHEN J S, ROBIN E N H. The color image processing handbook[M]. London: Chapman& Hall, 1998: 67-92.
[15] HOLUB V, FRIDRICH J, DENEMARK T. Universal distortion function for steganography in an arbitrary domain[J]. EURASIP Journal on Information Security, 2014, 2014(1): 1-13.
[16] SULLIVAN K, MADHOW U, CHANDRASEKARAN S, et al. Steganalysis for Markov cover data with applications to images[J]. IEEE Transactions on Information Forensics and Security, 2006, 1(2): 275-287.
[17] SCHAEFER G, STICH M. UCID: an uncompressed color image database[C]//SPIE 5307, Storage and Retrieval Methods and Applications for Multimedia. San Jose, CA, USA, c2004:472-480.
[18] LUO W, HUANG F, HUANG J. Edge adaptive image steganography based on LSB matching revisited[J]. IEEE Transactions on Information Forensics and Security, 2010, 5(2): 201-214.
[19] HOLUB V, FRIDRICH J. Designing steganographic distortion using directional filters[C]//The IEEE International Workshop on Information Forensics and Security (WIFS).Tenerife, Spain, c2012: 234-239.
[20] KODOVSKY J, FRIDRICH J, HOLUB V. Ensemble classifiers for steganalysis of digital media[J]. IEEE Transactions on Information Forensics and Security, 2012, 7(2): 432-444.
[21] 韩涛, 祝跃飞, 林斯思, 等. 基于空域失真模型的修正矩阵编码及其改进[J]. 计算机研究与发展, 2014, 51(7): 1467-1475.
HAN T, ZHU Y F, LIN S S, et al. Modified matrix encoding based on the spatial distortion model and its improvement[J]. Journal of Computer Research and Development, 2014, 51(7): 1467-1475.
[22] FILLER T, KER A D, FRIDRICH J. The square root law of steganographic capacity for Markov covers[C]//SPIE 7254, Media Forensics and Security. San Jose, CA, USA, c2009:801-811.
[23] MIELIKAINEN J. LSB matching revisited[J]. IEEE Signal Processing Letters, 2006, 13(5):285-287.
Subtractive pixel adjacency matrix based features for steganalysis of spatial color images
HAN Tao1,2, CHEN Xi1,2, ZHU Yue-fei1,2
(1. Institute of Cyber Space Security, Information Engineering University, Zhengzhou 450001, China; 2. State Key Laboratory of Mathematical Engineering and Advanced Computing, Zhengzhou 450001, China)
Through analyzing the potential security problems of directly extending steganography based on the grayscale spatial image to the color spatial image, novel steganalysis features for detecting the steganographic methods with color spatial images as cover images were proposed. First of all, the Markov transition probability matrices of the subtractive pixel adjacency matrices of three color channels were computed, and then the intra-color-channel features were extracted and merged. Afterwards, the transition probability matrices of the subtractive pixel adjacency matrices among the color channels were calculated, where four horizontal and vertical directions, and four diagonal and anti-diagonal directions are separately merged. And the two parts composed the inter-color-channel features. Finally, the final feature set of the proposed method consists of the intra-color-channel features and the inter-color-channel features, and the ensemble classifier was used for the training and testing of the proposed feature. The experimental results show that the proposed method can effectively detect the steganographic schemes based on the color spatial image. Moreover, the proposed inter-color-channel features can efficiently capture the effect of the content-adaptive steganography on the correlation among the color channels of color images.
steganalysis, color spatial image, content-adaptive steganography, subtractive pixel adjacency matrix, steganalysis feature
TP309
A
10.11959/j.issn.1000-436x.2016042
2015-03-03;
2015-09-09
国家科技支撑计划基金资助项目(No.2012BAH47B01);国家自然科学基金资助项目(No.61170234);郑州科技创新团队基金资助项目(No.10CXTD150);信息工程大学博士学位论文创新基金资助项目(No.BSLWCX201309)
The National Science-Technology Support Plan Project of China (No.2012BAH47B01), The National Natural Science Foundation of China (No.61170234), The Municipal Science and Technology Innovation Team Project of Zhengzhou (No.10CXTD150), The Doctoral Dissertation Innovation Fund of Information Engineering University (No.BSLWCX201309)
韩涛(1986-),男,四川彭州人,信息工程大学博士生,主要研究方向为密码学和信息隐藏。
陈熹(1988-),男,湖北建始人,信息工程大学讲师,主要研究方向为网络信息安全。
祝跃飞(1962-),男,浙江杭州人,博士,信息工程大学教授、博士生导师,主要研究方向为密码学和网络安全。