JPEG隐写分析中的校准原理探究
2015-10-18武警福州指挥学院军事理论教研室福建福州350002
张 焱(武警福州指挥学院 军事理论教研室,福建 福州 350002)
JPEG隐写分析中的校准原理探究
张 焱
(武警福州指挥学院 军事理论教研室,福建 福州 350002)
传统的隐写图经过剪切重压缩得到原始图像的近似图像,通过对该方法及其与检测特征之间的关系研究,建立了校准与校准特征的一维数学空间,该空间引入参考变换概念,定性地分析了校准方法和校准差分特征的相关性,从而得出校准技术提高检测性能的根本原因,同时得出校准图像不一定是原图相似图的结论,对校准特征的选择提供了理论依据。
参考变换;校准特征;检测性能
[3]针对MB隐写算法提出共生矩阵、空域虚特征值分解和边界梯度等的校准特征;参考文献[4]提取待测图像和校准图像的直方图和共生矩阵两种特征,检测 LSB匹配算法;张昊[5]证明了校准技术、Markov特征等结合使用对空域隐写的多类检测正确率高于混合特征。上述算法比非校准算法的检测准确率高。
除了剪切像素,应用轻微的旋转[6]或缩放都可以实现校准。因为这些操作可以打破原始的8×8分块特性,从而消除DCT域的嵌入影响,即使s′和s大小不同,经过标准化后,不影响对特征的提取。
假设特征集为F,则校准特征可表示为F(s)-F′(s′),如图1所示。
图1 剪切像素的校准过程
虽然校准已经很大程度地提高了检测性能,但是校准技术缺乏理论指导。本文在剪切重压缩校准的基础上总结了校准提高检测性能的根本原因是校准的参考特性和校准差分特征更高的敏感性。
1 校准作用原理
图2和图3是6 500张图像测试的平均值,该图表明在嵌入率为0.2 bpac时,nsF5算法中参考图与原始图的直方图相比,与隐写后的直方图更加接近。利用L2准则量化对比直方图的差异后,观察到:在嵌入率为 1 bpac时,参考图直方图与隐写图相比平均3.3倍地接近载体图像直方图;在嵌入率为 0.2 bpac时,隐写图与参考图相比平均2.9倍地接近载体图像。结果表明,即使参考图不接近原始图像的统计特征,校准仍然可以改进检测性能,参考文献[1]表明在特定的嵌入率下 nsF5隐写后的全局直方图与原图较为接近。
图2 nsF5在嵌入率为1 bpac时的直方图
图3 nsF5在嵌入率为0.2 bpac时的直方图
另外,李侃等人[7]分析 DCT系数块内、块间相关性,提出区域相关性的通用分析算法;李卓等人[8]提出的空域、小波和DCT三域融合的校准特征在不同的图像库上正确率较高,可见,校准操作与原始图估计图没有直接关系,校准技术的应用范围不局限于直方图特征。本文通过观察、统计分析和实验等手段,得出结论:校准提升检测的根本原因是由于剪切重压缩后得到的参考图像,参考图像与原始图像的特征差分提高了检测效果。
2 实验验证
下面以 PEV-274为例,已知载体图像,使用剪切重压缩校准,分析载体图像和隐写图像的校准特征分类结果。PEV-274特征集如表1所示。
表1 PEV-274特征集
设c代表载体图像,定义参考变换r∶χ→χ,对于任意c∈χ映射到 r(c)∈χ,校准图像的特征向量 fr=f。r,。代表映射运算,fr为校准图特征。根据 fr的定义知 fr是由特征向量f和参考变换r唯一决定的。校准特征等于图像特征与从该图像提取的参考特征之间的差分特征,用公式表示为:
Δf(x)≜fr(x)-f(x),∀x∈χ(1)
根据c和s各自的特征、校准图特征和校准特征值之间的关系,校准特征可分为5类,示意图如图4所示。
图4 校准分类的一维空间示意图
(1)fr(x)=f(x)+f*
也称为“相似参考”,原因是载体和隐写图像在校准后的差分特征相同,对应图4(a)。f*是一个具体的特征向量,即校准特征是个不变量,Δfr(x)=f*,因此校准特征已经失效,如YASS的校准检测,nsF5算法在嵌入率0.2 bpac时的检测,MME3算法在嵌入率 0.1 bpac时的M03检测,JPHS在嵌入率为 0.1 bpac时的检测。此时非校准检测比校准检测有效,且能降低计算的复杂度。
(2)r(s)=cˆ
此时r(s)的特征值与c的特征值近似相等,同时对每个载体都有 fr(c)≈f(c),fr(s)=f(cˆ)≈fr(c)≈f(c),因此,Δf(c)≈0,Δf(s)≠0,对应图4(d)。如果f(c)≠f(s)(这也是对特征f选择时必须满足的基本条件),分类2的表现形式就与剪切重压缩校准方法一致。此类校准效果主要依赖于f(s)与f(c)之差。如果 f(s)接近于f(c),检测效果就差;若 f(c)=f(s)时,校准无效(除非 Δf(c)与Δf(s)统计特性不同)。
当特征对嵌入较为敏感或嵌入率较大时就属于分类2,例如nsF5和Jsteg的直方图特征、nsF5的灰度共生矩阵属于对嵌入变化敏感,StegHide隐写由于只保持了全局直方图并没有考虑到单个系数的直方图如(2,1)位置的直方图,也属于该分类。
(3)r(s)=sˆ,fr(c)=f(sˆ)≈fr(s)≈f(s)
在实际中可通过多次嵌入的方法实现检测。此时,fr(c)变化会很大,但 fr(s)变化很小,如 OutGuess检测,对应图 4(f)。
(4)s和c的参考特征不随嵌入多少而变化
这一分类中,参考图既不接近载体图也不接近隐写图。
令:①fr(c)≈fr(s)≜fw;
②fw尽可能既接近f(c)又接近f(s)。
条件①规定了fr不因嵌入改变而改变;条件②确保了校准有效:假设r将所有的图像映射到特定的图像m∈χ,则有 fr(c)=f(m)=const,∀c∈χ,即使①满足了,Δf也只是在 f前面加了个负号,校准失效。所以,必须满足条件②。由图4(c)和图4(e)可以看出,fw越接近f(c)和 f(s),fw的变化就越小,检测率越高。但分类 4中要求 f(c)和 f(s)相差要大,而且特征变化方向保持不变。例如nsF5在嵌入率为0.2 bpac时的检测、MME3在嵌入率为0.1 bpac时的[H0,M00]检测效果。
(5)fr(c)=f(c)-F1,fr(s)=f(s)-F2,F1≠F2
r映射后 x由 f(x)变为反方向的 fr(x),具体方向要看 x是 c还是 s,参见图 4(b),最终 Δf(c)=F1,Δf(s)= F2。而且,即使在f(c)=f(s)时,校准仍可用。分类 5的实质是将Δf作为一个检测器,但是对于每一个载体和隐写图像来说得到上述的特征变换几乎不可能。令F1和F2是在F上的随机变量,假设 F1、F2分布不同,校准仍有效。例如用0、1直方图检测Jsteg,因为Jsteg保持了0、1的系数总数,即f(c)=f(s),因此特征本身对检测无益。但是在对c和s使用r校准后的映射特征结果却不同,JPHS算法的检测也属此类。
以上理论皆以代数学为基础,解释了一维空间内校准的适用条件和工作原理。从上述分类结果可以得知校准的性能随着r引起的特征值变化而变化。对于剪切重压缩校准,若保证校准检测效果较好,必须要求c和s的参考特征差异尽可能大或s的校准特征值尽可能大,也就是说关键在于参考变换r和特征f的选择。
3 结论
本文以校准技术发展为线索,对校准面临的问题,尤其是校准原理方面根据 Kodovsky提出的理论作了进一步的总结和实验验证,总结了校准能提高隐写分析检测性能的原因,为今后的校准检测技术研究提供了理论指导。
参考文献
[1]FRIDRICH J,GOLJAN M,HOGEA D.Steganalysis of JPEG images:breaking the F5 algorithm[C].Proceedings of the 5th Information Hiding Workshop,Lecture Notes in Computer Science,2003:310-323.
[2]PEVN T,FRIDRICH J.Merging Markov and DCT features for multi-class JPEG steganalysis[J].Proceedings of SPIE Conference on Electronic Imaging,Security,Steganography,and Watermarking of Multimedia Contents IX,2007,6505:3.
[3]董秀则,张茹,钮心忻.MB隐写分析算法[J].北京邮电大学学报,2012,35(2):99-103.
[4]杨林聪,夏志华.针对空域 LSB匹配的隐藏信息检测方法[J].中南大学学报(自然科学版),2013,44(2):612-618.
[5]张昊,平西建.使用混合 DCT特征检测空域隐写术[J].信息工程大学学报,2012,13(6):646-649.
[6]FRIDRICH J.Feature-based steganalysis for JPEG images and its implications for future design of steganographic schemes[C].Proceedings of 6th International Workshop,Information Hiding Lecture Notes in Computer Science,2005,3200:67-81.
[7]李侃,平西建.基于区域相关性的JPEG图像隐写盲检测方法[J].信息工程大学学报,2012,13(3):306-311.
[8]李卓,陈健,蒋晓宁,等.基于多域特征的 JPEG图像盲检测算法[J].浙江大学学报(工学版),2011,45(9):1528-1538.
The study of calibration in JPEG steganographic analysis
Zhang Yan
(College of Armed Police for Command in Military Theory Teaching and Research Section in Fuzhou,Fuzhou 350002,China)
Traditional steganographic figures got the approximate images of the original images after cropped and recompressed.through the study about the relationship between this method and the detection feature,the article showed a kind of mathematic space between calibration and calibration features in one dimensional.This space introduced a concept of reference transformation and had qualitative analysis of the correlation between calibration methods and calibration difference features,thus it concluded that the root reason that the calibration technology improves the detection performance,at the same time calibration images are not necessarily similar to the original images.this conclusion provides theory basis for the selection of calibration features.
reference transform;calibration feature;ddetection performance
TP391
A
1674-7720(2015)24-0076-03
张焱.JPEG隐写分析中的校准原理探究[J].微型机与应用,2015,34(24):76-78.
0 引言
2015-04-30)
张焱(1989-),女,硕士,助教,主要研究方向:信息隐藏,信息安全。
校准技术是近几年隐写分析技术中应用较多的一种预处理方式,主要用于数字图像隐写检测中基于特征的盲检测和专用检测。参考文献[1]把从隐写图像中估计出原始图像直方图的方法定义为“校准”。最常用的校准方法是剪切重压缩,先将一个JPEG图像s用DCT逆变换解压到空域,然后沿行列两方向分别剪切4像素,再用相同质量因子分块压缩成JPEG图像,得到s′,即估计(校准)图像。校准特征即L1准则:f(s)-f(s′)(f是特征函数,s代表待测图像,s′代表估计图像)。参考文献[2]中将23维改为274维PEV-274特征,由几组DCT系数直方图特性和空间相关性组成,且特征向量差分改进为单个特征差分集合,即改进的L2准则。