APP下载

基于区域相关性的LSB匹配隐写分析

2010-09-18陈铭1张茹1刘凡凡1武嘉1钮心忻1

通信学报 2010年3期
关键词:波谷极大值直方图

陈铭1,2,3,张茹1,2,3,刘凡凡1,2,3,武嘉1,2,3,钮心忻1,2,3

(1. 北京邮电大学 网络与交换技术国家重点实验室 信息安全中心,北京100876;2. 北京邮电大学 网络与信息攻防技术教育部重点实验室,北京100876;3. 北京邮电大学 灾备技术国家工程实验室,北京100876)

1 引言

LSB匹配作为改进的LSB算法,相对于LSB替换的改进之处就在于当载体对象样点值的LSB与信息比特不同时,样点值随机地加 1或减 1,这样将不会形成 2i与 2i+1的值对,而信息的提取方法与LSB替换相同,这就打破了LSB替换的值对转换规律,使得基于值对转换的卡方检测、RS检测、SPA检测、DIH检测等方法失效。设计针对LSB匹配的检测方法,需要构造新的统计模型,目前针对LSB匹配的检测方法大多是基于训练的特征提取方法,还未达到准确估计隐藏信息量的高度。

本文针对灰度图像空间域的LSB匹配,根据分析信息嵌入对局部像素的相关性的影响,提出一种基于区域相关性的检测算法,本文的检测算法复杂度低,运算简单并且误检率低,当嵌入率高于 0.3时检测结果具有较高的可靠性。

2 LSB匹配算法

2.1 典型的LSB匹配算法

LSB匹配的核心改进是构造一个随机性准则,当载体图像的像素值与嵌入信息比特不同时,根据该随机性准则确定像素值是加1还是减1。典型的LSB匹配算法是基于局部像素相关性的 LSB匹配算法[1,2],记载体图像像素值为xi,嵌入信息比特为mi,嵌入信息后像素值为x’i,分别以8邻域内像素的LSB中1的个数,以及8邻域内像素的平滑度表示区域内像素的相关性,如式(1)定义区域内像素的平滑度T。

利用区域相关性构造 LSB匹配准则,如果mi与xi的LSB相同,则不对xi做改动,如果不同,先判断xi是否为0或者255,为0则对其加1,为255则对其减1,如果两者都不是,则根据位8邻域内像素的LSB中1的个数来对 xi进行改动,令 Num为8邻域内LSB为1的像素个数,当Num为偶数时,对 xi加1,当Num为奇数时,对 xi减1;另一种是根据区域平滑度T对xi进行改动,当T大于零时,对xi减1,当T小于零时,对xi加1,上述2种LSB匹配算法可用式(2)与式(3)来描述。

2.2 LSB匹配的像素值转移概率

LSB匹配打破了 2i↔2i+1的像素值对转换规律,以 h(i)和h ( i )分别表示载体图像和载密图像的直方图,i∈{0,1,…,255},嵌入信息序列{M0,M1,…,Mm-1},视消息序列 0、1比的数学期望值为 1∶1,即

根据p(Mi=0)=p(Mi=1)=0.5,像素值2i以1/2的概率保持不变,以1/2的概率发生改变,根据随机性准则,2i将等概地向2i+1和2i-1发生转移,令Gi为灰度值等于i的像素集合,即Gi= { h ( i ) },i∈{0, 1, …, 255},LSB匹配的像素值转换的概率模型如图1所示,图1中M为消息比特,p为转移概率,从该模型可看出,h(i)和h ( i )服从式(4)分布:

式(4)表明,载密图像的直方图可视为载体图像直方图的平滑,嵌入信息后近似保持了载体图像的直方图分布,LSB匹配克服了2i↔2i+1的安全漏洞,这使得卡方检测法、RS检测、SPA检测、DIH检测等一系列检测方法无效。

图1 LSB匹配中像素值转移概率模型

3 针对LSB匹配的检测

“LSB matching”是由Andrew D.Ker[3]在2004年的第六届信息隐藏国际会议上正式提出的,但针对LSB匹配检测的研究早于正式术语的提出。

3.1 基于相邻颜色数与基于HCF的检测

Andreas Westfeld[4]针对基于 LSB匹配的隐写软件 Hide提出的基于相邻颜色数的检测方法,将彩色图像的相邻颜色定义为(r1,g1,b1)与(r2,g2,b2),若满足则称为相邻颜色,一种颜色至多有26种相邻颜色,而在JPEG图像中每种颜色出现的相邻颜色较少,平均只有4~5种,一般不会超过9种。LSB匹配嵌入信息后相邻颜色数将大量增加,某些颜色的相邻颜色数甚至达到了 26的上限,载体图像的平均相邻颜色数为2.20,以100%嵌入率LSB匹配嵌入信息后(每个像素嵌入3bit信息),平均值上升至5.58,Westfeld提出了根据观察相邻颜色数直方图分布来判断是否存在LSB匹配嵌入的方法,但没有明确给出区分载体图像与载密图像的统计量。

Andrew D.Ker[5]根据Westfeld的方法,以相邻颜色数的最大值为检测统计量,对经过JPEG压缩的位图,甚至对嵌入率仅为 1%的情况都具有较高的可靠性,但同时指出该方法对于未经过JPEG压缩或者是经过了缩放的图像是无效的,并且由于灰度图像中的相邻颜色数嵌入信息前后变化并不明显,因此该方法对于灰度图像并不适用。

Harmsen[6]将直方图的离散傅立叶变换定义为直方图特征函数(HCF, histogram characteristic function),隐藏过程被建模为一个加性噪声过程,因此载密图像的直方图 hs(n)可视为载体图像直方图 hc(n)与噪声概率分布函数f(n)的卷积,即对应到离散傅立叶变换可得嵌入信息的概率分布为 fΔ(0 )=0.5、fΔ(±1)=0.25,因此,以式(5)定义 HCF的质心C(H[K]),根据做检测判决。

Andrew D. Ker[7]指出Harmsen的HCF COM方法对于经过JPEG压缩的图像并且嵌入信息量较大时比较有效,而对于未经JPEG压缩的图像效果较差,只有在几乎满嵌情况下才有效;同时在文献[5]中讨论了该方法对灰度图像的检测效果,指出由于不同图像的C(H[k])变化很大,往往超出了载体图像与载密图像之间C(H[k])的差异,因此对灰度图像的检测效果很不理想,而且该方法最大的缺点在于需要获得载体图像,而在实际检测中这样的情况是很少见的。Andrew D.Ker对Harmsen的方法做了2种改进,第一种改进是对检测图像加入降维的预处理,第二种改进是计算相邻像素直方图,即利用二维的HCF作为检测统计量,改进的HCF COM方法对嵌入率30%~100%的经过JPEG压缩的图像较为有效,但对于未经压缩的图像只在几乎 100%嵌入的情况下才有效。

3.2 基于通用检测的分析

另一类针对 LSB匹配的检测采用的是通用检测的思想,即通过提取多特征构成特征向量,再利用神经网络或者SVM进行训练,构造载体图像与载密图像的分类器。

J. Fridrich[8,9]针对非自适应的±k嵌入采用最大似然估计/最大后验估计,通过载体图像估计、根据估计的载体图像从载密图像中分离嵌入信息、最后估计信息长度,实现对± k嵌入的检测。

Qingzhong Liu等[10,11]利用图像小波系数的广义高斯分布的形状参数来衡量图像的复杂度,在小波域滤除高频成分,根据LSB平面与次低位平面的相关性以及滤波后图像与检测图像的相关性构造42个特征量,构成检测特征集,作为载体图像与载密图像的分类器,将该分类器应用于彩色图像,但无论是灰度图像还是彩色图像,该方法的检测效果并不理想。

V.Suresh[12]借鉴 Andreas Westfeld[4]的方法,以单独颜色数比例作为检测统计量,分析以StirMark做默认操作、10%的放大、10%的缩小和旋转的重采样操作后该比例改变的大小,以对应4种重采样操作的单独颜色数比例的改变量<dsm,dzi,dzo,drot>作为特征向量,在不同嵌入率下,特征向量构成了相互分离的簇,并且在嵌入率达到50%以上时簇分离现象减弱,这种簇分离现象为后续利用支持向量机(SVM, support vector machine)分类提供了条件。Suresh的基于重采样的方法对于经过 JPEG压缩的图像检测效果较好,但由于未压缩的图像的特征向量的簇分离现象明显减弱,大大影响检测的准确性。

Jun Zhang[13]发现在高频成分丰富的图像进行LSB匹配后,灰度直方图(或彩色分量直方图)的局部最大值将减小,而局部最小值将增大,这使得载密图像中直方图局部极值与其相邻值的绝对差值和将小于载体图像的差值和,根据以上的分析提出了基于直方图极值的检测方法,并与 HCF方法[7]做了比较,说明该方法对于高频成分丰富的图像(即未经压缩的图像)的检测效果优于HCF方法,但对于高频成分稀少的图像(即经过压缩的图像)的检测效果要劣于后者。

Lisa Marvel[14]对特定的图像训练集,利用上下文树形加权算法(CTW, context tree weighting algorithm)对载体图像和不同嵌入率的载密图像进行训练提取特征向量,再利用 SVM 进行分类。该方法的局限性在于对特定嵌入率提取特征向量,不同的嵌入率下提取的特征向量对于其他嵌入率将不适用。

上述已有检测算法的缺陷在于:1)对于灰度图像检测效果不理想,部分算法只适用于彩色图像;2)运算量大,尤其是基于通用检测的方法,需要经过大量的样本训练,不适于实时检测;3)只在嵌入率较高 (高于30%,甚至接近100%) 时有效。因此,对于灰度图像 LSB匹配的检测仍是一个很具挑战性的课题。

4 基于区域相关性的LSB匹配检测

针对基于区域平滑度的LSB匹配算法,由于信息嵌入是根据区域内像素间的相关性确定嵌入规则,嵌入信息势必对像素间相关性造成影响,本文将以区域内像素间的相关性为统计量,分析相关性在嵌入信息前后的变化,以实现对隐蔽信息的检测。

4.1 区域内像素相关性分析

4.1.1 区域相关性定义

借鉴平滑度检测算法[15]中对图像区域平滑度的定义,以8邻域内像素与中心像素的像素值差值定义区域内像素相关性,以 xi,j表示位置(i, j)处的像素值,定义8邻域内像素间的相关性为T,T值定义参见式(1)。

T值绝对值的大小反映了8邻域内像素间相关性的强弱,T值的绝对值越小说明像素的相关性越强,反之则越弱。自然图像可视为一个局部平稳的信源,在图像某一个区域内的像素之间具有很强的相关性,局部区域内的像素具有近似平稳性,即是说局部区域内的像素数据的统计特性变化很小,这意味着在自然图像当中T值的绝对值一般会很小。在对自然图像建模的研究中,一般认为随机变量T近似服从广义的拉普拉斯分布,其概率密度函数f(t)为式(6),其中v为形状因子,Γ()⋅为伽马函数,f(t)具有如下性质:

2) T的数学期望应为0,意味着T的概率分布

图2示意了512×512的标准图Lena的T值的直方图分布,以H(i)表示T值的直方图,图中示意了经过统计T值分布的最大值出现在 Hmax= H(0) = 5 305,均值E[T]=0,可看出T值很好地符合了均值为0的广义拉普拉斯分布。

图2 标准图Lena的T值分布示意图

4.1.2 LSB匹配嵌入对区域相关性的影响

LSB匹配以嵌入率p嵌入信息,有(1-p/2)的像素保持不变,其余p/2的像素的LSB由0变为1(像素值增加1),或由1变为0(像素值减小1),对于局部区域内的像素,由于像素值+1或-1的概率均为0.5,因此像素值增加1的像素数与像素值减小1的像素数在概率上近似相等,这使得当前像素的邻域内像素值之和在嵌入信息后近似保持不变,T值是否发生改变就取决于当前像素是否发生了改变。

令x表示当前像素的像素值,x的转换概率决定了T值的转换概率,x向x-1、x+1和x转换,T值与x等概地向T-8、T+8和T转换,二者的转换概率模型如图3所示。

对图2中的Lena以随机嵌入方式按式(3)嵌入信息,图4给出了嵌入率为50%和100%时T值直方图分布,可看出,LSB匹配使T值直方图在峰值位置出现一个明显的凹陷,由广义拉普拉斯的单峰分布变为双峰值分布,通过观察T值分布的差异,可觉察隐藏信息的存在。

图3 8邻域中心像素x的转换概率决定T值的转换概率

图4 标准图Lena在不同嵌入率下的T值分布

4.2 基于区域相关性的检测算法

根据LSB匹配嵌入造成的T值分布的差异,设计针对基于式(3)的随机性准则的 LSB匹配的检测算法。

4.2.1 检测算法流程

以H表示T值的直方图分布,正常图像的H具有明显的单峰值分布,载密图像的H往往出现一个明显的波谷而呈现双峰值分布,检测算法就是通过判断H是否具有双峰值,实现对LSB匹配的检测。

H一般都具有关于某个点的对称性,根据这种对称性,首先统计H的最大值Hmax,确定比例参数σ,以σHmax截取H获得一个截取区间,以截取区间中点为界将截取区间分为2个子区间,分别统计2个子区间内H的最大值Hmax1与Hmax2,以及截取区间中点处 H的分布 Hmid,计算 Hmax1/Hmid与Hmax2/Hmid。当H分布是单峰值分布时,Hmax1、Hmax2应该很接近Hmid,2个比值接近于1;当H是双峰值分布时,Hmax1、Hmax2应该大于Hmid,2个比值大于1,因此通过比较Hmax1、Hmax2与Hmid的相对大小可判断H是否具有双峰值,从而实现对LSB匹配的检测。检测算法流程如下。

1) 对检测图像逐像素移动,按式(1)计算像素对应的T值,统计T值的分布H,并计算H的最大值Hmax,由T值的分布规律可知,T值主要分布在以0为中心的一定区域内,只有极少数像素对应的T值处于该区域之外,为消除主要分布区间以外的个别可能具有较大 T值的像素点的影响,只对i∈[-600, 600]以内的H(i)进行统计。

3) 计算截取区间[C1, C2]的中点Cmid处的分布Hmid,同时计算截取子区间[C1, Cmid]与[Cmid, C2]内的最大值Hmax1、Hmax2。

4) 计算 2个截取子区间内最大值与截取区间中点值的比值:取二者较大值

5) 确定判决阈值Rt做判决,如果R>Rt,判决图像为载密图像,否则判为非载密图像。

4.2.2 T值分布的进一步分析

T值分布一般符合均值为0的广义拉普拉斯分布,经过对大量图像的统计发现T值的分布还具有以下2个特点∶

2) H整体具有较为规则的分布,直观上直方图在最大值的两侧总体是单调递增和单调递减的,但在小区域内由于存在大量噪声,并不是严格递增和递减的。

此外,经过对多种类型图像的统计发现,T值分布不总是对称的,某些图像的T值并不符合均值为0的广义拉普拉斯分布,记T值分布在其主要分布区间[-150,150]内的峰值为P=H(peak),对于直方图不符合均值为0的广义拉普拉斯分布的图像,peak将大于0或小于0。

图5给出了纹理图texture的T值分布,经过统计 H均值为 0,在 0处出现[-150,150]的极大值Hmax=H(0)=1 422。用Ht截取H,计算2个截取子区间内的极大值与截取区间中点值的比值R1、R2,按检测算法的分析,对于载体图像R1与R2应很接近1,但由于H不关于0对称,截取区间[C1,C2]也不关于0对称,如图5(b)所示,C1=-96,C2=54,Cmid=-21,截取子区间的2个极大值Hmax1与Hmax2中,Hmax1与Hmid比较接近,而Hmax2将明显大于Hmid,这使得 R1接近于 1,而 R2明显大于 1,此时根据R=max(R1, R2)来判断图像是否是载密图像将产生误判。分析载密图像的T值,其分布同样不具对称性,经过对大量图像的统计,载密图像的直方图一般在0附近出现一个明显的波谷,如图5(c)所示,H的波谷出现在以0为中心的一个小邻域内,由于波谷位置与峰值位置不一致,截取区间[C1,C2]同样不具对称性(C1=-27,C2=-99),并且其中一个子区间内取得极大值Hmax2的点max2与截取区间中点Cmid重合,此时的 Hmax1与 Hmid比较接近,而Hmax2=Hmid,使得R1接近于1,而R2=1,某些图像甚至出现[C1,C2]整个区间位于了波谷的一侧,此时判断图像是否是载密图像将产生漏判。

图5 纹理图texture原始图像与载密图像的T值分布

根据上述分析,可知在检测过程中存在以下 2点干扰:

1) 直方图噪声的干扰,包括0处明显高于其余分布的极大值H(0)与小区域内的直方图噪声;

2) 直方图分布的不对称性,载体图像的单峰值位置由于偏离了0而易引起误判,载密图像的双峰值分布由于不具有关于0的对称性而易产生漏判。

4.3 改进的检测算法

为排除T值分布的不规则性对检测的影响,对检测算法进行2点改进:

1) 针对直方图噪声的干扰,对直方图进行滤波的预处理,目的在于滤除异常极大值和噪声的影响,预处理流程为去除异常极大值→均值滤波→重采样;

2) 针对直方图分布不对称的影响,对载密图像需要找到正确的波谷位置,从波谷位置开始向两侧寻找直方图分布的极大值,利用2个极大值与波谷值的比值实现对载密图像的正确检测。

4.3.1 直方图预处理

预处理采用直方图滤波的方式去除噪声,包括:去除异常极大值→均值滤波→重采样。

T值直方图H分布区间理论上为[-2 040,2 040],但经过大量实验发现,在一定的区间之外直方图分布一般趋于 0,并且可能存在噪声,为消除这些干扰,本文只对主要分布区间[-600,600]内的直方图进行去除异常极大值、均值滤波以及重采样处理,其余分布区间内的直方图不作处理。

1) 去除异常极大值

无论 H是否符合均值为 0的广义拉普拉斯分布,在0处总会出现一个明显高于其他分布的极大值,去除异常极大值的方法如下。

① 统计直方图在[-600,600]内最大值位置max∶ Hmax=H(max),计算 max与 max-1 分布的比值:r=H(max)/H(max-1);

② 如果r值较大,说明H(max)是一个异常极大值,否则说明直方图中不存在异常极大值。设定一个阈值t作为判断r大小的标准,当r>t时(t=1.2),以 max-1的分布替换 max的分布:H(max)=H(max-1),通过以上替换可有效去除异常极大值。

此外,也可采用对[-600,600]内的 H 统计前后分布的比值,通过观察是否出现异常大的比值来判断异常极大值的位置,但这种方法计算量较大,同时实验发现异常极大值的位置总是出现在最大值Hmax所处的max位置,因此只需判断Hmax是否是异常极大值即可。

2) 均值滤波

均值滤波原理是利用一个滑动窗口在直方图分布区间上逐点移动,对当前的每一个分布H(i),计算H(i) 所对应的滑动窗口的直方图分布均值,再以均值替换当前直方图的分布H(i),均值滤波可有效地消除局部区域内的噪声,使直方图整体趋于平滑,为后续的检测减少误判与漏判打下基础,具体描述为如下。

① 设定一个长度为 L的滑动窗口,从直方图分布区间左端起点开始,即从k = -600开始,对直方图的每一个分布H(i),计算滑动窗口内直方图分布的均值∶

② 以Hmi替换H(i),完成对当前第i个分布的均值滤波,滑动窗口移至下一分布H(i+1),判断是否有i+1≤600-L+1,是,则继续①操作,对H(i+1)做均值滤波,否,则说明完成对整个直方图的均值滤波。

3) 重采样

对直方图的重采样同样是利用一个滑动窗口在分布区间内移动,每次移动的距离为窗口的长度,计算窗口内直方图分布的均值,再以均值代表滑动窗口内所有的直方图分布,这等同于将分布区间长度为N的直方图以长度为L的滑动窗口做重采样,重采样后的直方图分布的分布区间长度变为N /L,具体描述如下。

① 设定一个长度为 L的滑动窗口,从直方图分布区间左端起点-600开始,计算滑动窗口内直方图分布的均值:

② 以miH′代表滑动窗口内的直方图分布,令H’(i)为重采样后的直方图,以miH′作为当前窗口内直方图分布,即将当前窗口内的L点分布重采样为l(l=N/L)点分布。

③ 采样完毕将滑动窗口向右移动 L点,判断是否有(i+1)L-1≤600,是,则继续①操作,否,则说明已完成对整个直方图的重采样。

图6给出了图5中texture经过去除异常极大值→均值滤波→重采样的预处理后的 T值直方图分布,可看出预处理有效地消除了异常极大值以及小区域内的噪声,直方图分布平滑,均值滤波与重采样的滑动窗口长度均设为 3,重采样将直方图的分布区间由[-600,600]缩减为[-200,199],分布区间缩减虽然减少了分布点数,但同时也减少了可能存在的噪声的影响。

4.3.2 改进的检测算法

检测算法的思想是通过计算2个截取子区间内的极大值与截取区间中点值的比值来判断是否存在明显的波谷,但由于T值直方图的差异,对于直方图分布不具对称性的图像,由于波谷位置偏离截取区间中点,上述判断方法将很易产生误判或漏判,因此检测算法需要改进的主要问题就在于找到真正的波谷位置。

图6 纹理图texture经过预处理的T值分布

经过大量实验发现,载密图像的波谷通常都出现在以0为中心的一个小邻域内,因此以0为起点,在一定邻域[-θ,θ]内寻找直方图分布的极小值即可找到真正的波谷位置。根据以上分析,改进的检测算法流程如下。

1) 统计检测图像的T值直方图H,对H做预处理∶去除异常极大值→均值滤波→重采样,均值滤波与重采样的滑动窗口长度设为3;

2) 以 Ht= σHmax(0<σ<1)为截取阈值截取 H,记录截取起点与截取终点C1与C2,如果截取区间[C1,C2]是关于0对称的,则采用4.2.1节的检测算法计算 2个子区间内极大值与波谷值的比值 R1′与 R2′,转至5),否则继续步骤3);

3) 以0为起点,在小邻域[-θ,θ]内寻找H的极小值Hmin,Hmin即为H的波谷值,记录波谷位置min,用min将截取区间分为2个子区间[C1,min]、[min,C2];

4) 统计[C1,min]与[min,C2]内的极大值 Hm′ax1、Hm′ax2,计算2个子区间内极大值与波谷值的比值:R1′= Hm′ax1/Hmin, R2′= Hm′ax2/Hmin;

5) 确定判决阈值Rt做判决,根据[C1,C2]是否关于 0对称来决定判决准则,当对称时,取R′=max(R1′, R2′),否则取R′=min(R1′, R2′),如果R′≥Rt,判决为载密图像,否则判为非载密图像。

4.4 实验结果与分析

4.4.1 典型图像实验结果

为测试本文检测算法的性能,对5幅512×512的标准灰度图像(图2(a)、图5(a)、图7)进行测试,以基于局部区域相关性的 LSB匹配算法(即式(3))随机位置嵌入信息,嵌入率依次为 0%、10%、20%、…、100%,嵌入的信息为伪随机的 0、1比特序列。

检测中直方图的截取门限比例σ的大小与检测的准确性密切相关,对于T值分布不关于0对称的图像,如果σ过大,则可能截取区间错过了波谷而引起漏判,反之如果σ过小,则可能截取区间中点位置偏离单峰值位置过大而引起误判,因此需要适当地设置σ的大小。其次,检测判决阈值Rt也将影响检测的准确性,过低或过高的Rt会引起检测的误判或漏判,由检测算法分析可知Rt>1,经过实验,令σ = 0.45,Rt=1.1可降低漏判与误判的概率。经过实验,在检测步骤 3)中邻域[-θ,θ]的大小令 θ=3即可保证经过较少次数的比较,就能够找到直方图真正的波谷位置。

图7 测试用标准灰度图

图8 测试图像Lena、texture、peppers、baboon、girl的载体图像与载密图像的直方图在经过直方图预处理后的分布

表1 测试图像的截取区间[C1,C2],波谷位置min以及H1与H2,p表示嵌入率

图8示意了测试图像的Lena、texture、peppers、baboon、girl的载体图像,以及嵌入率分别为50%和100%时的载密图像的T值直方图在经过去除异常极大值→均值滤波→重采样的预处理后的分布,图中水平方向的虚线表示截取直方图的截取门限,垂直方向的3条虚线从左至右分别表示截取区间的起点、所找到的波谷位置以及截取区间的终点。令[C1, C2]表示截取区间,min表示波谷位置,H1与H2表示在截取区间的起点与终点处直方图的分布,E[T]表示T值的均值,表1给出了5幅测试图像在σ = 0.45下上述5个参数的大小。

表2给出了利用改进的检测算法得到的5幅测试图像在不同嵌入率下的R1与R2,以及最终的判决统计量R,表中以J表示判决结果,J = 1表示判决为载密图像,J= 0表示判决为非载密图像,其次,以S表示图像的T值直方图是否关于0对称,S = 1表示直方图是关于0对称的,S = 0表示直方图是非对称的。

结合图8中的直方图分布,表1的数据表明无论是对关于0的对称的T值直方图(Lena,baboon,pepper,girl),或是对不关于0对称的 T值直方图(texture),本文的方法均能正确确定波谷位置,此外测试图像的载体图像与载密图像的T值均值均为0,截取区间的起点与终点绝对值的差值在±1之间,基本是关于0对称的,截取区间两端的分布值也趋于相等(纹理图texture除外),很好地验证了T值直方图的广义拉普拉斯分布特性。

表2中的数据说明,本文的检测算法对基于局部区域平滑度的LSB匹配算法,对原始的载体图像没有出现误判,当嵌入率高于40%时,可对载密图像进行准确的检测判决,在5幅测试的典型图像中,对于 texture可准确检测嵌入率高于 20%的载密图像,对baboon与peppers,可达到有效检测的最低嵌入率为30%,对girl与Lena,有效检测的最低嵌入率分别为40%与50%。

4.4.2 性能分析

4.4.2.1 性能比较

目前针对灰度图像LSB匹配算法的检测算法主要有强针对性算法,如基于HFC系列算法与基于汉明距离统计的检测算法[16]等,以及基于SVM的通用检测法,与已有算法相比,本文算法在保证较高检测正确率的同时,具有算法复杂度低的优势。

1) 检测正确率比较

已有的HCF系列算法[6,7]针对LSB匹配算法的有效检测最低嵌入率为30%,当嵌入率低于30%时,检测结果的正确性大大降低,基于汉明距离统计的检测算法有效检测的最低嵌入率为40%,另外的相邻颜色数[4,5]的检测算法并不适用于灰度图像,本文算法适用于灰度图像,对于原始图像和嵌入率高于30%的载密图像,检测结果是可靠的,具有与已有算法相当的检测性能,对于某些图像可实现对最更低嵌入率的准确检测,对纹理图texture准确检测的最低嵌入率为20%,通过对大量图像的实验,也验证了本文算法对原始载体图像的低误检率以及对高嵌入率的载密图像的高检出率。

2) 算法复杂度比较

HCF COM系列算法需要经过二维直方图统计,再利用二维DFT计算二维的HCF COM,而通用检测的方法[8~14]需要提取多维特征矢量,再经过大量的先验样本训练确定检测模型,上述算法的运算量都比较大,尤其是通用检测算法。而本文算法只对一维直方图统计波峰与波谷的分布情况,从检测图像的直方图中直接提取统计量,不需正交变换过程,也不需经过训练,因此本文算法较已有的检测方法具有运算复杂度低,速度快的优势,可保证检测的实时性。

4.4.2.2 改进方向

随着嵌入率降低,算法漏判的概率增大。检测算法的基础是基于对图像的T值直方图中是否存在波谷的判断,以图2中的标准图Lena为例,图9示意了嵌入率为20%、30%时T值原始直方图以及经过预处理后的直方图。

由图9(a)与图9(c)可看出,载密图像的T值分布在均值附近的峰值的尖锐程度降低,开始出现向下凹陷的趋势,随着嵌入率的提高,向下凹陷的趋势增大,直至出现明显的波谷,但嵌入率越低,直方图的波谷逾不明显;另一方面,由于对预处理流程中对直方图做重采样,重采样的结果使直方图的分布区间缩减,由图9(b)与图9(d)可看出,虽然缩减分布区间有助于消除分布区间内的噪声,但同时也进一步减弱了波谷现象,甚至抹去了波谷。综合以上2方面的原因,低嵌入率下的T值直方图的波谷现象明显减弱,大大增加了峰值数判断的难度,从而导致了对载密图像产生漏判。如何实现对低嵌入率的准确检测,是本文的进一步研究方向。

表2 不同嵌入率p下5幅测试图像的R1、R2、R,T值直方图的对称情况以及检测判决结果

图9 图Lena当p==20%与p=30%(p为嵌入率)时的T值直方图以及经过预处理后的T值直方图

5 结束语

本文介绍了典型的LSB匹配算法,分析了LSB匹配机制中像素值的转移概率模型,根据该转移概率模型讨论了LSB匹配相对于传统的LSB替换的改进,如何实现对LSB匹配的可靠检测仍是隐写分析领域的难点之一,本文介绍了目前主要的LSB匹配检测方法,包括 Westfeld[4]提出的基于相邻颜色数的检测方法、Harmsen[6]与Ker[7]的基于HCF的检测方法,以及基于多种特征提取的通用检测法。

针对基于局部区域像素平滑度的 LSB匹配算法,本文提出了一种基于区域相关性的检测算法,以8邻域内像素与中心像素的像素值差值定义区域内像素间的相关性,以相关性为检测统计量,通过观察该统计量的直方图分布在嵌入信息前后的差异实现对LSB匹配的检测。实验结果表明,本文检测算法对较高嵌入率(p>0.3)的 LSB匹配嵌入具有较高可靠性,与已有算法相当,同时对载体图像具有低误检率,并且复杂度低,运算简单,但对于低嵌入率(p≤0.3)易产生漏判,这也是本文检测方法的主要改进方向,如何实现对低嵌入率,尤其是小嵌入率(p < 0.1)的可靠检测,将是进一步的研究方向。

[1] 陈铭,平西建. 基于Arnold变换的图像信息伪装算法[J].计算机应用研究, 2006, 23(1)∶ 235-238.CHEN M, PING X J. Image steganography based on arnold transform[J]. Application Research of Computers, 2006, 23(1)∶ 235-238.

[2] 陈铭, 平西建. 基于Arnold变换与改进LSB嵌入方案的信息伪装算法[J]. 计算机工程与应用, 2005,41(28)∶ 37-40.CHEN M, PING X J. Steganography based on arnold transform and modified LSB embedding[J]. Computer Engineering and Applications,2005, 41(28)∶ 37-40.

[3] ANDREW D K. Improved detection of LSB steganography in grayscale images[A]. Proceedings of International Workshop on Information Hiding[C]. Toronto, Canada, 2004. 97-115.

[4] WESTFELD A. Detecting low embedding rates[A]. Proceedings of 5th International Workshop on Information Hiding[C]. Noordwijkerhout, 2002. 324-339.

[5] KER A. Resampling and the detection of LSB matching in color bitmaps[A]. Proceedings of Security, Steganography, and Watermarking of Multimedia Contents VII[C]. San Jose, California, 2005.1-15.

[6] HARMSEN J, PEARLMAN W. Higher-order statistical steganalysis of palette images[A]. Proceedings of SPIE Electronic Imaging[C].Santa Clara, CA, 2003. 178-190.

[7] KER A. Steganalysis of LSB matching in grayscale images[J]. IEEE Signal Processing Letters, 2005, 12(6)∶ 441-444.

[8] TARAS H, JESSICA F, DAVID S. Stochastic approach to secret message length estimation in ±k embedding steganography[A]. Proceedings of Security, Steganography, and Watermarking of Multimedia Contents VII[C]. San Jose, California, 2005.673-684.

[9] JESSICA F, DAVID S, MIROSLAV G. Maximum likelihood estimation of length of secret message embedded using ±k steganography in spatial domain[A]. Proceedings of Security, Steganography and Watermarking of Multimedia Contents VII[C]. San Jose, California, 2005.595-606.

[10] LIU Q Z, SUNG A H, RIBEIRO B M. Image complexity and feature extraction for steganalysis of LSB matching steganography[A]. Proceedings of 18th International Conference on Pattern Recognition[C].Hong Kong, China, 2006. 267-270.

[11] LIU Q Z, SUNG A H, CHEN Z X. Feature mining and pattern classification for steganalysis of LSB matching steganography in grayscale images[J]. Pattern Recognition, 2008, 41(1)∶ 56-66.

[12] SURESH V, SOPHIA S M, MADHAVAN C E V. Resampling operations as features for detecting LSB replacement and LSB matching in color images[A]. Proceedings of Multimedia Content Representation,Classification and Security[C]. Berlin, 2006. 249-256.

[13] ZHANG J, COX I J, DOERR G. Steganalysis for LSB matching in images with high-frequency noise[A]. Proceedings of IEEE 9th Workshop on Multimedia Signal Processing[C]. Shanghai, 2007. 385 -388.

[14] MARVEL L, HENZ B, BONCELET C. A performance study of ±1 steganalysis employing a realistic operating scenario[A]. Proceedings of IEEE Military Communications Conference[C]. Orlando, Florida,American, 2007. 1-7.

[15] 张涛, 平西建, 徐长勇. 基于图像平滑度的空域LSB嵌入的检测算法[J]. 计算机辅助设计与图形学学报, 2006, 18(10)∶ 1607-1612.ZHANG T, PING X J, XU C Y. Detection algorithm for spatial lsb embedding based on image smoothness[J]. Journal of Computer aided Design & Computer Graphics, 2006, 18(10)∶ 1607-1612.

[16] 徐旭,平西建,张涛等. 基于汉明距离统计的隐写分析算法[J]. 信息工程大学学报, 2008, 19(1)∶ 27-30.XU X, PING X J, ZHANG T, et al. Steganalysis method based on hamming distance statistics[J]. Journal of Information Engineering University, 2008, 19(1)∶ 27-30.

猜你喜欢

波谷极大值直方图
符合差分隐私的流数据统计直方图发布
板厚与波高对波纹钢管涵受力性能影响分析
梅缘稻
一道抽象函数题的解法思考与改编*
用直方图控制画面影调
中考频数分布直方图题型展示
基于音节时间长度高斯拟合的汉语音节切分方法
基于空间变换和直方图均衡的彩色图像增强方法
基于小波模极大值理论的励磁涌流新判据研究
基于经验模态分解的自适应模极大值去噪方法