一种有效的中值滤波图像盲取证检测方案
2017-03-28,
,
(黄淮学院动画学院,河南 驻马店 463000)
0 引 言
近年来,随着数字信号处理技术的发展以及专业图像编辑软件的普及,图像变得越来越容易被修改,以致其真实性愈来愈受到质疑,因而迫切需要取证技术对图像的真实性进行检测鉴别。其中,盲检测图像取证技术由于其不依赖于对原始图像的任何预处理,具有很高的实用性,已经成为了研究的热点[1]。对于数字图像取证来说,恢复图像的操作历史将有助于实现鉴别的目标,因此需要检测图像可能经历过的操作(如中值滤波、重采样、JPEG压缩、对比度增强等)。中值滤波一般被广泛地应用于信号的去噪和平滑处理,然而由于中值滤波具有的高度非线性,近年来也被应用于反取证技术中,使其成为了用于消除其它图像操作所留痕迹的有效工具,因此对中值滤波进行盲检测变得尤为重要。在实际应用中,中值滤波检测器通常面临两个严峻的问题:一是低分辨率的问题,这种情况当图像中只有部分区域经过滤波时就会出现,此时由于缺乏足够的样本,使得一些统计量无法可靠地估计,将导致检测器失效;二是JPEG压缩问题,图像通常是以JPEG格式保存和传输的,而压缩过程中的量化操作将有可能破坏中值滤波留下的痕迹。目前,已有相关的国内外研究者提出了一些关于中值滤波的检测方法。例如,Kirchner等人[2]最早提出通过图像一阶差分直方图中0和1的数量比来实现中值滤波检测,同时采用差分像素邻接矩阵(SPAM)特征克服JPEG压缩的影响。Cao等人[3]采用图像纹理区域一阶差分中零值的概率作为特征,但该方法仅适用于无压缩图像上的中值滤波检测。Yuan[4]提出了基于排序统计特性和灰度值的特征,该方法能处理图像局部区域经过中值滤波的情况,但在深度JPEG压缩时性能明显下降。Kang等人[5]采用自回归(AR)模型刻画图像的中值滤波残差(MFR)同时提取AR系数作为特征,该方法对JPEG压缩具有较强的鲁棒性,但在低分辨率图像上性能较差。Chen[6]提出了由全局概率特征(GPF)和局部相关特征(LCF)组成的GLF特征,在JPEG压缩或低分辨率的情况下可以取得较好的检测性能。然而在低分辨率JEPG压缩图像上检测中值滤波依然具有挑战性,为更好地解决数字图像取证中的中值滤波检测问题,给出了一种有效的数字图像取证盲监测方案(effective Blind Detection scheme of Digital Image Forensics,BDDIF),该方案从图像差分域为切入点来分析中值滤波引入的相关性,然后采用线性预测模型和旋转不变LBP算子描述相关性,提取出线性预测系数和归一化直方图特征,构成线性与非线性描述子,将两者结合起来增强中值滤波监测的性能。实验结果表明:与现有的检测方法相比,所给算法可以显著地提升中值滤波检测的性能,尤其是在低分辨率的JPEG压缩图像上,因此具有非常重要的理论意义和研究价值。
1 BDDIF方案设计
在数字图像上,二维中值滤波的具体处理过程是:选取一种滤波窗口,令其在图像上滑动,滑动过程中对滤波窗口所包含的像素值进行排序,然后取出中值替代滤波窗口中心点对应位置上的像素值。例如:一幅大小为M×N的图像,其对应的中值滤波图像式(1)所示:
g(m,n)=median{f(r,c)|(r,c)∈Ωm,n}
(1)
其中,Ωm,n表示位于坐标(m,n)上的滤波窗口。
由于中值滤波是按滤波窗口依次进行处理的,它在图像相邻像素之间引入了复杂的相关性,这种相关性在图像的差分域中也同样存在。因此,为了降低图像内容对检测算法的不良影响,所给BDDIF算法在k阶差分图像中进行检测,则图像差分的定义如式(2)所示:
(2)
1.1 线性描述子
文献[7]指出脉冲噪声会在信号中引入异常的不连续性,并且在信号经过差分之后,这种不连续性将会更加明显,通过采用线性预测模型描述信号的相关性,从而实现了一个脉冲噪声检测系统。由于中值滤波具有能够有效去除图像中脉冲噪声的特性,所以可通过引入线性预测模型来描述像素间的线性相关性,刻画出原始图像和中值滤波图像之间的差异,从而实现中值滤波的检测。其中,中值滤波检测的线性预测模型如式(3)所示:
(3)
(4)
然后最小化残差平方和,则有
α=〈U,U〉-1UTv
(5)
其中,U=[u1,u2,…,uη]T,v=[v1,v2,…,vη]T,〈·,·〉表示内积运算。
可以对给定的差分方向在相邻的像素差值上建立线性预测模型。假定沿着给定方向计算得到的像素差分都共用同一个模型,那么它们也共用同一组线性预测系数。为了估计线性预测系数,需要从差分图像上获取观测数据U和v。首先,沿着某个方向对图像进行差分得到差分图像。然后,沿着同样的方向用宽度为W的一维窗口在差分图像上滑动,每滑动一次就将窗口中的值取出来,作为矩阵Y中的一行。如图1所示。根据测试图像的大小不同,所采用的滑动方式也不相同。在默认情况下窗口之间不相互重叠,但是当测试图像的尺寸小于64×64时,为了能够获得足够多的观测数据来保证估计的准确性,则需采用相互重叠的滑动窗口。其中,矩阵Y的前W-1列即为所需的观测数据U,Y的最后一列即为所需的观测数据v,则采用式(5)即可估计出该方向对应的线性预测模型的系数。
图1 观测数据获取过程
假定自然图像的空域统计特性对于镜像和翻转具有对称性,则对于第k阶差分图像可以将水平和垂直方向、主对角线和次对角线上的线性预测系数分别作平均,从而降低特征的维数,则第k阶线性描述向量如式(6)所示:
(6)
最后,将所有K个线性描述向量合并即构成线性描述子L,且有L=[L1,L2,…,LK],为2K(W-1)维向量。其中,为了取得好的检测效果且兼顾计算效率,将参数{K,v}设置为{2,3}。
1.2 非线性描述子
在构造线性描述子时仅仅只考虑沿着同一个方向上的像素差分之间的相关性,下面则需要进一步研究沿着不同方向计算出来的像素差分之间所具有的相关性。中值滤波是高度非线性操作,具有改变像素局部区域排序统计特性的效果,因而可以采用各个方向上像素差分值的正负来刻画这种效果。由于正负符号构成了不同方向上像素差分之间的非线性相关性,假如将正的像素差分映射为1,将负的像素差分映射为0,那么一个像素周围上下左右4个方向像素差分的映射值就形成一个模式可以反映中值滤波的影响。如果进一步将符号映射推广到更多的方向上,将等价于Ojala等人[8]提出的局部二值模式(LBP),从而可以引入LBP来捕捉像素差分之间的非线性相关性。最原始的LBP算子是以一个像素点为中心,计算不同方向上邻近像素点与中心像素点之间的差值并进行阈值化,分配2的不同次幂作为权重,最后求出总和作为该中心像素点的标记值。假定将某个像素点I(m,n)作为中心(记为gc),则该点对应的LBP值如式(8)所示:
(8)
其中,R表示半径,即周围像素点与中心像素点之间的距离,P表示邻近像素点的总数,gp表示邻近像素点的像素值,s()为阈值化函数,且其定义如式(9)所示:
(9)
将参数{P,R}设置为{8,1},表示考虑像素点周围8个方向上距离为1的邻近像素点。原始LBP标记值总共有28=2562种,描述了周围像素值大小分布的所有可能情况。实际上通过适当的合并可获得更加紧凑的表达。首先,根据周围像素值的大小分布情况,LBP可以分成“统一型”与“非统一型”两种类型。当且仅当满足式(10)时,LBP被称作是统一型的。
(10)
(11)
给定一幅大小为M×N的图像,应用旋转不变LBP算子,每一个像素被赋予(0,P+1)之间的标记值,即可得到一幅标记图像Iq(m,n),其归一化直方图H=[h1,h2,…,hP+1]可以通过式(12)计算:
(12)
1.3 新方案增强特征LN
虽然上述构造的两个描述子都能用于检测图像是否经过中值滤波操作,但两者之间也存在差异。首先,它们分别利用了图像差分域不同部分的信息。线性描述子L描述了沿着相同方向计算得到邻近差值之间的线性相关性,而非线性描述子N考虑的是多个方向上差值的非线性相互关系。其次,它们利用了中值滤波的两种不同特性。线性描述子L利用了中值滤波的去噪和平滑特性,而非线性描述子N则反映了中值滤波对图像局部排序统计特性的影响。最后,它们在解决实际应用中遇到的问题时各有其优势。线性描述子L对于JPEG压缩更加具有鲁棒性,而非线性描述子N在低分辨率图像上具有较好的性能。因此,通过将线性描述子L和非线性描述子N组合起来相互补充,可以构成一个更加有效的特征,尤其是对于经过JPEG压缩的低分辨率图像具有更好的性能。
通过组合线性描述子L和非线性描述子N,构造了一个维数为18的特征向量,该特征描述了中值滤波给图像引入的复杂相关性,能够有效地将中值滤波图像和原始图像区分开来。同时,由于原始图像与其对应的中值滤波图像上提取出来的特征之间有较大差异,而连续两次中值滤波图像所提取出来的特征差别较小,所以在人为施加中值滤波的图像上提取出的特征能够提供有助于中值滤波检测的额外信息。因此,对于一幅测试图像,一方面除了直接在原图像上提取出一组特征外,另一方面还需要在测试图像上人为施加一次中值滤波(一般常采用3×3滤波窗口)提取出另外一组特征。最后,将两组特征组合起来即构成一个增强特征LN,此时其维数为原特征维数的两倍(36维)。
2 实验结果
为评估所给中值滤波检测算法的性能,将BDDIF方案同基于GLF与MFR特征的方案在无压缩的图像、有压缩的图像和低分辨率压缩的图像上的检测结果进行比较。实验采用的图像库是通过合并BOWS2[9]、NRCS[10]和DID[11]三个不同的图像库所得到的,且这三个图像库均已被广泛用于图像取证和隐写分析领域。首先,分别从这三个图像库中随机选取3000张图像组成一个9000张的大图像库,每一张图像都修改成大小为512 × 512的灰度图,即构成一个原始图像集合,记为DORI。然后,分别对DORI中的图像进行不同的处理以生成不同的实验图像集。其中,DMF3和DMF5是经过3×3和5×5中值滤波得到的图像集合,DAVE中的图像是通过均值滤波得到的,滤波窗口随机选择3×3或5×5,DGAU中的图像是通过高斯滤波得到的,滤波参数随机设为0.5或0.8,DRES中的图像是通过缩放得到的,缩放比例随机设为1.1或1.2,插值方法随机选择最近邻插值或双线性插值。同时,分别从DMF3和DMF5中随机选出二分之一数量的图像组成图像集合DMF35,分别从DORI、DAVE、DGAU、DRES中随机地选择出四分之一数量的图像组成图像集合DALL。下面图3给出了8个图像集合所构成的训练-测试对示意图(实线相连的两个图像集合表示为一个训练-测试对),其中每个训练-测试对中40%的图像作为训练集,剩余60%的图像则作为测试集。实验步骤具体过程如下:
图3 图像集合组合形成的训练-测试对示意图
第一步:对训练-测试对的图像进行预处理,例如剪切、压缩等;
第二步:提取训练集图像的特征向量作为支持向量机[12]的输入,使用C-SVM作为分类器(其中,C>0是误差惩罚项),选择RBF作为核函数,即K(xi,xj)=exp(-γ‖xi-xj‖2),网格定义为(C,γ)∈{(2C,2γ)|-5≤C≤5,-5≤γ≤5,C,γ∈}来执行网格搜索,在每个网格点上进行4重交叉验证,找到最优参数(Co,γo);
第三步:采用最优参数在完整的训练集上训练分类器;
第四步:提取测试集图像对应的特征向量,用训练好的分类器进行分类检测,通过受试者操作特性曲线及曲线与横轴围成的面积评估检测器的性能。
2.1 无压缩图像上的性能比较
将每个训练-测试对中的图像都剪切为B×B大小,其中B∈{512,32,16},然后在图像上分别提取GLF、MFR、LN三种特征用于训练和测试。三种特征在不同分辨率图像上的中值滤波检测结果如表1所示(其中黄色项表示每组对比结果中的最优值)。可以看出,图像分辨率为512×512时,GLF、MFR、LN三种特征的AUC都在0.994以上,具有很好的检测性能,尽管提取的LN特征性能较好,但差别并不是很明显。然而,在实际应用中很可能只有图像的局部是经过中值滤波处理的。例如,当伪造者将一幅图像的部分区域剪切并粘贴到另一幅图像上时,为了不留下明显的粘贴痕迹,伪造者有可能对粘贴区域的边缘进行中值滤波以使图像过渡更加平滑。由于通过对测试图像分块并检测中值滤波,就可以实现对篡改区域的定位。因此,在低分辨率越低的情况下,中值滤波检测器的性能越好,定位篡改区域的精度也就越高。当图像分辨率低于32×32时,MFR特征的性能明显下降,GLF特征和LN特征的性能尚无明显变化。当图像分辨率为16×16时,MFR特征的AUC仅有0.87,GLF特征和LN特征则分别达到0.995和0.998。在区分低分辨率中值滤波的图像和经高斯滤波、均值滤波、缩放处理的图像实验中,LN特征和GLF特征的性能同样优于MFR特征。当图像分辨率为16×16时,LN特征和GLF特征的AUC均保持在0.99以上,而MFR特征的AUC最高仅有0.937(训练-测试对MF5 vs. AVE),最低则为0.768(训练-测试对MF3 vs. AVE)。由此说明,所给LN特征方法对于低分辨率图像上的中值滤波检测具有更可靠的性能。
表1 GLF、MFR、LN三种特征在不同分辨率图像上的中值滤波检测
2.2 压缩图像上的性能比较
将每个训练-测试对中的图像保持原始的512×512大小,然后对训练-测试对中的图像进行质量因子为QF的JPEG压缩,其中QF∈{90,80,70}。GLF、MFR、LN三种特征在不同程度JPEG压缩图像上的中值滤波检测结果如表2所示(其中黄色项表示每组对比结果中的最优值)。可以看出,三种特征对JPEG压缩都具有一定程度的鲁棒性,而所给LN特征的性能相对于GLF特征和MFR特征则更好。同时随着JPEG压缩质量因子的下降,三种特征的性能也都有不同程度的下降,而LN特征的下降幅度要比其余两种特征较小。另外,在区分中值滤波图像和经过其他处理的图像情况下,上述差别则会更加明显。例如,在训练-测试对MF3 vs. RES上,随着JPEG压缩质量因子从90减小到70,GLF特征的AUC则从0.995下降到0.985,MFR特征的AUC则从0.991下降到0.963,而所给LN特征的AUC都一直保持在0.994以上。同样的,在MF5和MF35的情况下也能够观察到类似的实验结果。由此说明,所给LN特征方法在不同的中值滤波窗口中具有更好且更稳定的检测性能。
表2 GLF、MFR、LN三种特征在不同程度JPEG压缩图像上的中值滤波检测
2.3 低分辨率压缩图像上的性能比较
将每个训练-测试对中的图像剪切成B×B的大小,然后对其进行质量因子为QF的JPEG压缩,其中B∈{512,32,16},QF∈{90,80,70}。实验以训练-测试对MF35 vs. ALL为例,则有GLF、MFR、LN三种特征在不同的分辨率以及不同程度JPEG压缩图像上的中值滤波检测结果如表3所示。可以看出,虽然随着JPEG压缩质量因子和图像分辨率的降低,三种特征的中值滤波检测性能都有所下降,但是所给LN特征方法的中值滤波检测性能明显优于其他两种特征。当图像分辨率为16×16时,经质量因子为70的JPEG压缩情况下,LN特征的AUC在0.83以上,而GLF特征和MFR特征的AUC分别仅有0.799和0.66,因此所给LN特征方法的检测结果相较于GLF特征和MFR特征有很大程度的提升。由此说明,所给LN特征方法对于低分辨率以及JPEG压缩图像的中值滤波检测性能具有更强的鲁棒性。
表3 GLF、MFR、LN三种特征在不同分辨率及不同程度JPEG压缩图像上的中值滤波检测(MF35 vs. ALL)
3 结 语
所给出的数字图像中值滤波盲检测方案,首先从图像差分域的相关性着手研究中值滤波操作留下的痕迹,然后在此基础上构造了两种描述子用于分别捕捉中值滤波的不同特性。其中对于沿着特定方向计算得到的差分值采用线性预测模型进行描述,提取预测系数作为线性描述子,描述中值滤波的去噪和平滑特性;对于综合考虑多个方向上计算得到的差值时,通过引入旋转不变LBP算子,再提取出其归一化直方图作为非线性描述子,反映中值滤波对局部排序统计特性的影响。最后将两种描述子结合起来提出增强特征,进一步提高了中值滤波的检测性能。实验结果性能分析表明,所给出的方案优于现有的检测算法,尤其是对于经过JPEG压缩的低分辨率图像上具有更强的鲁棒性。
[1] 唐斌,康宝生,王国栋,等.基于三维网格模型的双重数字盲水印算法[J].计算机过程,2012,38(6):119-122.
[2] Kirchner M, Fridrich J. On detection of median filtering in digital images[C]//SPIE International Conference on Media Forensics and Security П, San Jose, CA, USA, Jan, 2010, 7541.
[3] Cao G, Zhao Y, Ni R, et al. Forensics detection of median filtering in digital images[C]//IEEE International Conference on Multimedia and Expo, Suntec City, Singapore, July, 2010: 89-94.
[4] Yuan H D. Blind forensics of median filtering in digital images[J]. IEEE Transaction on Information Forensics and Security, 2011, 6(4): 1335-1345.
[5] Kang X, Stamm M C, Peng A, et al. Robust median filtering forensics using an autoregressive model[J]. IEEE Transaction on Information Forensics and Security, 2013, 8(9): 1456-1468.
[6] Chen C, Ni J, Huang J. Blind detection of median filtering in digital images: A difference domain based approach[J]. IEEE Transaction on Image Processing,
2003, 22(12): 4699-4710.
[7] Vaseghi S V. Advanced digital signal processing and noise reduction[M]. New Jersey: John Wiley & Sons, 2008.
[8] Ojala T, Pietikainen M, Maenpaa T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.
[9] Hong W, Chen T S. Reversible data embedding for high quality images using interpolation and reference pixel distribution mechanism[J]. Journal of Visual Communication and Image Representation, 2011, 22(2): 131-140.
[10] 汪然,平西建,郑二功.基于直方图局部平滑度的LSB匹配隐写分析[J].应用科学学报,2012,30(1):96-104.
[11] 顾长华,张凤.最优区域与离散小波变换结合的颜色恒常性计算算法[J].燕山大学学报, 2014,38(3):226-232.
[12] 李明,蔡珣.基于支持向量机的多特征彩色图像边缘检测[J].计算机工程与设计, 2012,33(2):639-643.