基于量化表估计的JPEG合成图像盲检测
2015-01-04宋海英
王 艳*,宋海英
(成都工业学院 通信工程学院,成都 611730)
21世纪,数字图像处理技术飞速发展,图像采集设备成本日益降低,图像处理软件的广泛使用给人们的日常生活增添了乐趣,也给某些违法犯罪份子提供了有机可乘。若伪造图像被滥用于科学研究、法庭取证、新闻媒体等方面,将会对社会造成难以估计的负面影响。因此,对图像的真实性、完整性进行取证研究成为当前的迫切需要,具有非常重要的应用价值和现实意义。
JPEG(Joint Phorographic Experts Group)凭借其高压缩比、处理速度快的优点,已成为目前主流的图像压缩标准。因此,针对JPEG图像的盲取证技术研究具有非常重要的实用价值。近年来,针对JPEG图像的盲取证技术取得了很大进展,可以归纳为3类:1)利用图像的块效应特征进行盲取证[1-5];2)利用JPEG图像的头文件信息进行盲取证[6-7];3)利用JPEG图像压缩特点进行盲取证[8-9]。由于块效应特征是JPEG图像固有的本质特征,利用该特点可以找出更准确、更高效、更可靠的图像取证算法。因此,利用块效应特征进行图像盲取证成为国内外学者研究的重点。该方法的关键在于能否准确得到原始图像量化表,本文提出了一种量化表估计方法,将待测图像使用不同的质量因子对应的量化表求取量化误差,通过对量化误差进行极小值判定,得到原始图像量化表对应的质量因子。
1 基于JPEG的图像篡改模型和检测方法
JPEG图像是采用基于离散余弦变换(DCT)的压缩编码系统,编码之前先对图像进行8×8分块,再进行DCT变换以达到减少运算量的目的。由于分块的存在,图像之间原有像素值的相关性降低。在随后的量化阶段中,通过丢弃高频分量以达到压缩图像的目的,高频分量丢失得越多,在重建图像时,块边界处出现不连续跳变的现象越明显,这就是块效应。
JPEG格式的数字图像篡改方式可归为2类[4]:1)JPEG图像复制粘贴:目标图像和背景图像均为JPEG图像,此时又可以分为目标图像和背景图像的压缩质量因子相同或者不相同。2)非JPEG格式区域复制粘贴篡改:背景图像为JPEG格式,目标图像为非JPEG格式,从目标图像复制一部分区域粘贴到背景图像特定位置,再压缩为新图像。
由于块效应是JPEG图像固有的本质特征,基于块效应的盲检测算法试图在空间域或变换域找到一种评价块效应大小的测度。当图像进行复制粘贴篡改时,不同图像块效应网格位置或者质量因子不同,会导致块效应强度不一致,利用这种不一致性可以检测出篡改区域。
文献[5]定义了一种较为直观的块效应测度的方法。对于每个8×8像素块,测试块的块效应估计值为:
式中:D(k)为块中位置k的DCT系数;Q(1∶64)为估计的初始DCT量化表。整幅图像总计有N个像素块,则块效应测度值BAM可以表示为:
由块效应不一致的检测方法可以发现:要能准确检测和定位图像的篡改区域的关键在于能否准确得到原背景图像的量化表。叶水明[5]提出的利用DCT系数直方图的功率谱来估计JPEG图像压缩的初始量化表,在量化因子<80的时候会出现很大的误差。Fridrich[8]提出的方法可以估计经过两次JPEG压缩图像的原始量化表,该方法可以作为JPEG图像篡改检测的辅助手段。扈文斌等[10]提出用迭代方法估算出原始量化表,算法复杂度高。赵彦涛等[11]通过DCT系数直方图估计篡改图像来估计量化表,但是当背景图像和篡改图像质量因子相近时,错误率较高。
2 估算量化表
BAM的物理意义是使用估算出的量化矩阵,对图像数据进行量化求取量化误差。只要估算出的量化表无误,未经篡改的区域的B值相当于第二次量化误差,而篡改区域则是使用量化表Q1量化过一次,再使用另一个全新的量化表Q2量化求取量化误差,由于量化表的改变,篡改区域的量化误差比未经过篡改区域的量化误差大的多。
图1 质量因子为50~90时的BAM值
对一幅无损压缩历史的图像,使用50~99的质量因子对它求BAM值,结果如图1所示。可以发现,对一幅无压缩经历的图片,使用越大的质量因子进行JPEG压缩所产生的量化误差越小。但对一幅JPEG图像使用50~99的质量因子对它求BAM值时,曲线不再是单调递减的,图2是质量因子为95的JPEG图像在各个质量因子下的BAM值。可以发现,经过质量因子Q量化的JPEG图像再使用Q求量化时得到的量化误差是极小的,也就是说使用Q作为估算量化表计算出的BAM值很小,会在曲线中出现极小值。根据上述特点,获得篡改图像的JPEG压缩的量化表的方法为:1)对待测图像使用50~99的质量因子对应的量化表计算BAM值;2)对得到的BAM值进行极小值判定,极小值对应的质量因子为可疑求解点。
图2 质量因子为95时的BAM值
图3 篡改图像的BAM值
将一幅质量因子为87的JPEG图像2复制到质量因子为85的图像1上,再进行质量因子为90的压缩得到篡改图像。根据上述算法,得到篡改图像的BAM值曲线如图3所示。由图3可知,曲线分别在质量因子为85和90时出现了极小值,且85对应的BAM值比90的BAM值大。这是因为:BAM值是各个小块的B值的平均值,篡改图像含有质量因子为85的成分比较多,在采用质量因子为90求取BAM值时,得到的量化误差较大。从而可以判定原背景图像的质量因子为85,求得原图像的量化表。通过读取JPEG头文件中的量化表信息可以确定上述方法获得的量化表误差较小。
3 篡改区域定位
由式(2)可知,BAM是各个B(i)求取平均值,篡改图像的BAM值比未篡改图像的BAM值大的原因是篡改图像粘贴了一些B值较大的小块,根据这个思想,只要把这些小块标记出来就能定位出篡改区域。定位方法为:1)将图像分成N个8×8大小的块,根据上节方法估计出的量化表Q求出每个块的B(i);2)将B(i)、x和y组成一个行向量V,其中x,y分别为每个8×8小块第一个像素的坐标值,例如V(1,1)=B(i),V(1,2)=x,V(1,3)=y;3)对每个小块的V组成矩阵M,则可以得到一个N行3列矩阵;4)对矩阵M按照B(i)的值进行降序排列得到矩阵M';5)对M'前T行进行标记,T为认为给定的一个阈值,在图像中表示出前T行所对应的小块,如果图中标记的块为任何规律的随机分布,则认为图像没有经过篡改,退出检测。如果前T行对应的小块集中在一个区域内或者几个区域内,那么表示这几个区域为可疑篡改区域,逐渐增大T的值,直到分布的小块超出这几个区域开始在整幅图像随机分布,则终止。根据矩阵中每行的相应位置将前T块标示出来,标示出来的区域就是篡改区域。
4 实验结果
图4 JPEG图像复制粘贴型篡改盲检测
为验证算法的有效性,本实验对JPEG图像篡改的2种类型进行分别测试。首先测试JPEG图像复制粘贴型篡改。将图4(a)分别以质量因子85和90进行压缩,得到图4(b)和图4(c),然后将图4(c)中的汽车复制到图4(b)中相应位置得到篡改图像图4(d),最后再将篡改图像以质量因子95进行压缩得到图4(e),检测结果如图4(f)所示。图5为非JPEG格式区域复制粘贴篡改。图5(a)为JPEG图像;图5(b)为非JPEG图像;将图5(b)中的小车复制到5(a)中再进行压缩得到合成篡改图像,见图5(c);检测结果如图5(d)所示。实验中测试图像大小均为512×512,检测时间均在1 s以内。实验结果表明:本文中的算法可以有效地识别出篡改区域,检测速度快。
图5 非JPEG格式区域复制粘贴篡改盲检测
5 结语
针对JPEG复制粘贴型篡改,以JPEG图像固有的块效应特征为出发点,通过定义块效应测度,获取原图像的量化表来检测篡改区域。实验表明:该实验方法在进行量化表估计时,具有一定的容错能力,检测伪造图像快速准确。但当篡改图像进行双重压缩时,如果第二次压缩的质量因子小于或者等于背景时区域的质量因子,则该算法还不能检测出篡改区域,因此该算法的鲁棒性还有待提高。
[1]KEE E,JOHNSON M K,FARID H.Digital image authentication from JPEG headers[J].IEEE Transactions on Information Forensics and Security,2011,6(3):1066-1075.
[2]魏为民,唐振军.利用JPEG块效应不一致性的合成图像盲检测[J].中国图象图形学报,2009,14(11):2387-2390.
[3]赵峰,刘晓腾,荆涛,等.基于局部块效应的JPEG伪造图像的盲取证[J].信号处理,2010,26(12):1805-1811.
[4]赵洁,郭继昌,张艳.利用块效应特征的JPEG图像盲取证研究进展[J].中国图象图形学报,2013,18(6):613-620.
[5]YE S M,SUN Q B,CHANG E C.Detecting digital image forgeries by measuring inconsistencies of blocking artifact[C]//Proc of IEEE International Conference on Multimedia and Expo,2007:12-15.
[6]ALVAREZ P.Using extended file information(EXIF)files headers in digital evidence analysis[J].Digital Evidence,2004,2(3):1-5.
[7]KEE E,JOHNSON M K,FARID H.Digital image authentication from JPEG headers[J].IEEE Transactions on Information Forensics and Security,2011,6(3):1066-1075.
[8]FRIDRICH J,LUKAS J.Estimation of primary quantization matrix in double compressed JPEG images[C]//Proceeding of Digital Forensic Research Workshop,Cleveland,OH,USA:Elsevier,2003:67-84.
[9]CHEN Y,HSU C.Detecting recompression of JPEG via periodicity analysis of compression artifacts for tampering detection[J].IEEE Transactions on Information Forensics and Security,2011,6(2):396-406.
[10]扈文斌,刘凯.基于量化表不一致性的JPEG图像篡改盲检测[J].中国图象图形学报,2011,16(3):316-323.
[11]赵彦涛,郝丽娟,闫彦霖.基于量化表估计的JPEG篡改图像盲检测[J].计算机仿真,2012,29(10):23-25.