稳健性图像复制-粘贴篡改被动认证
2012-06-25陈岳军
姚 恒,陈 颖,赵 琰,陈岳军,乔 通
(上海大学通信与信息工程学院,上海 200072)
数字成像和互联网技术不断发展,轻松获取和分享自己的照片已成为现实。胶片时代专业摄影师数天的工作现在只需操作Photoshop等软件即可轻松完成。某些篡改者通过对图像内容进行编辑以达到混淆视听的目的。如何在未掌握原始图像信息的前提下检测并定位篡改图像成为近年来信息安全领域的研究重点。不同于以往的数字水印方法,图像被动认证不需原始图像和对原始图像嵌入任何信息,该技术具有更广泛应用前景。
一类常见的图像篡改为复制-粘贴(copy-move)操作,篡改者通过将图像中某一区域内容复制并粘贴到同一幅图像中另一区域来实现掩盖内容的目的。由于复制-粘贴具有操作简单的优势,因此受到图像篡改者的青睐。自2003年美国纽约大学Binghamton分校Fridrich团队[1]发表第一篇针对复制-粘贴操作进行检测的学术论文起,多家学术机构对这一问题展开了深入研究,根据选择图像特征不同,检测方法主要分为3类:变换域稳健特征子块匹配方法、旋转不变特征子块匹配方法和特征点匹配方法。笔者在系统调研的基础上对已有方法进行了阐述与归纳。
1 变换域稳健特征子块匹配方法
变换域稳健特征子块匹配方法是一类最早提出的复制-粘贴检测方法,其一般步骤为图像重叠遍历分块、逐块特征提取以及块匹配。流程图如图1所示。假设原始图像大小为M×N,分块子图像大小为B×B,则经过遍历后子块数量为(M-B+1)×(N-B+1)。不同方法中图像重叠分块和块匹配方法相似,算法间主要区别体现在块特征提取步骤中。
图1 变换域稳健特征子块匹配方法流程图
Fridrich等[1]最早提出复制-粘贴匹配检测算法。文献[1]对图像进行16×16重叠分块后进行DCT变换并量化得到量化系数,其中量化表采用16×16大小矩阵q88分别为标准JPEG量化表中量化步长。由于DCT变换后的系数按频率由低到高排列,因此通过字典排序逐次比较每块系数,当发现相似块后进行记录。搜索完毕后,统计每对相似块位移量,当有多组块具有相同位移后则认定该区域为疑似复制-粘贴区域。此方法对较大区域的篡改具有一定稳健性。图2为文献[1]中复制-粘贴区域检测结果,图中红色区域(编者注:原图为红色,即图2c中的灰色区域)即为检测出存在复制-粘贴操作的可疑区域。
图2 文献[1]复制-粘贴篡改检测实验结果
Popescu等[2]选择主成分分析(PCA)降维来实现图像块特征提取,在图像进行分块后计算图像每个子块PCA分量,B×B大小的子块Xi经PCA降维后可以表示为
式中,ej为Xi协方差矩阵的特征向量,则ai=XiTej。ai=(a1a2…ab)即为Xi新的表示,Xi可以近似看作有限个特征向量的线性组合。PCA降维后再进行量化进一步缩小数据量。通过对每个块进行字典排序,采用类似文献[1]中提出方法搜索相似块并记录相似块的相对位移,当一幅图像中多处出现相同位移即认定为发生复制-粘贴篡改。图3为文献[2]的实验结果,图3b为篡改图像并以JPEG格式保存,图3c和3d分别为两处发生篡改的检测结果。实验证明该检测算法对JPEG压缩具有良好稳健性。
图3 文献[2]复制-粘贴篡改检测实验结果
Langille等[3]提出一种基于k维树排序概念的检测方法,该方法主要特点在于图像经过分块后进行k-d字典排序,但由于图像未经过频域变换直接在空域内依据像素值进行排序,因此搜索方法的稳健性不足。
骆伟祺等[4-5]提出一种基于图像多维特征的复制-粘贴检测方法。图像分块后对每块提取7维特征并记为c1,c2,…,c7,这些特征包括:红绿蓝分量均值(分别记为c1~c3);将每块继续等分成两份并计算其中一块亮度在整个块中的比重(按照不同分法记为c4~c7)。对每个块特征进行字典排序,比较每个块之间的特征差异。当各参数小于事先设定阈值时即认为存在相似块。记录下相对偏移量,统计偏移直方图,当存在一定的相同块偏移时则认定为复制粘贴操作。
魏为民等[6]提出一种基于小波系数塔形分解匹配的方法,主要方法是对分块后的图像进行多级小波分解,小波低频系数基本反映图像特征因此在块相似性匹配上具有较好的效果。Li等[7]提出一种结合离散小波变换和奇异值分解(SVD)的检测算法。首先对图像进行小波变换,只比较低频系数并对低频系数进行遍历分块后,再进行SVD得到一个1维列向量。保存向量进行字典排序,统计相似度较大向量进行篡改定位。除文献[7]外,部分学者采用单一SVD方法进行相似图像块匹配[8-9]。
针对篡改者往往对待粘贴图像进行滤波操作的情况,Dybala等[10]提出一种有效抗滤波的复制-粘贴检测方法。算法主要在文献[3]基础上对图像进行拉普拉斯滤波预处理,可以实现算法对滤波操作的稳健性,然而该方法依然对轻微缩放、旋转、JPEG压缩等稳健性不足。Mahdian等[11]通过提取图像块中模糊不变矩特征的方法来增强图像匹配的稳健性,作者在图像分块后提取图像块24维模糊不变矩特征(如果是彩色图像则沿RGB的3个分量分别提取特征),再对该特征序列进行主成分分析降维,之后对数据进行相似度度量定位篡改区域。
张静等[12]首先对图像进行离散小波变换降维,取一阶低频系数进行复制-粘贴检测,将低频系数等比例分为左上、左下、右上和右下4块,假定复制和粘贴区域处于不同块内,对块与块之间分别进行相位相关检测,当检测到的块相位差峰值大于事先设定的阈值时则判定存在复制-粘贴篡改,并且根据峰值对应坐标可以定位篡改位置。检测方法有效的前提在于复制和粘贴区域需处于不同块内。王俊文等[13]提出一种基于图像块几何不变矩特征的复制-粘贴检测算法,首先对图像进行小波变换获取低频系数,提取几何矩特征,通过特征向量排序减少计算复杂度,最终实现篡改检测。其中几何矩特征主要通过图像的质心和图像位移不变中心矩得到。
Ardizzone等[14]提出通过提取包括边缘、Tamura和Gabor等多位特征在内的图像纹理特征来进行相似块匹配的方法。Yao等[15]提出一种基于非负矩阵分解的篡改检测方法。通过二值量化分解系数和字典式排序,算法复杂度较之前方法有一定程度的改善。
2 旋转不变特征子块匹配方法
当篡改者对局部图像进行复制之后,进行旋转缩放操作再粘贴到图像中后,采用之前方法进行检测变得异常困难。又有学者针对这类复制-旋转缩放-粘贴操作提出了一系列的检测方法。该类方法通用流程如图4所示,待检测图像依各点为圆心遍历取圆提取圆内旋转不变特征后根据特征进行匹配。
图4 旋转不变特征子块匹配方法通用流程图
Myna[16]首先提出一种结合小波和极坐标映射变换的抗旋转复制-粘贴检测方法。首先对图像进行多级小波分解,提取低频系数,针对低频系数进行逐块匹配。对每个B×B块进行对数下的极坐标(log-polar)变换得到一个B×B大小的极坐标傅里叶变换表示。对用傅里叶系数表示的块进行字典排序,比较相邻相似块得到匹配结果。Wang等[17]提出一种基于圆特征的抗旋转复制粘贴篡改检测方法。对图像中每一点分别以该点为圆心以1,2,3和4为半径作圆,分别计算这些圆的均值,并将这些均值作为该点的特征值进行匹配,当图像中出现相似特征点时即认为存在篡改。该方法对模糊、缩放等操作不具稳健性。
Bayram等[18]提出利用Fourier-Mellin变换旋转缩放不变特征进行复制-粘贴检测方法。首先对图像块进行傅里叶变换,将傅里叶系数映射到对数极坐标空间,假设映射后的图像表示为I(ρ,θ),沿不同θ方向进行累加并量化得到一维特征矢量f。比较每个块的f值,当遇到相同f时记录下块之间的距离差异。当一幅图像中出现较多相同距离差异的匹配块时则判定为复制-粘贴操作。由于此判决方法采用投票机制且要求图像块具有相同的位移,在面对稍大角度的旋转时判决即失效,该方法主要针对较小角度旋转的复制-粘贴操作。
Li等[19]在文献[18]基础上提出一种改进的基于 Fourier-Mellin变换旋转缩放不变特征的复制-粘贴检测方法。作者放弃[18]中使用的投票机制判决方法而是采用矢量腐蚀滤波(vector erosion filter)方法进行篡改区域定位。该方法主要考虑到图像块在经过旋转后不再存在相同位移而仅仅存在相似位移,因此通过判断图像中是否有一定数量块存在相似位移而定位为篡改。
Ryu[20]提出一种基于Zernike矩的复制-粘贴检测方法,Zernike矩具有旋转不变特性,因此通过对图像分块进行Zernike变换并对得到系数进行排序和匹配同样可以进行复制-旋转-粘贴篡改检测。但Zernike矩相对于log-polar域检测方法具有更高的运算复杂度。
Solorio等[21]首先对图像分块,将图像变换到log-polar域,沿角度方向进行累加并得到1个一维向量。在对图像块进行旋转、缩放和镜像反转后一维向量的幅值依然具有不变性,因此通过比较块之间log-polar域的傅里叶变换幅值可以进行复制-旋转-粘贴检测。在文献[21]基础上,文献[22]提出一种更加精准的极坐标域检测算法。提取图像块的4 个特征矢量记为 f1,f2,f3和 f4,其中 f1,f2,f3分别为图像RGB 3分量的极坐标对数傅里叶变换幅值,f4为图像块的熵值。通过设定阈值,当两个块所有特征小于阈值时则认定该区域为复制-粘贴区域。算法对较小尺度缩放,任意角度旋转和镜像反转具有稳健性。
类似于文献[21]中提出的方法,Wu等[23]对图像进行极坐标下傅里叶变换,傅里叶变换后图像旋转和缩放问题转化为平移问题,通过比较块之间的互谱来进行判断图像块是否经过复制-旋转-粘贴操作。Christlein等[24]结合文献[17,20-21]中的旋转不变分量进行匹配,匹配之后估计旋转缩放平移参数。
3 特征点匹配方法
前两类基于逐块匹配方法虽然具有精度高优点,但计算复杂度偏大,因此又有学者提出基于特征点匹配方法来进行复制-粘贴篡改检测,由于只对有限特征点进行匹配因此计算复杂度大幅度降低。
Huang等[25]提出一种基于SIFT匹配方法的复制粘贴检测方法。对图像进行SIFT特征点提取后,每个点得到多维向量,采用BBF(Best-Bin-First)方法对多点进行分类,得到计算出的相似SIFT点以完成匹配,算法对阈值敏感度较高。
文献[25]提出方法存在较多误判和漏检,Ardizzone等[26]提出一种基于SIFT点聚类方法进行复制-粘贴检测。图像提取SIFT特征点后,进行点聚类,再进行类之间匹配,这样避免了过多的虚警。Amerini等[27]在提取图像SIFT特征后,进行分级(hierarchical)聚类。对聚类后点进行分组,并通过多组SIFT点估计空间变换矩阵。该方法在检测定位篡改的同时可以估计篡改区域的几何映射参数。Xu等[28]提出一种基于SURF特征点匹配的检测方法。作为一类基于SIFT点改进方法,SURF同样具有旋转尺度变换不变特性。
Pan等[29]首先对图像进行SIFT点特征提取,搜索各特征点最小欧式距离特征点,只有当最近点的欧氏距离小于其他任意特征点的1/2时才被认定为可疑相似对。之后利用随机抽样一致性算法(RANSAC)估计原始图像和篡改图像之间的仿射变换矩阵T和偏移x0,其中y=Tx+x0为原始点与复制-旋转-粘贴之后点之间的映射关系。最后将图像依据估计出的T和x0进行仿射变换得到新的图像,最后比较原始图像和转换后图像的相似块进行篡改定位。实验流程示意图如图5所示,其中图5b为经过RANSAC算法过滤后的SIFT点匹配图,图5c为由估计出的仿射变换参数产生的相关性图。
表1 IDCT修剪算法的比特率和编码时间测试结果
图5 文献[29]检测算法流程示意图
4 结论
图像复制-粘贴篡改盲检测是一类重要的图像取证研究课题,这里对已有代表性方法进行系统阐述和归纳,表1为各类已有方法的主要优点和不足点。可见,目前尚无一类完美的检测方法可以结合其他领域取证方法[30]来得到更具说服力的结果。同时为了隐藏篡改痕迹反取证研究也已成为新的研究课题,经过反取证处理后的图像往往可以躲避已有检测方法,如何检测出这类刻意隐藏篡改痕迹的图像也将成为未来图像取证的重点研究方向之一。
[1]FRIDRICH J,SOUKAL D,LUKAS J.Detection of copy-move forgery in digital images[EB/OL].[2011-09-01].http://ws2.binghamton.edu/fridrich/Research/copymove.pdf.
[2]POPESCU A C,FARID H.Exposing digital forgeries by detecting duplicated image regions[R].Hanover,NH:Dartmouth College,2004.
[3]LANGILLE A,GONG M.An efficient match-based duplication detection algorithm[C]//Proc.the 3rd Canadian Conference on Computer and Robot Vision.Quebec,Canada:IEEE Press,2006:64.
[4]LUO W,HUANG J,QIU G.Robust detection of region-duplication forgery in digital image[C]//Proc.18th International Conference on Pattern Recognition.Hong Kong:IEEE Press,2006:746-749.
[5]骆伟祺,黄继武,丘国平.鲁棒的区域复制图像篡改检测技术[J].计算机学报,2007,30(11):1998-2007.
[6]魏为民,王朔中,唐振军.一类数字图像篡改的被动认证[J].东南大学学报:自然科学版,2007,37(S1):58-61.
[7]LI G,WU Q,TU D,et al.A sorted neighborhood approach for detecting duplicated regions in image forgeries based on DWT and SVD[C]//Proc.2007 IEEE International Conference on Multimedia and Expo.Beijing:IEEE Press,2007:1750-1753.
[8]KANG X,WEI S.Identifying tampered regions using singular value decomposition in digital image forensics[C]//Proc.2008 International Conference on Computer Science and Software Engineering.Wuhan:IEEE Press,2008:926-930.
[9]YANG Q,HUANG C.Copy-move forgery detection in digital image[C]//Proc.the 10th Pacific Rim Conference on Multimedia:Advances in Multimedia Information Processing.Bangkok,Thailand:IEEE Press,2009:816-825.
[10]DYBALA B,JENNINGS B,LETSCHER D.Detecting filtered cloning in digital images[C]//Proc.the 9th workshop on Multimedia & Security(MM&Sec 07).Dallas,Texas:IEEE Press,2007:43-50.
[11]MAHDIAN B,SAIC S.Detection of copy-move forgery using a method based on blur moment invariants[J].Forensic Science International,2007,171(2/3):180-189.
[12]张静,冯占磊,苏育挺.基于像素匹配的图像“复制-粘贴”篡改检测算法[J].天津大学学报,2009,42(8):713 -720.
[13]王俊文,刘光杰,戴跃伟,等.一种检测图像Copy-Move篡改鲁棒算法[J].模式识别与人工智能,2009,22(4):630-634.
[14]ARDIZZONE E,BRUNO A,MAZZOLA G.Copy-move forgery detection via texture description[C]//Proc.the 2nd ACM Workshop on Multimedia in Forensics,Security and Intelligence.New York:ACM,2010:59-64.
[15]YAO H,QIAO T,TANG Z,et al.Detecting copy-move forgery using non-negative matrix factorization[C]//Proc.the 3rd International Conference on Multimedia Information Networking and Security.[S.l.]:IEEE Press,2011:591-594.
[16]MYNA A N,VENKATESHMURTHY M G,PATIL C G.Detection of region duplication forgery in digital images using wavelets and log-polar mapping[C]//Proc.International Conference on Computational Intelligence and Multimedia Applications.[S.l.]:IEEE Press,2007:371-377.
[17]WANG J,LIU G,LI H,et al.Detection of image region duplication forgery using model with circle block[C]//Proc.International Conference on Multimedia Information Networking and Security.[S.l.]:IEEE Press,2009:25-29.
[18]BAYRAM S,SENCAR H T,MEMON N.An efficient and robust method for detecting copy-move forgery[C]//Proc.the 2009 IEEE International Conference on Acoustics,Speech and Signal Processing.Taipei:IEEE Press,2009:1053-1056.
[19]LI W,YU N.Rotation robust detection of copy-move forgery[C]//Proc.17th IEEE International Conference on Image Processing.Hong Kong:IEEE Press,2010:2113-2116.
[20]RYU S,LEE M,LEE H.Detection of copy-rotate-move forgery using Zernike moments[C]//Proc.the 12th international Conference On Information Hiding.[S.l.]:Springer Press,2010:51-65.
[21]BRAVO-SOLORIO S,NANDI A K.Passive forensic method for detecting duplicated regions affected by reflection,rotation,and scaling[EB/OL].[2011-09-01].http://www.eurasip.org/Proceedings/Eusipco/Eusipco2009/contents/papers/1569192018.pdf.
[22]BRAVO-SOLORIO S,NANDI A K.Automated detection and localisation of duplicated regions affected by reflection,rotation and scaling in image forensics[J].Signal Processing,2011,91(8):1759-1770.
[23]WU Q,WANG S,ZHANG X.Detection of image region-duplication with rotation and scaling tolerance[C]//Proc.the 2nd International Conference on Computational Collective Intelligence(ICCCI 2010).[S.l.]:Springer Press,2010:100-108.
[24]CHRISTLEIN V,RIESS C,ANGELOPOULOU E.On rotation invariance in copy-move forgery detection[C]//Proc.the 2010 Second IEEE Workshop on Information Forensics and Security.[S.l.]:IEEE Press,2010:1-6.
[25]HUANG H,GUO W,ZHANG Y.Detection of copy-move forgery in digital images Using SIFT algorithm[C]//Proc.the 2008 IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application.[S.l.]:IEEE Press,2008:272-276.
[26]ARDIZZONE E,BRUNO A,MAZZOLA G.Detecting multiple copies in tampered images[C]//Proc.17th IEEE International Conference on Image Processing.Hong Kong:IEEE Press,2010:2117-2120.
[27]AMERINI I,BALLAN L,CALDELLI R,et al.Geometric tampering estimation by means of a SIFT-based forensic analysis[C]//Proc.35th International Conference on Acoustics,Speech,and Signal Processing.Dallas,Texas:IEEE Press,2010:1702-1705.
[28]XU B,WANG J,LIU G,et al.Image copy-move forgery detection based on SURF[C]//Proc.International Conference on Multimedia Information Networking and Security MINES).Nanjing:[s.n.],2010:889-892.
[29]PAN X,LYU S.Region duplication detection using image feature matching[J].IEEE Trans.Information Forensics and Security,2010,5(4):857 -867.
[30]张闯,吕东辉.单幅图像估计光照方向算法研究及其应用[J].电视技术,2011,35(15):41-45.