APP下载

一种改进的SIFT篡改检测算法

2017-12-27张劲松周立新

电子器件 2017年6期
关键词:复制粘贴特征描述关键点

张劲松,杨 玫,周立新

(中国地质科学院岩溶地质研究所,广西 桂林 541004)

一种改进的SIFT篡改检测算法

张劲松,杨 玫,周立新*

(中国地质科学院岩溶地质研究所,广西 桂林 541004)

针对数字图像的复制粘贴盲检测进行了研究,传统的筛选特征描述部分不充分检测图像信息,基于统计分布特征和一致性约束理论提出了一种改进的SIFT篡改检测算法。首先,建立高斯差分(DOC)尺度空间特征点检测方法以提取关键点。然后,在主要方向生成的过程中基于最大色散方法选择,此外,该方法基于统计特征生成特征描述的精确坐标、尺度值、像素区域尺寸值、边界标记、边界角和曲率。最后,基于一致性约束新的匹配方法将介绍。实验结果为真正类率(TPR)值为98.03%,假正类率(FPR)值为7.99%,验证了本文提出的方法的可行性和有效性。该算法对篡改区域的平移、缩放和旋转有较强的鲁棒性。

改进的SIFT;复制粘贴;篡改;鲁棒性

随着数字化信息时代所产生的新技术和新产品给社会活动带来了较大的益处。各行业越来越多的运用photoshop,3Dmax等图像处理软件进行图片修改等操作,调整到预期的图片效果,传统观念中的“眼见为实”不存在了。目前关于图像的伪造和篡改技术已广泛应用于科学研究、保险索赔、媒体和司法取证等方面,已经对社会造成了较为严重的负面影响,针对数字图像真实性认证和完整性保护问题,吸引了各个方面学者的眼球。

近年来,国内外学者致力于对于图像复制粘贴篡改检测研究,取得了较为重要的成果以及可喜的进展,Jessica Fridrich[1]等人提出了离散余弦变换DCT(Discrete Cosine Transform)算法,其首先对所选取图像进行分块并对其进行量化操作,采用量化后的DCT系数作为检测图像特征向量,最后检测出所选取图像中存在的复制粘贴的伪造区域;Huang[2]等人基于文献[1]的研究基础上,对DCT系数矩阵进行降维,降低了计算的复杂性;骆[3]等人提出的模型首先基于下面的先验知识,假设“大面积区域”的大小不能小于原始图像尺寸的 0.85%。王等人[4]在完善上一小节模型的基础上,提出了一个新的模型,该模型可以抵抗多处篡改、几何变换方面的不足,王鑫等人[5]提出了一种针对彩色图像的复制粘贴篡改模型。Lowe 等人在 1999 年提出来SIFT(Scale Invariant Feature Transform)算法,后来又由 David Lowe[6]于 2004 年进行了改进。

由国内外研究情况来看[7],数字图像被动盲取证已经取得了一定的成果,但是数字图像盲检测的研究目前仍然处于基础理论研究和基本技术研究的阶段,至今还未形成一个系统。但是,目前的检测算法的使用范围比较单一,大多数的算法都是针对一种篡改行为。一些检测结果往往是建立在大量的预先假设的条件之上的,对数字图像的质量要求也比较高。

1 变分水平集活动轮廓模型和SIFT变换

1.1 基于边缘检测的变分水平集活动轮廓模型

GAC 模型可以通过极小化如下能量泛函来确定活动轮廓:

(1)

式中:p为图像矩阵,α1(p)为闭合轮廓线C的长度,g(C)是图像p的梯度,Cp函数为闭合曲线C,与式(1)相对应的水平集演化方程如下:

Φt=gk|Φ|+gΦ,Φ(0,C)=Φ0(C)

(2)

式中:Φt为Φ的一阶偏导数,C为U的零维水平集.单位法线g可表示为

(3)

函数Φ的曲率为

k=

(4)

1.2 SIFT方法的介绍

SIFT[8]是从图像中提取的一种尺度不变特征,它包括关键点检测和局部特征描述。提取特征有以下几个步骤,如图1所示。

图1 SIFT特征描述子的生成步骤

2 改进的SIFT特征描述子

2.1 DOG金字塔空间生成

在相邻的空间内生成DOG金字塔[9]空间为:

L(x,y,σ)=G(x,y,σ)⊗I(x,y)

(5)

DoG(x,y,kσ)=L(x,y,kσ)-L(x,y,σ)

(6)

式中:σ为比例因子。I(x,y)为输入图像。⊗表示x,y的卷积运算。G(x,y,σ)为不同尺度空间的高斯函数。

为了搜寻极值点,相邻像素点之间由2×2矩阵组成改变后的SIFT算法简化了每一阶的结构组成,根据Lowe在SIFT算法研究过程中总结的经验,对提取出的特征点中,本文将舍掉数值<0.04的局部特征不稳定的点。

2.2 关键点定位

在遍历区间内所有的尺度以后记录下图像所处的位置,基于高斯差分公式得到所有可以成为极值的特征点,在检测尺度空间内寻找极值的过程中,将任一像素与其临近区间的像素点相互比较,最后即可精确的确定关键点的位置和尺度[10]。对每个可能的极值特征点在其尺度空间上做泰勒展开,公式如下所示,低对比度的极值点将被舍弃。

X=(x,y,σ)T为点的偏移量. 通过计算极值关键点,计算函数D关于X的导数,如式(8)所示。

(7)

方程(7)代入方程(6):

(8)

对边缘的不稳定点进行滤值的Hessian矩阵为:

(9)

为了使计算得到的算子具有旋转不变性,在关键点邻域的窗口内的所有像素点中选择统计量最大的梯度方向作为其主方向。每个关键点所包含的3种信息为位置、方向以及所处尺度。邻域窗口内每个像素点的梯度模值方程如式(10)。

m(x,y)=

(10)

每个像素的方向使用式(11)计算。

(11)

2.3 特征点描述子生成

首先得到主方向后,将原标准坐标是根据主要方向旋转,使特征向量不变的旋转变化。其次,以所取关键点为中心,将其转换成能使关键点数值化的特征向量。取大小为N×N的关键点邻域窗口,以关键点为中心,将邻域窗口分为S块,每块为一个种子点,统计每个子块中的所有像素点分别在不同梯度方向的模值并进行累加。

2.4 特征点检测

在现实场景图像配准中,对应的图像之间的转换包含仿射变换,光照变化,角度变化。方法广泛应用于这一领域包括快速检测器,SUSAN,Harris,DoG特征检测,Hessian矩阵拉普拉斯变换等。考虑到这些因素,多个规模特征检测对于图像检测需求将是一个更好的选择。标准的拉普拉斯算子函数用于Harris拉普拉斯变换的极值检测方法的过程存在二阶导数,计算是较为复杂的。与此同时,DOG检测函数检测效率高于前者。因此,选取DOG检测方法进行检测多尺度特征点。

DOG检测过程的主要方向代关于筛选特征点,方向是通过插值获得。因此,结果是直方图的分散度的影响。基于这个问题,获得主要定位新方法。

2.5 相似匹配

假设一幅图像的关键点集为X={x1,x2,…,xn},每个关键点的SIFT 描述符为{f1,f2,…,fn}。在检测图像中对得到的关键点进行匹配。最直接的匹配策略是对于每一个关键点,使用欧式距离寻找它的最相似特征。为了检测两个关键点是否匹配,只需查看这两个关键点的距离是否小于某个阈值即可。但是这种方法只是粗略的进行匹配,如果需要存在有多个复制区域的情况时,则需进一步研究。

我们使用最近点和次近点的比率作为度量,并将其和阈值T1相比较,如果d1/d2

3 基于改进的SIFT复制粘贴篡改检测算法

算法首先利用边缘检测的变分水平集轮廓模型提取出图片的可疑区域,利用改进的SIFT变换提取图像的特征,形成新的特征矩阵,再利用相似性检测并定位复制粘贴篡改区域。过程如图2所示。

图2 改进的SIFT算法流程图

步骤1:待检测图像读取,如果是彩色图像,将其转换成为灰度图像。

步骤2:基于改进的SIFT算法提取图像中的特征点,生成邻域内每个特征点的描述子。把生成的特征点组成一个K×192维的特征矩阵,矩阵的每一行对应着一个特征点的特征描述子。

步骤3:计算这两个距离的比率c=d1/d2,迭代此过程,直到比率大于阈值T2,记录下目前的匹配点。

4 实验结果及分析

选取灰度图像作为实验图像,利用Photoshop CS3对其进行复制-粘贴篡改,篡改的方式主要有简单的复制粘贴、旋转、缩放、对整幅图像进行JPEG压缩、添加高斯噪声及这几种操作的结合。前面的为单一后处理操作,其余的混合操作。为了提高对算法评价的准确度,依据图像的内容随意选取图像的复制区域。

为了证明改进后算法的有效性,循环改变训练集和测试集,重复4次这样的实验:

(11)

然后,将选择的阈值应用于剩余图像的测试。获得的结果为:TPR=98.03%,FPR=7.99%。这意味着所选用的阈值可以很好的估计本文的算法。T2的大小选为0.5。

表1 训练阶段不同阈值下的检测率 %

简单的复制-粘贴:首先将此算法应用在理想的篡改情况下,只复制一个区域,然后粘贴到与此不相交的另外一区域,期间不添加任何的其他操作。

缩放情况:建立一个缩放情况的检测,复制区域被稍微放大或者缩小,如图4所示。

旋转情况:和前面的实验相似,建立一个旋转情况的检测,在将复制区域粘贴之前先将其旋转一个角度,以造成看起来有多个不同物体的假象。如图5所示。图5(a)是对图中的人物进行复制,然后旋转粘贴到左上角的位置。为了验证本文算法的有效性,以小船图为例,将本文算法和文献[11]中的算法分别在不同的篡改情况下相比较。对图3~图5运用文献中的算法进行检测,得出的检测结果如表2~表4所示。

图3 平移情况检测结果

图4 缩放情况检测结果

图5 旋转90°情况检测结果

表3 缩放情况下的检测率 单位:%

表4 旋转情况下的检测率 单位:%

从表1可以看出改进后的算法分别在不同的情况下的检测效果都有所提高。总之,在不同的篡改方式下,本文算法总能够获得较精确的匹配对得到一个较好的检测效果,这意味着算法可以应用于图像复制-粘贴检测,并且相比于改进前要好。本文算法对多图片后期处理具有较好鲁棒性,因此本文算法综合性具有较好的实用价值。

5 结束语

(1)本文提出的检测算法仅仅局限于同幅图像的复制粘贴操作,而在现实中还存在多幅不同图像之间的复制粘贴篡改操作。因此,本文提出的算法不能应用到多幅不同图像的复制粘贴篡改。在接下来的研究中,将针对不同图像间的篡改进行研究。

(2)本文算法虽然可以取得较好的检测效果,但是与其他算法相比,运行时间稍微高于其他算法。另外在阈值选择方面,本文是通过参考现有阈值,然后多次实验得到的,这也占用了很多时间。在接下来的研究中,应在保证算法检测率的同时,尽可能降低算法的运行时间。

[1] Fridrich A J,Soukal B D,LukA J. Detection of Copy-Move Forgery in Digital Images[C]//Proceedings of Digital Forensic Research Workshop. Cleveland OH,USA,2003.

[2] Huang Y,Lu W,Sun W,et al. Improved DCT-Based Detection of Copy-Move Forgery in Images[J]. Forensic Science International,2011,206(1):178-184.

[3] 骆伟祺,黄继武,丘国平. 鲁棒的区域复制图像篡改检测技术[J]. 计算机学报,2007,30(11):1998-2007.

[4] 王俊文,刘光杰,张湛,等. 图像区域复制篡改快速鲁棒取证[J]. 自动化学报,2009,35(12):1487-1494.

[5] 王鑫,轩波,彭思龙. 基于融合的高分辨率彩色图像拷贝-变换-移动篡改检测[J]. 中国图象图形学报,2010,15(7):1047-1056.

[6] David G,Lowe. Distinctive Image Feature From Scale-Invariant Keypoints[J]. International Journal of Computer Vision,2004,2(60):91-110.

[7] Li S,Lee M C,Pun C M. Complex Zernike Moments Features for Shape-Based ImageRetrieval[J]. IEEE Transactions on Systems. Man and Cybernetics,2009,39(1):227-237.

[8] 张婷. 基于SIFT数字图像复制黏贴篡改盲检测研究[D]. 河北工程大学,2013:23-45.

[9] 申铉京,朱叶,吕颖达,等. 基于SIFT和HSI模型的彩色图像复制-粘贴盲鉴别算法[J]. 吉林大学学报(工学版),2014(1):171-176.

[10] Fisher M A,Rolles R C. Random Sample Consensus:A Paradigm for Model Fitting with applications to Image Analysis and Automated Cartography[J]. Communication ACM,1981,24(6):381-395.

[11] Torr P H S,Murray D W. The Development and Comparison of Robust Methods for Estimatingthe Fundamental Matrix[J]. International Journal of Computer Vision,1997,24(3):271-300.

[12] Li S,Lee M C,Pun C M. Complex Zernike Moments Features for Shape-Based Image Retrieval[J]. IEEE Transactions on Systems. Man and Cybernetics,2009,39(1):227-237.

DetectionofCopy-MoveForgeryImageBasedonanImprovedSIFTDescriptor

ZHANGJingsong,YANGMei,ZHOULixin*

(Karst Geology Research Institute of Guangxi China,Guilin Guangxi 541004,China)

In the process of SIFT(Scale Invariant Feature Transform)image registration algorithm,the principal orientation is affected by the dispersion of histogram. Besides,the feature descriptor section of conventional SIFT does not make full use of local feature information. As to these problems,an improved SIFT algorithm on characteristic statistical distributions and consistency constraint will be presented. Firstly,DOG(Difference of Gaussian)scale space feature point detection method is adopted to extract key points. Then,in the process of principal orientation generation,our method selects line with maximum dispersion. Furthermore,this method generates feature descriptor based on characteristic statistical distributions in polar coordinate. Finally,a new matching method based on consistency constraint will be introduced. In experiments,the values of TPR(True Positive Rate)and FPR(False Positive Rate)is 98.03% and 7.99%,we test the performances of our propose method. The experimental results demonstrate the feasibility and effectiveness of our approach.

an improved SIFT;copy-move;tamper;robustness

10.3969/j.issn.1005-9490.2017.06.032

2016-11-04修改日期2017-01-05

TP391

A

1005-9490(2017)06-1496-06

张劲松(1987-),男,广西桂林人,汉族,在读硕士,助理研究员。研究方向为数据挖掘,网络编程,计算机视觉;

杨玫(1989-),女,广西桂林, 瑶族,本科,研究实习员,研究方向为数据挖掘、资料管理;

周立新(1971-),男,贵州剑河县, 苗族,研究生,研究员,研究方向为图像处理、数据分析、数据库,yovzhunldun04@163.com。

猜你喜欢

复制粘贴特征描述关键点
船舶尾流图像的数字化处理和特征描述技术
聚焦金属关键点
肉兔育肥抓好七个关键点
全面复制
Win10小技巧 复制粘贴多段不连续文字
目标鲁棒识别的抗旋转HDO 局部特征描述
用于三维点云表示的扩展点特征直方图算法*
复制粘贴打印机
基于差异的图像特征描述及其在绝缘子识别中的应用
复制粘贴打印机