基于Markov 特征的图像拼接检测算法研究

2022-12-03贾先欣

沈阳工程学院学报（自然科学版） 2022年4期

宋凯，贾先欣

（沈阳理工大学信息科学与工程学院，辽宁沈阳 110159）

1 概述

图像拼接是图像篡改中最基础和最常用的方法。该方法是从一幅或多幅图像中复制图像的一部分，粘贴到同幅或另一幅图像中，而不进行任何后续处理以达到篡改内容的目的。国内外的研究已经取得了一定的成果。NEENU H U 等［1］提出一种针对光照不一致性和内在重采样特性的检测方法，先将图像划分为互不重叠的小块，得到图像的颜色光照图，从中提取小波特征送入到分类器中进行分类，然后结合图像的二次差分矩阵提取出图像的周期性信息，用来检测图像是否被篡改。WEI W 等［2］提出了计算图像旋转角度估计器的方法，用于检测篡改图像时产生的角度旋转变换。由于在图像重标度和旋转中进行插值运算，在图像中引入周期性，可用来估计数字图像重标度的因子，这种基于插值的图像旋转角度估计器对小图像具有较好的效果。

2 图像特征的提取

图像篡改检测在模式识别中属于二分类的识别问题［3］。模式识别分为有监督的分类和无监督的分类两种。其中，监督学习是较为有效的一种方法，该方法利用预先标注的数据集，构造一个有推断功能的计算模型。首先要做的是从数据集中的图像中提取特征，用一个特征向量来代表图像。特征提取是模式识别中最为关键的一步，而拼接操作相当于在图像中引入加性噪声，本文所采用的马尔可夫统计特征可以捕捉到这种加性噪声引起的改变。马尔可夫特征是由马尔可夫转移概率组成的用于表征图像中统计变化的一种局部特征［4］。块离散余弦变换（Block Discrete Cosine Transform，BDCT）具有卓越的能量压缩和去相关的能力，不仅可以压缩图像的能量，降低特征向量的维数，还可以对图像进行去相关操作，使捕捉图像统计量变化更为容易。

本文采用监督学习中表现效果最好的支持向量机作为训练模型，以高斯径向基函数为核函数，生成0到1之间的数，并与决策阈值进行比较，从而判断图像是真实的或是被篡改的。基于马尔可夫特征提取的过程如图1所示。

图1 基于马尔可夫特征提取的过程

2.1 BDCT

BDCT 基本思路是将图像划分为n×n个子块，并对每个子块单独进行DCT 变换。根据文献［5］中所提到的，当分块大小N为2 的整数幂时，分类器的检测准确率才会有明显差异。所以，本文选择的分块大小分别是2×2、4×4、8×8、16×16。一个n×n的BDCT处理方式如下：首先，将给定的图像划分为不重叠的n×n块；其次，将二维离散余弦变换独立地应用于每个块中［6-7］；最后，得到由所有块的BDCT系数组成的二维矩阵，然后将DCT系数截断为整数绝对值。一个n×n块余弦变换系数可由式（1）得到。

式中，f(x,y)是图像函数；u,v=0,1,2,…,n-1；F(u,v)是离散余弦变换系数矩阵。

2.2 2D差分矩阵

对块离散余弦变换系数矩阵做2D 差分，可以减小由于图像内容多样性带来的影响。对于一个2D矩阵，主要有水平、竖直、主对角线和次对角线4个差分方向，如式（2）～式（5）所示：

式中，Su和Sv分别为离散余弦变化系数矩阵的水平和竖直方向维度。

2.3 阈值化

为了减少特征向量维数，降低计算复杂度，对差分后的离散余弦系数矩阵做阈值化处理。设定一个阈值T，当差分矩阵中的元素小于-T时，将其设置为-T；当差分矩阵中的元素大于T时，将其设置为T，如式（6）所示：

式中，X(u,v)代表Fh,v,d,m(u,v)。

实验表明，当阈值T从3 到5 递增时，准确率增加，在T=5时准确率达到最高。

2.4 一步转移概率

阈值化后，所有元素是介于［-T，T］之间的整数。采用一步转移概率矩阵，把水平和竖直两个方向阈值化差分矩阵的所有元素作为特征，特征向量就是2×(2T+1)×(2T+1)维。在水平和竖直方向上的一步转移概率矩阵使用如下公式：

式中，i,j∈{-T,-T+1,…,0,T}。

2.5 篡改检测

在特征向量提取完成之后，需要建立一个分类器，在二分类的模式识别中，支持向量机是表现最好的一种分类器［8-9］。其基本思想是将特征空间映射到更高维空间中，在该空间中数据点可以使用内核函数线性分离。支持向量机的训练算法在新的映射特征空间中构造一个最大边缘超平面来分离数据点，离超平面最近的点称为支持向量。通过求解一个约束优化问题，得到了最优分离超平面，其中线性超平面被定位。支持向量机有3 个常见的核：多项式函数、径向基函数（RBF）和sigmoid函数。本文选择了性能优良的以高斯径向基函数为核函数的支持向量机。

3 实验方法

为了评估基于马尔可夫特征的图像拼接检测算法的性能，本文选择公开的Columbia 数据集作为训练集和测试集。该数据集由1 845幅不同图像组成，其中933幅是真实的，912幅是拼接的［10］。图2显示了来自此数据集的一些示例图像。

图2 DVMM图像示例：真实图像（上）和篡改图像（下）

首先，逐个从数据集中读取真实和拼接的图像；其次，计算DCT 域的马尔可夫特征；最后，利用阈值T计算各方向的转移概率矩阵，并采用10 折交叉验证法得到最优参数C和G。

4 实验结果分析

本文提出的基于马尔可夫统计特征的图像拼接检测分为能量压缩去相关的BDCT、去除图像内容差异影响的2D 矩阵差分、降维提高检测效率的阈值化处理［11］、转化特征向量的概率转移矩阵4 部分，它们共同影响着分类器的最终分类结果。本文首先选定BDCT的块大小N=8，然后分别在T=3、4、5、6 时，在图像水平和竖直方向检测分类器的准确率，详细指标如表1 所示。从表1 可以看出：当T=5时准确率达到最大。之所以选择N=8 时的BDCT，是因为它在能量压缩和去相关方面表现最好。为了验证这一点，在阈值T=3 时，分别检测分块大小N=2、4、8、16 时的分类器的准确率，如表2 所示。实验结果表明：当N=8 时，分类器准确率最高。最后测试了不同分块大小的马尔可夫特征融合的分类器的准确率，如表3所示。实验结果表明：当T=3时，融合N=2、4、8时的检测准确率达到最高。