APP下载

基于四元极谐变换矩与显著特征的图像鲁棒哈希算法

2021-03-16王亚子孙怀波马远坤

计算机应用与软件 2021年3期
关键词:哈希鲁棒性预处理

王亚子 孙怀波 马远坤

1(周口师范学院数学与统计学院 河南 周口 466001)

2(阜阳师范大学数学与统计学院 安徽 阜阳 236037)

3(周口师范学院网络工程学院 河南 周口 466001)

0 引 言

随着多媒体技术的飞速发展和互联网的日益普及,通过互联网传播数字图像越来越流行[1]。但是图像在网络中传输时,会碰到外部的恶意攻击,使其信息被篡改与泄露,导致用户难以对其真实性实施判别[2]。因此,对用户端接收图像的内容进行真伪判别是一项具有重要意义的工作[3]。为了对图像内容做出准确识别,学者们提出了图像哈希方法,它是图像认证的常用方法,可作为图像的唯一表示而用于其信息的真伪决策,该技术对其内容具有强烈的敏感性[3-4]。

由当前的哈希算法研究成果发现,整个哈希序列的生成有3个主要过程:预处理、特征提取、输出哈希序列,尤其是特征提取阶段,对哈希算法的鲁棒性影响较大[2-5]。余震等[5]为了增强哈希序列对任意旋转角度的识别准确率,设计了基于融合鲁棒特征与多维尺度变换的紧凑图像哈希算法。利用线性插值与高斯滤波器来预处理图像,并引入极坐标变换来处理Y分量,再联合奇异值分解与Fourier变换来提取二次图像的鲁棒特征,随后利用多维尺度变换与加密函数,对这些特征实施压缩与加密,获取紧凑哈希序列。仿真数据验证了其哈希算法的效率与鲁棒性。此技术虽然采用了极坐标变换来增强哈希序列对旋转变换的识别准确率,但其仅仅考虑了彩色图像的L分量,忽略了其他成分的特征,使其对图像的描述能力不足,限制了其敏感性与鲁棒性。Gharde等[6]为了兼顾哈希序列的鲁棒性与识别率,设计了基于模糊颜色直方图的鲁棒哈希算法。首先将RGB空间转换到CIELab空间,并引入优化的调谐因子,构建无偏模糊颜色直方图提取方法,在CIELab空间内提取该直方图中最重要的特征,使其对噪声、缩放、JPEG压缩等常规内容修改具有较好的不变性,同时对各类攻击也有良好的准确识别率,通过在多种几何变换下进行测试,验证了其哈希算法的先进性。该方法采用了CIELab颜色空间,与人眼视觉系统很接近,且无偏模糊颜色直方图可以较好地描述图像的颜色信息,对颜色变换具有较好的稳定性,但是这种颜色直方图对旋转变换的鲁棒性较低。Yang等[7]为了提高哈希序列对图像内容的认证能力,设计了潜在低阶表示耦合均匀LBP算子的鲁棒哈希算法。首先对彩色图像的颜色空间实施转换,提取其亮度L分量,并对L分量完成重缩放与过滤的预处理,随后采用潜在低秩表示方法来得到预处理L分量的主要特征矩阵与显著特征矩阵,并将这两个矩阵实施分割,获得一系列的子块,借助均匀LBP算子,形成对应的归一化直方图,从而得到了哈希序列。该方法虽然采用了旋转不变均匀性的LBP算子,使其对旋转攻击具备较强的鲁棒性,但忽略了图像的颜色特征,对亮度调整缺乏敏感性,导致其对亮度修改的鲁棒性不理想。

为了充分描述图像的鲁棒特征,增强哈希序列对几何变换攻击的鲁棒性与准确识别率,本文设计了基于四元极谐变换矩与显著特征的图像鲁棒哈希算法。通过线性插值与自适应Wiener滤波器来预处理图像,以改善哈希序列对缩放与噪声攻击的鲁棒性;计算预处理图像的颜色向量角度,充分描述图像的颜色特征;利用傅里叶变换与频谱残差机制,分割出颜色向量角度中的显著性区域;引入LBP算子,提取相应的局部显著特征;基于QPHT变换,得到图像的QPHT矩,该特征是一个全局特征,因其考虑了彩色图像中不同颜色分量之间的关系,使其对多种几何攻击具备更强的鲁棒性;利用Logistic映射来定义加密函数,对QPHT矩和局部显著特征完成加密,从而获取哈希序列,以增强其抗碰撞性能;联合优化阈值与l2范数距离,完成可疑图像的认证。

1 算法设计

基于四元极谐变换矩与显著特征的图像鲁棒哈希算法过程见图1,其主要分为4个阶段:(1) 基于插值运算与Wiener滤波的图像预处理;(2) 基于颜色向量角度与Fourier变换的局部显著特征提取;(3) 基于四元PHT变换的全局特征提取;(4) 哈希加密与认证。

图1 本文哈希算法的过程

1.1 图像预处理

预处理是哈希序列生成的重要过程,其目的是增强算法对缩放与噪声干扰的鲁棒性[1-6]。若源图像I的尺寸为M×N,则可对其实施线性插值运算[5]处理,得到一个长度不变的哈希序列:

(1)

(2)

式中:x0≤zY≤x1,y0≤zX≤y1。

源图像经过插值运算后,相应的尺寸由M×N减小到Z×Z,因此,任意的输入图像经过此过程后,都可得一个固定长度的哈希序列,从而提高算法对尺度攻击的稳健性[6]。随后,利用逐像素自适应Wiener滤波[8]来消除插值图像噪声。该方法通过确定输入目标的最优估计值,以最小化其与插值图像之间的均方误差:

minE{[f(x,y)-f′(x,y)]2}

(3)

式中:f(x,y)是插值运算后的图像;f′(x,y)是f(x,y)的最优估计值。

根据式(3),对于f(x,y)经过Wiener滤波处理后,输出的无噪声图像为[8]:

g(x,y)=w(f(x,y)-u(x,y))+u(x,y)

(4)

式中:g(x,y)是滤波图像;u(x,y)是图像的像素均值;w(·)是逐像素自适应Wiener滤波器。

预处理结果如图2所示,其中:以噪声干扰图像为样本见(a),其经过线性插值处理后,输出的尺寸规范图像见(b),再由自适应Wiener滤波处理后的结果见(c)。可以看出,源图像中的噪声被有效过滤掉。

(a) 源图像 (b) 插值图像

1.2 局部显著特征提取

亮度(Lightness,L)、色相(Hue,H)、饱和度(Saturation,S)都是描述彩色图像的重要内容[9-10]。对于常规的图像内容变化,如亮度、对比度调整等,只会影响图像的强度,对H、S成分没有影响[10]。因此,本文算法通过计算滤波图像的颜色向量角度(Color Vector Angle,CVA)来提取颜色特征[10]。因为CVA对亮度内容具有理想的稳健性,但是对H、S两个成分的变换却非常敏感。在RGB颜色空间内,较欧氏距离而言,CVA具备更强的差异体现能力。以图3中的两对不同的颜色像素对(C1,C2)和(C3,C4)为例,其欧氏距离是相等的,均为8.944;但是(C1,C2)与(C3,C4)之间的CVA值是截然不同的。图3左侧的(C1,C2)之间的CVA为0.348 6 rad;而(C3,C4)之间的CVA为0.619 3 rad。

图3 不同颜色像素对的Eulidean距离与颜色向量角度

令P1=[R1,G1,B1]T、P2=[R2,G2,B2]T代表滤波图像中的2个颜色向量;则二者之间的颜色向量角度θ为[10]:

(5)

为了方便计算,本文利用sinθ来替换θ[10]:

(6)

随后,采用式(6)来计算滤波图像中所有像素所对应的sinθ值,输出颜色矩阵:

(7)

式中:Z代表滤波图像的高度。

以图2(c)为样本,基于上述过程输出的颜色向量角度图像见图2(d)。随后引入傅里叶变换[11],对图2(d)进行频域变换,充分获取其中的显著特征。令颜色向量角度图像为f″(x,y),其对应的傅里叶变换[11]为:

f″(x0,y0)=Fα[f″(x,y)](x0,y0)=

(8)

式中:Kα是变换核;(x,y)、(x0,y0)分别代表输入、输出平面坐标。

颜色向量角度经式(8)变换后,可形成对应的傅里叶频谱,通过B(f″)=|I(x,y)|来输出幅度信息B(f)。

基于B(f″),计算相应的对数谱L(f″):

L(f″)=log(B(f″))

(9)

通过L(f″),得到f″(x,y)的平均谱E(f″):

(10)

式中:*代表卷积运算;gq(f″)代表局部滤波[12]处理f″(x,y)后所输出的q×q维矩阵。

联合L(f″)、E(f″),计算频谱残差R(f″):

R(f″)=L(f″)-E(f″)

(11)

基于傅里叶逆变换,联合R(f″)与傅里叶频谱的相位部分P(f)=arg|I(x,y)|,得到f″(x,y)中的显著性映射:

S(f″)=F-1[exp(R(f″)+P(f″))]2

(12)

最后引入阈值分割方法[13],对S(f″)实施分割,确定f″(x,y)中的显著性区域;再采用LBP算子[14],提取该区域中诸如纹理、边缘等鲁棒特征,并将这些特征按照升序进行组合,得到局部显著特征向量,记为s={s1,s2,…,sm}。

将图2(d)作为测试对象,根据式(8)-式(12),输出的显著映射见图4(a);再联合阈值分割与LBP算子,所得到的局部显著特征见图4(b)。

(a) 显著性映射 (b)局部显著特征图

1.3 全局特征提取

极谐变换(Polar Hamonic Transform,PHT)[15]是一种基于正交投影基的二维变换方法,相对于其他正交矩而言,PHT具备更好的图像重构能力与更高的计算效率。对于彩色图像而言,其含有R、G、B三个不同的颜色分量。为了考虑三者之间的关系,文献[14]引入四元数理论,对PHT实施拓展,形成了四元极谐变换(Quaternion Polar Harmonic Transform,QPHT)。较PHT而言,QPHT对尺度缩放、旋转以及对比度等内容调整具备更理想的鲁棒性[16]。故在本文哈希算法中,利用QPHT矩来描述彩色想的全局鲁棒特征。令f(r,θ)代表极坐标中的彩色图像,则阶数为n,重复长度为l的QPHT矩Mn,l为[16]:

(13)

Hn,l(r,θ)=exp(-u2πnr2)exp(-ulθ)

(14)

因QPHT是依赖正交基来实现图像变换的,因此f(r,θ)可借助有限阶的QPHT矩来重构[16](n≤nmax,l≤lmax):

(15)

式中:f′(r,θ)代表重构图像;Rn(r)exp(ilθ)是基函数。

由文献[14]可知,QPHT中的Rn(r)exp(ilθ)在单位圆内是正交的,而且QPHT的每一阶对彩色图像的重建都有独立的贡献。令fr(r,θ)=f(r,θ+α)代表对f(r,θ)进行了角度a的旋转变化,则f(r,θ+α)、f(r,θ)的QPHT矩满足Mn,l(fr)=Mn,l(f)exp(ula)的关系。随后,对等式两边取绝对值,得到|Mn,l(fr)|=|Mn,l(f)·exp(ula)|=|Mn,l(f)|·|exp(ula)|=|Mn,l(f)|。可见,QPHT矩对任意角度的旋转都具备理想的不变性。另外,QPHT是依赖单位圆上来定义的,所以QPHT矩对尺度缩放攻击也具有很好的不变性。同时,将坐标原点置于彩色图像的质心上,可以实现平移不变性[16]。图5体现了多种几何攻击类型下的图像所对应的QPHT矩大小的变化情况。根据图5中的QPHT矩发现,源图像经过噪声、JPEG压缩、旋转和对比度等常规内容修改后,其对应的QPHT矩没有发生变化。

随后,令滤波图像为f′(x,y),对其进行阶数为n、重复长度为l的四元极谐变换,可获取n×l个QPHT矩。再将这些QPHT矩按照从小到大的顺序进行组合,获取全局特征向量,记为F={|M01|,|M02|,…,|Mnl|}。

(a) 初始图像 (b) 初始图像对应的QPHT矩

1.4 哈希加密与认证

将上述过程提取的局部显著特向矢量s={s1,s2,…,sm}与全局特征向量F={|M01|,|M02|,…,|Mnl|}实施简单的线性组合,得到一个1×(m+nl)维的融合特征序列Z={s1,s2,…,sm,|M01|,|M02|,…,|Mnl|}。为了便于后续描述,将其记为z=[z(1),z(2),…,z(m),z(m+1),…,z(m+nl)]。为了改善哈希算法的抗碰撞性能,本文引入Logistic映射[17]来设计加密方法。Logistic映射具有结构简单、效率高等优点,在数字加密领域被广泛应用[17]。

xj+1=μxj(1-xj)j=1,2,…

(16)

式中:u∈[0,4]为混沌参数。

随后,利用u与X0对式(16)迭代(m+nl)次,得到混沌序列{x1,x2,…,xm+nl}。再根据式(17)对{x1,x2,…,xm+nl}实施量化,输出新序列{a1,a2,…,am+nl}。

ai=mod(floor(xi×1014),256)

(17)

利用{a1,a2,…,am+nl}来设计加密函数:

bi=i+mod(floor(a(i+1 000)×1010),

(m+nl)-1)i∈[1,m+nl]

(18)

[a(i),a(bi)]=swap{a(i),a(bi)}

(19)

式中:bi代表加密后的位置;a(i)是{a1,a2,…,am+nl}中的第i个元素值;swap代表位置互换操作。

再联合式(18)、式(19)来加密z,可以得到哈希序列H={h1,h2,…,h(m+nl)}。

(20)

根据用户的预设阈值W,将其与式(20)的d值做比较。若d≤W,则二者为相似图像;反之,二者是差异图像。

2 实 验

为了验证所提算法的鲁棒性与识别准确率,从UCID数据库[19]中随机选择图像作为样本。另外,为了体现该算法的优势,将文献[5]、文献[7]作为本文算法的实验对照组。根据整个哈希生成过程可知,阈值W对图像的真伪决策精度具有重要的影响,因此,需要确定一个合理的W值。通过多次试验测试,设置较优参数如下:Z×Z=360×360、u=3.92、x0=0.55、阶数n=6、重复长度l=6。

2.1 阈值W的优化

从UCID库中随机选出80幅标准图像当成样本,借助PS软件,按照表1中的内容修改类型对其实施处理,形成1 080对相似图像;再次从该库中确定出200幅图像,基于PS软件,将复制-粘贴、裁剪以及组合攻击作用于这些图像,得到2 000对差异图像。最后根据式(20),计算这些图像对应的哈希序列之间的d值,从而获取较优的W值。

表1 内容修改类型及参数

图6是源图像与内容修改图像之间l2范数距离所对应的频数分布。由图6(a)可见,当d<32.5时,这些d值对应的频数分布较为集中;由图6(b)可见,当d>31时,这些图像的d值所对应的频数很集中。故在本次实验中,取W=32.5,对可疑图像的真假实施决策。

(a) 相似图像

2.2 哈希算法的鲁棒性测试

鲁棒性是反映哈希算法对图像内容修改的稳健性的客观评价指标[6]。在此次实验中,从UCID库中随机选出4幅标准图像作为样本,如图7所示;把表1中的内容修改类型作用于这些样本;利用式(20)来计算其相应的l2范数距离d,形成的结果见图8。根据输出的d值可知,对于本文算法而言,源图像与内容修改后的可疑目标之间的d值要远小于32.5。原因是本文算法采用了线性插值与Wiener滤波来预处理图像,使其对于任意的尺度缩放与噪声干扰,都可获取固定长度的哈希序列,消除噪声,并联合傅里叶变换与频谱残差法,有效提取局部显著特征。同时引入四元PHT方法,获取图像的全局鲁棒特征,使其对图像中的鲁棒特征描述更为充分,从而增强了哈希序列对内容修改的鲁棒性。

(a) Barbara (b) House

(a) 噪声干扰

若图像遭遇内容恶意修改,其对应的哈希序列与源图像是截然不同的,因此理想的哈希算法不仅要具备良好的稳健性,还要能准确识别出图像内容的真伪[2]。因此,将图9(a)当作源图像,对其施加常规内容修改和恶意攻击,并计算修改前后的图像所对应的哈希序列之间的l2范数距离d,以判别图像的真伪,输出数据见表2。由表中的d值发现,所提哈希算法能够准确识别出常规的内容修改,如噪声、对比度调整等,见图9(b)-(c),其相应的d值分别为7.93和14.62,显著小于32.5,故可把二者决策为相似图像;但是,其他3种恶意攻击的哈希序列之间的d值要远远大于32.5,见图9(d)-(f),故将三者决策为篡改图像。

(a) 初始图像 (b) 对比度修改

表2 不同攻击类型图像的认证决策结果

2.3 不同算法的鲁棒性测试

引入ROC曲线[20]来客观评估文献[5]、文献[7]和本文算法的鲁棒性的差异。首先,从UCID库中随机挑选200幅标准图像,借助PS软件,将表1中的几何内容修改类型作用于这些图像,从而形成3 200对相似图像。同时,将复制-粘贴、裁剪以及组合攻击作用于这些图像,形成2 000对差异图像。随后,利用本文算法、文献[5]和文献[7]来识别这些图像,根据其识别正确数量与误判数量来建立ROC曲线。ROC曲线[20]主要是由正确识别率PTPR和虚警率PFPR组成:

(21)

式中:n1代表正确决策的图像对的数量;n2代表差异图像被三种算法决策为相似图像对的数量[20];M1代表相似图像对的数量;M2代表差异图像对的数量。

不同哈希算法的ROC曲线见图10与表3。由表3可见,对于常规的内容修改和恶意攻击,本文算法具有更为理想的ROC曲线特性,其正确识别率均是最高的,显著优于文献[5]和文献[7]算法。例如,当虚警率PFPR=0时,文献[5]、文献[7]与本文方案的PTPR分别为0.901 8、0.925 6、0.957 3;PFPR=0.3时,三者的PTPR分别为0.994 6、0.995 3、0.999 1。原因是本文算法采用了傅里叶变换与频谱残差法来确定颜色向量角度图像中的显著性区域,利用LBP算子来提取其显著性特征,而且引入四元PHT变换,获取滤波图像的QPHT矩,这种颜色向量角度能够增强哈序列对亮度修改的稳健性。另外,QPHT矩对于旋转、缩放、噪声等内容修改,也具有很好的不变性。因此本文算法兼顾了全局与局部的鲁棒特征,对图像描述更为充分,所生产的哈希序列对图像内容具有更强的敏感性,从而使其具备很好的ROC曲线。虽然文献[5]、文献[7]两种技术都采用了预处理方法来增强哈希序列对缩放、噪声的鲁棒性,但是文献[5]是在YCbCr颜色空间内,提取了彩色图像的L分量的局部与全局特征,忽略了其他成分的特征,使其对图像中的鲁棒特征描述不足,从而限制了整个哈希序列的鲁棒性,文献[7]则是提取L分量中的主要特征矩阵与显著特征矩阵,通过LBP算子来生成哈希序列,这种方法不能有效描述图像的颜色特征,对亮度修改缺乏敏感性与鲁棒性。

图10 三种算法的鲁棒性测试比较

表3 不同算法的正确识别率结果

3 结 语

为了充分描述图像中的鲁棒特征,增强哈希序列对内容修改的鲁棒性与准确识别率,本文提出了基于四元极谐变换矩与显著特征的图像鲁棒哈希算法。计算预处理图像的颜色向量角度,联合傅里叶变换,分割出图像的显著性区域;利用LBP算子来提取其对应的局部显著性特征;引入四元极谐变换,计算预处理图像的QPHT矩;利用加密函数对显著特征与QPHT矩完成加密,输出安全性较高的哈希序列。通过优化决策阈值,计算内容修改前后的图像所对应的哈希序列之间的l2范数距离,实现可疑图像的真伪判别。在旋转、缩放、噪声以及亮度等攻击测试下,所提出的哈希算法能够对普通的内容修改与恶意篡改做出准确判别,具备较高的鲁棒性与敏感性,当虚警率大于0.1时,其准确率均维持在0.99以上。

后续将对数据压缩机制进行研究,设计合适的数据降维方法,对本文算法的哈希序列实施压缩,以提高哈希序列的生成效率。

猜你喜欢

哈希鲁棒性预处理
KR预处理工艺参数对脱硫剂分散行为的影响
预处理对医用外科口罩用熔喷布颗粒过滤性能的影响
手术器械预处理在手术室的应用
哈希值处理 功能全面更易用
武汉轨道交通重点车站识别及网络鲁棒性研究
污泥预处理及其在硅酸盐制品中的运用
Windows哈希值处理不犯难
文件哈希值处理一条龙
一种基于三维小波变换的鲁棒视频水印方案
电子节气门非线性控制策略