一种用于遥感影像完整性认证的感知哈希算法
2014-06-28丁凯孟朱长青
丁凯孟 朱长青
(南京师范大学虚拟地理环境教育部重点实验室,南京210046)
随着遥感技术与信息技术的飞速发展,遥感影像的获取、传输变得十分便利.但是,在传输、使用过程中,遥感影像容易遭受各种无意或有意的篡改攻击.如果遥感影像的完整性、真实性受到质疑,那么其使用价值将大大降低.因此,遥感影像的完整性认证问题不容忽视.
传统技术采用Hash函数进行数据的完整性认证.Hash函数对数据中每个比特位的变化都很敏感,这种敏感性适合文本数据的认证.但是,遥感影像经过格式转换、水印嵌入等操作之后,其内容并没有发生变化,不影响正常使用.所以,Hash函数用于遥感影像的认证存在很大的局限性.
感知哈希是多媒体数据集到感知摘要集的一类单向映射,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性[1].感知哈希的思想源于Hash函数,能够将任意长度的输入信息转换为简短的输出序列.感知哈希与Hash函数的显著区别在于,数据经过格式转换等不改变内容表示的操作,感知哈希散列不发生变化或变化很小.感知哈希为多媒体数据的认证提供了一种有效的解决方法.目前,已有许多学者展开了关于图像感知哈希的研究并取得了一定成果[2-8].但是,针对遥感影像数据认证的相关研究尚不多见.
本文基于遥感影像边缘特征,结合格网划分、信息熵理论以及奇异值分解(SVD),提出了一种用于遥感影像完整性认证的感知哈希算法.
1 基于边缘特征的感知哈希算法
在遥感影像中,边缘特征占据着重要的地位,是遥感影像识别、理解与分析的基础.边缘信息与对象分割联系紧密,是道路、河流等地物目标的载体[9].另一方面,遥感影像对量测精度有较高要求,如果边缘特征发生较大变化,往往意味着影像地物信息遭到篡改,也就失去了应用价值.此外,遥感影像往往不存在单一的或者明确的主题,颜色特征对于影像缺乏足够的内容表达能力[10].因此,边缘特征能够较好地反应遥感影像的内容信息.
遥感影像普遍具有海量性的特点,且不同区域包含的信息量也往往相差较大.因此,本文算法首先对影像进行隐形格网划分,并基于自适应策略,根据格网单元的信息熵对相应的格网单元进行自适应的预处理.然后,提取格网单元的边缘特征,以矩阵的形式表示.对格网边缘特征矩阵进行SVD分解后,选取部分较大奇异值作为格网单元的感知特征,并采用Hash函数进行压缩、归一化.最后,串联各格网单元的归一化特征,得到整幅影像的感知哈希散列.
1.1 基于信息熵的格网单元预处理
对原始影像进行W×H的格网划分(W和H根据实际影像大小而定)后,对每个格网单元进行预处理.预处理是格网单元统一分辨率的过程,即通过插值将格网分辨率统一为m×m.算法根据格网单元的信息量自适应地决定m的大小.信息熵能够反映图像中平均信息量的多少,故本文采用信息熵衡量格网单元的信息丰富程度.对于大小为M×N的格网单元Qij,其信息熵为
式中,pn表示格网单元Qij中灰度值为n的像素出现的概率.
依据以上3D打印零件的反求修复方法,选取某型号柴油机中具有复杂腔体的套筒零件,进行零件表面的曲面建模与破损曲面提取试验。
下面以两级为例进行自适应预处理的描述:设定信息熵的阈值T(实验中T取各格网信息熵的平均值),如果格网单元信息熵E(Qij)≥T,通过双线性插值将格网单元分辨率调整为m1×m1;如果E(Qij)<T,则将格网单元的分辨率调整为m2×m2(m1>m2).预处理之后的影像格网单元记为Gij.
自适应的预处理过程不仅能够对信息丰富的影像区域实现更高精度的认证,而且能够降低算法整体的计算复杂度.
1.2 格网边缘特征的提取
目前,基于梯度的边缘检测算法获得了广泛的研究应用.其中,Canny算子能在噪声抑制和边缘检测之间取得较好的平衡,是一种被普遍认可的边缘检测算法.因此,本文算法采用Canny算子提取影像格网的边缘特征.
提取格网单元Gij的边缘特征,进行序列化后,得到格网的边缘特征矩阵,记为Eij.其中,边缘特征的序列化过程如下:从左到右、从上到下地扫描边缘提取的结果,如果是边缘点,则相应的矩阵元素记为1,否则记为0.这样,Eij实质上是反映格网边缘特征的0-1矩阵.
1.3 基于SVD与Hash函数的边缘特征摘要化
为了解决感知哈希鲁棒性与敏感性之间的矛盾,对特征矩阵Eij进行SVD分解,将部分较大的奇异值作为格网单元的内容特征,并采用Hash函数进行归一化.
SVD分解是矩阵数值分析的常用工具.设A表示大小为 g×h的矩阵,rank(A)=r,r≤min{g,h},U,V 为正交矩阵,则
式中,Σ 为 g×h的对角矩阵,即 Σ =diag(σ1,σ2,…,σN),对角线上的元素称为矩阵A的奇异值,并且满足 σ1≥σ2≥…≥σN.
奇异值能够反映矩阵的代数本质,但这种本质不是直观的,而是一种内在的属性.在多数情况下,前10%的奇异值之和占据了所有奇异值之和的99%以上,因此可以用前K个奇异值来近似描述原始矩阵[11].本文提取前K个奇异值作为格网单元的内容特征,K的取值由算法鲁棒性要求和矩阵实际大小而定.
如果不考虑篡改定位的需求,那么可以采用安全性更高的Hash算法(如SHA-512)有效压缩哈希散列H的长度(本文考虑篡改定位的需求,所以不对生成的哈希散列进一步压缩).
1.4 遥感影像的完整性认证
感知哈希的匹配方式包括2种方式:阈值匹配与精确匹配[12].本文算法采用精确匹配的方式实现认证,即2个哈希散列完全一致才能通过认证.
在遥感影像接收端,具体认证流程如下:按照相同的步骤重新生成待认证影像的感知哈希散列H,并与收到的原始影像的感知哈希散列H'进行比较,就可以验证遥感影像的内容完整性.如果感知哈希散列不相等,则进一步比较感知哈希散列的子散列,便可实现篡改定位,即不相等的子散列Hij对应的格网单元就是发生篡改的区域.
2 实验与分析
为了验证本文算法的有效性,选取如图1所示的4幅三波段遥感影像进行实验与分析,大小分别为2 500 ×2 500,3 000×3 000,4 000 ×4 000,5 000×5 000.实验硬件平台为3.1 GHz主频的CPU,可用内存为2 G;软件开发平台为 Visual Studio 2010,编程语言为C++.
遥感影像格网划分的粒度应当综合考虑计算效率、影像实际大小、篡改定位粒度等多方面因素.这里对图1(a)和(b)采用8×8的格网划分,图1(c)和(d)则采用16×16的格网划分.信息熵阈值T为各影像格网信息熵的平均值.
本文算法能够认证影像数据的内容完整性.如图2和图3所示,遥感影像数据遭到局部细节篡改之后,相应的格网单元边缘特征发生变化,将会使重新计算的感知哈希散列发生变化,与原始的感知哈希散列进行精确匹配,便能检测恶意篡改.
图1 实验影像
图2 篡改检测与定位实例1
图3 篡改检测与定位实例2
本文算法还能对篡改进行定位,篡改定位粒度决定于格网划分的粒度,因此,格网划分得越细,篡改定位的精度越高.但是,如果格网划分得过于精细,算法的计算复杂度增加,感知哈希散列消耗的存储空间也会增加.
下面将本文算法与常规图像感知哈希算法进行对比测试.本文算法顾及了影像的数据海量性特点,针对每个格网进行特征提取;而主流的图像感知哈希算法大多针对图像的全局进行特征提取,输入数据较大时,可能无法感知数据局部变化.因此,为保证测试的公平性,采用图4(a)所示的格网单元(而不是针对整个影像)进行测试.
图4 对比测试的格网篡改实例
常规图像感知哈希算法主要利用DCT变换[2-3]、小波变换[4]、SVD 分解[6]进行特征提取,与本文算法的比较结果见表1.其中,小波变换中归一化Hamming距的阈值为0.01,DCT变换的阈值为0.05,SVD分解的阈值为0.005.
表1 不同算法的篡改识别对比
由表1可知,本文算法更容易识别影像局部的细微篡改,能够满足遥感影像高精度的认证要求.
下面测试算法的鲁棒性.遥感影像对精度有着较高的要求,故本文算法只对不改变影像内容的操作保持鲁棒性.在不改变影像内容的操作中,较为典型的是格式转换和数字水印嵌入,但密码学Hash函数不能对此进行有效认证.下面分别通过格式转换和数字水印嵌入操作来测试本文算法的鲁棒性.其中,水印嵌入采用最低有效位嵌入(LSB),原始影像为TIFF格式.
本文采用感知哈希散列未变化的格网占格网总数的百分比来描述算法鲁棒性.图1(b)经过JPEG格式转换(JPEG压缩)后,17.2%的格网单元的感知哈希散列发生变化,除此之外,实验影像中所有格网单元的感知哈希散列均没有发生变化.由此可见,本文算法对BMP和PNG格式转换、LSB水印嵌入等都具有较好的鲁棒性,同时对JPEG格式压缩也具有一定鲁棒性.
本文算法的鲁棒性可以通过预处理格网单元大小、奇异值选取的数量等进行调节.例如,选择的奇异值越多,认证精度越高;反之,算法鲁棒性越强.
需要指出的是,鲁棒性与认证精度之间存在矛盾:如果过分地强调鲁棒性就有可能漏检局部的细节篡改,对认证精度造成影响;过分强调认证精度,则有可能使不改变内容的操作(如JPEG压缩)不能通过认证.此外,本文的研究对象是经过投影校正与几何校正的遥感影像,因此本文算法视影像的几何变换为非法篡改.
实验影像的感知哈希计算时间见表2.在实际应用中,如果实时性要求更高,可以通过改变预处理格网大小、预处理阈值等来提高算法的运行效率.
表2 实验影像的感知哈希计算时间
为了验证本文算法自适应预处理的有效性,分别将格网单元预处理的大小固定为64×64和32×32进行测试(算法中其他步骤保持不变),影像感知哈希的计算时间见表3.对比表2和表3可以看出,本文算法在认证精度和运行效率之间取得了折中.
表3 非自适应预处理的计算时间对比 s
为了保证认证的安全性,感知哈希算法必须具有较高的单向性,即从感知哈希散列中得不到图像内容的有效信息.本文算法的单向性依托于Hash函数的单向性,而后者早已获得了广泛的认可,故本文算法具有足够的安全性保障.
3 结语
本文提出了一种用于遥感影像内容完整性认证的感知哈希算法.该算法对遥感影像进行格网划分后,自适应地对格网单元进行预处理,并提取格网边缘特征.然后,采用SVD与Hash函数等对提取的边缘特征进行压缩与归一化,得到最终的遥感影像感知哈希散列.自适应的预处理过程是运行效率与认证精度之间的平衡,SVD分解则是为了解决特征鲁棒性与认证精度之间的矛盾.由于不同遥感影像数据的大小相差较大,故算法未限定格网划分的粒度.实验表明,本文算法能够有效检测遥感影像的非法篡改,并能够定位篡改区域;同时,对不改变影像内容的操作具有较好的鲁棒性.但是,本文算法对于影像的频域相关操作的鲁棒性仍显不足,因此,鲁棒性更强的遥感影像边缘特征提取和编码方法是下一步研究的重点.
References)
[1]牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411.Niu Xiamu,Jiao Yuhua.An overview of perceptual hashing[J].Acta Electronica Sinica,2008,36(7):1405-1411.(in Chinese)
[2]张维克,孔祥维,尤新刚.安全鲁棒的图像感知哈希技术[J].东南大学学报:自然科学版,2007,37(1):188-192.Zhang Weike,Kong Xiangwei,You Xingang.Secure and robust image perceptual hashing[J].Journal of Southeast University:Natural Science Edition,2007,37(1):188-192.(in Chinese)
[3]Fridrich J,Goljan M.Robust hash functions for digital watermarking[C]//Proceedings of IEEE International Conference on Information Technology:Coding and Computing.Las Vegas,NV,USA,2000:178-183.
[4]Lin C Y,Chang S F.A robust image authentication method distinguishing JPEG compression from malicious manipulation[J].IEEE Transactions on Circuits and Systems for Video Technology,2001,11(2):153-168.
[5]Monga V,Evans B L.Perceptual image hashing via feature points:performance evaluation and tradeoffs[J].IEEE Transactions on Image Processing,2006,15(11):3452-3465.
[6]Kozat S S,Mihcak K,Venkatesan R.Robust perceptual image hashing via matrix invariants[C]//Proceedings of IEEE Conference on Image Processing.Singapore,2004:3443-3446.
[7]Tang Z,Zhang X,Dai X,et al.Robust image hash function using local color features[J].AEU-International Journal of Electronicsand Communications,2013,67(8):717-722.
[8]Zhao Y,Wang S,Zhang X,et al.Robust hashing for image authentication using Zernike moments and local features[J].IEEE Transactions on Information Forensics and Security,2013,8(1):55-63.
[9]周立国,冯学智,肖鹏峰,等.一种频域高分辨率遥感图像线状特征检测方法[J].测绘学报,2011,40(3):312-317.Zhou Liguo,Feng Xuezhi,Xiao Pengfeng,et al.Linear feature detection for high-resolution remotely sensed imagery in frequency domain[J].Acta Geodaetica et Cartographica Sinica,2011,40(3):312-317.(in Chinese)
[10]程启敏.遥感图像检索技术[M].武汉:武汉大学出版社,2011:22.
[11]韩崇,孙力娟,肖甫,等.基于 SVD的无线多媒体传感器网络图像压缩机制[J].东南大学学报 :自然科学版,2012,42(5):814-819.Han Chong,Sun Lijuan,Xiao Fu,et al.Image compression scheme in wireless multimedia sensor networks based on SVD[J].Journal of Southeast University:Natural Science Edition,2012,42(5):814-819.(in Chinese)
[12]韩琦.基于感知内容的人脸图像认证技术研究[D].哈尔滨:哈尔滨工业大学计算机科学与技术学院,2009.