基于子空间异常增殖字典的高光谱图像目标检测算法
2016-04-07赵春晖孟美玲
赵春晖, 孟美玲, 李 威
(哈尔滨工程大学 信息与通信工程学院, 黑龙江 哈尔滨 150001)
基于子空间异常增殖字典的高光谱图像目标检测算法
赵春晖, 孟美玲, 李威
(哈尔滨工程大学 信息与通信工程学院, 黑龙江 哈尔滨150001)
摘要:基于传统字典目标检测算法存在的不足,通过对原始字典进行增殖来提高字典中训练样本的数目,提出了基于子空间异常增殖字典的高光谱图像目标检测算法(SOPDSR).实验仿真证明了此算法可以提高目标检测的精度.
关键词:高光谱图像; 目标检测; 稀疏表示; SOPDSR算法
从20世纪80年代开始,高光谱遥感技术慢慢融入人们的生活,高光谱遥感技术在考古领域[1]、植被研究领域[2-3]以及地质探测领域[4-5]等领域都发挥着相当重要的作用.由于高光谱遥感技术应用的广泛性,近年来此技术愈发地受到许多专家学者的关注,使其以惊人的速度不断地被发展起来.高光谱遥感技术可以实现在获取高光谱遥感图像二维空间信息的同时获取其一维的光谱信息,并将两者结合,将其整合成一幅三维的高光谱遥感图像,使高光谱遥感图像数据可以被更加直观的表现出来.由于高光谱遥感图像数据具有波段窄、高光谱分辨率连续[6]等特点,所以在进行目标检测时更加容易恢复原始高光谱遥感图像的图像数据.将高光谱遥感图像中的像元准确地定义为目标或者是背景,便是目标检测的实质性所在.在高光谱遥感技术这么多年的发展过程中,科学家们已经研究出了许多成熟的目标检测算法,有异常目标检测(RX)[7]、支持向量机(SVM ,support vector machines)[8]、光谱匹配滤波(SMF,spectral matched filter)[9]、匹配子空间检测(MSD, matched subspace detector)[10]与自适应子空间探测(ASD, adaptive subspace detector)[11]等.随着法国科学家Mallat在1993年首次创新性的将稀疏表示理论引入到图像数据表示领域中[12],高光谱遥感图像目标检测领域便有了质的飞跃.然而由于传统稀疏表示理论选取的字典仅仅包含高光谱遥感图像中一小部分光谱信息,导致其恢复出来的原始信号的精确性并不高.压缩感知理论是稀疏表示最为重要的应用[13],压缩感知理论指出,高维原始数据可以被分解成一个低秩矩阵和一个稀疏错误矩阵[14].为此,本文提出基于子空间异常增殖字典的高光谱图像目标检测算法.通过将稀疏错误矩阵增殖到原始目标字典中,以增加原始字典中目标光谱信息的含量,来提高目标检测的精度.
1传统字典构造方法
在字典中,通常会包括许多种不同物质的光谱特征,本文利用高光谱图像的光谱值特征来对目标字典以及背景字典中原子的选取.由于目标与背景中包含不同的地物,即目标的光谱反射率曲线与背景的光谱反射率曲线具有较大差异,因此可以根据目标像素与背景像素位于不同子空间,实现对目标与背景中字典的选取.目标与背景的光谱反射率曲线如图1所示.
图1 反射率曲线
传统字典的构造方法有如下三种:
① K-svd字典设计算法.通过迭代算法求得最小化稀疏表示并更新原数据字典,形成冗余字典来进一步提升基于稀疏表示的目标检测算法的性能.
② 过完备字典的直接构造方法.本论文在这部分介绍一种过完备字典的构造方法,即过完备字典中所包含的原子从高光谱遥感图像(HSI)的左侧直接获取.如图2所示.
图2 直接构造法
过完备字典中的训练样本是从待测高光谱遥感图像数据的一部分直接获取.如图2中所示,有三个目标,过完备字典的原子从高光谱遥感图像数据的左侧直接提取.例如,过完备字典中样本的数量是360,其中目标样本的数量为28,背景样本的数量是332. 由于过完备字典中只包含测试图像中小部分目标样本和背景样本的光谱信息,导致过完备字典中的目标样本和背景样本的光谱特征并不丰富.
③ 过完备字典的双窗构造方法.接下来介绍一种通过使用在图像中某一个目标像元的部分光谱信息构造目标子字典的方法.像在图3 中展示的那样,背景子字典Ab是使用双窗中心在图3中所示的感兴趣的目标像元所产生.內窗的尺寸比目标的尺寸大一些.在Ab中的背景样本来自于外窗区域.构造方法如图3所示.
图3 双窗构造法
利用双窗中心在感兴趣像元处,提取过完备字典的样本.在上述字典的构造中,如果测试样本是目标像元,那么在背景字典Ab中就不会找到与此像元相似的光谱信息,因为外窗区域不包含任何目标像元的光谱信息.另一方面,如果测试样本是一个背景像元,那么在背景字典中,就能发现与之相匹配的光谱信息.
2传统稀疏模型
稀疏表示理论是基于稀疏表示的高光谱遥感图像目标检测算法的理论基础.此理论中包括含有目标原子和背景原子组成的过完备字典以及原子所对应线性系数所构成的稀疏向量.稀疏模型理论的基础是:将原始信号在过完备字典中展开,利用过完备字典中极少量原子线性组合的形式来逼近原始信号.公式如下:
(1)
式中:X为原始信号;D为过完备字典,完备性体现在D中的原子数目远比原始数据中的原子数目多很多;A为稀疏向量.这种算法基于如下假设:同一类别的像素点(目标或者背景)几乎位于同一低维子空间中.对于上述所提出的理论基础所采用的子空间模型的叙述如下:
(2)
式中:Nt是目标训练样本的数量;At是B×Nt阶的目标字典,它的每一列都代表目标训练样本,β是不确定向量,此向量的元素是At中个原子所对应的系数.在稀疏模型中,β是稀疏向量.
(3)
式中:Nb是背景训练样本的数量,背景字典Ab是一个B×Nb矩阵,此矩阵包含背景训练样本,β是一个不确定向量,其中稀疏向量的元素是Ab中各原子所对应的系数,在稀疏模型中,β就是稀疏向量.
稀疏表示算法中,在进行目标检测时,一个未知测试样本像元X,可以由背景子空间和目标子空间的线性组合的形式所表示.通过将背景子空间和目标子空间进行线性组合,这个测试样本X的光谱信息可以由目标子字典At和背景子字典Ab中所有的训练像元的线性组合所表示:
(4)
式中:A=[AbAt]是B×(Nb+Nt)阶矩阵,此矩阵同时包括背景和目标训练样本,β=[βbβt]T是(Nb+Nt)维向量并同时包括与背景字典和目标字典相对应的βb向量和βt向量.
上述方法假设测试样本同时坐落于目标训练样本和背景训练样本张成的空间中.在稀疏表示算法中,过完备字典通常包含不同的物质,例如树、道路、海洋和土壤.这些物质具有不同的光谱特征,并且背景和目标的光谱位于不同的子空间.例如,假设X是背景像素点,此像素点X就不能够被目标字典中的训练样本的线性组合的形式所表示.在经典稀疏情况下,β是一个稀疏向量.应当注意的是,由于缺少目标光谱信息,目标字典中的样本通常少于背景字典的样本个数.
3高维数据分解
由于压缩感知理论在稀疏表示领域的重大应用性,其理论基础愈发地受到专家学者的关注.压缩感知理论基础指出:被观测到的原始图像的数据矩阵D是被一个低秩矩阵A的一些元素恶化而来.这种恶化可以被一个附加的错误矩阵E所表示,也就是说,原始数据D可以被分解成一个低秩矩阵A和一个错误矩阵E.因为这个错误仅仅影响D中元素的一小部分,所以E是一个稀疏错误矩阵.由上述可知,可以得到原始数据矩阵D的分解形式,如图4所示.
(5)
上述所提出的公式提供了一个概念上的解决方案:受错误矩阵E是稀疏的这一条件的约束下,寻找可以产生数据的最低阶的矩阵A:‖E‖0≤k.关于此优化的拉格朗日算法的公式表示如下:
(6)
式(6)可以通过挑选适当的λ来精确地恢复出原始数据D所产生的矩阵[AE].然而,由于式(6)是凸优化问题,但目前为止并没有很有效的方法来解决这一问题.尽管如此,可以通过化简式(6),将l0范数用l1范数来取代,便可以得到更容易处理的优化问题公式,得到的替代公式如下:
(8)
(9)
在式(7)中, ‖‖1表示矩阵所有元素绝对值的总和,‖‖*矩阵的核范数(矩阵奇异值的总和),λ是正权参数.
图4 高维数据分解
4子空间异常增殖字典的提出
在基于稀疏表示的高光谱遥感图像目标检测算法中,过完备字典的构建是最重要的一个环节.原始过完备字典仅仅包括含待检测高光谱遥感图像中一小部分光谱信息.在待检测高光谱遥感图像中,不考虑结构性质不同的目标,因此,对原始数据进行稀疏表示与图像的重建过程均不准确.上面一小节指出,原始数据D可以被分解成一个低秩矩阵A和一个稀疏错误矩阵E,因此得到式(5).为了提高稀疏表示的准确性,本文提出了子空间异常增殖字典.此过完备增殖字典构建方法如下:
(10)
式(10)中,At+b是从待检测高光谱遥感图像中提取出来的过完备目标字典,此字典包括一部分目标光谱的光谱特征.目标子字典At的大小往往小于背景子字典Ab的大小.Ab是背景子字典,此背景字典包含从待检测高光谱遥感图像中的一部分获得的多种背景物质(如道路、草坪和树等)的光谱信息特征.在式(10)中,Ap是增殖字典,此增殖字典是从增殖的光谱空间信息也就是稀疏错误矩阵E中提取出来的.学习构建增殖字典的目的在于提高稀疏重建的精度.
5子空间增殖字典稀疏模型
数据的稀疏、冗余模型是假设高光谱遥感图像数据可以被过完备字典中极少量样本原子的线性组合形式来描述.就其本身而言,对于高光谱遥感图像目标检测来说,使图像数据进行稀疏表示的过完备增殖字典的选择对于高光谱目标检测的成功是极其重要的.为了提高在高光谱遥感图像中目标样本重建的准确度,利用上述所提出的方法,将过完备字典扩展为两部分:一部分是过完备字典原始部分,另一部分是从增殖的光谱空间信息中提取的增殖字典部分.然后将过完备字典与增殖字典相结合,使其当做一个新的过完备字典,应用到高光谱遥感图像的稀疏表示以及目标检测当中.
X是一个包含B维光谱波段信息的高光谱像元.像元X可以近似被如下训练样本的线性组合的形式所表示:
Abβb+Atβt+APβP=
[AbAt][βbβt]T+[AP][βP]=
Aβ+APβP.
(11)
式(11)中,Nb+Nt是过完备增殖字典中训练样本的数量,A是过完备字典,此过完备字典是B×(Nb+Nt)阶矩阵,矩阵的列向量为训练样本.β是一个未知矢量,其元素是与A中原子相匹配的系数.pNt是增殖目标字典训练样本的数量,Ap是增殖字典,此增殖字典是B×pNt阶矩阵,矩阵的列向量为目标训练样本.βP是未知矢量,其元素是与Ap中原子相匹配的系数.
在此模型中,空间光谱信息增殖字典的学习方法被用作对缺失先验目标光谱信息的预测.这种方法可以使过完备字典的目标信息进行增殖.因此,从测试图像中提取出的过完备字典可以被过完备增殖字典所取代并优化.
6稀疏向量的求解及检测结果的判定
(12)
式(12)中,‖‖0代表l0范数,求解最小化l0范数问题是一个非确定性多项式(NP-hard)问题.为了解决这个问题,可将l0范数用l1范数来取代,将其转变成线性规划问题,那么就可以用凸优化问题来解决.式(12)也可以用贪婪追踪算法来解决,如正交匹配追踪(OMP)算法或者子空间追踪(SP)算法.
(13)
(14)
稀疏向量得到后,比较残差rb(x)与rt(x).上式中,zb与zt是分别对应于背景字典和目标字典的重建稀疏系数.本文中,δ为选取的合适的阈值,利用下式来确定目标检测的输出:
(15)
DOPDSR算法流程图如图5所示.
图5 SOPDSR算法流程图
7仿真结果与分析
7.1高光谱图像实验数据
为了验证本文所提出的算法的有效性,一共使用了2幅高光谱图像数据进行仿真实验,这2幅图像数据的第50波段示意图如图6所示.
图6a的高光谱遥感数据是由机载可见光成像光谱仪(AVIRIS)在美国圣地亚哥机场获取到的数据.每个像元高达20 m2的空间分辨率,在0.4~1.8 μm波段范围内获取图像信息,此范围覆盖可见光波长到红外波长,获取图像信息相邻波段的间隔为10 nm .通过去除水的吸收带与信噪比略低的波段的图像信息后,实验数据中一共含有126个波段.本实验所用到的实验图像信息中,像元的数目是60×60,总共包含3架飞机作为待检测目标.
图6 仿真实验数据(第50波段)
图6b的高光谱遥感数据是由机载可见光成像光谱仪(AVIRIS)在美国圣地亚哥机场获取到的数据.每个像元高达20 m2的空间分辨率,在0.4~1.8 μm 波段范围内获取图像信息,此范围覆盖可见光波长到红外波长,获取图像信息相邻波段的间隔为10 nm .通过去除水的吸收带与信噪比略低的波段的图像信息后,实验数据中一共含有126个波段.本实验所用到的实验图像信息中,像元的数目是60×60,总共包含4架飞机作为待检测目标.
本文仿真环境:仿真实验是在MATLAB2010b的编程环境下进行的,通过MATLAB可编程语言实现对高光谱遥感图像数据的目标检测.本论文实验平台是处理器为Intel(R) Core(TM) i5-3210M CPU @ 2.50 GHz,主频为2.50 GHz,最大频率为3.1 GHz,缓存为3 MB,硬件核心数为2个,虚拟线程为4个;安装内存(RAM)为4.00 GB;系统类型为64位操作系统;Windows版本为Windows 7旗舰版.
操作界面如图7所示.
图7 MATLAB操作界面
7.2实验结果与分析
首先,讨论增殖样本的数目对算法检测性能的影响.预实验,是在参数λ的取值为0.1,虚警概率pf的取值是0.13的条件下进行的,在实验中字典部分选取了360个训练样本,其中目标训练样本的数目是34,背景训练样本的数目是326.首先,随机挑选所有目标训练样本中的24个像素点作为目标样本,其余336个为背景训练样本,进行目标检测的实验,得到一个检测概率并记录下来;接下来,依次增加目标训练样本的数目,一共进行十次实验.将实验所得到的数据绘制成如图8所示.
如图8所示,pd表示检测概率,图中给出了算法检测概率与增殖样本的数目之间的关系.可以看出,随着目标训练样本的增加,检验概率也不断增大,最后可以达到最大值.由此可以得出,在进行目标检测时,向原始字典中增加目标训练样本的数目可以对算法检测性能进行优化.
图8 增殖样本数目的影响
为了验证本文所提出的基于子空间异常增殖字典稀疏表示的高光谱图像目标检测算法的有效性,在进行实验时与另外两种算法进行对比.这两种算法分别为异常检测算法即RX算法与基于传统字典构造的稀疏表示高光谱图像目标检测算法即SR算法.
SR算法所使用到的字典中,共包含360个训练样本,其中检测三架飞机的过完备字典中共包含360个训练样本,其中目标训练样本的数目是16,背景训练样本的数目是344;检测四架飞机的过完备字典中共包含360个训练样本,其中目标训练样本的数目是21,背景训练样本的数目是339.
在实验中,参数λ的取值为0.1,并将稀疏错误矩阵E中丰度值最大的目标训练样本添加到子空间异常增殖字典中.最终检测三架飞机的子空间异常增殖字典中添加的目标训练样本的数目是27,检测四架飞机的子空间异常增殖字典中添加的目标训练样本的数目是34.
三架飞机的检测结果二值图如图9所示.
由图9可以看出,SR算法与SOPDSR算法都可以精准的检测出三架飞机,而SR算法的检测效果明显劣于其他两种算法.
4架飞机的检测效果图如图10所示.
由图10可以看出,相比于三架飞机的检测图,四架飞机的检测效果更加明显.RX算法基本无法得出是四架飞机的检测图;SR算法虽然可以看出是四架飞机,但有一部分高台信息也被检测出,给目标检测带来了误差;而SOPDSR算法可以清晰的检测出四架飞机.
用接收机工作特性(ROC)曲线[15]可以更加客观的衡量三种算法的检测性能.接收机工作特性用于描述不同检测阈值下检测概率pd与虚警概率pf之间的变化关系,提供对算法检测性能的定量分析.检测概率pd为检测到的真实目标像素数目与地面真实目标像素数目的比值;虚警概率pf为检测到的虚警像素数目同整幅图像像素数目总和的比值.三种算法针对真实飞机场图像数据的ROC曲线如图11所示.
图9 三架飞机数据仿真检测结果
图10 四架飞机数据仿真检测结果
图11 飞机数据接收机工作特性曲线
由图10的ROC曲线可以看出,SOPDSR算法与SR算法的ROC曲线接近,但SOPDSR算法的ROC曲线的点都比SR算法的要高一些.对于ROC曲线来说,曲线越接近于整幅图像坐标的左上方,说明算法的检测效果越好,也就是说,SOPDSR算法的性能优于SR算法.由图11也可以看出,这两种算法的检测性能都比RX算法的检测性能好.
8结论
本文首先介绍稀疏模型相关知识,并针对于由于传统字典构造方法得到的字典中所包含的训练样本的数目小、种类少方面的不足,提出了基于子空间异常增殖字典的高光谱图像目标检测算法,并通过试验仿真,验证了此算法具有更加理想的检测效果,提高了目标检测的精度.
参考文献:
[1] 谭克龙,万余庆,杨一德,等. 高光谱遥感考古探索研究[J]. 红外与毫米波学报, 2005,24(6):437-440.
(TAN K L, WAN Y Q, YANG Y D, et al. Study of hyperspectral remote sensing for archaeology[J]. Journal of Infrared and Millimeter Waves, 2005,24(6):437-440.)
[2] MANOLAKIS D, SHAW G. Detection algorithms for hyperspectral imaging applications[J]. IEEE Signal Processing Magazine, 2002,19(1):29-43.
[3] 申广荣,王人潮. 植被高光谱遥感的应用研究综述[J]. 上海交通大学学报, 2001,19(4):315-320.
(SHEN G R, WANG R C. Inst of agric remote sensing and inform[J]. Journal of Shanghai Jiaotong University , 2001,19(4):315-320.)
[4] 李志忠 杨日红,党福星,等. 高光谱遥感卫星技术及其地质应用[J]. 地质通报, 2009,28(2):270-277.
(LI Z Z, YANG R H, DANG F X, et al. The hyperspectral remote sensing technology and its application[J]. Geological Bulletin of China, 2009,28(2):270-277.)
[5] 钱建平,伍贵华,陈宏毅. 现代遥感技术在地质找矿中的应用[J]. 地质找矿论丛, 2012,27(3):355-360.
(QIAN J P, WU G H, CHEN H Y. The application of morden remote sensing technology to geology and ore exploration[J]. Contributions to Geology and Mineral Resources Research, 2012,27(3):355-360.)
[6] 张兵,高连如. 高光谱图像分类与目标检测[M]. 北京:科学出版社, 2011:2-26.
(ZHANG B, GAO L R. Hyperspectral image classification and target detection[M]. Beijing: Science Press, 2011:2-26.)
[7] KRAUTS, SCHARF L L, McWHORTER, et al. Adaptive subspace detectors[J]. IEEE Transections on Signal Processing, 2001,49(1):1-16.
[8] BANERJEE A, BURLINA P, DIEHL C. A support vector method for anomaly detection in hyperspectral imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006,44(8):2282-2291.
[9] MANOLAKIS D, SHAW G. Detection algorithms for hyperspectral imaging applications[J]. IEEE Signal Processing Magazine, 2002,19(1):29-43.
[10] SCHARFL L, FRIEDLANDER B. Matched subspace detectors[J]. IEEE Transactions on Signal Processing, 1994,42(8):2146-2157.
[11] CHEN Y, NASRABADI N M, TRAN T D. Hyperspectral image classification using dictionary-based sparse representation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011,49(10):3973-3985.
[12] 邓承志. 图像稀疏表示及其应用研究[D]. 武汉: 华中科技大学, 2008:10-35.
(DENG C Z. Research on image sparse representation theory and its applications[D]. Wuhan: Huazhong University of Sciense and Technology, 2008:10-35.)
[13] 石光明,刘丹华,高大化,等. 压缩感知理论及其研究进展[J]. 电子学报, 2009,37(5):1070-1081.
(SHI G M, LIU D H, GAO D H, et al. Advances in theory and application of compressed sensing[J]. Acta Electronica Sinica, 2009,37(5):1070-1081.)
[14] CANDESE, LI X, MA Y, et al. Robust principal component analysis: Recovering low-rank matrices from sparse errors[C]∥Sensor Array and Multichannel Signal Processing Workshop (SAM), 2010 IEEE, Jerusalem, 2010:201-204.
[15] 孙长亮,何峻,肖怀铁. 基于ROC曲线的目标识别性能评估方法[J]. 雷达科学与技术, 2007,5(1):17-21.
(SUN C L, HE J, XIAO H T. A new performance evaluation method based on ROC curve[J]. Radar Science and Technology, 2007,5(1):17-21.)
【责任编辑: 胡天慧】
Hyperspectral Imagery Target Detection Algorithm Based on Subspace Outlier Proliferation Dictionary Sparse Representation
ZhaoChunhui,MengMeiling,LiWei
(College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China)
Abstract:For the lack of the traditional dictionary, the target detection algorithm based on the subspace outlier proliferation dictionary (SOPDSR) is proposed. The subspace outlier proliferation dictionary is built by adding the number of training samples in the traditional dictionary. The simulation experiments are carried out to prove that the subspace outlier proliferation dictionary target detection algorithm does work and the new algorithm can improve the accuracy in target detection.
Key words:hyperspectral imagery; target detection; sparse representation; SOPDSR algorithm
中图分类号:TP 751.1
文献标志码:A
文章编号:2095-5456(2016)01-0033-08
作者简介:赵春晖(1965-),男,黑龙江汤原人,哈尔滨工程大学教授,博士生导师.
基金项目:国家自然科学基金资助项目(61571145, 61405041); 黑龙江省自然科学基金重点资助项目(ZD201216); 哈尔滨市优秀学科带头人基金资助项目(RC2013XK009003).
收稿日期:2015-06-05