多窗口融合判别子空间的高光谱图像异常检测
2019-04-10马春笑黄远程胡荣明张春森
马春笑,黄远程,胡荣明,张春森
西安科技大学测绘科学与技术学院,西安710054
高光谱图像可以达到纳米级的光谱分辨率,其波段数多达几十甚至数百个,因具有图谱合一的特性和丰富的光谱信息而在异常检测方面表现出很大的优势[1].
异常检测是一种非监督的目标检测方法[2],凭借其较强的实用性成为遥感应用研究的重点[3].最经典的异常检测算法是RX 算法,它的基本思路是假设在背景符合多元正态分布的情况下探测不符合这种假设的异常目标[4],其检测性能受到样本数据和前提假设条件的影响[5].RX 算法利用的只是高光谱数据的低阶矩统计信息,而忽视了高维数据的非线性信息[6],同时也不能利用数据自带的聚类属性.若将这种算法直接用于高光谱图像处理,则会产生很高的虚警[1].改进的局部RX(local RX,LRX)检测算法能够提高检测精度,改善检测结果,但是内外窗口尺寸的选择是一个难点[7],因为窗口尺寸对检测精度的影响很大.鉴于此,本文提出了一种基于判别子空间的结合多窗口融合的RX 算法,以非监督聚类的方式得到样本类别并对占优的聚类样本进行线性判别分析(linear discriminant analysis,LDA),从而使各聚类类内方差最小、类间方差最大以求得判别性特征向量;然后利用正交子空间投影(orthogonal subspace projection,OSP)使得背景与目标达到最大程度的分离,从而实现对背景的抑制;最后将抑制了背景信息的高光谱图像进行多窗口融合LRX 异常检测,并通过实验对比了传统的全局RX 与局部RX 算法、基于判别子空间的全局RX 与局部RX 算法、多窗口融合判别子空间的局部RX 算法,证明了该方法的有效性.
1 判别子空间多窗口融合异常检测算法
1.1 判别子空间
本文利用线性判别分析和正交子空间投影构建判别子空间,再以判别子空间抑制高光谱图像背景.正交子空间投影算法[8-9]是由Harsanyi 和Chang 等提出的,其投影算子为
式中,I为L×L维单位矩阵,L为高光谱图像的光谱波段数,B为特征向量,P为正交投影算子,X为原始高光谱图像,Y为去背景后的残留图像.
特征向量B选用LDA 计算的判别性特征向量.LDA 是一种有监督的分析方法[10],而本文没有先验信息,因此采取的方法如下:先对高光谱图像进行K-means 聚类以便将相似性质的同种地物进行归类,从而区分不同的地物[8],再将聚类产生的样本信息作为线性判别分析的先验信息而将比例占优的聚类视为异常目标的背景信息进行线性判别分析,得到了判别性特征向量.
判别性特征向量提取过程如下:假设样本有c个类别,将其投影到K个基向量,并将这K个向量表示为W=[w1w2···wk],其中各类样本由K均值聚类法产生,且每一类样本对应一个聚类.设有d维样本X=[x1,··· ,xN],其中xi表示第i类样本,N表示样本总数,Ni表示第i类样本数目[11].类内离散度矩阵Sw和样本的类间离散度矩阵SB分别定义为
式中
式中,Swi表示类别i的样本点x相对于该类中心点µi的散列程度,µ为所有样本的均值,µi为每类样本的均值,则最终的准则函数J(w)的形式为
求J(w)的最大值可得
1.2 LRX算法
LRX 异常检测[12]主要利用同心双滑动窗口模型对图像进行局部像元估计,得出背景均值µ和协方差矩阵Cb.双窗口中的内窗口包含了当前的异常目标像素,其作用就是防止目标像元被背景“污染”;外窗口是进行LRX 检测的背景区域.不同的内外窗口尺寸会影响异常检测的结果,通常内窗口的尺寸与检测目标尺寸相当,但小于外窗口的尺寸,且两种尺寸均为奇数,窗口中心点相同[8].图1为同心局部双窗模型的示意图[13].
图1 局部双窗模型Figure1 Partial dual window model
若检测窗口中心点的光谱向量为x,局部背景样本的均值向量估计值为µb,局部背景样本的协方差矩阵估计值为Cb,阈值为η,则可将LRX 算法的计算公式表示为
1.3 多窗口融合LRX算法
局部双窗检测是对一个像素点进行检测,使双窗口同时移动一个像素大小继续判决,直到对所有像素点检测判决完毕获得一幅异常点分布图.然而,选择LRX 内外窗口的尺寸很难,而窗口尺寸对RX 检测精度的影响很大,因此本文采用融合多个窗口尺寸的方式来提高检测精度.内窗口尺寸根据待检测目标确定,通常定义为目标的最小内接矩形,而外窗口则采用不同尺度的窗口大小,从而得到多窗口LRX 计算结果,再将其以相加方式进行融合.以3 个尺度窗口为例说明多窗口融合LRX 算法模型,如图2所示.
图2 多窗口融合的LRX 算法模型Figure2 LRX algorithm model for multi-window fusion
1.4 本文实验流程
本文实验流程图如图3所示,其具体步骤如下:
2)在简易垃圾填埋场封场治理中,采用柔性垂直防渗技术,一方面阻止污染物通过地下水往外渗漏,另一方面阻止了地下径流进入填埋场,防止产生更多的渗沥液。
步骤1对输入的原始高光谱图像进行K-means 聚类,得到聚类样本信息.
步骤2输入聚类样本信息进行线性判别分析,得到判别性特征向量.
步骤3基于OSP 的构建原理以判别性特征向量构建正交子空间实现对背景的抑制,得到去除背景的高光谱图像后利用多窗口融合的LRX 算法进行异常检测,得到异常像元的检测结果.
步骤4将不同窗口尺寸的RX 检测结果相加,得到最终的检测结果.
图3 实验流程图Figure3 Experimental flow chart
2 实验结果与分析
为进一步验证本文所提出的融合算法的有效性,利用液晶可调高光谱仪NUANCE 和高光谱数字图像实验仪HYDICE 的高光谱数据进行实验.
2.1 NUANCE 高光谱图像异常目标检测实验
2.1.1 NUANCE 实验数据说明
NUANCE 高光谱数据的实验区域以草地为背景,其图像大小为100×100,光谱分辨率为10 nm,包括了650∼1 100 nm 范围的46 个波段[14].该图像上两行并列的对象是感兴趣目标,包含10 个异常目标,共47 个像元.图4分别为原始Nuance 高光谱图像1 040 nm 波段图像和真实异常目标分布图.
图4 NUANCE 真实高光谱图像和对应目标的真实分布Figure4 NUANCE real hyperspectral image and actual drstribution of corresponding targets
2.1.2 NUANCE 实验结果与分析
为证明该方法的有效性,选择传统的全局RX算法(global RX,GRX)、局部RX 算法[15](local RX,LRX)、基于常规子空间的GRX 算法(common PCA subspace GRX,SGRX)与基于常规子空间的LRX 算法(common PCA subspace LRX,SLRX)(常规子空间采用PCA 变换得到的特征向量构建)、基于判别子空间的GRX 算法(discriminant subspace GRX,DSGRX)与基于判别子空间的LRX 算法(discriminant subspace LRX,DSLRX)、多窗口融合在判别子空间的局部RX 算法(multi-window fusion in discriminant subspace LRX,MDSLRX)进行对比,检测效果如图5所示.
首先从图5观察各检测算法的结果如下:
1)图(a)的检测效果不如图(b),因为图(b)的检测结果更加清晰,异常目标突出;
2)图(c)在抑制背景的同时也抑制了异常目标,故异常目标的检测效果最差;
3)图(d)虽然检测了部分异常目标,但显然对背景的抑制不够,从而导致背景杂乱无章,检测效果不突出;
4)图(e)检测效果也不理想,异常目标不够清晰;
5)从视觉效果上来看,图(f)和(g)优于其他图,它们对背景的抑制作用更强,且目标突出.
综合比较图4(b)与图5的检测结果,可以直观地看出7 种算法的检测性能如下:
1)对比图5可知局部的检测效果比全局的检测效果更好.
2)对比图5中的(a)、(c)、(e)这3 种全局算法的检测效果发现图(e)的效果最好,图(c)不如图(e)的原因是目标信息被当成背景抑制了,而图(e)通过聚类分析抑制了占指定比例的背景信息,增强了类间差异,证明了判别分析是有益于目标检测的.
3)对比图5中的(b)、(d)、(f)、(g)局部算法的检测效果发现图(g)的检测效果最好,图(d)对背景抑制不足,图(f)对背景信息和噪声抑制作用较强,说明判别分析在局部分析中是有效的.图(g)是通过多窗口融合得到了最好的结果.
图5 NUANCE 高光谱图像检测结果Figure5 Test results for NUANCE hyperspectral image
为了更好地对检测结果加以说明,以AUC 值评价检测结果.AUC 值越接近1,说明算法性能越好[16],各算法的AUC 值如表1所示.
通过比较AUC 值的大小,既验证了上文各算法结果的对比结论,又可以看出基于特征子空间的融合多个窗口尺寸的局部算法检测结果是最优的.该算法的检测精度较原始LRX、SLRX、DSLRX 均有所提高,所得AUC 值可达0.999 8.
表1 NUANCE高光谱图像异常检测算法AUC值Table1 AUC value of NUANCE hyperspectral image by anomaly detection algorithm
2.2 HYDICE 高光谱图像异常目标检测实验
2.2.1 HYDICE 实验数据说明
实验中截取了一个市区80×100 空间大小的图像作为真实的HYDICE 高光谱数据,图像光谱分辨率为10 nm,空间分辨率约为1 m.去除水的吸收带和信噪比较低的波段后,剩余175 个波段[17].该图像包含8 个异常目标,共17 个像元.图6为原始高光谱图像的第1 个波段图像和真实异常目标分布图.
图6 HYDICE 真实高光谱图像和对应目标的真实分布Figure6 HYDICE real hyperspectral images and actual drstribution of corresponding targets
2.2.2 HYDICE实验结果与分析
实验同样在MATLAB 2016a 环境下进行,根据图像大小、分辨率及感兴趣目标的大小并经多次反复试验选择最优结果的参数设置.根据潜在目标的尺寸将内窗尺寸设置为2×2,将其他参数设置如下:聚类子空间数目为2,聚类数目为6,异常像元占研究区的面积比为0.02,多窗口融合外窗口尺寸分别为3×3、5×5、7×7、9×9、11×11.
HYDICE 图像异常检测算法的AUC 值如表2所示.对比分析各算法的AUC 值可以发现本文算法的精度最高,所得AUC 值可达0.999 6,再次验证了本文算法的可靠性.
表2 HYDICE高光谱图像异常检测算法AUC值Table2 AUC value of HYDICE hyperspectral image by anomaly detection algorithm
3 结 语
本文提出了一种基于判别子空间的结合多窗口融合的RX 算法,利用聚类和特征子空间抑制背景信息和噪声,通过融合多种尺寸的局部检测算法结果提高了检测精度,并依据真实的HYDICE 和NUANCE 高光谱数据进行检验,证明了该算法的检测性能相比于传统RX 算法和基于常规子空间的RX 算法均有所改善,且该方法程序操作简便易于实现,是一种比较实用的异常检测方法.
本文的不足之处是没有利用高阶非线性信息,下一步的工作是在核空间进行聚类判别分析,采用核RX 算法检验本文的思路.