空间一致核协同优化的高光谱异常检测方法
2022-08-04张国云欧阳慧婷杨先畅
张国云, 欧阳慧婷, 涂 兵, 杨先畅
(湖南理工学院 信息科学与工程学院, 湖南 岳阳 414006)
0 引言
异常检测是高光谱图像处理和高光谱遥感应用领域的重要课题之一, 在军事安全、环境污染监测、地质勘探以及农林监控等实际应用中发挥了重要的作用[1].异常目标通常具有两个明显特征, 即概率低、数量少[2].利用这两个特征, 许多经典异常检测算法被提出, 如RX算法[3]、低秩与稀疏分解算法[4]、协同表示算法[5]和基于机器学习的异常检测方法等.RX算法通过求解待测像元与背景像元光谱均值之间的马氏距离得到检测结果, 但该算法需假设背景模型符合高斯分布, 而大部分情况下该条件无法满足[6].基于背景数据具有低秩性而异常数据具有稀疏性的假设, 低秩与稀疏分解算法将数据矩阵分解为一个低秩矩阵和一个稀疏矩阵.基于低秩与稀疏分解的算法最重要的是建立一个完善的过完备字典, 但是由于异常和背景先验信息的缺失和孤立噪声的污染, 当异常覆盖面积较大时, 异常可能会被纳入到背景字典中.基于机器学习的高光谱异常检测方法, 不需要评估背景统计量, 避免了背景建模的不准确.Li[7]等首先训练深度卷积神经网络(CNN)并用于高光谱异常检测.基于机器学习的方法通常需要复杂的计算过程和参数分析, 其中核参数和惩罚参数的优化直接影响分类结果的准确性.协同表示通过背景像元的线性组合来表示中心像元, 将得到的结果与实际结果的差作为异常目标的判断依据, 取得了不错的探测效果, 在异常检测中得到广泛应用.
由于高光谱遥感图像具有复杂的非线性光谱和空间信息, 大部分数据都不是线性可分的, 因此许多基于核函数方法改进的异常检测算法被提出.核RX算法[8]将原始数据通过非线性函数映射到高维特征空间, 使得原来线性不可分的数据变得线性可分, 从而能更好地区分背景和目标信息.核方法使异常与背景的可分性增强, 同时得到更纯净的背景像素集.例如, 基于核背景纯化的异常目标检测方法[9]能更准确地估计背景信息, 提取纯净背景像素集进行背景协方差矩阵估计.基于核方法的孤立森林高光谱异常检测方法[10]将高光谱图像通过径向基核函数映射到高维特征空间后, 利用异常比背景更容易受到内核空间中的隔离影响对异常目标进行检测.纯净的背景像素集对协同表示检测器的性能有很大的提高, 故一些其他的纯化背景像素集的策略也被提出来改善算法性能.最近邻正则化子空间局部求和异常值去除异常检测器[11]在最近邻正则化子空间中运用异常值去除的策略纯化协同表示方法的背景像素集, 降低背景像素集中含有异常像素对检测结果造成的误差.
本文将高光谱遥感图像非线性光谱信息用于协同表示检测器.首先, 将高光谱遥感数据通过核函数映射到高维特征空间, 增加目标像素与背景像素的可分性.然后, 为改善协同表示检测器的背景像素集含有杂质的问题, 采用异常值去除策略纯化背景像素集, 得到最近邻正则化子空间内邻域像素集的空间一致的核协同表示, 核协同表示近似值可以线性加权表示被测像素, 返回被测像素与其邻域之间的相似性度量.在通过上述方法得到异常目标初始检测图后, 利用高光谱图像的空间—光谱信息优化初始检测图,从而得到更精确的检测结果.最后通过在四个真实高光谱数据集上的实验证明所提算法在精度和性能方面有较大提升.
1 相关工作
1.1 协同表示异常检测算法
协同表示的目标是找到背景像素集的线性组合的权向量, 使协同表示结果与中心像元y的距离尽可能小.协同表示的目标函数为
权向量的解为
最后得到协同表示的近似值与中心像元的欧氏距离的残差, 作为被测像素的异常得分1r, 并设置合适的阈值, 将大于该阈值的被测像素认定为异常目标, 低于该阈值的则认定为背景像素.异常得分的数学表达式为
1.2 核协同表示
高光谱遥感图像具有复杂的光谱空间结构, 大部分情况下原始数据难以简单地线性分类识别.核方法的引入可以充分挖掘高光谱图像波段间的非线性统计特性, 增强不同类数据的可分性, 从而获得高维空间中的线性可分能力[12].将核方法应用到协同表示算法中, 采用高斯核函数作为投影函数:
将原始数据映射到核函数诱导的特征空间后, 中心像元投影为:y→Φ (y), 背景像素集投影为:Xs→Φ(Xs), Φ是一种非线性或线性核映射.被测像素的核协同表示目标函数优化为
其中α*为背景像素集在新的特征空间中的权向量,s为背景像素个数,λ为正则化参数, 背景像素集的权重对角矩阵Γy的表现形式变为
高维特征空间中权向量α*的求解公式为
核协同表示的残差rk求解公式更新为
2 空间一致核协同优化的高光谱异常检测方法
2.1 算法流程
本文提出空间一致核协同优化的高光谱异常检测算法(SCKCRD).首先, 利用非线性核函数将高光谱像元映射到高维特征空间, 增强异常目标与背景像素的可分性.由于异常目标的光谱值通常游离于中心地带, 可通过设置合适的阈值去除背景像素集中潜在的异常像素.然后, 用异常值去除方法加强最近邻正则化子空间内背景像素集的空间一致性, 从而优化核协同检测器的性能.被测像素的估计值将由其邻域像素的核协同表示通过线性加权求和得到.最后利用空间光谱信息优化初始检测结果得到被测像素最终的异常得分.算法流程如图1所示.
图1 异常值去除核协同表示算法流程
2.2 空间一致核协同表示方法
背景像素集中存在异常值会对测试像素的协同表示近似值造成较大的误差, 从而对检测性能带来负面影响.因此, 提高背景像素集的纯净度是提升协同表示检测性能的有效途径[13].针对协同表示算法中高光谱异常检测算法的背景纯化问题, 采用离群值去除策略提升算法检测精度.去除离群像素需要设置合理的阈值区间, 将检测窗口内像素强度值不在阈值区间内的像素作为异常值去除, 从而得到更纯净的表征中心像素的背景像素集.假定原始数据通过核函数投影到高维特征空间后服从正态分布, 阈值区间可根据双窗口内像素强度值的均值和标准差来构造[14].已有研究表明, 该方法得到的阈值区间能够较合理地隔离异常像素.该阈值区间上限τmax和下限τmin的计算公式为
其中μ和σ是原背景像素集Xs的均值和标准差.强度值高于τmax和低于τmin的像素将被移除出原背景像素集, 从而得到新的纯净的背景像素集Xp.中心像元y在高维特征空间中的离群值去除核协同表示目标函数更新为
地物通常表现为光谱和空间分布上的聚类特性, 即空间一致性高的地物属于同种类型的概率也会更高.像元的空间信息与其光谱值的重构有较大关系, 邻域像元对中心像元的作用与距离成反比.对于被测像素y, 假设其最近邻正则化子空间像素集为A= {a1,a2, …,am},m为子空间内像素个数, 像素ai通过离群值去除核协同表示算法得到的异常得分为ri, 则被测像素y的异常得分为
其中ρi为最近邻正则化子空间像素ai的权重, 数学表达式为
2.3 空谱优化过程
根据高光谱遥感图像的特点[15,16], 高光谱遥感影像中的像元与其周围像元通常反映相同或相似的地物特征.为进一步利用高光谱图像的空间信息, 采用一种同时利用光谱和空间信息的检测图优化方法来提高检测精度.同时考虑邻域像素xi与中心像素y之间的空间欧氏距离和离群点去除核协同表示预测值的距离, 定义距离和欧氏距离为
初始检测图包含HIS颜色模型的光谱信息, 利用被测像素及其相邻像素的空间位置关系, 对初始异常得分重新分配适当的权重.在该检测图优化过程中, 将待测像元的初始异常得分作为其残差的加权值和相邻像元残差的加权平均值.对于被测像素y, 该优化策略表示为
其中rfinal为被测像元最终异常得分,β为权重系数,φ为邻域像素集,ry和ri分别为像素y和像素ai的初始异常得分.
3 实验和结果分析
3.1 实验数据集
本算法在四个真实数据集上进行评估, 分别是San Diego、Airport、Beach和Urban数据集.它们是通过机载可见/红外成像光谱仪(AVIRIS)和反射光学系统成像光谱仪(ROSIS-03)获得的真实高光谱数据集,数据集的详细信息见表1.四个真实数据集的伪彩色图像和异常实际参考图如图2所示.
图2 数据集的伪彩色图及其异常实际参考图
表1 数据集的详细描述
3.2 实验结果与可视化分析
将本文算法SCKCRD与RX、局部RX(LRX)、协同表示算法(CRD)、属性边缘滤波器算法(AED)[17]、核孤立森林算法(KIFD)、核协同表示算法(KCRD)和异常值去除的最近邻正则化子空间局部求和算法(LSUNRSEDORAD)等七种异常目标检测算法进行实验比较.在对比实验中, 所有算法设置最佳参数值以尽可能地获取更高的检测精度.针对四个实验数据集, 各算法获得的视觉检测结果分别如图3~6所示, 白色表示异常像素, 黑色表示背景像素.从实验结果来看, CRD、AED、KCRD和LSUNRSEDORAD方法能大致识别飞机的位置, 但飞机形状较模糊, 且存在伪异常像素.在所有方法中, 一些与周围像素在光谱上有很大差异的背景像素也可能被检测为异常.AED、KIFD和SCKCRD的检测效果较好, 但AED算法的异常目标突出能力不如KIFD和SCKCRD算法, 原因可能是通过核函数的映射有效提高了目标与背景的可分离性, 而SCKCRD比KIFD算法的背景抑制效果更好, 得到较少虚警的检测结果.相对来说,SCKCRD算法具有更好的鲁棒性.
图3 不同算法在San_Diego数据集上的视觉检测结果
图4 不同算法在Airport数据集上的视觉检测结果
图5 不同算法在Beach数据集上的视觉检测结果
图6 不同算法在Urban 数据集上的视觉检测结果
3.3 ROC曲线和AUC值分析
图7为不同方法在各数据集上得到的ROC曲线.曲线下面积(AUC)值越大, 表明检测方法的优越性越强.可以看出, 本文SCKCRD算法在ROC曲线上的表现更好, 比其他方法有更大的曲线下面积, 且ROC曲线上升速度更快, 其检测精度优于其他异常检测方法.少数比较算法与SCKCRD算法的ROC曲线有相似的走势, 但在虚警率较低时, SCKCRD算法有更高的检测精度.
图7 不同算法在各数据集上的ROC曲线
表2给出了各算法在不同实验数据集上的具体AUC值, 不难看出, 本文方法在异常检测精度方面比其他方法有更高的AUC值.
表2 不同算法在各数据集上的AUC值
3.4 异常与背景可分离性分析
为比较各方法对背景和异常的可分离性, 我们用方框图将SCKCRD方法与其他方法的可分离性结果进行了对比.如图8所示, 将每种方法的检测值归一化, 红色框代表异常目标的检测值分布, 绿色框代表背景像素的检测值分布, 每个盒子内部的横线是中值位置, 盒子的上下边缘分别表示极大值和极小值, 反映了像素分布的倾向性和紧凑性, 异常目标与背景的中线位置之间的距离差代表了异常与背景的可分离性.从图8的结果来看, AED方法、KIFD方法和SCKCRD方法在四个实验数据集上的背景与异常可分离性都较好, KCRD算法在目标与背景的分离性方面也优于传统CRD算法, 这表明核方法在分离异常目标与背景方面发挥了重要作用.SCKCRD方法对异常和背景具有较高的识别能力.
图8 不同算法在各数据集上的异常与背景可分离性
4 结论
本文基于核方法有效提取高光谱图像非线性光谱和空间特征, 降低传统协同表示异常检测器对纯净背景的高度依赖性, 提出一种空间一致核协同优化的高光谱异常检测算法.该方法利用核函数投影方法增大异常与背景像素的可分离性.通过增强最近邻正则化子空间内背景像素的空间一致性, 对被测像素的邻域像素进行核协同表示, 然后将优化后的核协同表示近似值通过线性加权表示中心像素, 并充分利用图像的空间和光谱信息对检测器的初始检测图进行优化后再处理.在实际高光谱数据集上的实验分析表明, 本文所提算法在检测精度和算法性能方面都具有优越性.