APP下载

高光谱遥感影像异常目标检测研究进展

2024-03-09屈博郑向涛钱学明卢孝强

遥感学报 2024年1期
关键词:背景光谱像素

屈博,郑向涛,钱学明,卢孝强

1.中国科学院西安光学精密机械研究所 光谱成像技术实验室,西安 710119;2.西安交通大学 信息与通信工程学院,西安 710049;3.中国科学院大学,北京 100049

1 引言

高光谱影像是由一系列二维遥感图像构成的数据立方体,其中每张二维图像能够反映该区域内的不同地物对不同波长电磁波的反射/辐射强度,而高光谱数据的每个像素对应光谱曲线则反映了该像素在不同波段上的光谱信息。因此高光谱影像具有“图谱合一”的特征,即该数据既可以描述图像的地物几何空间关系信息,也可以观测对应地物物质属性的光谱信息。因此高光谱遥感影像在国土资源调查、地质灾害评估、城市规划、灾害救援等领域均有广泛的应用。

高光谱异常目标检测,指在没有借助任何目标先验知识的条件下,通过算法检测出场景中与周围像素特征不同的像素,并将其判定为异常目标。由于高光谱异常检测是一个无监督过程,不需要提前提供待测目标的先验信息,因此其在实际生活中发挥着很大的作用。例如灾害后通过异常目标检测技术实现被困人员搜救,森林火灾初期着火点的快速定位,矿产资源勘探过程中矿点搜索等等。但是从另一方面来说,由于在高光谱异常目标检测过程中,并不能提前获取异常目标的光谱、颜色、纹理等先验信息,整个检测过程处于一种“盲检测”的状态,因此异常目标检测的难度也比传统的目标检测难度更高。

高光谱异常检测问题的实际应用范围广且挑战性强,近些年来一直是遥感影像处理的一个热门研究方向,大量的学者开展了广泛且深入的研究,也取得了丰富的研究成果。但是目前高光谱异常目标检测仍然面临着许多的难点问题,比如相同材质的目标由于拍摄环境、大气干扰等原因,会表现出不同的光谱特性,干扰检测结果,导致出现“同物异谱”的问题,不同材质的目标也可能表现出“异物同谱”的问题;现有的高光谱异常检测算法往往处于实验室阶段,实用化程度偏低的问题;高光谱数据波段数多、包含大量冗余信息,数据处理困难的问题;成像过程中设备与环境的干扰,造成高光谱数据中单个像素包含混合像元的问题;目前公开的高光谱异常检测数据集数量不足、数据采集时间久远的问题等。

本文将首先对现有高光谱异常目标检测算法的研究与发展进行分析与总结,随后对高光谱异常目标检测研究未来的发展趋势提出自己的见解。

2 高光谱异常目标检测研究进展

高光谱异常目标检测的关键是通过分析与背景像素具有不同特征的像素,并将其判定为异常目标。高光谱异常目标检测示例如图1所示。

图1 高光谱数据伪彩色图与异常检测结果示意图Fig.1 Pseudo color map of hyperspectral data and the results of anomaly detections

本章节详细地分析总结了的高光谱异常目标检测算法的发展历程,以及各个发展阶段具有代表性的检测算法,并且根据检测方法的不同,将高光谱异常检测算法进行了相应的分类。主要分成了基于统计学的方法、基于数据表达的方法、基于数据分解的方法、基于深度学习的方法和其他方法5个大类,本章节在每个大类下面也对相应的异常检测算法进行了更加详细的划分,具体的分类结果详见表1。

表1 高光谱异常目标检测算法分类与特点总结Table 1 The summary of categories and characteristics for hyperspectral anomaly detection algorithms

随后本节将对每类异常检测算法的特点与不足进行详细的介绍与分析,并且对代表性的异常检测算法在常用异常检测数据集上的检测结果进行列举。最终对现有高光谱异常目标检测算法,在解决该领域存在问题做出的贡献,进行了相应的分析与探讨。

2.1 基于统计学的方法

基于统计学的高光谱异常检测方法,需要假设高光谱图像背景像素服从某种统计模型,然后将不符合模型的像素点标记为异常点。该方法的基本流程是首先初始化假设背景的统计模型;然后选取一定的像素点对统计模型的参数进行估计;最后对待测像素与背景统计模型之间进行距离度量,根据度量结果判断该像素为背景像素还是异常像素。

基于统计学的方法代表的有RX(Reed-Xiaoli)算法,该算法由Reed 和Yu(1990)提出,算法首先假设图像背景部分满足多元高斯分布,然后计算背景像素的均值与方差,然后通过计算待测像素与背景像素之间的马氏距离来判断该像素是否为异常像素。该方法计算量小,针对简单场景也取得了较好的效果,因此也被普遍认为是高光谱异常检测的基准方法。后续许多研究人员在此基础上对RX 算法进行了拓展与改进:Kwon和Nasrabadi(2005)提出了KRX(Kernel-RX)算法,该方法通过引入核函数,将高光谱数据映射到高维特征空间,使得异常目标与背景像素在高维空间中具有更好的区分度,进而提高算法的检测精度;Zhou 等(2016)在KRX 的基础上提出了CKRX(Cluster Kernel RX)算法,该方法首先对数据中的背景像素进行聚类操作,用每个聚类中心去替代该类中的所有像素,这样可以大大降低算法计算量,然后通过一个快速特征分解算法进行异常目标检测;Matteoli 等(2014)提出了LRX(Local-RX)算法,通过局部自适应核密度估计方法,对背景数据进行有效建模,降低了背景中噪声信息的干扰,从而提升了异常检测的精度;随后Guo等(2014)提出了WRX(Weighted-RX)和LF-RX(Linear Filter-Based)两种方法来解决高光谱异常检测问题,其中WRX是通过降低异常/噪声像素权重,提升背景像素权重,来更好地对背景信息进行评估,进而提升异常检测精度;LF-RX则是通过对异常/噪声像素进行滤波,获得一个更精确定背景协方差矩阵估计,进而获得更加真实的异常检测结果。

近些年也有不少学者也在基于统计学的高光谱异常检测方向进行着相关的研究,比如(Tu等,2020a,2020b)提出基于峰值聚DPC(Density Peak Clustering)的方法,该方法考虑传统RX 算法需要假设背景服从高斯分布并且估计背景模型极易受到异常像素干扰的问题,通过计算局部窗口的峰值密度图,判断出异常目标的位置,实现高光谱异常目标检测。该方法利用了异常数据出现频率低这一特点,无需进行背景的高斯分布假设,同时可以减轻异常像素引起的背景数据污染问题。

基于统计学的方法属于早期的高光谱异常检测算法,其优势在于思路简单,只需要根据现有数据设计统计学模型,并学习出相应的模型参数,最后通过某种度量方式来判断出异常与背景之间的区别,因此针对一些简单的场景能够取得不错的异常检测效果。但是由于此类方法一般需要假设数据的背景部分服从多元高斯分布这一数学约束,而该约束在实际获取到的数据中很难满足,因此此类方法对实际场景下复杂的真实高光谱数据,检测精度一般非常有限。

2.2 基于数据表达的方法

基于数据表达的方法在异常检测过程中无需对图像的背景统计分布进行假设,改进了基于统计学方法的局限性。其主要思想是高光谱数据中的背景像素是可以通过空间邻域像素或者背景字典近似表示,而异常像素则不可。该类方法的基本流程是,首先构建背景字典与稀疏系数矩阵;然后根据背景字典与系数矩阵,计算出待测像素的重构误差来判断是否为异常点。

常见的方法有基于稀疏表达的算法SRD(Sparse Representation based Detectors)和基于协同表达的算法CRD(Collaborative Representation based Detectors)。其中基于稀疏表达的方法首先由Chen 等(2011)提出,应用于高光谱目标检测任务,此方法的思路是目标像素可以被训练数据的稀疏线性组合来表达。随后Li 等(2015)将稀疏表达的思想应用于异常检测问题,提出背景联合的稀疏表达算法BJSR(Background Joint Sparse Representation),首先根据背景像素构建过完备字典集并估计稀疏系数矩阵,然后通过计算待测像素的重构误差来判断是否为异常像素。后续大量的学者也在此基础上进行了进一步的改进与探索(Zhang 和Zhao,2017;Ma等,2017;Ling等,2019;Zhao等,2017)。另一方面Li 和Du(2014)提出了基于协同表达的异常检测方法,该方法考虑了高光谱像素之间的空间关系,通过背景像素可以近似的被空间相邻的像素表达,而异常像素则不可以这一特性来进行异常检测,引入了一定的地物空间信息。Vafadar和Ghassemian(2018)提出了改进的协同表达检测算法CRBORAD(Collaborative-Representation-Based with Outlier Removal Anomaly Detector),该方法考虑到传统表达类方法在构建背景字典时,容易被异常像素或者噪声污染,导致模型不准确,因此该算法在进行协同表达操作前,先通过统计学方法移除可能存在的离群点(异常点、噪声点等),然后再使用协同表达的方法进行异常检测。随后,国内外的许多学者也在协同表达方向上开展了相应的研究(刘万军 等,2018;Su等,2020;Zhao等,2022)。

稀疏表达与协同表达这两类方法的思路接近,两者的区别在于稀疏表达采用L1 范数对目标函数中的表达系数进行约束,以获取一个稀疏的系数矩阵解;协同表达则是考虑了像素之间的空间信息,采用L2 范数对表达系数进行约束,这样求得的解更加稳定,并且通过相似矩阵的约束可以在一定程度上抑制背景中包含异常点的问题。

基于数据表达的方法可以克服基于统计方法需要对数据进行的高斯假设的局限性,将异常检测问题巧妙地转化成求解最优背景字典的系数矩阵问题,降低了检测算法的复杂度,同时也能在一定程度上避免异常点对背景的干扰,因此可以实现对较为复杂的高光谱数据的异常检测。但是该类方法在构建背景字典时,容易受到噪声与异常点的干扰,导致最终的检测效果下降。

2.3 基于数据分解的方法

基于数据分解的异常检测方法主要针对高光谱数据进行不同维度的分解,实现对异常目标的检测,该类方法主要分成基于矩阵分解和基于张量分解两类。基于矩阵分解的方法基本原理是因为高光谱数据中的异常目标往往只占有非常少的像素数,具有空间上的稀疏性,而大量的数据为背景区域并且地物类型比较单一,因此可以借助低秩矩阵分解的思路来进行异常检测。基于张量分解的方法,则是将高光谱数据看作高阶张量,同时从光谱维度和空间维度对高光谱数据的异常目标进行检测。

常见的基于矩阵分解的方法有:基于的低秩表达的方法LRR(Low Rank Representation)、基于鲁棒主成分分析RPCA(Robust Principal Component Analysis)的方法和基于Go-Dec 的方法等。LRR最早由Liu(2013)提出,该方法最初是应用于子空间聚类问题,利用低秩约束的目标函数,实现通过字典线性组合对数据样本进行表达。随后许多学者将该方法应用于高光谱异常检测问题,并进行了相应的改进。比如Xu 等(2016)提出了基于低秩稀疏表达LRaSR(Low-Rank and Sparse Representation)的方法,该方法利用背景字典的低秩矩阵表达对背景像素进行表示,并通过稀疏约束挖掘光谱局部特征,取得了不错的效果;Qu等(2018)提出基于光谱解混和字典低秩分解的方法ADLR(Abundance and Dictionary-based Low Rank decomposition),该方法在进行异常检测时考虑了混合像元问题,即:由于受到采集设备与采集环境的影响,在获取到的高光谱数据中,单个像素包含有多种地物的光谱信息,形成了混合像元。因此ADLR 方法首先利用光谱解混算法获取原始数据对应端元的丰度向量,随后利用获取到的丰度向量构建字典,这样既可以减少噪声干扰,也可以提取到更加具有区分性的特征,然后利用该字典对高光谱数据进行低秩矩阵分解,获取异常矩阵,最终实现异常检测,取得了很好的效果;Ning 等(2019)提出了潜在异常和背景双字典构建算法PAB-DC(Potential Anomaly and Background Dictionary Construction),分别通过联合稀疏表达构建背景字典,通过分析场景中的异常目标先验知识来构建潜在异常字典,通过双字典可以更加准确的从原始数据中分辨出背景、异常和噪声像素;Cheng 和Wang(2020)提出一种基于图和全变分正则化的低秩表达检测算法GTVLRR(Graph and Total Variation Regularized Low-Rank Representation)。该方法考虑传统的LRR 方法在进行高光谱异常检测过程中,仅使用到高光谱数据的光谱信息而忽略了空间信息,因此本方法引入图正则化与全变分正则化,保留高光谱数据中的局部几何结构与空间关系,提升检测的精度。

RPCA 是由Candès 等(2011)提出,该方法的主要思路是数据矩阵可以表示为一个包含结构信息的低秩矩阵和一个包含噪声的稀疏矩阵相互叠加,即:

式中,D为原始数据矩阵,L为低秩矩阵,S为稀疏矩阵,*为矩阵奇异值的和,约束L的低秩属性,L1范数则是约束S的稀疏属性。由于该方法可以有效提取出数据中的噪声部分,对光照、遮挡等的噪声干扰有一定的鲁棒性,因此在视频监控、人脸识别等领域发挥了一定作用。随后Zhu 等(2019)提出混合统计与表达的异常检测方法HSRAD(Hybrid Statistics and Representation-based Anomaly Detector),将统计学方法与矩阵分解结合起来,应用于高光谱异常目标检测中,该方法首先利用低秩稀疏矩阵分解算法将异常与背景像素分开,获取初步的异常检测结果,随后通过协同表达算法进一步的优化初步检测结果,筛选出噪声干扰,最终算法取得了较好的效果;Li 等(2021)则是考虑传统矩阵分解算法分解出的稀疏矩阵往往包含异常和噪声信息,噪声信息会严重干扰异常目标的检测,因此该文提出低秩稀疏分解与混合高斯模型相结合的方法LSDM-MoG(Low-rank and Sparse Decomposition with Mixture of Gaussian),引入混合高斯模型,将稀疏矩阵中的噪声与异常部分有效区分,提高了检测精度;Feng 等(2022)则是将矩阵分解与密度峰值协同表达结合起来,可以更加有效地利用矩阵分解结果中的低秩分量,并最终通过基于熵的自适应融合算法将二者检测结果融合,取得较好的效果。

Go-Dec 则是由Zhou 和Tao(2011)提出,相比于RPCA,此方法将原始数据分成低秩矩阵+稀疏矩阵+噪声矩阵,对数据的分解更为精细;并且其在求解过程中对矩阵的秩和稀疏程度均有约束,降低了整个模型的复杂度,算法求解的效率更高。后续Sun等(2014)将该方法应用于高光谱异常检测中,快速检测出场景中的异常目标;Zhang 等(2016b)提出基于低秩稀疏矩阵分解与马氏距离的方法LSMAD(LRaSMD-based Mahalanobis distance Method for hyperspectral Anomaly Detection),该方法先分解出低秩背景矩阵、噪声矩阵与稀疏异常矩阵,然后引入马氏距离来判断待测像素是否为异常。

基于张量分解的方法则是利用高光谱数据天然的“数据立方体”三维结构,将其看作三阶张量,随后将异常目标在低维空间难以检测的问题转移到高维张量空间,并且利用张量分解算法,同时考虑高光谱数据的空间与光谱维数据特征,最终有效实现异常目标的检测。例如Geng等(2014)提出了一种基于斜偏度张量的检测方法,可以有效解决传统基于张量分解异常检测算法,在求解过程需要反复迭代的不足,大大提升检测的速度;Zhang 等(2016a)将高光谱数据看作三阶张量,并通过塔克分解(Tucker Decomposition)将原始数据分解成1个核心张量和3个因子矩阵,随后通过分析因子矩阵的主成分判断背景和异常;Xie等(2019)提出一种基于结构张量与引导滤波器的异常检测算法,通过结构张量分解对原始数据进行波段选择,选出有效波段并降低计算复杂度,随后通过自适应加权算法获取初步检测结果,最后利用引导滤波器实现异常检测,获得较好的效果。

基于数据分解的高光谱异常检测算法,利用一般高光谱数据中的背景部分地物成分单一且占据了原始数据中的绝大部分像素,因此可以从原始数据中心分解出低秩成分来表示;而异常目标所占有的像素数一般非常少,因此可以从原始数据中分解出稀疏结构表示。这样将高光谱异常目标检测问题转化为矩阵/张量分解这种数学问题,可以利用丰富的数学方法来进行求解,取得了非常好的检测效果。

2.4 基于深度学习的方法

近些年来,随着计算机硬件的不断发展与图像数据量的爆炸性增长,深度学习算法在数据处理领域获得了非常广泛的应用,并且取得了远远优于传统算法的成果,比如在图像目标检测、目标跟踪、场景识别、图文生成、行为识别等诸多方向。因此在高光谱异常检测问题研究中,也有大量的研究基于深度学习方法开展。此类方法主要分成基于卷积神经网络CNN(Convolutional Neural Network)和基于对抗神经网络GAN(Generative Adversarial Network)的方法,基于CNN 的方法主要思路是通过卷积神经网络强大的特征提取能力,获取有效的高光谱数据特征,应用于后续的异常目标检测;基于GAN 的方法主要思路是通过GAN强大的数据分布学习能力,对数据中的背景分布进行有效建模,最终将高光谱数据中的背景像素与异常像素进行区分。

基于CNN 的方法由Li 等(2017),第一次将CNN 方法引入高光谱异常检测CNND(CNN-based Detector),该方法需要先将差异像素对和同类像素对作为输入数据,共同输入到CNN 中进行训练,然后将待测像素与其周围像素均值输入训练好的CNN中判断是否异常;Song等(2019)提出将CNN与空间密度聚类相结合的方法DBSCAN(Density-Based Spatial Clustering of Applications with Noise),通过CNN 准确提取高光谱数据的丰度图,丰度图比原始数据可以更好的区分出背景与异常像素,然后通过密度空间聚类获取光谱字典,最后结合低秩分解方法进行异常检测;Wang 等(2021)将CNN 与迁移学习、张量分解结合起来,通过迁移学习来应对高光谱异常检测中异常目标没有先验知识的问题,可以有效改进CNN 开展高光谱异常检测问题研究时训练数据量少的问题;Fu 等(2021)将异常检测问题转化为一个即插即用的检测框架DeCNN-AD(Denoising CNN-Anomaly Detection),通过CNN 正则化约束降低原始数据中的背景噪声,随后通过聚类构建优化字典,最终实现异常检测。

基于GAN 的方法有Jiang 等(2020c)提出了一种基于双RX探测器与半监督GAN相结合的方法semiDRX(semi Dual RX),先通过原始RX 算法提出初步的初始异常与背景像素,然后将该数据输入半监督GAN提取出更加准确地异常与背景像素,最后将结果通过精细RX 探测器获得最终异常目标检测结果;Jiang 等(2020b)则是提出了一种基于无监督显著重构约束的生成对抗网络异常检测算法HADGAN(unsupervised discriminative reconstruction constrained Generative Adversarial Network for HAD),该算法通过自编码器实现对GAN的显著重构约束,从而更加准确的学习背景像素分布并降低背景中异常目标的干扰,最后通过空—谱联合的方法检测异常目标;后续Li 等(2022b)提出了将稀疏编码与GAN相结合的方法sparseHAD(sparse codinginspired generative adversarial network for Hyperspectral Anomaly Detection),实现弱监督异常检测;Li 等(2022c)等采用双GAN 联合的方法更真实的重建出背景分布,其中第一个GAN 用于提取出低维的背景特征图,第二个GAN 则采用前面获取的背景特征图,结合空间信息获取更加稠密、更加准确的背景特征,最终采用空谱结合的方法获取最终异常检测的结果。还有其他学者也在此方向上进行了进一步的研究。

基于深度学习的高光谱异常检测算法,可以利用卷积神经网络强大的特征学习能力提取高光谱数据中抽象的高层特征,提升了背景与异常像素的差异性与区分度,实现更好的检测效果;利用对抗神经网络特有的数据分布学习能力,有效提取图像的背景分布,提升检测精度等。深度学习的方法在高光谱异常检测领域取得了优于传统方法的检测效果,但是网络结构的物理意义、对无监督学习的局限性等问题依旧是需要进一步的研究与探索。

2.5 其他方法

针对高光谱数据的异常检测,近些年来一直是遥感领域研究的热点领域,也涌现了许多新的方法。比如基于分数傅里叶变换FrFT(Fractional Fourier Transform)的异常检测算法(Tao等,2019),该方法通过将分数傅里叶变换引入异常检测中,可以更好的处理高光谱数据中的固有的非平稳噪声,并且可以有效地提升背景与异常的区分度;Zhang 等(2022b)提出将分数傅里叶变换与张量RX相结合的方法FrFT-TRX(FrFT-Tensor Reed Xiaoli),通过分数傅里叶变换将原始高光谱数据变换到分数傅里叶域,然后在分数傅里叶域采用张量RX 算法提取出异常目标。近些年也有许多学者对此展开相应研究(Zhang 和Cheng,2022;Zhang 等,2022a)。

另外还有基于空—谱信息结合的方法,此类方法同时利用高光谱数据的空间维与光谱维特征,以及异常与背景像素在空间和光谱上的差异,实现更加精确地异常检测。例如Li 等(2022a)提出谱—空深度支持向量数据描述算法ssDSVDD(spectralspatial Deep Support Vector Data Description),该算法提出一种端到端的深度单分类网络,将特征学习与异常检测集成到一个统一的框架中,在该框架中通过双流深度卷积自编码网络提取高光谱数据的光谱与空间特征,最终实现异常目标的检测。空—谱结合的方法一直是高光谱遥感领域的一个重要方向,该方向近些年也有不少学者在高光谱异常检测问题开展研究(Li等,2022d;Hu等,2022)。

此外基于视觉注意力机制的异常检测方法也是近些年的热点,由于异常目标往往与背景像素的光谱及空间特征差异巨大,因此该类方法将人类视觉注意力引入异常检测中,可以获取到一定程度的异常先验信息,进而提升检测的准确度。具体的,Xiang 等(2021)提出高光谱视觉注意力模型算法HVAM(Hyperspectral Visual Attention Model),该方法首先将原始数据进行波段选择,降低数据维度并删除冗余信息,随后通过视觉注意力模型获得选择后各波段的显著性特征图,最终实现异常目标的检测;Taghipour 和Ghassemian(2021)也提出基于人类视觉注意力的检测方法HVAAD(Human-Visual Attention-based AD),该算法的特点是引入了传统注意力机制中自下而上和自顶向下的注意力模型,将高光谱数据中的空间特征与光谱特征有机结合,提高最终的检测精度。

最后,我们将高光谱异常目标检测近些年来的主要发展过程与算法进行总结,如图2所示(图2中所有的方法缩写,均在本节前面部分有详细阐述)。

图2 高光谱异常目标检测算法发展历程Fig.2 The development of hyperspectral abnormal target detection algorithms

此外,本文也对这几类方法中的代表算法的在常用的高光谱数据集上的实验效果进行了总结,具体展示了不同方法在不同数据集上的AUC(Aera Under Curve)值,详见表2。表2 中第一行代表不同的高光谱异常检测算法,第一列代表不同的高光谱异常检测数据集。从表2中可以更加直观的看出每类方法检测效果,基于深度学习的方法的算法的检测效果要优于传统方法。表中数据来源于Xie等(2020);Jiang等(2020c);Fu等(2021)。

表2 常见高光谱异常算法在不同数据集上的AUC值Table 2 AUC values of hyperspectral anomaly detection algorithms on different datasets

现有算法针对目前高光谱异常目标检测中的难点问题也进行了一定程度的突破。比如许多算法针对高光谱数据波段多、波段之间冗余度高,采用了主成分分析、鲁棒主成分分析、SVD 等方法(Xie等,2019;Zhu 等,2019),对原始数据进行了波段选择、降维等预处理,提升了后续算法执行的效率;针对高光谱数据天生的混合像元问题,采用CNN/高光谱解混的方法获取相应的端元矩阵,并与其他方法进行结合实现最终的异常检测(Qu等,2018;Song等,2019)。但是针对现有高光谱异常检测中的难点问题,仍需要进行进一步的研究与探讨。

3 研究趋势分析

高光谱异常检测问题的研究,一直是遥感领域的热点问题,大量的研究人员在该问题上提出了非常多有效的检测算法,取得了很好的检测效果。经过调研与分析,针对现有高光谱异常检测研究中“同物异谱”与“异物同谱”的问题、高光谱数据冗余问题、算法实用化等关键性问题,本文认为未来高光谱数据异常检测研究的发展趋势可以总结为:数据库拓展、多源数据融合和算法实用化等3 个方向。本节后续内容将围绕这3 个方向进行详细阐述。

3.1 数据库拓展

现有高光谱异常检测算法性能验证所采用的实验数据库非常有限,大部分研究的实验部分往往都使用的6—7 个常用的数据库。而大部分数据库的数据均非常陈旧,数据采集的时间超过10 a,比如Salinas 数据采集于1998 年,HYDICE 数据库采集于1995 年,ABU 数据库采集于2010 年或2011 年等(表3)。而这些数据库采用的传感器参数也比较落后,因此如何拓展高光谱异常检测的数据库,是一个非常值得研究的问题。目前常见的高光谱异常检测数据库有HYDICE Urban 数据库,ABU数据库,EI Segundo数据库、San Diego数据库、Salinas 数据库等等。本节也将现有的常用高光谱异常检测数据库的特点进行了总结,如表3所示。

表3 常见高光谱异常目标检测数据集简介Table 3 Introduction to hyperspectral anomaly detection datasets

HYDICE Urban 数据集来源于美国陆军地理空间中心项目,通过HYDICE(Hyperspectral Digital Imagery Collection Experiment)传感器采集美国和加拿大地区的城市高光谱数据,原始图像尺寸为307×307,波段数210,波段范围400—2500 nm。最终的HYDICE Urban 数据库是在原始数据中剔除掉低信噪比、水吸收和不好的波段而构成(Kang等,2017)。

ABU(Airport-Beach-Urban)数据库来源于美国NASA 的喷射推进实验室的一项机载可见/红外成像光谱仪AVIRIS(Airborne Visible/Infrared Imaging Spectrometer)实验。具体的是通过4 种不同种类飞机挂载AVIRIS 探测器,拍摄了北美不同地区的机场、海滩和城市3 种场景9 个地区共13 张高光谱遥感图像,图像原始尺寸100×100,波段范围380—2510 nm,波段数224。此外,ABU 中Pavia数据是获取自ROSIS(Reflective Optical System Imaging Spectrometer)传感器。最终的ABU 数据库是在原始数据中,剔除掉低信噪比、水吸收和不好的波段构成(Kang等,2017)。

EI Segundo 数据库是通过AVIRIS 传感器采集,主要场景包括炼油厂、公园、学校和部分居民区。图像尺寸为250×300,波段数224,波段范围:366—2496 nm,空间分辨率为7.1 m/pixel。异常目标为储油罐和油厂建筑等目标(Li等,2022a)。

San Diego 数据集是由AVRIS 采集的美国圣地亚哥机场区域照片,图像原始尺寸为400×400,波段数224,波段范围370—2510 nm,图像空间分辨率为3.5 m/pixel,异常目标为飞机(Li等,2022a)。

Salinas 数据库是通过AVIRIS 传感器在加拿大萨利纳斯山谷采集的数据,原始数据尺寸512×217×224,空间分辨率3.7 m,包括蔬菜、裸露土壤和葡萄园等场景。实际使用剔除掉大气和水汽等低信噪比波段,图像尺寸180×180×204。异常目标为房屋等建筑(Yuan等,2015)。

AVON 数据集是采用 ProSpec TIR-VS 传感器拍摄纽约州罗切斯特市南部的AVON 地区的停车场区域,数据空间分辨率为1 m,原始图像尺寸100×100×360,其光谱范围为400—2450 nm。该高光谱图像中包含有68 个异常目标,不同颜色的毛毡与防水布为异常目标(Li等,2022d)。

Hyperion 数据库采用Hyperion 图像传感器,采集的是美国印第安纳州的农场区域数据,原始图像:242 个波段,357—2576 nm 范围,筛选后图像尺寸150×150×142。异常目标为屋顶和储物仓(Taghipour和Ghassemian,2019)。

SpecTIR 数据库采用ProSpecTIR-VS2 探测器,采集美国罗切斯特市附近的高光谱数据,图像尺寸180×180×360,空间分辨率1 m/像素,异常目标为人造彩色方块布(Herweg等,2012)。

可以看出,现有的常用数据库的往往比较陈旧单一,而近些年来高光谱传感器的性能和卫星发射技术都在不断发展,因此能够获取到光谱分辨率更高、波段数目更全的高光谱遥感数据。高质量的数据有助于提取出异常像素与背景像素的区别特征,从数据源头上改进光谱数据中“同物异谱”和“同谱异物”的难点,突破在算法层面难以突破的检测瓶颈。并且,随着传感器技术的不断发展,高质量的高光谱数据拥有更高的光谱分辨率,在一定程度上也可以减少混合像元问题对异常检测的干扰。此外,拓展数据库也可以为异常检测与深度学习方法的结合,提供更多不同地物类型、不同的波段类型的参考训练数据,也有助于检测精度的提升。

另外,数据库的拓展以获取数据量更大、传感器更先进、场景更加复杂的遥感数据库,也有助于促进面向复杂、真实数据库的高光谱异常检测算法的发展。因此,数据库拓展也是未来高光谱异常检测发展的一个重要发展方向。

3.2 多源数据融合

高光谱异常目标检测的多源数据融合有两层含义,一层是不同高光谱传感器获取到的高光谱数据结合起来开展异常检测;另一层是高光谱数据、高空间分辨率数据、合成孔径雷达数据SAR(Synthetic Aperture Radar)等不同种类的遥感数据有机结合进行异常目标的检测。

具体地,一方面随着遥感技术的不断进步,高光谱传感器的性能也在不断进步,针对同一地区往往能够获取到不同传感器拍摄到不同时间、不同分辨率、不同波段的大量数据。但由于不同时代、不同国家的高光谱遥感传感器的光谱分辨率、光谱波段以及图像尺寸等参数不尽相同,往往难以互相兼容应用。因此如何克服高光谱数据不同传感器之间分辨率、波段数等参数不一致的问题,将多种传感器中不同来源的高光谱数据共同应用于异常目标检测算法,提升数据的使用率与统一性,是一个非常有意义发展方向。

另一方面,目前不同来源不同种类的遥感数据获取越来越容易,常见的有高光谱遥感、高分遥感、SAR 等等。现有的高光谱数据基本都能达上百个波段,常见波段范围约为400—2500 nm,能够覆盖紫外、短波、近红外等多个波段,波段分辨率也能达到10 nm 级别,因此可以提供丰富的地物光谱信息,提升异常目标与背景目标的区分性,但高光谱数据的空间分辨率往往较低;高分数据的空间分辨率目前已经可以达到米级甚至亚米级,即单个像素对应实际地面的分辨率可以达到几十个厘米,并且高分数据图幅巨大,可以直观显示出丰富的地物空间信息,因此能够清晰的分辨出异常与背景在空间维度的区别,但该数据往往只包含少数几个波段的信息,不包含地物光谱信息;SAR 图像与传统成像过程不同,通过主动发射雷达波,根据接收到的回波信号进行成像,该数据具有全天时全天候工作特点,可以避免天气、云雾、沙尘等环境因素对数据获取的影响,并且由于采用主动雷达成像,具有一定的穿透性,对隐藏目标具有一定的检测效果。

因此如何发挥不同种类遥感数据的特点,比如高光谱数据丰富的光谱信息、高分数据详细空间信息、SAR 图像的全天时全天候特性等等,有效利用不同传感器数据的特点,来提升异常检测问题中背景像素与异常像素的区分度,可以获取更好的异常目标检测效果。

多源数据融合方向的发展,既可以更加有效地整合利用不同时期、不同参数的高光谱传感器获取到的数据资源,让不同传感器的数据在检测过程中均发挥作用,提升异常检测算法的实用性;也可以利用不同类别传感器获取到的具有不同特点的遥感数据,对高光谱异常检测中的“同物异谱”和“异物同谱”、数据冗余等挑战提供一种有效的思路。因此,发展多源数据融合的高光谱异常检测算法,也是未来算法的重要发展方向。

3.3 算法实用化

虽然目前的高光谱异常检测的研究已经取得了一定的成果,但是与实际应用仍然有一定的距离。主要的问题是算法的实用性不足,表现在算法在背景复杂的实际数据中的检测实验不足、检测算法对运行平台要求较高、检测设备便携性等问题。

具体的,现有的算法往往是在少数理想数据集中进行实验验证,甚至只在几幅高光谱数据上进行验证,缺乏在实际高光谱数据中的实验效果支持;另外,目前的算法在进行异常检测过程中,往往需要电脑、工作站、服务器等高性能计算平台,CPU主频3.2 GHz以上,显卡内存8 GB以上(Song等,2019;Ma等,2022),对于近些年发展迅速的基于深度学习的检测算法对计算平台的要求更高,单幅图像的检测速度也往往需要10 s到500 s 不等(Jiang 等,2020a;Li 等,2022c),在实际应用过程中往往无法提供如此多高性能的设备,限制了算法的应用;此外,现有设备往往需要经过数据采集、数据下载、数据处理、检测等一系列流程,如果能够利用现有的嵌入式平台,将采集设备与处理设备高度集成,并利用现有的跨平台深度学习框架,如腾讯公司的ncnn、英伟达公司的tensorRT等,将会大大增强高光谱异常检测算法的实用性(可部署到星上高光谱实时异常检测、森林火灾实时监测、消费级商用遥感异常检测等任务中)。

因此,如何将异常检测算法实用化,即发展实际复杂数据库上的鲁棒检测算法、发展异常检测的低计算复杂度快速算法、发展高光谱数据采集与异常检测处理算法的一体化的便携式异常检测设备等,也是未来高光谱异常检测算法一个重要的发展方向。

4 结语

高光谱数据由于其特殊的数据立方体结构,包含有丰富的空间与光谱信息,因此在遥感领域具有非常好的应用前景。而高光谱异常检测则是高光谱数据应用中的关键问题,本文对现有的高光谱异常目标检测算法进行了深入的调研与分析,总结出了现有算法的不同种类,分析不同种类异常目标检测的特点。随后本文针对未来高光谱异常检测研究的发展方向,给出了异常检测数据库拓展、多源遥感数据融合以及异常检测算法实用化3个未来的发展趋势。

猜你喜欢

背景光谱像素
赵运哲作品
基于三维Saab变换的高光谱图像压缩方法
像素前线之“幻影”2000
“新四化”背景下汽车NVH的发展趋势
《论持久战》的写作背景
“像素”仙人掌
晚清外语翻译人才培养的背景
高像素不是全部
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究