应用特征感知与协同表示的高光谱图像分类方法
2022-03-07闫德勤刘德山曹意唱
陈 浪,闫德勤,刘德山,曹意唱
(辽宁师范大学计算机与信息技术学院,辽宁大连 116081)
0 引言
高光谱图像(hyperspectral image,HSI)是由光谱维和空间维组成的三维图像数据,含有丰富的空间信息和光谱信息,广泛应用于目标检测、分类等方面。图像分类是应用的基础,为了能更好地识别出高光谱图像中的有效信息,提高识别精度,研究人员提出了多种机器学习方法,如深度学习、主动学习、降维等,都取得了较好的分类效果。
协同表示(Collaborative Representation,CR)以较低的时间复杂度、空间复杂度和较好的分类性能获得广泛关注。Bian 等通过挖掘不同层级之间的光谱信息,提出多层稀疏表示分类(Multi-Layer SR Classification,mlSRC)、多层协作表示分类(Multi-Layer Collaborative Representation Classification,mlCRC)和基于多层弹性网表示的分类(Multi-Layer Elastic Net Representation-based Classification,mlENRC),能有效克服训练样本的高相干性;Li 等基于相邻像素具有相似的光谱信息或者属于同一类的特性,提出联合类内协同表示(Joint CR,JCR),对局部区域内的像素进行均值处理,有效地联合了空间特征;Jiang 等利用像素间的空间位置信息构建权重矩阵,并以此对协同系数进行约束,提出空间感知的协同表示(Spatial-AwareCollaborativeRepresentation,SaCR)和联合空间感知的协同表示(JointSpatial-Aware Collaborative Representation,JSaCR);Yang 等基于局部区域内的像素具有高度的光谱相关性,提出区域自适应和字典自适应协同表示(Joint Collaborative Representation with Shape Adaptive Region and Locally Adaptive Dictionary,SALJCR),该算法通过自适应区域内的所有样本对测试样本进行重建,由测试样本与字典原子之间的光谱距离自适应地选择字典原子对测试样本进行表示;Chen 等提出加权的正则化协同表示分类算法(Weighted Regularized Collaborative Representation,WRCROC),通过构建训练样本与测试样本之间的权重矩阵和构建测试样本之间权重矩阵对稀疏系数进行约束;Su 等将多特征学习应用到协同表示的分类机制中,提出基于多特征字典学习协同表示分类(Multifeature Dictionary Learning for Collaborative Representation Classification,MCRCDL),该算法提取高光谱图像的多种特征,在不同特征下构造对应的字典,通过学习得出最优的协同表示系数;Karaca利用超像素的空间坐标关系,在概率核协同表示(Probabilistic Kernel Collaborative Representation,PKCRC)基础上,提出空间感知概率多核协同表示(Feature Fusion Version of PMKCR,PMKCR-FF;Decision Fusion Version of PMKCR,PMKCR-DF),该算法有效地结合空间感知和多核学习优势,以提高协同表示的分类性能。
上述算法都充分利用了高光谱图像的各种特征信息,取得了较好的分类效果,但存在一些问题,如噪声处理不够彻底、空间特征与光谱特征感知不充分、空间识别差等。为有效解决这些问题,本文提出应用特征感知与协同表示的高光谱图像分类方法(Classification of Hyperspectral Images with Feature Perception and Collaborative Representation,FP-CRC),该算法充分利用测试样本与训练样本之间的局部结构关系,通过图像重建、空间特征感知、光谱特征感知等方式,提高模型的噪音处理和空间识别能力。
1 相关工作
λ
为平衡参数,用于平衡重建误差项与范数项。对式(1)求解可得:
y
的类别标签与重建误差最小的字典原子标签一值,即:2 本文算法
本文提出应用特征感知与协同表示的高光谱图像分类方法模型。该模型主要分为图像重建、光谱特征感知、空间特征感知3个部分。首先将输入的图像进行自适应加权重建,然后进行光谱特征和空间特征感知,最后运用协同表示机制进行分类,其流程如图1 所示。
Fig.1 FP-CRC process图1 FP-CRC 流程
2.1 图像重建
研究发现,传统协同表示算法对异常点和噪声比较敏感,对边界的识别较差。利用像素间的局部关系对图像进行重建,能增强高光谱图像的空间特征和光谱特征,消除噪声和异常点,对准确分类具有重要作用。因此,利用自适应加权方式对原始图像进行重建。中心像素的重建值由相邻像素及对应的权重进行加权求和所得,它们之间的权重是自适应确定的。
m
为自适应窗口大小,ω
为中心像素与位于第i
行、第j
列的像素相似度。p
和p
分别为中心像素与位于第i
行、第j
列的像素。σ
可由公式(6)自适应地确定:d
为两像素点之间的距离:根据式(4)-式(6),可得窗口内每个像素自适应加权的权值,权值大小根据相邻像素欧氏距离的高斯函数确定。通过对相邻像素进行加权求和来重建出一个新的像素值:
通过上述定义可知,重建后同类别像素之间的差别较小,不同类别像素之间的差别较大。
2.2 光谱特征感知
在协同表示分类算法中,对光谱特征进行有效感知意义重大。本文通过定义光谱偏置矩阵对光谱特征进行感知,其定义如下:
ρ
为测试样本与字典原子之间的光谱相似度,由Pearson 系数来度量相似性大小,其表达式为:X
,Y
)是样本X
和样本Y
的协方差,σ
是样本X
的标准差;σ
是样本Y
的标准差,样本X
和样本Y
越相似,cov(X
,Y
)的值就越大,ρ
就越大;样本X
和样本Y
越不相似,cov(X
,Y
)的值就越小,ρ
就越小。2.3 空间特征感知
高光谱图像的空间特征除了体现在同一光波下光谱信息的变化外,还体现在像素间的空间位置上。本文通过像素的坐标来构建空间位置矩阵,对空间特征进行感知。
s
为测试样本y 与字典原子d
之间的空间相似矩阵,可由下式求得:c
是空间先验距离衰减速度参数,用(p
,q
)和(p
,q
)分别表示字典d
和测试样本y 的像素坐标。2.4 算法优化
将感知的特征以正则项的形式添加到协同表示的分类框架中,通过优化求解对重建后的图像进行像素分类。目标函数表示如下:
y
的类别标签:综上所述,应用特征感知与协同表示的高光谱图像分类方法伪代码如下:
应用特征感知与协同表示的高光谱图像分类方法
Input:
高光谱图像HSI,自适应区域大小,光谱感知参数λ
,空间感知参数γ
,平衡参数β
,平滑参数c;通过式(4)-式(8)对HIS 进行重建,将重建后的图像数据分为训练数据和测试数据,以训练数据作为字典;
由式(9)-式(10)进行光谱特征感知;
通过式(11)-式(12)进行空间感知;
通过式(15)预测测试集的标签class(y);
Output
:测试数据集的预测标签。3 实验结果与分析
在两个HSI数据集上验证所提出的FP-CRC分类模型的有效性和通用性。选取的对照算法有SRC、JCR、JSR和JSaCR,主要验证以下内容:①与SRC 相比,验证本文算法在噪声处理方面的优势;②与JCR、JSR 相比,验证本文算法在特征感知、边界识别方面的优势;③与JSaCR相比,验证本文算法在特征平衡机制、特征感知方法等方面的优势。分类性能由总体准确率(Overall Accuracy,OA)、平均准确率(Average Accuracy,AA)和Kappa 系数3个重要指标来评估。试验环境为Windows 7 X64 Intel Core i5-3470 CPU @3.2GHz,MATLAB2017b。
3.1 实验数据集
Pavia University:该数据集由ROSIS 传感器拍摄Pavia大学得到高光谱图像,去除12个噪声影响最大的波段,每个波段包括像元点610×340,具有9个类别的地物。
Salinas:该数据集由AVIRIS 传感器获取美国加利福尼亚南部Salinas 山谷区域的高光谱遥感图像,图像像素大小为512×217,包含16 种地物类别。该数据集在空间上具有224个波段,其中共有20个大气水分吸收和低信噪比的波段需去除,本实验采用处理后保留的204个波段数据。
3.2 参数设置
对本文模型FP-CRC 参数进行寻优。根据实验及相关算法参数设置经验将各参数取值范围确定为:λ
和β
取值范围{10,
10,
…,
10,
10},γ
取值范围{10,
10,
…,
10,
10}。在Pavia University 数据集和Salinas 数据集上的参数分析如图2 和图3 所示。Fig.2 Pavia University parameter analysis图2 Pavia University 参数分析
Fig.3 Salinas parameter analysis图3 Salinas 参数分析
在不同数据集上进行实验,统计分析得出自适应区域大小为11×11,其余参数如表1 所示。
Table 1 Parameter settings of different data sets表1 不同数据集下的参数设置
3.3 实验结果分析
在Pavia University 数据集和Salinas 数据集上按照每类随机选取30个样本的方式选取训练样本,余下的作为测试样本。表2、表3 给出不同数据集上的训练样本数、测试样本数及评价指标的实验数据。图4、图5 分别给出两个数据集的标签图和不同算法的预测结果。由于实验环境不同、实验数据的随机性,导致实验结果与文献结果存在波动,但在合理范围之内。
表2 和图4 给出不同算法在Pavia Univerisy 数据上的实验结果,由图4 可知,与SR算法相比,JSR、JCR、JSaCR 和FP-CRC 的分类结果中噪声较少,说明局部区域信息的运用能有效处理噪声和异常点;与JSR 相比,JCR、JSaCR 和FP-CRC 的分类结果中噪声较少,边界识别效果更优;与JCR 和JSaCR 相比,FP-CRC 的边界识别效果更优,进一步说明FP-CRC 的特征感知和特征再平衡的有效性。由表2可知,算法FP-CRC 的OA 为98.96%,AA 为98.82%,Kapppa为98.62%,3个指标的结果优于其他算法。在Bitumen、Bare Soil 两个类别上的准确率达到了100%。与JSR、JCR、JSaCR算法相比,FP-CRC 在Meadows、Trees、Bricks、Bitumen、Bricks 上的分类准确率较高,表明该算法在特征感知方面的效果更加准确;与SRC 相比,JSR、JCR、JSaCR 和FPCRC 准确率更高,表明局部区域特征对提高分类精度效果明显。
Table 2 Comparison of different classification algorithms in Pavia University data classification表2 Pavia University 数据分类中不同分类算法比较
Fig.4 Pavia Univerisy classification results图4 Pavia Univerisy 分类结果
表3 给出了不同算法在Salinas 数据上的分类结果。由表3 可以看出,本文算法在OA、AA、Kapppa 三个指标上分别为99.63%、99.57%和99.59,分类结果显著优于其他算法。在Soil_vinyard_develop、Brocoli、Fallow 等类别上的准确率为100%。与SRC 相比,JSR、JCR、JSaCR 和FP-CRC 等算法的分类效果明显,说明局部区域关系对提高分类效果有重要作用。与JSR、JCR 和JSaCR 相比,FP-CRC算法的分类精度较高。图5 是不同算法在Salinas 数据上的分类结果图。可以看出,在Grapes_untrained、Vinyard_untrained上,SR、JSR 等算法的分类结果包含了较多噪音,JCR、JSaCR 和本文算法噪音处理效果更加明显。与JCR 相比,JSaCR 和FP-CRC算法边界识别效果更好。从总体分类效果看,FP-CRC算法分类效果更明显。
Table 3 Comparison of different classification algorithms in Salinas data classification表3 Salinas 数据分类中不同分类算法比较
Fig.5 Classification results of Salinas图5 Salinas 分类结果
4 结语
针对高光谱图像分类问题,本文提出应用特征感知与协同表示的高光谱图像分类方法(FP-CRC)。该算法通过构建局部依赖关系矩阵,提高特征感知能力,图像重建能有效处理噪声。实验结果表明,本文算法在噪声处理、特征感知、空间识别等方面表现优异。但该算法还存在问题,如未利用样本之间的流形结构关系(或图结构关系)。后续研究将加入流形结构关系,或通过流形结构关系来构建整体关系,使模型更加完善。