APP下载

基于SOP-SRL波段选择和3D-Gabor滤波的高光谱图像分类

2021-09-07陈立伟张雅涵王立国哈尔滨工程大学信息与通信工程学院黑龙江哈尔滨150001

哈尔滨工程大学学报 2021年8期
关键词:波段滤波器光谱

陈立伟, 张雅涵, 王立国 (哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 150001)

随着传感器分辨率的快速发展,高光谱遥感影像具有了很高的空间分辨率和光谱分辨率[1]。高光谱图像由大量相关波段组成,数据维数高且带有标签的样本少,经典的分类方法往往只利用了光谱信息,而高光谱图像具有空间聚类的特征,同时利用空间信息和光谱信息可以提高分类的准确性,更好地挖掘有用信息[2-3]。Camps-valls等[4]提出使用基于复合核(composite kernel, CK)的空谱分类算法对高光谱进行分类,使用线性组合空间核和光谱核来代替支持向量机(support vector machine, SVM)中的核函数。Menon等[5]受CK算法的启发,提出使用最近邻的组合核空谱对高光谱图像分类,在CK的基础上运用了预处理步骤。Tarabalka等[6-8]提出马尔科夫随机场(Markov random field,MRF)与SVM分类器结合使用的分类算法,使用MRF引入的空间信息来调整SVM中得到的初步分类值。Liu等[9]提出了SVMSLR的分类算法,该算法将空间背景信息引入SVM,显著地提高了分类精度。空间-光谱特征描述的目的是根据原始光谱信息和邻近像素的空间信息,获取图像中每个像素的特征向量。然而,特征数量的增多可能会导致维数灾难。所以,在实际应用中对高光谱图像进行降维处理对后续分析变得尤为重要。主成分分析 (principal components analysis, PCA)是进行降维的主要方法,它将高光谱波段根据最高主成分的方差最大化,转化为线性不相关的成分。PCA变换虽然降低了维数,但是一定程度上会破坏高光谱图像的空间结构和相邻特征的局部信息,对后续特征提取及分类结果造成影响。而波段选择方法[10-11]则通过找到最具代表性的波段构成数据子集从而降低高光谱图像的维数,这种方法保留了原始光谱数据的物理意义,非常适合高光谱数据的降维。迄今为止,已有大量的波段选择方法被提出。根据分类时是否需要先验信息,可分为有监督[12-13]、无监督[14-15]及半监督[16-18]3类。而无监督的方法则依靠数据本身来评估每个波段的重要性,所以无监督波段选择方法更加稳定准确。

本文重点在于尽可能地提取图像的空间信息,并将其与光谱信息充分结合,并在提高分类精度的基础上增加算法的实用性。首先对高光谱图像所有波段应用无监督的SOP-SRL波段选择方法选择出信息量大的波段,在不破坏空间结构的前提下完成降维。然后对选定的波段使用3D-Gabor滤波器,提取空间纹理特征,更加有效的利用图像的空间信息。最后将提取的特征输入逻辑回归分类器(logistic regression,LR)。

1 基于SOP-SRL波段选择和3D-Gabor滤波的分类方法

1.1 SOP-SRL波段选择

X=[X1X2…Xn]∈Rb×n

(1)

(2)

(3)

上述过程在采样时刻重复进行,将所有可用样本扫描一次后,使用缓存向量q选择出排在前p位的波段B。

1.2 3D-Gabor滤波器

遥感高光谱图像的光谱空间分类技术由于能够更好地利用高光谱图像中现有的信息源,获得较高的识别率,Gabor滤波已被应用于特征提取,能够从光谱和空间域提取相关信息,可获得最佳的联合时频分辨率[19]。在高光谱成像的背景下,Bau等[20]提出利用三维Gabor实部获取高光谱图像中区域的主要能量特征。表明3D-Gabor滤波在提取光谱空间特征方面的有效性和优越性。

3D-Gabor滤波器的中心频率为:

(4)

3D-Gabor滤波器的方向为:

(5)

也可以用2个空间角度(θ,φ)表示,其中θ是滤波器方向和λ方向的夹角,φ是方向投影到(x,y)方向和x之间的夹角;高斯函数的形状参数σ;3个半轴长表示为(M,N,W)。运用3D高斯包络的3D谐波调制能得到一个标准的空间-光谱Gabor滤波器,数学表达式、高斯成分、正弦成分及各轴线方向的投影为:

g(x,y,λ)=a(x,y,λ)b(x,y,λ)

(6)

(7)

b(x,y,λ)=cos(2π(Fxx+Fyy+Fλλ))

(8)

Fx=Fsinθcosφ,Fy=Fsinθsinφ,Fλ=Fcosθ

(9)

式中:h(x,y,λ)表示高光谱图像的空间光谱域;分量(x,y)表示空间域;分量λ表示光谱域。

在实验中,通过改变θ和φ的值来获得不同方向的特征,设计不同方向的3D-Gabor滤波器(如图1、2所示),θ和φ分别选取为(0,π/4,π/2,3π/4)。当θ的值为0时,φ的值也只能取0,所以共13个方向。为了获得不同尺度的纹理特征,实验中还取了4个尺度进行计算。因此,共52个滤波器。

图1 3D-Gabor滤波器方向Fig.1 Direction of 3D-Gabor filter

图2 3D-Gabor滤波器投影Fig.2 Projection of 3D-Gabor filter

Gamba等[21]使用能量原理对特征矩阵进行后处理,滤波后的能量特征为:

(10)

式中:M和N是像素空间位置(M,N)处;W是图像的第W个波段;i是图像的特征号,取值1~52。

2 基于SOP-SRL波段选择和3D-Gabor滤波的高光谱图像分类方法

本文提出基于SOP-SRL波段选择和3D-Gabor特征的高光谱图像空间光谱特征分类方法(SOP-SRL and 3D-Gabor, SS-3DG)。所提出的方法融合SOP-SRL波段选择方法与3D-Gabor特征提取方法。首先应用SOP-SRL方法保存原始波段,并提供原始波段的一个子集作为输出;然后在选定的波段上使用3D-Gabor滤波器获得纹理特征,为高光谱图像中的每一个像素获得特征向量。在描述空间纹理特征信息时,本文的空间特征是使用3D-Gabor滤波器组对输入图像进行滤波,每个像素的特征向量为该像素对滤波器组的所有响应。由于充分描述了空谱特征,减少了需要的维数,从而避免了维数灾难,提高了高光谱图像分类的实验效率。本文算法的步骤为:

1)通过SOP-SRL算法更新记录波段分数的缓存向量q,选出分数最高的B个波段;

2)对于B个波段,令Ii为第i个波段,令fk是滤波器组K中的第k个滤波器的单位冲激响应。第i个波段对第k个滤波器的响应为:

(11)

滤波器组表示为:

(12)

式中:M为尺度个数;N为方向个数。

3)应用整个滤波器组,对选择的B个波段进行响应,即可得到图像中所有像素点的特征向量ψ:

(13)

4)分类:选择训练集,将得到的空谱特征向量ψ输入LR分类器进行分类。

3 高光谱遥感图像实验及对比分析

3.1 实验数据集

本节使用提出的算法对3组真实高光谱遥感图像进行仿真,它们分别是印第安农林、萨利纳斯谷和帕维亚大学数据集。

印第安纳农场数据集是1992年由AVIRIS传感器收集的。该影像总共有220个波段,图像尺寸为145×145像素,可用的标记样本数10 366个,共16种地物,如图3(a)所示;萨利纳斯谷数据集是由光谱仪AVIRIS拍摄的。图像尺寸为512×217像素,共224个波段,但是有20个波段是不能使用的,其中标记样本数为54 129个,共16种地物,如图3(b)所示;帕维亚大学数据集是由ROSIS-03[21]采集的,删除12个波段后剩余103个可用波段,每个波段有610×340个像素,标记样本数为42 776个,有9个标记的地物类别,如图3(c)。

图3 数据集地物分布Fig.3 Dataset feature map

3.2 实验仿真

本文采用常用的分类评价指标,即总体分类精度(overall accuracy, OA),第i类分类精度Ai,平均分类精度(average accuracy, AA),Kappa系数对分类结果进行定量分析。

1)总体分类精度POA为:

(14)

式中:N表示总的样本数目;mii表示第i类被正确分类的样本数量。

2)第i类分类精度Ai为:

(15)

式中Ni为第i类的样本总数。

3)平均分类精度(average accuracy, AA)PAA为:

(16)

4)Kappa系数K为:

(17)

式中K为分类结果图像与监督图像的一致性,值越高,一致性越高。

实验均在1.80 GHz Intel Core i7-8550U处理器的Matlab R2016a平台完成。

为了证明本文方法的可行性,选取以下算法作为对比算法:基于标准支持向量机分类算法(support vector machine, SVM),基于PCA降维和支持向量机分类算法(principle components analysis and SVM, P-SVM),基于SOP-SRL波段选择和SVM的分类算法(SOP-SRL and SVM, SS-SVM)和基于PCA降维的Gabor特征提取分类算法(principle components analysis and gabor, P-Gabor)。

参数设置:SVM:正则化参数C=2(-2:6),核函数选择RBF核函数,核参数σ=2(-12:12);PCA降维的主成分个数在不同数据集上需要设置不同的P,波段选择的正则化参数τ1、τ2、τ3、k、r分别设置为105、10-5、104、15和1.75。波段选择数在不同的数据集上需要设置不同的B。LR逻辑回归分类器的稀疏参数λ设置为0.000 15。

3.3 仿真结果分析

3.3.1 印第安农林数据集实验

第1组实验使用印第安纳农林数据集来验证本文算法的有效性。本次实验随机从每个地物中取总样本的10%作为训练集,剩余的90%作为测试集,将实验重复进行20次,取实验的平均结果。本文算法在印第安农场数据集的分类性能如表1所示,表1将本文算法与其他对比算法在各自最优参数下的OA、AA、Kappa系数进行了对比。表格中以粗体显示不同方法的最佳准确性。

表1 印第安农林数据集分类结果Table 1 Classification statistics for Indian Pines dataset %

如表12所示,SVM、P-SVM和SS-SVM均只利用光谱信息进行分类。P-SVM和SS-SVM均对高光谱图像进行了降维处理,减少了运算量缩短了实验时间,但是PCA降维在一定程度上破坏了高光谱图像的空间结构,相比于SVM分类精度反而有所下降。SS-SVM相比于P-SVM用SOP-SRL波段选择方法替代了PCA降维方法,保留了完整的光谱结构,分类精度有所提升,但是由于没有充分提取空谱特征,分类精度相比于传统SVM也有所下降,分类效果不够理想,所以充分提取空间信息十分必要。P-Gabor算法相比P-SVM算法引入了空间信息,分类精度有所提高,但是由于PCA降维在某种程度上破坏了图像的空间结构导致,无法反映出样本点的可分性和非线性,分类精度反而低于传统SVM算法,并且增加了计算量。而本文的SS-3DG方法,当参数B=20时,OA、AA和Kappa系数分别为84.82%、91.42%、82.73%,比SVM算法和其他算法分类精度分别高出5%、10%左右,提高了分类准确性,说明该方法能够在降维减少运算量的同时充分利用图像的空间结构,从时间上来看,SS-3DG由于采用无监督的波段选择方法替代PCA繁琐的线性变换,减少了计算量,大大节约了时间成本,提高了实验效率,说明该算法的分类性能更稳定。图4展示了几种算法的对比。

图4 印第安农林数据集分类结果Fig.4 Classification result maps of Indian Pinesdataset obtained

3.3.2 萨利纳斯谷数据集实验

与3.3.1节实验仿真类似,第2组实验数据为萨利纳斯谷数据集,实验仿真结果图如图5所示。根据前文提到的评价指标对本文算法及对比算法进行比较分析。同样的,随机选择每个样本的10%作为训练集,其余的作为测试集。分类性能如表3所示。

图5 萨利纳斯谷数据集分类结果Fig.5 Classification result maps of Salinas dataset obtained

表3 萨利纳斯谷数据集分类结果Table 3 Classification statistics for Salinas dataset %

本文算法在萨利纳斯谷数据集的分类性能如表3所示,表3对本文算法和其他算法的OA、AA、Kappa系数进行了对比,对比算法同样是在参数的最优条件下进行,可看出每个方法的最佳精度。如表3和表2所示,P-Gabor算法在此数据集上相比传统的SVM、P-SVM和SS-SVM算法引入了空间信息,OA有了一定的提高,但是由于PCA降维在某种程度上破坏了图像的空间结构甚至舍弃了一些有意义的信息,导致AA和Kapaa系数降低,而且增加了实验计算量,更加耗时。而本文的SS-3DG方法,当选择波段为20个时,OA、AA和Kappa系数可分别达到97.17%、98.95%、96.82%,比SVM算法和其他算法分类精度分别高出5%、10%左右,提高了分类准确性,同时从表4可以看出,由于减少了计算量,实验速度有了明显提高。图5展示了几种算法的对比,通过观察分类图,可以清楚的看出SS-3DG方法分类图上的错误分类更少,进一步验证了所提出方法的有效性。

表2 不同算法的计算时间Table 2 Computation time for different algorithms s

3.3.3 帕维亚大学数据集实验

与上述2个实验类似,第3组实验是在帕维亚大学据集上进行的,该数据集共有9类真实地物。实验仿真结果图如图6所示。在实验中,训练集依然选择10%,剩余的为测试集。分类性能如表4所示,3种算法的运行速度对比如表2所示。

表4 帕维亚大学数据集分类结果

图6 帕维亚大学数据集分类结果Fig.6 Classification result maps of Pavia of University dataset obtained

和前2组实验的评价准则一样,表3中可看出不同方法的最佳精度。正如预期的那样,P-Gabor算法在此数据集上相比SVM方法提高了10%左右,说明在此数据集上空间信息的引入能够提高分类精度。而本文的SS-3DG方法,选择了10个信息量最大的波段,OA、AA和Kappa系数分别为98.62%、98.72%、98.11%,比只利用光谱信息的SVM算法、P-SVM算法和SS-SVM算法分类精度有了明显提高,幅度为10%左右。虽然相比P-Gabor分类方法,本文方法分类精度提高不明显,但是从表2中可以看出,相比之下,该方法可以加快实验速度,缩减计算量,节省实验时间。

5)技术规范类:例如厨房电气化、电动汽车等领域存在相关设备品质与相关技术标准参差不齐,因此需要相关技术部门或者业界知名企业制定与规划相关标准,从而引导电能替代及相关行业的长足发展。

3.3.4 参数B和P对分类结果的影响

为了使本文算法的分类性能达到最优状态,本节对提出算法SS-3DG的主要参数即波段选择个数B进行了测试与调节;同时也对对比算法(P-Gabor)中的主要参数即主成分个数P进行了分析。

图7显示了本文方法SS-3DG使用不同B值在不同数据集上得到的OA曲线,从图中可以看出,当B=20,B=15,B=10时OA在3个数据集上分别获得最大值,当B太小时,所选择的波段数太少,分类精度较差,当B值达到最优值时,即图像的峰值点。分类精度显著提高,在超过最优值这一点之后,随着B值的增加,萨利纳斯谷数据集和帕维亚大学数据集的OA曲线的走势变化相对平坦,而印第安农林数据集的OA下降较快,原因可能是萨利纳斯谷数据集和帕维亚大学数据集样本比较集中且数据量大。随着波段数的增加,实验耗时越来越多,综合考虑分类结果和程序运行时间,在实验中将印第安农林和萨利纳斯谷数据集的B设置为20,帕维亚大学的设置为10。

图7 波段选择个数对OA的影响Fig.7 The influence of the number of bands on OA

对P-Gabor算法同样进行类似的实验,因此需要对主成分分析的变量P进行实验,参见图8。从图中可以看出,印第安农林和萨利纳斯谷数据集在P=20,帕维亚大学在P=10时,在3个数据集上的OA分别获得最大值。为了与提出的Band-Gabor算法形成对比,综合考虑,印第安农林数据集和萨利纳斯谷数据集在实验中选择P=20,帕维亚大学数据集选择P=10。

图8 主成分个数P对OA的影响Fig.8 The influence of the number of principal components on OA

4 结论

1)使用SOP-SRL波段选择方法,完成降维,与传统降维方法相比,在不降低图像性能的同时选择出信息量大的波段,降低复杂度,避免维数灾难,解决由线性降维带来的破坏空间结构等问题。

2)使用3D-Gabor滤波器在选定的光谱波段上获得纹理特征,充分描述空谱特征,改善分类结果。

3)分类结果表明,本文方法在提高高光谱图像分类精度的同时,能够减少计算复杂度,节省实验时间,提高实验效率。

猜你喜欢

波段滤波器光谱
基于三维Saab变换的高光谱图像压缩方法
浅谈有源滤波器分析及仿真
Ku波段高隔离度双极化微带阵列天线的设计
基于多模谐振器的超宽带滤波器设计
最佳波段组合的典型地物信息提取
基于3D-CNN的高光谱遥感图像分类算法
新型X波段多功能EPR谱仪的设计与性能
最佳波段选择的迁西县土地利用信息提取研究
从滤波器理解卷积
苦味酸与牛血清蛋白相互作用的光谱研究