基于空谱特征的核极端学习机高光谱遥感图像分类算法
2020-12-08宋雯琦闫德勤刘德山王军浩
宋雯琦,闫德勤,刘德山,王军浩
(辽宁师范大学 数学学院,辽宁 大连 116021)
0 引言
近年来,基于图像特征的分类一直是高光谱图像处理领域的一个重要课题。随着传感器技术的进步,高分辨率的遥感图像得到了越来越多的应用。在传统的高光谱图像分类系统中,分类器只考虑光谱特征,而忽略相邻位置的空间信息。近十年来,人们对利用空间特征来提高高光谱图像分类性能有着极大的兴趣。例如,马尔可夫随机场(MRF)模型[1]可以将空间上下文信息集成到图像分类的概率模型中。本文提出的局部二值模式(LBP)是描述局部空间模式的一种简单而有效的高级算子,它通过比较每个像素与其相邻像素之间的关系,来有效地描绘图像的局部结构。简而言之,局部二值模式就是用中心像素值通过二进制阈值来标记局部区域中的像素。在高光谱图像分类领域,LBP因其原理相对简单、计算复杂度低、具有旋转不变性和灰度不变性等显著优点,在空间特征提取中得到了广泛的应用。在文献[2]中,研究局部二值模式(LBP)和局部相位量化(LPQ)的纹理表征在光学遥感图像数据的土地覆盖分类中的应用,在LBP的基础上,提出基于局部二进制编码的纹理表示方法,即局部相位量化,并将LBP和LPQ算子与基于灰度共生矩阵的纹理特征进行比较。在文献[3]中,提取长波红外图像中的LBP算子,并利用定向梯度直方图(HoG)和均值-方差描述符进行异常检测。在文献[4]中,LBP和HoG特征被用于跟踪TerraSAR-X图像中的船舶交通,LBP被用作结构重点滤波器,HOG被用于方向估计,对给定的检测进行稳定分割。文献[5]在LBP算法的基础上,提出一种循环局部二值模式(CLBP)算法,该算法是在从高光谱立方体图像中选取的单个条带上计算得到LBP特征,然后利用该特征向量来表示活检样本中的图像,用以进行结肠活检分类。使用LBP提取高光谱图像的空间特征,既能减少类内方差,又可以改善分类性能,但却忽视了对光谱特征的提取。近年来,许多科学家发现,只有将空间和光谱信息结合起来,同时考虑高光谱图像的光谱特征和邻域像素之间的空间关系,才能更好地实现高光谱图像的精确分类。文献[6]中提出,利用核主成分分析(KPCA)等核方法对遥感图像数据进行非线性特征提取,并扩展数据的谱维数,然后根据提取的光谱特征,进而提取空间信息。在文献[7]中,提出一种将光谱信息和空间信息相结合,以支持向量机(SVM)作为基础分类器的高光谱遥感图像增量分类算法。在文献[8]中,提出基于深度置信网络(DBN)的一种新的特征提取方法,用于提取空间和光谱的联合信息,并使用新的图像分类体系结构分析高光谱数据。在文献[9]中,提出基于高光谱图像的空间光谱特征,提取褪色壁画图案,将空间分析和光谱分析相结合,从图像空间中提取类叶模式的区域。
极端学习机[10-11]由Hung等人于2006年提出,是一种新的单隐层前馈神经网络(Single-hidden layer feedforward neural networks,SLFNs),它可以利用提取的空间光谱特征对高光谱图像进行分类。选择极端学习机分类器是由于其在训练时无过多人为干预,在一定程度上可以避免传统神经网络陷入局部最优解的问题。极端学习机程序设计相对简单,分类有效性高,且在针对不同问题时可以提供统一的模型框架,有效的提高训练速度。除此之外,与传统的神经网络和支持向量机(SVM)相比,极端学习机也具有更好的分类性能。由于极端学习机的优点,使其被广泛应用于解决各类实际问题,例如:利用ELM分类器解决不平衡数据分类问题等。近年来,极端学习机分类器在高光谱图像分类领域中的应用受到了更加广泛的关注。在文献[12]中,使用单隐层前馈网络(SLFN)进行分类,再分别使用极端学习和优化剪枝的ELM(OP-ELM)进行训练,来获取农业中大豆作物的精确专题图。在文献[13]中,在以交叉验证精度作为性能指标来确定最优ELM参数的基础上,开发了一种基于自动求解的差分进化(DE)算法。
传统的极端学习机(ELM)由于输入权重和偏差是随机分配的,且具有相同数量的隐藏节点,因此在分类精度上可能会存在很大的差异。在文献[14]中,提出了核极端学习机(kernei extreme learning machine,KELM)来解决这个问题,其基本思想是使用核函数来代替ELM的隐藏层。值得注意的是,KELM中使用的核函数不需要满足Mercer定理,且能为多类分类问题提供统一的解决方案,因此KELM比传统的极端学习机更具有优势。由于KELM的性能优于使用随机输入参数的标准ELM算法,因此在各个领域得到了广泛的应用。在文献[15]中,KELM用于多光谱和高光谱遥感图像分类。结果表明,就分类准确性而言,KELM与SVM相似或比SVM更为准确,且KELM的计算成本显著降低。在文献[16]中,将核极端学习机(KELM)引入到航天结构领域的损伤位置检测中,可以更快的得到与支持向量机(SVM)和传统的BP神经网络(BPNN)相似精度的结果。在文献[17]中,利用KELM建立了基于实验数据的生物柴油发动机模型,以确定生物柴油的最佳配比。在文献[18]中,提出一种近似核极端学习机分类器,可用于大规模非线性人脸图像分类问题。在文献[19]中,利用核极端学习机作为分类器完成对小钢球表面缺陷的检测和分类。在文献[20]中,利用核极端学习机将从红外图像中提取的HOG特征进行分割。
本文受基于LBP空间特征的提取方法以及空间和光谱特征结合技术的启发,提出基于空谱特征的核极端学习机高光谱遥感图像分类算法SS-KELM,该算法将提取的光谱特征以及通过LBP提取的空间特征进行矢量堆叠,得到新的空谱特征向量,而后引入到KELM模型中,弥补特征提取不充分的问题。
本文所提算法的主要贡献在于:
1)将提取的光谱特征以及通过LBP提取的空间特征,通过使用矢量堆叠方法进行堆叠得到的新的特征向量——空谱特征向量:避免了只提取其中一种特征导致特征提取不充分,分类效果不理想的问题。
2)在KELM的基础上提出了SS-KELM算法,SS-KELM在引入新的特征向量的情况下对原始数据进行分类:在ELM的基础上提出了KELM,进而提出了SS-KELM,使得分类效果更加良好。
为了评价和验证所提出方法在图像分类过程中所具有的性能,我们使用Indian Pines和University of Pavia两个高光谱遥感图像数据集进行实验,将本文所提出的SS-KELM算法与SVM,KELM,内核协同表示与Tikhonov正则化(KCRT-CK)[21]及多项逻辑回归(MLR)[22]算法进行综合对比,实验结果表明本文所提出的算法在图像分类中能够取得较好的分类效果。
本文剩余部分安排如下,第二部分介绍空谱特征提取,第三部分介绍分类器,第四部分给出实验结果及分析,第五部分给出最后结论。
1 空谱特征提取
空谱特征提取的步骤包括两个并行模块:光谱特征提取和空间特征提取。然后将每个像素的光谱和空间特征堆叠成一维矢量,就可以得到同时包含图像的光谱信息和邻域像素间空间关系的空谱特征向量。最后将新的特征向量馈送到KELM核极端学习机中进行分类。在这里,本文先介绍如何进行光谱和空间向量提取。然后,简要介绍如何在拟议的框架中组合光谱和空间特征。
高光谱图像由大量光谱带组成,但其中包含许多冗余信息,因此,为了减少空间特征提取时的计算量,首先要对高光谱图像的光谱维进行数据降维处理。本文利用波段选择(例如LPE[23])通过选择具有独特和丰富信息特征的光谱带的子集来降低维数。
线性预测误差(LPE)是一种简单而有效的波段选择方法,它是基于波段相似性测量的。在空间特征提取中,线性预测误差(LPE)首先用于选择具有独特和信息特征的光谱带子集。假设存在两个初始波段B1和B2,对于每隔一个波段B,近似可以表示为B′=a0+a1B1+a2B2。在这里a0,a1和a2是最小化LPE的参数为:e = |B-B′|2。参数矢量可以用a=[a0,a1,a2]T表示。可以采用最小二乘解来获得如下的参数向量:
a=(MTM)-1MTm
(1)
其中:M是具有三列的矩阵,其第一列是全1,第二列是B1波段,第三列是B2波段。M的行数是每个波段中的像素总数。m是B波段。产生最大误差e的波段被认为是与B1和B2最不相似的波段,是要被选中的波段。以此类推,波段组合可以随后增加到五,六,七等,直到获得所需数量的波段。
在波段选择之后,我们要将基于局部二值模式(LBP)[24]的特征向量提取过程应用于每个所选波段。
1996年T.Ojala等人引入局部二值模式(LBP)对图像进行纹理分析。局部二值模式的主要思想是先由结构法对固定窗口进行分析,再由统计法对整体特征进行提取。LBP算法常以3×3为固定窗口,以该窗口的中心像素的灰度值为阈值,对其它相邻像素进行二值化处理,最后由其相对于中心像素的位置,进行加权求和,得到所求LBP值。局部二值模式是通过比较每个像素与其相邻像素之间的差异,来有效地总结图像的局部结构的,因此它是一种非参数方法。局部二值模式最重要的特性是其对单调照明变化的容忍度及其计算的简单性,同时它在精度和运算方面也具有优势,因此它还是一种理论简单但功能强大的分析算法。
给定中心像素tc,局部区域的每个相邻像素都被分配一个二进制标签,标签可以是“0”或“1”,这取决于中心像素是否具有更大的强度值。具体地说,k个相邻像素就是以中心像素tc为中心,半径为r的圆上的一组等间隔样本。半径r确定相邻像素和中心像素之间的距离,与所选择的k个相邻像素一起,中心像素tc的LBP代码可以由下式给出:
(2)
Z其中,若ti>tc,则U(ti-tc)=1;若ti≤tc,则U(ti-tc)=0。图1说明了给定的中心像素tc的八个((k,r)=(8,1))圆形邻域的二进制阈值处理的示例。然后以顺时针方向计算LBP代码,即二进制标签序列“11001010”= 83。
图1 LBP二进制阈值的示例
输出的LBP代码反映了尺寸为3×3的局部区域中的纹理取向和平滑度。在获得所有像素的LBP代码之后,再在以感兴趣的像素为中心的局部块上计算得出直方图,如图2所示。然后,将所有的LBP直方图带连接起来形成空间特征向量。
图2 LBP特征提取的实现
要注意的是,在本文中,我们使用的是原始LBP的扩展,称为均匀模式。均匀模式可以有效地减少特征向量并实现简单的旋转不变算子。如果二进制模式中最多包含两个0-1或1-0转换,则LBP被称为均匀的。在计算每个波段的LBP直方图时,将所有非均匀的图案都分配到一个单格点上。然后,一个波段的特征向量就可以从256个减少到59个。
光谱特征包含用于区分不同类型的地面类别的重要信息。空间特征减少了类内方差,并且可以改善分类性能。因此,光谱和空间特征向量的组合为实现高光谱图像的分类提供了更可靠的结果。本文中,通过使用矢量堆叠方法来解决光谱和空间特征向量的集成,如图3所示。具体地就是,对于每个像素将其空间特征向量添加到光谱特征向量的末尾,即可得到新的空谱特征向量。然后,将这些新的空谱特征向量引入到分类器中进行分类。详细的分类模型将在以下小节中描述。
图3 光谱特征和空间特征提取及矢量堆叠方法流程图
2 系统结构及原理
2.1 极端学习机
2006年,Huang等人[25-26]提出极限学习机(ELM),因其计算成本远低于任何其他基于神经网络的方法,不仅计算效率高,而且趋于实现与SVM相似或者更好的泛化性能,近年来引起了计算机视觉和模式识别领域的广泛关注。
(3)
其中h(·)是非线性激活函数(例如,sigmoid函数),βj=(βj1,βj2,...,βjC)∈RC表示将第j个隐藏节点连接到输出节点的输出权重向量,wj∈Rd表示将第j个隐藏节点连接到输入节点的权重向量,bj是第j个隐藏节点的偏置值。术语wj·xi表示wj和xi的内积。如果将值1填充到xi中以使其成为d+1维向量,则可以将偏差视为权重向量的一个元素,也可以随机分配。对于n个等式,将所有数据样本进行化简整合,式(3)可以改写为如下形式:
Hβ=Y
(4)
其中:Y=[y1;y2;…;yn]∈Rn×C为期望输出矩阵,β=[β1;β2;…;βn]∈RL×C为输出权值矩阵,且H是神经网络的隐层输出矩阵,则上式可以表示为:
(5)
在式(5)中,h(xi)=[h(w1·x1+b1) …h(wL·x1+bL)]是响应输入xi的隐藏节点的输出,将数据从d维输入空间映射到L维特征空间。在大多数情况下,隐藏神经元的数量要远远小于训练样本的数量,即L≪n,此时H为奇异矩阵,我们可以利用最小二乘解的方法对(4)式进行求解:
(6)
(7)
综上所述,具有L个隐藏节点,激活函数为h(·)的ELM算法的求解过程可总结成如下步骤:
1) 初始化训练样本集;
2) 随机指定网络输入权值wj和偏置值bj;
3) 通过显式激活函数计算隐层节点输出矩阵H;
2.2 基于核极端学习机的SS-KELM
传统的极端学习机模型仍存在着网络隐含层节点个数难以确定、缺乏考虑结构化风险导致过拟合等问题。针对此问题,Huang 等人将支持向量机中隐式表达特征空间的核函数映射引入极端学习机中,作为极端学习机的隐含层节点映射,构建核极端学习机模型。
在ELM中,假设的特征映射h(xi)是已知的。通过将ELM中的显式激活函数扩展到隐式映射函数中,构建出基于内核的ELM。此时假设的特征映射未知,则可以将ELM的核矩阵定义为:
ΩELM=HHT:ΩELM i,j=h(xi)·h(xj) =K(xi,xj)
(8)
因此,KELM的输出函数由下式给出:
(9)
最后根据具有最大值的输出节点的索引确定输入数据标签。
核极端学习机包含了传统极端学习机和支持向量机优点的同时,由于其假设特征映射是未知的,并给出相应的核函数,解决了传统极端学习机网络隐含层节点个数难以确定的问题。核极端学习机也可以使用更多的特征映射,如Sigmoid、三角函数等。与传统的支持向量机相比,核极端学习机在优化目标函数相同的基础上,对拉格朗日乘子的约束更少,因此可以得到更优的解。此外,由于传统的支持向量机需要解决大约束优化问题,而核极端学习机只需要一个分析步骤,因此,核极端学习机具有更快的学习速度。实验表明,KELM可以提供与SVM类似或甚至更好的分类准确度。
本文提出的SS-KELM算法,就是将经过矢量堆叠得到的新的空谱特征向量,引入到核极端学习机中进行分类,其步骤可总结如下。
输入:高光谱遥感图像数据集。
步骤1:定义基本参数,对三维真实高光谱数据集进行归一化处理;
步骤2:根据公式(1)利用波段选择LPE方法对数据进行降维处理,同时保存数据的光谱维特征;
步骤3:根据公式(2),对降维后数据使用LBP方法提取图像的空间特征向量;
步骤4:根据图像3所示流程图,将空谱数据进行结合;
步骤5:选择核函数,利用公式(9)计算输出结果;
输出:类内分类准确率CA、总体准确率OA、平均准确率AA和kappa系数。
3 高光谱图像分类实验
为了评估本文所提出的SS-KELM算法的性能,我们采用了两个被广泛使用的高光谱数据集Indian Pines数据集和Pavia University数据集进行评估,并选择了一些经典传统的分类算法来进行综合比较。在本小节中,我们首先对数据集进行简要的介绍。然后,通过与SVM,KELM,KCRT-CK,MLR算法的比较,显示并讨论实验结果。
3.1 数据集描述
第一个数据集是Indian Pines数据集。它由美国国家航空航天局的机载可见/红外成像光谱仪(AVIRIS)传感器,在1992年6月,于印第安纳州西北部的印度松试验场上采集的。该图像代表了145×145像素和220个波段的分类场景,拥有0.4至2.45μm的可见光谱和红外光谱区域,空间分辨率为20 m。该方案包含三分之二的农业和三分之一的森林。在本文中,去除吸水带后总共使用了202条光谱带。有16种不同的土地覆被类别,但在指定的地面真实地图中并非所有类别都是互斥的。训练和测试样本的数量在表1中显示。
表1 Indian Pines数据集样本信息
使用的第二个实验数据集是由反射光学系统成像光谱仪传感器收集的。该图像场景是在DLR(德国航空航天局)管理的HySens项目下收集的,覆盖了意大利的帕维亚市,其空间覆盖率为610×340像素。在去除水带之前,数据集具有103个光谱带。它的光谱范围可从0.43到0.86-μm,空间分辨率为1.3 m。地面真相图大约有9类的42 776个标记像素。表2总结了有关训练和测试样本数量的更多详细信息。
表2 Pavia University数据集样本信息
3.2 实验结果与分析
在本节中,将本文所提算法 SS-KELM与SVM,KELM,KCRT-CK,MLR算法的分类结果进行对比。通过对比它们的类内分类准确率CA、总体准确率OA、平均准确率AA和kappa系数来衡量每种算法的分类性能。
3.2.1 Indian Pines 图像数据实验结果
表3展示在Indian Pines数据集上固定训练样本个数,不同算法的类内分类准确率CA、总体准确率OA、平均准确率AA和kappa系数。通过比较6种算法的OA、AA和kappa系数可以很清楚地看到本文所提的SS-KELM 算法与SVM,KELM,KCRT-CK,MLR算法相比,在16类数据样本中,有12类的类内分类准确率CA要高于其他算法,总体准确率OA、平均准确率AA和 Kappa 系数均有所提升。图4展示在Indian Pines数据集上不同算法的类内分类准确率CA与类别之间的关系,根据分类准确率曲线可以看出,本文所提算法的分类准确率相对较高。
表3 Indian Pines 数据分类中不同分类算法的比较
图4 Indian Pines数据集不同方法分类准确率对照图
3.2.2 University of Pavia 图像数据实验结果
表4展示在University of Pavia数据集上固定训练样本个数,不同算法的类内分类准确率CA、总体准确率OA、平均准确率AA和kappa系数。通过比较6种算法的OA、AA和kappa系数可以很清楚地看到本文所提的SS-KELM 算法与SVM,KELM,KCRT-CK,MLR算法相比,在9类数据样本中,有6类的类内分类准确率CA以及总体准确率OA、平均准确率AA和 Kappa 系数均高于其他算法。图5展示在University of Pavia数据集上不同算法的类内分类准确率CA与类别之间的关系,根据分类准确率曲线可以看出,本文所提算法的分类准确率较高且曲线在2-9类上较为平稳。
表4 University of Pavia 数据分类中不同分类算法的比较
图5 Pavia University数据集不同方法分类准确率对照图
通过表3和表4的对比实验结果以及图4和图5的类内分类准确率对照图可以看出,SS-KELM 算法的分类性能优于其他分类算法,其原因在于SS-KELM算法在进行特征提取时,同时考虑高光谱遥感图像的光谱和空间特征,光谱特征包含用于区分不同类型的地面类别的重要信息,空间特征考虑了邻域像素之间的空间关系。本文利用局部二值模式(LBP)提取空间特征既减少了类内方差,又可以改善分类性能,同时使用矢量堆叠的方法将两种信息融合,使得特征向量包含更多信息,再将其引入到核极限学习机模型中,可以有效地提高高光谱遥感图像的分类精度,弥补核极限学习机在高光谱遥感图像分类中学习不充分、空间信息利用不充分等问题。
4 结束语
本文提出了一种基于空谱特征的核极端学习机高光谱遥感图像分类算法,利用LBP的框架来提取局部图像空间特征并与其光谱特征进行结合以进行高光谱遥感图像的分类。具体而言,首先,基于LBP提取空间特征,将LBP实施到通过LPE方法选择的原始波段的子集。然后,将提取的LBP空间特征和光谱特征通过使用矢量堆叠的方式进行结合形成新的特征向量。最后,还提出了利用KELM对新的特征向量进行分类。实验结果表明,局部LBP表示在高光谱图像空间特征提取中是有效的,因为它们在提供局部结构图案的同时还对图像纹理配置信息进行编码。同时考虑光谱和空间特征的新的特征向量,使向量的特征表示更具有准确性。此外,核极端学习机可以提供有效的分类,优于基于SVM的方法。在未来的工作中,我们将研究更复杂的特征选择方法。