APP下载

判别流形学习算法的高光谱数据降维与树种识别

2018-02-28汪少华

测绘通报 2018年1期
关键词:流形降维波段

汪少华,杨 婷

(1. 石河子大学农学院,新疆 石河子 832000; 2. 石河子大学理学院,新疆 石河子 832000)

高光谱成像是一个利用高光谱分辨率成像仪获取二维空间影像的遥感技术,其影像光谱覆盖上百个连续可见光、近红外和短波红外波段,每个像元对应一条连续完整的光谱曲线。高光谱遥感技术已在诸如人脸识别[1]、行星探测[2]及生物学[3]等领域得到了广泛应用。由于高光谱影像具有波段多、相邻波段高相关性的特点,使得每个像元的光谱数据冗余度非常高;同时由于每个像素位于高维的影像数据空间中,对高光谱图像进行目标探测、影像分割、像元分类及光谱解混过程时,将会增加计算复杂度并降低结果精度[4]。为了解决这些问题,数据的降维成为必然选择。

高光谱数据降维主要有两种途径:一是通过对数据的转换将数据维度减少,称为特征提取,如典型的主成分分析(principal component analysis,PCA)算法,通过对数据方差信息最大化的方法对数据降维[5];二是从众多波段中选择感兴趣的若干波段,称为特征选择,如利用光谱一阶微分和二阶微分选择差异性大的波段对高光谱数据进行降维[6]、利用密集采样和高光谱度量来分析不同树种的光谱特征,选择出对应波段进行分类[7]。本文将研究利用波段的特征提取对高光谱数据进行降维。

流形学习(manifold learning)是非线性降维特征提取所采用的主要方法之一,通过将高维数据在特征空间中对应的点用非线性方法转换到低维流形上实现高维数据降维。目前国际上主要的流形学习算法包括局部线性嵌入(locally linear embedding,LLE)[8]、ISO特征映射(ISOMAP)[9]、拉普拉斯特征映射(Laplacian eigenmaps,LE)[10]、Hessian特征映射(Hessian eigenmaps,HLLE)[11]、局部切空间排列(local tangent space alignment,LTSA)[12]和基于流形对齐的分类算法[13]等。这些算法都是非监督降维方法,对分类效果有局限性。本文将通过利用高光谱影像中的训练样本进行局部信息判别分析,并将其加入到已经建立的流形学习框架中,实现对高光谱数据有针对性的光谱降维,以提高影像的分类精度。

1 数据与方法

1.1 数据获取

Hyperion高光谱遥感影像具有242个波段,其分辨率为30 m×30 m,光谱范围为355~2577 nm。本文获取的Hyperion数据成像时间为2004年5月6日,该数据已经过辐射定标,以及斑点去除、回波校正、几何校正、坏像元恢复等一系列预处理;同时再对许多非正常像元或目视检测质量差的波段进行剔除,得到质量较好的126个波段用于接下来的遥感数据分析处理。本文的研究区域为森林覆盖率较高的杭州市余杭区百丈镇和鸬鸟镇、临安市高虹镇、安吉县山川乡和天荒坪镇交界处,遥感图像大小为462×987像素(如图1所示)。

图1 研究区高光谱影像数据

根据实际调查情况将研究区域森林树种分为毛竹、雷竹、杉木、阔叶林和马尾松5个树种及树种组,每个树种选择30个以上的样地共计179个样地。图1中分别标出了这5个树种组的典型对应光谱曲线,以及居民点和水体两个地类的对应光谱曲线图。采用手持GPS进行野外样地调查时,沿着每个样地走一圈得到样地范围和位置,并利用ArcGIS软件对调查样地进行投影转换处理,使调查样地与遥感图像坐标相匹配,利用Erdas软件将样地对应的遥感数据提取出来作为遥感图像分类参考样本;同时为了进行数据的深入分析与评价,通过目视判图与实际比较,从遥感图中提取水体与居民点两类主要非林地参考样本点补充进有林地分类参考样本中(见表1)。

表1 样地调查表

1.2 判别流形学习算法DLA

当前国际上采用的流形学习算法框架主要为图嵌入框架[14]和片排列框架[15]两种。本文根据高光谱遥感图像中对应的调查样地样本集,提出一种基于判别局部片排列(discriminant locality alignme-nt,DLA)的流形学习算法降低原高维光谱数据特征空间的维数,并比较分析样本数据集在不同的流形子空间的可分离性,然后分别采用最大似然分类器对遥感图像中的每个像素进行分类。

(1)

对于每一个样本的片排列Xi,在某一低维特征空间的对应输出记为

(2)

在低维特征输出空间中,期望同类的样本间距离更近,同时不同类的样本距离更远,从而达到类别的高判别性,如图2所示。

图2 DLA的局部优化示意图

对于低维子空间中的各个样本片排列Yi,期望yi和与之同类的样本距离更近,记为

(3)

同时,期望yi和与之不同类的样本间距离更远,记为

(4)

由于由局部邻近域所构成的片排列可以近似看成是线性的[16],于是可将式(3)、式(4)用线性的方法统一起来,用目标函数表示为

(5)

式中,度量参数β∈[0,1],用来统一同类样本间与不同类样本间的距离。这里,定义系数向量为

(6)

将式(5)化简为

(7)

(8)

将所有样本集中的每个片排列目标函数即式(7)统一,判别流形学习算法的目标函数可以表示为

(9)

根据线性化模型,将Y=UTX代入式(9)得到目标函数为

(10)

式中,UTU=Id。

对于式(9)、式(10)这一基本的优化问题,可以利用拉格朗日乘子法得到其最优解。通过对XLXT的标准特征值分解,得到优化问题式(10)的最优解即为特征值分解式(11)中的d个最小非零特征值对应的特征向量组合

(11)

1.3 PCA算法

PCA通过最大化数据集X的点矩阵在投影子空间中的迹,得到目标函数为

(12)

(13)

(14)

与DLA方法同理,将所有样本集中的每个片排列目标函数统一,判别流形学习算法的目标函数可以表示为

(15)

将Y=UTX代入(15)得到目标函数为

(16)

通过对XLXT的标准特征值分解,得到优化问题式(16)的最优解即为特征值分解式(17)中的d个最大非零特征值对应的特征向量组合,即

(17)

2 结果与分析

2.1 原始影像光谱曲线分析

在图3中显示了从原始高光谱影像中提取的总计1991个目标像元的相关光谱辐射亮度曲线,以反映目标像元光谱的均值、标准差、最大值和最小值情况。按照图中箭头方向,曲线从上到下分别为光谱最大值、均值加标准差、均值、均值减标准差、最小值。这些目标像元包括有林地5个树种组的179个样地对应像元,以及从影像中水体、居民地选出的像元。从图3中可以看出所选像元在126个对应波段上的均值和标准差信息变化,其中光谱均值最大值与最小值分别为5 141.7和388,对应波段为第57和第1个波段,标准差最大为1 350.7。对于标准差变化较大的部分可以作为判别不同地物信息的参考。图4显示了5种树种组,以及水体、居民点的光谱辐射亮度曲线,可看出5种树种组具有相似的光谱曲线形状,与水体、居民点光谱曲线部分形状具有显著差异。虽然5种树光谱整体形状相似,但在一些波段范围内也存在差别。这些差别性反映了7种地物光谱特性的不同,通过光谱信息差异性的判别分析可以作为更好分类不同地物的依据。

图3 目标像元相关光谱曲线

2.2 DLA与PCA对样本数据的降维分析

本文利用主成分分析(PCA)、判别流形学习(DLA)对高光谱数据进行降维,分别根据图像各地物参考数据建立影像像元分类的输入特征空间。影像参考数据见表2。其中,为建立特征空间所需的训练样本从参考数据中随机产生,为每类地物20个像素;测试样本为参考数据除去训练样本外的所有数据,用来分析评价分类准确度。由上文可知PCA特征空间即为前d个最大非零特征值对应的特征向量空间,DLA特征空间为前d个最小非零特征值对应的特征向量空间,这里常数d即为选择输出的特征维数。

图4 7种地物原始光谱曲线

样地类型参考样本训练样本测试样本水体16620146居民点15320133毛竹73320713雷竹12720107阔叶林71420694马尾松422022杉木562036合计19911401851

为了更好地分析比较DLA与PCA特征空间对不同树种,以及水体、居民点的分离效果,将输出维数d取值为2,即输出前两个主成分特征,以特征空间中散点分布图的形式显示,如图5所示。同时由于一些波段能够反映不同地物光谱特征的差别性,从7类地物中选择光谱值相关性小、标准差大的20和57波段,作为原始光谱(spectral)特征的二维特征空间散点分析,如图5(a)所示。图5(c)、图5(d)是判别流形学习算法DLA中度量参数β取0.000 1,同时样本数据集xi分别选择为居民点和毛竹数据时的判别流形特征空间各类地物散点分布图。从图5可以看出,基于局部判别片排列(DLA)的流形方法能够在其判别流形子空间中很好地将阔叶树种、毛竹、居民点和水体4类地物分开,但是对于马尾松、杉木和雷竹样本出现了不同程度的重叠与混淆,使得这3类树种组与毛竹、阔叶组的可分离性较低,这种地物混淆的特点同样出现在光谱(spectral)特征和主成分分析(PCA)特征空间的各类型散点图中,且混淆更明显,主要原因是不同树种光谱的相似性与复杂性造成。从图5中还可以看出,DLA与PCA方法对不同类型样本可分性要优于原始光谱特征方法,同时通过优化选择判别流形方法的样本集与度量参数,充分利用训练数据的判别信息,在保持各样本在输出的低维判别子空间局部几何结构的同时,使得同类样本数据更接近,而不同类型样本尽量远离,其对样本的可分性将比主成分分析方法效果更好。

图5 参考数据在不同特征空间分布散点

2.3 Hypersion高光谱影像分类结果与评价

分别选用光谱特征(spectral)、主成分分析特征(PCA)和判别流形(DLA)的特征作为输入特征,使用最大似然分类器对Hypersion影像中的每个像素进行分类,分类结果如图6所示。其中图6(a)选择5个光谱差异性显著波段作为光谱的特征输入;图6(b)和图6(c)是以主成分分析特征作为分类的输入特征,输出特征维数分别是10和5的分类结果图;图6(d)是判别流形方法选取参数β为0.000 1、输出特征维数为5的分类图。从分类结果可以看出,利用判别流形(DLA)的分类效果最优。而基于主成分分析(PCA)的分类效果与输出特征维数的选取密切相关,当输出选取前10种主成分特征时,在马尾松、杉木、雷竹的分类上出现了较多的错分漏分现象,当选取前5种主成分特征时,这些树种的错分现象得到明显改善。基于光谱特征方法进行分类的结果可以看出,图像左上角的杉木和下方的马尾松出现大量错分。本文提出的判别流形与主成分分析方法都能不同程度避免易混淆的杉木、马尾松、雷竹误分类的情况,图5中的样本数据特征空间分布情况与图6所示分类结果表明本文提出的基于判别流形学习的方法能够显著地提高高光谱遥感图像的分类准确度。

上述方法对Hypersion高光谱影像数据分类精度定量统计结果见表3。可以看出,本文提出的基于判别流形学习方法在各地物单类分类准确度与总体分类准确度取得较好的效果,其中对于水体、居民点、毛竹和阔叶树组的分类均取得很好的效果。基于主成分分析方法在维数为5时的分类准确度要明显高于维数为10的各类分类准确度。本文采用的4种方法对Hypersion高光谱图像数据的总体分类准确度分别为:76.97%、70.63%、81.86%和84.57%,这里判别流形学习方法较好地提高了影像的分类准确度。

表3 Hypersion高光谱数据分类准确度统计表

3 结 语

本文提出了基于判别局部片排列(DLA)的流形学习方法对高光谱图像进行降维,通过对局部样本数据进行流形学习框架内的优化训练,将原始光谱特征空间转换为最优判别流形子空间,然后在该流形子空间内使用最大似然分类器,对高光谱影像中的每个像素进行分类,并与通过最大化光谱方差信息的主成分分析(PCA)方法,以及根据样本光谱信息选取差异性显著波段的原始光谱(spectral)方法,进行高光谱图像降维后的各类型地物分类准确度比较。结果显示基于DLA的流形学习方法要优于其他方法,主要由于DLA方法能够充分利用样本数据的判别信息,以保持各类样本在输出低维子空间的局部几何结构,因此在对光谱信息相似的树种组进行分类时能够取得满意的效果,这将为利用高光谱影像数据进行大面积森林树种遥感识别与监测提供理论依据。

本文所提出的高光谱数据降维方法中,选择特征空间的输出维数均为5,即前5种主成分特征作为输出,对于Spectral方法即为所选取的5个波段所对应的原始光谱作为输出特征。通过比较PCA两种不同维数的分类准确度,可以看出PCA方法的分类准确度不会随着输出维数的增加而提高,而对基于DLA的流形学习方法降维的输出维数选取、样本集xi及度量参数β的优化问题将是下一步研究的主要内容。

[1] PAN Z, HEALEY G E, PRASCAD M, et al. Face Recognition in Hyperspectral Images[C]∥IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2003: 334-339.

[2] GENDRIN A, MANGOLD N, BIBRING J P, et al. Sulfates in Martian Layered Terrains: the OMEGA/Mars Express View[J]. Science, 2005, 307(5715):1587-1591.

[3] SCHULTZ R A, NIELSEN T, ZAVALETA J R, et al. Hyperspectral Imaging: A Novel Approach for Microscopic Analysis[J]. Cytometry Part A, 2001, 43(4):239.

[4] VELASCO-FORERO S, ANGULO J. Classification of Hyperspectral Images by Tensor Modeling and Additive Morphological Decomposition[J]. Pattern Recognition, 2013, 46(2):566-577.

[5] FARRELL M D, MERSEREAU R M. On the Impact of PCA Dimension Reduction for Hyperspectral Detection of Difficult Targets[J]. IEEE Geoscience & Remote Sensing Letters, 2005, 2(2):192-195.

[6] 王志辉, 丁丽霞. 基于叶片高光谱特性分析的树种识别[J]. 光谱学与光谱分析, 2010, 30(7):1825-1829.

[7] DALPONTE M, BRUZZONE L, GIANELLE D. Tree Species Classification in the Southern Alps Based on the Fusion of Very High Geometrical Resolution Multispectral/Hyperspectral Images and LiDAR Data[J]. Remote Sensing of Environment, 2012, 123(3):258-270.

[8] ROWEIS S T, SAUL L K. Nonlinear Dimensionality Reduction by Locally Linear Embedding.[J]. Science, 2000, 290 (5500): 2323.

[9] TENENBAUM J B, SILVA V D, LANGFORD J C. A Global Geometric Framework for Nonlinear Dimensionality Reduction[J]. Science, 2000, 290(5500):2319.

[10] BELKIN M, NIYOGI P. Laplacian Eigenmaps and Spectral Techniques for Embedding and Clustering[J]. Advances in Neural Information Processing Systems, 2002, 14(6):585-591.

[11] DONOHO D L, GRIMES C. Hessian Eigenmaps: Locally Linear Embedding Techniques for High-Dimensional Data[J]. Proceedings of the National Academy of Sciences of the United States of America, 2003, 100(10):5591.

[12] ZHANG Zhenyue, ZHA Hongyuan. Principal Manifolds and Nonlinear Dimensionality Reduction via Tangent Space Alignment[J]. Advances in Manu facturing, 2004, 26(4):313-338.

[13] 鲁锦涛, 马丽. 基于流形对齐的高光谱遥感图像降维和分类算法[J]. 国土资源遥感, 2017, 29(1): 104-109.

[14] YAN S, XU D, ZHANG B, et al. Graph Embedding: A General Framework for Dimensionality Reduction[C]∥IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2005:830-837.

[15] ZHANG T, TAO D, LI X, et al. Patch Alignment for Dimensionality Reduction[J]. IEEE Transactions on Knowledge & Data Engineering, 2009, 21(9):1299-1313.

[16] SAUL L K, ROWEIS S T. Think Globally, Fit Locally: Unsupervised Learning of Low Dimensional Manifolds[J]. Journal of Machine Learning Research, 2003, 4(2):119-155.

猜你喜欢

流形降维波段
混动成为降维打击的实力 东风风神皓极
多重卷积流形上的梯度近Ricci孤立子
最佳波段组合的典型地物信息提取
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
局部对称伪黎曼流形中的伪脐类空子流形
对乘积开子流形的探讨
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术