半监督多图嵌入的高光谱影像特征提取
2020-04-08唐玉枭段宇乐
黄 鸿,唐玉枭,段宇乐
(重庆大学 光电技术与系统教育部重点实验室,重庆 400044)
1 引 言
高光谱遥感影像包含从可见光到红外光谱区域数十数百个狭窄且连续的光谱波段,其每个像素点包含几十到几百维的光谱反射数据,已广泛应用于资源勘探、精细农业、灾害评估以及目标识别等领域[1-2]。高光谱影像尽管给地物精确分类带来了机遇,但是存在维数高、波段相关性强、标记样本较少等问题[3-5]。因此如何降低数据冗余,实现鉴别特征提取是高光谱遥感影像研究的前沿与热点[6]。
维数约简方法可以降低数据维数,得到高维数据有意义的低维表征,有利于解决“维数灾难”问题[7]。常用的维数约简算法主要有主成分分析(Principle Component Analysis, PCA)[8]、线性判别分析(Linear Discriminant Analysis, LDA)[9]、局部线性嵌入(Local Linear Embedding, LLE)[10]、拉普拉斯特征映射(Laplacian Eigenmaps, LE)[11]、等距映射(Isometric Mapping, ISOMAP)[12]、邻域保持嵌入(Neighborhood Preserving Embedding, NPE)[13]以及局部保持投影(Locality Preserving Projections, LPP)[14]等。上述方法可统一到图嵌入框架(Graph Embedding, GE)下,学者们基于该框架提出了边界Fisher分析(Marginal Fisher Analysis, MFA)[15]、局部线性判别分析(Losal Fisher Discriminant Analysis, LFDA)[16]、局部几何结构Fisher分析(Local Geometric Structure Fisher Analysis, LGSFA)[17]等监督学习方法,通过有效利用样本数据的类别信息提高低维嵌入特征的可分性,提升分类性能。但在实际应用中,标记样本往往非常有限,或者需消耗大量的人力财力去进行标记,同时存在大量的无标记样本可供利用。学者们提出采用半监督学习方法提出通过利用标记样本和无标记样本来实现半监督特征提取,如半监督鉴别分析(Semi-supervised Discriminant Analysis, SDA)[18]、半监督局部判别分析(Semi-supervised Local Discriminant Analysis, SELD)[19]和半监督稀疏流形嵌入(Semi-supervised Sparse Manifold Embedding, S3ME)[20]等,可进一步提升分类性能。
上述图嵌入方法仅考虑了点与点之间结构关系,而观测数据在高维空间往往具有复杂的多元结构[21],因此学者们提出构建超图模型以表达数据间复杂结构关系。Huang等[22]结合超图结构与判别局部保留投影的思想提出判别超-拉普拉斯投影(Discriminant Hyper-laplacian Dproiection, DHLP)方法,使投影后的同类数据聚集、不同类数据远离。Sun等[23]提出空-谱超图嵌入(SS Hypergraph, SSHG)方法,采用扩展形态特征和光谱特征并联合超图嵌入模型的方法学习高光谱图像数据的几何结构,同时引入超边权重的正则化约束来保持有效的超边界。Wang等[24]通过空间邻域内的相关像素来构造约束字典并激活相关点、抑制不相关点,提出一种空-谱局部约束弹性网超图学习模型并应用于高光谱图像地物聚类。在超图方法中,超边由多顶点连接构成,使超边更易连接成图,有效表征数据间的多元结构关系。超边权重为其所包含顶点之间两两相似度的和,两点之间的相似关系同时也受超边内其他顶点的影响,这种“平均”效应削弱了两点之间的直接联系。因此,如何有效联合简单图和超图模型,以有效表征高维数据本质结构,成为高光谱数据维数约简过程中的关键所在。
针对上述问题,本文提出一种半监督多图嵌入(Semi-Supervised Multi-Graph Embedding, SSMGE)的维数约简方法,以两类图的协同结构表征数据在高维空间中的结构,实现高光谱数据鉴别特征提取。该方法通过样本数据的欧式近邻点以寻找数据在高维空间的位置关系,利用有标记样本和无标记样本分别构建监督、非监督超图以表征其多元关系,并使用有标记样本构建普通图,然后通过多图协同方式来表征数据间的复杂几何结构。在低维嵌入空间中,加强类内图和本征图的结构,抑制类间图和惩罚图的关系,实现鉴别特征提取,进而有效改善地物的分类性能。在PaviaU和Urban高光谱数据集上的实验结果证明了本文方法的有效性。
2 本文方法
本文中,高光谱数据集表示为X=[Xl,Xu]∈RB×n,B为波段数,n为样本总数,其中标记样本集为Xl=[(xl,1,l1),(xl,2,l2),...,(xl,nl,lnl)]∈RB×nl,li∈{1,2,...,m},m为样本类别数,无标记样本集为Xu=[xu,1,xu,2,...,xu,nu]∈RB×nu,nl为有标记样本数,nu为无标记样本数,n=nl+nu。低维嵌入特征表示为Y=[yl,1,yl,2,...,yl,nl,yu,1,yu,2,...,yu,nu]∈Rd×n,其中d为低维特征的嵌入维数,Y=PTX,P∈RB×d为投影矩阵。
2.1 图嵌入模型
为更好地理解PCA,LDA,LLE,LE,ISOMAP,NPE,LPP等维数约简算法,YAN等[25]提出图嵌入模型并将上述算法统一到该框架下。在图嵌入模型中,需构建本征图G={V,W}以表征数据的统计及几何特性,其中V=[v1,v2,...,vn]∈RB×n为顶点集,W=[wij]∈Rn×n为权重矩阵,wij为顶点vi和vj之间的权值。
图嵌入模型的主要目的是使图中的顶点在低维嵌入过程中保持顶点间的相似关系,实际应用中可能会加入惩罚图使不相似数据尽量远离。因此,其目标函数可表示如下:
(1)
2.2 超图嵌入模型
超图与普通图的区别主要在于边与超边内顶点的数量不同,普通图的边仅表示两点之间的关系,而超图的边包含多个顶点,多点连接的不同超边共享更多的顶点,使超边更易连接成图,两类图从不同角度来表征高维数据中的结构关系。超图模型可表示为GH={VH,EH,WH},其中EH为超边集,VH为超边集,超边ei∈EH,其权值w(eH)∈WH。关联矩阵H=[h(vi,ej)]i,j∈R|VH|×|EH|表示顶点vi与超边ej的关系,顶点的度d(vi)表示连接顶点的超边权重之和,超边的度d(ei)表示为每条超边上顶点的个数,其定义如下:
(2)
(3)
(4)
超图与普通图的边主要区别在于顶点连接成边的方式不同,如图1(a)所示,该图共包含3条超边和15条普通边,普通图的每个边仅仅连接两个顶点,而超图的边由多个顶点构成,例如超边e1,e2分别由顶点子集{v1,v2,v5},{v2,v3,v4}构成。由于超边间的顶点子集有重叠部分,因此可以连接超边构成超图,相比普通图,超图更能更高
图1 普通图与超图结构对比Fig.1 Example of simple graph and hypergraph
效的揭示顶点间复杂的多元几何关系。图1(b),{e4,...,e18}为普通图的边,超边集{e1,e2,e3}构成超图关联矩阵H,H表示为每条超边所包含的顶点,1表示某超边包含对应的顶点,0表示不包含相应的顶点。
2.3 SSMGE算法
为有效利用高光谱数据中少量的标记样本和数量较多的无标记样本,并解决单一构图方法表征结构不足等问题,提出一种半监督多图嵌入(Semi-supervised Multi-graph Embedding, SSMGE)算法,实现鉴别特征提取。该算法首先利用标记样本计算得到其近邻点,构建有监督类内超图、类间超图和类内普通图、类间普通图,并利用无标记样本的近邻点和远离点分别构造无监督本征超图和惩罚超图,以实现多图协同表征高光谱数据的本征结构。在低维嵌入空间中,使类内图和本征图中的数据尽量聚集,类间图和惩罚图内中的数据尽可能远离,以提取低维鉴别特征,进而提升分类器分类性能。该算法流程如图2所示。
图2 SSMGE算法流程图Fig.2 Flowchart of proposed SSMGE method
2.3.1 有监督普通图与超图构建
在高光谱遥感数据中,同类地物对各个波段光谱的反射能力具有相似性,因此可利用光谱数据的欧氏距离来度量其近邻关系。普通图和超图主要结构差异在于图的连接方式不同,普通图仅仅是两点构成边,超图多点构成超边。
根据样本的类别信息与样本间的欧式距离来构建普通图和超图,包括类内普通图、类间普通图Gw={Vw,Ww},Gb={Vb,Wb}和类内超图GHw={Vw,EHw,WHw}、类间超图GHb={Vb,EHb,WHb},其中Vw,Vb为类内、类间图顶点集,VHw,VHb为类内、类间超图顶点集,EHw,EHb为类内、类间超边集,Ww,Wb为类内、类间图Gw,Gb的权重矩阵,WHw,WHb为超边集EHw,EHb对应的权重矩阵。
类内超边权值定义为:
类内超图的关联矩阵Hw定义如下:
(6)
基于超边权值WHw和关联矩阵Hw可计算顶点vi∈Vw的度:
(7)
(8)
与此同时,类间超图的超边权值可表示为:
(9)
其相应的类间超图的关联矩阵Hb表示为:
(10)
(11)
(12)
为提取出数据在低维空间的投影特征,使类内图尽量靠近,类间图尽量远离,由式(5)~式(12)可计算出超图的目标函数:
(13)
(14)
(15)
(16)
(17)
(18)
在低维嵌入空间中,为提取低维鉴别特征,应使类内图和类内超图更加紧密,类间图和类间超图更加远离。基于此,可联合式(15)和式(18)构建以下目标函数:
(19)
式中:α为平衡类内超图和普通图权衡系数,β为平衡类类间超图和普通图的权衡系数。
2.3.2 无监督超图构建
由于在实际应用中,标记样本往往非常有限,仅通过标记样本不足以有效表征高维数据的复杂结构,因此可通过无标记样本构建非监督超图来进一步表征其多元结构关系。为此,选取每个样本的近邻点构建无监督本征图,使其尽量靠近,选取远离点构建无监督惩罚图,使其尽量远离。无监督超图的超边权重、关联矩阵、顶点的度和超边的度定义如下:
(20)
(22)
(23)
(24)
(25)
(26)
(27)
由此,可得到无监督超图的目标函数:
(28)
进一步优化上述目标函数为:
(29)
结合式(19)与式(29),本文提出的半监督多图融合嵌入(SSMGE)算法的目标函数可表示为:
(30)
根据拉格朗日乘子法,式(30)中的最优化问题可被转换为求解如下广义特征值问题:
(31)
2.4 SSMGE算法步骤
算法:半监督多图融合嵌入(SSMGE)输入:高光谱数据集X=[Xl,Xu]∈RB×n,无标签样本Xu=[xu,1,xu,2,...,xu,nu]∈RB×nu,带标签样本Xl=[(xl,1,l1),(xl,2,l2),...,(xl,nl,lnl)]∈RB×nl,有监督图和超图类内、类间近邻点数intraK,interK,无监督超图近邻点和远离点数uK,低维嵌入维度d,平衡参数α,β。输出:低维嵌入特征Y=PTX∈Rd×n,PT∈RB×n为投影矩阵 1.将高光谱数据集X进行归一化处理,并随机选取一定数量标记样本和无标记样本进行训练;2.计算并选取带标签样本的intraK个类内近邻点、interK个类间近邻点,构建监督普通图和超图;3.计算监督普通图的拉普拉斯矩阵Lw=Dw-Ww,Lb=Db-Wb;4.计算监督超图的拉普拉斯矩阵LwH=Dwv-HwWHwDwe-1HwT,LbH=Dbv-HbWHbDbe-1HbT;5.计算并选取无标签样本近邻点和远离点各uK个,构建无监督超图;6.计算无监督超图的拉普拉斯矩阵LwHu=Dwvu-HwuWHwuDweu-1HwuT,LbHu=Dbvu-HbuWHbuDbeu-1HbuT;7.由式(30)构建多图融合优化目标函数;8.求解式(31)广义特征值问题,得到特征投影向量P,低维嵌入特征Y=PTX∈Rd×n。
3 实验结果与分析
为验证SSMGE算法的有效性,本文在PaviaU和Urban高光谱数据集上进行地物分类实验,并与相关算法进行对比。
3.1 实验数据集
University of Pavia (PaviaU)数据集于2002年由ROSIS传感器拍摄意大利北部Pavia大学的高光谱图像。该图像大小为610×340 pixel,空间分辨率为1.3 m,共有115个光谱波段,去除其中12个受噪声影响的波段,剩余103个波段用于实验。该图像包含沥青、草地、碎石、树和裸土等9类地物及其相应的标签信息,其假彩色图像和真实地物图像如图3所示。
图3 PaviaU高光谱图像Fig.3 University of Pavia hyperspectral image
Urban数据集于1995年由HYDICE传感器拍摄美国德克萨斯州胡德堡附近地区的高光谱图像,该图像大小为307×307 pixel,空间分辨率为4 m,共有210个波段,去除其中1~4,76,87,101~111,136~153,198~210共48个受噪声影响的波段,剩余162个波段用于实验。该图像包含建筑、阴影、沥青路、混凝土路、草地和树6类地物,其假彩色图像和真实地物图像如图4所示。
图4 Urban高光谱图像Fig.4 Urban hyperspectral image
3.2 实验设置
实验中,在数据集中随机选取一定数量标记样本和无标记样本作为训练集,其余作为测试集,其中无/半监督算法采用整个训练集进行学习,而监督算法只利用其中的标记样本。首先采用各种维数简约算法计算得到投影矩阵,然后得到测试样本的低维嵌入特征,最后采用最近邻分类器(1-NN)进行分类,每组实验均进行10次重复实验,并用总体分类精度(Overall Accuracy, OA)、平均分类精度(Average Accuracy, AA)和Kappa系数(κ)作为评价指标。实验中选取了RAW,PAC,LDA,MFA,LGSFA,DHLP和S3ME与本文提出的SSMGE方法进行对比,其中RAW为直接对原始数据进行分类。各算法参数均通过交叉验证调到最佳,MFA的类内、类间近邻数分别选取为3,60,LGSFA中参数k和β设为9和20,S3ME的加权参数β和系数平衡参数λ设为5和20。LDA低维嵌入维数为c-1,c为类别数,其余算法嵌入维数为30。
为探究本算法中类内、类间近邻点数目intraK和interK对总体分类精度的影响,从数据集中每类选取80个标记样本、400个无标记样本进行训练,其余作为测试样本。在实验中,在PaviaU数据集中intraK和interK参数区间设置为{5,10,...,50},在Urban中设为{3,5,...,25},且α=β=0.5,uK=60。图5为SSMGE算法在不同类内、类间近邻点数下的分类结果。
由图5可知,分类精度随类内近邻点数的增加先有所提升后下降,这是由于随着类内近邻点增加可更有效的表征高光谱数据结构,有利于鉴别特征提取,但是近邻点过多,会导致相似度低的数据点引入构建类内图,导致不能有效表征同类数据间本征结构;而类间点增加有利于表征不同类数据之间区别,但是过多类间点会导致计算复杂度增加。根据图5中的实验结果,将PaviaU,Urban数据集上(intraK,interK)分别设置为(25, 20)和(11, 7)。
为探究平衡参数α和β对结果的影响,继续下一步实验,其它参数不变,在两数据集中将α和β均设置为{0,0.01,0.1,0.2,...,0.9,1}。图6为不同α,β参数值下的分类结果。
由图6可知,本文提出的多图协同表征方法的分类性能均优于普通图/超图此类单一图嵌入方法,这表明简单图和超图具有互补性,有益于高光谱数据复杂结构表征。同时,本文方法在取得较好分类性能时,α往往要大于β,这说明超图模型在提取鉴别特征时更为重要。依据图6 中实验结果,本文在PaviaU,Urban数据集上将平衡参数(α,β)分别设定为(0.7, 0.7)和(0.3, 0.4)。
图5 SSMGE在不同intraK和interK参数下的OAFig.5 OAs of SSMGE with different values of parameters intraK and interK on PaviaU and Urban data sets
图6 SSMGE在不同α和β参数下的OAFig.6 OAs of SSMGE with different values of parametersαandβon PaviaU and Urban data sets
为探究无标记样本的近邻点和远离点数对实验的影响,随机选取无标记训练样本400个。为简化实验过程,在此将无标记样本的近邻点与远离点均设置为uK,其在两个高光谱数据集上调试范围为{20,40,...,200,250,300},具体分类结果如图7所示。同时,为分析无标记样本数量对分类性能的影响,设置无标记样本数为{50,100,200,400,...,4 000}进行测试,其分类结果如图8所示。
由图7可知,OA和kappa随无标记样本近邻点数和远离点数的增加先有所提升后开始下降,这是由于利用适量的无标记样本的近邻点和远离点可更有效表征数据间的本征结构。由图8可知,无标记样本的增加可它提供更多信息,有利于特征提取,分类精度也随之增加,但是过多无标记样本不仅会存在冗余信息,且会增加计算复杂度。因此,选择合适的其近邻点、远离点数和无标记样本数可以在分类精度和计算复杂度之间取得平衡。基于图7和8的实验结果,在PaviaU和Urban数据集上uK分别设置为120和140,无标签样本数分别设置为600和800。
图7 SSMGE在不同uK参数下的OAFig.7 OAs of SSMGE with different values of parameters unK on PaviaU and Urban data sets
图8 SSMGE在不同无标记样本数下的OAFig.8 OAs of SSMGE with different numbers of unlabeled samples on PaviaU and Urban data sets
3.3 PaviaU实验结果与分析
在实验中,从PaviaU数据集中每类随机选取5,10,20,40,60,80个有标记样本和600个无标记样本作为训练集,剩余样本作为测试集。采用1-NN分类器进行分类,每次实验重复10次。表1表示不同维数约简方法算法的分类结果。
由表1可知,各算法的分类精度随训练样本数的增加而增加,是由于训练样本数增加,其中的信息就越丰富,越利于特征提取,可改善分类效果。在标记样本较少的情况下,LDA,LGSFA,DHLP监督方法由于过拟合导致分类精度较低,但随着标记样本的增多逐渐表现出其优势,而半监督算法S3ME利用无标记样本解决标记样本不足的问题,利用半监督图有效表征数据的内部结构,获得较好的分类效果。本文提出的SSMGE算法基于多图协同表征的思想,通过充分利用有标记和无标记样本构建简单图和超图,实现高光谱数据中复杂结构表征。该方法不仅解决DHLP算法在标记样本较少时情况下超图模型构建不准确问题,同时比S3ME方法中单一图模型更有效表示数据中多元结构关系,其低维嵌入特征可分性更好,可获得更优的分类精度。
表1 不同算法在PaviaU数据集上的分类结果(总体分类准确度±标准差(%) (kappa系数))
Tab.1 Classification results with different numbers of training samples on the PaviaU data set(OA ± std (%) (KC))
算法1020406080RAW64.30±5.26(0.558)67.27±1.90(0.592)71.21±1.78(0.637)73.60±1.57(0.664)75.55±0.74(0.688)PCA64.30±5.56(0.558)67.27±2.00(0.592)71.22±1.89(0.637)73.56±1.66(0.664)75.54±0.81(0.688)LDA29.51±5.12(0.171)59.48±2.03(0.493)71.19±1.61(0.634)74.63±1.62(0.675)78.37±0.78(0.721)MFA67.66±3.64(0.598)71.76±2.03(0.645)75.25±2.84(0.686)76.58±2.92(0.702)78.08±1.83(0.719)LGSFA52.17±5.29(0.419)64.58±3.58(0.556)70.71±3.11(0.630)75.45±1.63(0.686)78.72±1.44(0.725)DHLP63.52±2.99(0.544)64.02±2.69(0.551)69.53±2.12(0.616)74.32±1.74(0.673)78.34±0.98(0.721)S3ME67.28±3.29(0.592)73.46±3.22(0.664)78.49±2.33(0.725)82.58±1.33(0.775)83.74±1.06(0.789)SSMGE68.46±2.89(0.607)75.08±2.32(0.684)80.64±1.74(0.752)83.61±1.04(0.788)85.42±0.95(0.810)
为探索各算法在各类地物上的分类性能,从PaviaU数据集中每类随机选取80个的标记样本、600个的无标记样本作为训练集,剩余样本作为测试集。表2为各类算法采用1-NN分类器测试各类样本的结果,包含总体分类精度、平均分类精度、kappa系数和降维时间(DR Time),图9为各算法在整个数据集上的分类结果图。
由表2可知,SSMGE在大多数地物类别中都具有较好的分类效果,具有最好的OA,AA和kappa系数。相比于S3ME算法,本文方法在训练时间上具有明显的优势,这是由于S3ME采用稀疏表示的方法表征数据之间联系,计算复杂较高。在图9中,本文方法在“Meadows”,“Bitumen”,“Bricks” 等地物中分类效果较好,错分点少,这是由于多图结构更能协同表征出数据的本征属性,去除冗余信息,提取出更有利于区分不同地物的鉴别特征,有利于分类。
表2 各类算法对PaviaU数据集每类地物的分类结果
图9 各类算法在PaviaU数据集上降维后的分类结果图Fig.9 Classification maps of different DR methods with 1-NN for the PaviaU data set
3.4 Urban实验结果与分析
从Urban数据集中每类地物随机选取10,20,40,60,80个有标记样本和800个无标记样本作为训练集,剩余样本作为测试集进行实验,表3为各维数简约算法在不同标记样本下采用1-NN分类器进行分类的实验结果。
表3 不同算法在Urban数据集上的分类结果(总体分类准确度±标准差(%)(kappa系数))
Tab.3 Classification results with different numbers of training samples on the Urban data set(OA ± std (%) (KC))
算法1020406080RAW69.92±3.68(0.547)71.84±2.93(0.571)73.36±2.20(0.592)75.20±1.61(0.616)75.69±0.98(0.623)PCA69.92±3.86(0.547)71.84±3.09(0.571)73.37±2.31(0.592)75.18±1.68(0.615)75.69±1.04(0.623)LDA67.03±4.14(0.513)57.77±3.32(0.397)66.67±3.34(0.507)76.29±2.07(0.633)78.18±1.31(0.660)MFA73.16±2.65(0.592)74.48±2.65(0.609)75.79±1.37(0.628)76.54±2.16(0.637)77.09±1.39(0.645)LGSFA65.40±5.21(0.500)74.95±1.74(0.612)76.48±1.87(0.637)78.36±2.31(0.662)78.65±1.00(0.666)DHLP73.14±2.87(0.592)74.91±1.20(0.616)75.16±2.39(0.619)77.51±3.14(0.650)77.45±1.09(0.650)S3ME73.49±3.20(0.594)76.73±2.12(0.639)76.36±2.39(0.636)78.36±2.81(0.664)79.04±1.29(0.673)SSMGE74.14±2.90(0.606)77.16±1.92(0.645)78.09±1.37(0.659)79.38±2.30(0.678)80.07±0.81(0.687)
由表3可知,MFA,LGSFA,DHLP等图嵌入算法要明显优于PCA,LDA等传统算法,说明图嵌入能更有效表征数据的几何结构;半监督图嵌入算法S3ME,SSMGE优于其他监督算法,这是由于半监督方法可充分利用标记样本和无标记样本间的信息,提升了地物分类性能;本文SSMGE方法在各种训练条件下分类结果均优于其他方法,这是由于其通过融合普通图和超图中的有用信息,从而可更充分表征高光谱数据的复杂结构关系,并增强同类数据的聚集性和不同类数据的远离性,改善特征提取效果,提升地物分类精度。
为进一步研究各算法对各类地物的特征提取性能,从Urban数据集每类中随机选取80个有标记样本和800个无标记样本作为训练样本,其余作为测试样本。表4为不同算法在每类地物上维数约简后采用1-NN分类器分类的结果,包含OA,AA,Kappa和降维时间,图10为各种算法在整个Urban数据集上分类结果图。由表4可知,相对其他算法,SSMGE在该数据集大部分类别地物上都均能获取更好的分类效果,且在图10中“Grass”,“Concrete”等地物具有较为光滑的分类结果,错分点少,表明多图协同嵌入方法比单图嵌入方法更能表征数据的内部结构,提取出更有利于提高分类效果的低维嵌入特征。
表4 各类算法对Urban数据集每类地物的分类结果
图10 各类算法在Urban数据集上降维后的分类结果图Fig.10 Classification maps of different DR methods with 1-NN for the Urban data set
4 结 论
针对普通图或超图嵌入高光谱数据过程中表达形式单一,并为解决较少标记样本下特征提取问题,本文提出一种结合图和超图联合表征的半监督多图嵌入(SSMGE)维数简约方法,以提取低维鉴别特征。该方法通过标记样本的近邻点构建类内图、类间图和类内超图、类间超图,以多图协同表征的形式挖掘高光谱影像中的数据关系,同时通过无标记样本的近邻点与远离点构建无监督本征超图和无监督惩罚超图,增加更多有利于分类的鉴别信息,同时加强超图结构在整个数据集中的结构关系。在低维嵌入空间中,加强数据的类内结构和本征结构,远离数据的类间结构和惩罚结构,以实现特征提取。在PaviaU和Urban高光谱数据集上的实验表明,相比于其他对比方法,SSMGE的总体分类精度分别可达到85.92%和79.74%,说明本文提出的SSMGE方法相比于单图嵌入方法能明显提升地物分类性能,有利于实际应用。由于本文方法仅利用高光谱数据的光谱信息,下一步工作将利用空间信息构建空-谱超图,进一步提升分类性能。