APP下载

空间-光谱约束的图半监督高光谱影像分类算法

2016-07-18何浩沈永林刘修国马丽

自然资源遥感 2016年3期
关键词:光谱空间

何浩, 沈永林, 刘修国, 马丽

(1.中国地质大学(武汉)信息工程学院,武汉 430074; 2.中国地质大学(武汉)机械与电子信息学院,武汉 430074; 3.新疆大学建筑工程学院,乌鲁木齐 830047)



空间-光谱约束的图半监督高光谱影像分类算法

何浩1,3, 沈永林1, 刘修国1, 马丽2

(1.中国地质大学(武汉)信息工程学院,武汉430074; 2.中国地质大学(武汉)机械与电子信息学院,武汉430074; 3.新疆大学建筑工程学院,乌鲁木齐830047)

摘要:高光谱影像数据的类标签样本获取困难,而在少量标签点情况下的分类精度通常不理想。为此,提出了一种改进的空间-光谱约束的图半监督分类算法(spatial-spectral constrained graph-based semi-supervised classification,SS-GSSC)。首先,以欧氏距离结合RBF(radial basis function)核函数确定空间相似性权值; 采用光谱相关角(spectral correlation angle,SCA)计算光谱相似性权值; 然后,将2种权值以乘积的形式进行组合,对相似性测度进行约束; 最后,利用标签传递算法对测试数据进行标签预测,获得分类结果。通过分别对Indian Pines影像和DC Sub影像进行分类实验的结果表明,该算法较之以往的分类算法,能更好地消除同类地物图斑中夹杂异类地物散点的现象,在少量标签点(每类25个)情况下,取得了较高的分类精度。

关键词:半监督分类; 图; 空间-光谱; 高光谱遥感

0引言

高光谱遥感影像分类一直是高光谱遥感领域较为热门的研究方向,从传统的监督分类、非监督分类,到近年来兴起的半监督分类,国内外研究人员已发展了多种分类算法。然而,多数算法仅利用光谱相似性测度进行分类,对地物的空间信息利用不足。针对此问题,国内外学者进行了大量的相关研究,提出了多种空间-光谱分类算法[1]。在引入空间信息辅助分类时,通常利用影像的纹理、形状等特征作为辅助信息。赵银娣等[2]提出了一种适用于多光谱纹理影像分类的广义马尔可夫随机场模型,该算法提高了纹理影像的分类精度; 黄昕等[3]提出了一种像元形状指数及基于形状与光谱特征融合的高空间分辨率遥感影像分类算法,该算法计算简便且能有效表达高分辨率影像的地物特征; Xia等[4]利用4种特征提取方法,结合旋转森林进行特征提取,再采用空间上下文信息、先验马尔可夫场等方法进行高光谱影像分类,显著提高了分类精度; Wang等[5]提出了一种新的基于空间-光谱标签传递分类算法用于高光谱图像的半监督分类; Ji等[6]采用构建超图结构形式将像元光谱特征与空间约束相结合,进行高光谱图像分类; Ghamisi等[7]提出了一种基于隐马尔可夫随机场分割和支持向量机(support vector machine,SVM)相结合的分类算法; Li等[8]提出了一种非局部联合协同表示分类算法与局部自适应字典相结合的高光谱图像分类算法。这些算法在标签数量较多的情况下具有很高的分类精度,但同时也都具有计算较复杂的问题; 当标签数量少、无标记样本数量庞大时,分类精度通常不理想。分类结果也常伴随着同类地物图斑中夹杂其他类别地物散点的现象。

本文在图半监督分类方法的基础上,顾及空间信息约束,提出一种改进的空间-光谱约束的图半监督分类算法(spatial-spectral constrained graph-based semi-supervised classification,SS-GSSC)。该算法基于2点假设[6]: ①具有相似光谱特征值的像元点可能具有相同的类别标签; ②空间邻近的像元点可能具有相同的类别标签。算法采用乘积的方式组合空间信息与光谱信息的权值,从而扩大像元点之间的相似性差异。能够在少量标签情况下,取得较高的分类精度。同时,也在一定程度上解决了同类地物图斑中夹杂其他类别地物散点的问题。

1空间-光谱约束的图半监督分类算法

传统的分类方法大体可分为监督分类和非监督分类。监督分类常利用有类别标签的训练样本数据训练获得一个分类器,对无标签的测试数据进行标签预测; 而非监督分类则是直接对没有类别标签的数据,利用数据的聚类特性进行分类; 近年来在模式识别领域兴起的半监督分类算法,同时利用了少量标签数据的类别信息和无标签数据中的隐含信息,对小样本分类具有一定的优势。基于图的半监督分类(graph-based semi-supervised classification,GSSC)[9]最大的特点就是用图来表示数据之间的关系。

综合考虑高光谱影像中目标像元与邻近相似像元在空间和光谱上的关系,将2种相似性测度组合定权,改进图半监督分类算法。该算法包括: 相似性测度选择、组合和标签传递计算。

1.1空间相似性测度

(1)

1.2光谱相似性测度

(2)

(3)

式中:n表示波段数;k为波段;r,t分别代表第i和第j个像元点的光谱值。

1.3相似性测度的组合方法

空间相似性权值和光谱相似性权值从不同的角度描述了像元点之间标签相似程度。实验了多种权值组合方法,发现采用权值相乘的方法组合定权,分类效果最好。这从理论上也很容易得到解释,如果2个像元点之间的2种相似性权值都很小或都很大,以乘积的形式组合可使这种相似性差异进一步扩大; 当2种相似性权值出现一大一小时,取乘积可使其相似性权值保持适中,从而有效地避免了光谱相似而空间距离较远的异类地物被误分为同一类地物的情况。则组合定权公式为

(4)

式中:Wij为像元i与像元j之间的组合边权值;W为对称矩阵; 为了避免像元自相似性,令Wii=0。

1.4标签传递算法

用图表示数据之间的关系,图的结点表示数据点(包括标签数据和无标签数据),点与点之间的边权值采用上述相似性测度组合方法计算获得。则预测标签值可表示为

(5)

式中: 参数α取值范围为(0,1); I为单位矩阵;

S=D-1/2WD-1/2,

(6)

其中D为对角矩阵,元素Dii为W的第i行之和;

Y*=(Yl,Yu)T={y1,y2,…,yl,yl+1,…,yl+u}T,

(7)

(8)

获得,式中C为类别数。

空间-光谱约束的图半监督分类步骤如下:

1)输入带标签的训练数据Yl和无标签的待分类数据Yu; 设置RBF核函数的带宽超参数σ和标签传递调节参数α; 设置训练数据标签个数。

3)设置标签矩阵。步骤为由Yl和Yu(无标签数据的标签值均为0)的标签构成N×C的标签矩阵Y,其中N为像元总数。

4)标签传递算法。首先,构建由训练数据和测试数据组成的全部数据的全连接图,边权值矩阵采用上述已计算出的W; 然后,利用公式(6)计算对称矩阵S; 最后,利用公式(5)计算预测标签矩阵F*,取极大值对应类别作为该像元的类别。

5)输出预测标签矩阵及分类结果图。

2实验结果及分析

2.1实验数据

为了方便比较算法的分类效果,选取了2种不同传感器的高光谱遥感影像。

1)Indian Pines数据集是AVIRIS传感器采集的数据,采集于1992年美国印第安纳州的一个农场,空间分辨率为20 m,去除水汽吸收波段,剩余200个波段。农田区域具有比较规整的几何形状,作物类别主要包括玉米和大豆,由于耕种情况和土壤湿度的不同,可以细分为多种类别。根据Landgrebe的报告[10],选择所有的16个类别进行实验。

2)Washington DC数据集为机载传感器HYDICE采集,影像由210个波段组成,波长范围400~2 400 nm,去除水汽吸收波段,剩余191个波段。实验选择了Washington DC的一个子场景,命名为DC Sub。该影像为行号655—762和列号67—177组成的108像元×111像元的影像,包含草地、树、屋顶、道路和阴影等6类地物。

实验中分别采用以光谱特征值作为相似性测度的GSSC方法和SS-GSSC方法进行对比实验。设置参数σ=10,α=0.1,标签数量选择时,每一类地物随机选择3~25个标签,例如标签数量选择为{3,5,10,15,20,25},分别测试各数据集在不同标签数量情况下的分类效果。为了避免随机选取标签带来实验结果的偶然性,对每种参数情况进行10次测试,取平均值进行分类精度评价。

2.2Indian Pines数据集的分类结果

当每类地物标签数量取25时,16类地物的分类精度及总体分类精度如表1所示。

表1 Indian Pines数据集训练与测试样本数及各类别分类精度

从表1可以看出,利用基于光谱特征的GSSC方法,分类精度较低,总体精度仅为56.20%; 加入空间信息后,采用SS-GSSC算法总体分类精度提高到了92.09%。由此可见,空间信息的参与大大提高了影像的分类效果。此外,本文算法SS-GSSC相对于传统算法GSSC能更好地区分玉米、干草、大豆、木材和大厦等地物。

2.3DC sub数据集的分类结果

在DC sub数据集中6类地物的分类精度如表2所示。

表2 DC sub数据集训练与测试样本数及各类别分类精度

分别采用GSSC算法和SS-GSSC算法进行分类的结果如图1所示。

(a) RGB假彩色合成影像 (b) 地面真实数据 (c) GSSC 分类结果

(d) SS-GSSC分类结果(e) SS-GSSC全图分类结果

图1DC Sub数据集分类结果

Fig.1Classification results of DC Sub

为了便于定量评价本文方法的分类精度,分类对象全部选择有地面真实数据的区域,如图1(b)所示。标签数量取25时,仅利用光谱特征的GSSC算法分类结果,在大块图斑中有较明显的异类散点出现,如图1(c)所示; 采用SS-GSSC算法分类,分类精度由95.57%提升到了99.62%,且消除了同类图斑中夹杂异类散点的现象,只在类别边界区域出现少量误分类点,如图1(d)所示。

进一步验证分类效果,将分类对象扩大到全图所有像元,标签数量仍取每类25个,采用SS-GSSC算法分类,总体分类效果良好,分类结果如图1(e)所示。影像右侧的小路、草地、树和建筑物等都得到了很好的区分,同类别内异类散点较少。但受标签点位置的影响,在标签点较少的区域,出现了少量误分类点。例如影像左侧的部分草地、树被误分成了道路。

2.4标签数量对分类精度影响分析

分别选取标签数量为3,5,10,15,20和25个,采用SS-GSSC算法对数据集Indian Pines进行分类,其分类结果如图2所示。

(a) RGB假彩色合成影像 (b) 地面真实数据(c) 3个标签分类结果 (d) 5个标签分类结果

图2-1 不同标签数量Indian Pines数据集分类结果

(e) 10个标签分类结果(f) 15个标签分类结果 (g) 20个标签分类结果(h) 25个标签分类结果

图2-2 不同标签数量Indian Pines数据集分类结果

从图2中可以发现,每类标签数量取3时,在地类复杂区域有明显的误分类现象,随着标签数量的增加,分类精度逐渐提高。当标签数量增加到15时,分类精度的提升较为缓慢。但整体上,采用本文算法都能不同程度地消除同类图斑中部夹杂异类散点的现象,误分类点只在区域边缘出现。

为了进一步比较本文算法的分类效果,在实验条件相同的情况下与文献[5]中提出的(spatial-spectral label propagation based on the SVM,SS-LPSVM)算法比较,SS-GSSC算法在标签数量很少时,例如标签数量取3和5时,已具有较高的分类精度; 随着标签数量的增加,该算法分类精度仍略高于SS-LPSVM算法。分类精度比较如图3所示。

图3 Indian Pines数据集分类精度比较

3结论

本文提出的空间-光谱约束的图半监督高光谱影像分类算法克服了以往基于像元光谱特征分类算法的局限性,增加了相邻像元之间的空间信息,提高了影像的分类精度,减少了同一类地物图斑中夹杂异类地物散点的情况,对高光谱影像分类具有一定的普遍适用性。

分别对Indian Pines影像和DC Sub影像进行的分类实验表明: 与传统的基于光谱特征分类算法相比,本文算法有较明显的精度提升; 在Indian Pines影像上进一步做标签数量对分类精度的影响分析,发现即使在标签数据较少的情况下,该算法仍然具有较高的分类精度; 同等实验条件下,与文献[5]中提出的SS-LPSVM算法比较,本文算法分类精度也略有提高。

但在标签数据分布非常不均匀的情况下,本文算法容易产生明显的误分类现象。这是该算法的不足之处,也将是下一步研究的重点。

参考文献(References):

[1]Fauvel M,Tarabalka Y,Benediktsson J A,et al.Advances in spectral-spatial classification of hyperspectral images[J].Proceedings of the IEEE,2013,101(3):652-675.

[2]赵银娣,张良培,李平湘.广义马尔可夫随机场及其在多光谱纹理影像分类中的应用[J].遥感学报,2006,10(1):123-129.

Zhao Y D,Zhang L P,Li P X.Universal Markov random fields and its application in multispectral textured image classification[J].Journal of Remote Sensing,2006,10(1):123-129.

[3]黄昕,张良培,李平湘.融合形状和光谱的高空间分辨率遥感影像分类[J].遥感学报,2007,11(2):193-200.

Huang X,Zhang L P,Li P X.Classification of high spatial resolution remotely sensed imagery based on the fusion of spectral and shape features[J].Journal of Remote Sensing,2007,11(2):193-200.

[4]Xia J S,Chanussot J,Du P J,et al.Spectral-spatial classification for hyperspectral data using rotation forests with local feature extraction and Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(5):2532-2546.

[5]Wang L G,Hao S Y,Wang Q M,et al.Semi-supervised classification for hyperspectral imagery based on spatial-spectral label propagation[J].ISPRS Journal of Photogrammetry and Remote Sensing,2014,97:123-137.

[6]Ji R R,Gao Y,Hong R C,et al.Spectral-spatial constraint hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(3):1811-1824.

[7]Ghamisi P,Benediktsson J A,Ulfarsson M O.Spectral-spatial classification of hyperspectral images based on hidden Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2565-2574.

[8]Li J Y,Zhang H Y,Huang Y C,et al.Hyperspectral image classification by nonlocal joint collaborative representation with a locally adaptive dictionary[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(6):3707-3719.

[9]Zhu X J.Semi-Supervised Learning with Graphs[D].Pittsburgh,Pennsylvania State:Carnegie Mellon University,2005.

[10]Landgrebe D.Multispectral Data Analysis:A Signal Theory Perspective[R].West Lafayette:School of Electrical and Computer Engineering,Purdue University,1998.

(责任编辑: 陈理)

Spatial-spectral constrained graph-based semi-supervised classification for hyperspectral image

HE Hao1,3, SHEN Yonglin1, LIU Xiuguo1, MA Li2

(1. Faculty of Information Engineering, China University of Geosciences(Wuhan), Wuhan 430074, China; 2. Faculty ofMechanicalandElectronicInformation,ChinaUniversityofGeosciences(Wuhan),Wuhan430074,China;3.FacultyofArchitectureEngineering,XinjiangUniversity,Urumqi830047,China)

Abstract:It is difficult to obtain labels of samples for hyperspectral data. Few labeled samples usually lead to low classification accuracy. In view of this situation, an improved spatial and spectral constraint graph-based semi-supervised classification algorithm (SS-GSSC) is proposed. First of all, Euclidean distance combined with radial basis function (RBF) is used to construct the spatial similarity edge weight; Spectral correlation angle (SCA) is used to calculate spectral similarity weights; Then, the two kinds of weights are combined to the form of product to restrict the similarity measurement; Finally, the label propagation algorithm is used to predict the test data labels so as to obtain the classification results. Classification experiments on Indian Pines image and DC Sub image show that, compared with the previous classification algorithm, the algorithm designed by the authors can better eliminate the phenomenon of the existence of the same category map spot included in other categories of scattered points, and can achieve higher classification accuracy under the condition of less label points (25 per class).

Keywords:semi-supervised classification; graph; spatial-spectral; hyperspectral remote sensing

doi:10.6046/gtzyyg.2016.03.06

收稿日期:2015-03-23;

修订日期:2015-05-18

基金项目:中国博士后科学基金面上项目“基于分形的玉米作物物候动态检测算法研究”(编号: 2013M542086)和中央高校新青年教师科研启动基金项目“基于结构推理的农作物多参量旱情监测方法研究”(编号: CUGL140834)共同资助。

中图法分类号:TP 79

文献标志码:A

文章编号:1001-070X(2016)03-0031-06

第一作者简介:何浩(1979-),男,博士研究生,讲师,主要从事高光谱遥感数据处理方面的研究。Email: hehao_1216@126.com。

引用格式: 何浩,沈永林,刘修国,等.空间-光谱约束的图半监督高光谱影像分类算法[J].国土资源遥感,2016,28(3):31-36.(He H,Shen Y L,Liu X G,et al.Spatial-spectral constrained graph-based semi-supervised classification for hyperspectral image[J].Remote Sensing for Land and Resources,2016,28(3):31-36.)

猜你喜欢

光谱空间
基于三维Saab变换的高光谱图像压缩方法
高光谱遥感成像技术的发展与展望
创享空间
空间是什么?
创享空间
创享空间
星载近红外高光谱CO2遥感进展
改进 C-V 分割算法在多光谱成像仪中的应用
基于GPU的高光谱遥感图像PPI并行优化
苦味酸与牛血清蛋白相互作用的光谱研究