APP下载

加权空-谱自适应近邻聚类的高光谱图像分类

2018-01-09王标标张峰干贾维敏

关键词:光谱聚类精度

何 芳, 王标标, 张峰干, 郭 帅, 贾维敏

(1.火箭军工程大学 核工程学院,陕西 西安 710025; 2.96862部队,河南 洛阳 471003)

加权空-谱自适应近邻聚类的高光谱图像分类

何 芳1, 王标标2, 张峰干1, 郭 帅1, 贾维敏1

(1.火箭军工程大学 核工程学院,陕西 西安 710025; 2.96862部队,河南 洛阳 471003)

高光谱图像聚类算法可以对海量的高光谱图像数据进行信息提取,完成地物类别的初步分类。自适应近邻聚类(clustering with adaptive neighbors,CAN)作为一种新型的聚类算法,利用样本间的局部连通性实现聚类,聚类效果较好,但是该算法的性能受样本间相关性的影响较大。基于此,文章提出了一种新的融合高光谱图像的空间信息和光谱信息的分类方法,即加权空-谱自适应近邻聚类(weighted spatial and spectral clustering with adaptive neighbors,WSS-CAN)法,该方法通过引入样本点的近邻窗口尺度和光谱因子2个参数对高光谱图像进行重构,增强了样本间的相关性,对重构后的图像进行CAN聚类,有效提高了分类精度。在Indian Pines和Salinas-A数据库上的实验结果表明,由WSS-CAN得到的总体精度分别为56.33%、77.90%,分别比其他聚类算法提升了11.52%~18.47%、10.1%~14.79%,聚类效果较好。

聚类算法;自适应近邻聚类;空间信息;光谱信息;加权空-谱自适应近邻聚类;高光谱图像分类

高光谱图像将传统的空间维与光谱维信息融合为一体,具有“图谱合一”的特点,广泛地应用于军事侦察、环境监测、地质勘查、精细农业、大气遥感、水文学等领域[1-2]。高光谱图像[3]是由成像光谱仪获取的遥感图像,将传统的空间维与光谱维信息融合为一体。高光谱遥感技术从可见光到热红外波段的范围内采集大量的、狭窄的光谱影像数据[4],其较高的光谱维数和光谱分辨率为地物精细分类带来了良好的机遇[5],然而,海量的高光谱图像数据也给寻找有用的地物信息带来了巨大的阻碍[6]。聚类算法是图像分割中的经典算法之一[7],采用合适的聚类分析方法可以从海量的高光谱图像数据中找到有价值的信息,从而完成地物类别的初步分类。

高光谱图像具有同类地物的光谱特征相同或相近、不同类地物的光谱特征差异较大的特点,高光谱图像聚类算法根据这一特点可以实现对高光谱图像的像元进行准确地分类[8]。

K-means作为经典的聚类算法,通过不断移动各类中心使每一类样本的类内距离最小,具有高效、简单的特点,但该算法的聚类性能与初始聚类中心的选取有关。谱聚类算法基于相似图构建Laplacian 矩阵,通过Laplacian 矩阵将样本点映射到较低维空间后再进行K-means聚类,引入图论的方法能取得较好的聚类效果,但是谱聚类算法的性能易受相似图构建的影响[9]。文献[10]提出自适应近邻聚类(clustering with adaptive neighbors,CAN)方法,将2点之间的距离越小成为同一类的概率越大作为先验知识。基于样本间的局部连通性自适应地为样本分配最佳近邻,得到相似矩阵。对Laplacian矩阵增加秩约束条件使样本的连通分量刚好等于样本类别数,并且每一个连通分量对应一类样本,聚类效果更好,稳定性更高。但是,CAN算法的性能在很大程度上依赖于构造自适应近邻图的样本的数量和相关性,样本的数量越多,样本间的相关性越大,聚类效果越好。基于此,本文提出一种新的聚类方法,即加权空-谱自适应近邻聚类(weighted spatial and spectral clustering with adaptive neighbors,

WSS-CAN)法,该方法首先利用高光谱图像的物理特性,通过引入近邻窗口和光谱因子2个参数对高光谱图像进行重构,使同类像元之间的相似性和异类像元之间的差异性增强,增大了样本间的相关性;然后根据样本间的局部连通性为重构后的数据自适应地分配最佳近邻,有利于提高高光谱图像的分类精度。

1 加权空-谱重构算法

加权空-谱算法可以对高光谱图像进行平滑处理,减小奇异点的干扰。其原理为:在高光谱图像中样本点xi的像素坐标为(pi,qi),则像元xi的近邻空间为:

N(xi)={x(p,q)},
p∈[pi-a,pi+a],q∈[qi-a,qi+a]

(1)

其中,a=(w-1)/2,w表示xi的近邻窗口的宽度即尺度,通常取为奇数。近邻空间N(xi)中的像素点为xi,xi1,xi2,…,xis,则xi近邻点的个数为s=w2-1。

采用如下规则对像素点xi进行重构,得到的重构像素点为:

其中,近邻空间N(vi)中任一像元vik到中心像元xi的权重为νk=exp{-γ0‖xi-xik‖2},参数γ0为光谱因子,通过对近邻空间中与中心像元差异较大的点赋予较小的权重而降低奇异点的干扰,实现对高光谱图像的平滑处理[11]。

近邻窗口尺度w可以调节近邻空间的大小,光谱因子γ0可以调整像元间的相互影响程度。因此,参数w和γ0的选取直接影响高光谱图像处理的结果,本文通过实验分析的方法进行选取。不同情况下像元xij的近邻空间如图1所示。

图1 不同情况下像元xij的近邻空间

采用图1方法预处理位于图像边缘或角落的像元。图1中,高光谱图像中的每一个像元用一个正方形格子表示,浅灰色格子为中心像元,深灰色格子为填补方式。对于位于四周的像素点,直接取最上、最下一行和最左、最右一列的像素补充,4个角的像素分别取与其近邻的3个像素的平均值进行填补。

2 基于CAN的高光谱图像分类

现有的聚类方法多数是基于输入数据的相似矩阵来实现聚类的,聚类性能在很大程度上依赖于相似矩阵的学习。

在聚类过程中,利用样本间的局部连通性往往能得到较好的聚类效果[10]。CAN算法以概率论上的近邻为基础,能有效利用样本间的局部连通性,自适应地为样本分配最佳近邻。该方法对Laplacian矩阵增加秩约束条件,使样本的连通分量刚好等于样本类别数,并且每一个连通分量对应一类样本。

其中,l为所有元素为1的列向量,而(3)式存在平凡解,即与xi最近的点与它成为近邻的概率为1,而其他点都不是xi的近邻。

其中,γ为正则化参数,利用(4)式为每一个样本点xi分配近邻,即

由于相似矩阵S是半正定矩阵,则对应的Laplacian矩阵LS特征值为0的重数k等于图论中相似矩阵S的连通分量的个数[9]。因此当rank(LS)=n-k时,可以使近邻分配成为一个自适应的过程,得到的连通分量刚好为k个,且每一个连通分量对应一类样本,而不需要进行K-means聚类或者其他的离散化聚类算法。因此,最终的目标函数为:

rank(LS)=n-c

(6)

3 基于WSS-CAN的高光谱图像分类

输入:高光谱图像数据X={x1,…,xn}T,X∈Rn×d,类别数k,参数γ以及λ,尺度参数w,光谱因子γ0。

输出:高光谱图像分类精度评价指标。

(1) 根据(1)式选取数据集X的近邻空间,得到所有样本的近邻空间。

4 实验验证与结果分析

(1) 实验数据选择。本文选择具有代表性的Indian Pines[12]和Salinas-A[13]图像数据库用于验证本文所提算法的有效性。

Indian Pines图像数据库是1992年6月由 AVIRIS 传感器在美国印第安纳州的一块印度松树测试地获取的,如图2所示。

该图像由145×145个像元组成,去除水的吸收及噪声剩下200个波段用作实验。每个波段图像上含有16类不同类型作物的像元,共 10 249个样本点。图2a为选取Indian Pines的第50、27、17波段合成的RGB图像,图2b为其地面真实数据及相应的图例。

Salinas-A图像数据库是Salinas图像的一部分,Salinas图像数据是在加利福利亚萨利纳斯山谷由AVIRIS传感器获得的[14],如图3所示。该图像包括83×86个像素点,224个波段,去除20个被污染的波段,剩余204个波段用于实验分析,每个波段包含5 348个样本点,6类地物。

图3a为选取Salinas-A的第16、130、200波段合成的RGB图像,图3b为地面真实数据及相应的图例。

图3 Salinas-A图像示意图

(2) 基于Indian Pines的高光谱图像分类。WSS-CAN的2个主要参数为近邻窗口尺度w和光谱因子γ0。本文通过实验分析不同的w和γ0对实验结果的影响,从中选取最佳的参数。不同的近邻窗口尺度w和光谱因子γ0对分类精度的影响如图4所示。

图4 在Indian Pines数据库上不同参数对分类精度的影响

当分析w对分类精度的影响时,γ0设置为1.0;同样地,分析γ0时,w设置为3。由图4可知,在Indian Pines数据库上的最佳参数设置为w=3,γ0=1.0。

为比较各个算法的性能,将4种聚类算法应用于高光谱图像分类中并计算分类精度评价指标。在IndianPines数据库上由不同算法得到的各类地物的分类精度,平均精度AA,总体精度OA和kappa系数见表1所列。由表1可知,WSS-CAN算法的分类性能明显优于其他算法,由WSS-CAN算法得到的OA达到了56.63%,kappa系数达到了0.469 2,分别比K均值算法提高了18.47%,达到了0.144 7。这是由于WSS-CAN算法有效融合高光谱图像的空间信息和光谱信息对高光谱图像的像素进行重构,使重构后的像素点类内相似性和类间差异性变大,增强了图像的可分性;采用实验分析的方法选取了最佳的近邻窗口尺度和光谱因子,有效地提高了分类精度;根据样本的局部连通性,自适应地为样本分配最佳近邻,聚类效果更好,稳定性更高。

高光谱图像存在“同物异谱”和“同谱异物”的特点,给地物的分类识别带来了一系列的问题,而本文提出的算法是一种无监督的分类方法,并不能有效解决上述问题,因此对于有些地物的识别精度甚至可能是0。从图2中可以看出苜蓿草、燕麦、石钢塔的样本个数都小于100,而所有样本的个数是10 249,但是CAN算法和WSS-CAN算法的聚类性能与构造自适应近邻图的样本的个数有关,因此对于小样本取得的聚类结果并不理想,表1中对C10、C12、C15等的分类效果并不是很好。

表1 Indian Pines数据库上各类地物在不同算法下的分类精度 %

4.3 基于Salinas-A数据库的高光谱图像分类

采用与IndianPines相同的参数检验方法,得到在Salinas-A数据库上的最佳参数取值为:w=5,γ0=1.0。各算法的分类结果见表2所列。由表2可知,由本文方法得到的OA达到了77.90%,kappa系数达到了0.721 6,分别较K均值算法提高了11%,kappa系数达到了0.112 7,再次证明了本文算法的实用性和有效性。

表2 Salinas-A数据库上各类地物在不同算法下的分类精度 %

从表1、表2可以看出,本文用到的几种算法对各类地物的分类精度的波动较大,这是由于高光谱图像中每一个像元点对应一条连续的光谱曲线,反映了其对应地物的光谱属性,不同地物的光谱属性不同,而在分类过程中是用光谱值进行分类的,因此对不同地物的分类精度不同,波动较大。

5 结 论

本文提出了一种新的融合高光谱图像空间信息和光谱信息的聚类算法,即WSS-CAN算法。WSS-CAN算法不仅有效利用了高光谱图像的空间信息和光谱信息,而且根据样本间的局部连通性实现聚类,取得了较好的聚类效果。在IndianPines和Salinas-A数据库上的实验结果表明:本文方法显著提高了分类精度,在IndianPines数据库上,由本文方法得到的OA达到了56.33%,比其他算法提升了11.52%~18.47%,kappa系数提升了11.25%~15.57%。在Salinas-A数据库上,由本文方法得到的OA达到了77.90%,比其他算法提升了10.1%~14.79%,kappa系数提升了10.51%~19.14%。

[1] 杨可明,刘飞,孙阳阳,等.谐波分析光谱角制图高光谱影像分类[J].中国图象图形学报,2015,20(6):836-844.

[2] 陈有明,杨娟,疏浅,等.长江流域地貌、水患防治及土地潜力遥感研究 [J].合肥工业大学学报(自然科学版),2014,37(6):736-744.

[3] 杨艺,韩崇昭,韩德强.利用特征子空间评价与多分类器的高光谱图像聚类[J].西安交通大学学报,2010,44(8):21-24.

[4] JIA X,KUO B C,CRAWFORD M M.Feature mining for hyperspectral image classification [J].Proceedings of IEEE,2013,101(3): 676-697.

[5] 栾静,殷明,于立萍,等.基于Curvelet和改进区域方差的遥感图像融合[J].合肥工业大学学报(自然科学版),2015,38(9):1220-1225.

[6] 何同弟.高光谱图像的分类技术研究[D].重庆:重庆大学,2014.

[7] 张海涛,李雅男.阈值标记的分水岭彩色图像分割[J].中国图象图形学报,2015,20(12):1602-1611.

[8] 李翔.高光谱影像的聚类分析及应用[D].北京:北京交通大学,2015.

[9] 刘雅蓉,汪西莉.LUV 色彩空间中多层次化结构 Nystrm 方法的自适应谱聚类算法[J].中国图象图形学报,2012,17(4):530-536.

[10] NIE F,WANG X,HUANG H.Clustering and projected clustering with adaptive neighbors[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data mining.[S.l.]:ACM,2014: 977-986.

[11] 黄鸿,郑新磊.加权空-谱与最近邻分类器相结合的高光谱图像分类[J].光学精密工程,2016,24(4):873-881.

[12] HUANG H,LUO F L,LIU J M,et al.Dimensionality reduction of hyperspectral images based on sparse discriminant manifold embedding[J].ISPRS Journal of Photogrammetry and Remote Sensing,2015(106):42-54.

[13] ZHOU Y C,PENG J T,CHEN C L P.Dimension reduction using spatial and spectral regularized local discriminant embedding for hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(2):1082-1095.

[14] 查方兴.基于稀疏表示和空间约束的高光谱遥感图像分类方法研究[D].西安:西安电子科技大学,2014.

Hyperspectralimageclassificationusingweightedspatialandspectralclusteringwithadaptiveneighbors

HE Fang1, WANG Biaobiao2, ZHANG Fenggan1, GUO Shuai1, JIA Weimin1

(1.College of Nuclear Engineering, Rocket Force Engineering University, Xi’an 710025, China; 2.Troops No.96862, Luoyang 471003, China)

The algorithm of hyperspectral images(HSI) clustering can extract the valuable information, which can be used to classify the ground truth, from vast HSI data. Clustering with adaptive neighbors(CAN), a new clustering algorithm, performs well by using the local connectivity effectively, but the result is susceptible to the correlation of samples. In this paper, a new spatial-spectral classification method, weighted spatial and spectral clustering with adaptive neighbors(WSS-CAN) is proposed. This algorithm combines both spatial window and spectral factor to reconstruct the HSI, which strengthens the correlation of pixels. CAN is used to cluster the reconstructed data, thus increasing the classification accuracy. The benchmark tests on Indian Pines and Salinas-A demonstrate that the performance of WSS-CAN is better than that of other algorithms. The best value of overall accuracy(OA) obtained by WSS-CAN on the HSI datasets is 56.33% and 77.90% respectively, exceeding that by other algorithms 11.52%-18.47% and 10.1%-14.79%.

clustering algorithm; clustering with adaptive neighbors(CAN); spatial information; spectral information; weighted spatial and spectral clustering with adaptive neighbors(WSS-CAN); hyperspectral image classification

2016-08-01;

2016-10-08

国家自然科学基金资助项目(61401471);中国博士后科学基金资助项目(2014M562636)

何 芳(1991-),女,湖北武汉人,火箭军工程大学博士生;

贾维敏(1971-),女,河北故城人,博士,火箭军工程大学教授,博士生导师,通讯作者,E-mail:jwm602@126.com.

10.3969/j.issn.1003-5060.2017.12.005

TP751

A

1003-5060(2017)12-1604-06

(责任编辑张 镅)

猜你喜欢

光谱聚类精度
基于三维Saab变换的高光谱图像压缩方法
热连轧机组粗轧机精度控制
高光谱遥感成像技术的发展与展望
超高精度计时器——原子钟
基于K-means聚类的车-地无线通信场强研究
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法