APP下载

基于光谱特征的自适应子空间波段选择方法

2013-11-05赵慧洁李旭东

北京航空航天大学学报 2013年5期
关键词:波段光谱聚类

徐 秋 李 娜 赵慧洁 李旭东

(北京航空航天大学精密光机电一体化技术教育部重点实验室,北京100191)

较多光谱而言,高光谱数据能捕捉到地物在光谱特性上更细微的差异,并以足够高的光谱分辨率来表达不同地物所具有的诊断性光谱特征.通过分析这些特征,能够反演出地物构造的物理指标和内部化学组分的含量等[1],因此高光谱数据在地物的定量化分析方面较其他遥感数据具有较大的优势.但高光谱数据具有极强的波段相关性,图像间存在大量冗余信息,降低了数据的应用效率,甚至包括地物分类或识别的精度.因此,有效利用高光谱数据的前提,是选择合适的特征对高光谱数据进行降维处理.

波段选择作为高光谱降维的重要手段一直是研究的热点方向.现有波段选择方法一般分为[2-6]:①基于信息量的波段选择方法,如波段指数、自适应波段选择;②基于类间可分性的波段选择方法;③基于子空间划分的波段选择方法,即先对数据整体空间进行子空间划分,然后在每个子空间内依据信息量或类别可分性等进行选择.

从方法思想和最终结果来看,基于子空间划分的波段选择方法充分考虑了数据全局特性与局部特性的差异,最佳波段组合不仅合理分布且更能反映数据的局部特性,较其他两类方法在理论上更具优势.但现有的子空间划分方法要么主观判断,子空间划分较为呆板;要么统计波段中全体地物的信息,在局部细节体现上并未将感兴趣地物与背景地物分开,子空间划分容易受背景地物影响,提取的特征空间针对性不强,无法满足数据定量分析与精细化应用的较高要求.

针对这一问题,本文对现有方法进行深入分析,突破光谱特征提取技术,通过引入反映感兴趣地物局部光谱特性的指标,建立子空间划分模型.该方法减少了背景地物对子空间划分的影响,实现了针对感兴趣地物最佳波段的有效提取.

1 方法实现

本文方法从感兴趣地物的光谱曲线出发,提取任意两类地物反射率绝对值距离的最大值和最小值,并以其乘积构建光谱自适应因子(SAF,Spectral Adaptive Factor);将SAF与波段的光谱信息组成子空间划分模型,以聚类实现子空间划分;以J-M距离实现子空间波段优化,最终在整个数据空间获得最佳波段组合.

1.1 光谱自适应因子

分析高光谱数据自身特点,在某一光谱范围内,当所有地物反射率变化较小、光谱曲线较为平缓时,各波段的信息量、类间可分性等统计参数在该光谱范围内趋于一致;如果在该光谱范围内,光谱特征因地物构造的某些物理指标或内部某些化学组分含量发生剧烈变化时,相应波段的信息量或类间可分性等也会产生巨大变化,这说明利用各波段信息量或类间可分性来衡量地物光谱特征的细微变化是可行的.当在地物诊断性特征波段上光谱发生巨大变化时,地物类别可分性增大或减小都存在一定可能,因此将类别最大可分性和最小可分性两个指标结合使用,既可较好地表征地物光谱特征变化对地物整体类别可分性的影响,又对最难分地物的差别进行保留,而仅用两者中的任一指标表征都是不全面的.

基于以上分析,本文提出在N类感兴趣地物的光谱曲线上,建立光谱自适应因子,其公式为其中,ρik为k波段上第i类地物的反射率;ρjk为k波段上第 j类地物的反射率,且 i,j∈N,i≠j.

Smax是同一中心波长上,任两类地物光谱绝对值距离的最大值,Smax表现了感兴趣地物的最大可分性,反映了感兴趣地物光谱在波段上的总体情况,从侧面也反映了波段携带感兴趣地物信息量的大小.Smin是同一中心波长上,任两类地物光谱绝对值距离的最小值,Smin表现了感兴趣地物的最小可分性,Smin越大,感兴趣地物之间的性质相差越远,最难分地物的可分性越大;Smin越小,感兴趣地物中有两类地物的性质相近,最难分地物的可分性越小.

由SAF定义发现,其值越大,该波段包含感兴趣地物的信息越多,类别可分性越强.

1.2 子空间划分

子空间划分主要依据本征维数对模型进行聚类,自动划分子空间,即估计本征维数m,将m作为聚类的类别数C,将SAF与波段的光谱信息组成子空间划分模型,利用聚类方法将模型分为C类,每一类即为一个子空间.

在高光谱数据处理中,PCA(Principal Componet Analysis)方法是应用最为广泛的本征维数估计方法之一,主要利用数据协方差矩阵的特征值λ对本征维数进行估计.PCA方法对维数为p的高光谱数据估计本征维数m的原则主要有:①选择λm≠0的最大维数;②累计贡献率G(m)达到足够大(一般在85%以上).G(m)公式为

图1是基于ENVI 4.4usgs_veg.sli地物数据库中3类地物(草、金花矮灌木、干草)的子空间划分,光谱范围为0.4~2.5 μm,本征维数m为3.运用系统聚类方法将数据分为0.4~0.87 μm,0.87 ~1.66 μm,1.66 ~2.5 μm 3 个子空间.

图1 3类地物子空间划分示意图

1.3 子空间波段优化

高光谱遥感中,地物反射率受光照、成像光谱仪、遥感平台、地物背景等各种因素影响,即使属于同一种地物,在相同波长下各像元的光谱响应也略有差异.在进行波段选择时,不能把子空间内SAF取值最大作为选择最佳波段的唯一标准,还要考虑地物样本的可分性.高光谱波段优化常用的类间可分性准则包括归一化均值距离、离散度、J-M距离等[7].归一化均值距离的定义是均值之差的绝对值除以标准差之和,它只能运用在一维空间中,不能运用于多维空间.当类均值相等时,无论标准差如何变化,归一化均值距离均为0,无法体现类别可分性的大小.

离散度、J-M距离都是基于类条件概率之差的.与归一化均值距离仅考虑一阶统计变量(平均值)相比,离散度、J-M距离进一步考虑了二阶统计变量(协方差)给分类带来的影响,克服了类均值相等给类别划分带来的不便.在离散度的定义中,归一化距离起主要作用,而在J-M距离的定义中却极大地降低了对一阶统计变量的依赖;从类别距离与分类精度的关系考虑,离散度近乎指数上升,而J-M距离增加到一定程度就不再增加,收敛于某一数值,这与地物分类精度收敛于100%性质一致.J-M距离比离散度更能较好地体现类别距离与分类精度的实际关系,因此在算法中选用J-M距离作为子空间类间可分性准则,其公式为

其中,α为巴氏(Bhattacharyya)距离.

在每个子空间内计算每个波段地物平均J-M距离,并从大到小排序,选择距离最大的波段作为子空间的最佳波段;将子空间的最佳波段最终组合为整个空间的最佳波段组合.

2 试验与结果分析

2.1 试验结果

试验数据由AOTF(Acousto-Optic Tunable Filter)成像光谱仪拍摄而成,包含A,B,C 3类地物(图2),波谱范围571~902 nm.其中171~180波段(757~775 nm)受氧气吸收影响反射率偏低,不予采用.最终待选波段为1~170波段(571~757 nm)和181~244波段(775~902 nm)共234个波段.基于PCA变换后特征值排列情况,研究区的本征维数m为3.

图2 研究区假彩色影像及空间关系示意图

提取3类地物的光谱曲线(图3)建立子空间划分模型(图4),选择系统聚类法划分子空间.对n个样本,系统聚类的基本思想是规定样品之间的距离和类与类之间的距离,在聚类开始时将n个样本各自作为一类,然后将距离最近的两类合并成一个新类,计算新类与其他类之间的距离,重复进行最近类的合并,直到最后所有样本合并为一类并形成一个聚类树形图,从图上能看出应分为几类及每类包含的样本.在系统聚类中,选择Euclidean距离、质心距离分别表示样本之间和类与类之间的距离,聚类后234个波段分为3组:1~145波段、146~215(除去171~180)波段及216~244波段.在3组波段中,依据3类地物平均J-M距离选择720 nm,800 nm,894 nm 3波段为最佳波段组合.

图3 3类地物光谱曲线

图4 3类地物的子空间划分

为验证方法性能,选择基于类间可分性最佳波段选择和波段指数(BI,Band Index)两种方法,对最佳波段组合进行对比,3种方法波段选择的最终结果如表1所示.

表1 3种方法的最佳波段组 nm

2.2 主观评价

图5为3组最佳波段组合的融合图像.从视觉效果比较,在基于本文方法的融合图像上,A,B,C 3类地物对比强烈,可分性最好.

图5 3组最佳波段组合融合图像比较

2.3 客观评价

为进一步定量对比,在图像上随机采样,各地物样本采样个数如表2所示.以地物J-M距离为衡量标准,进行样本可分性评价.Jij取值在(0,2)之间.Jij在(0,1)时,样本间不具有光谱可分性;Jij在(1.0,1.9)时,样本间具有一定的光谱可分性,但存在较大程度的重叠;Jij在(1.9,2.0)时,样本间具有很好的光谱可分性[8].

表2 3类地物样本个数

表3分别列出在3组最佳波段组合中,任意两类地物纯样本之间、边缘样本之间以及3类地物平均J-M距离的大小.试验结果表明:3种方法纯样本之间的J-M距离都在1.9以上,样本间具有光谱可分性;在边缘样本分类中,A和B,B和C的J-M距离在1.9以上,样本间具有光谱可分性;但光谱相似的A,C两类,3种方法边缘样本之间的J-M距离均小于0.5,表明样本间不具有光谱可分性.从3类地物的平均J-M距离比较,本文方法3类地物的平均J-M距离略高于另外2种方法,样本可分性最大,地物重叠程度最小.

表3 3组最佳波段子集J-M距离

采用最大似然法[9]对 720 nm,800 nm,894 nm 3波段组合进行地物分类.最大似然法假定每个波段的每一类统计都呈均匀分布,计算像元属于某一特定类别的似然度,每个像元被归并到似然度最大的那一类中.地物分类的混淆矩阵见表4,地物分类结果见图6.

表4 3波段分类后的混淆矩阵

图6 maximum likelihood分类图

总体分类精度:

(7920+300+1258)/9788×100%=96.832%Kappa系数为0.894.

错分原因:①分类精度受测试者主观因素影响.训练样本随机采样,不同测试者会选取不同的样本,样本的分布情况会影响分类效果;②边缘样本间相互干扰,分类纯度不高,导致精度降低.

3 结论

针对现有波段选择方法存在问题,本文通过引入反映感兴趣地物局部光谱特性的指标,建立子空间划分模型,提出一种基于光谱特征的自适应子空间波段选择方法.利用AOTF高光谱数据对方法性能进行分析与验证,结果表明:本文方法具有较强的有效性和实用性.

References)

[1]童庆禧,张兵,郑兰芬.高光谱遥感——原理、技术与应用[M].北京:高等教育出版社,2006:1-3 Tong Qingxi,Zhang Bing,Zheng Lanfen.Hyperspectral remote sensing:the principle,technology and application[M].Beijing:Higher Education Press,2006:1-3(in Chinese)

[2]韩瑞梅,杨敏华.一种改进的高光谱遥感数据波段选择方法的研究[J].测绘与空间地理信息,2010,33(3):137-139 Han Ruimei,Yang Minhua.Study on an improved method of band selection of hyperspectral remote sensing data[J].Geomatics & Spatial Information Technology,2010,33(3):137-139(in Chinese)

[3]苏红军,盛业华.基于正交投影散度的高光谱遥感波段选择算法研究[J].光谱学与光谱分析,2011,31(5):1309-1313 Su Hongjun,Sheng Yehua.Orthogonal projection divergence based hyperspectral band selection[J].Spectroscopy and Spectral Analysis,2011,31(5):1309-1313(in Chinese)

[4] Huang Rui,He Mingyi.Band selection based on feature weighting for classification of hyperspectral data[J].IEEE Geoscience and Remote Sensing Letter,2005,2(2):156-159

[5] Bajcsy P,Groves P.Methodology for hyperspectral band selection[J].Photogrammetric Engineering and Remote Sensing Journal,2004,70(7):793-802

[6]刘春红.超光谱遥感图像降维及分类方法研究[D].哈尔滨:哈尔滨工程大学信息与通信学院,2005 Liu Chunhong.Research on dimensional reduction and classification of hyperspectral remote sensing image[D].Harbin:College of Signal and Information Processing,Harbin Engineering University,2005(in Chinese)

[7]张良培,张立福.高光谱遥感[M].北京:测绘出版社,2011:83-87 Zhang Liangpei,Zhang Lifu.Hyperspectral remote sensing[M].Beijing:Surveying and Mapping Press,2011:83-87(in Chinese)

[8]齐腊,刘良云,赵春江,等.基于遥感影像时间序列的冬小麦种植监测最佳时相选择研究[J].遥感技术与应用,2008,23(2):154-160 Qi La,Liu Liangyun,Zhao Chunjiang,et al.Selection of optimum periods for extracting winter wheat based on multi-temporal remote sensing images[J].Remote Sensing Technology and Application,2008,23(2):154-160(in Chinese)

[9]孙丽娟.基于支持向量机的高光谱图像分类技术研究[D].哈尔滨:哈尔滨工程大学信息与通信学院,2011 Sun Lijuan.Research on classification of hyperspectral images based on support vector machine[D].Harbin:College of Signal and Information Processing,Harbin Engineering University,2011(in Chinese)

猜你喜欢

波段光谱聚类
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
高光谱遥感成像技术的发展与展望
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
雷达点元聚类算法性能的比较与分析