基于子空间划分的高光谱图像波段选择方法*
2017-04-22向英杰
王 琪 杨 桄 向英杰
(空军航空大学航空航天情报系 长春 130022)
基于子空间划分的高光谱图像波段选择方法*
王 琪 杨 桄 向英杰
(空军航空大学航空航天情报系 长春 130022)
高光谱遥感图像数据具有数据量大、波段冗余度大、波段间相关性强的特点,不利于图像的判读解译。如何从上百个波段中选出最优的波段组合对目标识别和分类是需要解决的问题。论文利用自动子空间划分法,结合相关系数矩阵“分块”的特点将所有波段进行大致划分,运用自适应波段选择法和光谱角制图算法进行波段选择。首先对所有波段利用相关系数矩阵划分子空间,再在各个子空间提取指数最大的波段,最后依据地物光谱可分性选取最佳的波段组合。最终计算论文方法与常用波段选择方法所选波段的相关系数和以及均方差,验证了论文方法的优越性。
高光谱图像; 波段选择; 波段指数; 子空间划分; 自适应波段选择; 光谱角制图
Class Number TP751.1
1 引言
高光谱分辨率遥感简称高光谱遥感,它是在电磁波谱的可见光、近红外、中红外和热红外波段范围内获取上百个非常窄的连续光谱的影像数据技术,它利用这些光谱波段从感兴趣目标中获取相关数据。高光谱遥感包括丰富的光谱、空间、辐射信息,有利于对地物进行分类及目标识别。
与其他遥感成像技术相比,高光谱遥感具有波段数量多、波段宽度窄、光谱响应范围广、光谱分辨率高的特点。高光谱影像可提供空间域信息和光谱域信息,即“谱像合一”。然而,由于高光谱数据波段众多,其数据量巨大,相邻波段的相关性强,使得信息冗余度增加,造成“维数灾难”,不仅增加数据处理的运算量,还影响地物分类的精度及目标的识别。因此就需要对数据进行降维处理。
高光谱图像的降维方法主要分为特征提取和波段选择两类。特征提取[1]是建立在各光谱波段间的重新组合和优化的基础上的,通过数据变换的方式把原始数据从高维空间投影到低维并优化的空间。特征提取方法包括主成分分析法(PCA)、最小噪声分离(MNF)、小波变换(WT)、奇异值分解(SVD)。特征提取法大大缩短了降维所需的时间,但是由于对图像进行了变换导致图像原有的光谱信息被改变。另一类是波段选择[2]方法,是针对特定对象选择光谱特征空间中的一个子集,这个子集是一个简化了的光谱特征空间,但它包括了该对象的主要特征光谱,并且在一个含有多种目标对象的组合中,该子集能够最大限度地区别于其他地物。波段选择方法主要分为两类,一类是基于信息量的波段选择方法,包括最大熵法、自适应波段选择法(ABS)、最佳指数法(OIF)、自动子空间划分法(ASP)等;另一类是基于类间可分性的波段选择方法,包括光谱相关系数法、光谱的混合距离法、光谱角度制图法等。最佳指数法(OIF)选择波段的依据是:选择标准差最大并且波段间的相关系数最小的波段,其缺点是计算量过大。最大熵法没有考虑波段间的相关性问题,仅考虑了信息量的问题。自动子空间划分的方法(ASP)将高光谱全部波段信息划分为若干个子空间,再在各子空间内进行波段选择。自适应波段选择法(ABS)将各波段的标准差与波段间的相关系数的比值定义为各波段的指数,并根据指数大小排序选择波段,大大减少了计算量。
本文汲取自动子空间划分的方法(ASP)和自适应波段选择法(ABS)的优点,提出了一种波段选择方法。其基本思路是:利用自动子空间划分法,根据各波段相关系数获得具有“分块”特性波段相关系数矩阵,按相关系数大小,把全部波段划分为若干个子空间,然后在各个子空间利用自适应波段选择法进行波段选择,获得各子空间内的最大指数波段,再通过求光谱角得到最佳波段组合。对最佳波段组合得到的假彩色图像与常用方法得到的假彩色图像进行对比,验证此方法的优越性。
2 波段选择算法
2.1 自动子空间划分(Auto-Subspace Partition,ASP)
谷延锋等[3]提出了一种自动子空间划分方法。自动子空间划分法依据波段的相关系数矩阵和邻近波段之间的可传递相关性将全波段划分为多个子空间。经划分后的每个子空间内数据的光谱特性都相似。
任意两波段Wi和Wj之间的相关系数计算公式为
(1)
(2)
波段相关系数矩阵只能粗略划分子空间,由于邻近波段的相关性很强,距离越远的波段相关性越弱。因此可以利用式(1)计算出相邻波段的相关系数,结合系数矩阵R对子空间进行精确划分。
2.2 自适应波段选择法(Adaptive Band Selection)
由于最佳指数法(OIF)计算量巨大,具有很大的局限性,因此提出了自适应波段选择法(ABS)[4~6]。ABS算法充分考虑了空间相关性以及谱间相关性。
自适应波段选择算法依据如下:
1) 所选波段含信息量最大。
2) 所选波段与其他波段间的相关性最弱。
根据以上准则得出算法的数学模型:
(3)
(4)
其中σi为第i波段的标准差,Ri-1,i为第i波段与前一个波段的相关系数。相关系数越小,两波段的独立性越大。Index是第i波段的指数。其中,M,N为图片的行、列像素个数。
自适应波段选择法(ABS)既考虑了图像信息量问题又考虑了波段间的相关性。计算各波段指数并按从大到小的顺序排列。波段指数表示信息量的大小,指数越大,信息量越大,反之则越小。对排列好的波段进行选择有以下两种方法:一是选取排在前面的n个波段;另一种方法是通过设定阈值选择波段,选择指数大于该阈值的波段。
2.3 光谱角度制图法
光谱角度制图法把光谱看作多维矢量,通过计算一个测量光谱(像元光谱)与一个参考光谱之间的“角度”来确定它们两者之间的相似性,夹角越小,光谱越相似。通过选择一种地物,以多个波段的灰度值作为一个多维矢量,将标准地物的光谱数据与待匹配的地物进行光谱向量的角度余弦值计算,将该像元归于余弦值最大的一类,将下一地物依次与各标准地物光谱向量进行角度余弦计算,重复上述过程直到地物全面分类完为止。光谱角计算公式如下:
(5)
式中,n为波段数,ωik为第i类地物在第k个波段的辐射亮度值,角度越大说明两类地物可分性越好。因此,光谱角最大的组合即为高光谱影像波段选择的最佳波段组合。
光谱角度匹配的算法流程如下:
1) 在标准光谱数据中选择一种地物从第一种开始。
2) 进行波段循环,将波段的灰度值作为一个多维矢量,将标准地物的光谱数据与待匹配的地物进行光谱向量的角度余弦值计算。
3) 进行样本循环,计算其他标准样本数据与该带匹配像元的光谱向量余弦值。
4) 余弦值越大,表明向量角度越小,越匹配,并将该像元归于余弦值最大的一类。
5) 将下一地物依次与各标准地物光谱向量进行角度余弦计算,重复上述步骤2)、3)、4)。
3 仿真实验及结果分析
3.1 实验数据说明
本文高光谱图像数据来自AVIRIS传感器,图像所示地区为美国圣地亚哥海军基地机场,共224个波段,该数据空间维大小为400×400像素。利用ENVI4.7软件对原高光谱图像进行预处理,包括去除水的吸收带和噪声波段,处理后保留了189个有效波段。由于图像数据量较大,所以只截取包含目标的部分区域作为实验数据,截取后图像大小为100×100像素。图1为原始图像的第20波段,图2为图像的局部放大细节图。
3.2 实验过程
将本文波段选择方法与常用的波段选择方法高光谱实验数据进行波段选择,都选择三个波段进行对比分析。常用的波段选择方法包括联合熵法、自适应波段选择法(ABS)、最佳指数法(OIF)。
1) 自动子空间划分
根据式(1)计算所有波段间的相关系数rij,组成相关系数矩阵R,该矩阵包含189×189个元素,图3是矩阵R的二维可视化形式,体现其“分块”的特点。通过矩阵的灰度变化只能粗略的分块,为了对子空间更精细地划分,利用式(1)计算相邻波段相关系数。根据矩阵及相关系数,将全波段划分为五个子空间:1~38、39~95、96~144、145~170、171~189。
2) 自适应波段选择
子空间划分完后,运用自适应波段选择法(ABS)对各个子空间内波段进行选择。利用式(3)计算各个波段的Index值,对每个子空间内波段的Index值进行排序,取波段指数排在前面的十个波段。波段指数如表1所示。
表1 波段指数及波段号
波段指数越大,其信息量越大。将四个最大指数波段进行排列组合,最佳波段组合应该从这些组合中产生。
3) 光谱角制图
从表1中任意选择三波段组合,分别计算光谱角,对候选波段精确分类。根据地物可分性理论,选择与飞机目标对比较为明显的3个背景: 草地、房屋、停机坪做光谱角,分别对目标及背景进行采样,用各类地物样本均值作为地物标准光谱。 计算飞机目标与背景地物的光谱角,阈值设为0.9995,选择光谱角最大的前3个波段组合,即为可分性最好的波段组合,如表2。
表2 最佳波段组合光谱角
根据表2,选出出现次数最多的波段,排在前三的波段组合即为最佳波段组合,如表3。
表3 波段出现次数统计
由表3得出最佳波段组合有两组,即 (7,95,161)和(95,136,161)。根据式(1)分别计算(7,95,161)和(95,136,161)各波段间的相关系数,计算结果(95,136,161)波段间相关系数大于(7,95,161)波段间相关系数,相关性强,造成冗余度较高。另外,第7波段和第95波段指数分别排在第一、第二位,其信息量较大。在选择最优波段时不仅要考虑波段间的相关性,还要考虑信息量。因此利用本文方法选择的最佳波段组合为(7,95,161)。
3.3 实验结果与分析
表4 各方法所选的波段组合
为了验证本文方法的优越性和说明存在的问题,将本文波段选择方法与常用的波段选择方法高光谱实验数据进行波段选择,常用的波段选择方法包括自动子空间划分法(ASP)、自适应波段选择法(ABS)、最佳指数法(OIF)。经实验,各方法所选择的波段如表4。
为了选取最佳的三个波段用于合成假彩色图像,计算出本文方法及常用波段选择方法所选的三波段间的相关系数之和,还有其均方差,结果按从小到大排列。若其中两波段相关系数小,而两个波段相关系数很大,导致三波段相关系数和最小,则不能称之为最佳波段组合。因此要计算平均相关系数的离散程度,体现波段间相关系数变化程度大小。三波段相关系数之和rsum=rx,y+ry,z+rx,z,其中rx,y、rx,z、ry,z分别是x与y、x与z、y与z的相关系数。相关系数的均方差表示为
计算本文及常用波段选择方法所选的波段组合的相关系数和及均方差。相关系数和最小且均方差最小的波段组合即为最优波段组合。计算结果见表5。
表5 各方法波段组合的统计数据
通过以上数据分析,本文方法选取的波段组合(7,95,161)三波段相关系数和最小且均方差最小,可以看出本文方法在相关性方面要优于自动子空间划分法(ASP)、自适应波段选择法(ABS)、最佳指数法(OIF)。
图4中(a)~(d)分别是自动子空间划分法、自适应波段选择法、最佳指数法及本文方法得到的假彩色图像。图4中的(e)~(h)是利用ENVI软件对以上波段组合分别赋予红色、绿色、蓝色,合成假彩色图像,对假彩色图像进行异常检测。
通过结果对比,利用本文方法得到的假彩色图像的目标形态明显,色调区分程度大,层次分明,更易于识别,为高光谱图像解译提供方便,在目标判读及解译方面较其他波段选择方法有一定的优越性,具有一定的应用发展前景。
4 结语
由于高光谱图像邻近波段相关性高且冗余度大,对图像判读解译造成很大困难。本文提出的方法利用相关系数矩阵二维可视化分块的特点并计算邻近波段相关系数将全波段精确划分为五个子空间,实现了子空间的自动的、精确的划分,然后在每个子空间内进行自适应波段选择法,并计算目标地物与背景的光谱角,最终提取出最佳波段组合。本文方法不仅考虑了信息量大小,还在一定程度上克服了邻近波段相关性问题,也充分考虑了地物的可分性。该方法计算量小、简便、高效、精确、效果明显。在高光谱遥感图像波段选择方面及图像解译方面具有研究意义和应用价值。
[1] 陈善学,胡灿,屈龙瑶.基于自适应波段聚类PCA的高光谱图像压缩[J].科学技术与工程,2015,15(12):86-91.
[2] 王立国,谷延锋,张晔.基于支持向量机和子空间划分的波段选择方法[J].系统工程与电子技术,2005,27(6):974-977.
[3] 刘国涛,王茂芝,崔之熠,刘斌.基于IDL的高光谱遥感图像的矿物信息提取[J].达县师范高等专科学校学报,2011(5):38-40.
[4] 董超,田联房,赵慧洁.遗传关联向量机高光谱影像分类[J].上海交通大学学报,2011,45(10):1516-1520.
[5] 胥海威,杨敏华,韩瑞梅,等.用随机决策树群算法进行高光谱遥感影像分类[J].应用科学学报,2011,29(6):598-604.[6] 张连蓬,储美华,刘国林,江涛.高光谱遥感波段选择的非线性投影寻踪方法[J].徐州师范大学学报(自然科学版),2004,22(4):49-53.
[7] 王朗,郭树旭.基于双向波段预测的超光谱图像无损压缩[J].吉林大学学报(信息科学版),2009,27(3):304-308.
[8] 孟强强,杨桄,卢珊,何高攀.基于端元提取的高光谱图像亚像元目标异常检测算法[J].科学技术与工程,2014,14(27):96-99.
[9] 李庆亭,张莲蓬,杨锋杰.高光谱遥感图像最大似然分类问题及解决方法[J].山东科技大学学报(自然科学版),2005,24(3):61-64.
[10] 黄睿,陈玲.图Laplacian半监督特征加权用于高光谱波段选择[J].应用科学学报,2011,29(6):626-630.
[11] 张韬,赵宇飞,安慧君,陈秀兰.ETM+影像提取伏沙地信息的最佳波段组合——以内蒙古锡林郭勒盟西乌旗为例[J].科技导报(北京),2011(17):29-33.
[12] 朱卫东,李全海,徐克科,李天子.基于二代Bandelet和主成分变换的高光谱遥感图像融合[J].同济大学学报(自然科学版),2011,39(7):1068-1073.
[13] 王书民.基于随机森林算法的航空高光谱数据分类方法研究[J].科学技术与工程,2016,16(21):83-87.
[14] 侯颖.三维小波零块编码算法在超光谱图像压缩中的应用[J].西安科技大学学报,2008,28(3):551-554.
[15] 李江颂,张红,于淼.土地资源调查的像元级遥感影像融合方法研究[J].山西大学学报(自然科学版),2011(4):667-670.
[16] 王霖郁,李坤波,黄丽莲.基于色调一致性改进的图像融合最速下降法[J].应用科技,2010,37(3):33-37.
[17] 孙梅,付妍,徐冉冉,赵勇,陈兴海.基于高光谱成像技术的水果品质无损检测[J].北京工商大学学报(自然科学版),2013,31(2):67-71.
[18] 刘华平,李昕,郑宇,徐柏龄,姜宁.一种改进的自适应子带谱熵语音端点检测方法[J].系统仿真学报,2008,20(5):1366-1371.
版 权 声 明
本刊已许可万方数据库、中国学术期刊(光盘版)电子杂志社在中国知网及其系列数据库等产品中以数字化方式复制、汇编、发行、信息网络传播本刊全文。著作权使用费与本刊稿酬一并支付。作者向本刊提交文章发表的行为即视为同意我编辑部上述声明。
《舰船电子工程》编辑部
Band Selection Method of Hyperspectral Image Based on Subspace Partition
WANG Qi YANG Guang XIANG Yingjie
(Aerospace Intelligence Department, Aviation University of Airforce, Changchun 130022)
Hyperspectral remote sensing image carries a large amount of information, large redundancy and strong band correlation, which is not conducive to the image interpretation. How to select the optimal band combination of target identification and classification from hundreds of bands is a problem to solve. In this paper, automatic subspace partition method is adopted, the correlation coefficient matrix “block” is used to divides all bands into several subspaces roughly. Then within each subspace, adaptive band selection and spectral angle plotting are conducted. Firstly, the correlation coefficient matrix is used to divide bands into several subspaces. Next, the biggest index of bands is selected. Finally, the best band combination is selected according to the spectral separability. At last, the correlation coefficient and mean square deviation of the bands which are selected from the proposed method and the conventional band selection methods are calculated and it verifies that the proposed method has certain advantages.
hyperspectral image, band selection, band index, subspace partition, adaptive band selection, spectral angle plotting
2016年10月11日,
2016年11月24日
王琪,女,硕士研究生,研究方向:高光谱图像波段选择。杨桄,男,博士后,教授,研究方向:遥感影像解译。向英杰,男,硕士研究生,研究方向:高光谱图像异常检测。
TP751.1
10.3969/j.issn.1672-9730.2017.04.025