APP下载

基于CDS工具的高光谱影像降维与维度估计方法研究

2016-11-04周亚文董广军崔爱红姚强强

测绘科学与工程 2016年3期
关键词:实验区降维光谱

周亚文,董广军,崔爱红,姚强强

信息工程大学,河南 郑州,450001



基于CDS工具的高光谱影像降维与维度估计方法研究

周亚文,董广军,崔爱红,姚强强

信息工程大学,河南 郑州,450001

高光谱影像降维策略是进行高光谱影像处理和分析的重要基础,相关降维方法已经被提出很多,可是绝对有效的方法仍未确定。本文对近年来一些具有代表性和前沿性的降维方法(PCA, ICA, MNF, LDA, MDS, PPCA, FA)进行对比分析,在此基础上,进一步对比采用的几种内在维度估计方法(CD, EV, GMST, MLE, PN),最后选择降维后的影像与原影像在非监督分类后运用CDS工具进行对比。实验结果表明,PCA方法整体较好,适应性更广泛;PN估计具有极大局限性;不同维度估计下同种降维效果相差不大,相同维度估计下不同降维方法效果相差较大。

高光谱遥感;内在维度估计;降维;非监督分类;CDS对比

1 引 言

影像地物自动识别分类一直是测绘学者追求的目标,高光谱遥感影像有光谱分辨率高和“图谱合一”特点,具有地物属性信息精细探测能力,通过分析光谱影像的光谱信息和空间特征信息,能够达到精细识别典型地物的目的[1]。目前,越来越多的国家开始重视高光谱遥感的利用,逐渐开始发射装配有高光谱传感器的卫星,如:中国计划2016年发射CCRSS,德国2018年发射EnMAP(Environmental Monitoring and Analysis Program)。高光谱数据存在一定限制:空间分辨率无法达到理想要求,计算处理复杂度增加却未明显增加分类精度。在这种情况下,数据量增加必然会对地物识别乃至分类造成阻碍。地物识别分类是遥感影像的应用目的,而降维是高光谱影像下实现分类的一个重要技术。

高维空间本身的稀疏性与多重共线性是高光谱影像中主要存在的问题,除此之外,过多的变量会影响查找规律的建立,数据过多造成的冗余计算量即我们熟知的维数灾难不容忽视,仅在变量层面上分析会把变量之间潜在联系忽略。针对这一系列问题,降维可以达到减少变量个数、确保变量之间相互独立、提供一个概括性框架来解释结果等目的。

由于高光谱数据波段数多、波段间冗余大,容易带来 “Hughes”现象和计算量大的缺点,多位学者针对不丢失相关信息的情况对实现高光谱影像数据降维的方法进行研究。本文共选取三个5种内在维度估计方法和7种降维方法进行对比分析。

2 方 法

2.1内在维度估计方法

通常情况下,降维结果波段的选取是根据每个波段包含数据方差的累计百分比与特征值等判别标准,因此带来的结果是降维结果受主观因素影响较大。在降维前进行内在维度估计可以大大避免人为选择波段数的误差。内在维度估计方法包括基于数据局部特征的估计方法和基于数据全局特征的估计方法。本文选取两种局部内在维度估计方法:最大似然估计(Maximum Likelihood Estimator, MLE)[2]和关联维度估计(Estimator based on correlation dimension, CD)[3];三种全局内在维度估计方法:基于特征值估计(Eigenvalue-based estimation, EV)[4]、测地线最小生成树估计(Estimator based on geodesic minimum spanning tree, GMST)[5]和包装数估计(Estimator based on packing numbers, PN)[6]。

2.2降维方法

高光谱遥感影像降维是把影像从高维空间转换到低维空间,来降低计算复杂度并提高分类精度。影像分类作为图像处理的一个较为重要的终端应用,精度和效率应该被充分提高。高光谱影像包含连续的光谱反射曲线,因此成为自动分类影像数据源的最佳选择。一般情况下,光谱波段的增加也会提高我们对土地以及覆盖类型分类的能力。然而由于高光谱影像的冗余信息(各波段间的相关性)很大,降维已成为分类以及特征提取的必要手段。多位学者已经提出了很多降维方法,不过绝对精确有效的降维方法一直未确定,这就给分类以及其他应用带来了很多不便。因此,寻找一种相对理想并且有效的降维方法对分类具有重大意义。

降维方法根据其性质可分为线性与非线性、监督与非监督、全局与局部以及特征提取与波段选择。文章中综合考虑各方面性质选取7种降维方法(见表1),选取的降维方法包括主成分分析(Principal Component Analysis, PCA)[7]、独立成分分析(Independent Component Correlation Algorithm, ICA)[8]、最小噪声分离(Minimum Noise Fraction Rotation, MNF)[9]、线性判别分析(Linear Discriminant Analysis, LDA)[10]、多维尺度分析(Multidimensional scaling, MDS)[11]、概率主成分分析(Probabilistic Principal Component Analysis, PPCA)[12]和因子分析(Factor analysis, FA)[13]。

表1降维方法对比

方法线性/非线性监督/非监督全局/局部PCA线性非监督全局ICA线性监督全局MNF线性非监督全局LDA线性监督全局MDS线性非监督全局PPCA非线性非监督局部FA线性非监督全局

2.3分类以及对比方法

由于非监督分类仅需一定知识识别分类的集群组,不需要对分类区域有详细的了解,因此可减少人为误差并且所需参数较少。非监督分类可以形成范围很小但具有独特光谱特征的集群,所分的类别比监督分类的类别更均质,独特的、覆盖量小的类别均能够被识别。综合考虑多方面原因,本文选用非监督分类进行分类实验,影像在实现不同方法的降维后分别进行非监督分类。为了更加直观地对比降维方法的优劣,使用对比工具将不同降维方法非监督分类后的结果均与原图的非监督分类结果进行对比。

分类后比较法包括CDS(Change Detection Statistics)工具和TC(Thematic Change)工具,本文采用CDS工具。CDS工具对两幅分类图像进行差异分析,是遥感动态监测中常见的方法,但在分类研究中并不经常使用,文中使用此方法对比分类后的影像,获得其差别度。CDS可对两影像中像元值直接运算以及变换处理,最后统计变化像元并成图显示。变化像元按数量、百分比和面积三个方面输出,成掩膜图像显示,掩膜图像记录两个分类图像对应像元的变化信息,相比于统计数据能更加直观地显示图像之间的区别[14]。它的优点是可以回避其他对比方法要求的影像时相一致性条件,避免影像间辐射校正和配准等问题,最小化地减少非地物变化因素的影响,同时还可以确定变化信息的空间位置并提供变化信息的类型[15,16]。

3 实验和分析

文章中选取三个不同遥感器数据源为实验影像,实验影像分别为:2008年6月份美国加利福尼亚州莫菲特场地区的一幅机载可见光/红外成像光谱仪(AVIRIS)影像,该影像数据包含224个波段,尺寸为139*159像素,大小为9.44MB,包含10类地物;Landsat影像,包含6个波段,尺寸为233*186像素,大小为254KB,包含10类地物;MODIS影像,包含22个波段,尺寸为151*178像素,大小为2.25MB,包含5类地物。

文中主要实验步骤包括内在维度估计、降维、分类以及对比,具体流程如图1所示。内在维度估计选取5种方法,针对三个实验影像,不同维度估计方法所估计维度结果均不同。在进行内在维度估计后,实验根据估计出的维数对影像降维。以此类推,直至使用所有维度估计方法估计的维数进行降维。其次对原始图像以及降维后的影像进行非监督分类,本实验中不同实验区地物种类不同,不同实验区降维后影像地物类别数选取与原影像非监督分类地物种类保持相同。最终将降维后影像分类图与原图像分类图使用CDS工具进行对比。

表2内在维度估计方法及结果

内在维度估计方法EVMLECDGMSTPNAVIRIS维度795110Landsat维度24352MODIS维度16240

图1 实验流程图

5种维度估计方法对三个实验区进行维度估计结果见表2。可以看出,不同影像、相同维度估计方法所估计的结果不同;相同影像、不同降维估计方法所估计的结果也不同。在三个实验区域中PN估计方法对AVIRIS和MODIS影像估计为0,仅对Landsat影像估计成功,说明了PN估计较选取的其他估计方法存在一定的局限性。

在内在维度估计之后对影像进行降维处理,实验中选择7种降维方法进行降维处理。由维度估计方法与降维方法任意组合,实验区1可得到28幅降维后影像。同理,实验区2可得到35幅降维后影像,实验区3可得到28幅降维后影像。在此基础上对以上影像以及三幅原始影像分别进行分类处理,可得到CDS对比工具所需要的全部图像共94(29+36+29)幅。

最终使用CDS工具让各实验区降维后分类影像与源数据分类影像对比,在输出的变化数量、百分比和面积三种变化信息中,本文选择原影像与降维影像分类后相似性百分比来展示变化效果,统计结果如表3~5。结果显示相同实验区不同维度估计与降维方法组合的相似百分比差异较大。

表3AVIRIS影像(实验区1)相似性百分比结果统计

PCAICAMNFLDAMDSPPCAFAEV85.47643.83847.39138.04781.93465.14631.008MLE85.34447.57146.29441.19384.65064.01944.522CD85.58343.66342.95744.34883.09164.62544.375GMST85.47839.42651.05640.59784.72365.99044.002

表4Landsat影像(实验区2)相似性百分比结果统计

PCAICAMNFLDAMDSPPCAFAEV35.65242.00518.94544.28834.86430.05428.065MLE34.67434.95223.45138.59633.73539.79235.902CD43.02238.26719.04725.87442.98435.47630.074GMST25,80420.96132.01342.13325.83530.61640.781PN35.65242.00518.94544.28834.86430.05428.065

表5MODIS影像(实验区3)相似性百分比结果统计

PCAICAMNFLDAMDSPPCAFAEV65.28699.20323.54920.42364.36848.93260.393MLE64.47576.83226.43827.41663.85345.82958.726CD60.39271.30825.98723.87160.36443.24357.012GMST63.95879.93729.64522.09763.65342.43561.291

利用CDS工具,对三个实验区不同内在维度估计及降维后的分类图与原图分类图进行对比,从而得到在某类内在维度估计下较好的降维方法,以及不同影像相对较好的内在维度估计方法。图2给出三个试验区每种内在维度估计方法下最好的降维后分类图,图3是各实验区降维后分类图像与原影像分类图像利用CDS工具对比后得到的掩膜图像。

精度分析:针对在实验区域一(AVIRIS影像224波段):无论哪种内在维度估计均是PCA主成分分析降维方法最优,其次为MDS、PPCA方法。而在基于同一种降维方法时对维度估计方法进行对比发现,PCA降维情况下CD维度估计方法较好,PPCA核主成分分析降维方法下GMST较优,LDA线性判别分析降维方法整体较差。图2(a)给出四种维度估计下的PCA降维后分类图,可看出,与原图差异较小。针对实验区域二(Landsat影像6个波段):整体降维效果不理想,原因为影像内在维度较少,每个波段均存储了大量影像信息且相关性较弱。表4显示,Landsat影像中CD维度估计下PCA降维效果更好;EV、GMST维度估计与LDA降维搭配效果更佳;MLE估计与PPCA降维结合效果较好。图2(b)给出四种搭配(CD与PCA、EV与LDA、GMST与LDA、MLE与PPCA)分类图。由表4可知,这四种组合相对于其他组合较优。针对实验区域三(MODIS影像22波段):每种内在维度估计方法下均是ICA降维方法效果最好,图2(c)给出四种内在维度估计下ICA降维后分类图。

耗时分析:在实验过程中经过粗略观察各降维方法所用时间,FA以及PPCA方法比其他方法耗时长,这也从另一方面体现出其的不精确性。

图2 各实验区降维效果图

图3 各实验区分类后对比掩膜图像

4 结 论

文章中选用三个不同传感器的实验影像进行内在维度估计以及降维后分类对比,采用CDS工具分别使降维后分类图像与原影像分类图像进行对比,避免了精度评价造成的误差,更直观地展示了降维效果的优劣。文章中选取了5种内在维度估计方法和7种降维方法进行实验,实验结果表明:

(1)主成分分析和多维尺度分析降维后影像相似性较高。

(2)在不同的内在维度估计方法下,同种降维效果相差较小;同种内在维度估计方法下,不同降维方法效果相差较大。

(3)并非保留维数越多分类效果越好,应使内在维度估计与降维算法搭配使用。

(4)影像数据不同,内在维度估计方法的选择不同,降维方法的选取也不同。

[1]余旭初,冯伍法,杨国鹏等.高光谱影像分析与应用[M].北京:科学出版社,2013.

[2]Levina E, Bickel P J. Maximum likelihood estimation of intrinsic dimension[C]. Advances in neural information processing systems, 2004:777-784.

[3]Grassberger P, Procaccia I. Measuring the strangeness of strange attractors[M]. New York :Springer, 2004.

[4]Fukunaga K, Olsen D R. An algorithm for finding intrinsic dimensionality of data[J]. IEEE Transactions on Computers, 1971, 100(2):176-183.

[5]董广军. 高光谱影像流形降维与融合分类技术研究[D]. 郑州:信息工程大学, 2008.

[6]Kégl B. Intrinsic dimension estimation using packing numbers[C]. Advances in neural information processing systems, 2002:681-688.

[7]臧卓, 林辉, 杨敏华. 利用PCA算法进行乔木树种高光谱数据降维与分类[J]. 测绘科学, 2014, 39(2):146-149.

[8]Wang J, Chang C I. Independent component analysis-based dimensionality reduction with applications in hyperspectral image analysis[J]. IEEE transactions on geoscience and remote sensing, 2006, 44(6):1586-1600.

[9]Denghui Z, Le Y. Support Vector Machine Based Classification for Hyperspectral Remote Sensing Images after Minimum Noise Fraction Rotation Transformation[C]. Internet Computing & Information Services (ICICIS), 2011:132-135.

[10]Wang Z Q, Chen G H, Yu Z Z. Linear Discriminant Analysis Based on Ensemble Learning[J]. Advances in Biomedical Engineering, 2012(9):265-270.

[11]卿湘运, 王行愚. 基于RJMCMC的多维尺度分析维数选择[C].北京:中国控制会议, 2007.

[12]穆向阳, 张太镒, 周亚同. 一种鲁棒的概率主成分分析方法[J]. 西安交通大学学报, 2008, 42(10):1217-1220.

[13]Fodor I K. A Survey of Dimension Reduction Techniques[J]. Neoplasia, 2008, 7(5):475-485.

[14]邓书斌. ENVI遥感图像处理方法[M].北京:科学出版社, 2010:259-262.

[15]Ridd K, Liu J, A comparison of four algorithms for change detection in all urban environments[J].Remote Sensing of Environment, 2007, 65(2):95-100.

[16]蒋玉峰. 基于混合模型和分类后比较法的SAR图像变化检测[D].西安电子科技大学,2013.

Dimensionality Reduction and Dimension Estimation Method for Hyper-spectral Imagery Based on CDS

Zhou Yawen, Dong Guangjun, Cui Aihong, Yao Qiangqiang

Information Engineering University, Zhengzhou 450001, China

Dimensionality reduction strategy is an important basis for hyper-spectral imagery processing and analysis, and many relevant methods have been proposed, but none of them is considered to be absolutely effective. In this paper, some typical and cutting-edge methods put forward in recent years are compared and analyzed, including PCA, ICA, MNF, LDA, MDS, PPCA and FA. Based on the comparison of above methods, further analysis of several intrinsic dimension estimation methods is conducted, namely CD, EV, GMST, MLE and PN. Finally, the imagery after dimensionality reduction is compared with the original one which has undergone non-supervised classification using CDS tools. The results of three experiment areas show that the PCA method is good in general and has a better adaptability; while PN has many limitations. The reduction effects of the same dimensionality in different dimension estimation are similar, while the effects of different dimensionalities in the same dimension estimation vary greatly.

hyper-spectral remote sensing; intrinsic dimension estimation; dimensionality reduction; unsupervised classification; CDS comparison

2016-02-16。

国家自然科学基金资助项目(61272146)。

周亚文(1991—),女,硕士研究生,主要从事高光谱影像处理与模式识别方面的研究。

TP751

A

猜你喜欢

实验区降维光谱
基于三维Saab变换的高光谱图像压缩方法
混动成为降维打击的实力 东风风神皓极
降维打击
青海省人民政府办公厅关于加强文化生态保护实验区建设的指导意见
2016年国家文创实验区规上文化产业收入近2000亿元
一种改进的稀疏保持投影算法在高光谱数据降维中的应用
星载近红外高光谱CO2遥感进展
教育部办公厅下发关于公布国家特殊教育改革实验区名单的通知
苦味酸与牛血清蛋白相互作用的光谱研究
基于特征联合和偏最小二乘降维的手势识别