APP下载

基于MODIS影像多特征的CART决策树分类

2013-01-27闫金凤

地理空间信息 2013年2期
关键词:植被指数决策树波段

张 会,闫金凤

(1.山东科技大学 测绘科学与工程学院,山东 青岛 266590)

基于MODIS影像多特征的CART决策树分类

张 会1,闫金凤1

(1.山东科技大学 测绘科学与工程学院,山东 青岛 266590)

以山东省为研究区域,利用2009年9月MODIS 的8 d合成波段反射率产品MOD09,选择特征变量植被指数(NDVI、EVI)、NDWI、NDMI、NDSI及辅助信息DEM,通过选取其中的影像特征组合来确定分类方案,构建各波段组合的CART决策树,对MODIS影像进行分类,得到CART决策树的最优波段组合。结果表明,特征变量DEM、NDVI、EVI对分类结果贡献较大;将CART决策树的分类结果与其相对应的最大似然分类结果进行比较可知,基于影像多特征的CART决策树分类方法能明显提高分类精度。

MODIS;波段选择;NDVI;EVI;NDWI;NDMI;NDSI;CART决策树

在利用遥感影像的土地资源研究中首先涉及的问题就是确定土地的所属类别,即遥感图像分类。传统分类方法(监督分类、非监督分类)耗时,对解译人员依赖性强,其结果往往因时因地因人而异,难以相互比较和转换,多数不可重复。这些局限性影响了迅速、准确、客观地获取大面积土地覆盖信息[1]。因此,研究人员提出了诸如人工智能神经网络分类、决策树方法和多元数据的专家系统等新方法。其中决策树分类方法能充分利用影像的光谱特征信息和其他辅助信息,有效解决遥感影像“同物异谱,异物同谱”的问题[2],提高了分类精度。马里兰大学全球8 km的土地覆盖产品就是采用二元决策树[3];Muchoney等利用MODIS数据对美国中部地区进行土地覆盖分类, 决策树分类的精度优于神经网络和最大似然法[4]。目前,决策树法在国内遥感影像分类中也得到了广泛应用:刘勇洪等引入了2种机器学习领域里的分类新技术——boosting和 bagging技术。分类回归树CART算法较 C4.5算法具有分类精度和树结构方面的优势[5];孙艳玲等利用决策树分类法对山东省MODIS数据进行土地利用类型分类,表明仅利用MODIS数据自身信息对宏观的土地利用分类就可达到较高的精度[6]。

1 数据预处理

该研究采用的数据是MODIS09产品和DEM数据。首先选取了美国LPDAAC的MODIS09数据产品:2009-09-01~2009-09-30 MODIS 的8 d合成波段产品MOD09Q1(1~2波段250 m分辨率)和MOD09A1(3~7波段500 m分辨率)图像。利用MODIS影像的处理软件MRT对影像进行批处理。为消除大面积云层的影响,对以上特征影像分别进行地理几何校正与重采样,采样方法为邻近法,投影体系为双标准纬线等积圆锥投影,分辨率统一到250 m,最终影像大小为6 778列×3 435行。

2 分类回归树

决策树常用的算法有CART、C4.5和D3等[7,8]。分类回归树(classification and regression trees,CART)是Breiman[9]于1984年提出的一种决策树构建算法,它是一种基于树的分类和预测方法。与其他决策树相比,其模型使用简单,易于理解。该方法最大限度地降低每个步骤的不纯洁度,使用递归分区将训练记录分割为组,然后根据使用的建模方法在每个分割处自动选择最合适的预测变量。如果节点中100% 的观测值都属于目标字段的一个特定类别,则该节点将被认定为“纯洁”。目标和预测变量字段可以是范围字段,也可以是分类字段。所有分割均为二元分割,即分割为2组。分割标准用的是基尼系数。此方法的缺点是很可能形成庞大复杂的决策树,过多树叶会加大原始数据的噪声,影响对影像真实信息的提取,并对最后的整体分类结果产生负作用,所以需要对决策树进行剪枝[2]。

3 CART决策树分类

3.1 MODIS影像多特征的提取

参与分类的波段选取MODIS09的前7个波段 B1~B7,NDVI、EVI、DEM、NDWI、NDMI、NDSI。除了已获取的B1~B7和DEM,下面分别介绍其他各影像特征及其计算方法。

1)NDVI(归一化植被指数):对于MODIS09来说,它的计算公式为NDVI=(B2-B1)/(B2+B1)。

2)EVI(增强型植被指数)[10]:EVI=2.5×(B2-B1)/(B2+C1×B1-C2×B3+L)。其 中 参数C1 和参 数C2分别为6.0和7.5,L=1为土壤调节参数。为了克服NDVI对高植被区较低的敏感性,针对MODIS影像发展新型植被指数EVI。

3)NDWI(水体指数):NDMI=(B4-B2)/(B4+B2)。NDWI已成功地应用到中国西北地区土地覆盖的制图中。

4)NDMI( 湿 度 指 数 ):NDMI=(B4-B6)/(B4+B6)。NDMI已成功地应用到土壤湿度的监测中[11,12],但还未用在宏观土地覆盖分类中。

5)NDSI(土壤亮度指数 ):NDSI=(B1-B4)/(B1+B4)。

3.2 分类方案的确定

针对N个波段的多光谱图像的特征选择问题,美国查维茨教授提出了最佳指数公式,但在实际应用过程中,由于应用目的、研究区域、遥感图像类别与成像季节等众多要素的不同,特征变量的选择是个相当复杂的问题,所以在实践中往往要经过反复试验才能确定最优特征变量。

为充分利用各个特征变量组合,并比较各个特征变量在分类中的作用,把已有的影像特征分为4类:原始影像特征B1~B7,植被指数NDVI、EVI, DEM,水体的指数NDWI、NDMI和NDSI。

首先选择B1~B7波段为一个组合作为基础对比,然后有次序地增加其他波段,来探讨增加其他影像特征对分类结果的影响,分别增加的波段有NDVI、EVI、DEM、NDWI、NDMI和NDSI。根据经验得知,植被指数和高程信息对分类效果的影响较为明显,所以在波段组合B1~B7、DEM的基础上分别增加NDVI、EVI、NDWI、NDMI和NDSI;然后在B1~B7、DEM、NDVI的 基 础 上 分 别 增 加 EVI、NDWI、NDMI和NDSI;在B1~B7、DEM、EVI的基础上分别增加NDWI、NDMI和 NDSI;在 B1~B7、DEM、NDVI的基础上分别增加NDWI、NDMI和NDSI;在B1~B7、DEM、EVI的 基 础 上 分 别 增 加 NDWI、NDMI和NDSI;最 后 在 B1~B7、DEM、NDVI、NDSI的 基础上分别增加NDWI和NDMI;在B1~B7、DEM、EVI、NDSI的基础上分别增加NDWI和NDMI。利用CART算法来确定各波段组合决策树节点规则。

本文以山东省为研究区域,按上述分类方案探讨基于MODIS09影像的CART决策树分类方法[13],然后从中选取分类精度最高的分类组合与最大似然分类方法进行比较。

3.3 训练样本的选取及CART决策树建立

采用刘纪远等的分类系统[14],把训练区分为耕地、林地、草地、水域、城乡、工矿及居民用地和未利用地。辅以2005 年 TM 影像人工解译结果作为参考,进行训练样本选择。根据已选择的训练样本生成CART决策树,构建各个波段组合分别对应的决策树。为了使决策树的参数具有统一性和可读性,B1~B7代表MODIS前7个波段 , B8代表DEM, B9代表NDVI,B10代表 EVI,B11代表NDWI, B12代表NDMI , B13代表NDSI。根据分类方案和所选样本建立各波段组合的CART决策树,得到各波段组合的分类图。

3.4 精度评价及结果分析

采用30%的样本建立混淆矩阵,结合50 m TM分类图对每一组波段组合的最大似然法和CART决策分类结果图进行精度评价,CART决策树的最优波段组合是B1~B7、DEM、NDVI、NDMI,分类精度(如表1、表2所示)达到了91.518%,比最大似然分类的最优波段组合B1~B7、DEM、NDVI、NDMI、NDSI提高了4.6%,Kappa系数也由0.813 4提高到0.875 2,其部分决策树模型如图1所示。而且CART决策树所使用的影像特征比最大似然法少了NDSI,提高了效率。基于CART决策树的最优波段组合B1~B7、DEM、NDVI、NDMI的分类结果如图2所示。

表1 最大似然法与CART决策树法分类结果比较

表2 基于波段组合B1~B7、DEM、NDVI、NDMI的CART决策树分类精度分析

图1 波段组合B1~B7、DEM、NDVI、NDMI的部分决策树模型

图2 山东基于波段组合B1~B7、DEM、NDVI、NDMI组合的CART决策树分类图

4 结 语

结合MODIS的影像多特征,利用CART决策树对试验区山东省进行了土地覆被分类,并与相应的最大似然分类结果相比较,CART决策树分类能显著提高分类精度。

1)相对于单独利用MODIS光谱特征差异进行的分类,随着特征变量的增加,分类精度的总体趋势不断提高,但不是所用变量越多,分类精度就越高。

2)DEM、NDVI、EVI对分类精度的提高贡献较大,NDMI、NDWI、NDSI次之。高程辅助信息、植被指数能显著提高分类精度。

3)由于MODIS影像空间分辨率的限制,草地、未利用地所占面积比重较小,且草地与耕地、林地,未利用地和某些耕地、城乡工矿居民地的光谱差异较小,导致草地、未利用地的分类精度不高,需要进一步改进。

[1] 赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003

[2] 齐乐,岳彩荣,基于CATR决策树方法的遥感影像分类[J].林业调查规划,2011,36(2):62-66

[3] de Fries R S, Hansen M C, Townsend J G R, et al . Global Land Cover Classifications at 8 km Spatial Resolution: The Use of Training Data Derived from Landsat Imagery in Decision Tree Classifiers [J].I N T.J. Remote Sensing,1998,19(16):3 141-3 168

[4] Muchoney D, Borak J, Borak H C, et al . Application of the MODIS Global Supervised Classification to Vegetation and Land Cover Mapping of Central America[J]. INT.J. Remote Sensing,2000, 21(6):1 115-1 138

[5] 刘勇洪,牛铮,徐永明,等.基于MODIS数据的决策树分类方法研究与应用[J].遥感学报, 2005,9(4):405 -412

[6] 孙艳玲,杨小唤,王新生,等.基于决策树和MODIS数据的土地利用分类[J].资源科学,2007,29(5): 169-174

[7] 陈云,戴锦芳,李俊杰.基于影像多种特征的CART决策树分类方法及其应用[J].地理与地理信息科学,2008,24(2):33-36

[8] 赵萍,傅云飞,郑刘根,等.基于分类回归树分析的遥感影像土地利用/覆被分类研究[J].遥感学报,2005,9(6):708-716

[9] Breiman L , Friedman J H , Olshen R A ,et al. Classification and Regression Tree[M ]. Wadsworth, 1984

[10] Enhanced Vegetation Index(EVI)[EB/OL].http://tbrs.arizona.edu/project/MODIS/evi.php,2003

[11] 赵英时.美国中西部沙山地区环境变化的遥感研究[J].地理研究,2001,20(2):213-219

[12] 刘勇洪,牛铮,徐永明,等.基于MODIS数据设计的中国土地覆盖分类系统与应用研究[J].农业工程学报,2006,22(5):99-104

[13] 陈云,戴锦芳,李俊杰.基于影像多种特征的CART决策树分类方法及其应用[J].地理与地理信息科学,2008,24(2):33-36

[14] 刘纪远,杨生.国家资源环境遥感宏观调查与动态研究[J].遥感学报,1997,1(3):225-230

CART Decision Tree Classifier Based on Multi-feature of MODIS Data

byZHANG Hui

Taking Shandong Province as the study area, we chose composite albedo MODIS products MODIS09Q1(B1~B2 band in September 2009, 250 m resolution)、 MODIS09A1(B3~B7 band,500 m resolution) for one period of 8-day, characteristics variables vegetation index (NDVI, EVI,)NDWI, NDSI, and auxiliary information DEM by selecting a combination of image features to determine the classification schemes. The CART decision tree was built for each kind of band combination to classify MODIS images. The optimum band combination of the CART decision tree was composed of the bands of B1~B7,DEM,NDVI,NDMI and Feature variables DEM, NDVI, EVI make a greater contribution to classification results. Comparing CART decision tree classification results with their corresponding maximum likelihood classification results, it show that the CART decision tree classification based on image features can significantly improve the classification accuracy.

MODIS, bands selection, NDVI, EVI, NDWI, NDMI, NDSI,CART decision tree

P237.3

B

1672-4623(2013)02-0111-03

10.11709/j.issn.1672-4623.2013.02.035

2012-10-23。

项目来源:国家863计划重点资助项目(2009AA12Z147)。

张会,硕士,研究方向为遥感应用。

猜你喜欢

植被指数决策树波段
一种针对不均衡数据集的SVM决策树算法
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
决策树和随机森林方法在管理决策中的应用
河南省冬小麦产量遥感监测精度比较研究
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
基于决策树的出租车乘客出行目的识别
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性