基于指数的遥感影像决策树分类方法
2016-05-14嘎力巴臧淑英李苗吴长山
嘎力巴 臧淑英 李苗 吴长山
摘要:本研究以哈尔滨市为研究区,采用Landsat-8多光谱影像为数据源,计算出水体指数、植被指数、建筑指数和土壤指数等共20个地物光谱指数;基于指数的决策树分类方法提取土地覆被类型,并对分类结果进行精度验证,对比分析不同指数对分类精度的影响。经过精度对比、筛选五组数据作为变量用决策树方法进行分类,并与于单纯地物光谱的(普通)决策树分类结果和最大似然法相比较。结果显示:五组基于指数的决策树分类结果都比普通决策树分类和传统的最大似然法分类精度高,分类精度最高的一组与以上两种分类结果相比,总精度分别提高了2.59%和9.55%,Kappa系数分别提高了0.08和0.15。本研究呈现了基于指数的决策树分类方法在土地利用信息提取中的优势,为更好协调哈尔滨市土地利用与城市扩展提供研究依据。
关键词:决策树分类;指数;信息提取;土地利用
中图分类号:X144 文献标识码:A 文章编号:2095-672X(2016)05-0043-06
DOI:10.16647/j.cnki.cn15-1369/X.2016.05.0010
Decision Tree classification of remote sensing images based on index
Galiba1,2, Zang Shuying2, Li Miao1,2, Wu Changshan1,2
(1.School of Geographical Science,Harbin normal university,Heilongjiang 150025;
2.Key Laboratory of remote sensing monitoring of geographic environment,College of Heilongjiang Province, Harbin 150025)
Abstract:In order to study the advantage of decision tree based on index in land use information extracted, taking Harbin as a resample,there are 20 spectral indexes was calculated,including water index,vegetation,construction and soil type index and so on,using Landsat-8 multispectral images. According to the validation sample verifies the accuracy of the result of the classification,and then comparison and analysis the influence of different index on classification accuracy.Based on this,the higher precision index was classified into 5 groups to extract the area land use type,the classification result compared with decision tree classification based on spectral and maximum likelihood method.The result indicates that five groups based on the index of decision tree classification precision were better than the decision tree classification based on spectral and the maximum likelihood classification,one group was highest among five groups,which total precision improved by 2.59% and 9.55%,the Kappa coefficient increased 0.08 and 0.15,respectively.This paper presents the advantage of the decision tree based on index in land use information extraction,which provide basic data for better coordination of Harbin city of land use and urban expansion.
Key words:Decision tree classification;Indexes;Information extraction;Land use
引言
社会和经济的快速发展加剧了城市扩展与土地资源的矛盾。因此,准确提取城市土地覆被类型是研究城市扩张的基础。遥感影像为土地信息提取提供了有利的数据支持。基于遥感技术最早并且研究最多的一项基础性工作是土地利用现状调查,为更好的研究土地分布状况及数量提供基础数据[1]。遥感影像分类方法从最初的目视判读到现在的计算机自动分类,分类精度与速度不断的在提高。由于判读完全是人工操作,很容易受到工作人员的主观随意性的影响,大规模的、需要快速获取分类结果的信息提取不适合使用此方法,且工作效率低。而计算机自动分类对遥感图像地物属性的分类和识别是模拟了人类的识别能力来分的计算机技术 [2]。但是传统的分类方法只基于光谱特征差异识别地物,分类结果因“同物异谱”和“同谱异物”,易出现较多的误分、漏分情况,从而影响分类精度。随着遥感技术的发展,80年代以来新的方法和理论不断的被引进到遥感技术当中[3]。其中决策树是常用的遥感技术之一。决策树有运算效率高、分类速度快、分类结果直观且清晰等优点,与传统的分类方法相比,决策树弹性和鲁棒性更好,能有效提高分类精度[4,5,6]。近些年,决策树分类的研究成果较多:McCauley 等[7]利用决策树分类法对美国Montgomery的土地利用进行分类制图,结果表明:决策树分类法在提取土地利用方面具有很大的潜力。Muchoney等[8]人基于MODIS数据,利用决策树、神经网络、最大似然法对美国中部进行土地覆盖分类,结果显示决策树分类精度最高。赵萍等[9]以南方地区SPOT影像为数据源,用决策树方法提取居民地,与传统监督分类方法相比,用户精度、生产精度和Kappa系数都有很大的提高。裴欢[10]等以吐鲁番SPOT-5 1B级数据为数据源,利用多地表特征参数的决策树分类法,总精度达到87.9%,与传统分类方法进行对比,分类精度明显提高。以上研究大多基于光谱特征差异识别地物,未考虑地物指数对提高分类精度的作用。何祺胜[11]等基于渭干河-库车河三角洲的TM影像,结合归一化植被指数(Normalized Differential Vegetation Index ,NDVI)、改进归一化差异水体指数(Modified Normalized Difference Water Index , MNDWI )、K-L变换前三主成分特征,使用决策树分类方法提取盐渍地信息,总体精度达到94%。
近年来,使用决策树获取城市土地利用的方法已经成熟,但很少有研究将各类地物光谱指数应用到分类器中,并比较他们的优缺点。本研究以哈尔滨市为研究区,分析水体指数、植被指数、建筑指数和土壤指数对决策树分类精度的影响。以总精度、耕地用户精度、居民地用户精度为指标;在各类指数中筛选出三类指标最高的三个指数,分别组成三组特征变量;在以各类指数中比较常用的指数组成一组特征变量以及全部指数共五组特征变量;并对比分类精度,挑选出的最佳分类变量是:各类指数中总精度最高的特征变量组,水体指数中的改进归一化水体指数(MNDWI)、 植被指数中的修改土壤调整植被指数(Modified Soil Adjustment Vegetation Index ,MSAVI) 、建筑指数中的改进归一化裸露指数(Modified Normalized Difference Barren Index ,MNDBI)和土壤指数中的裸土指数(Bare Soil Index ,BSI)组成。而且基于指数的决策树分类方法成功的提高了分类精度,为城市土地合理利用、有效规划和可持续发展提供参考数据。
1 研究区概况与数据
1.1 研究区概况
哈尔滨市是黑龙江省省会,也是黑龙江省政治、经济、科技中心。它位于中国东北的北部,松嫩平原东部,松花江右岸,地域范围为125°42′~130°10′E、44°04′~46°40′N之间,总面积为5.31万km2。哈尔滨属中温带大陆性季风,四季分明,冬季漫长寒冷,夏季短暂凉爽,年平均气温3.4℃,年平均无霜期130天,年均降水量569 mm,降水主要在夏季 [12,13]。松花江干流由西向东贯穿哈尔滨市中部,水源充足,土壤类型以黑土为主,地势不高,为农业生产提供优良的条件。因此耕地和居民地成了哈尔滨主要土地利用/土地覆盖类型,哈尔滨土地利用/土地覆盖类型还有水田和河流以及少量的裸地、草地和林地等。
本研究选取哈尔滨市中心城区作为研究区,包括南岗区,道里区,道外区,香坊区,平房区,松北区和呼兰区,如图1所示。
1.2 数据源及预处理
本研究以Landsat-8遥感影像为数据源,轨道号为118/28。为了不影响提取土地利用信息时的精确度,在选择影像时避免云雾,研究区范围内云量为零;影像数据质量良好。原始影像在遥感软件ENVI5.1下经过波段合成,在此基础上行进行几何纠正、辐射定标和裁剪等预处理获得覆盖研究区的OLI影像数据。
2 研究方法
2.1 决策树分类方法
决策树分类方法是目前比较常用的提取各种地类信息的分类方法之一,也是提取土地类型信息的常见的一种方法。决策树是一种分层处理的结构,它的基本思想是以一些判断条件来对原始数据逐步细化的过程[14]。决策树有一个根节点,还有一些中间节点和叶子节点构成的树状数据。决策树的每一个节点只有一个父节点和两个或多个后代节点。决策树每个分支点是一个决策判断条件,每个分支点下两个叶子节点,代表着不满意和满意的条件。该方法不需要任何先验统计假设。因此很多遥感影像提取所需要的信息当中决策树分类法被广泛的使用。决策树分类方法跟传统的最大似然法方法比起来,准确度更高,计算量也不大,在学习过程中容易被使用者了解等优点。
2.2 光谱指数
指数模型是根据多光谱影像中各类地物对不同波段的不同反映,在波段间突出地物信息的算法。它能很好地解释各类土地覆盖类型的特点,计算容易实现,方便实用。以下为本研究共选择的20个光谱指数,分别是水体类指数:归一化水体指数(Normalized Difference Water Index,NDWI)和改进的归一化水体指数(MNDWI);植被类指数:归一化植被指数(NDVI)、土壤调整植被指数(Soil-Adjusted Vegetation Index,SAVI)、修改土壤调整植被指数(Modified Soil Adjustment Vegetation Index,MSAVI)、增强植被指数(Enhanced Vegetation Index,EVI)、差值植被指数(Difference Vegetation Index,DVI)、比值植被指数(Ratio Vegetation Index,RVI)和绿度植被指数(GVI);建筑类指数:归一化建筑指数(Normalized Difference Barren Index,NDBI)、改进归一化裸露指数(Modified Normalized Difference Barren Index,MNDBI)、归一化三波段指数(Normalized Difference Three Bands Index NDTBI)、比值居民地指数(Ratio Resident-area Index,RRI)、比值不透水面指数(Ratio Impervious Surface Index,RISI)和生物物理组成指数(Biophysical Composition Index,BCI);土壤类指数:裸土指数(Bare Soil Index,BSI)、增强型裸土指数(Enhanced Bare Soil Index,EBSI)、归一化差值裸土与建筑用地指数(Normalized Difference Bareness and Built - Up Index,NDBBI)、归一化土壤指数(Normalized Difference Soil Index NDSI)和比值归一化土壤指数(Ratio Normalized Difference Soil Index RNDSI)。
2.3 训练样本与验证样本的选取
为了减少人为因素对分类结果的影响。本研究在研究区中选了500个随机点随着随机点使用ENVI的ROI采样工具选择训练样本。将70%的样本作为训练样本,30%作为验证样本。
3 结果分析
3.1 精度评价
精度评价是对分类结果准确性的评估。本研究利用混淆矩阵以分类总体精度、Kappa系数和用户精度为指标进行精度评价。当地物光谱分别与各类水体指数、植被指数、建筑指数和土壤指数结合做变量的决策树分类的结果:不同遥感指数对决策树分类精度的影响不同,不是每个遥感指数都能够提高分类精度。如表1所示。
3.2 指数的选取
根据决策树能融合不同来源和特征的数据,指数能突出各类土地覆盖类型的优点,使用基于遥感指数的决策树分类方法提取研究区土地类型信息。本研究依据不同指数对决策树分类精度影响的不同,组成以下五组多变量决策树数据,提取哈尔滨市土地类型信息:
第一组:选择各类指数中总精度最高的指数,分别是水体指数中的NDWI和MNDWI的精度一样高、植被指数中的DVI、建筑指数中的BCI和土壤指数中的EBSI与地物光谱结合进行决策树分类。由于水体指数中的两个遥感指数精度一样高。这一组做了三组变量。
第二组:各类指数中选出耕地用户精度最高的作为一组,水体指数中的NDWI、植被指数中的RVI、建筑指数中的NDBI和土壤指数中的EBSI与地物光谱结合进行决策树分类。
第三组:各类指数当中选出居民地精度最高的作为一组,水体指数中的MNDWI、植被指数中的MSAVI、建筑指数中的RISI和土壤指数中的EBSI与地物光谱结合进行决策树分类。
第四组:选择各类指数中最常用的指数,水体指数中的MNDWI、植被指数中的NDVI、土壤指数中的NDSI和建筑指数中的NDBI与地物光谱结合进行决策树分类。
第五组:文中提到的20个指数同时与地物光谱结合进行决策树分类。
在基于多变量的决策树分类中不同指数的组合对分类精度的影响不同(如表2所示)。基于指数的决策树与于单纯地物光谱的决策树分类结果和最大似然法的分类结果对比(如图2所示)。
4 结束语
本研究以哈尔滨市Landsat-8影像为研究对象,计算出研究区水体指数,植被指数,建筑指数,土壤指数四类指数共20个指数,并与地物光谱结合进行决策树分类。对比分析各类指数对决策树分类中的影响,组成五组特征变量。五组数据中分类准确度最高的一组是基于MNDWI、MSAVI、RISI和EBSI 的决策树分类结果:总精度为85.68%,Kappa系数为0.80。与传统最大似然分类方法总精度76.13%和Kappa指数0.65相比,总精度提高了9.55%,Kappa系数提高了0.15;与基于单纯地物光谱决策树分类的总精度83.09%和Kappa系数0.72相比,总精度提高了 2.59%,Kappa系数提高了0.08。
遥感土地类型信息提取中,基于指数的决策树分类方法与普通决策树和最大似然法相比分类精度都有所提高,并且不同的组合分类结果不同。在此方法中,不是光谱指数越多越好,也不是常用光谱指数组合的分类准确度最高,而是要选择指数最为关键。该方法结合指数模型和决策树,并保留了两种方法的优点,分类速度快、鲁棒性强,而且提高了分类准确度。
但本研究没有考虑到DEM数据、地表温度数据,忽略了地表高程,这些因子对分类精度都有一定的影响;只选取了较小研究范围,在今后研究中可以尝试将此方法用到更大研究区域范围的土地利用信息提取。
参考文献
[1]齐红超,祁元,徐瑱.基于C5.0决策树算法的西北干旱区土地覆盖分类研究—以甘肃省武威市为例[J].遥感技术与应用,2009,24(5):648-653.
[2]李爽,丁圣元,许叔明.遥感影像分类方法比较研究[J].河南大学学报(自然科学版),2002,32(2):70-73.
[3]杜凤兰,庆久,夏学齐.遥感图像分类方法评析与展望[J].遥感技术与应用,2004,9(6):521-525.
[4]POWELL S L,COHEN W B,YANG Z,et al. Quantification of impervious surface in the Snohomish Water Resources Inventory Area of Western Washington from 1972-2006[J].Remote Sensing of Environment,2008,112(4):1895-1 908.
[5]LU D,WENG Q.Spectral mixture analysis of the urban landscape in Indianapolis with Landsat ETM+imagery[J].Photogrammetric Engineering and Remote Sensing,2004,70(9):1 053-1 062
[6]李爽,张二勋.基于决策树的遥感影像分类方法研究[J].地域研究与开发,2003,22(1):17-21.
[7]MCCAULEY S,G OETZ SJ.Mapping residential density patterns using multi-temporal Landsat data and a decision-tree classifier[J].International Journal of Remote Sensing,2004,25(6):1077-1094.
[8]Muchoney D,Borak J,Chi,H,et al.Application of the MODIS global supervised classification model to vegetation and land cover mapping of Central America[J].International Journal of Remote Sensing,2000,21(6):1115-1138.
[9]赵萍,冯学智,林广发.SPOT卫星影像居民地信息自动提取的决策树方法研究[J].遥感学报,2003,7(4):309-315.
[10]裴欢,房世峰.基于地物光谱特征和空间特征的干旱区绿洲土地分类[J].地理科学,2013,33(11):1395-1399.
[11]何祺胜,塔西甫拉提·特依拜,丁建丽.基于决策树方法的干旱区盐渍地信息提取—以渭干河-库车河三角洲绿洲为例[J].资源科学,2006,28(6):134-140.
[12]宋戈,高楠.基于DEA方法的城市土地利用经济效益分析—以哈尔滨市为例[J].地理科学,2008,28(2):185-188.
[13]黄辉玲,吴次芳.基于可拓学的生态市建设评价—以哈尔滨市为例[J].地理科学,2009,29(5):651-657.
[14]潘琛等.决策树分类法及其在遥感图像处理中的应用[J].测绘科学,2008,33(1):208-211.