基于CART决策树的ZY-3卫星遥感数据土地利用分类监测
2016-12-22孙建伟马婧婧
孙建伟, 王 超, 王 娜, 马婧婧, 罗 静*
(1.华中师范大学 地理过程分析与模拟湖北省重点实验室, 武汉 430079;2.华中师范大学 城市与环境科学学院, 武汉 430079;3.天津市渤海城市规划设计研究院, 天津 300451;4.十堰市土地勘测规划院, 湖北 十堰 442000)
基于CART决策树的ZY-3卫星遥感数据土地利用分类监测
孙建伟1,2, 王 超3, 王 娜4, 马婧婧2, 罗 静1,2*
(1.华中师范大学 地理过程分析与模拟湖北省重点实验室, 武汉 430079;2.华中师范大学 城市与环境科学学院, 武汉 430079;3.天津市渤海城市规划设计研究院, 天津 300451;4.十堰市土地勘测规划院, 湖北 十堰 442000)
通过分析ZY-3卫星遥感影像光谱特征、数据质量,探讨其遥感影像在土地利用分类监测领域的应用前景.基于遥感影像特征,结合面向对象的分析思想,选择训练样本构建决策树分类模型,进行土地利用计算机自动分类,并通过混淆矩阵和Kappa分析对分类精度进行评价.研究表明:1)基于决策树模型和面向对象分类方法,ZY-3卫星遥感影像分类总体精度为88.76%,有助于提高影像分类精度;2)在分类模型中,ZY-3卫星影像对水域、耕地、公路用地和林地影像辨识度较高,而对于其它用地类型相对不足.3)ZY-3卫星数据高分辨率影像特征明显,影像可用于土地利用分类监测.
ZY-3卫星; 数据质量; 土地利用; 分类精度
近年来,高分辨率遥感影像应用逐渐广泛,小范围的土地利用实时监测成为可能[1].在高分辨率遥感影像土地利用分类研究领域,国内学者已针对Quick Bird,SPOT5等数据源的国外卫星遥感影像数据开展了很多相关研究.任国业论述了Quick Bird影像的图像处理和影像解译方法,进行县域土地利用更新调查实践[2];楼立明等阐述了利用SPOT5高分辨率遥感影像进行镇域土地利用变化监测的方法和过程,认为将SPOT5遥感影像与相关数据综合应用于1∶1万土地利用变化监测是可行的[3].然而,受制于国产卫星影像精度不高的长期影响,国产高分辨率遥感影像在土地利用分类监测中的应用研究相对较少[4].
ZY-3是资源三号卫星的简称,是我国第一颗自主研发的民用高分辨率立体测绘卫星,装载三线阵测绘相机和多光谱相机,其运行的太阳同步回归轨道高度约506 km,倾角约97.42°.该卫星可提供幅宽大于51 km、分辨率2.1 m(全色)和5.8 m(多光谱)的平面影像和分辨率达3.5 m的立体影像.因此,卫星具备空间测绘和国土资源调查的综合功能,可应用于国土资源调查与监测[5].ZY-3星载多光谱相机的分辨率为5.8 m,设置了蓝、绿、红和近红外4个波段,可实时或准实时地将图像数据传回地面接收站,通过地面处理提供假彩色及真彩色ZY-3图像产品[6].4个波段的光谱设置基本延续了美国Landsat、法国SPOT及中巴资源卫星CBERS等系列卫星数据的光谱范围.
ZY-3卫星的高分辨率遥感影像应用前景较为广阔,但是目前关于ZY-3卫星遥感数据的研究以在轨测试和成像定位精度为主,涉及土地利用分类监测的研究成果相对较少,亟待探索.本文尝试利用土地分类要素在高分辨率影像上的表现特点,基于CART决策树提取各要素在光谱、纹理、形式方面的特征;选取ZY-3高分辨率影像土地利用信息提取的优化方法,建立单时相ZY-3数据土地分类监测模型,实现土地利用信息的智能提取,并对分类精度进行评价,为利用高分辨率遥感数据进行土地利用分类监测工作提供参考.
1研究区概况与数据来源
1.1研究区概况
选取湖北省荆州市荆州区八岭山镇为研究区域,影像地面覆盖范围位于荆州城区西北部(图1),属亚热带湿润季风气候,地势较为低平,有少数丘陵和洼地,为典型的冲积平原,地貌特征丰富,适合于研究ZY-3卫星遥感影像对不同区域和地物的辨识能力.八岭山镇降雨充沛、土壤肥沃,因此植被覆盖面积较广,约占总面积70%,其余地表覆盖以建设用地和水体为主.通过实地考察,区内植被覆盖区域多为耕地,且为基本农田保护区,因此开展土地利用监测意义较大;其余植被覆盖区域以八岭山上的林地以及周围缓坡园地为主,分布面积较小;建设用地主要包括以汉宜高速、318国道为主的交通用地,以及散乱分布的农村居民点用地;水体主要为湖泊和坑塘;此外,草地和未利用地少量分布.
图1 研究区在湖北省的位置Fig.1 Location of the study area in Hubei Province
1.2数据来源
ZY-3星载多光谱相机的分辨率为5.8 m,覆盖宽度为51 km,设置了Band1(0.45~0.52um)、Band2(0.52~0.59um)、Band3(0.63~0.69um)和Band4(0.77~0.89um)4个波段,全色波段(0.45~0.80um)影像的分辨率为2.1 m[7].以覆盖江汉平原一景ZY-3数据为信息源,其遥感影像获取时间为2012年2月,整景影像示意如图2.作为比较的土地利用数据来源于2009年八岭山镇土地利用现状图,制图比例尺为1∶10000,按照第二次土地调查类型进行分类.
图2 研究区遥感影像Fig.2 Remote sensing digital image of the study area(左为多波段真彩色合成影像,空间分辨率为5.8 m;右为全色波段灰度影像,空间分辨率2.1 m)
2遥感数据预处理
2.1遥感影像校正
在ENVI4.8软件的支持下,采用多项式法对研究区ZY-3影像数据进行几何精纠正,三次卷积法进行像元重采样.校正基准图像为坐标系统定义明确的第二次全国土地调查成果,校正控制点数量为30个,主要采样目标为道路交叉点、房屋拐点等易分辨的要素,且在整个图幅上均匀分布.最终选定的控制点总的RMS为0.293 6,满足土地利用变化动态监测几何校正误差要求.通过影像校正,可统一ZY-3影像和第二次全国土地调查成果的坐标系统,同时消除几何畸变.
2.2遥感影像融合
遥感影像融合是指通过将多波段低分辨率的遥感影像与单波段高分辨率的遥感影像进行合成处理,以便获得同时具有高分辨率和多波段的遥感影像的操作过程[8].本文采用Gram-Schmidt变换方法,通过影像融合(图3),将多波段影像的空间分辨率由5.8 m提高到了2.1 m,使得地物识别能力明显增加.
图3 影像融合前后对比Fig.3 Contrast between original image and fused image(左为融合前的影像截图,右为融合后的影像截图)
3研究方法
3.1影像分类方法
影像分类方法众多,在实际分类中各种方法的适用性存在显著差别.基于ZY-3高分辨率影像在光谱、纹理、形状等方面表现出的显著特征,本文选择面向对象的分类思想;同时参考分层分类思想,即各种地类在不同特征上存在敏感性差异,利用先验知识和辅助数据,针对特定地类采取最佳方法将其进行分类提取的目标,选择基于决策树的分类方法.
3.1.1面向对象的影像分类 在样区内,ZY-3影像上同物异谱和同谱异物现象大量存在.如果采用传统的面向像素的分类方法,则会出现严重的噪点现象,分类精度也会受到重要影响.本文采用面向对象的遥感影像分类方法,该方法最重要的特点是分类的最小单元不再是单个的像素(像元),而是通过影像分割技术得到的同质影像对象(图斑);且分类不仅局限于光谱特征范畴,而是依据同质影像对象的光谱、纹理、形状等特征的集合[9].因而,相对于传统分类方法,面向对象的影像分类方法能充分利用遥感影像所蕴含的多种信息,使得分类结果更加合理,所以更适合进行高分辨率遥感影像的分类[10].
3.1.2基于决策树的分类模型 决策树能直观表示知识,代表对象属性与对象值之间的映射关系.在机器学习中,决策树学习可以籍由分类已知的事例来建立一个树状结构,并从中归纳出事例蕴含的某些规律;在决策系统中,决策树是一个预测模型,利用生成的决策规则集,可对样本外的事例进行预测[11].其中,CART算法(Classification And Regression Tree,又名分类回归树)基于统计理论进行模式识别,具有强大的统计解析功能,相对于二叉树决策树,它将最优通用树的发现和决策模型的精度验证嵌入到了本身的算法之中,提高规则提取的自动化程度;同时,其构建的二叉树结果包含的决策规则更加简单易懂.因此,可以基于CART算法建立遥感影像分类决策树,对特征样本数据建立统计解析模型.
本文土地利用分类系统以《土地利用现状分类》(GB/T 21010-2007)为参考,着重保留具有使用价值的类型信息,同时依据ZY-3遥感影像在亮度、色调和纹理等方面的表现特征,压缩了部分分类内容.最终确定的分类系统包含耕地、园地、林地、城乡建设用地(城镇用地、农村居民点)、公路用地、水域(滩地、河渠、水库、坑塘)和其他土地(包括草地)7个地类.针对每一种地类,各选取了160个左右的样本开展特征提取.特征样本的选取是特征提取阶段的关键,因此特征样本一定要保证足够的数量,同时要保证足够的代表性.
3.2影像分类流程
设计影像分类流程如下:首先,利用影像的光谱特征和空间信息在原始影像上识别并划分出合理的分割范围,生成影像对象,结合影像特征构建分类标准,构建特征空间;然后,基于影像对象选择学习样本;最后,构建决策树分类模型,执行分类,并进行分类精度评价.
图4 研究区影像分类流程Fig.4 Flow chart of image classification in the study area
第1步:利用ENVI FX软件所提供的Full Lambda-Schedule算法实现合并分块效果.经过反复实验,分割尺度选择40,合并尺度选择90的分割尺度下,分割效果最佳.
第2步:经过反复不断地调整,最终设定土地利用分类标准为耕地、园地、林地、城乡建设用地、公路用地、水域和其他土地7个地类,测算最优分割尺度下,各种地类光谱特征、纹理特征和形状特征.光谱特征如最小灰度值minband_x、最大灰度值maxband_x、均值avgband_x、标准差stdband_x、波段比值bandratio﹛bandratio=(band4-band3)/(band4+band3)﹜、色调hue、饱和度saturation和亮度intensity等;纹理特征如均值tx_mean、、相异tx_range、标准偏差tx_variance和熵tx_entropy;形状特征如面积area、周长length、紧实度compact、凸度convexity、坚固性solidity、圆特征roundness、形状要素formfactor、延伸性elongation等.
第3步:利用SPSS19.0建立CART决策树,设置自变量包含影像的各项光谱特征、纹理特征和形状特征.设置验证方式为交叉验证,最大树深度为10.
4结果与分析
4.1基于CART算法的ZY3遥感影像分类决策树
运行SPSS19.0软件,得到对象分类规则如下:
第1步:If bandratio > 0.1122,then object belongs to "耕地".
第2步:If bandratio [-0.4284,0.1122] AND avgband_3 > 314.9985 AND roundness > 0.1726,then object belongs to "城乡建设用地".
第3步:If bandratio [-0.4284,0.1122] AND avgband_3 > 314.9985 AND roundness < 0.1726,then object belongs to "公路用地".
第4步:If bandratio < 0.1122 AND avgband_3 < 314.9985 AND tx_entropy < 0.1757,then object belongs to "水域".
第5步:If bandratio < 0.1122 AND avgband_3 < 314.9985 AND tx_entropy > 0.1757 AND avgband_2 < 306.5675,then object belongs to "林地".
第6步:If bandratio < 0.1122 AND avgband_3 < 314.9985 AND tx_entropy > 0.1757 AND avgband_2 > 306.5675 AND bandratio < 0.0019,then object belongs to "其他用地".
第7步:If bandratio < 0.1122 AND avgband_3 < 314.9985 AND tx_entropy > 0.1757 AND avgband_2 > 306.5675 AND bandratio > 0.0019,then object belongs to "园地".
决策树如图5所示.
分类规则显示,耕地的波段比值(bandratio)特征较为明显,可以以此提取出耕地;城乡建设用地和公路用地的红光波段DN值(avgband_3)平均值要高于其他的地类,可据此对这两种地类进行提取,然后根据公路用地圆特性(roundness)较小的特征区分公路用地与城乡建设用地;对于园地、林地、水域和其他用地,可以利用水域熵值(tx_entropy)很小的特征对水域进行划分;对于园地、林地和其他用地,可以利用林地的绿光波段DN值(avgband_2)低于其他地类的特征,提取林地;对于园地和其他用地,可以利用其他用地与园地波段比值(bandratio)不在同一分布区间的特征,进行划分.
4.2影像分类结果
利用上文构建的CART影像分类决策树对八岭山镇的ZY-3遥感数据进行土地利用类别划分,得到的结果为图6a所示,并将分类结果与土地利用现状(图6b)进行比较,实现分类效果和土地利用变化的初步定性分析.
图5 影像分类决策树Fig.5 The decision tree of image classification
图6 研究区土地利用现状分类结果Fig.6 Classification results of land use status in the study area
4.3分类精度评价
采用随机采样、分类检验的方式对影像分类结果进行评价,即从整幅影像中随机选择一定数量的参考图斑,对信息提取结果精度进行评价.通过野外实地考察或依据土地利用变更调查数据判别和确定参考图斑的实际地类,然后执行评价,得到分类图的精度评估误差矩阵.分类结果的精度和误差评价显示在一个混淆矩阵里,同时记录总体精度和Kappa系数,结果如表1所示.
表1 基于决策树的分类结果混淆矩阵
从表1可以看出,园地存在较高的错分率,为30.06%,林地和耕地容易与园地发生混淆,这可能是因为影像获取的时间为冬季,园地内果树树叶凋落,导致与林地和耕地的影像辨识度变低;其他用地错分率也相对较高,为23.89%,与其容易发生混淆的地类为园地、耕地、水域和城乡建设用地;园地和城乡建设用地漏提率相对较高,分别为16.71%和14.81%.综合评价分类结果,分类总体精度为88.76%,相对较高,主要是因为耕地和水域的分类精度高,且这两种地类在研究区分布广泛的缘故.Kappa系数值表明影像分类结果一致性强,具有较强的可靠性.
5结论与讨论
1) ZY-3遥感数据空间分辨率较高,影像清晰,存在较高的空间一致性.利用影像分类技术,可以实现对耕地、园地、林地、城乡建设用地、公路用地、水域和其他用地等地类的自动提取,解译精度较高,可满足土地利用分类监测需求.
2) 本文采用基于CART决策树的高分辨率影像地类提取方法,针对遥感影像上的典型地类特点,面向对象式的采用多种提取类特征,建立多层次的分类规则进行地类提取,总体精度达到88.76%.实验证明:将决策树理论运用于高分辨率遥感影像分类提取,有助于提高影像分类提取精度.
3) 对比各种地类在影像分类中的精度,可以发现ZY-3卫星遥感影像辨识度最高的地类是水域,其次是耕地、公路用地和林地;而对于城乡建设用地、园地和其他用地,影像辨识度仍待改善,仍然需要发掘适用于此地类的影像特征辅助开展影像分类.
在实验中,尝试进行土地利用二级类型划分,但自动分类的精度不是很高.其主要原因是遥感影像获取时间为冬季,地类自身差异较小,仅从光谱、纹理、空间特征上难以体现二级地类间的差异;且ZY-3光学载荷光谱波段只有四个波段,监测能力也确实受到一定程度的限制.
[1] 周成虎. 遥感影像地学理解与分析[M]. 北京:科学出版社, 1999.
[2] 任国业, 湛洪举, 周华茂, 等. 利用快鸟卫星影像开展县级土地利用更新调查方法初探[J].西南农业学报, 2005,18(01):74-76.
[3] 楼立明, 刘卫东, 冯秀丽. 基于高分辨率遥感影像的土地利用变化监测[J].遥感技术与应用, 2004,19(1):30-33.
[4] 易 玲, 汪 潇, 刘 斌. HJ-1卫星数据质量及其在土地利用中的应用研究[J].国土资源遥感, 2009(3):74-77.
[5] 李德仁. 我国第一颗民用三线阵立体测图卫星——资源三号测绘卫星[J].测绘学报, 2012, 41(3):317-322.
[6] 李 霖, 罗 恒, 唐新明, 等. 资源三号卫星多光谱图像特征分析和质量评价[J].国土资源遥感, 2014, 26(1):17-24.
[7] 曹海翊. “资源三号”卫星遥感技术[J].航天返回与遥感, 2012, 33(3):7-15.
[8] 周兴东, 于胜文, 赵长胜, 等. 利用遥感图像进行土地利用分类方法的研究[J].煤炭学报, 2007, 32(5):481-484.
[9] 陆美蓉. 面向对象的高分辨率遥感影像分类及应用研究[D].南京:南京林业大学,2010.
[10] FIGUEIREDO S M D M, CARVALHO L M T D. Evaluation of decision tree classification accuracy to map land cover in Capixaba, Acre [J]. Cerne, 2006, 12(1): 38-47.
[11] 程晓兰. 决策树分类算法及其应用[D].大连:大连交通大学,2008.
[12] FOODY G M. On the compensation for chance agreement in image classification accuracy assessment [J]. Photogrammetric Engineering and Remote Sensing, 1992, 58(10): 1459-1460.
Research on land use classification monitoring through the Remote Sensing data of ZY-3 satellite based on CART decision tree
SUN Jianwei1,2, WANG Chao3, WANG Na4, MA Jingjing2, LUO Jing1,2
(1.Key Laboratory for Geographical Process Analysis & Simulation, Hubei Province,Central China Normal University, Wuhan 430079;2.College of Urban and Environmental Sciences,Central China Normal University, Wuhan 430079;3.Tianjin Bohai Urban Planning & Design Institute, Tianjin 300451;4.Shiyan Land Surveying & Planning Institute, Shiyan, Hubei 442000)
The purpose of this paper is to analyze the spectral signature and image quality of ZY-3 satellite and discuss its application prospect in the field of land-use classification and monitoring. Methods employed are that based on the features of the high-resolution image. Object-oriented thinking is used to select training samples to build a decision tree classification model. Land use classification is then performed automatically by computer and the classification accuracy is evaluated by confusion matrix Kappa analysis. The results indicate that 1) based on the models of decision tree and object-oriented classification, the classification accuracy of ZY-3 satellite is 88.76 percent, which serves to improve the classification accuracy; 2) through classification models based on ZY-3 satellite, the ground objects of water body, farmland, road and forest show higher distinguishing degree than others; 3) ZY-3 satellite data is characterized as high-quality resolution, which can be used in land-use classification and monitoring.
ZY-3 satellite; image quality; land use; classification accuracy
2016-04-19.
国家自然科学基金项目(41371183,41501145);华中师范大学中央高校基本科研业务费项目(CCNU16JCZX09);国家测绘地理信息局卫星测绘应用中心科技支撑项目(2011BAB01B05).
1000-1190(2016)06-0937-07
F301.24; P237
A
*通讯联系人. E-mail: luojing@mail.ccnu.edu.cn.