基于遥感影像的保定市土地利用分类研究
2022-03-29祝文华张启明
祝文华,张启明,张 培
(1保定理工学院资源与工程技术学院 河北 保定 071000)
(2华北地质勘查局五一九大队 河北 保定 071000)
0 引言
土地资源是人类赖以生存的重要资源,人类生产活动正在快速改变土地利用类型的分布和属性。随着环境变化和城镇变迁,土地资源就显得更加珍贵。国家进行的土地调查是为了实现基础数据成果信息化管理与共享,满足生态文明建设、空间规划编制、国土空间用途管制等各项工作的需要。近年来,3S技术的发展日益成熟,给土地管理部门提供了土地利用动态监测新的思路与方法。及时有效地获取土地利用信息对指导社会,经济、土地资源的合理利用和环境发展及科学管理土地资源有着重要的现实意义。传统的分类提取调查采取实地测量与统计相结合的方法,效率低下,数据的更新能力较差。遥感能够进行空间连续覆盖和长时间持续观测,因而成为土地覆盖数据获取的重要手段。
2015年,保定市城区范围进行了调整,市区面积扩大了近7倍;2017年,国家设立雄安新区,保定迎来历史大变革,城中村征地提上议程,全区土地利用类型发生明显变化。因此,科学合理地进行土地利用分类,不仅有助于政府摸清自己的土地情况,建立城市的土地规划体系,满足区域规划的需求,也有利于进行城市的土地利用动态监测,以便持续合理地开发和使用现有的土地资源。为了对保定市区的土地利用状况进行统计,分别采用非监督分类、监督分类和多源决策树3种方法的多种算法进行分类,并对该研究区分类方法和分类精度进行了对比分析,取精度较高的方法进行各种土地分类数据的变化分析。
1 研究区概况及使用的遥感数据
研究区域位于河北省保定市。作为毗邻新区的保定市,2015年5月13日,国务院对保定行政区划进行了调整:保定市辖区由3个变成5个,原来的3个市辖区中的新市区更名为竞秀区,原来的北市区、南市区合并设立为莲池区,增加设立满城区、清苑区和徐水区。城市的扩张必定带来植被减少、土地退化和环境破坏等问题,本着建设生态城市的宗旨,土地利用变化很长一段时间内仍是关注的重点。本文使用遥感数据从影像层面上对保定市区的土地利用情况进行分类统计,对城乡土地利用情况进行了统计分析。本文采用的数据源为Landsat 8多光谱遥感影像,轨道编号为124/033,参照天气情况和温度以及云量情况选取研究区2018年和2013年同时期的数据,这个时间是北方夏季,农作物生长旺盛,天气干燥,气温高,且较长时间未降雨,分类干扰因素较少。Landsat 8影像的多光谱波段空间分辨率为30 m,全色波段分辨率为15 m,已完成辐射校正和几何粗校正处理。
2 分类方法
遥感图像分类就是将图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或者其他信息,按照某种规则或算法划分为不同的类别[1]。
非监督分类是在没有训练样本获得先验知识的情况下,根据像元在各波段值的相似性进行归类,并保证各类别的距离尽可能地大。在ENVI软件中可以人为设置类别个数,一般是多于最终分类数,再经过分类后处理进行类别的删除和合并得到分类结果。
监督分类,又称训练分类法,即利用足够的具有代表性的训练样本建立判别函数进行待分像元的类别的判定,需要人工建立每一种分类类别的样本数据,并对样本数据的分离性进行计算。常用方法包括最小距离法、多级切割分类法、特征曲线窗口法和最大似然比分类法。
决策树分类是基于遥感图像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类[2]。决策树分类与传统的分类方式相比,可参与分类的数据源不局限于某种卫星遥感影像,像非监督分类的结果,DEM数据,波段比值运算的结果都可以作为数据源来使用。常用的监督分类和非监督分类太过依赖目视解译和光谱特征分离性,精度很大程度上在于确定的分类数目和样本选择的全面性,对于同物异谱和同谱异物的问题很难解决。实际分类过程中,通过研究各种地物类别的各个波段的光谱特征结合专家经验总结进行数理统计,获得分类规则,也可引入非监督分类结果或DEM等数据源通过设置阈值建立一种树状结构的框架,来进行遥感分类。
3 研究过程
3.1 影像预处理
监督分类主要使用目视解译,对影像进行波段叠合和几何校正,接着进行主成分分析提取,波段融合和标准假彩色合成就可以通过实地采集的样本数据进行建立各类土地类型的感兴趣区域来进行监督分类。根据Landsat 8数据特性及本研究区土地覆盖特征的特点,一开始确定的分类结果为居民地、道路、林地、耕地、裸地和水体,通过分析,只有居民地和道路样本数据的分离度小于1.9,由于分类效果不是很好,最终分类的结果为建设用地、林地、耕地、裸地和水体,其中建设用地包括居民地、厂矿单位和道路设施。学校位于莲池区和清苑区的交接处,在学校建立GPS控制网后,利用GPS接收机到周边城区和农村进行野外调查获取采样数据(调查区域为近些年没有发生土地利用变化情况的区域),对于其他区的采样数据使用奥维地图来进行室内目视判读验证来提高解译精度(图1~2)。
在决策树分类中,除了对研究区影像进行了影像-影像模式的几何校正外,由于NDVI参数需要使用反射率,在ENVI软件中使用Radiometric Correction/Radiometric 进行辐射校正,获得反射率reflectance,接下来使用Layer Stacking和Gram-Schmidt Pan Sharpening对1-7多光谱和全色波段进行波段叠加和波段融合,接着使用全色波段进行图像融合将分辨率提高到15 m。
3.2 行政区划数据
研究中使用的行政区划的shp数据是从国家基础数据库下载的1:25万的矢量数据,该矢量数据是线文件wl格式的,可在MapGIS软件中转换为ArcGIS中的线shp文件,然后把行线数据转换为polygon数据,作为后续裁剪遥感影像和高程数据的面shp文件,为了与遥感影像的投影一致,需要在ArcGIS中添加原有投影信息,需要将面shp文件的投影转换为UTM投影。
3.3 DEM数据
DEM使用的是ASTER GDEM 30M分辨率数字高程数据,ASTER GDEM数据是免费向公众分发的,可以从中科院地理空间数据云下载,是目前唯一覆盖全球陆地表面的高分辨率高程影像数据[3]。下载选择ASTER GDEM V2全球数字高程数据,该数据进行了修正,下载的影像编号为N39E114、N39E115、N38E114和 N38E115,在ENVI中进行投影转换为UTM投影坐标系,然后对投影后的影像再进行mosaic拼接,接着将DEM的分辨率由30 m转变成15 m,便于与遥感数据进行叠加分析来建立决策树(图3、图4)。
3.4 决策树的建立
由于单纯通过单一波段设置阈值的方法来进行类别的区分比较困难,引入NDVI、NDBI和DEM数据来参与土地分类模型,对Landsat 8多光谱遥感影像计算NDVI(归一化植被指数),来进行植被的提取是一种非常有效的方式。NDVI的计算方法有近红外波段/红波段或(近红外波段-红波段)/(近红外波段+红波段),ETM的红波段和近红外波段是3和4波段,Landsat 8的红波段和近红外波段是4和5波段的反射率。NDBI(归一化建筑指数)是Landsat 8影像的6波段和5波段的差与和的比值[4]。
接着对监督分类中的训练区样本数据进行各波段数据的最大值、最小值、均值和方差统计分析,结合单波段的统计分析情况,采用遥感影像单波段统计特征值,DEM数据和NDVI相结合的方式建立分类决策树[5]。先利用NDVI值区分出植被和非植被,用2波段和NDBI分出水域和建设用地,对于植被区的分类,加入DEM数据进行辅助分类,分出林地和耕地(图5)。
使用同一套外业的采样数据来进行各种分类方法的精度对比发现:以2013年的数据为例,决策树分类结果的精度为93.458%,比普通监督分类方法高2.024%,Kappa系数为0.952,比监督分类高0.093。使用决策树方法对2013年和2018年的各类土地使用面积进行了统计(图6、图7)。通过调查研究发现,水体、林地、建设用地和裸地面积都有所增加,耕地的面积减少,主要原因有:农村劳动力短缺造成人为撂荒,国家征地进行城市建设,有的地区村民因年龄过大在耕地上种植树木进行买卖。另外,保定城市化进程加快,毫无疑问带来了建筑面积增加,近些年也进行了盛大的绿化造林工作,使的林地面积增加。徐水的瀑河水库在2018年,得益于南水北调流经瀑河水库给白洋淀进行补水,另外,保定政府也进行了市区护城河的治理,使得水体面积增加。
4 结语
对保定市区进行监督分类,由于GPS信号的覆盖距离和高楼的遮挡,我们只在莲池区和清苑区进行了样本数据点的采集,建立训练样本也是选用南部区域的点。在进行决策树分类规则的设定时,需要全区具有代表性地物点作为实验数据,除了GPS采样点作为一部分实验数据,又根据奥维地图上的地类清楚区域对应找到的影像点作为另一部分实验数据,这两部分大量样本数据基础上共同进行地物的光谱特征分析,来找到分类波段和阈值,进行决策树分类。
通过研究发现,使用监督分类的精度不如决策树分类精度高,主要有以下两个原因:(1)因为使用GPS进行采样点的区域主要在学校周边,根据样本的颜色和纹理特征对周边区域的分类较好,但是对于西北部区域的分类效果较差,造成总体精度低;(2)决策树分类采用面向对象方式,从地物的反射率出发,利用各种地物的反射率阈值特征结合地形数据进行综合分析,比监督分类的目视解译效果更好,从而分类结果精度较高,但也需要进行各种地物的波段分析和决策树的分类结果的反复验证。