基于Landsat遥感影像的浙江省建设用地扩张监测
2022-08-25王贝贝李星月
王贝贝,李星月,陈 濛
浙江省城乡规划设计研究院,浙江 杭州 310030
0 引 言
城镇作为人类生产生活的重要场所,是非农经济社会要素高度密集的综合体[1-2]。近年来,城市经济快速发展,城市人口迅速增加,使得居住、生产用地需求不断上升,进而导致城镇空间持续扩张,建设用地规模增大[3-4]。我国的城镇化率由1978 年的17.90%增长到2018 年的59.58%[5-7]。土地是城镇建设的最基本载体,城镇化过程和经济社会活动离不开土地资源,快速高效地提取城镇建设用地,准确分析时空格局演变及驱动力,是区域可持续发展的科学依据和重要保障[8-10]。
遥感技术观测范围广,观测成本较低,近年来在土地利用变化监测中广泛使用,Landsat 影像由于获取时间的连续性强以及中等分辨率的优势,使其适合监测土地利用方面的变化[11-13]。基于Landsat 遥感影像提取建设用地变化主要有两类方法:一是通过选择样本点利用机器学习进行影像分类,有研究表明,支持向量机分类方法提取城镇建设用地作用显著,通过此方法可以在城市群层面进行长时间序列的城镇建设用地扩展动态监测[14-15]。CART 决策树和最大似然分类方法在城市历时30 年的建设用地变化情况监测取得了较为理想的效果[16-17]。二是通过波段运算构建指数进行土地覆被分类,其中归一化植被指数(Normalized Difference Vegetation Index,NDVI)、归一化水体指数(Normalized Difference Water Index,NDWI)、归一化建筑指数(Normalized Difference Built-up Index,NDBI)、改进的归一化建筑指数(Built-up Index,BI)、新居民地提取指数(New Built-up Index,NBI)等在土地覆被信息提取方面作用显著。另外,影像融合和时间序列在变化监测方面也有一定优势[18],采用遥感影像融合的方法,将Landsat 中分辨率遥感影像和MODIS 多光谱影像融合分析,在保留光谱信息的同时提高影像的空间分辨率,使得城镇建设用地提取精度进一步提高[19]。时间序列方法先分析城镇建设用地扩展前后时间序列轨迹特征,然后使用决策树、支持向量机分类方法进行城市和郊区的土地覆盖变化监测[20-21]。
通过分析发现,目前的土地利用变化分析方法以机器学习、指数法、影像融合、时间序列等为主,对于分类结果的精度评价一般采用人工选取样本点的方式,通过计算混淆矩阵验证分类精度。混淆矩阵的出现确实为遥感影像分类精度提供了量化依据,但是随着研究的深入,基于样本点的混淆矩阵评价方法陆续显露出一些问题。精度评价结果对样本点的依赖性较大,只能对样本点所在区域进行评价,忽略了样本点外的绝大部分区域。
考虑到上述问题,本文以中国城镇化进程相对较快的东部地区省份为研究对象,采用支持向量机和指数相结合的分类方法提取浙江省30 年建设用地扩张的时空变迁。随机选择省内部分城市的土地利用现状数据与提取结果进行校核,定位识别错误的区域,从而改进分类方法,提升分类精度,最终使得精度评价结果更为全面科学。
1 研究区与数据
1.1 研究区概况
浙江省地理环境优越,地处北纬27°02′~31°11′,东经118°01′~123°10′之间,东临东海,南接福建,西与安徽、江西相连,北与上海、江苏接壤,对内对外交通十分便利。全省陆域面积10.55万km2,下辖杭州、宁波、嘉兴、温州、金华、绍兴、湖州、舟山、台州、丽水、衢州11 个市(图1)。浙江省开发历史悠久,经济发达,是长三角经济圈的重要组成部分。近年来,城市化快速推进,大量人口涌入城市,建设用地需求急剧增加,土地利用结构发生较大变化。
图1 研究区概况Fig.1 Location of the study area
1.2 数据来源
本文采用的数据主要有遥感影像数据和土地利用现状数据。遥感影像数据从USGS 网站和地理空间数据云下载,包括1990、1995、2000、2005、2010、2015、2020 共7 个年份的Landsat5 TM、Landsat7 ETM+ 和Landsat8 OLI 共3 种卫星遥感数据。由于浙江省范围广阔,需要多幅影像拼接才能覆盖全域,为避免影像获取时间不一致造成的建设用地检测误差,同一年份选取采集时间差在3 个月左右的9 幅影像,选取结果见表1。
表1 遥感影像数据获取时间表Tab.1 List of acquisition time of remote sensing image
2 建设用地提取方法研究
研究结合上述两种数据源,采用指数法和支持向量机相结合的方法对遥感影像进行分类,通过计算NDVI、NDWI、NDBI、BSI 4 个指数建立特征空间,选取典型样本支持向量机分类,得到建设用地覆盖范围。然后将部分地区的遥感影像建设用地识别结果和土地利用现状数据进行叠加验证精度,根据精度校验结果改进方法从而进一步提高识别精度。最终得到1990-2020 年浙江省建设用地分布图,并从建设用地扩展和土地利用变化两个方面对结果进行分析(图2)。
图2 技术路线图Fig.2 Technical flow chart
2.1 图像预处理
从USGS 网站和地理空间数据云获取的Landsat 一级数据产品已经完成了图像几何配准,且误差在0.5 个像元以内,满足研究的精度要求。采用ENVI 中快速大气校正方法(QUAC)对Landsat TM/ETM+/OLI 3 种数据进行大气校正。由于2003 年6 月Landsat7 出现机器故障,导致后来采集的影像出现条带,利用邻近时间可用像元替换来修复条带[22-23]。同时,为了保持遥感影像地物边缘的连接性和完整性,采用边界保持类平滑滤波器(K-Nearest Neighbor,KNN)对每一幅影像做滤波操作。对经过大气校正、条带修复和KNN 滤波的影像进行拼接和裁剪,得到浙江省域范围的影像。
2.2 建设用地提取
2.2.1 分类体系确定
不同地区的土地覆盖分类体系标准是有区别的,国际具有代表性的分类体系有美国USGS 分类体系、欧盟Corine 分类体系、国际LUCC 分类体系,国内主要有中国科学院土地资源分类系统、国土资源部土地覆盖分类系统等。本次研究的主要目的是监测城镇和农村建设用地的变化。基于此,结合浙江省实际情况,参考中科院土地资源分类系统,将浙江省分为建设用地、林灌草地、耕地、水体、裸地5 种土地覆盖类型,见表2。其中,建设用地主要指城镇和农村建筑用地、交通道路用地、工矿用地等人造地表。
表2 土地利用分类体系Tab.2 Land use classification system
2.2.2 指数法构建分类特征空间
由于地表不同覆盖地物的结构不同,造成对光的吸收和反射情况不同,形成了每种地物典型的反射光谱特征。通过在多光谱波段内寻找研究对象的最强和最弱的反射波段,运用比值和归一化运算,进一步扩大两者之间的差异,从而在指数影像上能够获取研究对象的最大亮度增强[24]。浙江省土地利用/土地覆盖类型主要有建设用地、林灌草地、耕地、水体、裸地5 类。针对建设用地、林灌草地、水体、裸地4 种地类相应地选取4 个指数来区分不同的土地覆盖类型,分别是归一化植被指数(NDVI)、归一化水体指数(NDWI)、归一化建筑指数(NDBI)、裸土指数(Bare Soil Index,BSI)[24-26],选取结果见表3。
表3 遥感指标列表Tab.3 List of remote sensing indicators
通过计算同一幅影像的上述4 个指数,将计算结果与影像原有波段共同作为分类特征空间,然后用机器学习中的支持向量机分类方法进行分类,计算结果如图3所示。NDVI 影像中植被的亮度较高,特征进一步突显;NDBI 影像中建设用地的亮度较高,使得建设用地特征进一步突显;NDWI 影像中水体的值较高,故水体在影像中显示出较高的亮度特征;裸地具有较高的BSI 值,故BSI 影像中裸地显示出较高的亮度。
图3 4 种遥感指数影像Fig.3 Four images of remote sensing index
2.2.3 支持向量机分类
建设用地是一种复杂的土地利用类型,与其他地类相比存在许多同物异谱以及同谱异物的现象,采用普通的分类方法很难将其从遥感影像中准确提取出来。随着信息技术的发展,计算能力加快,以支持向量机为代表的机器学习方法逐渐成熟,在遥感图像分类中应用广泛[27]。支持向量机分类的基本思路是将实际问题变换到高维特征空间,在高维特征空间寻找最优拟合平面作为分类面将类与类区分开来[28]。通过在研究区均匀选取不同地类的典型样本,支持向量机可以通过不断的学习找到最优分类特征平面。样本空间分布如图4 所示(以瑞安市中心城区为例),每种地类选取150 个左右样本点,共计812 个样本点。
图4 支持向量机样本分布Fig.4 Sample distribution of support vector machine
2.3 建设用地提取精度校核
随着我国对用地管控政策的收紧,多次全国国土调查以及历年用地变更调查均能通过测绘、地理信息、互联网等技术实地调查土地的地类、面积和权属,成为监测土地利用情况的主要手段,是当前全国土地利用状况和土地基础数据最为真实准确的反映。本文基于公开发布的土地利用现状数据,在精度验证的基础上定位错分区域,通过分析这些区域影像的特点,寻找误差原因,从而提升建设用地分类的精度。
校核的具体方法如图5 所示,将支持向量机分类识别得到的建设用地数据与土地利用现状数据相叠加,判断精度是否满足要求。若不满足精度要求,针对建设用地同物异谱特性,通过更新训练样本再次输入支持向量机进行分类,同时运用形态学算子通过膨胀和侵蚀填补内部孔洞,然后再与土地利用现状数据叠加分析,如此迭代直至精度满足要求。
图5 结合土地利用现状数据的精度校核流程图Fig.5 Flow chart of accuracy check using current land usedata
遥感识别建设用地与土地利用现状数据中的建设用地空间叠加之后会产生表4 中的结果,精度可以表示为:
表4 改进混淆矩阵Tab.4 Improved confusion matrix
式中,a为土地利用现状是建设用地且遥感识别结果也是建设用地的面积值;b为土地利用现状是建设用地但遥感识别结果是非建设用地的面积值;c为土地利用现状是非建设用地但遥感识别结果是建设用地的面积值;d为土地利用现状是非建设用地且遥感识别结果也是非建设用地的面积值。
3 浙江省1990-2020年建设用地提取结果分析
3.1 土地利用现状数据校核结果
研究选取多个城市进行校核,在此以瑞安为例进行展示。土地利用现状数据校核前分类结果如图6a 所示,瑞安市中心城区总面积448 km2,其中现状建设用地面积107 km2,遥感识别的建设用地面积为131 km2,两者重合的部分为83 km2,精度仅为83%,许多非建设用地的区域被识别为建设用地类别,东部和西南部地区这种情况尤为严重。经过土地利用现状数据校核后的分类结果如图6b 所示,中心城区的东部和西南部两个区域的错分像元几乎全部被去除,经计算遥感识别的建设用地面积为101 km2,与土地利用现状数据重合的面积为91 km2,精度达到了94%,建设用地识别精度有明显的提升。
图6 土地利用现状数据校核前后分类结果对比Fig.6 Comparison of classification results before and after verification of current land use data
3.2 建设用地扩张过程分析
基于以上方法,本文提取了浙江省1990、1995、2000、2005、2010、2015、2020 年7 个年份的建设用地,并计算了不同时间段建设用地扩展速率。建设用地扩展速率表示空间单元建设用地面积的阶段变化率,计算公式如下:
式中,q为建设用地扩展速率;ak为某一时间段建设用地扩展面积;as为某一时间段初期的建设用地面积;t为时间段,一般以年为单位,计算结果如图7 所示。
图7 浙江省1990-2020 年建设用地扩展速率Fig.7 Expansion rates of construction land in Zhejiang Province from 1990 to 2020
从浙江省整体角度看,1990 年全省建设用地面积2751 km2,2020 年全省建设用地面积增长为13205 km2,为1990 年的4.8 倍,城镇化速度较快。6 个时期浙江省建设用地扩张速率呈现急剧上升、急剧下降、缓慢上升的态势,具有阶段性与波动性特征。2000 年以前浙江省处于城镇化初期阶段,用地规模快速增加,1995-2000年扩展速率最高,达到了10.9%。2000 年以后扩展速率一直下降,在2010-2015 年达到最低值,仅为3.5%,较之前的大规模扩展,用地增长更为精明。
1990-2020 年浙江省11 个地市的建设用地空间扩张过程如图8 所示。可以看出,虽然1990-2020 年浙江省建设用地总体呈现出扩张趋势,但扩张过程的空间异质性明显,不同城市间建设用地扩张速度差异较大。在空间结构上,杭州、宁波、温州、金华及其周边城市建设用地分布密度明显高于其他地区。逐渐形成了以杭州、宁波、温州、金义为核心区,以环杭州湾、甬台温、杭金衢、金丽温四大城市连绵带为轴线延伸,以四大都市区为辐射拓展的“四核、四带、四区”网络型城市群空间格局。
图8 浙江省1990-2020 年建设用地空间扩张过程Fig.8 The process of spatial expansion of construction land in Zhejiang Province from 1990 to 2020
3.3 土地利用变化分析
通过Arcmap 软件对1990、2020 年土地利用数据进行叠置分析,结果如图9 所示。浙江省土地利用类型以林灌草地(57%)和耕地(20%)为主,1990—2020 年土地利用转移方向表现为耕地大量减少和建设用地持续扩张。
图9 浙江省1990-2020 年土地利用面积变化和2020 年土地利用面积占比图Fig.9 Land use changes in Zhejiang Province from 1990 to 2020 and proportion of land use area in 2020
将1990、2020 年土地利用数据相交后的统计数据进行土地利用转移矩阵分析,结果见表5。30 年来,浙江省共有36826.6 km2的土地利用类型发生了改变。其中,耕地的转出最大,减少了18084.9 km2,主要转出为建设用地,转入主要是林灌草地和裸地;林灌草地的转出以建设用地为主,其次是耕地,转入主要是裸地和耕地;建设用地很少转出,流入相对较多,增加了12014.7 km2,新增的建设用地主要来源于耕地和裸地(表5)。
表5 浙江省1990-2020 年土地利用转移矩阵Tab.5 Land use transfer matrix of Zhejiang Province in 1990-2020
4 结 论
本文基于指数法和支持向量机相结合的分类方法,采用土地利用现状数据对分类结果进行校核,定位识别错误的区域,从而改进分类方法,提升分类精度,得到了浙江省1990、1995、2000、2005、2010、2015、2020 年7 期土地利用数据,并分析了1990-2020 年间浙江省土地利用变化和建设用地时空演变格局,得出的主要结论如下。
1)支持向量机和指数法相结合可有效识别建设用地。本文首先计算了研究区的NDVI、NDBI、NDWI、BSI等4 个指数,然后与影像原有的波段叠加构建分类特征空间,综合了指数法和支持向量机两种方法的优势。
2)定位影像分类误差对提升识别精度具有显著作用。将支持向量机分类得到的建设用地数据与土地利用现状数据相叠加,定位识别错误区域,通过更新训练样本和孔洞填充的方式提高建设用地识别精度,经修正后的方法对建设用地的提取准确率可以达到94%以上。
3)在无法获取精确的土地利用现状数据的环境下,开放的Landsat 数据和本文方法适用于国土空间规划分析,对宏观层面分析建设用地拓展方向、建设用地分类变化具有实际意义和推广价值。
4)1990-2020 年浙江省土地利用转移方向表现为耕地大量减少和建设用地持续扩张。建设用地扩张速率呈现急剧上升、急剧下降、缓慢上升的态势,具有阶段性与波动性特征。空间结构上总体呈现出扩张趋势,但扩张过程的空间异质性明显,不同城市间建设用地扩张速度差异较大,逐渐形成了“四核、四带、四圈”网络型城市群空间格局。