APP下载

基于随机森林的土地利用变化及城市驱动分析①

2021-05-21方君君沙晋明周正龙林淇昕

计算机系统应用 2021年5期
关键词:土地利用耕地精度

方君君,沙晋明,周正龙,林淇昕

1(福建师范大学 地理科学学院,福州 350007)

2(福建师范大学 湿润亚热带山地生态国家重点实验室培育基地,福州 350007)

土地利用变化是地球系统的主要动态过程[1],变化动力主要由人为因素触发[2].土地利用变化清楚地反映了人类活动与自然环境之间的相互作用[3].土地利用变化动态信息反映了地球的基本特征,也是我国长期关注的问题[4].根据城市人口比例,中国城市化率从1978年的18%上升到了2014年的55%[5].这种快速的城市扩张导致了其他土地类型的变化,福建省也面临类似情况[6].随着人工智能的发展,机器学习由于其优势在土地利用分类中得到广泛应用,随机森林目前已经成为遥感分类机器学习中一种有效方法.不同研究者利用随机森林对Landsat 数据进行了研究,证实该方法有效提高了分类精度[7,8].

研究证明城市的扩张是土地利用变化的主要驱动因素[9].国内对土地利用变化的研究主要集中在驱动机制(如经济、政策)[10,11]及土地变化对其他方面(如生态系统服务价值、地表径流、热环境)的影响[12-14];杨华溢等[15]、李铖等[16]针对地铁建设对土地利用时空变化的影响也做了相关研究.但总体来说,较少考虑城市扩张本身对土地利用变化的驱动分析.

平潭以其独特的地理优势吸引了政府的关注.它位于连接太平洋和台湾海峡的主通道,是连接珠江三角洲和长江三角洲的战略节点[17].2009年根据国务院《关于支持福建省加快建设海峡西岸经济区的若干意见》精神在平潭成立综合试验区.2014年,设立中国(福建)自由贸易试验区,平潭片区列为其中.2016年,国务院发布《国务院关于平潭国际旅游岛建设方案的批复》,平潭国际旅游岛建设步入正轨.以上,使得平潭的经济改革进入国家战略,城市得到快速发展.

基于此,本文以平潭主岛海坛岛作为研究区,借助遥感和地理信息技术,定量分析了1984-2017年间5 个阶段土地利用变化情况,并对城市扩张及扩张对其他地类的变化进行了详细分析.以揭示该地区土地利用情况,为该区土地合理利用及协调可持续发展提供依据.

1 研究区及数据

1.1 研究区概况

海坛岛(图1)位于福建省福州市东部,与台湾隔海相望(地理位置北纬25°22′~25°40′;东经119°40′~119°54′),如图1,面积286.08 km2.气候为亚热带海洋性季风,年平均温度19.6 ℃,多年平均降水1180.9 mm.地形以中部沿海平原为主,北部和南部主要为低山丘陵,最高海拔435 m.该地区原有植被遭到破坏,现有植被多为次生植被,多样性低,结构简单[18].它是中国沿海地区的一个典型例子,以其独特的地理优势获得特别关注.

图1 研究区

1.2 数据源和预处理

本研究主要数据源是6 个时期的陆地卫星遥感影像(1984、1990、1996、2003、2010和2017).影像下载自地理空间数据云平台[19],数据详情见表1.由于研究区位于湿润亚热带地区,影响分类的地物四季变化不明显,可选择不同季节影像进行土地利用信息的提取[20].对每期遥感影像进行辐射定标、大气校正、地形校正和图像配准预处理[21],按研究区矢量进行裁剪用于影像光谱指数的计算、主成分分析(PCA)和土地利用分类.光谱指数包括归一化差值植被指数(NDVI)、土壤调节植被指数(SAVI)、增强植被指数(EVI)和修改的归一化水体指数(MNDWI),这些指数减少了由于地表坡度和传感器观测方向引起的相似土地特征的光谱变异.将主成分分析变量和光谱指数作为特征变量提高随机森林土地利用分类的精度.谷歌地球影像用于分类训练样本的选择,2000年和2010年Globeland30土地覆盖数据集[22]作为分类后处理的参照.

表1 遥感影像详细信息

2 研究方法与原理

2.1 随机森林分类

随机森林是利用多棵树对样本进行训练并预测的一种分类器.该算法通过构造多个训练集得到决策树序列,即通过k轮训练,得到一个分类器序列{h1(x),h2(x),…,hk(x)},构成一个多决策树的分类器组合,最后通过投票产生输出结果[23].随机森林具有以下优点:(1)其基础学习器是决策树,可以进行分类,也可进行回归,在最终的分类时,可以输出概率;(2)随机森林的袋外无偏估计可以有效估计分类器的泛化误差;(3)变量重要性估计也是随机森林算法的重要优点之一,被广泛应用于特征筛选之中[24].在土地利用分类应用中,运算量没有显著提高的前提下提高了分类精度[25].ENVI 5.5扩展插件随机森林分类器可以实现土地利用的分类.该过程有两个关键参数:生成树个数和特征数量.决策树个数决定了随机森林总体规模,取值一般在100~10 000之间,值越大模型越收敛,模型运行时间增加,且当树的个数不断增加时,模型会出现过饱和现象[20].通过不断试验,此次分类确定该值为500.特征数量决定了决策树的强度,值越大强度越大,但树之间相关性也增大.此次特征数量由待分类影像波段数平方根原则确定.

根据国家土地覆盖分类[26,27]和当地经验,确定了8 个土地利用类别(有林地、灌木林地、草地、耕地、建设用地、裸地、水域、湿地).对于光谱反射率变异性小的地物如水体,可以选择少量的训练样本,而变异性较大的林地、灌木等,可以适当增加训练样本,但应保证每个地物最少50 个样本的需求[28].样本的选择以谷歌地球历史影像优先,在没有同期数据源的情况下以下载的遥感影像进行采集.对分类后结果的检查,样本的再次修改,可以减少错分从而提高分类精度.

2.2 土地利用变化指数

用年平均变化率(ARC)和变化强度指数(CII)评价土地利用变化的时间分布.

ARC为单一土地利用动态度.它用于量化研究某一时期特定某类的面积动态比例,并进行跨期预测.利用ARC,对土地利用类型从初始年的增长率进行了标准化,以便于比较周期性土地利用变化.计算公式为:

其中,A1和A2分别是某一阶段初始时间(T1)和终止时间(T2)的某地类面积,它们之间的年数为N.

CII指数考虑了研究区总面积,计算了各土地利用类型变化程度的比率,以证明其总体变化速度.较高的正CII值表明快速扩张,而负值被认为是收缩.计算公式为:

其中,TA是研究区总面积.Sun 等[29]将CII分为极低速(|CII|<0.1)、低速(0.1≤|CII|<0.2)、中速(0.2≤|CII|<0.4)、快速(0.4≤|CII|<0.7)和极快速(|CII|≥0.7)变化.

2.3 城市扩张类型

城市扩张可分为跨越式、边缘式和填充式,可用景观扩张指数(LEI)进行量化.计算公式为:

其中,Ao为新增城市图斑缓冲区(向外1 m)与原有城市相交部分面积,Av为缓冲区与非城市用地相交面积.LEI=0,为跨越式扩张;0<LEI≤50,为边缘式扩张;50<LEI≤100,为填充式扩张,详见文献[30].

2.4 类间变化检测

基于转移矩阵,计算了转换程度(ET)和转换状况(CT).ET取值大于等于0,当ET=0,则该地类在研究期间趋于保持不变,当ET增加,表明该地类的转换正在加强.然而,ET只反映变化的幅度,不反映变化的方向(扩张或收缩).因此,采用CT来进一步了解转化的方向.CT在[-1,1]之间变化,当CT离0 越远,该类就越不稳定;当CT越接近0,被类型的双向转换越平衡.

为了阐明各地类面积对同时转化程度的影响,基于Nourqolipour 等[31]计算了区域独立动态变化(AILC).AILC的值越接近1,内在动态损益(由该值符号决定)就越大,转换受类大小的影响就越小.AILC值越小,表明该地类的转换受类大小的影响越大.以上指数计算见表2.

表2 土地利用参数

3 结果分析

3.1 特征变量优化及分类精度

实验证明:在遥感影像中加入特征变量,可以提高随机森林分类的精度.但加入变量过多会使得分类速度变慢.为了保证分类效率,根据特征变量重要性,从中选取前五个变量加入遥感影像进行分类,并对特征变量优化前后分类的准确性进行比较.以2017年为例,随机生成510 个检验点,对照谷歌地球进行地类的目视解译,以其作为地表真实地类对分类结果进行精度评价.未加入特征变量的随机森林总分类精度为77.94%,加入所有特征变量的总分类精度为84.05%,加入前五个特征变量的总分类精度为85.05%.

2017年最终的分类误差矩阵如表3.建设用地的用户精度最高,裸地的制图精度最高,总Kappa 系数为0.8185,总分类精度为85.05%.对其他时期影像采用相似的方法进行分类及精度验证,结果表明特征优化后的随机森林总分类精度均大于85%,满足土地利用分类的精度目标,可用于分类后分析[32].

3.2 土地利用特征

土地利用空间分布如图2.各时期总体来看,有林地主要分布在东北部、北部和西南区域;灌木林地分布在有林地四周;草地零星分布于研究区;耕地主要分布于研究区中部偏北区域;建设用地以中东城市为核心,向四周扩张;水域集中在西部沿海区域和南部三十六脚湖;湿地分布于西部滨水区域.各土地利用类型面积比例见表4.耕地在6 个时期面积占比最大,裸地在5 个时期面积占比最小(除1990年湿地面积比例最小).林地(有林地和灌木林地)的占比在6 个时期分别为25.56%、27.71%、25.13%、26.36%、23.27%、27.77%,占据了研究区较大比例.建设用地在2017年达到22.43% (64.17 km2).

表3 2017年随机森林分类结果误差矩阵

3.3 土地利用变化特征

土地利用变化指数如图3,不同阶段不同土地利用类型变化有所差异.建设用地每阶段都表现出扩张的趋势(位于Y 轴右侧),而其他地类在整个研究期均存在增加和减少两种现象.根据图3中CII可知,变化最明显的是2010-2017 期间建设用地的增加,其次为1984-1996 期间耕地的减少.建设用地增加主要是由于2009年平潭综合试验区的成立推动了城市的发展,而耕地的减少可能跟1985年退耕还草政策有关.总体来看,属于极快速变化的(|CII|≥0.7)还有:1984-1990年的水域和草地,1990-1996年的耕地,2003-2010年的灌木林地,2010-2017年的湿地及有林地.

图2 土地利用时空分布

表4 1984-2017年间6 个时期土地利用类型面积占比统计(%)

图3ARC 对每类土地利用面积动态比例进行了不同阶段的量化.对有林地、灌木林地来讲,2010-2017年变化最大,对应ARC为+6.92%和-6.53%;草地1984-1990年增加最多(ARC+8.14%);耕地只在1990~1996年增加,其余阶段均减少;建筑用地持续增加,2010~2017年增速最大;水域在1 9 8 4-1990年增加最显著,这可能跟1990年影像季节为夏季有关;湿地跟水域在不同阶段表现出此消彼长的现象.

图3 土地利用变化指数

3.4 城市扩张分析

城市不仅是土地利用类型,而且被认为是土地变更的主要驱动力[9],因此其扩张模式值得深入探讨.图4为城市扩张类型分布图,表5为各阶段城市扩张类型比例.综合分析可知,各阶段都以边缘扩张为主,跨越扩张为辅.2010-2017年期间边缘扩张比例最大,达到81.87%,扩张区主要位于西部海港区和西南滨海区.1990-1996和2003-2010 期间,跨越扩张和边缘扩张占了相当大比例,与同阶段城市边缘扩张比例接近,表明城市形态更加分散.尽管填充式扩张对于改变城市景观走向饱和模式非常重要[33],但其在该岛城市扩张中所占的比例最小,尤其是前十几年(1984-1996年).1996-2003 期间,填充扩张比例大于跨越扩张比例,这主要是由于城市核心区的发展造成的.图4还表明,与丘陵和山区相比,平原和低洼沿海地区更容易发展为城市用地.由于边缘扩张的贡献远远大于填充扩张,表明该研究区扩张趋势大于其紧凑性,Yu和Zhou[34]指出这是城市快速扩张的特征表现.

3.5 城市驱动分析

海坛岛城市的发展跟其他土地利用的转换情况见表6.研究期间,城市土地的转入转出存在较大差距.城市持续不变的区域从4.63 km2(1984-1990年)增加到20.04 km2(2010-2017年),增长了约4.33 倍.城市土地变化主要来源和去向均为耕地.整个研究期来看(1984-2017年),51.62 km2(55.90%)的扩张城市来自耕地.各阶段来看,耕地转为城市最大值为第5 阶段(2010-2017年),城市转为耕地最大为第4 阶段(2003-2010年).

图4 城市扩张类型

表5 城市扩张类型比例(%)

除耕地外,第1 阶段城市扩张主要由裸地(4.72%)、灌木林地(3.81%)和湿地(3.77%)贡献,损失主要为草地(23.84%)、水域(23.73%)和有林地(7.49%).第2 阶段城市扩张几乎全部(89.29%)来源于耕地(48.82%)、草地(26.52%)和灌木林地(13.95%),损失的也主要由这3 种地类占据.第3 阶段城市扩张来源于耕地(66.57%)、林地(13.75%)和草地(7.01%),损失为耕地(63.29%)、灌木林地(13.68%)和湿地(9.61%).第4 阶段扩张源于耕地(55.55%)、林地(20.53%)和湿地(13.37%),损失为耕地(78.32%)、湿地(12.57%)和裸地(3.94%).最后阶段耕地(50.33%)、湿地(24.82%)为主要扩张源,损失为耕地(62.55%)、林地(19.51%)和草地(13.71%).这表明,城市土地的转换主要在于少数几个主要类别上(耕地、林地、草地、湿地),且城市和主要地类之间存在着空间上的交换关系.

各阶段城市扩张的土地利用来源空间分布如图5.5 个阶段城市扩张主要来源均为耕地(表6),但空间分布却有一定差异.第1 阶段损失的耕地位于城市中心区附近,第2 阶段集中在研究区中部,第3 阶段在以上地区为基础向外扩张,第4 阶段则广泛分布于研究区各部分,第5 阶段集中在西南部和东南部.值得注意的是,第5 阶段城市的扩张,水域和湿地有较大贡献,且集中在西部和西南部滨海区域.

城市用地总变化从第1 阶段(13.80 km2)到最后阶段(54.45 km2)依次增加(表7).除最后阶段由净变化主导,其余阶段总变化的主要部分为交换变化.在整个研究期间,净变化为55.15 km2,大约是1984年城市面积的5.33 倍.总变化、净变化和交换变化与土地利用类型的大小有关,这种地区依赖可能导致一些误解[31].如整个研究期间,耕地占据了城市土地扩张的最大比例(图5),部分原因可能是其占主导地位的规模.这种误解可以通过AILC最小化.AILC从第1 阶段的0.25一直下降到第3 阶段的0.10,而后上升到0.45,但都远小于其最大值1,这证实了城市转换受土地利用类型大小的影响.ET在第1 阶段最高(26.38),表明城市变化强烈,但在第3 阶段有所下跌(14.37),最后阶段也达到了25.62.CT前两阶段(0.32,0.33)高于随后两个阶段(0.16,0.29),表明前两阶段城市比较不稳定,更倾向于扩张.第3 阶段CT值最小(0.16),表明其扩张和收缩比较平衡.最后阶段CT值最大(0.62),说明此阶段城市表现出极强烈的扩张现象.

表6 1984-2017年城市土地转入转出统计(km2)

图5 城市扩张时空分布

表7 1984-2017年城市变化统计

类间转换(增益和损失)、空间位移(交换变化)和其他指数(ET、CT、AILC)的量化提供了其他无法理解的详细信息[35,36].这为城市扩张及扩张对其他地类变更的深入分析提供了有力帮助.

4 结论与展望

随机森林分类,分类结果很大程度受样本影响,本文通过高分辨率谷歌影像选择纯净训练样本,借助特征变量和分类产品数据辅助,经反复检验和样本修改,对海坛岛八大地类进行了分类提取,并获得了较高的土地利用分类精度(6 个时期影像精度均高于85%),符合土地利用进一步分析要求.研究各阶段耕地地类的面积始终最大,林地(有林地和灌木林地)次之,裸地最少.在土地利用变化方面,建设用地始终保持增长的趋势,且在2010-2017年增速最快,这可能跟2009年平潭综合试验区的成立有较大关系.1984-1996年间耕地大面积减少,这可能跟退耕还草政策相关.

城市扩张类型以边缘扩张为主,其次为跨越扩张.该岛城市的发展对其他地类的变更有重要的驱动作用.城市土地的转换主要体现在少数几个主要类别上(耕地、林地、草地、湿地).耕地作为优势类,在各个阶段都是城市扩张的主要来源和损失去向,但不同阶段空间位置分布有所差异.

海坛岛由于其特殊的地理位置获得了特殊的关注.综合试验区、经济贸易区的成立,国际旅游岛的定位,为该岛的发展注入了不竭动力.城市的发展紧凑性较低导致耕地日益缩减,提出合适的海岛型城市发展方案,从而实现各种土地利用类型的协调,对该地区的可持续发展至关重要.

猜你喜欢

土地利用耕地精度
城市土地利用变化模型研究进展与展望*
我国将加快制定耕地保护法
基于不同快速星历的GAMIT解算精度分析
数字化无模铸造五轴精密成形机精度检验项目分析与研究
五台县土地利用变化研究
基于“风险—效应”的土地利用空间冲突识别与测度
土地利用变化与大气污染物的相关性研究
坚决落实耕地保护“军令状” 牢牢掌握粮食安全主动权
耕地种田也能成为风景
近似边界精度信息熵的属性约简