基于多层神经网络的西双版纳土地利用时空演变及预测研究
2023-02-27许安泽张述清朱大明裘木兰
许安泽,张述清,朱大明,裘木兰,保 红
(1.昆明理工大学 国土资源工程学院,云南 昆明 650093;2.云南省国土资源规划设计研究院,云南 昆明 652100; 3.昆明市不动产权籍调查中心(昆明市国土规划勘察测绘研究院),云南 昆明 650200)
0 引言
近年,随着我国社会城市化进程的加速和经济的快速发展,人们对土地资源的开发不断增加,过渡开垦、过度放牧、围湖造田、挖湖造景、毁林种茶等土地利用发生重大变化[1-2]。通过建立土地利用变化模型(Land use/cover change,LUCC),重现过去土地利用时空演变,预测未来土地利用空间格局,研究土地利用变化的时空规律与驱动机制,可以为土地管理提供科学依据和决策支持。
当前常见的LUCC模型,如元胞自动机(Cellular automaton,CA)[3]、CLUE-S模型[4]、智能主体模型(Agent-based model,ABM)[5]等多是基于过往的已知土地利用变化得到土地变化总体数量,然后利用Logistic线性回归[6]方法计算驱动因子与土地利用变化的关系,经反复递归后预测土地变化[7]。然而土地利用变化是一个非常复杂的过程,并非简单的线性发展,采用单一的线性数学方法构建的LUCC模型并不能很有效的模拟真实土地利用变化。多层神经网络(Multi-layer perceptron,MLP)[8]是一种模拟人脑神经网络处理信息的系统,具有自学习、自组织、联想以及记忆等特点,适合模拟土地利用变化这种非线性系统[9-10]。近年基于神经网络的土地利用变化研究被广泛讨论和应用,如黎夏等[11]提出了一种基于神经网络的单元自动机模拟城市的发展(ANN-CA),能够在大大缩短寻找参数时间的同时获得更高的模拟精度;Almeida等[12]基于神经网络系统模拟和预测城市土地利用的变化,获得较好的模拟和预测效果;韦春竹等[13]建立一种基于BP神经网络和遗传神经网络算法优化的元胞自动机土地扩张模型,通过优化算法使得整体精度提高5%;Gomes等[14]利用神经网络研究城市压力下农业用地的变化,探讨外部驱动因素如何影响未来土地利用变化;张伟良等[15]基于孪生神经网络构建的模型,实现对土地利用现状变化区的快速提取。
虽然基于MLP建立的土地模型与传统线性模型相比有更高的可靠性,但大多数分析对神经网络的训练较为简单,不能有效的发挥MLP的全部优点。驱动因子的选择上多是自然因子,没有或较少考虑到社会经济因子对土地利用变化的影响,且多应用于单一土地利用类型的变化。西双版纳是我国热带生态系统保留最完整的地区,素有“动植物王国”和“生物基因库”的美称,同时又是我国天然橡胶种植面积最大的市(州)和国家级重点风景名胜区,生态保护与经济发展存在一定矛盾。本文全面分析2009—2019年西双版纳多种土地利用变化特征,并在考虑多种影响因子的前提下,基于MLP建立该地区的土地利用模型,预测2029年土地利用变化。研究可为西双版纳国土空间规划、水土保持与生态修复等土地管理工作提供参考。
1 研究区域概况与数据来源
1.1 研究区域概况
西双版纳傣族自治州(地理位置:21°10′~22°40′ N,99°55′~101°50′ E),全州辖景洪市、勐海县、勐腊县,北部紧依普洱市,东南与老挝毗邻,西南与缅甸接壤,国土面积1 912 450 hm2(图1)。2019年末,全州户籍总人口101.46万人,其中少数民族人口79.03万人,占户籍总人口的77.90%,共居住着汉族、傣族、彝族、哈尼族等13个民族。该地区地处北回归线以南的热带边缘,受太平洋东南气流和印度洋西南季风以及北部高山的影响,终年高温多雨、干湿两季明显。
图1 西双版纳位置示意图Fig.1 Location of the Xishuangbanna
1.2 数据来源及预处理
土地利用数据来源于2009年第二次全国土地利用现状成果、2014年土地变更调查数据和2019年第三次全国土地调查成果,共3期的土地利用调查数据。在综合考虑西双版纳州土地利用现状分布与本次研究重点的前提下,根据《第二次全国土地调查技术规程》《第三次全国国土调查技术规程》和《土地利用现状分类》等技术标准,将地类合并为7类:耕地、园地、林地、草地、建设用地、水域、未利用地(图2)。土地利用变化驱动因子主要来源于2009—2019年西双版纳傣族自治州统计年鉴、西双版纳州国土空间规划(2021—2035年)相关专题的研究成果、中国科学院资源环境科学与数据中心(https://www.resdc.cn/)、云南省生态保护红线分布图。驱动因子包括自然因子:高程、坡度、降雨、地表温度、坝区范围、路面范围等。社会经济因子包括:人口密度、社会生产总值(GDP)、已有的土地规划等。在ArcGIS软件的支持下对获取到的所有数据预处理,使它们保持一致的空间坐标系、像元大小、像元单位和处理范围。
图2 2009、2014、2019年西双版纳土地利用现状示意图Fig.2 Land use cover map of Xishuangbanna in 2009,2014,2019
2 研究方法
2.1 土地利用变化特征
2.1.1 动态度
研究土地利用变化的动态特征,可以从区域土地利用变化的数量、速度、结构等方面入手。土地利用动态度是一种能够直观反应出研究时段内区域土地利用变化数量与速度的模型。该模型包含单一动态度和综合动态度两项指数,单一动态度反应的是研究区一定时间范围内某一地类数量变化情况,综合动态度则体现研究区一定时间范围内的所有土地利用类型变化的情况[16-17]。从不同的尺度出发将两项指数结合分析,能够更加全面的反应研究区土地利用变化的程度[18]。动态度计算公式为:
(1)
式中:K为单一动态度;Ua、Ub分别为研究起始与终止时间节点上的某一地类面积。
(2)
式中:LC为综合动态度;ΔLUi-j为研究时间段内i地类转为j地类(i≠j)面积的绝对值;LUi为研究初期i地类的面积;n为土地利用类型的数量。
2.1.2 转移面积矩阵
土地利用动态度指数虽然很直观地反应土地利用变化的剧烈程度,也易于比较不同的土地利用类型变化的差异,但该指数无法具体地刻画出地类的转移方向。国内外学者通常采用转移面积矩阵来描述土地利用类型的转移方向,该矩阵使用系统分析的方法对状态转移进行定量描述,有效的表达地类的转移结构特征[16]。转移面积矩阵表达式为:
(3)
式中:S为转移面积矩阵;Sij(i=1,…,n,j=1,…,n)表示期内第i类土地利用类型向第j类土地利用类型转移的总面积;n为地类的数量。
2.2 土地利用变化预测
2.2.1 马尔可夫模型(Markov model)
马尔可夫模型是一种能够预测事件发生概率的过程,常用于无后效性特征的事件,即事件发生过程具多种可能的状态,过程在ti+1时刻所处的状态仅与ti时刻所处的状态有关[19]。土地利用变化是时间和状态都为离散的随机运动过程,适合马尔科夫过程的模拟,地类即对应马尔可夫模型的“可能状态”[20]。利用马尔可夫模型研究土地利用变化一般采用转移概率矩阵来表示,该矩阵与转移面积矩阵相似,表达式为:
(4)
式中:P为转移概率矩阵;n为土地利用类型数;Pij(i=1,…,n,j=1,…,n)为期内第i类土地向第j类土地转移的概率。
2.2.2 多层神经网络(MLP)
MLP是Rumelhart等[21]提出的一种被广泛使用的人工神经网络,该算法在单层神经网络的基础上引入了一个或多个隐藏层,模拟人脑神经对复杂信息的处理机制,能够有效的在因变量与驱动因子之间建立合适的关系,即使他们之间存在非线性的关系[22-23]。MLP结构由输入层、隐藏层和输出层构成,每一层都由若干的神经元组成,层与层之间完全连接,而同一层之间神经元无连接(图3)。基于MLP建立的土地利用变化模型,输入层的神经元对应影响土地变化的各种驱动因子,输出层则对应不同地类之间的转换概率。
图3 多层神经网络结构图Fig.3 Structure diagram of MLP
2.2.3 多标准评价(MCE)
多标准评价(Mulit-criteria evaluation,MCE)方法是一种基于多条件的评估决策系统,决策的条件被称为标准[24-25]。这些标准可能是限制条件或激励因子,限制条件一般表现为二值化的规则,它的作用是排除某些变化趋势,比如在生态保护区与耕地红线内禁止建设用地的扩张。激励因子是连续的数据类型,体现某些变化的相对适宜性,比如已有规划的道路周围有更大的可能会出现新的建设用地。采用MCE建立的土地利用变化预测模型能够实现在多种土地利用变化趋势中做出选择,这种选择并不是简单的对比,MCE系统会根据不同的条件尝试组合一组标准,并根据特定目标实现决策的单一复合。该方法的计算首先查询土地利用变化趋势图上单位土地变化概率,为单位土地创建一个地类流出与流入概率表,然后依据Markov转移概率矩阵计算的变化需求量与保护区等限制条件重新分配单位土地的地类,最后将重新分配的地类替换原有地类生成一幅未来的土地分布图。
3 分析与结果
3.1 土地利用变化的特征分析
3.1.1 土地利用变化动态度分析
为揭示2009—2019年西双版纳不同地类变化的差异与区域土地利用变化的剧烈程度,分别从单一尺度和全局尺度计算10年内7种地类的单一动态度和单位土地的综合动态度。首先根据式(1)算得耕地、园地、林地、草地、建设用地、水域、未利用地7种地类的单一动态度分别为:16.6%、8.9%、1.9%、85.2%、43.4%、32.2%、66.6%。然后选择1 km网格为分析动态度的单元,根据式(2)计算土地利用综合动态度(图4)。
从单一动态度计算结果可知,2009—2019年土地利用类型单一动态最小的是林地1.9%,最大的是草地与未利用地分别为85.2%与66.6%。分析其原因,主要是得益于西双版纳得天独厚的自然条件非常适合植被生长,在没有人为干扰的条件下,短期出现的草地或裸地很快又会被林地覆盖住。同时值得注意的是建设用地的动态度相对较高为43.4%,表明十年间西双版纳的城镇扩张的速度较快。由图4可知,过去十年间西双版纳西部地区的勐海县土地利用变化最为剧烈,主要原因是该地区2009年有较多的草地,十年后这些草地大部分转换为林地或园地。同时该地区拥有西双版纳最大的坝子——勐混镇坝子,各种土地利用类型的交错分布,地类间的转换比较复杂,致使该区域土地利用变化剧烈。
图4 2009—2019年西双版纳土地利用动态度分布示意图Fig.4 The distribution of land use dynamic during 2009—2019 in Xishuangbanna
3.1.2 土地利用变化流向分析
基于ArcGIS空间分析工具,统计2009—2019年西双版纳不同土地利用类型之间的变化总量,获得2009—2019年土地利用转移面积。由表1可知,2009年林地和园地覆盖面积分别是1 061 057 hm2和571 853 hm2,2019年覆盖面积分别是1 081 195 hm2和622 759 hm2,覆盖面积超过85%,是西双版纳最主要的土地利用类型。由于林地与园地所占面积比最大,可以计算出两者的净转入与净转出的面积也是最大的,林地净转入和净转出面积分别为132 878 hm2和112 740 hm2,园地净转入和净转出面积为137 027 hm2和86 121 hm2,然而林地与园地的动态度却不高,分别为1.9%与8.9%,表明2009—2019年西双版纳的林地与园地保持相对稳定的覆盖面积。观察到草地面积从67 663 hm2降至10 011 hm2,未利用地面积从451 hm2降至151 hm2,且从流向上来看草地与未利用地变化面积的主要流向是林地与园地,这两种地类十年间发生了较大的变化。值得注意的是由于城镇的扩张与挖塘搞水产养殖,导致10年间耕地面积减少约28 292 hm2,而建设用地与水域分别增加10 466 hm2与4 734 hm2。
表1 2009—2019年西双版纳土地利用变化转移面积矩阵Tab.1 Area change matrix of land use change from 2009 to 2019 in Xishuangbanna 单位:hm2
3.1.3 土地利用变化驱动力分析与选择
土地利用变化驱动因子是指导致土地利用方式和目的变化的主要自然因素和社会经济因素,驱动因子的选择是研究土地利用变化的核心问题,也是构建土地利用变化趋势模型的基础。为研究所选驱动因子与不同地类变化之间的关系,采用克莱姆相关系数(Cramer'sV)量化驱动因子与土地变化之间的关系。Cramer'sV是双变量相关分析的一种方法,用于衡量分类数据之间的相关程度,适合初步评价土地利用的驱动因子,其计算式为:
(5)
式中:φc为克莱姆相关系数;χ2为皮尔森卡方检验系数;N为样本数量;k为变量的最小类别。
表2列举所选驱动因子Cramer'sV值,取值范围介于1到0之间,1表示完全相关,0表示两个变量完全无关。在MLP建模中,驱动因子的克莱姆相关系数一般大于0.1就可以采用,大于0.3即表示具有较好的相关性。
表2 土地利用变化驱动力分析Tab.2 Driver analysis of land use change
3.2 土地利用变化时空格局的演变预测
3.2.1 土地利用变化转移概率
土地利用变化预测量是从数量上推算未来变化的趋势,通常采用Markov计算土地利用变化转移概率矩阵。该矩阵是进一步计算出土地利用变化预测数量的前提,也是后续结合MLP和MCE作土地利用分布预测必不可少的步骤。本文以年为单位,把土地利用类型之间的转换视为一系列离散的过程,依据式(4)计算各土地利用类型的转移概率(表3)。表中行为2019年的土地利用类型,列为2029年的土地利用类型,单元格表示预测的2019—2029年各地类间转移的概率。
表3 2019—2029年西双版纳土地利用变化转移概率矩阵Tab.3 Transition probability matrix of land use change from 2019 to 2029 in Xishuangbanna 单位:%
3.2.2 MLP训练与模型建立
根据不同的土地利用类型建立7个不同地类的MLP子模型,并通过均方根误差(Root mean square,RMS)曲线和准确率来保证训练结果。优秀的MLP模型RMS值会更小,准确率也会越接近于100%,且随着迭代次数的增加RMS曲线还会逐渐趋于水平。选择MLP训练停止条件为:RMS<0.01、训练迭代10 000次、准确率100%,通过不断调整各个子模型的学习速率、隐藏层节点数和驱动因子等参数,获得最优的训练效果(图5)。
从图5训练结果来看,所有子模型的训练RMS曲线与测试RMS曲线在计算刚开始时都呈现断崖式的下降,而后随着迭代次数的增加逐渐收敛平行,两条曲线的差值均控制在较小范围内,全部子模型的平均准确率达到85.07%,证明建立并训练的MLP模型具有较高的可靠性。在MLP训练结果得到的土地利用变化趋势图集与Markov算得的土地利用变化转移概率矩阵的基础上,结合MCE方法建立一个完整的LUCC预测模型。
图5 MLP分析结果Fig.5 Analysis result of MLP
3.2.3 模型精度评价
借用遥感分类中常用的精度检验Kappa系数作为模型精度的评价标准,该系数是一致性检验的指标,也常用于衡量分类的效果[26]。Kappa值的区间为(0,0.2]表示极低的一致性、(0.2,0.4]表示一般的一致性、(0.4,0.6]表示中等的一致性、(0.6,0.8] 表示高度的一致性和(0.8,1]表示几乎完全一致。Kappa计算公式为:
(6)
式中:P0为土地利用分布模拟正确模拟单元格的比例;Pc为随机模拟正确单元格的比例;Pp为理想模拟正确单元格的比例。
将2009与2014年西双版纳土地利用分布图带入LUCC模型预测2019年的土地利用分布,并对预测结果与真实土地分布图进行精度检验。算得Kappa值为0.84,表明基于MLP建立的LUCC预测模型有较高的性能。并计算2019年土地利用预测误差得到耕地、园地、林地、草地、建设用地、水域、未利用地的误差为:7.15、8.69、4.25、3.54、1.07、5.24,各地类预测误差均在10%以内,进一步证明建立的LUCC模型具有可靠性。
3.2.4 预测结果
在保证LUCC模型精度的基础上,以2009年第二次全国土地调查和2019年第三次全国国土调查成果为基础预测2029年的西双版纳的土地利用分布情况,同时通过叠加土地利用变化趋势图集得到2029年土地利用变化的趋势图(图6)。并根据2029年预测结果统计各地类数量,将其与前20年的地类分布情况作比较(表4)
图6 2029年版西双版纳土地利用预测示意图Fig.6 Prediction map of land use cover of 2029 in Xishuangbanna
表4 2029年西双版纳土地利用面积预测Tab.4 Prediction area of land use cover of 2029 in Xishuangbanna
由图6、表4可知,未来西双版纳的城镇将进一步向外扩张,建设用地的面积仍然呈现增长的趋势,2029年建设用地预测面积为36 958 hm2,同比增长6.98%。耕地面积则呈现出下降的趋势,预测结果显示2029年耕地面积降至134 548 hm2,面积占比由原来的7.44%降至7.04%。由图6(b)2029年土地利用变化趋势图可以看出西双版纳西部地区的勐海县未来土地利用变化的概率会更大,而西双版纳的耕地又主要集中在该地区,可见对于未来保护该区域的耕地面积是有一定挑战。受生态红线和耕地红线保护的土地,未来土地利用发生变化的概率是极低的,但需要注意的是保护区边缘土地利用变化概率仍然较大。从预测结果的整体来看,未来林地与园地仍然是西双版纳最主要的土地利用类型,2种地类的面积相对稳定。
4 结论与讨论
1)2009—2019年,西双版纳土地利用类型以林地和园地为主,仅这两种地类就占总面积的85%,而土地利用变化最为明显是草地,十年间大量的草地转换为其它用地类型。生态保护红线中心区域的土地利用较为稳定,但边缘地区仍受到较大的威胁。随着城镇化的扩张与水产养殖的兴起,建设用地与水域呈增长趋势,耕地面积有一定程度的下降。
2)预测结果显示,未来西双版纳土地利用类型仍以林地和园地为主,园地面积小幅度的上升,建设用地面积持续加速增长,耕地面积则会减少。未来土地利用变化概率最大的区域位于西双版纳西部的勐海县,该区域有大量的耕地,是需要着重关心的区域。以林地为主的自然保护区和生态保护红线同样值得关注,特别是边界地区应避免被经济林地或建设用地占用。
3)本文基于多层神经网络模拟西双版纳土地利用时空演变,避免了传统线性模型的弊端,但还存在部分不足。主要是土地利用数据仅来源于土地调查,没有结合遥感数据进行综合分析,且分析尺度不够丰富。未来研究计划将不同尺度效应考虑进去,结合遥感影像探究最适合的研究尺度,同时选取更多的驱动因子以优化模型。