基于CA-Markov模型的洞庭湖区土地利用变化模拟研究
2023-12-04袁淑君王莹湖南工程职业技术学院
袁淑君 王莹(湖南工程职业技术学院)
土地利用模拟是研究土地利用变化趋势、探索人地关系协调发展的重要手段。[1]通过数据测算及空间分析找到影响地类布局的驱动因子,探寻隐藏在地类变化中的规律,结合模拟模型将掌握的规律进行迭代运算,可以得到按照当前趋势未来某一时间段的土地利用类型的布局形式,为未来区域土地利用管理政策制定提供数据支持。[2]土地利用布局优化是指对土地要素进行空间调控,力求在不同区域之间实现不同类型的合理配置,是实现土地资源合理利用、优化城市发展空间发展格局的重要手段。[3]土地利用布局优化方案对国土部门制定城市总体规划具有现实参考意义,对促进地方经济发展、加强生态保护、实现社会公平、促进资源利用协调发展具有深远意义。通过对文献的研究,CLUE-S、Binary-Logistic和CA-Markov模型被经常用于土地利用的未来情况模拟。在这之中,CA-Markov和CLUE-S模型在定量分析和空间展开研究方面虽存在局限性,但常用于空间分析,大体上可以展现出各种地类的时空变化趋势及规律。Logistic模型和Markov链在处理复杂空间范围内的模拟上还存在一些缺陷,主要用于经验统计,在求解复杂操作中发挥重要作用。[3]综上所述,CA-Markov模型在土地利用模拟研究中得到了广泛应用。
本文以洞庭湖区为研究对象,基于从2000年至2020年之间获取的五期的土地利用遥感数据,通过回归分析进一步探索了各驱动因子和各土地类型空间布局上的潜在关系。在此基础上,利用CAMarkov模型,根据现有趋势预测2035年洞庭湖区土地利用类型布局。
一、区域概况
区位分布:洞庭湖区主要分布在湖南及湖北的部分区域,辖区内共33个县(市、区),总面积6.05万平方公里。本次研究中选取湖南省的岳阳、常德、益阳及长沙市望城区作为研究对象(以下简称洞庭湖区),面积约4.63万平方公里,占全省总面积的21.89%。
地形地貌:东部、南部和西部的洞庭湖地区都是山区,地势高;北部是平原水网区域,地势呈现中间低、四周高的趋势,由四周向中部依次按中低山、低山—侵蚀剥蚀丘陵、岗地—流水堆积平原和湖积围堤平原的顺序展开,显示明显的“碟形盆地圆带状”景观,各进湖水系呈扇形分布。[4]
水热条件:研究区属亚热带湿润季风气候区,光热充足,雨量充沛,雨热同期。
资源总量:生态资源方面,生物类型丰富,湿地种类繁多,被列为国际重要湿地;地表水资源总量560.97亿m3,占全省的29.38%;地下水资源量103.92亿m3,占全省的23.79%,总面积2625平方公里,是中国第二大淡水湖;在非金属矿产方面,资源总量丰富,主要有磷、岩盐、芒硝、石膏等。
社会经济方面:到2020年,洞庭湖区常住人口1506.62万人,比2000年减少139.89万人,其中城镇人口866.83万人,城镇化率达到57.54%;实现国内生产总值10494.87亿元,占全省经济总量的25%;三大产业结构为11∶40∶49,基本形成“三、二、一”的产业格局。
二、数据来源与研究方法
(一)数据来源
1.遥感数据
涉及的遥感影像基本均来自中国科学院资源环境科学与数据中心。其中2000年、2005年和2010年的数据源主要采用的是Landsat TM/ETM遥感影像,并通过人工目视解译。2015年及2020年数据主要基于前一期的数据,利用Landsat 8遥感影像,并通过人工目视解译。
2.非遥感数据
高程、气温、降水、NDVI、河流、土壤侵蚀、铁路、人口密度、GDP、生态系统服务价值等栅格和矢量数据均来自中国科学院资源环境科学与数据中心。
根据高程和NDVI数据分别计算坡度和植被覆盖度。到河流的距离和到铁路的距离使用ArcGIS软件中的欧氏距离工具进行处理。
(二)研究方法
1.土地利用特征分析
(1)土地利用的地带性分析
洞庭湖区海拔范围为-112~2043m,海拔高度变化差异较大,为了分析不同时期各种土地利用类型的地带分异,本文利用ArcGIS 10.7中的重分类功能将海拔按照相等间隔分为五个等次,并将五个不同时期的土地利用现状图与之进行叠置分析。
(2)土地利用类型转换分析
对2000—2005年、2005—2010年、2010—2020年和2000—2020年四个时期的土地利用转移状况进行了详细的数据分析。土地利用转移矩阵计算公式如下:
上式中,Mij表示第i种地类转换为第j种地类的面积,n表示土地利用类型的总数,即n=6。
每种地类的面积占比计算如下:
上式中,R表示某一地类占总面积的比值,Aij表示第i年第j种地类的面积。其中i=2000、2005、2010、2020,j=1、2、3、4、5、6。
(3)土地利用变化强度分析
通常情况下,衡量一个地区的土地利用变化强度可以从地类变化速度和地类变化幅度来分析,其中地类变化速度主要用土地利用单一动态度计算,地类变化幅度主要用地类变化强度计算。计算公式如下:
上式中,Rd表示地类的单一动态度,Ua表示某地类在前一期的面积,Ub表示该地类在后一期的面积,T表示时间间隔。
上式中,Id表示某一类型土地的变化强度,Ai表示研究区域内各类型土地的总面积。
2.Binary Logistic回归分析
Binary Logistic回归分析(简称二元回归分析)不同于一般的回归分析,它以每个栅格单元为研究对象,找出每种土地利用类型与每种驱动因素之间的线性关系。计算公式如下:
上式中,Pi表示i种地类出现在每个栅格单元中的概率,x0,x1,…,xn-1为每个驱动因子,β1,β2,…,βn为回归方程的解释变量系数,x0,i,x1,i,…,xn-1,i是各驱动因子在i地类上的值。
3.CA-Markov模型构建
(1)元胞自动机(CA)模型
元胞自动机模型(简称CA模型)将研究区域划分为一定数量的规则格,每个格单元视为一个单元,每个单元按照一定的转移规律变化,通过自身和附近的变化反映整个研究区域的变化。在了解转移规律的基础上,通过模型模拟可以得到未来某一时期土地利用的空间布局。
(2)马尔科夫链(Markov)模型
马尔科夫链模型(简称Markov模型),在地类的数量变化预测上经常发挥着至关重要的作用。土地利用转移概率是由一种地类转换为另一种地类的面积占原有土地总面积的比例。土地利用类型的转移概率可用转移矩阵表示为:
那么T时刻的土地利用状态可以表示为:
上式中:Pin表示土地利用类型从i类转移到n类的概率,满足0≤Pin≤1,E(T0)和E(T)分别表示T0和T点的土地利用类型。
(3)CA-Morkov模型
CA-Morkov模型由元胞自动机(CA模型)和马尔科夫链(Morkov模型)组成,可以很好地进行空间分析和数量预测。
三、结果分析
(一)土地利用空间分布特征分析
总体来看,90%的土地利用类型分布在700m以下,其余10%分布在700m以上。700m以下林地和草地两种土地利用类型占比均超过70%,700—1600m仍有10%~20%分布。这说明整个研究区各土地利用类型存在一定的地带分异规律,但分异不明显,主要集中在700m以下的低空区域,高程带之间仅存在少量流动,各土地利用类型的高程分布总体相对稳定。
(二)土地利用时空演变特征分析
1.土地利用数量变化特征
2000—2020年,随着研究区社会经济的快速发展,各土地利用类型也呈现出不同程度的变化。建设用地持续增加,耕地、林地、草地逐渐减少,水域和未利用地保持稳定但略有波动。六种主要土地类型中,建设用地、耕地和未利用地面积变化幅度较大。在此期间,研究区建设用地及未利用地分别增加了626km2和304km2,建设用地占比从1.85%逐渐增加到3.20%,未利用地占比增加了1.35%。根据洞庭湖区实际分析,耕地面积减少583km2,是所有土地类型面积减少最大的,而根据洞庭湖区实际分析,减少的原因可能有以下三个方面:一是近几年外出务工人员较多,耕地荒废现象普遍;二是以镉为主的重金属导致幕阜山、雪峰山土壤侵蚀及土地石漠化,部分耕地难以耕种,耕地面积减少;第三,建设项目和其他非农业活动的占用导致耕地数量减少。
2.土地利用变化时空转移持征
(1)土地利用变化时空转移特征
从时间上看,2010年以前土地利用类型之间的转换相对稳定。2010—2020年,土地利用转换较为活跃。根据土地利用转换量变化分析,2000—2020年,耕地和林地转出面积最大,转出面积分别为2100km2和1355km2,转出面积最少的是建设用地,转出面积为201km2。转出土地面积基本转为建设用地,建设用地转入面积626km2,其次是未利用土地,转入面积304km2。其他类型的土地通常迁入比迁出少。
(2)土地利用空间转移持征
从各类土地的空间分布来看,2000—2020年,湖区以洞庭湖为核心,耕地四面环抱,覆盖面积最广。草地与林地、耕地相邻,未利用地与水域相邻,呈分散分布。建设用地中的城市建设用地主要集中在沿湖平原区,且有扩大的趋势,农村聚落群体多而分散,且大多分布在以耕地为主的农田周围,多沿高速公路分布,研究期间空间变化不明显。
3.土地利用动态变化特征
从土地利用综合动态分析来看,整体上20年之间洞庭湖区域的土地变化较为活跃,分阶段来看,2005—2010年洞庭湖区域土地利用变化最为显著,而2015—2020年洞庭湖区域土地利用变化速度明显放缓。而建设用地K值在5个阶段均为正,且增长速度较快,扩张明显,2005—2010年未利用地K值达到9.874%;其次是建设用地K值4.992%;耕地变化率一直为负,特别是2010年以后,耕地变化率下降了很多,而且减少明显;在此期间,林地变化速率也为负,面积继续减少;草地、水域和未使用土地的变化率是浮动的。总之,洞庭湖区土地利用的变化主要依赖于人类活动和城市扩张。此外,由于2010年后洞庭湖水利工程的建设和长江经济带的建设及生态环境的保护,水域面积的下降有所减少。
(三)土地利用变化影响因素分析
1.土地利用变化驱动因子分析
根据洞庭湖区的实际情况,为了更加准确、科学地实现土地利用模拟,保证数据的科学性、代表性和可用性,共选取了11个驱动因子,分别分属于自然、社会经济和区位三个方面。如表1所示:
表1 土地利用变化驱动因子统计表
通过SPSS软件诊断11个驱动因子的共线性,提取分析结果中的容差和方差展开因子(VIF值),借用VIF值对驱动因子是否存在多重共线性进行诊断,公式如下:
由表2可知:每个驱动因子的VIF值都远远小于10。说明这11个驱动因素都不存在多重共线性,可以采用二元回归分析。
表2 驱动因子的方差膨胀性因子(VIF值)计算结果
2.Binary Logistic回归分析
在ArcGIS 10.7中将11个驱动因素转换成ASCII文件导出,并将数据导入SPSS软件,在因变量中导入6种土地利用类型,在自变量中导入11个驱动因素,按照次序依次进行回归分析,回归分析结果制表如表3。
表3 各土地利用类型Binary Logistic EXP(β)系数
由上表可知,数值越大即表明驱动因子在地类分布上的关联性越强,由此可得:(1)对耕地分布格局影响最大的因子是高程和年平均气温,EXP值分别为2.595和2.308。(2)对林地分布格局影响最大的因子为植被覆盖度和坡度,其EXP值分别为3.168和2.334。(3)对草地分布格局影响最大的因子是年降水量和土壤侵蚀,EXP值分别为1.437和1.324。(4)植被覆盖度和生态系统服务价值对水体分布格局的影响最大,EXP值分别为1.572和2.686。(5)人口密度和GDP对建设用地分布格局影响最大,分别为3.127和3.03。(6)坡度和年降水量对未利用土地分布格局影响最大,EXP值分别为1.919和1.964。(7)坡度、植被盖度、生态系统服务价值、国内生产总值(GDP)和距铁路距离是影响土地利用类型分布的5个关键因素。
(四)CA-Markov模型模拟
在土地利用模拟研究中,Kappa系数经常被用来验证土地利用模拟的准确性。在进行2035年土地利用模拟之前,可以首先检验一下模型模拟的准确程度,根据现有的2000年及2010年数据模拟2020年数据,并将2020年模拟数据和2020年现实数据做对比,分析其准确程度。并进一步采用CROSSTAB选项对模拟精度进行测试,结果显示Kappa系数为0.8358,大于0.75,模拟精度较高,能够满足研究需要,各地类模拟误差明细显示如下,由此可知模型模拟上对除建设用地和未利用地的其他地类模拟精度较高,建设用地和未利用地模拟上误差略大,不过整体上满足研究需要,可进行下一步预测。
在此基础上,进一步结合现有的2010年及2020年数据预测2035年土地利用状况。首先生成2010—2020年利用马尔科夫转移概率矩阵和各土地利用类型的适宜性地图集。[5]其中,CA模型中的邻域结构设置采用系统默认的5*5型冯诺依曼形状,迭代次数为15次,最终形成2035年的土地利用模拟图(如图1)。
图1 洞庭湖区2035年土地利用模拟图
在未来的扩张过程中,洞庭湖区将进一步减缓城市扩张速度,加强土地集约利用程度,增强占补平衡、生态补偿,大力实施退耕还林、退耕还草、退耕还湖等政策,加强人工林地种植和水利设施建设,大力推进生态文明建设,合理布局三生空间,实现高质量发展。
四、结论与讨论
本文以洞庭湖区为研究对象,借助Binary-Logistic回归和面积转移矩阵研究方法,分析了洞庭湖区20年来土地利用的时空变化,深入探讨了变化的原因,并利用CA-Markov模型模拟预测了研究区2035年土地利用变化趋势。[6]
2000—2020年,洞庭湖区6种土地类型的变化幅度和活跃度均有所提高。城市化进程的加快导致的城市扩张,不可避免造成建设用地持续增加;耕地主要向建设用地、水域和林地转变,面积明显减少;林地面积略有减少;这一时期变化最显著的是草地和未利用地,呈现出先减少后增加的明显趋势。
以洞庭湖区2000年土地利用状况数据为基础,利用Binary-Logistic回归分析了11个影响因子与各地类分布的关系,结果表明,这些因子对地类具有较好的解释效果,ROC检验值均大于0.8。各影响因子对不同地类具有不同的驱动作用和解释能力,其中坡度、植被盖度、生态系统服务价值、GDP、距铁路距离等的解释能力最好。
模拟结果表明,2035年洞庭湖区建设用地、草地、水域和未利用地面积均将增加,而耕地和林地面积将减少。洞庭湖区城市化进程明显加快,主要集中在岳阳楼区、武陵区和赫山区。草地、水域和未利用地主要集中在研究区各区县域和城区边缘,生态保护措施效果明显,但容易造成耕地和林地的撂荒。
本研究存在一些不足:在影像监督分类的情况下,由于所选样本的可分离性存在细微误差,导致分类结果与实际土地类型之间存在细微误差,CAMarkov模型预测结果的科学可靠性需要考虑研究区域短期内不会发生重大经济和政策变化。此外,在编制洞庭湖区适宜性图集过程中,对影响因素的选取和权重分配较为主观,缺乏客观分析。[3]这些都是今后洞庭湖区进一步优化研究的重点方向。