APP下载

一种顾及驱动因子重要性的双约束RF-Patch-CA城市扩张模拟方法

2021-04-15林,刘皓,荆磊,李

地理与地理信息科学 2021年2期
关键词:都市区元胞约束

刘 天 林,刘 明 皓,荆 磊,李 婷

(重庆邮电大学计算机科学与技术学院/空间信息研究中心,重庆 400065)

0 引言

城市快速扩张在创造巨大经济价值的同时,环境、生态及社会问题也日益突出,特别是行政区划调整、城市扩张和重点项目建设等违背农民意愿的被动城市化问题已引起学术界的广泛关注[1]。如何遵循城市化发展规律,因势利导地制定城市发展规划,是实现社会、经济和环境可持续发展必不可少的环节。城市动态模拟是制定城乡发展规划的重要工具与手段,可为土地资源合理分配、结构有效调整、生态环境保护和农民安置等社会问题提供决策方案。

自从Chapin等首次将元胞自动机(CA)应用于城市扩张及土地利用/覆盖研究[2]后,CA逐渐成为国内外相关学者关注的热点,CA的核心问题是如何有效获取用地转换规则[3]。多准则决策较早用于定义非确定性、多维度和多级别的转换规则,但由此得出的驱动因子权重与实际结果间的因果关系并不清晰[4]。之后,Logistic回归[5,6]、神经网络[7-10]、遗传算法[11]和蚁群算法[12]等智能算法被用于提取更加准确、客观的转换规则,体现了其独特优势。用地转换规则获取过程中,元胞演化机制模拟是CA模型构建的一个关键问题, 一些模型考虑到土地利用类型之间转换的真实情况而引入动态邻域[13]、自适应竞争[14]和元胞转换异步[15]等机制,或考虑自然与社会现象的空间分异而合理地引入地理分区[16]理念,或考虑驱动因子的变化而引入城市未来发展规划等政策因素[17],从而使模拟结果更加精准。但在使用智能算法提取规则进行城市扩张模拟时,对于城市元胞密集程度特别大的区域,由于非城市元胞会同样被赋予较大的转换概率,使得模拟结果产生类间模糊,这与传统CA模型在每次迭代中通过设置某一阈值或选择转换概率最大的前N个元胞进行转换等约束条件有关。这种机制加上邻域因素影响将导致城市密集区域的非城市元胞优先转换,并与已存在的城市元胞不断连接,零散的斑块整合为较大的斑块,从而产生城市中心元胞团簇现象[18]。团簇现象在景观格局上表现为城市斑块面积变大,数量大幅减少,形状更加规则,然而在真实的城市扩张过程中,城市元胞密集区域中的部分非城市元胞(如小面积的池塘水域和复杂地形条件下的山体森林等)通常不会发生转换。限制图层方法可在一定程度上解决类间模糊而被广泛使用,但该方法通过植入大面积的规划要素改变转换规则,不适合量多面广的复杂地形下的用地转换;加之传统智能算法的元胞转换策略无法真实模拟城市扩张中的用地演化机制,使得该方法在解决团簇现象方面不理想。

随机森林(Random Forest,RF)的抗过拟合能力强,训练速度快,在一定程度上可降低不平衡数据集的误差,且能度量各驱动因子的重要性,在城市扩张模拟中精度较高[19,20];基于斑块(Patch)扩张的CA模型能真实体现城市扩张过程,其关键是确定每个新增斑块的面积,而已有研究基于历史土地利用数据确定斑块扩张面积[21,22],未考虑驱动因子对城市斑块扩张的影响程度。综上,针对传统CA模型存在的不足,本文耦合随机森林与基于斑块扩张的CA模型,在顾及驱动因子重要性基础上,构建一种基于斑块最大面积与城市扩张总量的双约束RF-Patch-CA城市扩张模拟方法,并利用该方法模拟重庆主城都市区2010-2017年城市扩张情况,提取有效的城市扩张转换规则。

1 研究区域与数据

重庆市是成渝双城经济圈的核心城市之一,是实施长江经济带和“一带一路”战略的重要组成部分,是国家推进新型城镇化的重点区域。2020年5月,重庆市首次明确“主城都市区21个区”的概念,主城都市区位于重庆西部,包括中心城区、同城化发展先行区、重要战略支点城市和桥头堡城市四部分,其中中心城区包含“两江四岸”核心区(图1)。

图1 重庆主城都市区示意

考虑到城市扩张的主要动力,本文选择自然环境、社会经济和交通作为城市扩张的主要影响因素。研究数据(表1)中,土地利用数据源于全球土地覆盖高分辨率观测与监测(FROM-GLC),该数据精度较高,在研究区域内表现出城市斑块数较多、平均面积较小和分布离散等特点,适用于解决城市中心元胞团簇问题。将表1中的异构数据统一研究区域范围、空间坐标系和分辨率(100 m),通过水体、路网和兴趣点数据计算相应的欧氏距离和点密度,构建统一的驱动因子数据集(图2)。

表1 研究数据

2 研究方法

2.1 双约束RF-Patch-CA模型技术流程

RF-Patch-CA模型(图3)运行过程如下:1)通过检测前后两期土地利用分类数据变化得到城市用地变化数据,并与相对应的驱动因子数据进行随机分层抽样;2)将抽样后的数据集输入RF模型进行训练与测试,通过训练好的RF模型得到每个元胞的转换适宜性,并利用袋外数据评价驱动因子的重要性;3)根据城市发展适宜性、邻域效应与限制因素计算得到总体转换概率;4)通过驱动因子重要性度量估计斑块扩张的最大面积,作为基于斑块扩张的CA模型的局部约束条件;5)由城市用地变化数据统计得到城市扩张总量,作为基于斑块扩张的CA模型的全局约束条件;6)基于斑块的配置与迭代对城市扩张进行模拟与参数校验,得到模拟结果。本文分别在元胞层面与斑块层面对模型进行评价,并与RF-CA、ANN-CA和Logistic-CA模型相比较,验证模型的准确性;通过马尔科夫链计算城市未来扩张总量并输入到模型中,获得未来预测结果。

2.2 转换规则提取

CA模型中每个元胞的总体转换概率取决于城市发展适宜性Ps、邻域效应Ω与限制因素Pc。城市发展适宜性通过RF算法计算得到,该算法基于集成学习的思想,将多棵决策树组合成森林,利用多数投票规则得到分类结果[20,23,24],公式如下:

(1)

图2 城市扩张驱动因子

图3 双约束RF-Patch-CA模型结构

元胞i被分为第k种类别的概率计算公式为:

(2)

在城市扩张模拟研究中,元胞i在t时刻转换为城市元胞的概率Ps(i,t)(亦即元胞i在t时刻的城市发展适应性)可表示为:

(3)

邻域效应是CA模型的重要组成部分,代表n×n邻域范围内中心元胞与周边元胞的相互作用,具体表现为中心元胞n×n邻域范围内城市元胞的密度。元胞i在t时刻的邻域效应可表示为:

(4)

限制因素约束了特殊土地利用类型向城市的转换,可表示为:

(5)

式中:Landusek表示第k种土地利用类型;当元胞i在t时刻符合扩张限制条件时,con(·)取值为0,否则取值为1。

考虑到地理和政策因素,本研究规定河流、湖泊和森林保护区不会转换为城市,因此,元胞i在t时刻的总体转换概率(未显式地增加随机因素,而是在斑块扩张中通过轮盘赌隐含城市转换的随机性)可表示为:

(6)

2.3 基于斑块扩张策略的CA模型流程

驱动因子重要性反映了驱动因子对城市扩张的影响程度,本文据此估计每个斑块扩张的最大面积,作为模型的局部约束条件。假设某元胞扩张形成的斑块的最大面积由重要性最大的驱动因子决定,具体而言,因为每个元胞的面积相等,所以第i个元胞作为起点扩张形成的斑块最大面积Amax,i可等价为组成该斑块的元胞数量,即:

(7)

式中:

模型的全局约束条件表示为:

(8)

式中:A为城市扩张总量,也代表n个起点元胞扩张形成的斑块实际面积之和;Ai为第i个起点元胞扩张形成的斑块实际面积。

为验证重要性最大的驱动因子对城市斑块扩张的影响程度,本文设计了基于单约束的斑块扩张流程。该实验流程相比上述实验的不同之处在于:1)移除了通过重要性最大的驱动因子计算斑块最大面积Amax,i的模块(局部约束条件);2)仅使用轮盘赌机制作为每个斑块扩张的迭代终止条件。

图4 基于斑块扩张的CA模型流程

2.4 精度检验与评价

本文分别从元胞与斑块层面对模型进行精度检验与评价。在元胞层面,总体精度(OA)在数据类别不均衡方面存在局限性,基于混淆矩阵的Kappa系数能更准确地进行一致性检验。Pontius等根据实际结果与模拟结果的变化差异提出品质因数(Figure of Merit,FoM)[25],相比OA和Kappa系数,FoM能更准确地反映对复杂地理系统模拟的一致性和准确性,其计算公式如下:

FoM=B/(A+B+C+D)

(9)

式中:A为实际发生转换、但模拟中未发生转换的错误区域面积;B为实际和模拟中都发生转换的正确区域面积;C为实际和模拟中都发生转换,但转换为与实际不相同的错误区域面积,本研究只涉及非城市元胞的转换,故C=0;D为实际未发生转换、但模拟中发生转换的错误区域面积。

在斑块层面上,为精确评价模拟结果的城市元胞团簇程度,选取3种景观指数:斑块数量(NP),反映景观格局及破碎程度;斑块平均周长面积比(PARA_MN),描述斑块形状的复杂度;平均最邻近欧氏距离(ENN_MN),度量斑块间的离散和团聚分布。Chen等运用基于以上景观指数计算得出的景观相似度αl评价实际图像与模拟图像之间的差异[17],其计算公式如下:

(10)

式中:li,s和li,o分别表示模拟图像与实际图像的第i种景观指数;Δli为3种评价指标的归一化结果。

3 实验结果与分析

3.1 模型关键步骤

首先,由2010年和2017年城市土地利用数据经过用地变化检测得到城市土地利用变化数据,随机分层抽取10%作为样本,然后获取样本对应的驱动因子数据,由此构建样本数据集。利用样本数据对RF模型进行训练和调优,训练好的RF模型子树数量为1 200,子树的最大深度为40,子树结点每次分裂时考虑的最大特征数为3。此外,RF模型对驱动因子重要性的计算结果显示,夜间灯光强度对城市扩张的影响程度远大于其他驱动因子。考虑到夜间灯光数据在一定程度上反映区域的经济发展水平与人口密度[26],而城市扩张的主要动力源于社会经济和人口迁移等因素[27],故本研究用夜间灯光强度约束城市斑块扩张。在斑块扩张的迭代过程中,元胞的总体转换概率由式(6)得到;扩张系数通过校验确定,本研究取值为25。

3.2 城市扩张模拟结果

以2010年重庆主城都市区为初始状态,通过双约束RF-Patch-CA模型得到2017年城市扩张模拟结果,并与传统CA模型模拟结果和2017年实际结果进行对比(图5)。从全局看,双约束RF-Patch-CA模型的模拟结果比3种传统CA模型更接近实际结果;从局部看,3种传统CA模型呈现出明显的城市中心元胞团簇现象,而双约束RF-Patch-CA模型避免了该现象。图5d与图5e的局部结果比较说明,通过考虑驱动因子重要性约束城市斑块扩张,能使模拟结果更符合实际城市斑块的分布格局。

图5 2010-2017年重庆主城都市区城市扩张模拟与实际分布对比

3.3 精度评价

由表2可知,双约束RF-Patch-CA模型相比单约束模型在OA、Kappa系数和FoM上分别提高了0.0034、0.0359和0.0599,说明考虑驱动因子对城市斑块扩张的影响程度能有效提高模型的模拟精度。

表2 单约束和双约束RF-Patch-CA模型精度对比

为进一步验证模型精度,在元胞层面和斑块层面将本文双约束RF-Patch-CA模型与RF-CA、ANN-CA和Logistic-CA模型进行比较(表3、表4)。从元胞层面看,本文模型的OA、Kappa系数和FoM均高于上述3种模型,其中Kappa系数分别提高了0.0222、0.0231和0.0245,FoM分别提高了0.0376、0.0391和0.0414,说明双约束RF-Patch-CA模型更有利于探索城市扩张转换规则;从斑块层面看,3种传统CA模型的斑块数远小于真实斑块数,斑块面积更大,斑块间相对较分散,在城市元胞密集区域呈明显的团簇现象,而本文模型的3项景观指数更接近实际值。本文模型景观相似度为77.48%,相比3种模型分别提高了40.92%、41.16%和32.33%。模型景观指数和景观相似度的对比结果充分说明了本文双约束模型模拟结果有效避免了城市元胞团簇现象,景观格局更接近实际结果。

表3 双约束RF-Patch-CA模型与传统CA模型精度对比

表4 双约束RF-Patch-CA模型、传统CA模型和实际结果的景观指数对比

3.4 参数敏感性分析

为更加精确反映斑块扩张的最大面积对模型精度的影响程度,本文分析不同的扩张系数k(取值范围为5~50,步长为5)与FoM之间的关系(图6)。当扩张系数k在5~25区间内,FoM呈明显上升趋势;当k=25时,FoM为0.3460,此时模型模拟精度达到最高;当k=30时,FoM开始急剧下降;当k在30~50区间内,FoM总体呈下降趋势。

图6 FoM与扩张系数k的关系

根据式(7)可得,扩张系数k与斑块最大面积呈正相关。当k较小时,斑块容易扩张至最大面积,模拟结果倾向于根据模型的既定规则转换;当k较大时,斑块很难达到最大面积,模拟结果倾向于城市扩张中的不确定性因素;合适的k值能有效平衡两者间的关系,达到最高模拟精度。

3.5 驱动因子重要性分析

由各个驱动因子对城市扩张的影响程度(图7)可知:1)夜间灯光强度对城市扩张影响最大,重要性达0.1297,远大于其他驱动因子。夜间灯光分布体现了社会经济和人类活动强度在空间上的差异,而城市扩张是经济发展和人口迁移等因素共同作用的结果。2)到机场距离是影响城市扩张的重要因素。机场一般修建在远郊地区,城市会尽量避免向机场方向扩张。3)地铁站的位置也对城市扩张产生较大影响,新建的地铁站不断向四周延伸,带动周边区域发展,推动非城市用地转换为城市用地。4)基础设施(学校、商场和医院)分布密度对城市扩张具有不同程度的作用。值得一提的是,景点对城市扩张的影响较大,重庆独特的城市特性与文化背景吸引了大量外地游客,旅游业得到极大发展,对景点周围的非城市用地转换产生了一定影响。5)地理环境因素(如高程和坡度)对城市扩张影响相对较弱。大型城市通常位于平原地带,而重庆以丘陵和山地为主,在复杂的地形地貌上扩张,因此重庆主城都市区在面积扩张方面对地理环境相对不敏感;但在景观格局方面,重庆主城都市区相比平原地带的成都市,NP、PARA_MN和ENN_MN在同等城市面积内提高了360、19.532和51.141,说明地形地貌对城市扩张格局有深度影响。

3.6 城市未来扩张预测

为预测重庆主城都市区未来扩张情况,根据2010-2017年城市变化数据,通过马尔科夫链计算2024年和2031年的城市扩张总量。以2017年模拟结果(图5e)为初始状态,通过双约束RF-Patch-CA模型得到2024年和2031年城市扩张预测结果(图8a、图8b),未来重庆主城都市区呈现以城市群为中心向四周扩张趋势。由表5可知,在未来14年内,中心城区发展速度逐步放缓,同城化发展先行区和重要战略支点城市保持快速发展势头,而桥头堡城市将保持相对缓慢的扩张趋势。

图7 驱动因子重要性

图8 2024年和2031年城市扩张预测结果

表5 未来模拟情况下各地区的城市用地年均增长率

4 结论与讨论

本文构建双约束RF-Patch-CA模型,以重庆主城都市区2010年城市土地利用数据为初始状态,通过城市扩张变化的内在规律挖掘转换规则,得到2017年城市扩张模拟结果;通过与传统CA模型的模拟结果进行对比,验证模型的准确性与适宜性;最后基于双约束RF-Patch-CA模型预测重庆主城都市区2024年和2031年城市分布格局。

研究结果表明:1)在顾及驱动因子重要性基础上构建的基于斑块最大面积和城市扩张总量的双约束RF-Patch-CA模型,避免了传统CA模型在城市扩张模拟中存在的城市中心元胞团簇现象,更加精确地模拟出复杂的城市扩张过程;2)扩张系数的敏感性分析表明,模型中引入真实城市扩张中的不确定性因素能够提高模型性能;3)驱动因子重要性计算结果显示,夜间灯光强度显著影响城市扩张格局,地理环境因素对城市扩张面积的影响相对较弱,但对城市扩张形态影响较大;4)2017-2031年重庆主城都市区呈现以城市群为中心向四周扩张趋势,发展重心将由中心城区逐步转移至同城化发展先行区和重要战略支点城市。

本文虽然对城市扩张驱动因子的重要性进行了度量,但未考虑空间异质性问题。驱动因子在不同子区域对城市扩张的影响程度存在差异,如何对研究区域进行合理分区并对每个分区构建不同的转换规则,需进一步探讨。

猜你喜欢

都市区元胞约束
重庆主城都市区工业遗产分布图(部分)
“碳中和”约束下的路径选择
约束离散KP方程族的完全Virasoro对称
都市区创智中枢 北郑州水韵嘉城
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
自我约束是一种境界
县域对接融入都市区研究
基于元胞数据的多维数据传递机制
适当放手能让孩子更好地自我约束