基于GIS平台以Python语言搭建“人工神经网络”模型及在城市开发边界划定中的应用以桂林市为例
2021-04-01李浩
李浩
改革开放后我国快速城市化进程促进城市规模迅速增长,新增建设用地规模不断增加。城市化的快速发展对城市带来负面影响,包括城市交通拥堵、过度抬高地价、土地利用粗放等。城市开发边界(UGB)是为解决城市无序扩张问题而提出的一项政策措施,已经成为西方国家抑制城市扩张比较成功的方法。2019年《关于在国土空间规划中统筹划定落实三条控制线的指导意见》提出,科学有序地统筹布置城市、生态和农业空间,要按照集约适度、绿色发展要求划定城市开发边界,防止城镇无序蔓延,为未来发展留有开发空间。由此城市开发边界成为国土空间规划工作的重心。
国外对城市开发边界的研究起步较早,德国最新研究是建立起一套智能模拟系统,挑选对城市发展影响较大的基础设施要素,例如机场、火车站和水厂等,对其影响城市拓展的规律进行探究。国内学界早期主要借助CA元胞自动机对城市空间发展进行模拟,利用其时空动态模拟的特点,来判断城市用地在元胞属性变化中取得的规律,后期出现了各类与CA结合的模型体,例如SLEUTH-CA、逻辑回归CA和约束性CA等;随着近年来计算机技术的不断进步,国内许多学者采用了更智能的算法模型,例如CLUE-CA、Markov-CA、ANN-CA和ABM智能体算法等;更有很多学者借助采用了MATLAB、MAPINFO和SPSS等模块组合软件,进行复杂城市边界模拟的独立开发。其中以多智能体和人工神经网络的情景模拟方式逐渐成为学界主流,其优势是借助极其复杂的运算方式,利用可获取的城市数据进行多方面的分析,真正模拟复杂多变的情景环境,充分考虑交通、公服、地形、市场等因素对城市边界拓展的影响。人工神经网络(ANN)是一种应用类似于生物神经网络的结构来处理信息的数学模型,广泛用于各类空间场景分析模拟技术。人工神经网络主要分为输入层、隐藏层和输出层三部分,除了运用人工神经网络算法外,还充分利用了ARCGIS搭载的Python脚本语言。本次将神经网络、样本训练、成果预测等集成于一个环境,创新性地形成ANN-PY神经网络算法模型,对依托于GIS平台的城市数据进行分析研究,形成一套适合规划人员进行简易开发的程序,使划定城市开发边界更加科学容易。
一、研究数据与方法
1.研究区概况
桂林市位于广西壮族自治区东北部,与湖南省永州市、邵阳市接壤,距离自治区首府南宁市430公里。桂林市地理特点属于喀斯特岩溶地貌,国土总面积为2.78万平方公里,现有建设用地规模为1202平方公里,占全市国土面积的4.35%。
2.研究思路
本次ANN-PY神经网络算法模型的技术逻辑思路为以2000年桂林土地利用为底,输入12个影响因子,通过影响因子对像元的分值叠加和黑箱学习,以形成2015年的土地利用为目标,训练得出模型变化规则。以2019年桂林土地利用为新样本输入,形成2035年土地利用数据变化,从而预测2035年的桂林城市开发边界形态。
3.研究数据
(1)土地利用数据来源于国家地理信息中心发布的全国遥感影像分类并截选出桂林市部分。土地利用数据包括桂林市2000年、2015年和2019年的土地利用数据。根据本次试验需要进行重分类为6类图斑,包括耕地、林地、草地、水、城市用地和乡村用地,分别对应1~6的代码。
(2)城市影响因子数据来源于高德电子地图。城市影响因子数据包括3类12个:①8个点状影响因子,分为政府机构、生活服务、医疗、宾馆、餐饮、地产小区、交通设施和旅游景点;②3个线型影响因子,为高速公路、国省道、主干路;③1个面型影响因子,为地形高程数据。
4.研究结构
(1)神经网络结构。输入层包括13个神经元,对应着12个影响因子和初始土地利用,能够直接与12类影响因子对接,促进输入的精确性;输入层链接隐藏层的激活函数为sigmod();隐藏层包括18个神经元,为了均匀内部权重以提升准确性,大于输入层的个数;隐藏层链接输出层的激活函数为tanh();输出层为6个神经元,对应着6种土地利用类型转化概率;反向激活函数为rule(),以促进反向学习能力。
(2)抽样训练结构。训练采取对现有数据进行抽样,在初始土地利用、影响因子数据和目标土地利用内,定义随机选取8000个采样点,每次获取1个数组;建立初始化矩阵,随着内部函数训练,土地转化混淆矩阵出现相应权重变化,初始土地利用抽样像元点数值发生变化,向目标年抽样像元点靠拢,响应成功即完成训练。
(3)邻域演变结构。模拟CA元胞自动机空间变化机制,以邻域空间相关性为基础,构建3*3邻域范围,以邻域像元值变化为动力,设定阈值为1,因子值叠加超过阈值即可以发生变化,像元点及邻域像元发生波动。
(4)精度检验结构。采取Kappa系数来验证神经网络学习精度,在每一轮学习训练结束后,输出图元与目标图元进行对比,确定一次准确率,当准确率过低时便会再次进行一轮训练,达到一个最高的准确率时,模型停止训练。
(5)成果预测结构。输入新土地利用和影响因子作为初始值,根据已保存的用地转换概率,启动像元值叠加变化,推动邻域范围波动,形成模拟土地演变过程,设定总体变化数量,输出目标年土地利用数据。
5.模型学习
ANN-PY神经网络模型具有传统CA模型所不具备的自动化和精度优势,训练学习过程相对稳定,易受到输入数据影响。由于桂林土地利用数据和影响因子为市域范围数据,建设用地总量占比不到4%,稳定不变的“林田湖草”占比超过95%,因此模型学习偏好倾向于不变。若输入数据替换为建设用地占比较高的中心城区数据,模型学习偏好倾向于变化。为模拟桂林市市域土地利用变化形态,选取变化概率更小、难度更高的模型训练方式。
6.成果预测
根据桂林市土地利用变化规模总量,设置目标年约5000个城市建设用地像元增长量。在模型开启训练和模拟后,城市建设用地增长量达到相应数量后,模拟停止并输出目标年土地利用图像。经过多次实验和调整模型参数,最终在多个输出结果中选取实验效果较好,Kappa准确率较高,土地利用转化形态良好,城市建设用地像元比较聚合的图像,作为最终模型预测结果。将模型最终预测结果和实际项目中初步划定的城镇开发边界集中建设区范围进行叠加,城市建设用地重叠部分平均占比为59.5%。如成果验证中心城区重叠程度较高,外围重叠较少,边缘组团无重叠,表明本模型预测成果比较集中,边缘组团缺少拓展动力。对两者有区别的图斑进行分析,判断实际项目集中区规模过大,不符合城市用地总增长量要求,应适当缩减外围红色区域;其次选取蓝色区域中区位条件好、开发度高的地区划入集中区,优化实际集中区范围。
二、结论
研究结果表明,通过加载2000年桂林市土地利用数据和影响因子,模拟2015年桂林市土地利用变化情况,学习桂林市城市用地扩张的规则,模型Kappa精度最高达到97%;并以2019年桂林市土地利用现状为底,预测桂林市2035年土地利用变化情况,实验值与城市开发边界初步结果进验证达到59.5%,能够覆盖到城区大部分区域,达到预期研究目标。因此本模型具有一定可行性,能够在一定环境下模拟城市用地变化过程,为桂林市城市开发边界的划定工作提供一定的技术支持,结合实际为合理引导桂林市城市发展提供有效策略。