基于机器学习的乡村聚落“空间—动力”耦合机制解析方法研究*
——以江苏溧阳市为例
2022-09-15赵之齐
付 鹏 肖 竞 赵之齐 谢 鑫
0 引言
从世界各国城镇化的历程来看,当城镇化率迈入50%~70%之间时(2021年我国常住人口城镇化率为64.72%),一般会由城乡分化、城乡分离迈入城乡融合的重要发展阶段[1]。在“乡村振兴”战略全面推进的背景下,我国广阔的村镇地区将迎来新一轮“聚落重构”的机遇。近年来,围绕乡村转型发展的研究成果愈发丰富,其中“转型过程—空间行为—机理分析—评价模拟—调控模式”的研究范式[2]逐渐成为当前研究乡村转型重构及其内在原理的重要方向。在此范式中,认识和揭示乡村聚落重构的内在机理也是我国乡村发展的新命题,尚存在诸多问题与挑战,故而补充与完善聚落转型重构动力机制的理论与方法显得尤为必要。
在理论研究层面,聚焦我国乡村转型发展多尺度演进规律、内外因子驱动机理、空间优化重组方法等学术学理研究不断完善[3-7]。同时,在信息化、数字化等现代发展浪潮下,人工智能技术成为我国重点探索与应用的重要方向,积极运用大数据与人工智能分析方法,更加科学全面地分析乡村地域系统要素的演变过程及其机制,革新乡村聚落空间重构的研究范式也显得尤为重要。本文着眼于乡村转型重构动力机制的方法与技术提升,从理论方法出发,系统梳理近期不同领域的乡村转型机制研究方法与技术的进展成果,从人工智能中的机器学习技术方法入手,尝试将乡村聚落空间重构的特征及其多维动力数据相关联,定量化识别其主导驱动力,以期丰富乡村空间重构机制研究的量化分析方法。并将此方法应用于江苏省溧阳市作为实证研究,目的是解析其在2010—2018年乡村剧烈重构阶段的空间特征以及相关的驱动机理。
1 乡村聚落重构动力机制的研究进展
1.1 乡村聚落重构动力机制研究主要方法
在村镇聚落重构及其动力机制研究方面,不同学科从不同角度均在开展相关研究。其中,社会学、经济学、地理学领域针对宏观机制、经济影响、社会影响层面研究较为突出;而围绕人居环境科学的城乡规划学、建筑学、风景园林学等学科也从城市空间研究逐渐过渡到乡村空间的研究。但围绕“空间—动力”耦合的研究成果主要集中在地理学与城乡规划学领域[5]。
地理学领域,聚落重构动力机制的研究方法主要集中在对较大尺度的土地斑块空间特征量化以及基于统计学模型的影响因素识别[6]。现有研究主要是结合GIS的叠加分析和空间统计功能,并采用分形维数、中心性强度、熵权法、多元线性回归、地理探测器、地理加权回归、多元线性回归、时空地理加权回归、因子分析、聚类分析[7-11]等方法研究建设用地规模或聚集程度变化的综合影响,结合定性分析揭示其驱动因素;规划学领域,研究对象一般聚焦于聚落个体尺度,动力机制分析方法主要依赖于剖析典型案例以及定性判别来说明聚落重构的影响因素。目前研究较为普遍的是结合历史影像、测绘地形图,将聚落空间以形态类型学、分形几何学、形状指数等方式进行量化,并结合评价指标、AHP层次分析法、德尔菲法等方式探究空间形态特征、用地变化与自然、社会、经济因素的相关性[12-16](图1)。
图1 乡村聚落重构动力机制分析方法研究进展与聚类分析(2010—2022年)Fig.1 research progress and cluster analysis of dynamic mechanism analysis methods for rural settlement reconstruction (2010-2022)
总体来看,经过十余年的研究发展,相关学者也意识到,在乡村聚落重构动力机制逐渐从单一驱动转向多元互动机制时,定性研究的方法难以回答哪些空间形态特征是源于地域哪些自然、社会、经济条件,以及不同动力因素作用强度、作用范围下空间形态会发生何种变化,因此对现行的村庄规划、建设、发展的指导较为有限[17]。故而研究方法逐渐从定性分析转向空间描述、指标体系、统计学模型等定量研究方式,以期能够更加精准、直观地刻画不同动力因素作用下的空间重构特征及其作用机制。但目前的定量研究更多地依赖指标体系、权重分配、统计学模型的方法,因素权重赋值的相对臆断、主观性较强,专家打分、层次分析、模糊评价、灰色系统关联度等方法,都试图对权重进行客观赋值,但改善作用不大[18]。基于此,动力机制解析的定量研究方法,特别是“数据驱动”的定量识别方法有待进一步加强。
1.2 人工智能背景下动力机制量化解析的研究方向
在传统的规划研究及实践中,基于定性分析的规律描述和模式总结是主要的研究方法。随着学科融合和新技术理念的融入,2017年国务院《新一代人工智能发展规划》明确提出以机器学习、深度学习等算法为代表的人工智能介入空间规划领域。传统的空间规划编制理念、方法、技术也将面临巨大变革,数字化分析、动态预测、人工智能算法、大数据等技术手段不断深入规划设计领域,为解决科学问题提供了新的契机和新的途径[18]。随着乡村聚落研究的开展,数字化分析方法逐渐介入乡村聚落空间研究,研究方式也从定性描述阶段向定量数据挖掘阶段大步迈进,更加科学地探索时空规律,辅助空间决策,促进乡村地域特色的传承与发展[20]。
机器学习是实现人工智能的核心技术之一,特别是在大数据迸发的当下更能凸显其优势。1997年米歇尔(Mitchell)提的出机器学习方法[21],经过二十余年的探索,已在土地科学领域进行了广泛运用,包括土地覆盖分类、特征分析、农地评估、抛荒地识别、城市扩张、资源与生态安全评价[22-25]等。在评估、验证、预测用地变化等方面展现出相较于传统方法的巨大优势,一定程度上弥补了传统城乡规划模式中主观定性与平面化分析的缺陷,让规划学科能够更加科学地解释并解决城乡的复杂性问题。
2 乡村聚落“空间—动力”耦合机制解析的机器学习方法
2.1 机制解析的方法建构
机器学习本质是借助于计算机的运算能力,通过计算事物属性的相关关系,“学习”知识,发现事物的规律、预测事物发展[26]。相较于其他人工智能算法,机器学习在归纳事物客体的“分类、回归”方面具有独特的优势,常应用于发现数据中的模式和规律并识别驱动因素[27]。具体而言,机器学习算法分为监督学习(supervised learning)和无监督学习(unsupervised learning)。其中,有监督学习是从给定的有标注的训练数据集中学习出一个函数(模型参数),当新的数据到来时可以根据这个函数预测结果。本文结合监督学习算法的模型理论、数据结构,对乡村聚落空间重构特征进行标记,对关联数据进行“学习”,挖掘聚落空间重构的影响因素。
乡村聚落“空间—动力”机制解析的机器学习方法,是将聚落重构的“空间”特征进行识别、提取、赋值,同时与其“动力”因素(例如所在的区位条件、自然地理情况、附近的资源条件、经济与社会发展情况等)相关联,形成一套完整的数据集,运用机器学习算法计算不同“空间”与“动力”的耦合关系,提取不同影响因素的作用强度。具体方法是在构建乡村聚落重构的跨时空尺度综合数据库基础上,分四个步骤实现:聚落空间重构特征解译及赋值标记、多维驱动数据的选择与转译、机器学习模型选择与训练、动力因素识别与机制解析[28](图2)。
图2 动力机制解析的机器学习原理及流程Fig.2 machine learning principles and processes of dynamic mechanism analysis
2.2 “空间—动力”机制解析的机器学习流程
2.2.1 聚落空间重构特征解译与赋值标记
空间重构的特征直观反映乡村聚落的功能、规模、格局变化。在空间尺度上,一般有省、市、县等宏观尺度与镇、村、单体等微观尺度两大类研究。由于在微观尺度受到村民自身主观意愿和各种因素的影响具有不确定性,而村落空间重构的统计学规律随着观察尺度的扩大而逐渐明晰[29]。故本文重点研究县域尺度聚落用地空间的重构状态,具体分为聚落的收缩变化和聚落的扩张变化(村庄建设用地的增减变化),将建设用地增加或减少的聚落斑块进行识别、提取、标记,形成“标签”数据。
标签是机器学习中的因变量,是监督学习的目标。乡村聚落空间重构动力机制研究的机器学习依赖于建立多维度影响因素与特征标签的量化关联,故需要通过相关降维量化手段进行数据转译表达,将单一属性以符合其作用特征的描述方式转置于地理绝对空间中,建立起自然地理、社会经济等空间多维关联的基础数据,为客观挖掘复杂系统运作机制奠定基础。在标签数据提取上,将区域内的聚落重构前后乡村用地矢量数据进行叠加分析,识别聚落建设用地扩张或收缩的图斑,再运用ArcGIS将图斑转变为带有面积属性的空间点(表1)。
表1 聚落重构特征标签标记示意Tab.1 settlement reconstruction feature labeling schematic
在此基础上,运用ArcGIS的核密度(kernel density)分析工具将聚落重构的空间标记进行核密度分析(表2)。值得说明的是,在分析过程中,保留了聚落变化的面积作为权重值,用于表示连续表面的景观内的计数或数量。空间点所记载的面积越大,其基础计数越大,这样可以在一定程度上避免聚落变化面积属性带来的计算误差,使核密度值计算更为客观。最后,将计算后的和密度值作为因变量,来表征村落空间重构的剧烈程度。
表2 因变量(核密度值)计算说明Tab.2 dependent variable (kernel density value) calculation instructions
2.2.2 多维驱动数据选择与转译
乡村地域系统是一个自然—经济—社会—生态复合体[30],在获得聚落空间重构特征标签数据基础上,将复杂的自然、社会、经济等多种属性转译为空间中的相关数据,通过绝对空间的拓扑关系和属性空间的属性关联,建立训练样本的多维关联特征空间数据集(“属性”数据)。乡村聚落空间重构在内生需求与外源动力内外综合作用下进行[6],受聚落区位、自然地理、发展资源、社会经济等复杂要素影响,需要建立覆盖多元影响因素的多维关联数据库。本文基于已有理论成果,考虑数据获取可能性,最终选取包括4个维度共14个影响因素(表3)。准备相关土地利用、POI点、经济社会数据,转译得到聚落区位距离、空间资源情况、自然地理度量指标、社会经济情况等指标,集成到聚落空间的三维属性中,整备出重构影响因素数据集。
表3 乡村空间重构影响因素空间转译说明表Tab.3 interpretation table of spatial translation of influencing factors of rural spatial reconstruction
其中,运用欧氏距离方法(euclidean distance)计算各个特征点距市区、镇区、核心景区、主要道路、其他镇村道路的距离属性;运用空间计算与空间统计得到聚落空间重构特征点的高程值、坡度值、生态资源、农业资源、人口密度、人均收入等;此外,通过高德POI数据导入分析获取经济社会活力的核密度分析、村域内景点的资源的核密度等。
2.2.3 动力机制解析的机器学习方法选择
随着学科的融合发展,机器学习方法已在地理学、生态环境学研究中用于空间演变、土地变化的相关研究[31],支持向量机、K近邻、神经网络、地理探测器、元胞自动机、随机森林、GBDT等经典机器学习算法已在相关研究中取得了有价值的研究成果,证明了机器学习对于空间研究的重要意义[32]。其中,基于树的集成算法在土地利用变化研究中有突出优势,在复杂的、特征未知的大量多维非平衡数据集的分析决策中具有显著优势,体现出良好的学习效果[33]。具有高度可解释性的基于树的集成算法主流模型(如随机森林、GBDT等),在主导特征的解释上有突出优势[34]。
在较大样本量下,梯度增强算法具有一定优势,因此基于梯度增强算法的梯度提升决策树模型(gradient boosting decision tree, GBDT)通常发挥比其他决策树相关集成模型更好的学习效果[35],具有预测精度高、构建过程简便、能处理非线性、连续和离散数据、结果可解释等优点[36],对土地及空间的影响因素和动力机制研究有极佳适用性和算法优势,本文选取此模型进行机器学习研究。
2.2.4 特征重要性计算与作用机制解释
针对聚落扩张与聚落收缩两类数据集,进行参数设置(数据洗牌、训练占比、基学习器数量、节点分裂设置等)与模型运算;运算后通过MSE(均方误差,预测值与实际值之差平方的期望值)、RMSE(均方根误差,为MSE的平方根)、MAE(平均绝对误差,绝对误差的平均值)、R²(将预测值跟只使用均值的情况下相比)等一套保证训练精度的指标。通常RMSE比MSE更广泛用于评估回归模型于其他随机模型的性能,因为它的因变量具有相同的单位;R 平方值越高则模型性能越佳,越被认可。
在训练数据、测试数据通过精度检验后,输出模型的特征重要性指标,预测结果可以由人来解释(可解释性)。其中,特征重要性(variable importance)是一个衡量每个输入特征对模型预测结果贡献的指标(0~100%),以直观反映每个特征是如何在模型的最终“决策”中发挥作用的。在本案中,特征重要性的结果与聚落空间重构的动力因素作用强度直接关联,反映了乡村聚落重构的驱动力影响显著程度,代表了不同动力因素作用于空间重构的作用强度。
3 溧阳市乡村聚落“空间—动力”耦合机制解析方法实证
3.1 研究区域概况
溧阳地处长三角几何中心,是宁杭生态经济带上重要节点城市,是国家生态市、中国优秀旅游城市,也是江苏省唯一的“全国丘陵山区农业综合开发示范市”。同时,溧阳自然资源丰富生态环境优美,呈现“三山一水六分田”的地貌特征;旅游资源富集,除了南山竹海、天目湖等的5A、4A景区以外还有200多家旅游农庄和各类精品民宿。2019年末,溧阳市农村人口近30万,共有171个行政村、2490个自然村,每平方千米1.62个自然村[37]。
究其原因,由于顶管在顶进过程中遇到了较多大粒径砂卵石及坚硬岩石,且没有使用减阻措施,所以阻力加大,顶力突然升高,顶程15~31m之间顶力较大,因其上方是道路交通载荷影响区,顶管顶进较为吃力。
二十一世纪以来,溧阳农村主要经历了五个阶段的建设与发展①。特别是在2011年后分三个层次的全面整治,打造三星级村庄24个,二星级村庄242个,省级美丽乡村示范点21个,保护了一批传统村落,3个村获得建设部美丽宜居乡村示范。随后,建成7个特色田园乡村,500个美丽宜居乡村。伴随着上述一系列行动的推进,溧阳乡村发展水平不断提升,乡村特色愈发凸显,实现了“点上有特色、线上见风景、整体大提升”的成效(图3)。
图3 溧阳市区位与乡村聚落发展概况Fig.3 location of Liyang City and rural settlement development overview
3.2 乡村聚落空间重构特征
溧阳市乡村聚落在2010—2018年期间,伴随着美丽乡村建设与特色田园乡村建设的推进,聚落在近十年期间总体上呈现聚落收缩(2.42 km²)高于聚落扩张(1.87 km²)的趋势。从数量和平均规模上看,聚落扩张的斑块数量(1060)高于聚落收缩数量(768)的斑块,同时聚落扩张的平均面积(1762.18 m²)小于聚落收缩的平均面积(3146.73 m²),则表示溧阳市的乡村建设已经逐步迈入整体空间格局优化与聚落小微渐进式更新补足阶段,这与《国家乡村振兴战略规划(2018—2022年)》中“搬迁撤并类村庄”和“集聚提升类村庄”的发展模式相契合(表4)。
表4 溧阳市聚落空间重构特征统计表Tab.4 statistical table of spatial reconstruction characteristics of settlements in Liyang City
空间分布上,结合溧阳乡村空间分区可以看出:收缩聚落斑块主要呈现线性、集聚等特征,主要位于市域东北部水圩地区与中部平原地区,南部低山地区则在此期间聚落减少数量较少;扩张聚落斑块则呈现分布较为均衡,各街镇均有不同程度扩张的总体特征,南部低山地区局部聚落增加较为密集(图4-6)。
图4 聚落空间收缩斑块分布Fig.4 spatial shrinkage patch distribution of settlements
3.3 “空间—动力”机制解析
3.3.1 数据标记与转译
将聚落空间重构的扩张斑块与收缩斑块的两个数据集进行空间标记。得到聚落收缩数据集面积从45.78 m²到22.64 hm²不等的聚落768个标记点;聚落扩张数据集面积从14.63 m²到20.06 hm²不等的聚落1060个标记点。同时对标记点的空间分布进行面积加权的核密度分析,得到聚落扩张、聚落收缩集中分布的量化数值。其中,聚落扩张的核密度值最高为2.1,聚落收缩的最高值为1.8(表5)。
表5 聚落空间重构标签总体情况表Tab.5 settlement space reconstruction label overall situation table
同时,建立溧阳市可能影响因素聚落空间重构的4维度共14个影响因子的多维空间转译数据(图7),将转译数值结果关联到聚落重构特征标记点,整备出便于机器学习数理计算的聚落空间重构扩张与收缩的两个特征数据集(表6),并采用min-max方法对数据集进行标准化处理(表7)。
表6 聚落空间扩张数据集示例Tab.6 example of the settlement spatial expansion dataset
表7 聚落空间扩张数据集示例(标准化后)Tab.7 example of the settlement spatial expansion dataset (after normalization)
图5 聚落空间扩张斑块分布Fig.5 spatial expansion patch distribution of settlements
图7 溧阳市聚落空间重构驱动数据整备Fig.7 settlement space reconstruction drives data reconditioning of Liyang City
将标记出的1060个聚落扩张特征点数据集与768个聚落收缩特征点数据集,运用训练集数据来建立梯度提升树(GBDT)回归模型,并将建立的回归模型应用到训练、测试数据,得到模型评估结果(表8)。由结果可知,训练出的两个模型的精度均较高,MAE、MSE和RMSE的值均较低,意味着回归模型的准确度高,具体来讲,聚落扩张数据集的测试集的RMSE为0.065,R²为0.927;聚落扩张数据集的测试集的RMSE为0.06,R²同样达到为0.927,显示出该学习模型性能较为突出。
表8 GBDT模型评估结果Tab.8 evaluation results of GBDT model
3.3.3 动力机制解析
通过建立的聚落收缩与聚落扩张两个机器学习模型分别计算得到的4个维度14个动力因素的贡献度,各特征(自变量)的重要性比例则代表了各驱动因素在聚落空间重构影响因素的贡献程度(图8),结合乡村聚落重构的空间特征,可以从以下三个方面进行解读溧阳在2010—2018年间聚落重构的“空间—动力”机制。
图8 GDBT模型计算的聚落空间重构特征重要性Fig.8 characteristic importance of settlement space reconstruction calculated from the GDBT model
第一,片区空间活力、区位优势对聚落空间扩张影响程度较大。在聚落扩张数据集机的特征贡献值中,社会活力(服务等设施的集中度)在14组数据中数值最高,达到41.5%,其次为核心景区距离(31.0%)与市区距离(9.4%)。进一步通过数据的频数分布来分析不同影响因素的值对于聚落扩张的作用(图9)。社会活力的作用机理较为简单,即活力越高,该地区聚落扩张的可能越大;从核心景区距离和市区距离的具体统计情况来看,在距景区2000 m以内的聚落扩张数量最高,其次在2000~9500 m内均呈现出较高的聚落扩张现象,越远则不明显;市区距离则是在1000~8500 m范围表现出明显数量上优势,1000 m以内和8500 m以外,聚落扩张的数量则不显著。整体上可以看出,距离景区、城区越近,则聚落扩张的趋势越明显。
图9 聚落扩张空间点的核心影响因素情况统计Fig.9 statistics on the core influencing factors of settlement expansion space points
第二,城镇化发展、经济收入状况对聚落空间收缩影响最为强烈。在聚落收缩的模型结果中,市区距离(32.0%)与景区距离(10.9%)两项特征因素,以及经济收入(23.3%)三项指标总共贡献66.2%的特征值,是影响聚落收缩的主要因素。结合聚落收缩空间点的市区距离和人均收入情况统计,可以看出,距离市区越近(主要集中在6500 m以内),聚落收缩的数量也越多,这是由于城镇化发展,导致村落的撤并;人均收入数据则可以明显看出,收入越低,其聚落收缩的数量越多,则表明从村民自身角度,经济收入达不到预期时(主要与周边村镇进行对比),则更愿意选择搬迁的方式进行改变(图10)。
图10 聚落收缩空间点的核心影响因素情况统计Fig.10 statistics on the core influencing factors of settlement shrinkage space points
第三,旅游发展对溧阳的乡村聚落重构的影响作用突出。在两个模型中,距核心景区距离对于聚落收缩(10.9%,负贡献)与聚落扩张(31.0%,正贡献)均较为显著,凸显出具有良好旅游条件的聚落在过去以及未来的发展中具有一定优势及潜力。主要表现为两个方面:维持原始聚落的格局与促进聚落适当集聚。依托于天目湖5A级景区、南山竹海4A级景区等优质的旅游资源的乡村聚落,逐步形成乡村旅游、休闲旅游带动的旅游特色型聚落。在近10年的发展演变过程中,聚落的空间格局传承与保护受益于核心景区的带动,当地居民也因经济收入的增长,更愿意保留其宅基地;同时,巨大客流量的消费能力激活了区域经济,带动周边聚落产业延伸发展,促进了聚落空间肌理延续于聚落空间整合集聚。
4 启示与结语
4.1 启示
基于机器学习的聚落“空间—动力”耦合机制的解析方法,是在传统定性分析与主观权重赋值的定量分析基础上,充分发挥计算机的技术提升以及机器学习的算法进步,通过大数据以及多维数据转译的数据挖掘技术,更为客观的识别乡村聚落在当前乡村振兴、聚落转型背景下的重构内在机理。一定程度上摒弃了人的先验主观经验,以数据为驱动,在保证动力机制识别的客观性,获得较为准确的动力机制探测结果,进一步将计量科学融入乡村聚落发展的理论与实践中。
同时,由于机器学习回归模型具有可预测性,可以将该方法运用到城乡空间的布局规划中,以提升规划的效率和科学性。例如,在县域村庄布局规划时,运用训练好的模型,将村庄的具体条件输入到模型变量数据中,计算得到该聚落的扩张、收缩可能性,作为村庄布局规划中集聚提升、搬迁撤并的客观评价标准。在本案例中,溧阳的扩张以区位条件具有优势、经济社会活动较为发达的区域为重点,在聚落进行集聚提升和新增选址时,可以作为重要参考依据。
4.2 结语
运用机器学习方法来剖析聚落空间重构的动力机制同样存在一定的局限。机器学习依赖于数据驱动,数据的选择与缺失对于机器学习的结果有较大的差异。本文研究了4个维度14个影响聚落重构指标的数据,尚缺乏政策导向、上位规划等因素作用于聚落空间重构的影响,所以定性分析在目前的乡村发展、乡村规划的研究中同样占据重要的地位,定性与定量结合,能够更加准确地描述与解释聚落发展的内在机理。但在数据愈发丰富、分析方法愈发进步的时代,定性层面的影响如何转译为定量的数据,进而通过计算机的融入客观分析解译聚落空间重构与发展的多维度影响因素的方法将是未来探索的重要方向之一。
图表来源:
图1-2、4-5、7-10:作者绘制
图3:作者拍摄、绘制
图6:赵毅, 陈超, 许珊珊. 特色田园乡村引领下的县域乡村振兴路径探析——以江苏省溧阳市为例[J]. 城市规划, 2020, 44(11): 106-116.
图6 溧阳乡村空间分区Fig.6 rural space division of Liyang City
表1、3-8:作者绘制
表2:根据ArcGIS官方文档整理
注释:
① 溧阳市乡村建设五个阶段分别是:2005—2011年社会主义新农村建设阶段、2011—2013年村庄环境整治阶段、2013—2017年美丽乡村建设阶段、2017年至今的特色田园乡村阶段、2019年开始美意田园行动阶段。