工作流驱动的城市人口与就业空间模拟
2024-02-03王艺,张红,邓雯
王 艺,张 红,邓 雯
(1.西南交通大学地球科学与环境工程学院,四川 成都 611756;2.华东师范大学城市与区域科学学院,上海 200241;3.华东师范大学全球创新与发展研究院,上海 200062)
0 引言
21世纪以来,世界城市化程度明显提高,2010年城市地区居住人口占比在50%以上[1,2]。城市是居民居住、生产和生活的主要场所[3,4],就业地和居住地等活动位置的选择影响着城市内部空间结构[5],合理规划城市土地利用及劳动力分配对实现空间平等有重要意义。目前,学者对城市空间结构的时空特征、演化过程、影响因素与驱动机制等开展了大量研究,阐述了人口和就业对城市空间结构演化分析的重要性[6-9]。结构主义认为城市空间结构是解释人口和就业时空分布的工具,提倡将城市划分为就业中心、住宅区以及通勤成本3种基本结构要素,而由观察、经验构建的计算机模拟实验是实现城市空间结构统计和数学研究的可信赖途径[10]。其中,城市土地利用/交通交互(Land Use/Transport Interaction,LUTI)模型可用于模拟人口活动及空间分布[11,12],而Lowry提出的研究大都市人类活动空间组织的城市模拟模型是第一个可操作的LUTI微观模拟仿真模型[13]。随后,Garin将Lowry的迭代公式优化为有唯一解的矩阵方程组,使劳动参与率、可达性等因素对空间结构的影响得以量化[14]。学者们拓展了Lowry模型在城市及区域空间演化模拟中的应用,构建了METROPILUS、DRAM/EMPAL和TELUM等模型以模拟美国大都市区的人口与就业发展[15],提出了QUANT模型以模拟就业地点、人口和交通的相互作用[16],开发了TIGRIS XL模型用于探索交通与土地利用政策对城市居民与企业选址活动的影响[17]。国内研究起步较晚,多见于对Lowry模型的初步梳理和应用[18-20],如将Lowry模型框架引入北京市城市扩张和空间发展研究,以揭示城市空间组织演化特征[21,22],或借助Lowry模型实现基建选址与效益评估[23],也有学者尝试改进静态的Lowry模型,使之既能描述城市发展过程中人口及就业的动态分布格局[24],又能模拟预测不同政策下的城市空间演化情况[25]。
模拟研究的难点之一在于寻求最优解,为此,研究者需要花费大量时间重复实验步骤并比较实验结果[26]。科学工作流以尽可能简单、透明的方式记录了数据处理过程的细节,例如:数据输入、输出及分析的各个功能实现及其组合方式[27-29]具备可共享、可执行、任务自动化等优点,成为执行可重复、可拓展空间分析任务的有效工具[30-32]。科学工作流管理系统允许用户创建和重用分析任务,提供图形用户界面确保分析过程可视、可记录、可及时调整[33-35]。目前开源的工作流管理系统主要有KNIME(Konstanz Information Miner)、VisTrails、YesWorkflow、Taverna、Makeflow、Nextflow等。其中,KNIME是一个可高度拓展的平台,它无缝衔接了各种专业统计分析工具或第三方库(如R、Python),且能提供大量功能模块,支持用户借助少量代码实现复杂的分析任务;同时,该平台支持对组件进行积木式组合拼接以灵活构建工作流模型,各组件独立运行并记录运行结果,整个数据分析过程清晰直观,用户可基于定制化的低代码可视编程界面和简单直观的节点结构,实现数据集成、检索与分析操作,并获取详细的结果报告;相比其他平台,KNIME支持有选择地执行工作流程中的每个节点,用户可随时修正模型、查看结果或实现交互操作[36]。地理学者利用KNIME进行太阳辐射建模和实证分析[37],创建可复用的COVID-19传播可视化模板以帮助各国卫生局识别传播源[38],使用地理社交媒体资源创建可重复、透明的灾难响应分析流程[31],借助平台的空间分析软件(K-span)构建数字高程模型数据集[36]等。
由于城市系统本身的复杂性,有关Lowry模型在城市空间结构模拟领域的研究仍较鲜见。为提升城市空间建模的效率、灵活性、可共享性和可移植性,本文以描述城市人口与就业关系的Garin-Lowry模型为例,基于KNIME平台开发Garin-Lowry模型工作流,探究多种情景下城市人口及就业分布特征,并验证多种城市交通与行为地理假设。
1 Garin-Lowry模型
Garin-Lowry模型是一种广为接受的城市人口与就业关系模型,它以经济基础和重力模型为基本假设[39],依据预先给定的研究区域基础就业分布和交通网络通行时间,模拟研究区域的人口和服务业就业分布。
1.1 基本假设
Garin-Lowry模型在探究城市空间结构时,着重考虑城市系统中人口的居住空间、城市交通网络以及城市产业空间三者的相互作用,模型构建基于如下基本假设[40,41]:①基于经济基础理论,假定提供就业岗位的部门包括基础部门和非基础部门,对应地,就业模式分为基础就业和非基础就业[14]。②基础部门由位置外生的活动组成,其选址位置固定,基础部门的产业不依赖当地市场的行政、工业和商业活动,基础就业能独立为除当地以外区域提供服务和产品,是模型的外生变量。③非基础部门生产的产品和服务在区域内被消费,主要提供医生、教师、客服等与当地人们活动紧密相关的就业岗位,这些非基础型就业受人口分布状况影响较大,也称服务型就业,其数量和分布是模型的内生变量。④一定时间范围内,各区域的人口和就业分布之间相互依存且相互作用。基础部门生产的货物和服务输出到除当地以外的地方,其就业主要取决于区域外部的需求,较少受人口分布的影响;非基础就业部门主要为当地市场提供服务,其就业取决于当地需求且区位非常重要。
1.2 人口与就业的求解
根据Garin-Lowry模型,将研究区域划分为n个通过交通网络相互连接的子区域,各子区域均具有居住和工作双重功能属性。基础就业人数(B)、服务型就业人数(S)和人口(P)均可表示为一个n维向量,将每个小区编号为1、2、…、n,则Bi、Si和Pi分别表示子区域i内基础就业人数、服务型就业人数和人口数。已知研究区域基础就业人数B,基于假设④可确定各子区域的服务型就业人数Si和居民人数Pi。由于人口分布将产生相应的服务需求,当人口分布确定时,可凭借生产约束的引力模型为各子区域分配服务就业[42]。每个子区域i的服务就业人数Si取决于i区域的市场潜力(服务就业需求潜力),即任一区域j的居民都有可能选择区域i提供的服务,选择区域i的可能性与任一区域的人口数有关,也与区域j到区域i的距离占区域j到任一子区域距离总和的比重有关(式(1))。
(1)
式中:dij为区域i、j之间的通行时间,α为购物行为距离摩擦系数,e为给定常数,表示服务业就业人数占总人口比重,tij为区域i、j之间的通行时间占所有区域到j区总时长的比例。
为模拟居住需求差异产生的职住分离,即在区域j居住的职工可能在区域i工作,当基础就业和服务型就业的情况已知时,凭借吸引约束引力模型为各子区域分配居住人口[42],各子区域j的人口Pj由全部区域的就业情况E决定,并综合考虑通勤时间的影响,得到公式如下:
(2)
式中:β为通勤行为距离摩擦系数,h为给定常数,表示总人口占总就业人数比重,gji为第i区就业对所有区域影响中第j区人口受影响占比。
Garin-Lowry模型通过线性方程组的方式求解人口与就业的精确解,借助向量S、B和P描述人口与就业分布,对式(1)和式(2)进一步简化得到矩阵方程组(式(3)),由于仅存在未知变量S和P,此处方程数量等于未知数的个数,可求得唯一解。
(3)
式中:T=(etij),是由人口分布生成的服务就业矩阵;G=(hgji),是由就业生成的人口分布矩阵。
2 Garin-Lowry模型空间模拟的工作流实现
城市人口与就业情况的模拟涉及建模过程和模型开发两方面:建模过程指向科学工作流程的设计,如设计应用情景和构建模型输出所需信息;模型开发是模拟计算的核心,使用可复用、参数可调的模型组件以确保工作流程的迁移性,各模型组件封装不同算法,形成独立可计算的单元,支持多源数据读写,可实现分类、回归、聚类等机器学习和数据挖掘算法,也可调用R、Python等的第三方库自定义模型算法。借助KNIME记录模拟过程可增加数据处理步骤的透明性,通过灵活调整参数设置并自动执行模型以展示最终的可视化分析结果。
2.1 基本思路
本研究通过模拟和比较不同城市形态与结构下人口及就业分布特征,揭示城市交通与土地利用之间的空间交互特性。城市空间结构包括城市物理空间结构(UPSS)和城市互动空间结构(UISS)。首先,城市的建成环境从物理空间上确定了城市资源的配置,如企业分布、交通网络格局等,不同的基础就业分布格局对应不同的城市空间结构,基础就业作为外生变量,其企业厂房既可集中于城市中央,也可散布于任意城市区域,假设作为内生变量的人口与服务就业在各城市区域均有分布,且其分布具有空间异质性[43-46]。其次,人类的居住、就业、购物等行为塑造了城市互动空间结构,不同的行为以旅行、商品交换等形式发生,而道路为城市人口及货物流动提供了交通便利,故本文所构建模型可用于模拟交通网络对人口和就业分布的影响,如城市可通过新建高速公路缩短旅行时间,也可加密路网以增加交通供给。最后,道路是最基本的城市形态要素,不同街区布局与路网组织方式下的城市形态多样,例如:规则格网城市的所有街区形状相同,放射性城市的街道以环状围绕城市中心辐射分布,蜂窝状城市结构则具有“中心辐射”特性,以最大化实现土地的集约利用,可对多种城市形态下城市人口与就业空间分布进行对比。
基于上述假设,本文模拟了多种城市人口与就业分布情景,使用工作流简化对实验过程的描述,并利用不同任务及其之间的数据依赖关系表达多情景模拟实验过程(图1)。首先整理模拟情景并输入相关数据;然后明确城市概况,调控各项情景模拟任务以确切描述实验目标;接着调控模型参数,确保模型运算正确;最后展现计算结果,可视化各城市人口与就业的分布特征。
图1 城市人口及就业模拟工作流程
2.2 Garin-Lowry模型的组件设计
工作流以“节点”为基本处理单元,通过节点“端口”间的“数据管道”实现数据流通,保障工作流有序执行。节点具有多种功能,如多源异构数据的输入输出、数据筛选和清洗、运行结果可视化、图表和地图统计等,节点被执行后,可以通过图形用户界面及时检查输出。KNIME还提供了交互窗口,用户可以按需调整输入参数。组件可以用于封装工作流的各个部分,并可以在工作流之间重复使用,从而支持创建复杂但结构良好的工作流。
Garin-Lowry模型涉及参数较多,本文封装GL组件以实现该功能。工作流中Python Script节点与GL组件调用了若干Python社区扩展库,包括GeoPandas、Pandas、Numpy、NetworkX、momepy、spaghetti、SciPy和matplotlib,在运行前应先完成运行环境的配置。组件中行过滤选择器用于简化输入表,单选按钮、下拉框、数字输入框等节点用于不同参数交互设置。例如,下拉框可以指定Location ID Field、Basic Employment Field以及计算结果对应的字段;数字输入框允许用户手动输入特定数值范围和数字精度的浮点数,默认情况下ALPHA和BETA的值均为1.0,而H和E由美国统计摘要数据计算得到。使用Python Script节点编写Garin-Lowry模型求解程序,输入数据为研究区基础就业数据、距离数据和交互界面设置的各种变量,计算得到的人口和服务就业数据将输出到基础就业数据的属性表中。组件中各变量预定义了默认的缺省值,既可在视图中直接修改并重新运行,也可按需增删控件节点。例如,当未输入矢量数据时,可在组件内增加数字输入框控制节点Threshold以控制ALPHA和BETA的变化间隔,并将原有的ALPHA和BETA字段分别修改为两个变量的最大值和最小值,通过指定数字间隔生成两个变量的取值列表,然后进行排列组合,可以模拟出多组ALPHA和BETA取值。循环节点用于控制模拟次数,将多次计算结果合并输出在同一张表上。
2.3 Garin-Lowry模型的多情景模拟
KNIME工作台以串并联的方式集成多个处理单元并搭建完整工作流。本文设计的用于模拟城市人口与就业的Garin-Lowry模型包括3个步骤(图2),图2中被重复使用、修正过参数的处理单元用橙色背景的子标题区分。本文使用KNIME分析平台的节点实现数据的常规处理(如输入输出及可视化),使用自定义的GL组件完成多情景模型计算模拟。
图2 本地端工作流部署
1)数据输入与查询。输入数据包括研究区域的面状边界、中心点以及交通网络3类矢量数据,用户仅需设置矢量数据所在路径即可。为增加模型共享的便捷性,此处调用Python的扩展库GeoPandas实现对*.zip格式Shapfile文件的读取。在KNIME中矢量数据被存储为表(Table)形式,字段wkt负责记录坐标信息,默认读取的OBJECTID字段为唯一标识符以区分不同的子区域、路网等实体。利用Python的扩展库matplotlib实现从表到地图的数据格式转化,以查询输入数据。
2)距离矩阵计算。将任意两个子区域之间的距离定义为区域中心间的最短路网距离,路网距离既可以是路网空间距离,也可以是通行时长。当需调整路网密度、限速时,可重复调用该Python Script节点并修改weight变量以确保最短路径计算的准确性。在输出的距离表中,任意两个子区域分别由OriginID与DestinationID标识,其距离由NetwkTime字段记录。
3)人口与服务就业分布模拟。利用开发的GL组件,针对不同的场景分别调整参数,模型的运行结果同样由matplotlib展示。
上述功能模块已发布至数据共享网站(10.6084/m9.figshare.23677101)。
3 城市人口与就业分布模拟案例
本文旨在探究不同城市形态、基本就业布局和交通网络条件下人口及就业的分布特征。首先生成同心圆、矩形网格和六边形3类假想城市,设置相应的实验变量;然后将城市进一步划分为单就业中心与多就业中心两类,后者对应随机、均匀和相对集中3种情景,模拟并比较不同类型、不同中心格局下城市人口与就业分布的空间特征;最后,模拟不同路网可达性下城市人口与就业分布的特征差异。
3.1 3类假想城市
传统城市空间研究中,可将城市简化为具有简单、规则几何形状的理想城市,如巴洛克时期的圆环城市、18世纪末美国的规则格网城市和20世纪初中心地理论假设的六边形城市。本文选取同心圆、矩形网格和蜂窝3种不同的假想城市形态,各城市总面积相同且均包含121个等面积子区域。其中,同心圆城市由11个圆环和12条放射状道路组成,矩形网格城市沿横纵方向分别由12条交通网络切分,蜂窝城市则由121个正六边形拼接而成,任意邻接的两子区域间共享一条道路(图3)。
各城市数据包括分布区域面状要素、区域质心点要素和交通网络线要素数据(表1)。在仿真模拟中,只考虑城市的空间结构,而忽略城市的地理坐标系或距离测量单位。
表1 实验数据
3.2 不同基础就业格局下城市人口与服务就业分布模拟
根据城市中心的数量,基础就业格局又可进一步划分为单中心情景和多中心情景。基础就业单中心情景参考经典的单中心城市Alonso-MillsMuth模型,假设城市的基础就业全部集中于中央商务区(CBD),即城市中心子区域基础就业人数为100,其余子区域基础就业人数为0,进而利用Garin-Lowry模型模拟3类假想城市人口和服务型就业的分布情况(图4),发现在基础就业单中心分布情景下,人口数量与服务就业人数分布表现出从中心向外围逐层递减的特征,符合城市人口密度的距离衰减规律[47]。不同城市形态中,蜂窝城市中心城区和郊区之间人口数量差异最大(极差为5.93)、矩形网格城市次之(极差为5.46)、同心圆城市最小(极差为5.12),这可能是因为蜂窝状城市布局本身具有多层级的特点,各种资源集中分布在高等级城市中心,城区吸引力较大所致。尽管如此,不同形态的城市人口数量差异的极差值相差不超过1,表明各形态城市人口分布差异相对较小。由各城市服务就业模拟结果可知,3种形态城市的服务就业衰减速度(极差不超过1)均显著低于人口(极差大于5)。采用自然断点法对服务就业人数进行分类,发现各类子区域数量相近,说明服务就业分布几乎不受城市形态影响,而是随人口数量变化。这主要缘于基础就业一定时,居民住所选择主要受基础就业的位置约束,就业机会越多的区域居住人口越多;而服务型就业选址更灵活。
图4 基础就业单中心情景下不同形态城市人口与服务就业分布情况
对于多中心情景,假设城市包含1个位于城市几何中心的主中心和n-1个副中心,根据主副中心的分布格局,将基础就业分布设置为均匀分布、随机分布和相对集中分布3种情景。其中,均匀分布意味着主中心和各副中心的基础就业机会均等且空间均衡,此时各中心基础就业规模为100/n;在随机分布情景下,仅部分副中心与主中心拥有相同就业机会;在相对集中分布情景下,主中心及其邻近的副中心集中了所有基础就业。为便于比较,将随机与相对集中分布情景中包含基础就业机会的主中心及副中心数量设为一致,模拟结果如图5和图6所示。可以看出,3种多中心分布情景下,城市的人口与服务就业均表现出中心—外围距离衰减特征,但城市内部的人口数量分异程度不一。就主中心而言,蜂窝城市变化最明显(极差从8.61降至4.78),其次为同心圆城市(极差从8.16降至4.89),矩形网格城市受基础就业数量的影响最小。随着提供同等基础就业机会的副中心数量增加,人口涌入城市主中心的需求降低,人口分流导致主中心人口密度下降。对于具有多层级特征的蜂窝城市而言,基础就业子区域数量的增加进一步强化了这种多层级特征,使副中心成为人口和经济活动的集聚点。相比之下,矩形网格城市相对规整、同心圆城市较集中,增加基础就业子区域数量可能对整体分布影响较均衡,人口变化趋于平缓。当基础就业的空间分布离散程度增加时,各子区域间城市人口规模的差异逐渐缩小,随机分布情形下差异程度最低。这主要是由于当大型工厂散布于城市各处时,基础就业将不仅集中于城区,综合考虑生活舒适程度和通勤成本,居民倾向于选择在工作单位附近定居。
图5 基础就业多中心情景下不同形态城市人口分布情况
图6 基础就业多中心情景下不同形态城市服务就业分布情况
综上,城市形态和中心格局并不会改变人口及服务就业从中心向外围递减的圈层分布特点,基础就业子区域数量的增长和分布的离散化均会降低城市各区域人口数量分异,但二者对服务就业的影响程度极低,并且基础就业子区域数量变化对蜂窝城市人口分布的影响最大。
3.3 不同交通网络下城市人口与就业分布模拟
为模拟并分析交通网络对城市人口与就业分布的影响,保持城市面积与空间结构等参数不变,仅改变距离摩擦系数,发现人口与就业依然从中心向外围逐层递减,但变化幅度不同。以同心圆城市为例,从中任选某一辐射方向的11个子区域并分别绘制各区域内人口及服务就业规模变化的折线图(图7)。从图7可知,当α一定时,β的变化对城市中心人口规模的影响明显;当β一定时,不同α并未引起人口规模的明显变化;增大α或β均会使服务就业折线变得陡峭。这表明随着交通条件的改善,通勤行为距离摩擦系数β将减小,人们有更多的居住选择机会,一部分居民倾向于选择远离市中心、环境更合适、面积更大的住所;交通便利同时也使城市外环居住的人数上涨,服务行业就业的人员仍延续就近上班的准则,导致城市外环服务就业数量上涨。
由图8可知,当部分道路(同心圆城市第7环子区域的公路及所有径向道路)被提速时,城市人口与服务就业变化显著,可见高等级道路的出现缩短了旅行时长,城市中心的人口逐渐减少,城市外环人口有所增长。就环向道路而言,由于第7环线的道路提速,人口在此处出现增长,且速度越高人口涨幅越大;就径向道路而言,人口的变化趋势与未提速一致,但人口变化的幅度略小。这说明高等级道路的建设改变了城市地理格局,导致通勤时间快速缩短、不同区域之间的联系加强,人员、货物等可以更快速地在不同子区域间流动,促使人口向郊区集中,有助于人口分布平坦化。相较于人口,服务就业的变化幅度较小,受道路等级的影响甚微,服务就业在第7环出现的增长主要是由于人口的变化,这主要是因为服务型就业的本质是提供非物质性服务,如教育、娱乐类服务主要依赖当地居民的需求而受周边交通通达性的影响较小。
图8 不同等级道路限速下同心圆城市人口与服务就业变化情况
综上,交通网络的时空压缩效应显著,有助于增强人类空间流动,进而影响人们住所选择、购物等行为。当交通条件改善时,人们可选择周边自然环境氛围更浓厚的郊区,或选择靠近名校等区域。本文利用工作流分析对比多种路网条件下的城市人口及就业情况,有助于快速识别最适宜人口与就业布局的路网条件。
4 结论与讨论
本文搭建了一个用于模拟城市人口及就业分布的工作流,复用已有流程并微调组件参数,快速设置了3类城市形态、4类基础就业分布以及不同的距离摩擦系数和道路等级情景。通过分析比较多种情景的模拟结果发现:城市人口空间分布均表现出中心—外围距离衰减特征;城市形态对城市人口分布的影响微弱,在给定基本就业数量与分布的情况下,同心圆、矩形网格与蜂窝城市间人口分异相差不大;城市基础就业分布越离散,中心区人口密度越低;修建高等级公路对住房位置选择影响微弱;距离摩擦系数β显著影响城市人口分布,交通越便利,城市边缘区人口密度越高;城市服务性就业的变化趋势紧随人口,但各种情景下的变化幅度均较小。
本文构建的工作流可为开展城市人口、交通与土地利用等要素的多情景演化模拟提供便捷、灵活、高效、可复制、可移植的解决方案。针对不同的政策和规划方案设计多种模拟情景,预测政策对城市形态、经济发展、人口密度、交通设施布局等方面可能产生的影响,有助于更好理解不同政策选择的可能结果,从而为制定更科学、可行的城市政策和规划提供依据。未来将尝试引入土地利用、职业差异、年龄等影响因素,并将城市空间扩展到信息化虚拟空间,构建更精细的Garin-Lowry模型。此外,人本尺度的移动轨迹数据可反映人口的通勤行为与日常生活轨迹、模拟交通拥堵状况,网络点评数据直观反映出人口的活动模式、消费习惯、社交偏好等社会经济行为,借助这些数据进行城市模型的校准和验证,有助于提高模型的真实性和准确性。