APP下载

基于混合地理加权回归的城市轨道交通站点客流预测研究

2021-10-18岂常禄胡昊

铁道科学与工程学报 2021年7期
关键词:客流量站点轨道交通

岂常禄,胡昊

(上海交通大学 船舶海洋与建筑工程学院,上海200240)

随着轨道交通在中国的大力发展,以轨道交通带动城市更新发展的理念逐渐普及,城市轨道交通TOD(transit-oriented development,以公共交通为导向的开发)项目成为主要发展方向。客流量预测是相关项目规划阶段十分重要的基础工作,然而我国大部分预测客流量与实际数据相差较大,北京、上海等地的实际客流只有预测客流的30%~60%[1]。同时,变化较快的建设环境以及精细化的城市管理要求城市轨道交通客流量预测模型可以快速响应相关变化,并得出更为精确的预测结果。目前运用较多的“四阶段法”从宏观的角度进行城市范围内的交通量分配,工作量大、预测结果不准确且对站点周边的环境变化反应缓慢。越来越多的学者开始从站点层面分析,构建客流量和各影响因素间的直接关系模型来进行预测。尽管神经网络模型近年来在实时客流量预测方面取得了一定成果,但从中长期预测的角度,国内仍缺少大规模的数据集为其提供支撑,因此适用性不强。基于OLS(Ordinary Least Square,最小二乘法回归)的回归模型也常被用于相关研究,其以站点客流量作为因变量,车站服务范围内影响客流量变化的因素作为自变量,构建模型进行预测。相关研究可分为服务范围内影响因素选取和模型构建两个部分。吕帝江等[2−4]较为全面地研究了服务范围内对站点客流量影响显著的因素,人口、就业岗位数量等均被认为是重要的解释变量。尽管OLS模型可以提供相对准确的预测,但它设定客流量和影响因素之间存在着稳定的关系,即影响因素为全局变量。但是由于研究区域通常较大,这种关系实际上会有所不同,部分变量对客流量的影响程度是随着距离而改变的,全局变量的假设并不符合实际。近年来,学者们开始考虑各因素对客流量的影响程度随距离衰减的现象,GWR(geographic weighted regression,地理加权回归)模型也开始被广泛运用到客流量预测的研究中。GUTIERREZ等[5]发现基于路网距离衰减模型建立的多元回归模型具有更好的解释能力。张旭等[6−8]构建了GWR模型和OLS模型对轨道交通客流量进行预测研究,结果显示GWR模型比OLS模型预测精度更高,效果更好。然而目前的研究仍存在一定程度的不足:一是由于GWR模型只能选择局部变量,部分研究影响因素的选取考虑不全面,往往仅研究某一类型的影响因素,例如人口因素或者土地利用对客流量的影响,存在一定的片面性。二是大部分研究获取的数据以传统调查为基础,相关数据较为宏观且更新不及时,其精细程度无法满足研究需要。综上,本文通过获取及整理互联网多源数据的方式,获得符合研究需要的更为精细的多源数据集。同时构建MGWR(mixed geo‐graphic weighted regression,混合地理加权回归)模型,保证研究选取的变量中全局变量和局部变量的多样性。同时构建OLS模型,比较不同模型的拟合能力和预测精度。并根据拟合能力和更好的建模结果分析城市轨道交通车站客流量与各解释变量之间的空间变化关系。

1 关键影响因素选取

1.1 客流量影响因素选取

城市轨道交通车站服务范围的确定在影响因素选取和模型构建中均起到了十分重要的作用,大部分学者在理论研究和实地调研的基础上选择800 m作为站点的缓冲区[8−11],在郑州的实地调研中也发现,相邻站点之间的距离往往不超过1.6 km,因此本研究将800 m作为车站服务范围的极限,在此范围内进行相关影响因素的确定和数据获取工作。

城市轨道交通的可达性不高,受到城市土地利用的影响,居民出行并选择城市轨道交通作为出行方式,则需要考虑在站点与其他交通方式的衔接。在此分析基础上大部分学者认为可将客流量影响因素划分为四大类型:1)建成环境和土地利用;2)外部连接性;3)内部连通性;4)站点自身因素[12−14]。建成环境和土地利用是乘客产生出行需求的根本因素之一,其中体现居住和办公密度的指标是决定客流量的关键因素。相关指标可用居住人口和办公人口体现,然而大部分研究中的人口数据由政府统计部门提供[2,4],且人口数据被认为均匀分布在所划分的片区中。为了从互联网中获得较为准确且更新及时的数据,考虑到数据的可获得性,本研究选取站点周边小区的户数(千户)和办公设施的建筑面积(万平方米)作为体现居住和就业人口的解释变量。

同时,土地利用多样性体现了轨道交通站点周边土地的开发强度和吸引能力,是影响站点客流量的关键因素,其计算公式为:

式中:LUDI为土地使用多样性指数;pi为第i类用地的建筑面积占各类用地总建筑面积的比例;n为不同性质用地的类别数。以往大多数研究仅将土地利用划分为居住、办公和商业用地[12,14],不同利用的土地与客流量关联性很强,精细化土地划分很有必要,因此在本研究中选取了居住、办公、购物、医疗和教育5种土地利用类型。

路网密度反映了站点周边道路的密集程度,体现了轨道交通与其他交通方式的衔接便捷性和站点的可达性,是在外部连接性方面重要的解释变量,其计算公式为:

式中:p是路网密度,km/km2;L是轨道站点吸引范围内的道路长度,km;S是轨道站点吸引范围的面积,km2。

此外,大量乘客会选择乘坐轨道交通后换乘公交车,这种公共交通系统内部换乘的便捷性也极大程度上影响了乘客的选择意愿,本研究选取站点接驳的公交线路数这一最具代表性的指标。同时,轨道交通站点自身的某些属性也与该站点的客流量关系较强,其中站点是否为换乘站与站点客流量关系较为紧密,本研究选取其为解释变量并规定其为0/1变量。

1.2 数据获取

在确定了研究选取的影响因素后,则需要确定相关的目标数据集,并进行多源数据的采集与整理,将研究所需的多源数据来源总结于表1中。

表1 多源数据来源及内容说明Table 1 Multisource data source and content description

其中郑州市地铁站点客流量数据由郑州市地铁集团提供,各站点客流量如图1所示。其他类型数据均需从存储在互联网的各数据中心获取。成熟的高德、百度等电子地图中均存储了丰富的POI数据,但存在一定获取难度。其中百度地图提供了API接口服务,可以合法免费地检索POI,本研究使用Python语言编写了数据抓取程序以获得相关POI数据。同时通过对比各地产网站提供的数据,安居客网站中各居民社区的信息较为齐全,因此从安居客网站中获取了研究范围内3 825个居住社区信息。城市数据派网站中提供了郑州市建筑物和道路网的矢量数据,通过在软件ArcMap中利用地理处理等工具可以得到建筑物的建筑面积和各站点周边的路网密度。此外,可通过郑州本地宝网站获取到各地铁站点接驳的公交线路数。

图1 郑州市轨道交通1和2号线站点客流量Fig.1 Station ridership of Zhengzhou Rail Transit Line 1 and line 2

从互联网获取的原始数据存在数据冗余、信息缺失等问题,需要对其进一步筛选及整合才能得到进一步建模的数据集。例如抓取的POI数据中会出现既包含单个社区也包含该社区内某栋楼的情况,需要针对具体内容进行剔除。剔除后使用ArcMap软件中属性表关联工具,通过名称这一字段可将居住社区的多源数据整合在一起。此外,获取的大部分建筑面积并没有建筑名称,需要对应办公类POI在地图中的位置轮廓来将二者结合起来。

2 城市轨道交通车站客流预测模型

2.1 模型选择

在传统的OLS模型中,所有自变量和因变量之间的关系均被假设为全局关系。然而对于空间数据而言,很有可能存在由于位置不同而造成的空间异质性,因此在这种情况下,全局模型的假设是不合适的。

GWR模型考虑了这种空间异质性,避免了OLS模型中自变量系数保持不变的问题,近年来也被越来越多的学者应用到交通需求预测的研究中。传统的GWR模型将所有变量规定为局部变量,这与实际不符。部分学者开始对其进行改进,建立起包含局部变量和全局变量的MGWR模型,以求将各影响因素的差异性体现出来。因此,本文将构建更符合实际的MGWR模型对轨道交通客流量和影响因素之间的关系进行研究。

传统的OLS模型如下:

在此基础上,GWR模型允许了局域的参数估计,是对全局回归模型的拓展,其模型如下:

MGWR模型是对GWR模型的进一步扩展,允许模型的解释变量中同时存在全局变量和局部变量,模型如下:

在OLS模型中,yi和xik为i点处的因变量和解释变量;β0是截距;βk是i点处的影响因素xik的回归系数;(ui,vi)是i点的地理位置;εi是均值为0,方差为σ2的误差项。

与OLS模型不同的是,在GWR模型中,βk(ui,vi)是第i个样本点处影响因素xik的回归系数,其数值大小随着点位置的改变而发生变化。

求解地理加权回归模型,需要对每个回归分析点i进行加权线性最小二乘法,公式如下:

其中,X为自变量抽样矩阵;y是因变量抽样值列向量;W(ui,vi)是对角矩阵,其对角线上的元素为每个数据点到回归分析点i的权重值,且根据地理学第一定律,距离越近则权重值越大。最为常用的表示权重变化的函数为高斯函数,本文也选取高斯函数作为核函数,其公式如下:

式中:ωij是点j与车站i之间的权重;dij是表示点j与车站i之间的空间距离;b是带宽,是确定权重的重要参数,分为固定型(Fixed)和适应型(Adap‐tive)。本文选取适应型带宽,使其根据不同的站点情况选择最优的带宽长度,并选取优化程度较好的AIC准则确定最优带宽值。

2.2 模型构建

在获得的相关数据进行筛选处理后,在软件SPSS25.0中进行多元线性回归建模分析,同时对各影响因素进行显著性检验以及共线性检验,建模和检验结果见表2。

表2 解释变量显著性及共线性检验结果Table 2 Significance and collinearity test results of explana‐tory variables

从表2可以看出,各自变量的显著性P值均小于0.05,即通过了α=0.05的显著性检验,说明选取的自变量均对车站客流量有显著影响。各自变量的方差膨胀因子VIF均小于10,通过共线性检验,说明各自变量之间并不存在高度相关的关系。所选解释变量的系数均为正数,说明各解释变量对站点客流量均有正向的促进作用。同时OLS模型的调整R2为0.585,说明OLS模型的预测精度较好。

在软件GWR4.0中进行混合地理加权回归模型构建,选择高斯函数作为核函数,并选择带宽类型为“Adaptive”,进行建模运算,结果见表3。

表3 MGWR模型建模结果Table 3 Results of MGWR model

其中,小区户数和办公设施的建筑面积随距离变化程度较大,故设为局部变量。而路网密度和土地多样性作为表征不同站点服务范围内道路通畅程度和土地利用平衡程度的解释变量,其在固定站点的数值不随距离产生变化。同时站点接驳的公交线路数量以及站点是否为换乘站(0/1变量)也均为固定值,故以上4项解释变量均设为全局变量。

3 模型比较及结果分析

MGWR模型的调整R2为0.734,高于OLS模型的0.585。根据OLS模型的残差平方和计算出的AIC值为836,而MGWR模型的AIC值为807,小于OLS模型的AIC值,且差额超过3,说明2个模型的结果有显著差异[15],且MGWR模型的预测精度更高,适用性更强。因此本文根据MGWR模型的建模结果对郑州市轨道交通客流量与影响因素之间的关系进行探讨。

从表3可见,除去接驳的公交数量这一解释变量,其他解释变量的系数均为正值,这说明大部分解释变量对轨道交通站点客流量有正向的促进作用,而接驳公交线路数则相反,其数量越多,相应站点的客流量则越少。将周边小区户数和办公设施建筑面积的参数建模结果在软件Arc‐Map10.6中显示,结果可见图2和图3。

图2 解释变量户数的系数变化Fig.2 Coefficient variation chart of explanatory variable number of households

图3 解释变量办公面积的系数变化Fig.3 Coefficient variation chart of explanatory variable office space

从图2中可见,郑州市轨道站点周边小区户数的系数区域性较强,基本上呈现从东到西逐渐增大的趋势,说明郑州市东边区域小区户数的大小对邻近轨道交通站点客流量的影响程度不如郑州市的西边区域。而从图3中可以看出,较大的办公设施建筑面积的系数集中在郑州市的中心区域,且西城区的系数稍高于东城区。说明郑州市中心区域的办公需求对于轨道交通的客流量影响较为明显,且东城区办公设施的建筑面积对邻近轨道交通站点客流量的影响能力相对较弱。

郑州市东边的大部分区域为郑州市新区,人口规模相对较小,且规划布局较为合理,并配套了较多商业、工业、科技园区、高等院校等城市功能区以及高铁站等交通设施,使得轨道交通站点设置的目的性较强,导致其客流量的关键影响因素较多。相对于老城区,周边小区的户数和办公设施的建筑面积这2种解释变量的重要性不明显。

值得注意的是,在MGWR的建模结果中站点周边接驳的公交线路数这一解释变量的参数值为负,与OLS模型建模结果不同。通过上文分析,MGWR模型的预测精度更高,说明其能更准确地反映出解释变量和客流量之间的关系,因此本文认为郑州市站点周边接驳的公交线路数并没有对站点客流量起到正向的促进作用。相反地,站点周边接驳的公交线路数量越多,选择乘坐地铁的乘客则越少。这一结果可解释为,在郑州市地铁和公交运营仍处于互相竞争的状态,两者间的衔接并没有做好。这与我国大部分城市的城市规划有关,早期的城市开发并没有依靠轨道交通,而将地铁投入使用后,其线路与大部分公交线路重合是不可避免的,也就造成了一定程度上的竞争关系。

此外,大部分研究中,公交线路数这一解释变量均对客流量有正向的促进作用,但其研究对象为轨道交通网络发展较为完善的城市。郑州市轨道交通仍处于建设初期,线网覆盖率较低,相较于轨道交通,公交车的可达性更高,这一因素可能也导致了两者的竞争状态。同时说明在郑州市现阶段,乘客乘坐地铁并换乘公交的需求较少,居民日常通勤范围较小,资源仍集中于城市中心区域。在未来,郑州市应做好城市和交通线路规划,避免地铁与公交线路的大量冲突,并通过提升换乘便捷性等手段促进两者之间客流的转换。

4 结论

1)通过建模分析,MGWR模型的预测精度和可解释性优于OLS模型,可以更准确地预测城市轨道交通客流量。

2)MGWR模型的建模结果可以直观地显示出各局部变量对客流量影响的空间变化关系,并可以分析不同区域城市轨道交通站点客流量的关键影响因素。

3)根据MGWR模型的建模结果,郑州市轨道交通站点接驳的公交线路数量对站点客流量有负面的影响,可解释为在郑州市公交运营与轨道交通运营仍处于互相竞争的状态,建议通过城市交通规划等方式进行改善。

猜你喜欢

客流量站点轨道交通
轨道交通产品CE认证论述
高速轨道交通发展趋势
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
基于嵌入式系统的商场客流量统计算法
首届欧洲自行车共享站点协商会召开
怕被人认出
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
基于AFC数据的城轨站间客流量分布预测
城市轨道交通联调探讨