APP下载

基于GWR的城市轨道交通车站客流预测模型*

2019-04-30程国柱周林芳徐慧智

关键词:路网客流车站

程国柱 周林芳 徐慧智

(东北林业大学交通学院1) 哈尔滨 150040) (河北水利电力学院交通工程学院2) 沧州 061001)

0 引 言

客流预测是城市轨道交通规划的前导工作,目前,国内对客流预测研究包括影响因素分析和预测模型建立两部分.Zhao等[1-3]的研究较为全面,包括基于车站和车站间的影响因素分析及快速公交系统中步行距离与乘客特征和车站的关系,但未考虑解释变量对客流的贡献率随与车站的相对距离而变化.李俊芳等[4]考虑了距离车站不同圈层的人口对客流贡献率的不同,且建立的BP神经网络预测模型预测结果较好,但BP神经网络的函数关系处于“黑箱”中,未对因变量与自变量的关系进行充分解释.

国外对解释变量与客流贡献率关系的研究更为深入.Sohn等[5]发现七个解释变量对客流量有显著影响,并借助结构方程研究了解释变量对自变量的影响及其之间的关系.Gutiérrez等[6]发现基于路网距离衰减模型建立的多元回归模型具有更好的解释能力.Geneidy 等[7]发现以1 259 m为半径的范围能够覆盖85%的乘客.Sung等[8]发现各解释变量对客流量的影响分别在不同的距离阈值下达到最大.

在以往的研究中,对于车站服务范围的确定多采用经验值,且未考虑到随到达地铁车站距离的增加而导致的客流衰减的规律.为简化问题,多采用直线距离代替乘客步行的实际路网距离.本文将在对哈尔滨地铁乘客出行调查分析的基础上,采用路网距离对车站服务范围进行研究和采用地理加权回归(geographic weighted regression, GWR)模型对车站客流量预测进行研究.

1 数据来源

1.1 地铁客流量及乘客空间分布数据

哈尔滨地铁1号线自2013年开通以来,已运行5年,经过了3年客流培育期.对哈尔滨地铁1号线各车站(除哈东站站和哈南站站,下同)客流量及乘客空间分布进行调查,调查时间为2017年12月26日—2018年1月12日的各工作日.由于1 d内,地铁车站上、下车乘客量基本对称,因此,仅调查了各车站平峰时段15 min内上车乘客量.并对乘客出发地点进行随机问卷调查,运用百度地图,得到出发点到对应地铁车站的路网距离.

1.2 车站服务服务范围内用地情况

车站服务范围确定后,在Arcgis10.0环境下,建立地铁线路、车站、车站吸引范围内不同土地利用类型建筑的矢量图及乘客步行网络数据集.用地性质由百度实景地图查找获得.坐标系统为Beijing_1954_3_Degree_GK_Zone_42投影坐标系,单位为m.

2 城市轨道交通车站服务范围确定

2.1 地铁乘客空间分布规律

调查共得到927组地铁乘客出行生成点信息,将数据以50为间隔,分为100~1 850 m,共36组.路网距离与乘客比例(表示步行到车站的距离大于某路网距离的乘客比例)的关系见图1.

图1 乘客比例与路网距离散点图

由图1可知,乘客比例随路网距离增加呈现非线性衰减规律,在0~500 m路网距离内,乘客比例快速衰减,在500 m之外,衰减速度趋缓.在SPSS20.0环境下,选择二次模型、三次模型、复合模型、增长模型、指数模型和Logistic模型对散点图进行拟合.6种模型的拟合结果均通过0.01的显著性水平检验.综合考虑模型解释能力及表达式简洁性,选用复合模型表示乘客比例与路网距离的关系.在SPSS中对复合模型的初始表达式进行优化,得到乘客比例随路网距离的衰减规律:

R=145.878·0.997NL

(1)

式中:R为大于某路网距离的地铁乘客占全部地铁乘客的比例,%;NL为地铁乘客步行至相应地铁车站的路网距离,m.

2.2 车站服务范围

不同乘客覆盖比例对应的车站服务范围阈值及不同车站服务范围阈值对应的乘客覆盖比例,见表1.

由表1可知,随着车站服务乘客比例的增大,乘客覆盖比例增加相同数值所需的车站服务范围的增加也越大,即车站服务范围扩大所带来的乘客比例增加的边际效益在减小.根据文献[9-10]可知,使用乘客覆盖率为85%所对应的路网距离作为服务范围阈值.距车站757 m路网距离内的乘客所占比例为85%,800 m路网距离内的乘客所占比例为86.81%.综合考虑服务范围阈值的代表性及其所能覆盖的乘客比例,确定800 m路网距离为地铁车站服务范围.据此,哈尔滨地铁1号线各车站的服务范围见图2.

表1 不同地铁车站服务范围对比

图2 哈尔滨地铁1号线车站服务范围示意图

3 地铁线路及车站服务范围矢量化

在Arcgis环境下,建立地铁线路、车站、车站吸引范围内不同土地利用类型建筑的矢量图及乘客步行网络数据集.本文考虑行政管理、居住、教育文化、商业、休闲娱乐、医疗卫生6类土地利用类型,各建筑的具体土地利用属性可由查找百度实景地图获得.

以哈尔滨地铁1号线为例,在Arcgis环境中,采用Beijing_1954_3_Degree_GK_Zone_42投影坐标系建立的矢量图及道路网络数据集见图3.

图3 哈尔滨地铁1号线矢量图及道路网络数据集

运用Arcgis的几何计算功能,可以得到各个建筑物的占地面积,结合百度实景地图,可以获得各建筑的楼层数,最终得到各建筑的楼层面积,为

Ai=Si·fni

(2)

式中:Ai为建筑i的楼层面积;Si为建筑i的占地面积;fni为建筑i的楼层数.

在Arcgis中,建立乘客步行的道路网络数据集,运用网络分析功能即可得到各建筑与相应地铁车站的路网距离.结合乘客比例依路网距离的衰减规律,定义建筑楼层面积与其到达地铁车站路网距离对对应的乘客比例的乘积为加权楼层面积,为

MAi=1.45878·0.997NL·Ai

(3)

式中:MAi为面要素的加权楼层面积,m2.

4 基于GWR的回归预测模型

4.1 方法的选取

客流预测研究方法包括四阶段法和普通最小二乘法.四阶段法虽应用广泛,但需以大量的出行调查资料为基础,需耗费大量的人力、物力、财力和时间,且四阶段模型适用于对区域规模的范围进行交通预测,而对于公共交通出行这一以车站服务范围为对象的研究则不再适用.

基于最小二乘法的多元回归模型使客流预测问题得到简化,降低了预测成本,且各解释变量能够反映车站周围环境和自身属性对客流的影响.但多元回归模型中各解释变量的系数在各预测单元内均保持一致,忽略了变量对客流的影响存在地理空间的变化及特殊变量对个别区域的影响这两个特征.

GWR模型适用于研究空间异质性问题,其从局部回归和探索空间关系的角度对自变量和因变量的关系进行研究,能够反映解释变量随空间变化而产生的对因变量影响的变化规律,改进了普通最小二乘法中解释变量系数保持不变的缺点.在一条地铁线路中,其周围土地利用情况及车站自身属性均处在变化中,因此,采用GWR模型能够适用这种变化.

4.2 解释变量选取

土地使用类型是乘客出行产生的核心因素,且不同土地使用类型决定了居民出行强度的差异,因此造成了地铁乘客量的不同,如商业区的地铁车站,一般其乘客量明显更多.因此,将上述6种不同类型用地的加权楼层面积作为解释变量.此外,以上变量仅从绝对量的角度对土地使用进行了衡量,没有涉及土地使用多样性对客流量的影响.因此引入土地使用多样性指数[11],为

(4)

式中:LUDI为土地使用多样性指数;pi为第i类用地的楼层面积占各类用地总楼层面积的比例,%;n为不同性质用地的类别数.

200 m范围内接驳公交线路数、路网密度和车站可达性均可以从不同的角度衡量乘客到达车站的方便程度,因此,也将这3个变量作为解释变量.其中,200 m范围内接驳公交线路数主要用来衡量步行距离范围之外的乘客选择地铁出行的方便程度;车站可达性用于衡量车站在线路中的中心度,其值大小在(0,1)之间,值越大,表示车站越靠近线路中心,而一般位于地铁线路中间的车站客流量较大,为

(5)

式中:Aci为第i个地铁车站的可达性指数;Ndi为第i个地铁站点到其他各车站的路网距离之和,m.

4.3 基于GWR的客流量回归预测模型

GWR模型从局部回归和探索空间关系的角度对自变量和因变量的关系进行研究,能够降低甚至排除空间自相关的影响[12-13].GWR模型对每一个样本都生成不同的回归系数,为

(6)

式中:yi为车站i的上车乘客量,人;xij为车站i的解释变量j;βij为车站i中解释变量j的系数;βi0为截距;εi为残差.

GWR模型进行局部回归时,将考虑每个回归样本点其周围样本点的信息,并根据周围样本点与该样本点的距离,对周围样本点的信息设定权重.权重计算有多种方法,其中,Gaussian函数法和bi-square法应用最广泛,论文选用Gaussian函数法,为

(7)

式中:wij为车站j的变量相对于车站i的权重;dij为i、j两车站的距离,m;b为带宽.

在带宽范围内,各样本点相对回归样本点的权重矩阵为

(8)

式中:W(i)为回归样本点i的权重矩阵.

根据加权最小二乘法可得到β(i)的估计向量,为

(9)

式中:

β(i)=(βi0,βi1,…,βin)

(10)

5 实例分析

5.1 解释变量选取

经过系数显著性检验和方差膨胀因子检验,最终选取行政管理用地、商业用地、休闲用地、医疗卫生用地、土地使用多样性和200 m范围内接驳公交线路六个自变量.

在ArcGIS中,运用Arctool box中普通最小二乘法(ordinary least square, OLS)工具进行运算,结果见表2.由表2可知,各自变量系数均通过了0.05的显著性检验,说明各自变量对地铁上车乘客量具有显著影响,且各自变量方差膨胀因子VIF均小于7.5,通过共线性检验.模型AdjustedR2为0.74,赤池信息变量AIC为413.72.

表2 自变量系数显著性及方差膨胀因子检验结果

对以上变量进行莫兰指数(Moran I)检验,结果见表3.检验结果表明,休闲用地和200 m范围内接驳公交车线路对应的P值均小于0.1,两个变量在空间上具有显著地集聚性.说明虽然最小二乘回归模型拟合优度较好,但可能存在偏态,稳定性差.

表3 解释变量Moran I检验结果

5.2 基于GWR模型的预测结果

将相同的自变量运用Arctool box中的GWR模型进行运算,结果显示,GWR模型的AdjustedR2为0.81,大于OLS模型的0.74,AIC为399.01,小于OLS模型的413.72,且二者之差大于4,表明GWR模型较OLS模型有更优的适用性.各车站上车乘客量的实际值和预测值对比见表4.

表4 各车站上车乘客量观察值和预测值对比

4类用地的系数在各车站的分布见图4.

图4 不同类型用地建筑的加权楼层面积的系数在各车站分布图

由图4可知,4个解释变量的系数在各车站均为正值,说明4类用地的面积均和地铁客流产生呈正相关.通过对比以上4个解释变量系数的变化规律,发现行政管理用地加权面积和休闲娱乐用地加权面积的系数变化规律基本一致,均呈现由北向南逐渐减弱的趋势 ;商业用地加权面积和医疗卫生用地加权面积的系数变化规律也基本一致,呈现由北向南逐渐增强的趋势.对比4类土地使用类型在各车站的分布情况,说明并非车站服务范围内某类土地使用的加权面积越大(小),其对地铁客流的贡献能力越大(小),例如,商业类土地使用中,博物馆车站服务范围内的商业类土地使用加权面积最大,但单位面积内其对客流的贡献能力处于中等水平.

土地使用多样性指数的系数在各车站的分布情况见图5.

图5 土地使用多样性指数的系数在各车站分布图

由图5可知,土地使用多样性指数的系数从桦树街车站到博物馆车站逐渐增大,从博物馆车站到哈达车站逐渐减小,且其系数在各车站均为负值,说明一定范围内的土地使用多样性系数与客流产生之间为负相关,当土地使用多样化程度越大,居民能够在一定范围内满足其基本的生活需求,因此不需要地铁这一适用于中远距离出行的交通方式.

接驳公交车数量的系数在各车站的分布见图6.

图6 接驳公交车数量的系数在各车站分布图

由图6可知,200 m范围内接驳公交车的系数从桦树街车站到和兴路车站逐渐增大,而在和兴路车站到哈达车站逐渐减小,且系数始终为正值,说明接驳公交车线路数对地铁车站客流产生具有促进作用.

6 结 论

通过对哈尔滨地铁1号线乘客依路网距离的分布规律进行分析,确定了地铁车站800 m路网距离为其服务范围,该范围小于大部分研究中所采用的800 m欧氏距离.结合乘客依路网距离的衰减规律定义了加权楼层面积,并采用Arcgis的几何计算和路网分析功能进行计算.在GWR模型中,采用了行政管理、商业、休闲娱乐、医疗卫生、土地使用多样性指数和200 m范围内接驳公交线路数6个解释变量,运行结果表明基于GWR模型的客流预测模型由于基于最小二乘法的多元回归模型.本文研究对象为单条地铁线路的客流预测,而地铁线路发展成网后,其特点将不同于单条线路,需要进行后续的研究.

猜你喜欢

路网客流车站
客流增多
云南智慧高速路网综合运营管控平台建设实践
基于多源异构大数据融合技术的路网运行监测预警平台
宁夏高速公路路网“最强大脑”上线
车站一角
城市轨道交通节假日期间大客流行车组织思考与实践
基于系统动力学的城市轨道交通车站客流控制仿真与优化
打着“飞的”去上班 城市空中交通路网还有多远
在北京,一个车站的治理有多难
基于自学习补偿的室内定位及在客流分析中的应用