地铁站点客流特征与土地利用关系研究
2018-01-09马晓磊张继宇刘剑锋王江锋李金海
马晓磊, 张继宇, 刘剑锋, 王江锋, 李金海
(1. 北京航空航天大学交通科学与工程学院, 北京 100191;2. 北京城建设计发展集团股份有限公司, 北京 100037; 3. 北京交通大学交通运输学院, 北京 100044)
地铁站点客流特征与土地利用关系研究
马晓磊1, 张继宇1, 刘剑锋2, 王江锋3, 李金海2
(1. 北京航空航天大学交通科学与工程学院, 北京 100191;2. 北京城建设计发展集团股份有限公司, 北京 100037; 3. 北京交通大学交通运输学院, 北京 100044)
讨论轨道交通站点客流的时间变化规律,根据客流的时序特征,利用时间序列聚类的K-means算法对轨道交通站点进行分类,对比不同类别站点的客流差异,同时探究轨道交通站点早晚高峰进出站客流与站点周围用地密度之间的相关关系,在考虑空间相关性的基础上,采用地理加权回归定量计算回归方程,详细分析客流与用地之间的相关系数在空间的分布情况。通过分析为不同站点制定有针对性的运营管理措施,以及为轨道交通规划提供理论支持。
城市轨道交通; 地铁客流特征; 土地利用; 地理加权回归; 时序聚类分析
车站作为轨道交通的核心,客流问题尤为突出,这些问题与车站周围用地有着密切的联系。探索车站客流规律,挖掘客流与用地之间的关系,对于完善轨道交通系统至关重要。
轨道交通系统的客流特征一直都是研究的重点问题[1-2]。王静等利用IC卡数据从时间、空间分布来探究轨道交通网络化运营的客流特征[3]。马小毅等利用广州市轨道交通运营资料,总结轨道交通从单线发展到网络的客流规律[4]。刘剑锋等从不同线路的角度出发提取不同的客流特征信息并总结规律[5]。
在土地利用方面,很多学者研究客流与土地利用的关系。张宁等以东京为例研究车站日均上下车客流量与车站影响范围内的容积率、人口、岗位等数据之间定量和定性的关系[6]。彭沙沙等提出轨道交通线网和土地利用各自的评价体系并建立了协调评价模型[7]。李世民等研究北京地铁5号线开通后沿线的人口变化规律,得出客流与沿线用地开发的互动关系[8]。
已有研究多集中在地铁客流与土地利用的整体关系,但缺少对微观层面的客流分析。本研究以北京IC卡数据为基础,详细探究微观层面车站的客流规律,利用时间序列聚类对车站进行分类,总结不同类型站点的客流分布。根据客流分布规律,使用GWR定量计算客流特征值与用地密度之间的相关关系,为轨道交通规划运营提供数据支持。
1 地铁站点分类与客流特征
1.1 基于K-means的时序聚类
轨道交通系统车站众多,很多车站的客流分布有相似之处,所以利用车站客流对车站进行聚类,能够简化研究,更好地挖掘客流规律。车站的单日进出站客流是典型的时间序列数据,所以本次研究选择基于K-means的时序聚类方法。这种方法将时序数据处理成K-means能够识别的数据结构,适用于大数据的聚类[9]。
K-means聚类首先按照固定规则确定k个初始中心,分别计算每个个体到初始中心的距离,将其划分至距离最近的类别中,然后重新确定初始中心,不断迭代直到符合聚类标准。
(1)
B值越大表示类与类之间的差别越大,反之则表示类之间差距越小。同样定义类内系数W,表示每一类的类内个体差异。
(2)
W值越大,表示类内之间个体差异越大,反之表示类内个体差异越小。
根据B和W的含义可以定义多种参数来判断k值的合理性。其中,Calinski和Harabasz criterion为最常用的系数。
(3)
式中,n表示集合S的个体总数。C值越大则k的取值越合理。
K-means算法对初始中心的选择十分敏感,基于K-means的时序聚类提供多种初始中心确定方法,本次研究选择最大距离法确定初始中心。首先选择两个距离最远的个体作为初始聚类中心,然后将已选择距离最远的个体添加进聚类中心集合。这种方法能够保证初始聚类中心之间的距离最远,符合聚类的基本原则。
1.2 数据处理与聚类结果
本次研究所用数据为通过IC卡得到的北京地铁2015年6月第一周工作日266座车站96时段(15 min一段,标号1~96,去除地铁每天停运时间0:00-5:00,共76个时段)的进出站客流量,取周一至周五的平均值。
为了同时考虑进站和出站双方向客流,本次研究分别对进站和出站客流进行聚类,然后交叉分类得到最终结果。根据聚类方案,需要同时确定进站和出站两个k值。陶志祥等观察不同车站的进出站客流时间分布形态,大致将客流分布分为5种:单向峰型、双向峰型、全峰型、突峰型和无峰型[10]。所以本次研究k值的范围选择4~6,通过计算参数Calinski和Harabasz criterion确定最终的聚类数k。
利用R软件的kml语言包进行聚类计算,得到参数结果如表1所示。进站和出站都选择k=5,然后进行交叉分类,将北京地铁266座车站分成10类,如图1所示。通过观察每一类站点的客流规律,进行进一步分类,最终将地铁站点分成3大类10小类,分别为双峰型、工作型和居住型(见表2)。
表1 Calinski-Harabasz criterion计算结果
图1 交叉分类Fig.1 Cross classification
Aa类是典型的双峰型站点,占车站总数的43.6%,是包含车站数目最多的一类站点,基本覆盖了北京市线网的各个部分,但是整体的客流量较小,全天客流在6 000人次左右,平均高峰期客流为320人次/15min。
表2 车站分类结果
工作型站点共有78座,占车站总数29.3%。图2和图3分别表示工作型中Cd类站点的客流分布和空间分布。客流高峰集中在出站早高峰和进站晚高峰,是典型的工作方向流动。平均总客流量达到30 000人次/d,最大的单位时间客流达到2 800人次/15 min,车站需要采取相应限流措施以保证正常运营。从空间分布可以看出,Cd类有3个地理中心,分别是中关村、复兴门和国贸,都是北京市内重要的科技商业中心。
图2 Cd类车站客流时间分布Fig.2 Average passenger temporal distribution of Cd station
图3 Cd车站位置分布Fig.3 Cd station location distribution
居住型站点共有57座,占车站总数的21.4%。早高峰以进站客流为主,晚高峰以出站客流为主,另外两个方向几乎没有峰值出现。图4和图5表示居住型Dc类客流分布曲线和空间分布。从图中可以看出,Dc类站点客流分布更集中,最大客流达到2 700人次/15 min。车站集中分布在回龙观和天通苑附近,是北京市重要的居住中心。
图4 Dc类车站客流时间分布Fig.4 Average passenger temporal distribution of Dc station
图5 Dc车站位置分布Fig.5 Dc station location distribution
2 客流特征值与用地密度的关系
2.1 用地密度提取
提取用地密度首先应该确定地铁站的辐射范围。本文利用缓冲区和泰森多边形叠加的方法寻找适当的车站辐射范围,辐射半径选取1 000 m,保证了辐射范围没有重叠。根据确定的辐射范围可以计算每一个车站区域的面积。
本次研究的用地数据来自于北京市国土资源和规划部门,数据格式为GIS地图,其中包括北京市内各个领域的用地,每一条数据包括该地点的用地类型、地址、地理坐标等,基本涵盖北京市所有的用地信息。基本的数据结构为兴趣点(point of interest),是地理统计中常用的基本单元。例如停车场兴趣点包含北京市内商场、写字楼的室内停车场以及各个室外停车场和路侧停车场,涵盖信息非常全面。根据本次的研究内容,选取了餐饮服务、公司企业、公交站点、停车场、金融服务、科研教育、零售行业、商业大厦、休闲娱乐、医疗服务、住宅小区等11种用地密度作为基础用地数据。
利用ARCGIS将地图与处理后的车站辐射范围在同一坐标系下进行相交处理,得到每一个车站辐射范围内11类用地的分布情况。统计每一个车站周围不同用地的数量,除以车站辐射范围的面积,即得到每一座车站周围各类用地的密度,单位为个/m2。
根据车站分类结果可知不同站点的客流主要差异为高峰客流,因此选择早高峰(7:00-9:00)和晚高峰(17:00-19:00)小时客流作为模型因变量。
2.2 GWR模型
在空间分析中,不同的个体观测值在不同的地理位置观测得到,而传统的回归模型假设观测值在空间中保持一致性,忽略了其空间差异。地理加权回归模型GWR是在普通的线性回归模型基础上加入空间因素[11],即
(4)
其中,(ui,vi)表示第i个采样点的坐标,βk(ui,vi)表示第i个采样点上第k个回归参数,是地理位置的函数,εi∈N(0,σ2),Cov(εi,εj)=0(i≠j),为了表示方便,将上述公式简写成:
(5)
将公式写成矩阵的形式:
y=(X⊗β′)I+ε
(6)
这里⊗表示矩阵的逻辑乘运算,即将X的元素与β′对应的元素相乘,构成新的矩阵。设有n个采样点和p个自变量,则X与β′都是n×(p+1)维的矩阵,I为(p+1)×1单位向量。β由n组回归系数构成,形式如下:
(7)
因为地理加权回归模型中的回归参数在每个采样点上都是不同的,因此未知参数的个数为n×(p+1),远远大于观察个数n。在估算采样点i的回归参数时,不同观测点处的观测值的重要性不同,距离i点越近的观测值重要性越大,反之越小。利用加权最小二乘法,i点回归参数可通过使
达到最小来估计。这里wij为回归点i与其他观测点j之间地理距离dij的单调递减函数。令βi=[βi0,βi1,…,βip]′,Wi=diag(wi1,wi2,…,win),则i点的回归系数βi为
(8)
利用上述方法逐点进行回归,得到包含各采样点上回归参数估计矩阵β如下:
(9)
在GWR模型中确定距离权重函数wij是至关重要的一步,本次研究采用高斯距离法,这种方法选取连续单调递减函数高斯函数来拟合距离与权重之间的关系,函数形式如下:
wij=exp(-(dij/b)2)
(10)
b为描述权重与距离之间函数关系的参数,称为带宽,引入CV指数对带宽计算如下:
(11)
2.3 拟合结果
本次研究提取不同站点早晚高峰进出站的高峰小时客流量作为因变量,11种用地密度作为自变量进行相关性分析。首先利用向后排除法进行自变量的筛选,结果如表3所示。工作方向的早高峰出站和晚高峰进站客流有相同的影响因素,居住方向的早高峰进站和晚高峰出站客流有类似的影响因素。
表3 高峰小时客流量影响因素
在进行空间自相关分析之前,需要计算因变量的空间自相关系数,以确定是否存在空间自相关性,计算公式如下:
(12)
(13)
莫兰I指数结果如表4所示,4个参数的置信度都在99%以上。Moran’sI指数全部大于0.15,自变量在空间中呈现正相关性,为进一步分析4种客流量的空间相关性提供了理论基础。
表4 莫兰指数
下面选择早高峰进站客流对拟合结果进行具体的介绍。相关系数结果如表5所示。
从3个影响因素对进站早高峰客流量影响系数的均值可知,住宅区密度对乘客早高峰乘坐轨道交通的影响程度最大,住宅密度越高乘坐地铁的乘客越多;停车场密度与进站早高峰客流量呈负相关,说明停车场密度越大选择轨道交通的乘客越少;公交车站密度与进站早高峰客流量呈正相关。在早高峰时段,公交车与地铁相互补充,但影响有限,是3种因素中相关性最小的一种。
表5 相关系数结果
图6表示住宅密度相关系数的空间分布图,外围区域的颜色较深,说明外围区域住宅密度对早高峰进站客流影响较大。在东北和西南方向的颜色最深,相关系数最大。主要是房山线和15号线沿线,这些区域交通相对落后,轨道交通是主要的出行方式。
图6 住宅相关系数空间分布Fig.6 Spatial distribution of correlation coefficients for residenfial district
3 结论
本次研究以北京市轨道交通IC卡数据为基础,根据轨道交通站点单日进出站客流时间分布分别对进站和出站客流利用时间序列聚类方法进行聚类,最后交叉分类,将北京市轨道交通车站分成3大类10小类,并分析各类别之间的客流差异,计算客流特征值;利用ARCGIS地图提取用地密度信息,分析不同类别站点周围用地密度差异;结合高峰客流数据的特点选取GWR模型分析高峰客流量与用地密度之间的相关关系。研究成果可以为轨道交通站点制定客流管理策略提供一定的数据支持,同时可以作为轨道交通线路走向和站位规划的重要依据。今后的研究可以针对GWR模型进行进一步的完善,同时收集更多数据资料,分析相关系数分布的成因。
[1] AGUILÉRA V, ALLIO S, BENEZECH V, et al.Using cell phone data to measure quality of service and passenger flows of Paris transit system[J].Transportation research part c emerging technologies, 2014(43):198-211.
[2] SUN L, LU Y, JIN J G, et al.An integrated Bayesian approach for passenger flow assignment in metro networks[J].Transportation research part c emerging technologies, 2015(52):116-131.
[3] 王静,刘剑锋,孙福亮.北京市轨道交通线网客流分布及成长规律[J].城市交通,2012,10(2):26-32.
WANG Jing, LIU Jianfeng, SUN Fuliang.Passenger demand distribution and increasing trend over Beijing railtransit[J].Urban transport of China, 2012, 10(2):26-32.
[4] 马小毅, 金安, 刘明敏,等.广州市轨道交通客流特征分析[J].城市交通, 2013(6):35-42.
MA Xiaoyi, JIN An, LIU Mingmin,et al.Rail transit passenger flow characteristics in Guangzhou[J]. Urban transport of China,2013(6): 35-42.
[5] 徐成永,李刚.北京城市轨道交通网络化发展方向和模式探讨[J].都市快轨交通, 2017,30(7):39-44.
XU Chengyong,LI Gang.Development trend and mode of Beijing urban rail transit networking[J].Urban rapid rail transit, 2017, 30(7): 39-44.
[6] 张宁,叶霞飞,刘剑锋.土地利用对轨道交通车站客流量的影响[J].城市交通, 2010, 8(3):23-27.
ZHANG Ning, YE Xiafei, LIU Jianfeng.The impact of land use on demand of urban rail transit[J]. Urban transport of China, 2010, 8(3):23-27.
[7] 彭沙沙, 吴小萍, 梅盛.基于GIS的城市轨道交通与土地利用协调研究[J].铁道工程学报, 2011(1):76-79.
PENG Shasha, WU Xiaoping, MEI Sheng.Study on coordination between urban rail transit and land use based on GIS[J].Journal of railway engneering society, 2011(1):76-79.
[8] 李世民,安栓庄,贺腊妮.轨道交通与城市用地开发互动影响研究[J].都市快轨交通, 2013, 26(5):25-29.
LI Shimin, AN Shuangzhuang, HE Lani.Research on interaction between rail transit and city land development[J].Urban rapid rail transit, 2013, 26(5):25-29.
[9] Genolini C, Alacoque X, Sentenac M, et al.kml and kml3d: R Packages to cluster longitudinal data[J].Journal of statistical software, 2015, 65(4):1-34.
[10] 陶志祥,张宁,杜波.城市轨道交通客流时空分析研究[J].城市公共交通,2004(2):33-35.
TAO Zhixiang, ZHANG Ning, DU Bo.Research on the time & space distribution of passenger flow in urban rail transport[J].Urban public transport, 2004(2):33-35.
[11] 覃文忠.地理加权回归基本理论与应用研究[D].上海:同济大学,2007.
QIN Wenzhong.The basic theoretics and application research on geographically weighted regression[D].Shanghai:Tongji University, 2007.
RelationshipbetweenCharacteristicsofSubwayPassengerFlowandLandUse
MAXiaolei1,ZHANGJiyu1,LIUJianfeng2,WangJiangfeng3,LiJinhai2
(1. School of Transportation Science and Engineering, Beihang University, Beijing 100191;2. Beijing Urban Construction Design & Development Group Co., Ltd., Beijing 100037;3. School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044)
This paper researches the characteristics of metro station ridership changed with the time. The subway stations are divided by using sequential K-means clustering algorithm based on the temporal distribution of metro station ridership. The distinctions between different categories are compared in this paper. A geographically weighted regression(GWR)model which considers the spatial correlation is built to quantitatively calculate the regression correlation to analyze the relationship between station-level ridership and land density around the station. The paper also provides the visual maps to explore the spatial distribution of the correlation coefficients. This study can provide theoretical basis to make specific operational management strategies and help the design of urban rail transit.
urban rail transportation; subway passenger flow characteristics; land use; geographically weighted regression; sequential clustering
10.3969/j.issn.1672-6073.2017.06.006
U231
A
1672-6073(2017)06-0033-06
2017-04-14
2017-06-05
马晓磊,男,副教授,博士生导师,主要从事交通大数据、公共交通方面的研究,xiaolei@buaa.edu.cn
国家自然科学基金(51408019;61473028);北京市自然基金项目(8162031);北京市科技新星计划项目(z151100000315048);中国科协青年人才托举工程
(编辑:郝京红)