基于IC卡数据的轨道站点候车时间特征分析

2019-01-16陈艳艳陈兴斌吴克寒李金山

重庆交通大学学报(自然科学版) 2019年1期

陈艳艳，陈兴斌，吴克寒，李金山，熊杰

(1. 北京工业大学北京市交通工程重点实验室，北京 100024；2. 北京市市政工程设计研究总院有限公司，北京 100082)

0 引言

随着轨道交通的发展，使用轨道交通进行通勤成为人们日常生活的一部分，由此乘客在轨道站点内的候车时间也长短不一。客运服务质量是城市轨道交通运营生存和可持续发展的关键[1]。虽然轨道列车客运量大，但是在高峰时刻依然无法满足通勤乘客的需求，因而有些乘客在高峰时期需要在轨道站内等待下一辆列车，甚至是下下辆。乘客在轨道内候车时间已经成为评价站点服务水平的关键因素[2]。张海丽[3]提出地铁站内排队通道的服务水平等级划分方法；曹志超[6]通过调查建立了乘客候车时间满意度模型，并定量评估了城市轨道交通突发大客流应急策略的优劣。准确真实地计算乘客在轨道站内候车时间可优化轨道站点的限流制度，对地铁发车间隔安排具有重要意义，同时对车站容纳能力、设备设施评估也有很好的借鉴意义。

国外学者计算乘客平均候车时间的传统方法主要为取为发车间隔时间的一半[5]，或是引入流体力学模型[6]等来计算；C.LIEBCHEN[7]提出完善图模型，可通过优化列车时刻表来缩短乘客候车时间；广义资源限制的开行方案优化模型[8-9]则可用来计算总候车时间。

国内学者则更着重于通过地铁的运营信息、乘客的个人特性等来研究乘客的候车时间。曹志超等[10]针对乘客候车时间计算模糊问题，在考虑乘客实时到达规律、OD(起讫点)分布、发车间隔和列车运能基础上，提出可用于城市轨道交通网络和双向的大客流和常规客流的候车时间累计计算方法；曹守华[11]针对乘客走行特性，分析了乘客在地铁站内的分布规律。

公交IC卡是一种新的客流信息采集手段，它为交通分析提供了新的数据源[12]。基于此，笔者提出了一种基于地铁IC卡数据来计算高峰时期乘客候车时间的方法；并将这种方法运用于北京地铁站内乘客候车时间的计算，并将计算结果进行特征分析。通过这种基于大数据的计算方法，可更可靠、准确、真实的计算出乘客地铁站内的候车时间。

1 计算方法

1.1 概述

在进行轨道出行的时候，出行时间由候车时间、轨道行驶时间和行走时间这3部分构成。对于特定地铁出行OD而言，其轨道行驶时间是恒定的，而乘客的行走时间也大同小异；故特定站点出行OD高峰时刻的出行时间与非高峰时刻的并不一样，其主要影响是候车时间。

笔者通过地铁IC卡刷卡数据准确获取了乘客进出地铁站站点和准确时间等大量数据，并对这些数据进行筛选、清洗，选择可靠的出行时间数据，计算出乘客在高峰时刻的候车时间。

1.2 地铁出行OD选择

对每个地铁站点而言，以其为起点的地铁OD有很多，笔者选择无换乘节点的OD进行计算。如果乘客进行换乘，就会产生换乘时间、选择路径等影响出行时间的因素，即采用相同出行OD的乘客出行时间影响因素不唯一。故笔者首先筛选出上车站点所在线路与下车站点所在线路相同的地铁刷卡数据，即不换乘刷卡数据。

在轨道站点所有不换乘出行OD中，再选取早高峰出行量最大的出行OD。这样选取的特定出行OD样本量更大，同时数据也更具代表性。

1.3 出行时间计算

根据地铁出行OD，提取对应地铁IC卡刷卡数据，计算每个出行时间T，如式(1)：

T=Tout-Tin

(1)

式中：T为乘客出行时间，表示从乘客刷卡进站开始，到乘客刷卡出站时间；Tout为乘客出站时间，可由IC卡数据获取；Tin为乘客进站时间，可由IC卡数据获取。

1.4 数据清洗

IC卡刷卡数据中难免存在异常数据，某些是因为仪器异常导致，某些则是乘客异常出行所导致。故应该对IC卡数据进行清洗。

根据地铁线路长度等，确定地铁正常出行的最小时间为Tmin，最大时间为Tmax；将地铁出行时间限定在Tmin～Tmax，将小于Tmin或大于Tmax的数据剔除。

同时，IC卡数据存在某些出行时间虽在允许范围内，但却不是正常通勤出行的情况，例如在某个地铁站等人而导致出行时间远大于其应有的出行时间。将每个提取出来的出行OD数据按小到大排序，选取前99%、98%、97%、95%的数据视为有效数据，并检查其数据清洗情况，发现98%的数据为合理出行数据。99%则会过分清洗，而低于98%时会导致数据清洗不彻底。故选取98%的数据作为有效出行数据进行分析。

1.5 候车时间计算

将所有OD出行按每10 min求平均值，可计算每10 min所对应的出行时间。而高峰时期延误可能来源于客流组织措施(限流)、旅行时间波动等。

站内限流是因客流过大为避免乘客集聚在车门口候车的客流组织措施。其本质是将候车时间转换为站内行走时间，故笔者将限流而产生的延误时间视为候车时间的一部分。

为排除旅行时间波动干扰，故在平峰时刻取每10 min出行时间平均值作为比较稳定的不排队旅行时间；同时在早高峰时刻，取每10 min出行时间最大值作为排队延误出行时间。若早高峰时刻和平峰时刻均采用平均值，会导致计算的排队时间偏小，因为在长达2 h的早高峰时刻中，其排队时间也会呈现一定波峰。

OD出行的所有出行时间每10 min求平均值，则得出平均出行时间为T10。早高峰出行时间Tz选取早高峰出行时间内T10的最大值；平峰出行时间Tp选取平峰时间内T10的平均值。

早高峰出行时间如式(2)：

Tz=max{T10z}

(2)

式中：Tz为该站点的早高峰出行时间；T10z为出发时刻在早高峰时段内的出行时间。

平峰出行时间如式(3)：

Tp=avg{T10p}

(3)

式中：Tp为该站点平峰出行时间；T10p为出发时刻在平峰时段内每10 min的出行时间。

乘客候车时间如式(4)：

t=Tz-Tp

(4)

式中：t为乘客候车时间。

2 北京地铁候车时间特征分析

笔者以北京278个轨道站点为研究对象，采用2016-04-11—2016-04-15这5 d工作日地铁刷卡数据，计算了这278个站点的早高峰候车时间。

2.1 北京轨道站内早高峰等车时间计算

2.1.1 出行时间计算

针对北京市轨道交通现状，采用5个工作日数据，计算了北京所有轨道交通早高峰出行OD的出行量，将需要换乘的OD剔除，保留不换乘出行OD。

针对每个轨道站点，笔者在以该站点为起点的所有OD出行量数据中选取其出行量最大的一个OD。

选取的278个轨道出行OD，如表1。

表1 选取的轨道出行ODTable 1 Selected rail transit OD

根据选取的OD数据，获取每条对应OD的刷卡记录。由刷卡记录获取刷卡进站时间和刷卡出站时间，并将其出站时间减去进站时间，计算出每个出行时间，如表2。

表2 由IC卡数据计算的出行时间Table 2 Travel time calculated from IC card data

2.1.2 数据清洗

根据北京地铁情况，选取同线路地铁正常出行的最大时间Tmax=150 min，Tmin=3 min，小于3 min和大于150 min的数据被剔除；将每个出行OD数据按时间顺序由小到大排列，选取前98%数据为有效数据。数据清洗前后对比如图1。

图1 清洗前后数据对比(西红门-西直门)Fig. 1 Data comparison before and after cleaning (Xihongmen-Xizhimen)

2.1.3 候车时间计算

逐个计算北京278个轨道站点的早高峰候车时间及其对应时刻，计算结果如表3。

表3 站点的早高峰候车时间Table 3 The waiting time of station at early peak hour

2.2 候车时间特征分析

2.2.1 站点位置对候车时间的影响

图2为北京地铁早高峰时站内候车时间分布，每个站点的圆圈大小代表该地铁站点排队长度。由图2可看出：在北京大兴线、1号线、八通线、6号线、5号线、昌平线等连接城区与郊区的线路中，其郊区的站点大多为早高峰排队时间较长的站点。以天安门为北京城中心，计算每个站点与天安门的直线距离；同时计算北京每个环带上所有站点的平均候车时间，如图3、4。

由图3、4可知：北京6环外的平均候车时间最长，二环内平均候车时间最短，候车时间和站点与城中心距离呈正相关性。这说明：北京职住相对还比较不平衡，而且大量人群都居住在离城中心较远的地方。早高峰时段，有大量通勤人员从郊区前往城区，导致郊区站点候车时间远大于城中心的。其典型站点是昌平线的沙河站，沙河站行程时间如图5。

图2 北京地铁早高峰站内候车时间分布Fig. 2 Waiting time distribution of subway station in Beijing at peak hour

图3 候车时间与北京环带关系Fig. 3 Relation between the waiting time and Beijing ring zone

图4 候车时间与站点和城中心距离关系Fig. 4 Relation between waiting time and distance between stationand city center

图5 沙河-西二旗出行时间分布Fig. 5 The travel time distribution from Shahe to Xierqi

城区内某些站点早高峰候车时间为负值，意味着早高峰时乘客在该站点乘车不需要排队。由于早高峰发车频率比平峰时要高，其典型站点定为13号线的五道口站，五道口站选取OD为五道口—西二旗，如图6。

图6 五道口-西二旗出行时间分布Fig. 6 The travel time distribution from Wudaokou to Xierqi

笔者因过往实时发车间隔数据难以得到而未将轨道站点候车时间结合发车间隔进行准确计算，故只进行整体分析，这并不影响候车时间计算及特征分析。

2.2.2 站点位置对最大候车时间的影响

观察北京地铁站点早高峰最长排队时间发现：大兴线、6号线等连接城区和郊区的地铁线路中，郊区站点早高峰最长排队时间明显早于城区。笔者选取候车时间大于2 min的站点，分析其最大候车时间发生时刻的特性，如图7、8。

图7 发生时刻与北京环带关系Fig. 7 Relation between the occurrence time and Beijing ring zone

图8 发生时刻与站点和城中心距离关系Fig. 8 Relation between the occurrence time and the distance between the station and the city center

最大候车时间发生时刻与站点和城中心距离呈负相关，即站点离城中心距离越大，站点最大候车时间发生时刻就越早。这是因为通勤距离更长的乘客需要更早出行才能保证及时到达单位。

2.2.3 候车时间与人口密度及站点进站量的关系

结合每个站点附近人口居住密度和该站点的早高峰进站量，笔者分析了候车时间与之的相关性，如图9、10。

图9 等车时间与车站早高峰进站量关系Fig. 9 Relation between waiting time and station early peak intake

图10 候车时间与人口密度关系Fig. 10 Relation between waiting time and density of population

候车时间与人口密度并无明显相关性，而候车时间与车站早高峰进站量并不呈线性相关性，而是呈多项式相关性。车站早高峰进站量的峰值在10 000～15 000人次时出现。这说明进站量大的站点排队时间不一定长，因为某些站点是始末站，进出站量虽大，但是其候车时间却不长。

2.2.4 限流政策对候车时间的影响

北京为缓解早高峰站内压力，在某些站点施行了限流措施，某些站点为站内限流，某些为站外限流。

在客流量较大的情况下，站外限流能起到很好的作用。比如：5号线的天通苑北等几个站和1号线的苹果园等几个站均施行了站外限流，并起到良好作用。这几个站点的客流量相当大，但由于限流，故其站内候车时间并没有延长。

当站点客流过大，站外限流所起到的作用也有限。比如：昌平线沙河站施行了站外限流措施，但是该站早高峰候车时间依然是全北京所有站点中最长的一个；大兴线西红门站施行站内限流，故该站点早高峰候车时间也相当长。

2.2.5 候车时间与线路开通时间的相关性

基于北京已开通的17条线路，笔者分别计算了每条线路的平均候车时间，并将其与该线路开通时间做了相关性分析，如图11。由图11可知：地铁候车时间与其线路开通时间并无明显相关性。

图11 地铁等车时间与该线路开通年份相关性Fig. 11 Relevance between waiting time of metro and opening time of this line

3 结语

笔者提出了一种基于地铁IC卡数据来计算高峰时期乘客在轨道内候车时间的方法。通过该方法，能更可靠、准确、真实地反映出乘客地铁站内候车时间，对地铁限流等相关政策的制定、地铁运行状态的研究都具有相当意义。

基于北京2016-04-11—2016-04-15这5d的工作日数据，笔者计算了北京278个站点的候车时间并进行分析。发现北京地铁候车时间与站点离城中心的距离呈正相关；地铁最大候车时间发生时刻与站点离城中心距离呈负相关；候车时间与站点周围人口密度没有很强的相关性，但也有一定关系；同时站点候车时间与站点开通时间并无明显相关性。