基于统计的轨道交通旅行时间估计方法
2019-07-01陈佳施海全孙煜
陈佳 施海全 孙煜
摘 要:本文致力于解决城市轨道交通旅行时间的估算。研究通过对影响换乘路径选择和旅行时间的因素的研究分析,提出了基于统计的候车时间和换乘时间估计的算法,并用上海轨道交通的历史数据评价了该算法的可靠性。
关键词: 城市轨道交通;换乘路径;旅行时间;K短路径
文章编号: 2095-2163(2019)03-0240-04 中图分类号: U491 文献标志码: A
0 引 言
轨道交通作为城市公共交通的重要方式之一,具有运量大、速度快、安全、准时等特点,已逐渐成为居民出行首选公共交通工具。随着轨道交通路网不断扩大,换乘站点越来越多,乘客需跨线乘坐列车的情况日益普遍,换乘路径选择和旅行时间是乘客普遍关心的问题,本文研究分析了影响换乘路径选择和旅行时间的因素,提出一种基于统计的方法来估计路径的旅行时间。
1 影响因素研究
1.1 换乘路径
通常,乘客出行时并不会考虑从起点到终点之间所有可能的换乘路径,而仅考虑其中的一部分换乘路径,称作有效路径。现有清分模型中,采用K短路径法(即求解任意2个跨线站点间的K条最短路径)来搜索有效路径[1-4]。主要实现思想如下:
1.2 旅行时间
需要指出的是,当本文研究討论各种时间时,此处则特指这种时间开销的期望值。如果其中经过从某一线路站点i到另一线路站点j的换乘(含换乘步行及换乘候车时间),即有:
研究中基于简洁的表达考虑,在此仅列举一次换乘的情况,但本文中的推导和计算可以简单推广到多次换乘的情况。同时注意到,即便在同一条线路中,不同运行区间的地铁运营时刻也有所不同,因此候车时间不仅依赖于出发站点o,也依赖于目的站点d或换乘站点i。
在正常运营的条件下,所有班次列车分方向通过相邻站点间的行车时间及在站台停留的时间基本一致。不同出发和目的站点闸机到上下车点所需时间t(进闸)o和t(出闸)d虽然存在差异,该差异相对于跨线站点间的换乘步行时间t(换乘)o,d基本可忽略不计。而总候车时间和总换乘步行时间则可能受车厢拥挤度、步行速度等各方面因素影响,详细分析见1.3节。
1.3 影响因素
本文梳理罗列了影响换乘路径选择的各个因素。对其可做阐释描述如下:
(1)途经车站数。
(2)换乘次数。
(3)是否出站换乘:出站换乘会比站内换乘多出再次安检和过闸机时间。
(4)是否首发站。
(5)末班车时间:末班车时间可能会影响换乘路径的可达性。
以上因素(1)~(3)均与路径的时间开销相关,由此可推,时间开销对乘客的换乘路径选择有重要的影响。而时间开销中除了候车时间和换乘步行时间,其它时间基本没有弹性。
影响花费时间中的总候车时间的因素有:
(1)行车间隔时间:假设只要列车到站就可以上车,单次候车时间取值范围为0~发车间隔时间。可见,行车间隔时间越短,可能的最长候车时间越短。
(2)车厢拥挤度、候车人数和排队位置:这一组客观因素会影响乘客能否乘上车,与因素(1)及乘客是否赶路这一主观因素综合,亦可能影响乘客是否有意愿再等候一辆列车,从而影响等候的列车数。若没能乘上第一辆列车或情愿再等候一辆列车,则将延长候车时间,延长时间等于行车间隔时间乘以多等候的列车数。
(3)是否首发站:综合因素(1)、(2)及乘客是否赶路可能影响乘客是否有意愿再等候一辆列车,从而影响等候的列车数。若情愿再等候一辆列车,则将延长候车时间,延长时间等于行车间隔时间乘以多等候的列车数。
影响总换乘步行时间的因素主要是乘客步行速度,而乘客步行速度与下述因素相关,可将其整合概述为:
(1)乘客自身步行速度。
(2)乘客是否赶路。
(3)换乘通道拥挤度。
2 旅行时间估算
2.1 同线进出站旅行时间的估算
如1.2节所述,同线进出站的旅行时间可表示为:
本文采用上海申通地铁提供的相邻站点间上下行行车时间(含站台停留时间)来得到总行车时间的估算t^(行车)o,d。仍需说明的是,由于上下行的区分,在本文中,所有的实际站点都被区分为带有上下行标记的2个不同的逻辑站点。
对于闸机到上下车点所需时间t(进闸)o和t(出闸)d,研究假设进出闸的步行时间为与站点o和d无关的常量,即:
由1.3节可知,影响候车时间的主要因素是行车间隔时间,而从上海申通地铁提供的路网各线行车间隔时分表可得每条线路(区段)的同一方向在一个时间段内的发车间隔时间是一个定值,该定值直接影响了期望候车时间。过程中,由于逻辑站点本身带有上下行的标记,因此一个实际区段也被区分为带有上下行标记的2个不同的逻辑区段。用R(x)表示站点x所属的区段,则针对某一出发站点所在的区段R(o)和另一目标站点所在的区段R(d),有:
于是,研究推导得到:
这为研究中运用统计的方式求得t(非行车)R(o),R(d)和to,d提供了便利。令{t(1)o,d,…,t(n)o,d}表示在较长的一段时间(例如一个月)内,从站点o到d的所有历史交易记录中所获得的实际乘客从进闸到出闸的时间开销。针对第k次交易记录,就可以计算得出其非行车时间为t(k)o,d-t^(行车)o,d。综合所有的交易记录,研究可以取计算得到的非行车时间集合的中位数t=(非行车)o,d作为从该数据集中获得的统计值。这里采用中位数而非平均数的原因是,平均数较易受少数实际时间开销特别大的异常交易的干扰。
基于相同区段的候车时间的共性,从充分利用历史数据的角度出发,可以将相同出发区段内的所有出发站点和目的区段内所有目的站点构成各种组合,针对每一种组合计算非行车时间的中位数,并将所有组合的中位数综合在一起,计算平均数,获得对t(非行车)R(o),R(d)的估计。具体的算法如下:
與2.1节类似,研究可以将相同出发区段内的所有出发站点和目的区段内所有目的站点构成各种组合,并甄选出只存在一条有效路径,且该路径经过(i,j)一次换乘的组合,针对每一种组合计算非行车时间的中位数,并将所有组合的中位数综合在一起,计算平均数,获得对t(换乘)i,j,R(d)的估计。具体的算法如下:
(1)遍历换乘线路上所有的出发区段O和目标区段D。
(2)获取该出发区段和目标区段的出发站点、目标站点组合所构成的集合,可将其写作如下数学形式:
(4)将各种组合的中位数综合在一起,计算出该出发区段到目的区段的换乘时间平均数,可使用如下公式计算求出:
(5)输入任一出发站点o和目标站点d,换乘站(i,j),站点所在区段R(o)、R(i)和R(d),估计其旅行时间为:
2.3 实验结果
本文中实验用2018年4月2日~13日间工作日早高峰(进站时间在7:00~9:00间)进出站点在1号线主线(莘庄站-上海火车站)上的所有OD对的历史数据,以及进站站点在1号线主线上一次换乘、且只存在一条换乘路径的所有OD对的历史数据,采用2.2节提出的算法估算了2018年4月16日~25日间工作日早高峰进站站点在1号线主线上一次换乘、且只存在一条换乘路径的所有OD对(共525个OD对)的旅行时间。然后分别将本文算法估算值和上海地铁官网查询值与实际数据所得时间开销的统计值进行比较,最终运行结果见表1。
由表1可知,本文算法估算值在偏差平均值、偏差大于10%占比和偏差大于20%占比这3项评价指标上均优于官网查询值。研究针对算法估算值偏差超过10%的OD对分析发现均存在以下一种或全部现象:周期内历史数据量非常少,均小于10笔;OD间站点数量非常少,只有2~4站。
3 结束语
本文探讨了上海轨道交通清分模型的K短路径算法,研究分析了影响城市轨道交通换乘路径选择和旅行时间的各类因素,提出了一种基于统计的旅行时间估计的方法,最后采用上海轨道交通的历史数据评价了该算法,所得结果要优于上海地铁官网提供的查询结果。
参考文献
[1]王明中. 城市轨道交通一票(卡)通换乘票务清分系统的研究与实现[D]. 上海:上海交通大学,2004.
[2]吴敏,苏厚勤,王明中. k(≤3)条渐次最短路径搜索算法的研究及其实现技术[J]. 计算机应用与软件,2004,21(8):81-83.
[3]黄胜,孟世聪,胡幼华. 轨道交通系统票务清分算法[J]. 计算机应用研究,2004,21 (6) :104-106.
[4]EPPSTEIN D. Finding the k shortest paths[J]. SIAM Journal on Computing, 1998, 28(2): 652-673.
[5]ZHAN F B. Three fastest shortest path algorithms on real road networks[J]. Journal of Geographic Information and Decision Analysis,1997, 1(1): 69- 82.