基于公交专用道的准点到站预测方法
2020-09-18李文锋林艳玲游建泳
李文锋,杨 旭,林艳玲,游建泳,程 远
(1.厦门卫星定位应用股份有限公司,福建 厦门 361000;2.长春公交(集团)有限责任公司,吉林 长春 130000)
公交车受路况、车流、红绿灯等多种因素影响,很难像高铁一样按时到开,这就给乘客候车造成了困扰,经常出现公交车“等半天不来,一来好几辆”的情况,乘客的候车成本较高。如果公交车能够像高铁一样每个站点都有时刻表并按时刻表准时到站,乘客就可按点候车,大大减少了乘客的候车成本,提高公交的便捷性。
日本的公交很早就配备了先进的公交车优先系统,公交车配备智能联网装置,通过与交通信号灯系统的交互,保证公交拥有优先行驶权,几乎做到了公交车完全准点。国内成都、济南、武汉等城市已试点准点公交,并开通了数条准点公交线路,准点误差控制在1 min以内。国内对准点公交课题也有了一定研究,别一鸣[1]等提出的城市公交线路时间控制点选择算法是基于历史公交GPS数据,在公交运行途中设置时间控制点,华雪东[2]等提出了基于数据融合的公交到站时间组合预测模型。
对于准点公交的运营,不仅依赖于准确的GPS定位,更依赖于历史数据的计算分析,通过历史数据挖掘公交车辆行驶特征与行驶时长的稳定性。科学地制定公交站点准点到站时间,加上公交专用道的开通,大大降低公交车的拥堵程度,为公交准点到站提供了决定性条件。本文基于海量的GPS定位数据,在公交专用道开通的背景下,提出了公交准点到站的时间预测方法与公交到站时间可靠度评估方法,有助于实现公交“定点发车,准时到站”的目标。
1 原始数据采集与预处理
1.1 原始数据采集
原始数据主要有海量公交车GPS定位数据、营运趟次数据、站点信息表及线路信息表。
1.1.1 公交车GPS数据
GPS数据来源于公交车台上报的实时定位数据,精准记录了车辆的运行轨迹,主要字段包括终端号、GPS时间、进出站类型、线路编号、站点序号、上下行、经度、纬度等,具体如表1所示。
表1 公交车GPS数据
1.1.2 营运趟次数据
营运趟次信息来源于公交调度系统,从车辆营运调度过程中产生,包括设备ID、司机编号、起始站点ID、进入起始站时间、离开起始站时间、终点站ID、线路ID、班次号、行车方向、准点参数、原始发车时间,如表2所示。
表2 营运趟次数据
1.2 数据预处理
为更好地提高数据分析结果的准确度,必须将采集来的数据进行清洗,矫正异常数据。GPS轨迹会出现设备信号不稳定而导致数据丢失的情况,需要将丢失的数据重新补传。GPS轨迹会发生漂移现象,需要结合GIS地图数据纠偏。营运趟次数据会因接口不稳定导致部分数据丢失,需要经过业务员的补录与审核,数据清洗预处理后再录入正式数据库。
2 公交准点到站时间预测
2.1 断面运行时长计算
要预测公交到站时间,首先需要获取到准确的公交运行时长,而公交运行时长在不同路段、不同时间内是不一样的,需要分类处理。本文将公交线路划分为若干个断面,将时间划分为若干个细分时段,依次计算每个断面、每个不同时段内的公交车辆运行时长。
第一步:获取至少三个月的公交专用道途经线路的公交GPS轨迹数据,根据日期特征分类,分为周一、周二、周三、周四、周五、周六、周日七个类别,每个类别的数据都有不同的特征,需要分别计算。
第二步:将七个类别的数据再分组,每15 min分为一组,例如:00:00—00:15为一组,00:15—00:30为一组,依此类推。
第三步:以组为单位,获取每条线路、每个相邻站间的车辆到离站信息,计算组内站间的运行时长,站间运行时长=后一站到站时间-前一站离站时间。
第四步:将每个小组内相同线路、相同断面的站间运行时长求平均,获得每条线路不同时间段内的站间运行时长。
本文提出了公交运行时长可靠指数的概念,是指在某一特定时段内某一特定路段中,公交车辆运行时长方差的倒数,公交运行时长可靠指数越高,代表该线路公交车辆运行速度越稳定,到站准点的概率就越大。如表3所示,在不同时段里,“莲坂外图书城-绿家园小区”的平均运行时长更稳定,据其计算出的运行时长可靠指数更高,则由到站预测方法得出的班次时间表准点率也较高。
基于以上所述,公交调度人员可提醒司机在“莲前-莲坂外图书城”路段中要注意控制车速,以提高公交到站的准点率。
2.2 站内停靠时长计算
除了车辆的站间运行时长,还应获取准确的车辆站间停靠时长,这样才能减少车辆的到站时间累加计算误差。车辆停靠时长在不同的日期类别与不同时间段内,由于客流量的不同,会有不同的区别,因此,本文提出的计算方法是分日期类别与时间段来计算站内停靠时长。
第1步:获取至少三个月的公交专用道途经线路公交GPS轨迹数据,根据日期特征分类,分为周一、周二、周三、周四、周五、周六、周日七个类别,每个类别的数据都有不同特征,需要分别计算。
第2步:将七个类别的数据再进行分组,每15 min分为一组,例如:00:00~00:15一组,00:15—00:30一组,依此类推。
第3步:以组为单位,获取每条线路、每个站点的车辆到离站信息,计算组内站点的站内停靠时长,站内停靠时长=离站时间-到站时间。
第4步:将每个小组内相同线路、相同站点的站内停靠时长求平均,获得每条线路不同时间段内的站内停靠时长。
计算结果如表4所示。
表3 公交线路断面运行时长参数表
表4 公交线路站内停靠时长参数表
2.3 到站时间计算
计算好断面运行时长与站内停靠时长后,便可用累加法计算每条线路的到站时间。
第1步:获取线路排班数据,得到每条线路的首站发车时间。
第2步:从线路的首站开始,对每个站点都判断到站时间与离站时间所在的时段区间,获取对应时段的断面运行时长与站内停靠时长,从第一站开始进行累加,直到最后一站,得到每个站点的到站时间与离站时间,汇总每个班次的到站时间表,从而实现公交到站预测。
示例:周一某班次,“莲前”公交站的到站时间为08:37:00,按表3、表4所得,运行时长为3 min,停靠时长为0.5 min,则可预测出下一站“莲坂外图书城”站到站时间为08:40:30。
3 公交准点率统计
3.1 准点区间设定
考虑到公交车很难把准点精确到秒,结合实际情况,本文认为准点不应该是一个点,而是一个区间,在区间内到站的都应认为是准点,所以可设置公交1 min内早到或1 min内晚到都为准点。由于不同线路不同站点的情况不相同,也应该对线路与站点的准点区间进行个性化设置。
3.2 准点率统计
为评估公交的准点到站情况及本文提出的到站预测方法的可靠性,在此提出准点率的计算方法。
第1步:根据本文提出的到站时间预测方法,预测某线路各班次的到站时间表,同时收集该线路班次中各站点的实际到站时间。
第2步:遍历每个班次每个站点,将实际到站时间与预测的到站时间进行比对,判断实际到站时间是否落在预测时间的准点区间内,如果在区间内,则判断为准点,否则为非准点。
第3步:通过第二步所收集的准点数据计算准点率。准点率=准点班次数/班次总数。
本文所提公交到站时间预测方法,旨在预测公交车辆的定点到站时间,通过采集实际到站时间数据,根据以上所述三个步骤进行的准点率统计,便可校验该方法的可靠性。
4 结 语
本文基于公交GPS轨迹数据,在公交专用道设立的背景下,提出了公交车辆准点到站时间的预测方法,并提出了公交准点到站可靠程度的评价体系,不仅能够根据排班准确计算每一班次的公交车辆到站时间表,而且能够在实际运营当中,评价公交准点到站的可靠程度,对于可靠程度较低的线路,可采取诸如司机提醒控速的方法提高公交准点率。本文通过日期分类与时间分割方法,从历史数据计算车辆平均运行时长,从而计算对应时段内的公交到站时间,能够更加准确地预测公交准点到站时间,减少误差。