公交线路运行不稳定性画像方法及其应用
2022-05-18吴娇蓉谢金宏王宇沁
吴娇蓉 谢金宏 王宇沁†
(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.同济大学 城市交通研究院,上海 201804)
近年来,随着轨道交通、网约车、共享单车、共享汽车等多种新型交通方式的兴起和发展,城市地面常规公交的客流份额受到挤占,地面常规公交相较于其他交通方式的劣势逐渐显现出来,其中运行不稳定是被老百姓诟病的主要问题之一,主要表现在两个方面。
首先,公交运行时间不稳定,乘车总耗时难以把控;实际运行时间远高于计划运行时间,给公交日常调度带来一定困难(如图1所示的某公交线路工作日早高峰期间实际运行时间波动图)。
图1 某公交线路工作日早高峰实际运行时间与计划运行时间对比
其次,公交线路中途站点的公交车辆串车和大间隔现象常发,使得乘客在站点等车时间忽长忽短的情况时有发生(如图2所示的某公交线路早高峰的运行时间图)。从乘客期望角度而言,候车时间过长、门到门乘车时间波动较大,是乘客可能放弃公交出行的重要影响因素。而一个公交班次能否按时发车、能否准时到达线路经过的公交站点、能否在合理的运行时间区间内从起点站行驶至终点站、公交发车频率是否合理等,都会影响公交运行的稳定性。
图2 某公交线路早高峰车辆运行时间图Fig.2 Bus operation time in morning peak of a bus route
因此,公交运行稳定性综合反映了公交线路的运行时间、到站时间、中途站点乘客候车时间偏离平均值和预计值的大小。文中采用公交线路GPS和公交IC卡刷卡数据进行联合分析,开展公交线路运行不稳定性画像及公交线路分类分级研究,提出不同类别公交线路的画像标签属性,并以上海为例,选取中心城和嘉定新城共135条公交线路作为研究对象,重点对两项运行稳定性指标均“差”的线路进行深入画像,画像标签包括平均每日百公里人次、途经主干道里程比、途经公交专用道里程比、沿线人口密度、沿线POI(Point of Interest,兴趣点)密度等,并针对画像结果提出优化策略。
1 公交运行稳定性研究现状评述
现有研究分别从站点、线路等多角度开展公交运行稳定性分析。在站点层面,有学者用车头时距的变异系数作为建立评价指标的依据,考虑了实际车头时距的波动性,但是未考虑实际车头时距与计划车头时距的关系[1];也有学者采用基于概率统计的偏离计划到站时间的公交站点运行准点性静态评价指标,以概率的形式反映到站具体时刻的关系,但该方法存在时刻表与实际运行情况出现系统性偏差时指标适用性弱的问题[2- 3];部分学者选用机器学习方法进行到站时间稳定性预测,例如支持向量机模型[4- 5]、粒子群优化神经网络模型[6]、相关向量机方法[7]、小波神经网络预测模型[8- 9],但存在影响因素选取片面、数据难以获取等问题,例如有的模型仅从时间序列角度建模,而对一些重要影响因素有所忽略[10- 11]。
在线路层面,经典的分析方法是使用车辆运行时间的方差来反映整体线路的运营波动程度,但该方法存在不同线路难以横向比较的问题[12- 13];严海等[14]采用公交车头时距与发车间隔的平均绝对误差来评估全程车的可靠性;宋现敏等[15]提出了基于车头时距的行程时间波动性指标,并通过聚类算法将公交运行环境划分为不同级别的波动性;张宇石[16]从线路与站点、准点性与稳定性两组评价层次提出了3种常规公交运行稳定性评价方法,并分别在多个城市进行了实证。
综上可知,在线路层面将运行时间稳定性指标的阈值划定与实际道路运行条件相结合来进行研究的较少,因此文中拟采用线路运行时间的变异系数作为运行时间评判指标。在站点层面,主要关注乘客候车时间的不稳定性,并通过车头时距的波动来进行刻画,车头时距存在自身的稳定性、与计划发车间隔相比较的稳定性两类评判指标。车头时距自身的稳定性包括车头时距的方差、偏离平均车头时距的波动系数等指标,考虑到要与计划发车间隔相比较,文中拟采用基于偏离计划车头时距的站点波动指数的改进指标作为评价指标来反映乘客候车时间的不稳定性。
2 公交线路运行稳定性指标及计算方法
2.1 车辆运行时间波动性指标
一条线路一个班次的车辆运行时间是指该班次车辆从驶离始发站至到达终点站期间的行程时间(包括停站时间和站间行驶时间),一条公交线路在各个时间段(高峰小时或平峰)内的运行时间是否稳定可以反映其可靠性。文中使用车辆运行时间的变异系数和方差来衡量一条线路在研究时间段内的运行时间波动性,表达式见式(1)-(3):
(1)
(2)
(3)
2.2 中途站点乘客等待时间波动性指标
公交线路的首发站发车间隔基本遵循发车时刻表,但是中途站点前后相邻的两辆公交车辆到达的时间差往往有较大波动,因此文中定义乘客在站点i等待车辆j的等待时间为车辆j与上一辆车辆j-1到达站点i的时间之差,如式(4)所示:
ti, j=Ti, j-Ti, j-1
(4)
式中,ti, j为乘客在站点i等待车辆j的等待时间,Ti, j为车辆j到达站点i的时间。
k时段内乘客在站点i的平均等待时间定义如下:
(5)
文中建立了乘客等待时间波动指数用来与时刻表进行比较。为建立标准的发车间隔,以时刻表为基准定义标准发车间隔t0, j如下:
t0, j=T0, j-T0, j-1
(6)
式中,t0, j为车辆j与前车在起始站的时刻表上的发车间隔,T0, j为车辆j在时刻表上规定的发车时间。
乘客等待时间波动指数用于衡量乘客实际等待时间偏离时刻表的程度,其定义如式(7)和式(8)所示:
(7)
(8)
3 公交线路运行稳定性分析
3.1 研究对象描述
文中分别选取上海市中心城和嘉定新城共135条公交线路进行对比研究,其中中心城选取64条,嘉定新城选取71条。2019年,中心城7个行政区域的行政区划面积为289.4 km2,人口为687.1万人,人口密度为23 742人/km2,中心城开发强度相对成熟;嘉定新城行政区划面积为464.2 km2,人口为159.6万人,人口密度为3 438人/km2,其人口密度远低于中心城,仍处于持续发展阶段。研究对象的空间分布如图3所示。
图3 研究对象的空间分布Fig.3 Spatial distribution of research objects
3.2 数据预处理
研究所用数据为2019年6月1日至2019年6月30日的上海市公交IC卡数据和GPS数据,其中每日IC卡数据量在400万条左右,GPS数据量在110万条左右。基于Python完成了数据清洗、匹配等数据预处理工作,实现了对刷卡时间异常、刷卡编号缺失的IC卡数据及经纬度异常、时间记录异常的GPS数据的剔除和修复。数据预处理过程如图4所示。
图4 公交IC卡与GPS数据预处理流程Fig.4 Preprocessing process of bus IC card and GPS data
在此基础上,结合公交IC卡数据、公交GPS数据、公交车辆信息数据、公交站点信息数据这4种数据源进行关联判断,从而实现IC卡数据的上车站点判断(如图5所示),最终IC卡数据的匹配率在70%以上。
图5 公交IC卡数据与上车站点的匹配流程Fig.5 Matching process of bus IC card data and pick-up sites
3.3 公交线路运行稳定性分级方法
为了凸显不稳定线路的数据表现,车辆运行时间波动性指标和中途站点乘客等待时间波动性指标均取每条线路上下行的最大值。取工作日数据,分别计算出每条线路的车辆运行时间波动指数和乘客等待时间波动指数,根据不同指数累计分布曲线的拐点确定临界值,从而进行稳定性分级,如图6-9所示。
图6 中心城公交线路的车辆运行时间波动指数累计分布曲线
图7 中心城公交线路中途站点的乘客等待时间波动指数累计分布曲线
图8 嘉定新城公交线路的车辆运行时间波动指数累计分布曲线
图9 嘉定新城公交线路中途站点的乘客等待时间波动指数累计分布曲线
中心城和嘉定新城的两类指标临界值如表1所示,根据临界值将公交线路稳定性区分为好、差两个等级。
表1 中心城和嘉定新城的两类指标的临界值
3.4 公交线路分类结果
中心城和嘉定新城的4类线路分类结果如表2所示。中心城和嘉定新城中,运行时间稳定性、中途站点乘客等待时间稳定性两项指标均“好”的线路占比均为56.3%,两项指标均“差”的线路占比分别为9.4%和11.3%。虽然中心城和嘉定新城在上海所处的空间区位不同,但运行稳定和最不稳定的线路占比却是基本相同的。两项指标一“好”一“差”的线路分类结果有一定差异,运行时间稳定性好、中途站点乘客等待时间稳定性差的线路在中心城的占比为18.8%,高于嘉定新城的12.7%;运行时间稳定性差、中途站点乘客等待时间稳定性好的线路在中心城的占比为15.6%,低于嘉定新城的19.7%。这表明,中心城公交线路运行时间稳定性略好于嘉定新城,嘉定新城中途站点乘客等待时间稳定性略好于中心城。
表2 4类线路分类结果Table 2 Classification results of 4 types of routes
4 公交线路运行不稳定性画像及其应用
4.1 分类公交线路画像
对表2的4种运行稳定性分类线路,进一步选用线路长度、站间距、平均每日百公里人次为画像标签进行分析,指标统计结果见表3。
表3 中心城和嘉定新城的4类线路画像结果
由表3可以得出三方面结论。
1)中心城与嘉定新城相比,4类线路表现出的基本特点是:中心城的平均线路长度较短,平均站间距较小,平均每日百公里人次较多。
2)比较线路分类1、2、3,运行时间稳定性和中途站点乘客等待时间稳定性两个指标均“好”的线路分类1,其平均线路长度适中,平均站间距略大,平均每日百公里人次高于线路分类2和3,即能吸引较多公交乘客。线路分类3的运行时间稳定性差,平均每日百公里人次为3类线路中最低。可见,运行时间稳定性好是吸引乘客的主要因素。
3)运行时间稳定性和中途站点乘客等待时间稳定性两个指标均“差”的线路分类4,其乘客乘车体验较差,但是该类线路的平均每日百公里人次高于线路分类2和3,说明该类线路有一定的客流基础,如果能够进行运行稳定性改善,将能增加潜在客流。
结合几类线路的运行稳定性及客流情况,发现线路分类4的客流需求偏高、运行稳定性差,因而兼备优化提升的预期效益和潜在空间。
4.2 两项指标均“差”的第4类线路的二次画像
公交线路分类画像结果显示,中心城和嘉定新城的第4类线路平均每日百公里人次指标处于较高水平,分别达到212和195,说明此类线路存在较高客流需求。运行稳定性和中途站点乘客等待时间稳定性均较差,说明服务品质存在优化空间。服务现状差但客流需求高,是研究对象中亟需优化提升的线路群特征,因而本节针对兼具提升价值和提升空间的第4类线路进行二次深入画像,解析提升此类线路服务竞争力的关键,以期为适配性优化策略的制定提供参考。
第4类线路的空间分布如图10所示,由图可见,该类线路在中心城和嘉定新城均围绕着城市副中心呈放射状展开。
图10 第4类线路的空间分布Fig.10 Spatial distribution of category 4 route
采用线路非直线系数、途经公交专用道里程比、途经主干道里程比、沿线人口密度(定义为线路途经道路两侧500米内覆盖的人口密度)、沿线POI密度(定义为线路途经道路两侧500米内覆盖的POI密度)这5个标签进行二次画像,结果如表4、表5所示。嘉定新城的公交专用道非常少,因此在表5中未列出途经公交专用道里程比。分析表4、表5可以得出如下结论。
1)从整体水平来看,中心城线路途经主干道里程比接近于嘉定新城的两倍,沿线人口密度和沿线POI密度远高于嘉定新城。
2)中心城两项线路运行稳定性指标均“差”的线路,其沿线人口密度均值为1.5万人/km2,POI密度为327个/km2,由此解释了平均每日百公里人次高的原因。该类线路的途经公交专用道里程比为6%~40%,途径主干道里程比在40%~59%之间,除了表4的6路,其他线路的途经公交专用道里程比远低于途径主干道里程比;结合表2,中心城公交线路改善中途站的乘客等待时间稳定性的需求较为迫切。因此,利用信息技术提高该类线路的到站时间预报准确性、在主干道上再增设一些公交专用道、辅以大站车、区间车调度等运营组织手段,将有助于改善乘客等待时间稳定性指标。
表4 中心城第4类线路的画像结果Table 4 Profile results of category 4 route in the central city
表5 嘉定新城第4类线路画像结果Table 5 Profile results of category 4 route in Jiading new city
3)嘉定新城两项线路运行稳定性指标均“差”的线路,其沿线人口密度均值为5 722人/km2,高于嘉定新城的人口密度。途径主干道里程比在7%~57%之间,但是公交专用道设置较少,大部分线路非直线系数较大(均值为1.54),远高于中心城的线路非直线系数。结合表2,嘉定新城公交线路改善运行时间稳定性指标的需求更为迫切。因此,首先需要改善新城的主干道道路条件,尽可能增设公交专用道;对于嘉定3路、102路、103路、117路和127路公交线路,建议适当优化线路走向,提高途经主干道里程比;再配合大站车、放站调度等运营组织手段,来改善运行时间稳定性。
5 结语
文中聚焦站点乘客候车和全程运行时间波动性,提出公交线路运行不稳定性的分级方法。以上海为例,提出中心城和嘉定新城公交线路的运行稳定性分级阈值,并将线路分为4类。中心城和嘉定新城两项指标均“好”和两项指标均“差”的线路比例基本相同,不受空间区位影响。运行稳定性指标一“好”一“差”的线路则表现出差异性。
进一步选用线路长度、站点数、站间距、平均每日百公里人次指标对4类线路画像,发现运行时间稳定性“好”是吸引乘客的主要因素。线路运行时间稳定性和中途站点乘客等待时间稳定性两个指标均“差”的线路分类4,乘客乘车体验较差,但是该类线路的平均每日百公里人次较高,因此采用途经公交专用道里程比、途经主干道里程比、沿线人口密度、沿线POI密度、线路非直线系数指标进行二次画像,考虑到中心城、新城空间区位的差异性,针对性地提出优化运营调度、增设公交专用道、改善新城主干道等优化策略,为精准提高公交线路服务品质提供了决策支持。
文中提出的研究方法可为公交线路运行可靠性评价及运营优化、上海市中心城和嘉定新城的公交专用道设计布局等提供决策支撑。后续研究中,将按照线路类型、沿途站点类型对公交车辆运行时间波动性分区段进一步细化,研究公交运行时间及其波动性。此外,文中只收集到了2019年6月份的数据,后续研究将继续采集其他月份的数据开展公交线路运行稳定性对比分析。