现代数据处理在公交客流分析的应用研究
2020-09-10张礼平
张礼平
摘 要:基于公交IC卡刷卡消费记录数据,提出乘客上车站点估计模型,主要包括刷卡时间序列的聚类分析和类与站点的匹配模型。根据经纬度的坐标来计算相邻站点间的距离,并在考虑交通信号灯和道路情况的前提下依次进行公交车辆某次出行的行车时间的计算,特别针对在站点(除终点站)无人上车的情况考虑类与站点的匹配,最后分析公交线路站点处的上车客流量特征和线路满载率。
关键词:公共交通;公交客流;公交智能卡;聚类算法
中图分类号:U491.17 文献标识码:A
0 引言
智能公交系统内储存的数据资料是国外学者的重点研究对象,Pelletier等综合介绍了公交IC卡记录数据在公共交通方面详细使用情况[1];Ceder等人研究了基于公交IC据的换乘站点公交客流信息,对公交调度进行了优化[2];Jin Young Park等人将IC卡数据和GPS数据进行融合,针对不同时间段的乘客出行规律、运行速度进行研究分析[3];Dessouky等利用公交刷卡数据计算道路中路段的行驶时间,从而预测公交车辆的到站时间;Koutsopouls等采用数学规划的方法来分析乘客的刷卡数据和公交集团的运营调度信息;Bagchi等利用公交IC卡中的信息,分析乘客出行行为中的乘客周转率、乘客消费金额[4]。国内陈学武[5]等人使用统计分析的方法对公交刷卡数据展开研究,并分析乘客行为规律。李文锋将公交刷卡数据与GPS数据进行匹配,对公交客流建立多维度数学分析模型,分析公交客流特征[6]。公交系统存储的数据与传统的调查方式收集的数据相比,公交系统存储的数据更具有时效性、代表性、准确性更高、成本低。
1 估计乘客上车站点的模型
1.1 刷卡时间序列的聚类分析
由于乘客上车刷卡消费记录中刷卡时间具有不可逆性,分析乘客上車刷卡时间差序列,以公交车在最短相邻俩站点间的行车时间作为聚类分析的最小距离[7]。记某条线路的总站点数为m,站点序列为M={1,2,3,……,m},采用经纬度坐标[8]的方法计算公交车由站点i到站点i+1的距离d(i,i+1),则公交车由起点站到终点站的全程距离D:
(1-1)
假定在起点站有乘客刷卡上车开,终点站时无乘客刷卡上车。一辆公交车一次出行的全程行驶时间T:
(1-2)
其中:t1——该公交车于此趟出行时所记录的最早一个公交乘客刷卡乘车的上车时间;
tn——最晚一个公交乘客刷卡乘车的上车时间;
α——交通信号灯的影响系数,0<α<1;
δ——由最后一位乘客刷卡上车时间来给出的调整系数,δ>0。
公交车在某次出行中行驶的平均速度V是全程距离D与全程行车时间T之比,则聚类的最小距离Tmin为公交线路上相邻两个站点间的最小距离dmin与平均速度V之比。
1.2 类与站点的匹配模型
以最小距离为聚类依据,将刷卡时间序列分为n类,需要考虑相邻两类间的行驶距离Δd(k-1,k)和相邻站点间的固定距离的关系来匹配。设起点站与第一类匹配,终点站不进行匹配,进行第二类匹配时,可供匹配的站点序列为{2,3,4,……,m-1},其中有m-1-n个站点没有乘客上车,记为ΔS1,因此第二类的上车站点只能是候选站点序列{2,2+1,2+2,……,2+ΔS1}中的一个站点。计算第一类与第二类之间的行驶距离Δd(1,2),再计算起点站到其他站点的固定距离d(n1,n1+i),Δd(1,2)与d(n1,n1+i)近似时,此时站点与第二类匹配,无乘客上车的站点数量为第二类上车站点与第一类上车站点间隔的站点数。依次估计各类的上车站点,无乘客上车的站点数量满足如式1-3的规律:
(1-3)
第nk类所对应的上车站点mk的估计模型如式1-4:
(1-4)
其中:Δt(k-1,k)——最晚刷卡乘车的上车时间和紧邻后一类中最早的上车时间之间的间隔。
2 结果分析
2.1 客流量分布特征
以金华市繁忙线路K330为实例,线路分为上行和下行两个方向,其中上行共计21个站点,下行共计22个站点,发车间隔9~15分钟。对K330一个月公交IC卡刷卡消费数据进行分析,其线路客流呈现周期性变化,七天一个周期。客流曲线会出现“波峰”和“波谷”,周一至周五平均客流量为6.249 3万人,变化较为平缓;周六和周日的客流量变化较大,是客流曲线上的“波峰”。K330线路客流量时间上的分布不均衡性,客流量变化曲线有规律的波动,体现了市区的出行需求,表明市民在周末的出行比其他时间段明显增多。
2.2 满载率分析
线路晚高峰时间段客流量处于相对较高的水平,最大满载率一般都发生于早高峰时段。金华市K330路的客流高峰期出现在早上七点到九点之间,K330路在高峰时段的运营已接近饱和,高峰满载率已经到达70%以上。
3 结论
本文以公交IC卡刷卡数据作数据支撑,提出上车站点估计模型,用所提出的模型来完成客流量的统计,分析线路客流分布特征和满载率分析,客流量在时间分布上具有不均衡性和呈现周期性波动,高峰时段和非高峰时间的客流量变化特别明显。对其高峰时段采用有限措施来缓解交通问题,更加合理地安排公交调度。
参考文献:
[1]Marie-Pier Pelletier,Martin Trepanier,Catherine Morency.Smart card data use in public transit: A literature review[J].Transportation Research Part C,2011(19):557-56.
[2]Ceder,A.and tal.“Timetable synchronization for buses.”Computer-aided scheduling of public transport,N.H.M.Wilson,ed,Springer,New York,1998.
[3]Jin Young Park,Dong-Jun Kim.Use of Smart Card Data to Define Public Transit Use in Seoul,South Korea[J].Transportation Research Record: Journal of the Transportation ResearchBoard.Vo1.2063,2008:3-9.
[4]M.Bagchi,P.R.White.The potential of public transport smart card data[J].Transport Policy,2005,12:464-474.
[5]李海波,陈学武.基于公交IC卡和AVL数据的换乘行为识别方法[J].交通运输系统工程与信息,2013(06):73-79.
[6]李文锋,林艳玲,程远.基于公交IC卡与GPS数据的公交客流可视化分析[J].交通科技与经济,2018,20(05):55-59+80.
[7]胡雷芳.五种常用系统聚类分析方法及其比较[J].经济研究,2006,3(02):61-65.
[8]崔金红,王旭.Google地图算法研究及实现[J].计算机科学,2008,34(11):193-195.