基于GPS数据的公交站点区间行程时间可靠性影响因素
2015-04-24王殿海汤月华高杨斌
王殿海 汤月华 陈 茜 高杨斌 金 盛
(1浙江大学建筑工程学院, 杭州 310058)(2杭州市城乡建设委员会, 杭州 310006)(3杭州市综合交通研究中心, 杭州 310006)
基于GPS数据的公交站点区间行程时间可靠性影响因素
王殿海1汤月华1陈 茜2高杨斌3金 盛1
(1浙江大学建筑工程学院, 杭州 310058)(2杭州市城乡建设委员会, 杭州 310006)(3杭州市综合交通研究中心, 杭州 310006)
为提高公交行程时间预测与信息发布的准确性,借助显著性分析确定影响可靠性预测的主要因素.首先,基于公交GPS数据,采用地图匹配算法建立站点区间行程时间计算方法;其次,针对11组不同路段站点之间的区间行程时间数据,通过拟合优度检验筛选最佳分布模型,并利用最大似然估计获取最优分布模型参数;最后,建立公交行程时间可靠性评价指标体系,分析交通条件、道路条件、采样间隔与行程时间波动指数、延误指数的相关关系.结果表明:三元高斯混合分布模型能以100%的接受率最优地拟合公交行程时间数据,站点区间长度、公交小时流量、采样间隔与行程时间可靠性存在相关关系,而交叉口相对位置则为非关键影响因素.
公交;行程时间可靠性;高斯混合分布模型;波动指数;延误指数;影响因素
公交站点区间行程时间可靠性是进行公交行程时间预测、评价公交运行准点率与服务水平的重要指标之一.由于我国城市道路交通环境复杂,公交车辆运行受到非机动车、行人、交通信号、路段出入口车辆等诸多因素的干扰,公交行程时间可靠性较低,严重制约了公共交通服务水平的提升.因此,针对公交行程时间可靠性影响因素的研究具有重要的理论与现实意义.
国内外学者对于公交站点行程时间的研究多数是针对公交行程时间分布与预测的.公交行程时间分布研究是根据数据样本拟合某种分布类型,获得分布参数,进而得到行程时间的有效值[1].通常影响行程时间分布的主要因素可分为道路因素、路段交通环境因素、车辆因素、突发因素等.公交行程时间预测方法的研究主要包括传统数学回归方法、现代科学人工智能方法、交通仿真方法、卡尔曼滤波方法等[2-4],多数从宏观角度对公交线路和线网进行研究,并没有考虑路段条件、行人过街和交叉口的交通状况等因素对公交行程时间的影响.而对行程时间可靠性的研究主要侧重于机动车行程时间的研究[5-7],并未突出公交车的运行特性.
站点区间运行时间可靠性是指在一定的公交服务水平下,常规公交在站点区间内的运行时间保持一致性的概率.本文以此为研究对象,通过对行程时间分布进行拟合,获取公交行程时间分布模型参数,进而建立行程时间可靠性的计算模型.根据实测数据定量分析交通条件、道路条件及采样间隔等因素对公交行程时间可靠性指标的影响,为公交行程时间预测与信息发布奠定理论依据.
1 基于GPS数据的公交行程时间获取
1.1 公交站点区间行程时间
公交站点区间行程时间是指公交车辆从上游站点启动到相邻下游站点停车这一过程所消耗的时间(不包括站点的上下乘客时间),是相邻站点间的实际行驶时间,其计算公式如下:
Tij=A(i+1)j-Dij
(1)
式中,Tij表示编号为j的公交车从第i站到第i+1站的行程时间;A(i+1)j表示编号为j的公交车到达第i+1站的时刻;Dij表示编号为j的公交车离开第i站的时刻.
因此,公交车在站点启动以及到达站点时刻的确定是计算公交行程时间的关键.
1.2 GPS数据预处理
车辆在高速行驶时,GPS接收机可能受到较强的干扰信号而无法接受信号,导致GPS记录的经纬度值和公交车辆当前所在位置准确值存在较大差异.公交车在交叉口等待时,受外界多径效应的影响,而经纬度值是在小范围内波动的,因此造成了公交车缓慢行驶的假象.综上,修正公交车GPS数据自身误差的关键是解决位置漂移与速度漂移问题[8].
为减少公交车辆GPS数据的误差,需要对公交GPS经纬度值与GIS数据的匹配加以修正.具体步骤如下.
① 确定需要匹配的路段,在GIS中定位并标记经纬度范围.以Lk{(X1,Y1),(X2,Y2),…,(Xn,Yn)}表示路段k中n个顶点的坐标范围,其中(Xn,Yn)为GPS数据点经纬度坐标.若路段k呈直线状态,则认为Lk为矩形,采用边界4个顶点的经纬度坐标即可框定路段范围;若路段弯曲,则需更多的点,以点点之间的连线来明确路段的范围.例如,文三-保淑交叉口东西向站点区间路段呈规则矩形L1,则可将其表示为L1{(120.1332, 30.2792),(120.1331, 30.2798), (120.1398, 30.2801),(120.1398, 30.2797)}.
② 检索每一条GPS数据,若第i点的GPS数据Ai(Xi,Yi)满足如下条件:
Ai(Xi,Yi)∈Lk{(X1,Y1),(X2,Y2),…,(Xn,Yn)}
(2)
则初步认定此数据属于所选路段.例如,点A1(120.1381, 30.2798)满足此条件,则初步认为它是文三-保淑路段上的公交轨迹数据.
③ 以时间顺序排列筛选得到GPS数据,根据经纬度值的递增递减关系判定公交运行方向.
④ 选择路段的某一方向,在步骤②初步选定的数据中,按照下式依次匹配路段的GIS数据:
(3)
1.3 公交行程时间
获取公交在2个站点间的行程时间,关键是要得到公交车行驶通过路段上2个断面的时刻,而通常截取的GPS数据点(CF段)只占实际检测区间(BG段)中的一大部分,在首尾两端会出现检测盲区(如图1中的BC段和FG段).盲区长度不可忽略,需把这段时间计入行程时间之内[9].图中点B和点G为公交停靠站点,包含B,G两点的AC段和FH段时间包含公交站点停靠时间,因此不能认
图1 GPS数据点示意图
为车辆在这2段内是匀速行驶的.假设BD段和EG段是匀速行驶的,则通过插值法可以算得盲区段行驶时间.
通过与实际调查数据比对发现,当CF段长度与BG段长度比值大于0.75时,该方法准确率较高.因此,在处理过程中摒弃比值过小的路段数据.计算公式如下:
(4)
式中,tBC,tFG,tCD,tEF分别表示BC段、FG段、CD段和EF段的行程时间;lBC,lFG,lCD,lEF分别表示BC段、FG段、CD段和EF段的距离.求得的BG段的行程时间为tBC,tCF,tFG三部分之和.
1.4 数据获取
为了减少社会车辆对公交车的影响,选取的研究路段为杭州市已形成的公交专用道路段,包括文一路(古墩路至教工路段)、文二路(古翠路至上塘路段)、文三路(古翠路至上塘路段)及天目山路(古翠路至沪杭甬高速段)等共计11个路段.挑选出符合以下条件的路段数据:① 相邻站点之间有且只有一个信号交叉口;② 站点之间距离不小于250m;③ 路段有连续的双向公交专用道.数据采集时间为2013年9月13日07:00:00—14:00:00.表1列出了11个数据采集路段内基本道路情况及公交行程时间数据基本统计量.
表1 站点区间行程时间数据描述
2 公交站点区间行程时间分布模型
2.1 行程时间分布拟合
在已有行程时间分布模型的基础上,运用正态分布、对数正态分布、威布尔分布以及高斯混合分布模型[10-11]对处理后的杭州市11个路段的公交站点行程时间数据进行分布拟合,选取拟合优度最好的分布模型.具体步骤如下:
① 采用1.2节中的方法,匹配文三-保淑交叉口东西向站点区间的GPS数据记录.将行程时间数据分为高峰时段(07:00:00—09:00:00)和平峰时段(12:00:00—14:00:00).计算得到每一辆公交车辆经过该区间的行程时间,以6s为行程时间间隔,画出频率直方图,初步判定分布特征.图2为文三-保淑路站点区间行程时间的频率直方图.由图可知,行程时间分布具有明显的长尾分布特征.
(a) 高峰时段
(b) 平峰时段
② 分别运用正态分布、对数正态分布、威布尔分布以及高斯混合分布模型,对实际的行程时间数据进行分布拟合与参数估计.
③ 为了验证拟合分布的有效性,对数据拟合结果进行K-S检验.
2.2 分析讨论
表2给出了文三-保淑路区间行程时间数据拟合后的K-S检验结果.K-S检验中参数P越大,说明拟合效果越显著.决策值H=0时则接受通过检验的假设;H=1则拒绝假设.由表可知,5种分布在显著水平α=0.05时都能通过显著性检验,且二元高斯混合分布与三元高斯混合分布模型的拟合结果明显优于其他3类分布模型,尤其是对于三元高斯混合分布,P>0.9.图3给出了行程时间数据样本概率密度函数与5类分布的拟合效果图.由图可知,无论高峰时段或者平峰时段,行程时间样本数据都具有较为明显的多峰分布现象,对数正态分布、威布尔分布和正态分布这3种模型对数据的拟合结果较差.二元高斯混合分布模型的拟合结果较前3种分布模型有所改善,而三元高斯混合分布模型与实测数据具有更高的拟合优度.由于公交行程时间受到信号交叉口阻滞、路段多种干扰等因素的影响,分布具有较强的不确定性及多峰值现象.因此,采用高斯混合分布模型能够更加有效地拟合多峰值分布,同时可以较好地解释模型参数的物理意义.
表2 文三-保淑东西路段5组分布模型K-S检验
(a) 高峰时段前3类分布模型
(c) 高峰时段三元高斯混合分布模型
(d) 平峰时段前3类分布模型
(e) 平峰时段二元高斯混合分布模型
(f) 平峰时段三元高斯混合分布模型
重复2.1节中步骤,对其余10个路段的行程时间数据进行拟合分析,将5种模型分别用于样本数据,以更全面客观地选择效用最优的分布模型.表3给出了11个路段22组行程时间实测数据在5种分布模型下的K-S检验结果.通过计算可知,22组数据对对数正态分布、威布尔分布、正态分布、二元高斯混合分布、三元高斯混合分布模型拟合的接受率分别为68.18%,45.45%,18.18%,77.27%,100%,接受样本数据中P值的平均值分别为0.28,0.12,0.19,0.40,0.81.拟合优度从优至弱依此为:三元高斯混合分布、二元高斯混合分布、对数正态分布、威布尔分布以及正态分布.因此,可以认为站点区间内行程时间服从三元高斯混合分布是合理的.对于拟合优度最优的三元高斯混合分布模型,除了文二-教工交叉口东西向站点行程时间的拟合P值和文二-学院段平峰时段的拟合P值小于0.5外,其余都保持在一个较高的水平.文二路-教工路交叉口东西向站点之间距离为283m,是距离最短的一组;而文二路-学院路交叉口距离西侧站点距离过近,此类道路站点布局因素,极有可能对站点区间的行程时间分布产生影响.此外,文二-学院段平峰时段公交行程时间样本量只有60,样本量过少也可能是影响拟合优度的因素之一.
表3 5种分布模型对22组数据的K-S检验
K-S检验结果和实际拟合图形表明,三元高斯混合分布模型可以较好地拟合信号控制交叉口存在时公交车在站点区间的行程时间,进而获得不同行程时间的分布特性.根据EM算法得到的参数估计如图4所示.图中,ωi,μi分别为三元高斯混合分布模型中第i(i=1,2,3)类行程时间所占比例和均值.由图可知,在三元高斯混合分布中,第1类高斯分布的平均行程时间最大,所占比例最小;第3类高斯分布均值最小,所占比例其次;第2类高斯分布均值居中,比例最高.无论在高峰或平峰时段,过长与过短的行程时间在常规公交运行过程中均是小概率事件,多数情况下公交行程时间是稳定在一个特定区间内的.
图4 22组数据的估计参数分布图
3 行程时间可靠性的影响因素
3.1 可靠性评价指标
行程时间预测信息发布主要包括2方面内容:预测行程时间和可靠性.在以往对行程时间可靠性的研究中,评价指标大体可以分为三大类:基于偏差的评价指标、基于概率的评价指标和介于两者之间的评价指标.基于偏差的评价指标是指用行程时间或单位距离行程时间的方差、标准差或变异系数来评价行程时间的不可靠性(即波动性).基于概率的评价指标是指在一定条件下,出行者能够在一定时间内完成指定出行的概率.介于两者之间的评价指标中最具代表性的是行程时间延误指数,它反映了出行者为了以某一概率(通常取为95%)[12]准时到达目的地,需要比平均时间多花费的时间.本文选用行程时间波动性和行程时间延误指数2个指标综合研究了影响行程时间可靠性的关键因素.前者反映路段的行程时间稳定性,为管理者制定提高行程时间稳定性的管理策略提供参考,后者满足出行者希望掌握出行状况的需求,并容易被公众接受和理解.
3.1.1 行程时间波动性
数据的波动性与行程时间预测的精度相关,离散程度越小,精度相对越高.变异系数类似于级差、标准差、方差等指标,都是反映数据离散程度的绝对值.其数据大小不仅受变量值离散程度的影响,还受变量值平均水平大小的影响.可用其作为指标衡量数据的波动性,即
(5)
式中,Vk为路段k的变异系数;n为样本量;tkj为第j辆车在路段k上的行程时间;tkave为路段k上经过的所有样本车辆的平均行程时间.
三元高斯混合分布模型可表示为
(6)
式中,Gk为路段k的高斯混合分布函数;Nk为对应Gk的正态分布函数;i为高斯混合分布的分布种类;σi为第i类行程时间的标准差.
由于样本服从高斯混合分布,均值不能简单地用几何平均值代替,应该以高斯混合分布均值作为行程时间均值标准,即
(7)
3.1.2 行程时间延误指数
计划行程时间指标[13]是一种介于基于偏差和基于概率之间的评价指标.计划行程时间指标是指高峰小时内某路径行程时间的95%分位数,它反映了为保障该路径大部分出行的准时性出行者需要的时间.综合考虑稳定性和出行效率2个层面来评价公交系统,定义行程时间延误指数为95%分位数和平均值的差值,即
(8)
3.2 交通条件
如图5所示,分析11组交叉口东西向站点区间小时流量与波动性指数和延误指数的关系.随着公交小时流量的增加,延误指数有较明显的上升趋势,波动指数上升趋势平缓,两者均存在随机波动的现象. 表4为波动指数、延误指数与公交小时流量相关系数表.由表可知,从波动性角度来看,公交小时流量与行程时间可靠性指标表现为中等相关性;从延误指数角度来看,则表现为强相关性.
(a) 波动指数与公交小时流量关系图
(b) 延误指数与公交小时流量关系图
表4 波动指数、延误指数与公交小时流量相关系数表
注:R1为波动指数与公交流量的相关系数;R2为延误指数与公交流量的相关系数.
通过研究延误指数与公交小时流量关系图(见图5(b))中不同路段曲线所表现的特性可知,路段2,3,4,5,9上公交小时流量在各时段均小于80辆,曲线走势平缓.路段1,6,7,8,10的曲线在公交小时流量小于80辆时,延误指数保持在一个相对稳定的水平;当小时流量为80~90辆时,延误指数有急剧上升的趋势.因此,认为区间[80, 90]辆中存在公交小时流量的临界值,使得行程时间延误指数在超过这个临界值时出现激增的现象.在高峰时段,除了信号交叉口本身给公交行程时间带来的不确定性以外,由于公交车不具有单独的进口导向车道,高流量的社会车和公交车之间的影响亦是延误产生的原因.红灯时期交叉口进口车道社会车辆的排队长度过长,阻碍了公交专用道上的公交车在交叉口附近变道行为的有序进行;公交车之间的跟车行为同样增加了行程时间的延误.
图5(a)和(b)中不同路段的关系曲线分布在不同的坐标空间中,路段1~3对应的曲线落在图5(a)和(b)的上方位置,站点距离为283~319m;路段4~7对应的曲线落在中间位置,站点距离为328~408m;路段8~11对应的曲线落在图5(a)和(b)下方位置,站点距离为441~643m.这些数据体现了站点区间距离与延误指数存在一定的关系.
3.3 道路条件
道路条件除了站点区间长度和交叉口相对位置外,还包括道路的几何条件、容量限制和路面条件.由于本文考察的站点区间全部设有公交专用道,公交拥有专用路权,可以排除道路的几何条件、容量限制和路面条件等因素带来的影响.
3.3.1 站点区间长度
为了区分流量相异带来的影响,区分高峰时段和平峰时段以及上下行(向东行驶为上行,向西行驶为下行),分析站点区间距离与行程时间波动性以及延误指数的关系.高峰、平峰时段上下行站点区间距离与波动指数的相关系数为-0.72,-0.64,-0.63,-0.62,与延误指数的相关关系为-0.79,-0.77,-0.79,-0.78,表现为强相关性.分析图6中折线图走势,站点区间距离较短时,波动性指数和延误指数偏大,数据波动较大,此区间的行程时间可靠性相应较差;反之,则会弱化公交运行过程中其他因素带来的扰动,可靠性较高.
影响站点区间公交行程时间可靠性的因素有交叉口信号方案、上游公交站点发车频率、车车之间影响以及路段中央人行横道的影响等,其中最主要的影响因素来自于信号交叉口.站点区间距离较短时,红灯等待时间占站点区间行程时间的比例较高,等待时间的不确定性带动整个行程时间的不确定,延误指数和波动指数随之增加;若站点间距离足够长,则红灯等待时间在整个行程时间中占据的比例较小,红灯等待时间的不确定性不足以对整个区间的行程时间造成影响,延误指数和波动指数相应较小.
(a) 波动指数与站点区间距离
(b) 延误指数与站点区间距离
3.3.2 交叉口相对位置
交叉口相对站点位置定义为
(9)
式中,Lk为第k个路段交叉口的相对位置;mk为第k个路段下游站点与交叉口之间的距离;nk为第k个路段上游站点与交叉口之间的距离;Dk为第k个路段上游站点与下游交叉口之间的距离.
选取11个路段,区分高峰时段和平峰时段以及上下行,研究交叉口相对位置对行程时间可靠性的影响.上下行高峰、平峰时段波动性指数与站点相对位置的相关系数分别为-0.49,-0.30,-0.18,-0.30,延误指数与站点相对位置的相关系数为-0.26,-0.31,-0.19,-0.24,表现为弱相关或者无相关.因此,交叉口相对位置并非是影响行程时间可靠性指标的因素.
3.4 采样间隔
行程时间预测精度与信息采样间隔相关.采样间隔过短,样本采集量较少,使其不具有代表性,在不同时间段所得的预测信息可靠性波动大且不稳定;采样间隔过长,道路交通状态发生变化时,预测信息则不具有实时效应.因此,选取一个合适的采样间隔对行程时间可靠性的分析至关重要.
以文三-保淑路段行程时间为例,固定更新间隔为20min,将采样间隔划分为10个等级:30,40,50,60,70,80,90,100,110,120min,每个时段横跨60min.例如,早上07:00:00—08:00:00为第1个时段,07:20:00—08:20:00为第2个时段,以此类推.提取该路段各时间段内检测到的公交车行程时间,求得波动指数和延误指数在不同时间段内的变化(见图7).由图7可知,第1时段~第4时段的波动指数和延误指数明显高于其他10个时段,第4时段之后指数变化趋于平缓,保持在稳定水平.前4个时段的时间跨度为07:00:00—09:20:00,处于早高峰时段,这与之前验证的行程时间波动指数、延误指数与公交小时流量存在相关关系这一结论相一致.
(a) 波动指数
(b) 延误指数
此外,在不同的采样间隔下,样本的波动指数和延误指数也存在差异.相较于采样间隔大的曲线,采样间隔较小的曲线更趋向于位于坐标空间的下方,即波动指数和延误指数的均值更小,说明同一采样间隔下同一时段中的样本数据集聚性较好,可靠性较高.
计算采样间隔下2个指标的均值,得到波动指数、延误指数随采样间隔变化的关系图(见图8).由图可知,行程时间的波动指数和延误指数随着采样间隔的增大而增大,特别是在采样间隔小于70min时,增长趋势显著,而当样间隔大于70min后,增长趋势平缓.由于公交小时流量远小于社会车辆,采样间隔过小将无法保证行程时间样本的数据量,导致拟合结果不具代表性或出现过大的预测偏差,故不提倡使用更小的采样间隔.
(a) 波动指数
(b) 延误指数
4 结语
为提高公交行程时间预测的精准性,本文基于公交GPS数据,采用地图匹配算法、误差修正法和插值法获得公交行程时间数据.针对11组包含信号交叉口的站点区间公交行程时间,采用正态分布模型、对数正态分布模型、威布尔分布模型、高斯混合分布模型对数据进行拟合,并利用K-S法对模型的拟合性能进行定性测试.结果显示,由于受到信号、行人、排队的影响,简单的分布模型并不能很好地拟合数据,而三元高斯混合分布则可以较好地对数据进行描述.进一步利用最大似然估计法对模型参数进行估计和分析.在高斯混合分布的基础上,提出了波动性指数和延误指数可以表征数据的可靠性,从而影响行程时间预测的精确性,分析了可能影响上述指数的三大因素:道路几何条件(站点区间长度和交叉口相对位置)、交通状态(公交车小时流量)和采样间隔.结果显示,交叉口相对位置不是影响上述指数的关键因素,站点区间长度、公交小时流量与可靠性存在相关关系.最后,将采样间隔分为10个等级,分别对样本的波动指数和延误指数2个指标进行综合分析,探讨采样间隔对公交行程时间可靠性的影响.
本文采集的数据是在自适应交通信号配时下获取的,尚未定量分析交通信号对公交行程时间可靠性的影响.在后续研究中,将基于固定信号配时数据,定量分析交叉口进口道组织形式、交通信号配时方案、路段行人过街干扰等因素对公交行程时间可靠性的影响.
References)
[1]Wu Yong, Xing Jianping, Lu Xiaoyan, et al. Distribution model of urban bus travel time with bus lane [C]//FourthInternationalConferenceonTransportationEngineering. Chengdu, China, 2013: 302-308.
[2]张宇石.大城市常规公共交通运行可靠性的研究与实例评价[D].北京:北京交通大学交通运输学院,2008.
[3]Meng Qiang, Qu Xiaobo. Bus dwell time estimation at bus bays: a probabilistic approach [J].TransportationResearchPartC:EmergingTechnologies, 2013, 36: 61-71.
[4]Ramezani M, Geroliminis N. On the estimation of arterial route travel time distribution with Markov chains [J].TransportationResearchPartB:Methodological, 2012,46(10): 1576-1590.
[5]Clark S, Watling D. Modeling network travel time reliability under stochastic demand [J].TransportationResearchPartB:Methodological,2005, 39(2): 119-140.
[6]Chen A, Ji Z, Recker W. Travel time reliability with risk-sensitive travelers [J].JournaloftheTransportationResearchBoard, 2002, 1783: 27-33.
[7]Qu Xiaobo, Oh Erwin, Weng Jinxian, et al. Bus travel time reliability analysis: a case study [J].ProceedingsoftheICE-Transport, 2014, 167(3): 178-184.
[8]张和生, 张毅, 温慧敏,等. 利用GPS数据估计路段的平均行程时间[J]. 吉林大学学报:工学版, 2007, 37(3): 533-537. Zhang Hesheng, Zhang Yi, Wen Huimin, et al. Estimation approaches of average link travel time using GPS data[J].JournalofJilinUniversity:EngineeringandTechnologyEdition, 2007, 37(3): 533-537. (in Chinese)
[9]Gurmu Z K, Fan W. Artificial neural network travel time prediction model for buses using only GPS data [J].JournalofPublicTransportation, 2014, 17(2): 45-65.
[10]陈小鸿, 冯均佳, 杨超. 基于浮动车数据的行程时间可靠度特征研究[J]. 城市交通, 2007, 5(5): 42-45. Chen Xiaohong, Feng Junjia, Yang Chao. Research on travel time reliability characteristics based on floating car data[J].UrbanTransportofChina, 2007, 5(5): 42-45. (in Chinese)
[11]Du L, Peeta S, Kim Y H. An adaptive information fusion model to predict the short-term link travel time distribution in dynamic traffic networks [J].TransportationResearchPartB:Methodological, 2012, 46(1): 235-252.
[12]李晓莉. 不同交通流运行状态下的行程时间可靠性分析[J]. 交通运输工程与信息学报, 2013, 11(1): 79-85. Li Xiaoli. Analysis of travel time reliability under different traffic flow conditions[J].JournalofTransportationEngineeringandInformation, 2013, 11(1): 79-85. (in Chinese)
[13]Yan Yadan, Guo Xiucheng, Li Yan, et al. Bus transit travel time reliability evaluation based on automatic vehicle location data [J].JournalofSoutheastUniversity:EnglishEdition, 2012, 28(1): 100-105.
Influence factors of GPS-based bus travel time reliability between adjacent bus stations
Wang Dianhai1Tang Yuehua1Chen Qian2Gao Yangbin3Jin Sheng1
(1College of Civil Engineering and Architecture, Zhejiang University, Hangzhou 310058, China)(2Hangzhou Urban and Rural Construction Committee, Hangzhou 310006, China)(3Hangzhou Urban Comprehensive Transport Research Center, Hangzhou 310006, China)
In order to improve the accuracy of public travel time forecasting and information dissemination, the factors that affect the reliability prediction are determined by means of significance analysis. First, based on GPS(global positioning system) data of public transport, the calculation method of travel time between stations is built up by the map-matching algorithm. Then, the optimum distribution model is built up by using the test of fit goodness with 11 groups of travel time data of different road sections, and the parameters of the optimal model are obtained by the maximum likelihood estimation. Finally, the evaluation index system of the bus travel time reliability is established to analyze the correlation between the traffic condition, road condition, sampling interval and the fluctuation index as well as the delay index. The results show that the Gaussian mixture distribution model can fit the public transport travel time best with the acceptance rate of 100%. The length between two stations, public traffic per hour and sampling interval are correlative to the travel time reliability, while the location of junctions is the non-critical factor.
bus; travel time reliability; Gauss mixture model; fluctuation index; delay index; influence factors
10.3969/j.issn.1001-0505.2015.02.036
2014-04-14. 作者简介: 王殿海(1962—),男,博士,教授,博士生导师, wangdianhai@zju.edu.cn.
国家重点基础研究发展计划(973计划)资助项目(2012CB725402).
王殿海,汤月华,陈茜,等.基于GPS数据的公交站点区间行程时间可靠性影响因素[J].东南大学学报:自然科学版,2015,45(2):404-412.
10.3969/j.issn.1001-0505.2015.02.036
U491
A
1001-0505(2015)02-0404-09