APP下载

基于多类型浮动车数据的高速公路路段速度修正模型*

2018-12-05孙威巍何兆成陈锐祥叶伟佳

关键词:浮动营运路段

孙威巍,何兆成,陈锐祥,叶伟佳

(1. 中山大学智能交通研究中心,广东 广州 510006;2. 广东省智能交通系统重点实验室,广东 广州 510006)

路段速度是行驶在路段上所有车辆的平均速度,是重要的交通流参数,容易被人们理解和接受。实时高速公路路段速度为高速公路交通状态评估,交通信息发布等领域提供了依据,因此获得准确的高速公路路段速度很有必要。浮动车是配备GPS和无线通信装置的普通车辆,间隔一定的时间或距离将带有车牌、速度、方向、经纬度等信息的原始GPS数据传输到交通信息中心。浮动车较线圈等检测器有覆盖范围大,成本低等优点,近年来发展迅速[1-2]。因此,利用浮动车GPS数据来估计高速公路路段速度具有巨大的应用潜力。

目前浮动车GPS数据有两个主要的特征:1)车型众多。例如,广东省浮动车根据车型可以分为8种类型,包括出租车、公交车、重型货车、旅游包车等。2)差异较大,即不同车型由于车辆特性及营运特性不同,导致不同车型间速度差异较大。例如,高速公路上的出租车由于行驶特性与家用小汽车更为接近,行驶速度常超过100 km/h,而客运车在高速公路上行驶速度一般不超过90 km/h,这两类车辆即使是在相同的交通状态下,速度仍然存在差异。

多类型浮动车数据的汇聚接入虽然能提高数据对高速路网的覆盖程度,但如何对其有效利用以实现高速公路路段整体交通流速度的估计,则主要面临以下几个问题: 1)多类型浮动车车速的一致性表征问题。即不同车型的车速与整体交通流速度的关系不一样,不加区分直接采用将较大地影响路段整体交通流速度的估计。例如,出租车是小型车,相较客货运车等大型车辆,它的速度可能更接近整体交通流的速度[3-5];2)多类型浮动车数据的时空分布不均问题,即由于不同车辆营运特性不同,其GPS数据的时空分布不一样。例如,出租车多分布于城市道路和城市周边的高速公路上,而客货运车车辆的分布则覆盖了整个路网,从而导致某些高速公路上可能只有货运车GPS数据而没有出租车GPS数据。因此,使用多类型浮动车GPS数据计算高速公路路段速度时应同时考虑不同车型之间的速度差异及时空分布差异。

目前在基于浮动车数据的速度估计方面,一般只采用一种车型数据,或者不区分浮动车的车辆类型,先估计单辆浮动车的速度,然后以路段所有浮动车速度均值作为路段速度[6]。单辆浮动车速度估计模型有:距离-时间模型,利用目标路段的第一个和最后一个GPS点,根据两GPS点的距离差除以时间差估算车辆的行驶速度[6-8];Quiroga等提出的速度-时间梯形积分模型,利用瞬时速度序列累计积分得到单辆浮动车走过的距离,除以GPS点序列首末点的时间差估算单辆浮动车的行驶速度[9];Wang等提出的地点调和平均模型,将目标路段所有车辆瞬时速度的调和平均值作为路段速度[10]等。但,只使用单一浮动车数据容易受到车型的干扰以及车辆营运特性的限制。本文考虑不同车型车辆特性及营运特征,提出了一种基于多类型浮动车数据的高速公路路段速度修正模型。首先,证明了在计算过程中可以使用出租车路段速度作为高速公路路段速度;然后,区分车型,选取合适的数据集特征,使用人工神经网络技术得到了标准速度和营运车速度的关系,输入营运车样本特征集,获得相对应的标准速度。

1 研究框架

在高速公路上运行的车辆有客运班车、旅游包车、货车[11]等,据统计客运班车、旅游包车、货车约占广州市浮动车总数的63%。因此,本文仅采用客运班车、旅游包车、货车和出租车的GPS数据(下文中客运班车与旅游包车归为客运车,货车归为货运车,统称为营运车)进行研究。基于多类型浮动车的高速公路路段速度修正模型包括浮动车数据分析和路段速度修正模型两个部分,如图1所示。而,浮动车数据分析包括出租车速度代表性分析和浮动车数据分布分析;路段速度修正模型包括营运车样本集特征分析、营运车样本特征集的选取以及人工神经网络模型。

2 浮动车数据分析

将浮动车GPS数据按照车型分类,研究不同车型之间GPS数据的差异。首先,分析出租车速度对于高速公路路段速度的代表性;然后,研究不同类型浮动车在高速公路上的速度分布以及空间分布差异。

2.1 出租车路段速度的代表性分析

使用位于广深高速上的视频点作为检测器,采集交通流速度[12](交通流速度指道路上所有车辆的平均速度,包括出租车,营运车及私家车等车辆即高速公路路段速度)。采集广深高速上出租车的GPS数据,通过距离-时间模型得到出租车的行驶速度,进一步得到出租车的路段速度,验证该速度与交通流速度的关系。实验时间为2014年3月7日8:00至3月8日00:00,广深高速全程保持顺畅交通状态。

图1 路段速度修正模型的框架图Fig.1 Research framework of link speed correction model

采用假设性检验分析的方式来验证交通流速度与出租车路段速度的关系。原假设为出租车速度与交通流速度差异不明显,备选假设为出租车速度与交通流速度差异明显,显著性水平为0.05。检验结果如表1所示,组间均方误差远小于组内均方误差,P值为0.637,远大于显著性水平,因此接受原假设。出租车路段速度与交通流速度差异不明显,能够较好的反映高速公路路段运行情况,在计算中可以使用出租车路段速度作为高速公路路段速度。因此,本文在后面的研究中将出租车路段速度看作标准速度。

表1 假设性检验结果Table 1 Results of hypothetical test

2.2 浮动车数据分布分析

2.2.1 浮动车速度分布分析 以某一天全天24 h高速公路上的浮动车原始数据为分析对象,剔除了速度为0的数据,统计原始浮动车GPS数据的分布情况,分析不同车型的速度差异。不同车型的速度分布情况如图2-4所示,横坐标为速度,纵坐标为速度对应的数据量,已对数据量做对数化处理。在图中,某些速度的数据量会突然增加,这是因为浮动车的GPS设备在车速达到某些值的时候会额外传回一条记录。

图2 非零速的数据分布情况(出租车)Fig.2 Non-zero speed distribution (Taxi)

图3 非零速数据的速度分布情况(货运车)Fig.3 Non-zero speed distribution (truck)

图4 非零速数据的速度分布情况(客运车)Fig.4 Non-zero speed distribution (bus)

从图中可以发现,三种车辆的速度在达到40 km/h之前相对来说分布比较均匀,而出租车的速度主要集中在80~105 km/h;货运车速度主要集中在50~80 km/h;客运车速度主要集中在60~90 km/h。由此可得,在高速公路上的出租车速度整体大于高速公路上的营运车速度。

2.2.2 浮动车空间分布分析 以广州市某一天全天24 h的匹配数据为分析对象,统计每条高速公路的车辆数,以柱形图形式叠加到广东省高速公路的电子地图上,如图5-7所示。

图5 出租车GPS数据空间分布Fig.5 Spatial distribution of taxi

图6 货运车GPS数据空间分布Fig.6 Spatial distribution of truck

图7 客运车GPS数据空间分布Fig.7 Spatial distribution of bus

从图中可以看出,在高速公路上浮动车的空间分布极为不均匀,广州市出租车的分布主要集中在广州市及临近的高速公路,而广州市的客运车和货运车则广泛分布在广东省的高速公路。这种分布上的不均匀,使得在高速公路上经常会出现只有营运车而没有出租车的情况。

3 基于多类型浮动车数据的路段速度

修正模型

由上文可知,本文以高速公路上出租车路段速度作为标准速度,但不同车型的浮动车数据在车速分布以及空间分布上存在较大差异,在很多情况下目标高速公路上只有营运车,并没有出租车。为了在这种情况下获得相对准确的高速公路路段速度,本文提出了一种使用人工神经网络技术的基于多类型浮动车数据的高速公路路段速度修正模型。选取合适的营运车样本特征集作为神经网络的输入,相对应的标准速度作为神经网络的输出,通过训练,得到营运车数据集与标准速度的关系,从而可以在缺少出租车的高速公路上通过营运车数据得到相对应的标准速度。

3.1 营运车样本集特征分析

本文对营运车样本集从总体与部分两个层面进行了分析。将营运车样本集分为营运车样本全集SVc以及营运车时段样本集SEVc,营运车样本全集SVc表示目前拥有的全部营运车速度样本集,而时段样本集SEVc表示在特定时间段内的营运车速度样本集。按照以下的步骤,从SVc中提取营运车样本全集特征,从SEVc中提取营运车时段样本集基本特征以及营运车时段样本集速度分布特征。具体如下:1)提取营运车样本全集特征。从营运车速度样本集SVc中提取了三个特征,分别是:样本集15位速度(15%车辆的车速小于等于该数值,50位速度和85位速度依此类推)SVc,15,样本集50位速度SVc,50以及样本集85位速度SVc,85。2)提取营运车时段样本集基本特征。从营运车时段样本集SEVc中提取了五个特征,分别是:样本集平均速度SEVc,avg,样本集最大速度SEVc,max,样本集最小速度SEVc,min,单辆营运车的速度vc以及车辆类型VT,营运车车辆类型分为客运车和货运车。3)提取营运车时段样本集速度分布特征。结合营运车样本全集特征和时段样本集基本特征,提出了营运车时段样本集速度分布特征θ,该特征同时考虑了时段样本集最大速度SEVc,max以及车辆性能两个因素,表征该时刻营运车速度集与标准速度的关系。根据该关系,进一步将速度分布特征分为四类: 普遍低速,同路段的营运车速度都低于15位速度。即,SEVc,max

图8为时段样本集速度分布特征,及其与标准速度的对应情况,横坐标表示标准速度的速度区间,纵坐标表示对应该速度区间的营运车样本集θ的出现频率。

图8 标准速度与营运车时段样本集的速度分布特征Fig.8 Velocity distribution characteristics of standard speed and commercial vehicle time sample set

由图可知,速度分布特征和标准速度存在对应关系。在标准速度小于20 km/h的情况下,速度特征会出现普遍低速以及普遍中低速两种情况,且以普遍低速为主。在标准速度为20~40 km/h时,速度特征以普遍中低速为主。在标准速度为40~80 km/h时,会出现多种速度特征同时存在的情况,且在不同的标准速度区间所占比例不同;随着速度的增加,存在中高速特征的比例也在增加。在标准速度大于80 km/h时,出现的速度分布特征为存在中高速与存在高速,且以存在高速为主;随着速度的增加,该特征所占比例越大。

3.2 营运车样本特征集的选取

上文中我们提取到了9个特征,但这9个特征对于营运车速度与标准速度的关系并不一定都有明显的促进作用。因此,本文使用基于序列前向特征选择方法[13],从9个特征中选取最有效的几个特征作为速度估计模型的输入,用平均绝对相对误差作为目标函数值,特征选取过程如图9所示。最终,单辆营运车的速度vc、车辆类型VT以及营运车样本集特征θ被选择为模型的输入。

图9 特征选择过程Fig.9 Process of features selection

3.3 神经网络模型

基于特征选取,确定输入层包括单辆营运车的速度vc、车辆类型VT、营运车样本集特征θ;输出层为路段速度。网络层数为3,传递函数为对数S型转移函数,参数α决定S型函数的陡峭程度,这里α为2。图10和表2为神经网络结构和训练样本示例。在模型中,设定学习率为0.1,冲量因子为0,训练误差为10-6。

表2 训练样本示例Table 2 Examples of training samples

图10 神经网络示意图Fig.10 Schematic of neural network

3.4 基于贝叶斯网络的速度修正模型

为了对模型进行横向比较,本文同时构建了基于概率统计的贝叶斯网络模型[13-14]。基于贝叶斯网络的速度估计模型考虑了样本集特征和速度的关系,计算方法如公式1所示:

(1)

4 结果与分析

4.1 实验数据

将广州市2014年8月28日-12月18日每天7:00-20:00间23 478辆出租车以及超过50 000辆营运车的GPS作为数据源,以5 min为统计间隔。以广东省高速公路作为实验区域,一共包含112条高速,全长4 457 km。因机场高速同时包含有出租车和营运车,有足够的数据做验证,本文选择机场高速作为实验对象。以机场高速上所有营运车的速度样本作为本次实验的营运车速度样本集,所有的出租车路段速度作为出租车速度样本集,通过统计分别得出客运车和货运车的15位,50位以及85位速度。用2014年8月28日-9月30日以及10月2日-12月28日的速度作为训练数据,用2014年10月1日的数据作为验证数据。

4.2 与结果分析

2014年10月1日机场高速三元里至机场方向发生非常发性拥堵,图11给出了机场高速12 000~13 000 m路段的人工神经网络模型实验结果、标准速度以及营运车平均速度。图12给出了机场高速12 000~13 000 m路段贝叶斯网络模型实验结果、标准速度以及营运车平均速度。在这里引入两个误差分析指标,平均绝对相对误差和平均绝对误差。

(2)

(3)

图11 人工神经网络修正模型实验结果Fig.11 Results of ANN model

图12 贝叶斯网络修正模型实验结果Fig.12 Results of Bayesian network model

从图11-12和表2-3可以看出,在拥堵交通状态下,因为车辆运行受到限制,车速都比较低,所以各个模型的输出以及营运车平均速度均与标准速度相差不大,但由于总体车速比较低,导致较小的速度差异也会造成较大比例的误差;而在顺畅交通状态下,各类型车辆能较好地发挥自身车辆特性,造成营运车平均速度明显低于标准速度,神经网络模型的输出结果和贝叶斯网络模型的输出结果都更加贴近于标准速度,但贝叶斯网络模型波动较大,平均绝对误差也较大,这是因为神经网络拥有很强的非线性拟合能力,可映射任意复杂的非线性关系。而在拥堵情况下,速度都比较低,单车速度与路段速度呈线性关系,导致贝叶斯网络性能更好。

表3 拥堵交通状态下的误差分析Table 3 Error analysis in congested traffic

表4 顺畅交通状态下的误差Table 4 Error analysis in free traffic

5 结 语

在拥有多类型浮动车数据的情况下,获取一个较为准确的高速公路路段速度对于交通评估等十分重要。为此,本文提出了一种基于多类型浮动车数据的高速公路速度修正模型,并以广州机场高速的数据作为实例验证,结果表明:本文提出的这个方法较已有的基于贝叶斯网络的修正方法精度更高,稳定性更好,具有较大的实用价值。进一步的工作是继续分析不同车型的数据特征,提高修正精度。

猜你喜欢

浮动营运路段
电连接器柔性浮动工装在机械寿命中的运用
论资本账户有限开放与人民币汇率浮动管理
常虎高速公路路段拥堵治理对策探析
基于XGBOOST算法的拥堵路段短时交通流量预测
高速公路重要路段事件检测技术探讨
VRT在高速公路营运管理中的应用
大考已至:撤站后的三大营运管理痛点及应对
秋日掠影
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真