APP下载

高速公路异构数据融合方法研究

2020-09-10杨奎军李玉宝陈翠娇

交通科技与管理 2020年12期
关键词:神经网络

杨奎军 李玉宝 陈翠娇

摘 要:通过神经网络模型对固定检测器采集的地点车速数据、交通流量数据和手机切换技术提取的路段行程时间数据进行时间、空间和语义的一致化处理,最后用路段平均车速对道路交通状态进行评估,以山东省济乐高速南延段为例,采用该多源数据融合模型相较于固定检测数据融合模型,得出的路段平均车速误差值减小。

关键词:交通状态;神经网络;异构数据

中图分类号:U491 文献标识码:A

0 引言

行驶在高速公路的车辆受车辆速度、时间占有率、车流量以及天气状况等客观条件的影响,极易造成高速公路的交通拥堵以及二次事故的引发,目前高速公路交通状态预测所使用的微波检测器虽然固定,但在路网分布上相对稀疏。史岩[1]采用神经网络模型对微波检测器、牌照识别检测器采集的交通流速度数据和浮动车数据进行融合。姚午开选用收费站刷卡数据和浮动车数据进行数据融合,采用极限学习机算法对高度公路交通状态进行评估。

出行者对于规划路线的选择比较注重行程时间,而行程时间的长短受多种因素的影响,手机活动数据覆盖的时空范围相对较广,可以弥补固定检测数据的不足,基于固定检测器采集的数据和手机活动数据,提出基于神經网络的高速公路异构数据融合方法。

1 数据获取及预处理

1.1 原始数据获取

以山东省济乐高速南延段的固定检测数据、手机活动数据作为研究对象。

1.2 微波检测数据预处理

1.2.1 剔除错误数据

(1)阈值法。1)地点速度为一瞬时值,是指车辆通过道路某一个断面的行驶速度,瞬时值不确定性较大,需要对速度区间加以弹性系数如式1所示:

式中:表示点速度;表示道路速度上限;视为弹性系数,一般取1.3~1.5之间。

济乐高速南延段的最高设计速度为100 km/h,所以超过150 km/h的数据即可视为错误数据。

2)交通量是对所经过车辆进行统计的最终结果,统计时间将会影响统计结果,所以加入弹性系数为,如式2所示:

式中:表示交通量;视为弹性系数,一般取1.3~1.5之间;表示道路通行能力;表示数据采集时间。

济乐高速南延段单车道道路通行能力2 400 h,弹性系数为1.5,统计时间间隔为5 min,那么在时间间隔内最大值为300辆。

(2)交通流逻辑判别法。阈值法剔除的错误数据是区间外的,但是不缺乏区间内的数据存在错误,这是由于数据传输等多方面原因造成的,这些数据也会影响道路交通状态的判断,所以需要将这些数据删除。当地点车速和交通量出现两者不同时为0,可视为错误数据,应将其剔除。

1.2.2 修补缺失数据

(1)时间序列插补法。本文选用三组历史数据,利用时间序列法进行缺失数据的插补,方法如3所示:

(3)

式中:表示缺失数据值;表示第一组历史数据值;表示第二组历史数据值;表示第三组历史数据值。

(2)空间位置插补法。空间位置插补法是依据检测器数据在空间特征上具备关联关系,具体如下:

式中,是在第个时间间隔内的时间平均车速;是第个时间间隔内的时间平均车速;是第个时间间隔内时间平均车速的方差。

1.3 手机活动数据

通行车辆载有的持卡手机,在行驶过程中经过的相邻基站可视为道路的固定检测区域,当行驶的车辆从一个切换小区行驶到下一个切换小区时,通信运营商后台能够显示车辆经过两个切换小区的时间及位置。通过标定好的切换路段长度L和时间差,对经过固定检测区域的车辆进行路段平均速度的计算。

1.4 空间匹配

选取固定检测器采集的数据与手机活动数据作为数据源,数据融合过程中数据需要对应于同一空间,数据要保证是同一路段的高速数据,否则融合达不到目的。选择山东省济乐南延高速路段的两类数据进行空间匹配。

1.5 时间匹配

不同检测器采集数据的时间间隔不同,需要将采集的数据变换成一致的时间周期,并将同一时刻的数据进行匹配。手机活动数据的传输间隔可自由设定,固定检测器采集的数据上传间隔为5 min。

2 基于神经网络的数据融合

论文以建立异构数据为输入和路段车速为输出的三层前馈BP神经网络融合模型。输入层主要负责接收不同的输入信息,隐藏层的神经元数目不固定,但数量与模型的强健性呈正相关,但同时也会增加模型训练的迭代次数。输出层是前两层经过传输、分析后形成的输出结果,即路段平均车速。

通常,输入层至隐藏层的隐节点采用函数激活,隐藏层至输出层选用线性函数激活。表达式如下:

3 模型结果对比

将周三下午15:40-16:00的行程时间作为预测对象,选用之前十周每周三的行程时间作为神经网络的训练数据,将训练数据分为事故发生事故不发生两类分别训练,将周三下午15:40-16:00的实际数据作为验证数据。选择均方根误差RMSE作为数据融合模型的评价指标,公式如下:

式中,是第k个时间间隔的融合平均速度;是第k个时间间隔的真实平均速度;N是总的时间间隔数量。

4 结论

基于神经网络的固定检测数据和手机活动数据的多源融合模型,相比较于单源数据,多源数据融合后选取的行程时间指数TTI增加了评估的稳定性以及准确性,评估结果更能反应目前的道路交通状况。在以后的研究中,可考虑更多的影响因素,提高预判系统的整体性能。

参考文献:

[1]史岩,董宏辉,张瑜,等.多源检测器的交通数据融合研究[J].道路交通与安全,2015,15(03):35-40.

猜你喜欢

神经网络
复杂神经网络下的多行为识别技术研究
基于人工智能LSTM循环神经网络的学习成绩预测
基于BP神经网络算法的成绩预测模型研究
基于CNN的轻量级神经网络单幅图像超分辨率研究
基于图像处理与卷积神经网络的零件识别
基于改进VGG-16神经网络的图像分类方法
基于 BP 神经网络的城市轨道交通客流预测研究
基于自适应神经网络的电网稳定性预测
基于遗传算法对广义神经网络的优化
基于遗传算法对广义神经网络的优化