高速公路异构数据融合方法研究_参考网

高速公路异构数据融合方法研究

2020-09-10杨奎军李玉宝陈翠娇

交通科技与管理 2020年12期

关键词：神经网络

杨奎军李玉宝陈翠娇

摘要：通过神经网络模型对固定检测器采集的地点车速数据、交通流量数据和手机切换技术提取的路段行程时间数据进行时间、空间和语义的一致化处理，最后用路段平均车速对道路交通状态进行评估，以山东省济乐高速南延段为例，采用该多源数据融合模型相较于固定检测数据融合模型，得出的路段平均车速误差值减小。

关键词：交通状态;神经网络;异构数据

中图分类号：U491 文献标识码：A

0 引言

行驶在高速公路的车辆受车辆速度、时间占有率、车流量以及天气状况等客观条件的影响，极易造成高速公路的交通拥堵以及二次事故的引发，目前高速公路交通状态预测所使用的微波检测器虽然固定，但在路网分布上相对稀疏。史岩[1]采用神经网络模型对微波检测器、牌照识别检测器采集的交通流速度数据和浮动车数据进行融合。姚午开选用收费站刷卡数据和浮动车数据进行数据融合，采用极限学习机算法对高度公路交通状态进行评估。

出行者对于规划路线的选择比较注重行程时间，而行程时间的长短受多种因素的影响，手机活动数据覆盖的时空范围相对较广，可以弥补固定检测数据的不足，基于固定检测器采集的数据和手机活动数据，提出基于神經网络的高速公路异构数据融合方法。

1 数据获取及预处理

1.1 原始数据获取

以山东省济乐高速南延段的固定检测数据、手机活动数据作为研究对象。

1.2 微波检测数据预处理

1.2.1 剔除错误数据

（1）阈值法。1）地点速度为一瞬时值，是指车辆通过道路某一个断面的行驶速度，瞬时值不确定性较大，需要对速度区间加以弹性系数如式1所示：

式中：表示点速度;表示道路速度上限;视为弹性系数，一般取1.3～1.5之间。

济乐高速南延段的最高设计速度为100 km/h，所以超过150 km/h的数据即可视为错误数据。

2）交通量是对所经过车辆进行统计的最终结果，统计时间将会影响统计结果，所以加入弹性系数为，如式2所示：

式中：表示交通量;视为弹性系数，一般取1.3～1.5之间;表示道路通行能力;表示数据采集时间。

济乐高速南延段单车道道路通行能力2 400 h，弹性系数为1.5，统计时间间隔为5 min，那么在时间间隔内最大值为300辆。

（2）交通流逻辑判别法。阈值法剔除的错误数据是区间外的，但是不缺乏区间内的数据存在错误，这是由于数据传输等多方面原因造成的，这些数据也会影响道路交通状态的判断，所以需要将这些数据删除。当地点车速和交通量出现两者不同时为0，可视为错误数据，应将其剔除。

1.2.2 修补缺失数据

（1）时间序列插补法。本文选用三组历史数据，利用时间序列法进行缺失数据的插补，方法如3所示：

（3）

式中：表示缺失数据值;表示第一组历史数据值;表示第二组历史数据值;表示第三组历史数据值。

（2）空间位置插补法。空间位置插补法是依据检测器数据在空间特征上具备关联关系，具体如下：

式中，是在第个时间间隔内的时间平均车速;是第个时间间隔内的时间平均车速;是第个时间间隔内时间平均车速的方差。

1.3 手机活动数据

通行车辆载有的持卡手机，在行驶过程中经过的相邻基站可视为道路的固定检测区域，当行驶的车辆从一个切换小区行驶到下一个切换小区时，通信运营商后台能够显示车辆经过两个切换小区的时间及位置。通过标定好的切换路段长度L和时间差，对经过固定检测区域的车辆进行路段平均速度的计算。

1.4 空间匹配

选取固定检测器采集的数据与手机活动数据作为数据源，数据融合过程中数据需要对应于同一空间，数据要保证是同一路段的高速数据，否则融合达不到目的。选择山东省济乐南延高速路段的两类数据进行空间匹配。

1.5 时间匹配

不同检测器采集数据的时间间隔不同，需要将采集的数据变换成一致的时间周期，并将同一时刻的数据进行匹配。手机活动数据的传输间隔可自由设定，固定检测器采集的数据上传间隔为5 min。

2 基于神经网络的数据融合

论文以建立异构数据为输入和路段车速为输出的三层前馈BP神经网络融合模型。输入层主要负责接收不同的输入信息，隐藏层的神经元数目不固定，但数量与模型的强健性呈正相关，但同时也会增加模型训练的迭代次数。输出层是前两层经过传输、分析后形成的输出结果，即路段平均车速。

通常，输入层至隐藏层的隐节点采用函数激活，隐藏层至输出层选用线性函数激活。表达式如下：

3 模型结果对比

将周三下午15：40-16：00的行程时间作为预测对象，选用之前十周每周三的行程时间作为神经网络的训练数据，将训练数据分为事故发生事故不发生两类分别训练，将周三下午15：40-16：00的实际数据作为验证数据。选择均方根误差RMSE作为数据融合模型的评价指标，公式如下：

式中，是第k个时间间隔的融合平均速度;是第k个时间间隔的真实平均速度;N是总的时间间隔数量。

4 结论

基于神经网络的固定检测数据和手机活动数据的多源融合模型，相比较于单源数据，多源数据融合后选取的行程时间指数TTI增加了评估的稳定性以及准确性，评估结果更能反应目前的道路交通状况。在以后的研究中，可考虑更多的影响因素，提高预判系统的整体性能。

参考文献：

[1]史岩，董宏辉，张瑜，等.多源检测器的交通数据融合研究[J].道路交通与安全，2015，15（03）：35-40.

猜你喜欢

复杂神经网络下的多行为识别技术研究

基于人工智能LSTM循环神经网络的学习成绩预测

基于BP神经网络算法的成绩预测模型研究

基于CNN的轻量级神经网络单幅图像超分辨率研究

基于图像处理与卷积神经网络的零件识别

基于改进VGG-16神经网络的图像分类方法

基于 BP 神经网络的城市轨道交通客流预测研究

基于自适应神经网络的电网稳定性预测

基于遗传算法对广义神经网络的优化

基于遗传算法对广义神经网络的优化

交通科技与管理

交通科技与管理的其它文章