高速公路异构数据融合方法研究
2020-09-10杨奎军李玉宝陈翠娇
杨奎军 李玉宝 陈翠娇
摘 要:通过神经网络模型对固定检测器采集的地点车速数据、交通流量数据和手机切换技术提取的路段行程时间数据进行时间、空间和语义的一致化处理,最后用路段平均车速对道路交通状态进行评估,以山东省济乐高速南延段为例,采用该多源数据融合模型相较于固定检测数据融合模型,得出的路段平均车速误差值减小。
关键词:交通状态;神经网络;异构数据
中图分类号:U491 文献标识码:A
0 引言
行驶在高速公路的车辆受车辆速度、时间占有率、车流量以及天气状况等客观条件的影响,极易造成高速公路的交通拥堵以及二次事故的引发,目前高速公路交通状态预测所使用的微波检测器虽然固定,但在路网分布上相对稀疏。史岩[1]采用神经网络模型对微波检测器、牌照识别检测器采集的交通流速度数据和浮动车数据进行融合。姚午开选用收费站刷卡数据和浮动车数据进行数据融合,采用极限学习机算法对高度公路交通状态进行评估。
出行者对于规划路线的选择比较注重行程时间,而行程时间的长短受多种因素的影响,手机活动数据覆盖的时空范围相对较广,可以弥补固定检测数据的不足,基于固定检测器采集的数据和手机活动数据,提出基于神經网络的高速公路异构数据融合方法。
1 数据获取及预处理
1.1 原始数据获取
以山东省济乐高速南延段的固定检测数据、手机活动数据作为研究对象。
1.2 微波检测数据预处理
1.2.1 剔除错误数据
(1)阈值法。1)地点速度为一瞬时值,是指车辆通过道路某一个断面的行驶速度,瞬时值不确定性较大,需要对速度区间加以弹性系数如式1所示:
式中:表示点速度;表示道路速度上限;视为弹性系数,一般取1.3~1.5之间。
济乐高速南延段的最高设计速度为100 km/h,所以超过150 km/h的数据即可视为错误数据。
2)交通量是对所经过车辆进行统计的最终结果,统计时间将会影响统计结果,所以加入弹性系数为,如式2所示:
式中:表示交通量;视为弹性系数,一般取1.3~1.5之间;表示道路通行能力;表示数据采集时间。
济乐高速南延段单车道道路通行能力2 400 h,弹性系数为1.5,统计时间间隔为5 min,那么在时间间隔内最大值为300辆。
(2)交通流逻辑判别法。阈值法剔除的错误数据是区间外的,但是不缺乏区间内的数据存在错误,这是由于数据传输等多方面原因造成的,这些数据也会影响道路交通状态的判断,所以需要将这些数据删除。当地点车速和交通量出现两者不同时为0,可视为错误数据,应将其剔除。
1.2.2 修补缺失数据
(1)时间序列插补法。本文选用三组历史数据,利用时间序列法进行缺失数据的插补,方法如3所示:
(3)
式中:表示缺失数据值;表示第一组历史数据值;表示第二组历史数据值;表示第三组历史数据值。
(2)空间位置插补法。空间位置插补法是依据检测器数据在空间特征上具备关联关系,具体如下:
式中,是在第个时间间隔内的时间平均车速;是第个时间间隔内的时间平均车速;是第个时间间隔内时间平均车速的方差。
1.3 手机活动数据
通行车辆载有的持卡手机,在行驶过程中经过的相邻基站可视为道路的固定检测区域,当行驶的车辆从一个切换小区行驶到下一个切换小区时,通信运营商后台能够显示车辆经过两个切换小区的时间及位置。通过标定好的切换路段长度L和时间差,对经过固定检测区域的车辆进行路段平均速度的计算。
1.4 空间匹配
选取固定检测器采集的数据与手机活动数据作为数据源,数据融合过程中数据需要对应于同一空间,数据要保证是同一路段的高速数据,否则融合达不到目的。选择山东省济乐南延高速路段的两类数据进行空间匹配。
1.5 时间匹配
不同检测器采集数据的时间间隔不同,需要将采集的数据变换成一致的时间周期,并将同一时刻的数据进行匹配。手机活动数据的传输间隔可自由设定,固定检测器采集的数据上传间隔为5 min。
2 基于神经网络的数据融合
论文以建立异构数据为输入和路段车速为输出的三层前馈BP神经网络融合模型。输入层主要负责接收不同的输入信息,隐藏层的神经元数目不固定,但数量与模型的强健性呈正相关,但同时也会增加模型训练的迭代次数。输出层是前两层经过传输、分析后形成的输出结果,即路段平均车速。
通常,输入层至隐藏层的隐节点采用函数激活,隐藏层至输出层选用线性函数激活。表达式如下:
3 模型结果对比
将周三下午15:40-16:00的行程时间作为预测对象,选用之前十周每周三的行程时间作为神经网络的训练数据,将训练数据分为事故发生事故不发生两类分别训练,将周三下午15:40-16:00的实际数据作为验证数据。选择均方根误差RMSE作为数据融合模型的评价指标,公式如下:
式中,是第k个时间间隔的融合平均速度;是第k个时间间隔的真实平均速度;N是总的时间间隔数量。
4 结论
基于神经网络的固定检测数据和手机活动数据的多源融合模型,相比较于单源数据,多源数据融合后选取的行程时间指数TTI增加了评估的稳定性以及准确性,评估结果更能反应目前的道路交通状况。在以后的研究中,可考虑更多的影响因素,提高预判系统的整体性能。
参考文献:
[1]史岩,董宏辉,张瑜,等.多源检测器的交通数据融合研究[J].道路交通与安全,2015,15(03):35-40.