APP下载

面向高速公路大数据的短时流量预测方法

2019-08-01王雪菲丁维龙

计算机应用 2019年1期
关键词:大数据

王雪菲 丁维龙

摘 要:针对高速公路传统的短时交通流预测方法适用数据规模小、全网预测效率较低、数据的时空关系被忽视等问题,提出一种结合了K近邻(KNN)模型且面向高速大数据的短时交通流预测方法。首先,对模型的K值和距离度量进行调优,利用交叉验证进行模型参数的对比实验;然后,考虑数据内在的业务时空关联,建模基于时空特性的特征向量;最后,在大数据环境下建立回归预测模型,以最优参数的模型实现预测。实验结果表明,与传统时间序列模型相比,所提方法一次可预测出全站点的流量,单次运行速度快,效率提高了77%,平均绝对百分比误差(MAPE)和绝对百分比误差中位数(MDAPE)均有明显减低,且具有良好的水平扩展性。

关键词:交通流量;短时预测;K近邻;时空数据;大数据

中图分类号: TP319

文献标志码:A

Abstract: Aiming at the problems that traditional short-time traffic flow prediction method in highway domain is suitable for small scale data, which limits the efficiency on massive data, and the spatio-temporal relationship of data is neglected, a short-term traffic flow prediction method for big data with combining K-Nearest Neighbors (KNN) in highway domain was proposed. Firstly, the K value and distance metric of model were tuned, and the model parameters were compared by using cross validation. Secondly, considering inherent spatio-temporal association of data, feature vectors based on spatio-temporal characteristics were modeled. Finally, a regression prediction model was established under big data environment, and the prediction was realized with the model of optimal parameters. The experimental results show that compared with traditional time series model, the proposed model works on all toll stations at one time, has high speed of single running and improves the efficiency by 77%. The method significantly reduces Mean Absolute Percentage Error (MAPE) and Median Absolute Percentage Error (MDAPE) and it also has good horizontal expansibility.

Key words: traffic flow; short-term forecasting; K Nearest Neighbors (KNN); spatio-temporal data; big data

0 引言

近年來,随着我国经济稳定的发展和高速公路路网建设日渐完善,高速路网的交通流量不断增长,人们的交通需求也逐渐增加,给路网的通行能力带来一定挑战。路网中交通拥堵问题带来一些社会问题,不仅增大了处理交通拥堵的花销,还给我国经济带来了一定损失,因此减少交通拥堵是我国需要解决的重大社会问题之一。对交通状况的控制和交通流诱导是智能交通系统(Intelligent Transport System, ITS)的核心研究问题,其关键在于短时交通流量预测,使之利用交通管控在路网中分散交通流,缓解交通拥堵状况,给出行者提供交通诱导信息。交通流根据预测周期可分为两类:短时预测(short-term Forecasting)和中长时预测(mid-long-term Forecasting)[1]。其中短时交通流预测指以5~30min时间跨度上的时间间隔,运用当前交通流数据信息去预测下一个5min至30min内的交通流量,本文以时间间隔取5min为例讨论短时交通流量的预测。

高速公路大数据由静态数据和动态数据组成,静态数据包含高速公路收费站位置信息、路段信息、分中心信息等;动态数据包含收费站过车信息、事故信息、道路养护信息、气象信息等。这些数据具有以下特征:1)复杂性。高速公路的交通状况逐渐复杂,采集到的相关数据多种多样。2)海量性。路网数据动态增加形成海量的高速公路大数据。3)实时性。高速公路过车数据是实时接收、秒级更新的。4)动态性。高速公路数据不但包含一些静态信息,还包括动态信息。高速公路数据不仅具备空间性质,还具有时间性质[2]。现有的高速公路交通流量预测大多是利用微波车检器测出的数据进行单站点的交通流量预测,使用高速公路收费站出入口测试到的过车数据进行交通流量预测的研究较少。高速收费站过车数据目前主要应用于收费统计和交通流量统计,其价值没有被充分挖掘。

利用高速公路大数据对高速公路收费站交通流量进行短时预测存在以下3个难点:

猜你喜欢

大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索