基于时空特性的高速路短时交通流预测
2017-05-17李莉杰舒勤
李莉杰++舒勤
摘要:为提高高速路短时交通流预测的准确度,建立了一种基于时空相关分析和BP神经网络的短时交通流预测方法,首先,通过分析高速路网上下游断面间的时空相关性和空间互相关性,选取与预测目标相关性较大的历史时段和相关断面。然后,将各相关断面交通流时间序列与其时间延迟序列进行重构,选取历史时段和重构后的相关断面作为BP神经网络预测模型的输入。利用四川省某高速路数据对该预测方法进行性能评价,实例证明该方法与只考虑高速路时间特性或空间特性的预测模型相比具有更高的预测精度,提高了交通流预测的实时性和可靠性。由此可见,该方法可作为高速路短时交通流预测的有效手段。
关键词:短时交通流预测;时空相关分析;BP神经网络;时间延迟
中图分类号:TP391.9 文献标识码:A 文章编号:1007-9416(2017)03-0046-05
Abstract:Aiming at the shortage of traffic flow prediction based on single cross-section, the interaction of the adjacent cross-sections in the high speed road network is studied. Then according on the analysis of the spatial-temporal characteristics,a short-time traffic flow forecasting model based on the multiple cross-sections was established .The model is extended to the prediction model based on a single cross-section,and temporal-spatial characteristics of high speed traffic flow and time delay characteristics of space interaction are considered and they determine the input dimension of the forecasting model.Finally, BP neural network is the forecasting tool to estimate the prediction results.The experimental results show that the prediction model has higher prediction accuracy compared with the traditional single cross-section prediction model and improved the real-time performance and reliability of traffic flow prediction.It is of great significance to improve the traffic efficiency of high speed road.
Key Words:short-term traffic flow forecasting; spatio-temporal correlation analysis; BP neural network ; time delay
1 引言
高速公路作為一种普遍且重要的交通方式在客货运输中发挥着重要的作用,实时有效的交通预测信息可以诱导出行者的行为、解决或缓解交通拥堵等问题[1]。由于高速公路基本路段的交通流是非间断交通流,上下游间交通状态相互影响,上下游交通流参数分布具有一定相似性和延迟性,即整个路网是一个相互关联、相互影响的系统。对交通流进行预测时,如果只考虑单一断面的交通流数据,当出现车祸、天气恶劣等偶然因素时,交通流的波动性变大,预测的准确性会降低[2]。目前国内外学者逐渐将交通流的时空关联性用于短时交通流预测中,Wu 等[3]采用时空随机效应模型对城市路网交通流量进行预测,不仅考虑了目标路段的历史交通参数,还考虑了多个参考路段的交通参数;Min等[4]利用时空关联性对实时路交通流进行预测;邱世崇等[5]提出了一种基于时空特性分析和数据融合的预测方法,利用最小二乘动态加权融合算法将基于时间序列数据预测结果和空间回归估计预测结果进行融合输出最终结果;丁闪闪等[6]提出了一种基于时空关联和 BP_ Adaboost 的短时交通参数预测方法,先利用主成分分析对多个影响因素进行预处理,再采用Adaboost 算法对 BP 神经网络进行优化。以上对路网时空相关性的考虑在一定程度上提高了预测精度,但往往忽略相邻断面空间相互作用的延迟性。
交通流短时预测预测方法主要分为两类:第1类是基于传统数理统计理论的方法,主要包括时间序列预测法、历史均值预测法、卡尔曼滤波法[7]等;第2类是基于知识发现的智能模型,主要包括神经网络预测、非参数回归预测、支持向量机[8]等。第1类预测方法优点是方法模型简单,缺点是随着预测周期的缩短,交通流序列的非线性和随机性增强,预测精度减小[9]。第2类预测方法可以充分逼近任意复杂的非线性和随机性序列[10],对短时交通预测具有很好的效果。其中,BP神经网络是应用最广泛的模型网络,具有很好的非线性逼近能力[11]。
本文首先通过时空相关分析得到与待预测断面相关性较大的历史时段和相关断面,然后对相关断面和对应的时间延迟进行重构,构建BP神经网络预测模型。与传统方法相比,该模型考虑了上下游相邻断面序列的时间延迟,融合了断面交通流的时空特性及BP神经网络的非线性拟合优势,提高了短时交通流的预测精度。
2 交通流序列的相关性度量
交通流序列包含了交通流的特征和运行规律,利用R/S分析来研究时间序列的长程相关性以及空间互相关系数来对空间断面间交通流的相互作用进行分析。
2.1 R/S分析
R/S分析主要是通过计算Hurst指数来判断时间序列是否具有长程相关性[12]。Hurst指数的计算过程如下:设时间序列为,则t个时间序列数据的均值为
(1) 由此求得累计偏差
(2)
(3)
标准差
(4)
由公式(1)-(4)算出R/S,根据式(5)通过最小二乘法算出Hurst指数。
(5)
其中Hurst指数的取值范围为。
2.2 互相关系数
互相关系数经常用于研究复杂网络各单元间的内在相互作用关系[13]。对研究断面和的交通流时间序列和,互相关系数)计算公式为:
(6)
为交通流时间序列和基于的互协方差,计算公式为:
(7)
交通流时间序列、的均值为、和标准差为、。其中:
(8)
(9)
式中:为时滞参数[14],是指两个序列之间的时间间隔,反映了两序列的产生在时间上的先后关系。高速公路基本路段上游观测点的车辆按照一定速度行驶,经过一定的空间长度后达到下游观测点,时滞参数即为交通流从上游传递到下游所涉及的时间上的延迟[15],也称为偏移时间。
3 交通流时空相关分析
时空相关分析研究空间中的对象随时间变化的关系,反映了时空数据在时间和空间上的相互作用关系,本文利用四川省高速交通流断面数据进行分析和验证。
3.1 时间相关分析
对高速路交通流时间序列进行R/S分析,采样时间为15min,采样点分别为96个(1天)、480个(5天)、960个(10天),分别计算出Hurst指数为0.69-0.88,见表1,均大于0.5小于1,说明交通流序列具有长程相关性,这表明该交通流时间序列具有分形特性,即交通流序列未来变化趋势与历史变化趋势成正相关,意味着上一时刻交通流的状态影响当前時刻和下一时刻交通流的状态,这也决定了交通流的预测要使用历史时段的数据。
3.2 空间互相关分析
高速路交通流不仅随时间变化,同时也受到空间因素的影响。现阶段对交通流空间变化特性的分析和描述认为,交通流互相关性大小是空间距离的函数,随着断面间距离的增加,空间互相关性逐渐减小,对于同一路网,两确定断面间的空间互相关性随着交通负荷的增大而增大。作为计算互相关系数大小的重要参数,时滞参数的大小同样与空间距离有关。图为研究断面流量互相关系数及时滞参数与断面间空间距离的关系。可以看出,互相关系数随空间距离增加逐渐减小,减小至一定值时趋于平稳。时滞参数在0~100Km范围内随断面间距增大而增大,间距超过100Km以后,在1~2间波动,主要原因是断面间距过大,空间相互作用的影响变小。如图1所示。
同时,两断面交通流序列的互相关系数大小也会随着时滞参数变化而变化。任选两上下游断面,从图2可以看出,两断面的互相关系数随时滞的增大而减小,在时达到最大,在时互相关系数未达到最大,主要原因是两断面间的空间距离不能使交通流变化的相互作用立即体现。
4 基于BP神经网络的交通流预测模型
根据时空相关分析结果可以找出与待测断面时间相关性较大的历史数据以及空间上相关性较大的几个相关相邻断面,但是相邻断面间的空间相互作用是非线性的,所以建立预测模型时选取BP神经网络作为预测工具。BP神经网络是一种单向传播的多层前馈网络,包括输入层、隐含层和输出层,BP神经网络的基本思想是输入信号经隐含层和输出层的非线性函数作用后输出,且通过调整输入值、输出值和权值对神经网络进行训练可以以任意精度逼近任意非线性函数。目前BP神经网络因其结构简单、可操作性强、自适应能力强等优点已被广泛用于模式识别、预测、函数拟合等领域。
4.1 预测模型的建立
该预测模型可简述为:利用BP神经网络建立待预测断面与相关断面的历史数据建立历史值与预测值的映射关系,由于时滞参数的存在,相关断面的流量序列数据要按照对应的时滞进行重构。如图3所示。
具体算法流程如下:
步骤1:确定待预测断面与相关断面
确定待预测断面,根据时空特性分析确定与待预测断面时空相关性较大的m 个相关断面以及断面与两流量序列的时滞。
步骤2:获取断面数据
获取待预测断面当前时刻t及t之前的r个时刻的交通流量以及相关断面在时刻和时刻对应的流量序列(即断面经时滞对的交通流产生影响)。
步骤3:明确训练样本与预测样本
确定训练样本和预测样本,其中,训练输入为:
训练输出为断面当前时刻t的流量值。预测输入为:
步骤4:数据预处理
对输入输出数据进行归一化处理,设和分别为为训练样本的最小值,为归一化后的交通值,通过公式(10)使训练样本转换到[0,1]区间。
(10)
步骤5:训练网络及预测
利用训练集对BP网络进行训练,训练结束后将预测集输入训练好的网络,得到预测输出后进行反归一化就可得到待预测断面t+1时刻的流量。
4.2 预测模型的实现
本文采用的是MATLAB提供的神经网络工具箱,预测模型为一个三层前向型BP神经网络,输入层和输出层的节点数分别由输入向量和输出向量的维数决定,若输入向量为m维数据,则根据Kolmogorov定理,隐含层的节点可为2m+1个。要注意的是,不同的隐含层节点数会影响预测的精度,所以我们需要找到最佳的隐含层节点数。首先,使用MATLAB中的mapminmax函数对输入输出数据归一化处理,然后使用newff函数来初始化神经网络以及traindgm算法来训练网络,训练网络时需要不断调整迭代次数或调整预测精度,直至使预测误差降到最小,最后,用sim函数对BP网络进行预测输出以及预测结果进行反归一化处理。
4.3 误差结果及分析
为了衡量神经网络预测结果,使用以下几个性能指标:
平均绝对百分误差():
(11)
均方根误差():
(12)
式中:为预测值,为真实值。
4.4 实例仿真
选择四川省某一断面为待预测断面,通过时空特性分析找出与该断面相相关性较大的4个相关断面以及分别对应的时滞。
本文选择2013年5月6日至2013年5月20日待预测断面的流量序列以及4个相关断面的流量序列为训练集,其中流量数据的采样时间为15min,选择2013年5月21日待预测断面的流量序列以及4个相关断面的流量序列为预测集。利用训练集对BP神经网络进行训练后,用预测集对待预测断面2013年5月21日的流量进行预测。其中,BP神经网络的输入层节点为8个,输出层节点为1个,隐含层节点数为18个,训练次数为10000次,训练精度为0.001,学习率为0.01。为了对比分析,分别进行基于交通流时间相关性、空间互相关性以及时空信息的BP神经网络模型进行预测,采用相同的网络結构。三种模型的预测结果如图4所示。
从图中可以看出,基于时空特性分析和BP神经网络的短时交通流预测精度明显比只基于交通流时间相关性、空间互相关性的BP神经网络模型精度高。三种预测方法的性能指标比较见表2。
5 结语
本文通过对高速路交通流时间特性和空间特性的分析,深入分析了上下游断面间空间相互作用的延迟性,构建了基于多断面的BP神经网络预测方法。通过实例仿真结果及误差分析可知,该预测模型比只采用单一断面数据的交通预测方法提高了精度,验证了基于多断面的时空预测方法的有效性。
参考文献
[1]崔立成.基于多断面信息的城市道路网交通流预测方法研究[D].大连:大连海事大学图书馆,2012.
[2]Lin S L,Huang H Q,Zhu D Q, et al. The application of space-time ARIMA model on traffic flow forecasting[C]//Machine Learning and Cybernetics, 2009 International Conference on.IEEE, 2009, 6: 3408-3412.
[3]WU Y J,CHEN F,LU C T,SMITH B L,CHEN Y.Traffic flow prediction for urban network using spatio-temporal random effects model. 91st Annual Meeting of the Transportation Research Board . 2012
[4]Min W,Wynter L.Real-time rode traffic prediction with spatio-temporal correlation[J]. Transportation Research Part C: Emerging Technologies. 2011, 19(4): 606-616.
[5]邱世崇,陆百川,马庆禄.基于时空特性分析和数据融合 的交通流预测[J].武汉理工大学学报( 信息与管理工程版),2015,37(2):156-160,178.
[6]丁闪闪,王维锋,季锦章,等.基于时空关联和BP_Adaboost的短时交通参数预测[J].公路交通科技,2016,05: 98-104.
[7]杨兆升,邴其春,周熙阳,等.基于时间序列相似性搜索的 交通流短时预测方法[J].交通信息安全,2014,06:22-26+43.
[8]姚智胜,邵春福,熊志华,等.基于主成分分析和支持向量机的道路网短时交通流量预测[J].吉林大学学报(工学版),2008,01: 48-52.
[9]郭伟,姚丹亚,付毅,等.区域交通流特征提取与交通状态评估方法研究[J].公路交通科技,2005(7):101-104.
[10]Messai N., Thomas P., El Moudni A. et al. Feed-forward and RTRL neural networks for the macroscopic traffic flow prediction and monitoring: the potential of each other[M]. 2003: 199-204.
[11]王秋平,舒勤,黄宏光.关于交通流量数据预测建模研究[J].计算机仿真,2016,02:194-197+464.
[12]贺国光,冯蔚东.基于R/S分析研究交通流的长程相关性[J].系统工程学报,2004,02:166-169.
[13]赵婷婷,张毅,周彧,等.城市路网交通流的空间相关性[J].清华大学学报:自然科学版,2011,51(3):313-317.
[14]WILLIAMS B M. Modeling and Forecasting Vehicular Traffic Flow as a Seasonal Stochastic Time Series Process[D]. Charlottesville,VA: University of Virginia 1999.
[15]陈彦光,刘继生.基于引力模型的城市空间互相关和功率谱分析——引力模型的理论证明、函数推广及应用实例[J].地理研究,2002,06:742-752.