APP下载

基于ARIMA模型的短时交通流预测研究

2020-01-16刘学刚张腾飞LIUXuegangZHANGTengfeiHANYin

物流科技 2019年12期
关键词:交通量交通流差分

刘学刚,张腾飞,韩 印 LIU Xuegang,ZHANG Tengfei,HAN Yin

(上海理工大学 管理学院,上海 200093)

0 引言

随着城市化进程不断推进、智能交通系统的迅猛发展,汽车保有量日益增加,道路交通拥挤已经成为制约城市发展的重要因素,仅仅依靠增加道路面积,不能有效解决交通堵塞问题,所以越来越多的学者开始研究智能交通系统用以提高道路通行能力,缓解城市的交通压力。同时,短时交通流预测是实现智能交通系统中交通诱导与控制的首要问题之一,该预测能够实现城市道路路网最大化合理利用,极大程度降低交通事故的发生概率,提高社会经济效益,因此,可靠的短时交通流预测很有必要。同时克服短时交通流预测随机性、周期性与不确定性是当下的难点与重点。自20世纪70年代以来,交通学者就开始将其他领域应用较为成熟的预测模型直接使用在短时交通流预测领域,如自回归模型(MA)、自回归移动平均模型(ARMA)等。这些模型未能有限反映出交通流的不确定性,无法克服其他外在干扰因素对交通流量的影响。由于时间跨度的缩短,使得预测的交通流受非线性干扰因素的影响较大,造成预测结果与预测精度不甚理想。随着研究的深入,为了适应交通流不确定性与非线性的特点,一种基于ARIMA模型(差分自回归移动平均模型)的短时交通流预测使用广泛。

国内外基于ARIMA模型的研究众多。1993年Kim与Hobeika将ARIMA模型应用到高速公路交通流量预测中[1-2];姚亚夫、曹锋[3]采用ARIMA方法进行交通流量趋势预测,并按照AIC准则进行模型定阶,最终通过实测数据进行验证,结果表明,ARIMA模型能够获得较好的中短期预测精度。2008年张利、施化吉等基于ARIMA模型结构的时间序列分析方法,用最小二乘法进行参数估计,同时对多个统计量进行误差分析,结果表明:该算法在应用于时变性强的短时交通流量预测时,相对于Astom算法具有更好地预测性能[4]。2017年张艳艳、刘晓佳[5]等根据已有事故资料,对事故过去发展变化的规律进行分析,参照现有水上交通条件,采用时间序列分析法中的ARIMA模型进行分析预测,对水上交通事故未来发展趋势的科学推测。2019年谢红利、赵树鹏、王浩宇[6]通过ARIMA模型对重庆市轨道交通进站客流量进行预测,同时得出其所建立的预测方法可以适用于城市轨道交通的客流预测。孙旻根据崇遵高速公路车流量的时间序列,进行了ARIMA建模的实证分析,实验中发现崇遵高速公路的出口流量序列为非平稳序列,具有一定的趋势和周期性,故利用ARIMA模型对该非平稳时间序列进行建模预测,预测效果较为合理[7]。

纵观以往的研究可以看出,尽管ARIMA模型具有波动性及不确定性,但其对于预测短时交通流仍然具有重要意义。本文首先考虑道路交通流时间序列的非平稳性特征,通过差分使数据变得平稳,并构建ARIMA( 6,1,)6模型,对上海市杨浦区大连路的短时交通流进行预测,结果表明ARIMA模型可以很好地拟合短时交通量数据,ARIMA模型在短时交通量预测中有很大应用价值。

1ARIMA理论基础

ARIMA(差分自回归移动平均模型)是一种时间序列数据预测的统计方法,其描述的是某一时间序列变量自身的统计规律性,根据历史时间序列的相关关系,揭示系统的动态结构特性及其发展规律。

1.1ARIMA模型

ARIMA(差分自回归移动平均模型)可以分为以下几类:AR(自回归模型)、MA(移动平均模型)、ARMA(自回归移动平均模型)、ARIMA(差分自回归移动平均模型)。预测思路是将预测主体随时间变化形成的序列看作是一个随机时间序列,通过若干次差分化使非平稳数据转化为平稳序列,用一定的数学模型近似描述这个随机序列[8]。这个模型一旦被识别,就可以用时间序列的现在或过去的数据来预测未来数据值。ARIMA模型在预测过程中仅考虑了时间序列的历史数据,通过发掘自身规律建立模型,提取有效信息对数据进行预测,在数据预测方面有很大的应用价值。

ARIMA(p,q,)d模型表达式为:

其中:yt是时间序列数据;p是自回归项的系数;d是差分的阶数;q是移动平均项的系数;ε是均值为0、方差为σ2的白噪声序列;B是滞后算子,定义为Bkyt=yt-k,Ø1……Øp和θ1……θq是系数。

如果数据是平稳的时间序列数据,那么d=0,方程(1)就可以简化为ARMA模型,表达式如下:

其中:yt是时间序列数据;C0是常数;p是自回归项的系数;q是移动平均项的系数,Ø1……Øp和θ1……θq;ε是均值为0、方差为σ2的白噪声序列。

1.2 ARIMA建模步骤

(1)获取时间序列数据,根据其函数图像以ADF单位根检验其方差,对序列的平稳性进行识别。对非平稳序列进行平稳化处理。直到处理后的数据的偏相关函数值以及自相关函数值无显著差别地趋于零后终止此项操作。

(2)根据时间序列识别规则,建立相应模型。若平稳序列的偏相关函数及自相关函数均是拖尾,则可使用ARIMA模型;然后对参数进行定阶与估计,判断其是否具有统计的意义。

(3)对建立的ARIMA模型参数和残差序列进行检验,同时判断残差序列是否为白噪声,即检验模型拟合是否合理。(4)通过Eviews软件对交通量数据建立ARIMA模型并对交通量进行静态预测,并对模型结果进行评价分析。

2 实证分析

2.1 数据分析及预处理

本数据选取上海市大连路2015年11月9日至12日的短时交通量数据,数据为电磁感应线圈获得,统计时间间隔为3分钟,共采取1 920个数据,见图1。为此将1 900个数据作为训练数据,留下20个数据进行预测对比分析。

从图1看出短时交通量数据Q的波动性较大,存在一定的规律性,由此大致判断该时间序列数据为非平稳数据,为此进行单位根ADF检验结果为非平稳时间序列。对于非平稳时间序列数据则需要进行差分,一阶差分后得到DQ,对差分后的数据进行单位根检验,检验结构显示t统计量小于1%置信水平下的值,即拒绝原假设存在单位根,所以一阶差分后的序列是平稳时间序列。检验结果如表1。

2.2 模型的识别与定阶

因为一阶差分后的短时交通量数据为平稳时间序列数据,即可以进行ARIMA(p,1,q)模型预测。而(p,q)的值则首先通过序列的自相关和偏自相关系数确定。

由图2的自相关系数和偏自相关系数初步判断(p,q)的值均不大于5,由此建立不同(p,q)阶数的组合进行测试,根据AIC以及SC准则选取最优组合模型得ARIMA( 5,1,4),采用最小二乘法对模型的系数进行估计,如表2所示。

图1 短时交通量数据

表1 一阶差分后时间序列ADF检验结果

图2 一阶差分序列的相关图

表 2 ARIMA( 5,1, 4)模型

模型的表达式为:

将表达式转换后为:

2.3 模型残差的检验

对 ARIMA( 5,1, )4模型的残差进行白噪声Q检验,检验结果如图3所示,残差的白噪声检验均通过显著性测试,得残差序列为白噪声序列,即时间序列中的信息被充分提取,模型拟合较好。

图3 残差的相关性检验

2.4 模型的预测及评价

通过Eviews软件对交通量数据建立ARIMA( 5,1,)4模型并对交通量DQ进行静态预测,向前20步预测得到序列的预测值,

具体预测结果见图4,模型的评价指标则采用MAPE、RMSE和MAE表示,见表3。

MAE、MAPE、RMSE的表达式:

其中:xi为交通量的实际值,x*为交通量的预测值,n为预测的步数。

通过图4看出短时交通量的拟合曲线与实际值基本走势一致,而残差也变现为平稳数据,表明模型的拟合效果较好,ARIMA模型可以进行交通量的预测。通过表3得RMSE为7.02,MAPE为26.55,MAE为5.26表明模型可以拟合短时交通量数据,但MAPE相对较大,一是因为本研究收集的数据统计时间间隔为3分钟,而短时交通量数据本身就具有很大的不确定性以及波动性导致,二是因为ARIMA模型再进行预测时只考虑时间序列本身的历史数据,没考虑外在的不确定性因素,导致模型在预测时不能较好地拟合不确定性和波动性大的数据。

3 结束语

影响短时交通量数据变化的因素有很多,本文没有考虑外因素的影响,仅分析交通量时间序列本身的历史数据,建立ARIMA( 5,1, )4模型进行短时交通量预测,采用最小二乘法对模型进行参数估计并采用静态预测法对数据进行20步预测,结果显示模型的拟合效果较好,ARIMA模型再进行短时交通量预测时有很高的实用价值,本研究也有一些不足之处需要改进,一是ARIMA模型本身只考虑自身的历史数据进行预测,但由于数据不足也导致了模型的预测精度不是很高,二是短时交通量数据本身不确定性较大,ARIMA模型不能很好地捕捉之间的规律。所以下一步的研究就是通过对ARIMA模型改进使之可以更好地预测短时交通量数据。

图4 交通量的拟合曲线

表3 模型的评价

猜你喜欢

交通量交通流差分
基于ETC门架数据的高速公路交通量转换探究
数列与差分
基于动态差法的交通量监测技术应用
高速公路补偿交通量模型研究
基于四阶段法的公路交通量预测研究
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
基于差分隐私的大数据隐私保护
具有负压力的Aw-Rascle交通流的Riemann问题
相对差分单项测距△DOR