APP下载

ARIMA-RBF 模型在城市轨道交通客流预测中的应用

2013-08-29何九冉四兵锋

山东科学 2013年3期
关键词:单位根客流量客流

何九冉,四兵锋

(北京交通大学交通运输学院,北京 100044)

客流量预测是城市轨道交通规划设计和运营管理的基本依据,已成为城市轨道交通建设过程中的重要环节。传统的客流预测方法中应用最广泛的是时间序列方法,该方法最早起源于1927年,直到70年代末到80年代中后期才在我国得以深入研究和应用。近年来自回归移动平均模型(ARIMA 模型)是预测领域的主要方法之一,是时间序列方法中许多基本思想的基础,姚亚夫等[1]应用ARIMA 模型进行交通流量趋势预测,得到较好的预测结果;池启水等[2]将ARIMA 模型应用于煤炭消费预测。ARIMA 方法现在已经有一套完整的建模方法,但是具有一定的局限性,它假定分析的时间序列是平稳的,对于非平稳的时间序列预测结果不能达到最好,要将其转换为平稳序列。

神经网络是一种新型的预测方法,适合复杂、非线性的条件,摆脱了建立精确数学模型的困扰,具有良好的自组织性、自适应性,有很强的学习能力、抗干扰能力等[3],目前已经建立了BP 神经网络模型、多层感知器神经网络、径向基函数神经网络、动态神经网络等神经网络模型,并且这些模型已经广泛应用于预测领域。例如,Deng 等[4]利用BP 神经网络模型对公路客运量预测,取得了较好的预测结果;Xiao 等[5]利用RBF 神经网络预测高速公路短期交通流量,预测结果显示RBF 神经网络能够较准确地预测高速交通流量;李晓俊等[6]提出了基于径向基神经网络的铁路短期客流预测模型。

近年来,许多学者考虑将不同预测方法组合在一起,建立组合预测模型从而提高预测的精度。例如Tsai等[7]提出多时序单位神经网络模型和并行组合神经网络,对铁路客运需求进行预测;Zheng 等[8]将贝叶斯法和神经网络组合对短期的高速公路交通流预测,结果表明组合模型的预测效果比单个神经网络模型更好。

城市轨道交通的客流具有一定的时序特征,即客流量随着年、月、周、日的变化而变化的规律,其中最明显的时序特征是客流以周为周期,每个周期中客流具有相似的变化趋势,由于客流易于受到多种因素的影响,每个周期内客流变化大小均不相同,具有一定的非平稳时间序列特征,因此,本文拟采用ARIMA-RBF 组合模型来描述和预测同时具有周期性和非平稳时间序列特征的客流数据,主要做了以下几个方面的工作:(1)从客流量折线图中总结客流的时序特征,选出用于预测的历史客流量数据;(2)用ARIMA 模型对客流进行预测,得到包含客流的线性特征的客流预测结果和包含非线性特征的ARIMA 预测误差;(3)用RBF 神经网络模型对ARIMA 预测误差进行预测,建立ARIMA-RBF 组合预测模型。

1 ARIMA 模型

一般来说原始的城市轨道交通客流量数据是非平稳时间系列,需要通过(d 阶)差分计算将其转化为平稳时间序列{yt}:

式中,B 被称为后移算子。

对于平稳化处理后的序列{yt}采用ARMA(p,q)模型就可以得到ARIMA(p,q)模型,设

式中,yt为t 时刻的观测值,{εt}为零均值白噪声序列,φi(i=1,2,3,…,p)和θj(j=1,2,3,…,q)为参数,p为自回归阶数,q 为移动平均阶数,φ(B)和θ(B)为算子多项式,并且

ARIMA(p,d,q)模型可以表示为:

2 RBF 神经网络模型

RBF 神经网络是一种逼近性能良好的前向神经网络,结构简洁,具有学习速度快,还存在局部极小等优点[3],RBF 神经网络具有3 层结构,即:输入层、隐含层和输出层。通常,一个具有m 个输入值、n 个隐含节点及一个输出值的RBF 神经网络结构如图1 所示。

在图中,{x1,x2,…,xn}为输入数据,输入层的神经元个数由输入数据的种类决定;F(x)为单输出,(ω1,ω2,…,ωn)为隐含层与输出层之间的连接权重。输入层节点只是将数据传递到隐含层,所以输入层节点到隐含层节点间的连接权重为1,隐含层节点i 的输出为

图1 RBF 神经网络结构图Fig.1 The architecture diagram of RBF neural network

其中,i=1,2,…,m;R 为径向基函数,Ci为第i 个神经元的径向基函数中心,σi为第i 个神经元的径向基函数的宽度参数;‖X-Ci‖为欧式范数。

隐含层径向基函数可以选用不同的函数,通常使用高斯函数作为径向基函数,即,

所以RBF 神经网络的输出可以表示为:

式中,F(x)为RBF 神经网络的输出。

3 ARIMA-RBF 组合模型

实际的客流变化不仅有线性规律也有非线性规律,ARIMA 模型和RBF 神经网络模型分别适用于线性和非线性条件下的客流预测,本文将这两种模型组合,所建立的组合模型既能把握客流序列的线性规律,又能考虑到客流序列的非线性规律。

设一个客流序列由线性和非线性组成构成,即:

图2 ARIMA-RBF 模型预测流程图Fig.2 Prediction flowchart of an ARIMA-RBF model

式中,Lt和Nt分别表示客流序列的线性和非线性组成。

首先用ARIMA 模型对客流序列中的线性组成进行预测,得到具有非线性特征的ARIMA 模型的预测误差et:

然后将et其作为RBF 神经网络模型的输入单元,则RBF 神经网络模型可以表示为:

式中,f 为神经网络拟合的非线性方程,εt为随机误差,设RBF 神经网络的预测结果为,则有:

4 实例分析

本文选取北京地铁1 号线2011年2月21日~2012年5月27日的客流量数据预测1 号线2012年5月28日~6月3日的客流量,数据由北京市地铁运营有限公司提供。下面对1 号线2011年2月21日~2012年5月27日客流量数据进行分析。

4.1 数据分析

4.1.1 北京市轨道交通客流量数据分析

本文选取北京地铁1 号线2011年2月21日~2012年5月27日的日客流量进行分析,客流的变化见图3。

由图3 可以看出,客流量基本呈现以周为周期变化的趋势。节假日因素对客流量影响较大,节假日期间客流变化与平常日客流明显不同。元旦、清明节、五一劳动节、端午节、国庆节和中秋节期间客流量较大,五一劳动节和国庆节期间客流量能达到全年最大客流量,春节期间的客流量大幅度降低,出现全年最低值。并且客流变化规律也与平常日不同,除了我国法定节假日外,3月8日妇女节、圣诞节也会出现客流较大的变化。节假日因素不仅影响着节假日期间客流的变化,也会导致节前一周的客流量发生较大的变化。

图3 1 号线2011年2月21日~2012年5月27日客流量变化趋势图Fig.3 Variation diagram of passenger flow from February 21,2011 to May 27,2012 for line 1

4.1.2 北京市轨道交通平常日客流量数据分析

本文是对2012年5月28日~6月3日平常日的客流进行预测,节假日对客流变化的影响较大,所以本文将1 号线2011年2月21日~2012年5月27日期间,受到元旦、3月8日妇女节、清明节、五一、端午节、国庆节、中秋节和春节、圣诞节等节假日影响的节假日及节前一周的客流量剔除,选取2011年2月21日~2012年5月27日期间不包含任何节假日的294个平常日,共计42 个完整周的日客流量进行分析,客流变化趋势如图4 所示。可以看到,1 号线在2011年2月21日~2012年5月27日期间平常日客流量以周为周期发生规律性的变化:每一周内周一到周四是工作日,这几天的客流量相差不是很大,周五的客流量明显变多,周六、周日的客流量又呈明显的下降趋势,且远远低于工作日的客流量;另外可以看出平常日客流量整体呈现一定的非平稳特征,下面用数学方法分析平常日客流序列的平稳性和周期性。

4.1.3 平常日客流数据平稳性和周期性分析

自相关函数图、偏自相关函数图和单位根检验是考察时间序列平稳性最重要的工具,本文利用SPSS 软件绘制2011年2月21日~2012年5月27日期间284 个平常日共计42 个完整周的客流量的自相关函数图和偏自相关函数图,见图5。

从图5 中可以看出,平常日客流的自相关函数图呈明显的周期性波动,周期长度为7,以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著地不为0,说明此时间序列为具有周期性的非平稳时间序列。

利用Eviews 软件对平常日客流进行单位根检验结果见表1。

从表1 中可以看出单位根统计量ADF=-2.142258,大于Eviews 给出的显著性水平1%~10%的ADF临界值,所以认为该平常日客流序列是非平稳的。

图4 1 号线2011年2月21日~2012年5月27日平常日客流变化趋势图Fig.4 Variation diagram of daily passenger flow from February 21,2011 to May 27,2012 for line 1

图5 1 号线2011年2月21日~2012年5月27日平常日客流自相关和偏自相关函数图Fig.5 The ACF and PACF diagrams of daily passenger flow from February 21,2011 to May 27,2012 for line 1

4.1.4 数据平稳化处理

由以上分析可知平常日客流序列是以一周为周期的非平稳时间序列,需要将客流数据进行平稳化处理,即进行周期差分。定义经过平稳化处理后的数据序列为{yt},{yt}共有277 个数据,{yt,t=1,2,…,277}的自相关函数和偏自相关函数图见图6。

表1 1 号线2011年2月21日~2012年5月27日平常日客流单位根检验结果Table 1 The unit root test results of line one ordinary day passenger flow during February 21,2011 to May 27,2012

图6 {yt}的自相关和偏自相关函数图Fig.6 The ACF and PACF diagrams of {yt}

可以看出,经过周期差分后得到的时间序列{yt,t=1,2,…,277}的自相关函数在9 阶后截尾,偏自相关函数拖尾,说明此序列已成为平稳时间序列,可以用来构建ARIMA 模型。

对平稳化处理后的时间序列{yt}进行单位根检验,结果见表2。

从表2 中可以看出{yt}的单位根统计量ADF=-4.305616,小于Eviews 给出的显著性水平1%~10%的ADF 临界值,所以认为该序列是平稳的。

通过以上分析可知,节假日因素对城市轨道交通客流的影响是较大的,不同节假日期间客流的变化规律是不同的;平常日客流虽然呈现以周为周期的变化规律,但是属于非平稳时间序列,经过周期差分处理后的序列成为平稳时间序列。

表2 {yt}单位根检验结果Table.2 The unit root test results of {yt}

4.2 实例预测

4.2.1 预测过程

本文选取2011年2月21日~2012年5月27日期间294 个平常日共计42 个完整周的客流量数据预测2012年5月28日~6月3日的客流量,预测过程见图7。

图7 ARIMA-RBF 模型客流预测流程图Fig.7 The forecasting process of ARIMA-RBF model

284 个平常日客流分为3 部分:2011年2月21日~2011年12月18日期间224 个平常日、2012年1月9日~2012年3月25日期间35 个平常日、2012年4月9日~2012年5月27日期间35 个平常日。首先利用2011年2月21日~2011年12月18日期间平常日的客流量数据构建ARIMA 模型,预测2012年1月9日~2012年6月3日平常日的客流量,由此可以得到2012年1月9日~2012年6月3日期间平常日客流量的预测值,通过和实际客流量对比,再将得到的2012年1月9日~2012年3月25日平常日的ARIMA 模型的预测误差作为RBF 神经网络的输入数据,2012年4月9日~2012年5月27日期间平常日的ARIMA 模型的预测误差作为RBF 神经网络的期望输出,从而构建RBF 神经网络来预测2012年5月28日~2012年6月3日的ARIMA 模型预测客流量的误差,将ARIMA 模型的预测值与RBF 模型预测的误差值相加得到最终的客流预测值。

4.2.2 预测结果

本文分别用ARIMA 模型、RBF 神经网络模型和ARIMA-RBF 组合预测模型对北京地铁1 号线2012年5月28日~2012年6月3日的客流量进行预测,用平均绝对相对百分比误差(MAPE)作为预测结果的评价指标,其计算公式为:

图8 三种模型预测结果的平均绝对相对百分误差Fig.8 Mean relative absolute percentage errors of the prediction results for the three models

式中,yi为1 号线路所预测的一周内第i 天客流量的真实值,^yi为预测值,三种模型所预测的一周内日客流量的平均绝对相对百分比误差如图8 所示。

从图8 中可以看出,三种模型对北京地铁1 号线2012年5月28日~6月3日的日客流量的预测结果中,ARIMA-RBF 模型预测结果的预测误差最小,平均每天的预测误差为3%,ARIMA 模型的预测误差最大,平均每天的预测误差为4%,RBF 神经网络的预测误差介于ARIMA 模型和ARIMA-RBF 模型之间,由此可见,ARIMA-RBF 模型的预测效果最好。

5 结论

本文构建了ARIMA-RBF 组合预测模型,其核心思想就是先用ARIMA 模型对客流变化中的线性规律进行拟合,再用RBF 神经网络模型对具有非线性特征的ARIMA 预测误差进行预测,从而能考虑了客流变化的非线性特征,将两个模型的预测结果相加得到客流量的预测值。预测结果表明,本文建立的预测模型能够提高预测精度,减小预测误差,还能充分考虑轨道交通平常日客流的周期性和非平稳性特征,在城市轨道交通平常日客流预测领域具有很好的适用性。

[1]姚亚夫,曹锋.基于ARIMA 的交通流量短时预测[J].交通科技与经济,2006,(3):105 -107.

[2]池启水,刘晓雪.ARIMA 模型在煤炭消费预测中的应用分析[J].能源研究与信息,2007,23(2):117 -123.

[3]高宁,张建中.MATLAB 在RBF 神经网络模型中的应用[J].农业网络信息技术,2009(2):110 -116.

[4]DENG W,LI W,YANG X H.A novel hybrid optimization algorithm of computational intelligence techniques for highway passenger volume prediction[J].Expert Systems with Applications,2011,38(4):4198 -4205.

[5]XIAO J M,WANG X H.Study on Traffic Flow Prediction Using RBF Neural Network[C]//Proceedings of the Third International Conference on Machine Learning and Cybernetics.Shanghai,2004:26 -29.

[6]李晓俊,吕晓艳,刘军.基于径向基神经网络的铁路短期客流预测[J].铁道运输与经济,2011,33(6):86 -89.

[7]TSAI T H,LEE C K,WEI C H.Neural network based temporal feature models for short-term railway passenger demand forecasting[J].Expert Systems with Applications,2009,36(2):3728 -3736.

[8]ZHENG W Z,LEE D H,SHI Q X.Short-term freeway traffic flow prediction:bayesian combined neural network approach[J].Journal of Transportation Engineering,2011,132(2):114–121.

[9]ZHANG G P.Time series forecasting using a hybrid ARIMA and neural network model[J].Neurocomputing,2003,50:159 -175.

[10]张吉刚,梁娜.基于ARIMA-ANN 的时间序列组合预测模型[J].三峡大学学报,2008,30(4):86 -88.

猜你喜欢

单位根客流量客流
客流增多
基于嵌入式系统的商场客流量统计算法
STAR模型下退势单位根检验统计量的比较
基于自学习补偿的室内定位及在客流分析中的应用
基于AFC数据的城轨站间客流量分布预测
人工免疫算法在电梯客流时段划分的应用
基于MCMC算法的贝叶斯面板单位根检验
ESTAR模型的单位根检验统计量及其功效比较
城市轨道交通运营客流数据分析缺陷及应对
从客流量推算公交出行PA矩阵的方法