基于SARIMA和RBF神经网络的机场货运量预测
2016-12-06邢志伟李学哲冯文星
邢志伟,李学哲,,罗 谦,冯文星,,白 楠,,潘 野,罗 沛
(1.中国民航大学航空自动化学院,天津 300300;2.中国民用航空局第二研究所,成都 610041)
基于SARIMA和RBF神经网络的机场货运量预测
邢志伟1,李学哲1,2,罗谦2,冯文星1,2,白楠1,2,潘野2,罗沛2
(1.中国民航大学航空自动化学院,天津300300;2.中国民用航空局第二研究所,成都610041)
针对机场货运量预测不能满足机场实际运行精度等缺点,提出一种季节性ARIMA和RBF神经网络集成模型预测机场货运量,该模型首先利用季节性ARIMA模型预测机场货运量线性部分,然后用RBF神经网络模型预测机场货运量非线性部分,最后把非线性部分预测结果作为线性部分预测结果的补偿,得到最终预测结果。实验结果表明,新模型可以有效结合季节性ARIMA和RBF神经网络各自的优点;相对单一季节性ARIMA模型和单一RBF神经网络模型预测精度分别提高了6.30%和3.32%,预测精度满足机场实际运行要求。
机场货运量;季节性ARIMA;RBF神经网络;集成;预测
机场货运量的预测既可以为机场发展提供导向作用,也可以为机场管理者提供决策支持[1],因此,机场货运量的预测一直是民航业研究的重点。而机场货运量作为一种时间序列数据,其预测方法随着技术的不断突破,可以分为2类:一类是传统预测方法,如经济计量法、回归分析法、灰色预测法、自回归差分移动平均(autoregressive integrating moving average, ARIMA)等[2-4],其中时间序列分析中的差分自回归移动平均相当灵活,融合了时间序列和回归分析的优点,在预测应用中最为广泛;另一类为人工智能预测模型,如BP神经网络模型、RBF神经网络模型等[5-6],其中RBF神经网络具有全局逼近能力,从根本上解决了BP神经网络的局部最优问题,而且拓扑结构紧凑,结构参数可实现分离学习,收敛速度快,是神经网络预测的首选。
为了有效利用各种模型的优点,Bates等在1969年提出了组合预测的思想,就是将几个模型通过适当方式进行组合,以期获得最优预测结果[7]。南娟[8]将经济计量法与回归分析法进行熵权法组合预测机场货运量,预测结果显示该算法具有较高的预测精度。傅培华等[9]运用Shapley值法将BP神经网络和灰色理论预测模型进行组合,并对航空货运量进行了预测,得到的预测结果更加接近实际。但目前组合模型的预测结果还不能满足机场实际运行需求的精度。
本文提出一种将线性季节性ARIMA和非线性RBF神经网络集成组合(记为SARIMA-RBF)的机场货运量预测模型,该模型科学地结合了季节性ARIMA模型和RBF神经网络模型的优点,结果表明,预测精度得到提高,并达到机场实际运行需求的精度。
1 机场货运量的SARIMA-RBF预测模型
由于机场货运具有极强的季节性特点[10],本文首先采用季节性ARIMA(即SARIMA)模型来刻画机场货运量的线性部分。SARIMA可表示为ARIMA(p,d,q)(P,D,Q)S,其中p、q、P、Q分别表示非季节性和季节性自回归、移动平均算子的最大滞后阶数,d、D分别表示非季节性和季节性差分次数,S为季节性时间序列的变化周期。
设复杂、非线性货运量时间序列为Yt,根据季节性ARIMA模型的建模方法,步骤如下:
1)根据时间序列图、自相关函数图识别其平稳性;
2)对非平稳的时间序列数据进行平稳化(差分)处理,并得到d和D的取值;
3)根据平稳后的时间序列自相关图和偏自相关图确定p、q,P、D的可能取值,采用贝叶斯信息法(BIC)确定最佳的模型阶数,检验是否具有统计意义,确定季节性ARIMA预测模型。
得到机场货运量线性预测模型,即可预测机场货运量线性部分at,则机场货运量线性部分预测残差为
然而,季节性ARIMA模型是利用差分这一纯数学的方法提取序列中的线性因素,所以在解释时间序列变化过程中,不能较好地说明影响时间序列变化的非线性因素[11],因而导致模型的预测精度偏低。为了更好地刻画影响机场货运量的非线性因素,提高模型的预测精度,用非线性RBF神经网络模型来修正SARIMA模型的预测残差,从而提高预测精度。
为加强RBF神经网络学习过程的稳定性,将一维机场货运量时间序列进行拓阶重构,转换成多维时间序列[12]。由于SARIMA模型的周期为S,为不失一般性,设最优阶数为m=S+1,得到的时间序列输入为
输出为
则机场货运量一维残差时间序列输出可表示为
RBF神经网络预测模型的训练学习重要步骤一般为:
1)选择网络输出层的径向基函数,本文选择常用的高斯径向基函数,即
则式(4)可表示为
2)确定RBF隐层中心及网络连接权值,训练网络,拟合时间序列,直到网络收敛于一定的标准。否则,可重新改变网络的初始权值甚至网络的拓扑结构,直至训练结果满意。
本文采用K-均值聚类算法确定基函数的中心,步骤如下:
网络权值选择最小二乘法直接计算
3)利用训练好的网络模型对未来时间序列进行预测。
通过训练学习得到非线性RBF神经网络残差预测模型,进而预测SARIMA模型的修正残差为et,可得到最终预测结果,即yt=at+et。
综上所述,机场货运量SARIMA和RBF神经网络集成预测模型的构建如图1所示,总结可分为以下3步:
图1 机场货运量SARIMA-RBF模型图Fig.1 SARIMA-RBF model of airport cargo
1)用SARIMA对Yt进行建模,预测结果为at,Et为机场货运量原序列与SARIMA模型预测结果的残差,即Et=Yt-at。
2)根据确定的RBF神经网络的样本集,输入拓阶重构后的机场货运量序列Y,输出为E,构造RBF神经网络预测模型,预测得到补偿SARIMA模型残差结果et。
3)将两种模型的预测结果组合成为最终的预测结果,即yt=at+et。
2 实验与结果
2.1实验数据来源
实验数据选用国内某枢纽机场2010-01~2014-07(共55个月)的真实运营数据,如表1所示。
表1 某枢纽机场55个月的货运量数据Tab.1 55 months’cargo data of one hub airport
2.2实验过程
2.2.1机场货运量的线性部分预测
将某枢纽机场货运量数据输入SPSS19.0软件中,采用其ARIMA模块,对数据进行分析,得到机场货运量时间序列图(为作图方便,将时间2010-01~2014-07编号为1-55),如图2所示。
图2 机场货运量时间序列图Fig.2 Airport cargo’s time series
由图2可看出,机场货运量从2010—2014年有明显的上升趋势,故某枢纽机场时间序列为非平稳时间序列,应对其进行差分,消除不平稳性。对于时间序列的差分次数d,通常只取0、1或2,同时通过对时间序列图和自相关图来判断参数d的阶数。所以,首先对机场货运量时间序列进行1次差分.通过1次差分后的货运量时间序列图可看到时间序列的上升趋势基本消除,时间序列呈平稳状态,故差分次数d=1,如图3所示。
图3 1次差分后的机场货运量时间序列图Fig.3 Airport cargo’s time series by one time difference
从1次差分后的货运量时间序列自相关(ACF)图可以看出,当k=12时,自相关系数有较大的峰,说明序列含有季节性,需要进一步作季节差分,如图4所示。得到差分后时间序列的自相关图,时间序列样本的自相关系数很快落入随机区域,序列趋势基本消除,但是当k=12时取值依然很大,季节性依然很明显,对其作第2次季节差分,发现季节性仍然没有完全改善,故只做1阶季节差分。故季节性差分次数D=1。
由图5和图6判断可知,其自相关函数图是截尾的,而偏自相关(PACF)函数图是拖尾的,故选择季节自回归、移动平均算子的最大滞后阶数分别为p=0、q=1、2、3。由图5和图6还可知,其季节性差分后,当k=12时,其自相关系数仍有较大的值,表明存在季节自回归和季节移动平均,故选择季节自回归、移动平均算子的最大滞后阶数分别为P=1、Q=1。
图4 1次差分后的机场货运量时间序列自相关图Fig.4 ACF by one time difference
图5 1次差分和1次季节性差分后的机场货运量时间序列自相关图Fig.5 ACF by one time difference and one time seasonal difference
图6 1次差分和1次季节性差分后的机场货运量时间序列偏自相关图Fig.6 PACF by one time difference and one time seasonal difference
经过以上的分析,初步确定有ARIMA(0,1,1)(1,1,1)12,ARIMA(0,1,2)(1,1,1)12和ARIMA(0,1,3)(1,1,1)123个模型。分别计算其贝叶斯信息法(BIC)值为-1.443、-1.352和-1.238。由贝叶斯信息法判断规则:BIC值越小,其模型可靠性越高,可知ARIMA(0,1,1)(1,1,1)12为较优模型。
应用模型ARIMA(0,1,1)(1,1,1)12对某枢纽机场货运量进行预测,预测结果如图7所示。
图7 SARIMA模型预测结果Fig.7 Cargo series forecast by SARIMA
2.2.2机场货运量的非线性部分预测
用MATLAB2014a实现RBF神经网络程序,根据SARIMA模型预测结果和机场货运量实际值得到机场货运量预测残差,作为RBF神经网络的期望输出。然后将原始机场货运量数据进行拓阶重构,延迟时间为1,则最优阶数为13;将拓阶重构后的机场货运量数据作为输入。最后,将训练数据输入到RBF神经网络中,进行学习建模,并最终预测残差序列值。
同时,用单一RBF神经网络模型对某枢纽机场货运量进行预测,预测结果如图8所示。
图8 RBF神经网络模型预测结果Fig.8 Cargo series forecast by RBF
2.2.3机场货运量最终预测结果
将SARIMA模型的预测结果和RBF神经网络模型预测的残差值结果相加,得到机场货运量的最终预测结果,如图9所示。
图9 SARIMA-RBF模型预测结果Fig.9 Cargo series forecast by SARIMA-RBF
3 实验结果与分析
为了对比分析季节性ARIMA和RBF集成预测模型与其他模型的预测精度,将单一SARIMA模型、单一RBF神经网络模型和SARIMA-RBF 3种模型对某枢纽机场2014-08~2014-10的货运量预测结果作图,如图10所示。并将3种模型预测结果的平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对误差百分比(MAPE)作为评价指标,其指标如表2和表3所示。
图10 3种模型预测结果Fig.10 Three model’s forecasting results
表2 3种模型机场货运量预测误差Tab.2 Three model’s forecasting errors
表3 3种模型的平均绝对误差百分比Tab.3 Three model’s forecasting MAPEs
从表2和表3的对比结果可知,SARIMA-RBF模型在机场货运量预测中相对单一SARIMA模型和单一RBF神经网络模型的预测结果,平均绝对误差和均方根误差都得到了量级的提升,其机场货运量预测平均绝对误差百分比相对单一SARIMA模型和单一RBF神经网络模型更是分别提升了6.30%和3.32%。对比结果表明:SARIMA-RBF模型预测综合利用了ARIMA和RBF神经网络的优势,更加全面地刻画了机场货运量的变化规律,提高了机场货运量的预测精度。
4 结语
本文提出一种基于SARIMA和RBF神经网络集成的机场货运量预测模型。实验结果表明,这种模型能有效利用ARIMA和RBF神经网络的优点,提升机场货运量的预测精度,达到机场实际运行精度要求。在今后工作中,将考虑加入影响机场货运量的实时因素,进一步提高模型的预测精度。
[1]戈锐,范幸丽,张玮.我国航空货运市场发展趋势探析[J].运输市场,2014(4):37-41.
[2]朱魏巍,许俐.上海浦东国际机场货运量预测[J].科学技术与工程,2009,9(2):509-511.
[3]CHOU T Y,LIANG G S,HAN T C.Application of fuzzy regression on air cargo volume forecast[J].Quality&Quantity,2013,47(2):897-908.
[4]徐勤兰,樊重俊,张鹏.灰色支持向量机在机场吞吐量预测中的应用[J].上海理工大学学报,2012(4):347-350.
[5]孟建军,杨泽青.基于模糊神经网络的民航物流预测研究与仿真分析[J].计算机工程与设计,2010(5):1056-1059.
[6]CHEN S C,KUO S Y,CHANG K W,et al.Improving the fore-casting accuracy of air passenger and air cargo demand:The application of back-propagation neural networks[J].Transportation Planning and Technology,2012,35(3):373-392.
[7]BATES J M,GRANGER C,W J.The combination of forecasts[J].Operational Research Quarterly,1969,20(1):451-468.
[8]南娟.基于分类法的机场货运吞吐量预测方法研究[D].南京:南京航空航天大学,2009.
[9]傅培华,鲍福光,李进.基于组合预测模型的航空货运吞吐量预测研究[J].上海管理科学,2012(2):48-52.
[10]汪泓,周慧艳.机场运营管理 [M].北京:清华大学出版社,2008: 75-89.
[11]赵鑫,郭嘉,吴建川.ARIMA模型和GM(1,1)与ARMA(p,q)组合模型在滑坡短期预报中的对比分析[J].安全与环境工程,2012 (3):24-28.
[12]陈明.MATLAB神经网络原理与实例精解[M].北京:清华大学出版社,2013:196-237.
(责任编辑:黄月)
Airport cargo forecasting based on SARIMA and RBF neural network
XING Zhiwei1,LI Xuezhe1,2,LUO Qian2,FENG Wenxing1,2,BAI Nan1,2,PAN Ye2,LUO Pei2
(1.College of Aeronautical Automation,CAUC,Tianjin 300300,China; 2.Second Institute of CAAC,Chengdu 610041,China)
The model of integrated seasonal ARIMA and RBF neural network(SARIMA-RBF)is proposed to solve the problem that airport cargo forecasting accuracy can not meet the actual operation of the airport.In the SARIMARBF,the first use of seasonal ARIMA is to forecast the linear part of airport cargo,and then to forecast the nonlinear part of airport cargo with RBF neural network,finally the nonlinear forecasting result is taken as the compensation of linear forecasting result to get the final forecasting result.Experimental results show that the new model can be combined with respective advantages of seasonal ARIMA and RBF neural network.The new model compared with single seasonal ARIMA model and single RBF neural network model forecasting accuracy are improved by 6.30%and 3.32%;and its forecasting accuracy can meet the actual operation of the airport.
airport cargo;SARIMA;RBF neural network;integrate;forecasting
V35;TP391
A
1674-5590(2016)05-0051-05
2015-10-20;
2015-12-16基金项目:国家科技支撑计划(2012BAG04B02);国家自然科学基金项目(U1233118,U1333122,U1233124);中央高校基本科研业务费专项(3122014P003)
邢志伟(1970—),男,天津人,研究员,博士,研究方向为民航装备与系统、民航智能规划与调度.