APP下载

基于SD-ARIMA复合模型的虹桥机场旅客吞吐量预测

2019-12-10杨梦达戴晨斌冀和樊重俊

物流科技 2019年11期
关键词:预测

杨梦达 戴晨斌 冀和 樊重俊

摘要:构建SD-ARIMA(p,d,q)(sp,sd,sq)S(1)复合模型,使用剔除季节趋势后的月度客流量数据对上海虹桥机场2008年1月至2017年12月数据进行建模,以2018年1—8月虹桥机场旅客吞吐量数据作为测试集进行预测验证。结果发现:虹桥机场客流量呈现出冬季偏低的季节性波动趋势;SD-ARIMA复合模型对时间序列极端值数据更为耐受,对客运量表现出较好的拟合效果。通过时模型不同角度的性能分析,本研究构建的SD-ARIMA复合模型具备一定的有效性及优越性,可用于短期的机场客流量预测,同时对机场的运营及资源调配等方面具有一定参考价值。

关键词:SD-ARIMA复合模型;旅客吞吐量;典型季节指数;预测

中图分类号:F560.6

文献标识码:A

0引言

机场旅客吞吐量是指通过航空方式进入及离开空港区的旅客人员数,直观体现了机场的规模和旅客运送能力,同时也可以反映出机场所在地区的开放程度、文明水平和活跃水平,是衡量该地区社会发展程度与经济进步水平的一项关键指标。对民航旅客吞吐量进行预测,有助于机场提前调配运力资源,并合理高效地启用机场基础设施或设备,进而为机场运营和管理决策提供科学的依据。与大多数交通枢纽一样,虹桥机场旅客吞吐量呈现出一定幅度的季节波动。2010年,虹桥机场启用2号航站楼,第二条机场跑道随后投入运营,机场旅客吞吐量在該时间后出现质的提升。随着机场基础设施的完善和服务水平的提高,越来越多的国内乘客选择航空出行,虹桥机场的旅客吞吐量也逐年增大。2018年,上海虹桥客运量达到4364.5万人次,排在国内机场第8名。

国内学者在客流量及货运量等预测方面已取得若干成果,ARIMA模型也已被学者广泛地用于商务、金融和医疗等领域的数据预测中。Dong-wei XU等通过构建ARIMA-Kalman模型对城市交通状态的变化进行预测,经过实验发现,相比传统方法ARIMA-Kalman模型显示出了更低的误差率。李苑辉等使用ARIMA模型对三亚机场旅客吞吐量进行了预测,结果表明ARIMA模型具有较好的预测效果,平均月度误差为2.74%。张鹏与白晓分别使用ARIMA模型与不同机器学习算法如Modflow,SVR进行组合并用于预测,取得了相比单使用ARIMA模型更为精确的拟合效果。近年来随着人工智能算法的兴起,神经网络同样被广泛用于交通领域的预测中,屈拓将GM(1,1)和BPNN组合在一起对成都双流机场客运量进行预测,结果表明组合模型残差平方和为2.744,预测精度大幅优于单GM模型与单BPNN算法。此外,常用的预测模型还包括多元回归模型、灰色预测模型、时间序列与支持向量回归模型等。这些模型对于线性和非季节性数据的预测较为准确,用于非线性数据或包含了季节因素影响的时间序列而言未取得令人满意的预测效果。

综上,已有的民航旅客吞吐量预测研究对季节因素的考察略显不足,预测结果受极端值影响相对较大,且并未给出能够体现旅客吞吐量季节波动信息的典型季节指数。对此,本研究构建SD-ARIM(p,d,q)(sp'sd,sq)s(1)复合模型,以剔除季节因素后的时间序列数据为基础,对虹桥机场客流量数据建模并预测。

1SD-ARIMA复合模型

1.1季节分解模型

季节分解(Seasonal Decomposition)模型,是通过计算典型季节因子,将一个时间序列中的季节因素剔除出来。一个时间序列TCSI由长期趋势T、循环趋势c、季节影响.s以及不规则波动,互相叠加而成,剔除季节影响和不规则变动后,原始时间序列变为T@n。

季节成分一般用典型季节指数(Seasona]index)来表示,使用序列的观测值除以相应的典型季节指数后再乘上季节修正因子以消除序列的季节成分。机场各月客流量的典型季节指数,反映了该交通枢纽客流量的季节波动情况。出行淡季和旺季对机场资源的需求量不同,机场可参考典型季节指数对资源提前进行调配。

移动平均趋势剔除法为典型季节指数的常用计算方法,其算法过程为啕:

(1)计算移动平均值,由于本研究使用的是月度数据,因此采用步长为12的移动平均,随后将结果进行一次“中心化”计算,即得出“中心化移动平均值”

(cMA)。

(2)计算原始数据与中心化移动平均值的比值,随后求出各个比值的月度平均值。即得出特定季节指数。

(3)由于平均数设定为1,所以理论上12个月的均值之和应为12,但由于四舍五入问题,12个月的特定季节指数相加不一定为12。因此采用季节修正因子对特定季节指数进行调整,得出研究所用的典型季节指数。季节修正因子的公式为:

记为SD-ARIMA(p,d,q)(sp,sd,sq)s(1)。其中,SD表示使用季节分解模型剔除序列中的季节影响,自回归算法参数记为p,差分阶数记为d,移动平均算法参数记为g,ARIMA季节模型自回归算法参数记为sp,季节差分阶数记为sd,季节模型移动平均算法参数记为s口,季节周期记为s。由于本研究使用的是月度数据。因此s为12。

2虹桥机场客流量预测模型

由于本研究所用到的虹桥机场旅客吞吐量数据以月度为单位,具有一定的季节特征,因此使用SD-ARIMA(p,d,q)

2.1数据说明

本研究以虹桥机场为例,使用上海虹桥机场2008年1月至2018年8月的月度客流量作为实验数据;其中将2008年1月至2017年12月的客流量数据作为训练序列;2018年1月至8月的数据作为测试序列。并运用软件SPSS24.0做相关预处理。

2.2典型季节指数

本研究最终计算出的虹桥机场客流量1-12月典型季节指数分别为:0.942,0.881,1.021,1.027,1.033,0.983,1.060,1.043,1.007,1.077,0.989,0.940。可以看出,11月至次年2月,虹桥机场旅客吞吐量低于典型月度。3月至10月中,除6月稍低外,旅客吞吐量均高于典型月度。反映出虹桥机场客运量冬季偏低的季节趋势。

将各月旅客吞吐量原始数据除以相应的典型季节指数,得到季节分解后的时间序列数据,记为TC。相比原始序列,TC序列更为平滑,削弱了极端值的影响,将时间序列的趋势更加明显显的展现出来。接下来使用TC序列进行ARIMA建模,建模后得到的预测值乘上各月典型季节指数,得出最终的预测值。

2.3训练序列的平稳性

使用ARIMA模型必须保证序列是平稳的。通过SPSS24.0软件做序列图,发现虹桥机场旅客吞吐量呈现波动上升的趋势,并在2010年有个明显的拔高。为进一步检验序列是否达到建模要求的平稳,做出训练序列数据的自相关图进行观察,如图1所示。

由训练序列自相关图可以看出,自相关函数有明显的拖尾性。因此序列具有明显的趋势特征,需要进行差分运算,使得序列平稳。接着进行一阶差分和一阶季节性差分,消去序列的季节性趋势。经过差分后的结果如图2所示,序列图没有明显的上升下降趋势,也未显示出明显的季节性趋势,可以判断序列已经基本平稳。

序列进行差分后,进一步检验序列是否平稳并确定虹桥机场客流量预测模型的参数。现做出差分后训练序列的自相关图和偏自相关图,如图3、图4所示,序列已经可以被认为是平稳序列。

2.4模型参数的确定

首先确定差分运算的阶数,序列进行一阶差分和一阶季节性差分后已经基本平稳,且经过试验,进行二阶差分后序列的季节性差异未获得更为明显的优化,因此取出d=1,d=1,S=12。

接着做出一阶差分运算而未进行一阶季节性差分运算后序列的自相关图和偏自相关图。由于一阶差分后的自相关函数和偏自相关函数均没有超出置信区间界限,因此p和q的取值均为0。从季节差分运算后训练序列的偏自相关图可以看出有1个明显峰值,印取值为l;自相关图有2个明显峰值,sq取l或2。综上,共有两种模型参数的组合可供选择,分别为ARIMA(0,1,0)(1,1,1).s(12)以及ARIMA(0,1,0)(1,1,2)S(12)。

对2种参数组合分别进行建模,计算出相应的R方及N-BIG指数进行对比,R方越大,赤池信息准则N-BIC指数更小,则模型具有更好地拟合效果。此外,需考虑建模后的Ljung-Box Q检验效果,Ljung-Box Q统计量越大,序列提取信息越完整。综合考虑,最终选择N-BIG指数更小,Ljung-Box Q检验较高的ARIMA(0,1,O)(1,1,1)s(12)模型。

3模型预测效果评价

根据选定的参数进行建模,模型信息见表1。

模型统计表反映出建立的ARIMA综合模型提取了训练时间序列91.8%的信息,且N-BIG值较低。Ljung-Box Q检验的显著性远高于0.05,表示提取信息后的时间序列可以看做没有建模价值的白噪声序列。

通过与测试序列对比,进一步评价所构建模型的预测效果,2018年1月至8月的测试值及模型预测值对比如表2所示,表中最終预测值为建模得出的预测数据乘以典型季节因子后的数据。可以看出,预测数据乘以典型季节指数后,大幅降低了极端值的影响。结果显示,各月预测值的误差绝对值百分比大多低于3%,仅2月份的误差略高,2018年前8个月预测值总和的误差绝对值小于1.2%,预测效果较为满意。此外,经过试验,相比剔除季节因素后建模的回归模型以及仅使用ARIMA模型进行预测的建模,SD-ARIMA复合模型均方程差和误差绝对值百分比均优于前者,用于预测更为精确。综上,对于虹桥机场旅客吞吐量预测,本研究构建的SD-ARIMA(0,1,0)(1,1,1)S(12)模型的效果更理想,具有一定的有效性和优越性。

4结束语

本研究首先计算了虹桥机场旅客吞吐量的典型季节指数,发现了虹桥机场旅客吞吐量的季节波动趋势。接着使用季节分解后的时间序列数据构建了将季节因素考虑在内的SD-ARIMA(p,d,q)(sp,sd,sq)S(1)复合模型对虹桥机场客流量进行预测。结果发现:

(1)典型季节指数显示,11月至次年2月虹桥机场旅客吞吐量低于典型月度。3月至10月中,除6月外,旅客吞吐量均高于典型月度。总体来看体现了虹桥机场客流量冬季偏低的季节趋势。

(2)从预测效果来看,相比剔除季节因素后进行建模的回归模型以及单独使用ARIMA模型进行的预测,SD-ARIMA复合模型对于虹桥机场旅客吞吐量的预测误差更小,对序列中的极端值数据更为耐受,模型拟合更为准确,可以用于短期预测。

(3)通过SD-ARIMA复合模型对机场旅客吞吐量做出预测,有助于航空枢纽提前根据客流量进行资源调配,从而起到高效利用人财物资源的作用,对机场的日常运营及决策具有一定参考价值。

本研究构建的sD-AIuMA模型虽然展现了对极端值较好的耐受性,但计算出的预测值与实测值在某些特定年份仍有相当误差。后续研究将围绕SD-RNN-ARIMA混合模型展开,以期进一步提高模型对数据的适应性以及获得更高的预测准确率。

猜你喜欢

预测
无可预测
基于PCC-CNN-GRU的短期风电功率预测
选修2—2期中考试预测卷(A卷)答案与提示
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
不可预测