基于时间序列分析的铁路客流量预测实证研究
2019-09-12赵佳华
赵佳华
【摘 要】 随着城市轨道交通不断发展,我们将如何用科学手段来预测客流,如何来提高轨道交通的运营水平引起关注。由于铁路客运量具有较强的趋势性和季节性,本文将以浙江省铁路客运量为例,运用乘积季节 ARIMA模型,建立1阶12步差分自回归移动平均模型 ARIMA模型,通过自相关和偏自相关图像来初步识别 ARIMA模型各个参数,并根据所建立的模型来预测浙江省铁路客流数据,我们对浙江省2012-2017年铁路客运量的月度数据进行拟合,建立了ARIMA模型,在此基础上预测2018年到2022年的月度客运量,模型总体效果较好。
【关键词】 时间序列分析 铁路客运量 季节ARIMA模型 预测
一、引言
铁路客运量预测是铁路客运规划的基础,也是铁路建设和改造过程中投资规模、收益等因素分析的基础。国外对铁路客流的预测进行了较早的研究。在1962年的美国杂志“Chicago Area Transpporttation Study”中,首次提出了铁路客流预测的应用。在此基础上,在20世纪70年代,经济学家丹尼尔·麦克法登通过研究非集急理论,将“效用理论”应用于交通领域,并提出Logit实用模型,使其能够对乘客流量分担率进行计算。随着铁路客运量预测的复杂变化,许多新的预测研究方法层出不穷,其中最常见的是时间序列预测方法。
时间序列分析是动态的时序数据处理的一种统计方法。该方法采用随机数据序列,以随机过程理论和数理统计方法为基础,进行定性定量预测。ARIMA模型的基本思想是:随着时间的推移,我们认为预测对象形成的数据序列是一个随机序列,并利用一定的时间序列模型来近似地解释序列。一旦确定了这个模型,那么就可以基于现有的时间序列数据预测过去和现在甚至将来的值。由于时间序列法把影响变化的因素由“时间”统一描述,它避免了考虑许多因素的影响,而且数据容易获得,容易计算。因此,它是铁路客运交通预测应用的理想方法。
二、理论模型与方法
自回归移动平均(Auto-Regressive Moving Average,ARMA)模型是平稳时间序列分析的经典方法。它由一个自回归模型(简称AR模型)和移动平均模型(简称MA模型)组成。因为它适用于所有类型,是目前最常用的时间序列预测方法。
ARMA模型的一般形式如下:
.
式中:表示模型的自回归部分;表示模型的移动平均部分;称为ARMA(p,q)序列,非负整数p,q分别称为自回归阶数和移动平均阶数,参数称为自回归系数,称为移动平均系数。
当p=0时,则ARMA(0,q)模型
.
称为q阶移动平均模型,记为MA(q)。
当q=0时,则ARMA(p,0)模型
.
称为p阶自回归模型,AR(p)。
三、实证方法
(一)数据来源
改革开放以来,浙江的交通运输业实现了稳步发展,经济社会发展的需求差距逐渐缩小。因此,本文建立了基于浙江省铁路客流的季节性时间序列预测模型,采用从2012年1月至2017年12月间的交通运输数据。
(二)数据平稳化
由于本文选取每月的数据,可能会有季节性的影响。因此,刻画分析了2012年1月至2017年12月的客运量数据,可以看出,节假日因素会导致客流发生较大的变化,不同的节假日对客流变化会产生不同的影响。因此,应该利用一阶12阶差分来消除长期趋势和季节波动的影响。
由于软件给出的变量相关性检验的结果可能会对模型参数的估计造成影响,导致在时间序列回归分析中容易出现伪回归情况。因此,需要对时间序列的平稳性进行检验。本文采用ADF检验来验证数据的平稳性。结果如下表1:
由上表可知,统计量检验结果显著,P值为0.0000,明显小于1%的置信水平,检验统计量显著,拒绝原假设,序列经过1阶12步差分处理后,认为该序列为平稳时间序列。
(三)模型的参数估计与检验
差分序列DKYL的自相关函数和偏相关函数显示,差分序列DKYL的自相关函数和偏相关函数在第12期的值分别为(-0.323,-0.168),显著不为0,说明即使进行12步的季节差分,差分后的序列在滞后12期仍表现出较高的相关性,因此建模过程中仍需要考虑季节性的因素的影响。这种情况下我们尝试用ARIMA乘积季节模型进行拟合。
根据AIC最小原则,最终我们选择较为合适的模型:ARIMA,具体的参数估计和模型的残差自相关图的结果如下,则乘积季节模型的参数估计结果可以表示为:
.
其中,为白噪声过程。
从表2的估计结果来看,参数显著性和平稳可逆性都满足。因此模型ARIMA能够很好地拟合浙江省铁路客运量的发展趋势,信息判断准则AIC和SBC的数值也相差无几。
(四)基于ARIMA模型的客流量预测
我们利用时间序列建模对以上确定的乘积季节模型ARIMA进行后续五年的预测。图2显示了每月的客运铁路从2012年1月至2017年12月总共六年和随后的5年2018年1月至2018年12月的预测值,我们可以看出, 该模型拟合得较好,该模型拟合的较好,只有相对较小的误差方差,所以预测极限非常接图 2 模型预测结果
根据这些预测,铁路部門可以对铁路运营和其他任务进行针对性的调整和部署,使铁路在综合运输系统中发挥优势,促进国民经济的发展。
四、总结
从以上ARIMA模型中获得2018年1月到2022年12月铁路每月客运量的预测值。相关的铁路部门可以充分利用这些模型理论进行针对性的调整,充分发挥铁路的优势,促进国民经济的发展。
(1)充分利用票价浮动机制调整客流,来应对铁路客流量的周期性波动。从2018年到2022年的月度客运量预测,我们可以看到,7月和8月的客运量将比其他月份稍高一些,也就是说,在两个月期间乘火车出行的人通常会多出几倍。在12月和1月,客运量下降到最低水平。因此,对于这两种情况造成的周期性波动,铁路部门可以充分利用铁路货运费的浮动机制来规范客流。在旺季,车辆的数量应适当增加,以满足人们的出行需求,增加铁路部门的收入。在客流淡季,可以适当发放优惠票,刺激人们乘坐火车出行,或者增加货物数量,避免空车造成的经济损失和资源浪费。
(2)借助时间序列分析的季节性建模方法,我们检验出了浙江省2012年1月到2017年12月的月度铁路客运量存在趋势性和周期波动性,进行周期为12的季节性差分之后较好的消除了趋势性和周期性。其次,在周期12的季节差分序列DKYL基础上建立相应ARIMA模型。最后,在构建的模型的基础上进行2018年到2022年的预测,可以发现,整体拟合效果较好,误差比较小。
总之,利用本文建立的季节时间序列模型的方法一方面避免了在铁路系统中对于客流量的主观臆测,我们通过较为客观的方法进行诊断,另一方面避免了趋势项和周期波动对时间数据的影响,具有良好的广泛适应性,对未来浙江省其他线路的轨道交通规划和调整都具有良好的参考价值和现实意义。
【参考文献】
[1] 张杰,刘小明,贺玉龙,等.基于时间序列的我国铁路客流量预测[J]. 统计与咨询, 2008: 20-21.
[2] 裴武,陈凤,程立勤,交通量时间序列ARIMA 预测技术研究[J].山西科技, 2009(1):75-79.
[3] 祁伟,李晔,汪作新,季节性ARIMA模型在稀疏交通流下的预测方法[J].公路交通科技,