基于ARIMA简单季节模型的河南省快递业务量预测
2019-08-10李贞贞
摘要:本文对发展迅速的快递行业进行研究,选取河南省月度快递业务量,考虑到月度快递业务量的趋势性、季节效应,通过建立ARIMA简单季节模型对快递业务量进行预测。结果表明,該模型预测效果较好。
Abstract: This paper studies the fast-growing express delivery industry, selects the monthly express delivery volume of Henan Province, and considers the trend and seasonal effect of monthly express delivery volume, and forecasts the express delivery volume by establishing the ARIMA simple seasonal model. The results show that the model has a good prediction effect.
关键词:时间序列分析;ARIMA模型;快递业务量
Key words: time series analysis;ARIMA model;express traffic
中图分类号:F259.1;F224 文献标识码:A 文章编号:1006-4311(2019)17-0271-03
0 引言
随着电子商务的兴旺、蓬勃发展,消费者的购物方式悄然发生了变化,网购成为了重要的购物方式。购物方式的变化带动了快递行业的迅猛发展。
对于快递行业的企业,业务量的变化对人员管理、投资决策等产生重要影响,因此快递业务量的预测对企业的经济决策有着重要参考依据。为了有较高的预测精度,需要对业务量时间序列数据进行有效合理分析、挖掘,建立业务量预测模型。
对于快递业务量的分析,学者采用了不同的模型和方法进行了分析,如灰色预测模型、组合预测、时间序列分析模型等等。
对于数据较少的,可采用灰色预测模型。洪琼[1]等根据江苏省2009至2017年规模以上企业快递业务量年度数据,用灰色预测模型GM(1,1)对其进行预测,认为江苏省的快递市场需求的增长势头迅猛。孙丽[2]基于我国2008至2014年我国快递业务量数据运用GM(1,1)模型进行拟合,拟合精度较高。可运用该模型对业务量进行预测。
对于时间跨度较长的数据,考虑到快递业务量具有长期趋势性、季节性、短期波动等特点,建立模型时需要考虑其特点,商丰瑞等[3]利用SARIMA模型对我国月度快递业务量进行预测分析;张仲斐等[4]利用四大快递公司的季度跨国快递业务量数据建立了基于ARIMA模型,该模型短期预测效果良好。
也有学者尝试运用组合预测的方式进行预测。王惠婷等[5]利用我国1995年至2016年的年度快递业务量,建立了二次指数平滑模型、多项式曲线预测模型、ARIMA模型等,进行组合预测,预测精度好。万晓榆[6]等运用重庆市邮政业的月度时间序列,组合灰色预测等多种模型,并运用方差倒数法进行组合预测,预测精度较好。
基于以上学者的研究,选取了跨度较长的河南省月度快递业务量,运用ARIMA模型进行建模分析预测。
1 研究方法
ARIMA模型是70年代初由Box和Jenkins提出的时间序列预测方法,是时域分析方法的核心内容。对于非平稳时间序列,ARIMA模型是常用的随机分析方法。该模型是差分运算和ARMA模型的组合。其中差分运算提取确定性信息,ARMA模型是对经过差分变换后平稳的序列建立的模型。
对于仅含有长期趋势效应的时间序列,可构建ARIMA(p,d,q)模型,其基本结构为:
简记为 其中d为提取长期趋势信息的差分阶数, 为p阶自回归系数多项式; 为q阶移动平均系数多项式。
对于既含有季节效应又含有长期趋势效应的简单序列,可构建简单季节模型,其基本结构为: 。其中D表示提取季节效应,进行D步差分;d表示提取趋势信息所用的差分阶数。
2 河南省月度快递业务量的实证分析
2.1 数据来源
为研究快递业务量的规律特点,本文研究了2014年6月-2019年3月河南省快递业务量数据(见表1),数据来源于河南省邮政管理局网站行业统计栏。业务量指的是规模以上(年业务收入200万元以上)快递服务企业业务量。为了检验模型预测的准确性,选2014年6月-2019年2月的月度数据进行建模,将2019年3月数据用来预测对比。运用统计软件SAS9.1进行数据分析。
2.2 平稳性检验
对时间序列的初步检验是平稳性检验。平稳性检验可根据时序图和自相关图等图检验法进行,也可以根据单位根检验进行检验。用X表示原序列。
从时序图中可以看出,随着时间的推移,业务量原序列呈现明显的上升趋势,具有一定的周期性,显然是非平稳序列。由于是线性上升趋势,利用1阶差分提取长期趋势效应。由于快递业务量具有一定的规律性,快递春节前夕停运,开启春节模式,因此1月、2月业务量偏低;“双十一”购物节等影响,10月、11月业务量较高。季节效应的周期约为12,因此进行12步差分,消除季节效应。差分序列用Y表示。
利用ADF检验判断差分序列是否平稳,ADF检验结果详见表2。序列Y三种类型的Rho统计量、Tau統计量都拒绝序列非平稳的原假设,认为序列Y平稳。
2.3 白噪声检验
对差分序列进行白噪声检验,检验结果如图2。
在显著性水平0.05的条件下,由于延迟6阶的检验统计量P值小于0.05,因此差分序列Y不能视为白噪声序列,可以尝试用模型对其信息进行提取。
2.4 模型识别和参数估计
观察自相关系数、偏自相关系数图特点,对差分平稳序列进行模型识别和参数估计。
样本的1阶自相关系数超过2倍标准差,1阶以后自相关系数都在2倍标准差之内,且由非零系数变为小值波动的速度比较迅速,认为自相关系数1阶截尾。分析序列偏自相关系数特点,认为其拖尾。据此,可尝试建立MA(1)模型。
参数估计方法采用条件最小二乘估计,并对参数的显著性进行检验。由图5,对均值?滋的显著性进行检验,由于P值为0.1820,大于0.05,显著性检验未通过。
选择去掉常数项之后的MA(1)模型,参数估计结果详见图6,参数?兹1的显著性检验通过。
即对河南省月度快递业务量序列拟合的模型为
2.5 模型检验
残差白噪声检验显示延迟6阶、12阶、18阶、24阶的LB检验统计量的P值均显著大于0.05,模型有效。
2.6 对河南省快递业务量进行短期预测
检验模型的预测能力。利用MAPE度量样本期内的预测能力,计算公式为该模型样本期内的MAPE为10.27%,预测能力良好。对样本期外,通过模型预测2019年3月业务量为16078.79万件,与真实值15600.66万件进行比较,误差为3.06%,预测能力较好。通过模型的预测值可供快递行业作参考。
3 结束语
本文运用ARIMA简单季节模型对河南省快递业务量进行预测,拟合效果较好,可用于短期预测,可为河南省的快递从业企业的经济决策提供一定的参考依据。
参考文献:
[1]洪琼,张浩,万玉龙,薛柏.江苏省快递业发展需求预测模型研究[J].江苏商论,2019(03):43-44,54.
[2]孙丽.基于灰色预测模型的快递行业市场需求预测[J].铁道运营技术,2017,23(04):5-8,35.
[3]商丰瑞,张静.基于SARIMA模型的我国快递业务量预测[J].现代经济信息,2016(20):350.
[4]张仲斐,赵一飞.基于ARIMA模型的全球跨国快递业务量预测[J].华东交通大学学报,2012,29(01):102-107.
[5]王惠婷,李蒙.组合预测模型在我国快递量预测中的应用[J].科学技术创新,2017(22):73-74.
[6]王燕.应用时间序列分析 [M].第三版.北京:中国人民大学出版社,2012.
[7]万晓榆,费舜,田帅辉.基于组合预测的邮政业务主要指标预测研究——以重庆邮政业为例[J].重庆邮电大学学报(社会科学版),2016,28(05):102-108.
[8]高铁梅.计量经济分析方法与建模[M].北京:清华大学出版社,2006.
作者简介:李贞贞(1986-),女,河南濮阳人,讲师,主要研究方向为数据分析与建模。