季节ARIMA模型在企业销售量预测中的应用①
——以卷烟销售为例
2016-09-24武汉大学数学与统计学院程幸福
武汉大学数学与统计学院 程幸福
中国烟草总公司贵州省公司 陈厚铭
武汉大学测绘遥感信息工程国家重点实验室 樊红
季节ARIMA模型在企业销售量预测中的应用①
——以卷烟销售为例
武汉大学数学与统计学院程幸福
中国烟草总公司贵州省公司陈厚铭
武汉大学测绘遥感信息工程国家重点实验室樊红
为预测贵州省各地、市、州烟草公司2016年卷烟季度营销情况,本文收集了贵州省各地、市、州烟草公司2006年~2015年卷烟季度销量数据,建立了季节ARIMA模型(Auto-Regressive Integrated Moving Average Model,整合自回归移动平均模型)。为了提高卷烟销量预测的准确性,本文把异常值加入模型,经过实证分析,以六盘水市卷烟销售为例,该模型很好地模拟了该市卷烟销售量的变化规律,并且有效地预测了该市卷烟季度的销量。
ARIMA模型 卷烟销售 季节预测 贵州省
卷烟销售量受到很多方面因素的影响,如该市的卷烟市场、经济水平、季节、人口数量、政策等[1],卷烟季度销售量呈现二重趋势的规律性变化,其特点是观察值排列顺序的重要性和前后观察值及其同期比之间的相关性,即预测点与其相距较近的观察点的相关性较强,而与其相距较远的观察点相关性较弱。二重趋势预测通常的方法有线性回归法、神经网络、时间序列分析法等[2]。对于单一变量随机时序的预测,Box-Jenkens等人提出的ARMA方法是公认的最好的预测方法。
孟玲清等人把季节ARIMA模型应用于对某地区一口井的地下水埋深的预测[1];何建先对数据取自然对数以减小数据方差的变化,再用季节ARIAM模型模拟并预报网络流量[4];罗艳辉等人基于ARMA建立卷烟月度预测模型,再用计划评审技术PERT得到月预测经验期望值,最后设定加权系数得到月预测销售量[2]。但ARIMA模型在贵州省各地、市、州烟草公司季度卷烟营销的研究还不够充分,缺少实用化的模型。
笔者主要研究了季节ARIMA模型在六盘水市及贵州省各地、市、州烟草公司卷烟营销季度预测中的应用。
1 模型的建立
建立ARMA模型的基本前提是保证时间序列的平稳性。季节ARIMA建模的过程则是把非平稳时间序列平稳化,这个过程涉及到去除序列的趋势及季节效应,再建立ARMA模型。模型中的p和q一旦确定下来,则ARIMA模型便可确定。其基本建模步骤如下。
(1)数据序列的平稳化。(2)计算自相关和偏相关系数,检验预处理后的数据是否符合ARMA建模要求。(3)根据自相关系数(ACF)及偏相关系数(PACF)的截尾性,初步判别序列属于哪类模型以及模型阶次,应用AIC准则为模型定阶。(4)参数估计后,对ARIMA模型的适合性进行检验,即对模型的残差序列进行白噪声检验,如果不能通过,则必须对模型重新进行定阶。
2 六盘水卷烟销量季度预测实验
项目组拟对贵州省六盘水市卷烟销售情况进行预测,首先整理出六盘水市2006年~2015年各个季度的卷烟销售量数据,如图1所示。
2.1数据平稳化
由图1可发现该市卷烟销售量有逐年递增趋势,且有周期性波动,因此首先对销售数据进行一次差分处理以消除趋势带来的影响,然后再进行季节差分以消除季节性带来的影响。差分后的数据自相关函数如图2所示,其中的数据已经不存在明显的周期性和趋势性,且无明显的自相关现象,可以认为处理后的序列是平稳的。
图1 2006年~2016年季度销售数据
图2 两次差分变换后的数据及子相关系数
2.2模型选择、检验和评估
为了选择一个更合适的模型,本文尝试了多种模型参数,所得结果记录如表1所示。
表1 模型参数选择
其中p、d、q分别代表常规ARIMA模型的自回归阶数、差分次数和移动平均阶数,P、D、Q分别代表季节项自回归阶数、差分次数和移动平均阶数。由AIC定阶准则知,模型5是最优的模型,其结构为:
另外,基于Bonferroni检验发现2015年第四季度是一个可加异常值,即该异常值仅对2015年第四季度的卷烟销量产生影响,我们把这个异常值纳入模型5,即不考虑该异常情况对后期数据的影响得到新的模型,记为模型6,该模型的AIC指标为621.24小于模型5 的AIC指标。
再检验模型6的合理性,如果模型的残差近似服从正态分布,则我们认为模型已经提取了数据内在的规律,否则要进行重新选择模型。为评估模型残差是否服从正态分布,图3画出了残差图、残差自相关函数图、Ljung-Box检验图以及残差分位数—分位数检验图。
图3 模型检验情况
可见模型6的残差通过了Box-Ljung检验及正态性检验,近似为白噪声,因此模型6是最合理的模型。
2.3预测
对六盘水市卷烟销售量的最小均方误差预测情况,画出预测值及其95%的置信区间,如图4所示。由图4可以看出季节ARIMA模型能够很好地模拟六盘水市卷烟季节销售量,而且预测带很窄。
3 结语
针对贵州省各地、市、州烟草公司卷烟季度营销预测的需求,本文收集了贵州省各地、市、州烟草公司2006年~2015年卷烟季度销量数据,编程实现了ARIMA模型(Auto-Regressive Integrated Moving Average,整合自回归移动平均模型),为了提高卷烟销量预测的准确性,以六盘水为例,通过把异常值加入模型,该模型很好地模拟了六盘水市卷烟销售量的变化规律,并很好地预测该市卷烟季度销量,经过实证分析,该方法也适用于贵州省其他地、市、州的烟草公司。本文提出的季节ARIMA模型,对于其余同类的应用有一定的借鉴作用。
[1]孟玲清,王晓雨,宋学娜.季节性时间序列建模与预测[EB/ OL].中国科技论文在线,2008-01-18.
[2]罗艳辉,吕永贵,李彬.基于ARMA的混合卷烟销售预测模型[J].计算机应用研究,2009(7).
[3][美]克莱尔.时间序列分析及应用R语言(第2版)[M].潘红宇,等译.北京:机械工业出版社,2011.
[4]何建.基于时间序列的网络流量分析与预测[J].中国科技信息,2005(22).
F272
A
2096-0298(2016)08(b)-167-02
本文研究得到了中国烟草公司贵州省公司科学研究与技术开发项目“贵州烟草商业卷烟营销大数据分析与研究”(合同号201407)的支持。
程幸福(1990-),男,汉族,安徽亳州人,硕士研究生,主要从事随机分析和数理统计方面的研究。
樊红(1967-),女,汉族,湖南益阳人,博士,博士生导师,教授,主要从事时空数据挖掘、定性空间信息检索和智能空间信息服务方面的研究。