差分自回归移动平均模型在企业物资采购中的应用
2020-06-16张云
张 云
(西安航天动力试验技术研究所,陕西西安 710100)
0 引言
采购预测是指企业的决策者在商品采购市场上调查取得资料的基础上,经过分析研究,并运用科学的方法来测算未来一定时期内商品的供求及其变化趋势,从而为商品采购决策和制定商品采购计划提供科学的依据,保证供给平衡和利润最大化的过程。
预测的理论和方法很多,按客观因素分为定性方法和定量方法,其中定量方法又分为时间序列法、季节性预测和因果分析法。时间序列法是一种统计分析方法,因为历史数据表现出比较强的规律性,因此可以根据它过去的变动趋势预测未来。时间序列有4 种变动因素:①长期趋势,在整个预测期内事物呈现出逐渐增加或渐减的趋势;②周期变动,以某一时间间隔为周期的周期性变动,如危机和复苏的交替;③季节变动,以一年为周期的周期变动,如服装行业销售额的季节性波动;④偶然变动,除上述3 种情况之外的不规则变动。时间序列法通常对4 种变动因素有侧重地进行预处理,从而派生出剔除季节变动法、移动平均法、指数平滑法、自回归法、时间函数拟合法等具体预测方法。
无论是制造业还是服务业,都在通过降低成本的方法取得更多的利润。因为采购量决定库存量,而成本降低的重要手段就是降低库存,所以合理的采购预测成为降低库存、增加收益的重要手段。文献[1]使用梯度方法和拉格朗日松弛法构建了采购预测模型,对采购成本的优化问题做出了一个良好的解决。文献[2]分析采购预测中存在的问题,并对在按订单生产中供应链遇到的采购预测问题,给出了合理的前提条件和解决办法。文献[3]在考虑到所有与采购决策相关的成本的基础上提出了基于数学规划的采购预测模型,解决了钢铁制造公司轴承采购的预测问题。国内[4]基于小波变换的自回归移动平均模型为框架,实现时间序列预测在医用耗材采购管理中的应用。文献[5]以石油企业物资采购现状为切入点,对石油企业物资管理现状信息化制约因素进行分析,提出详细的信息化购买手段与实施措施。文献[6]采用基于自回归移动平均模型,且适用于小样本情形的建模方法,然后分析政府采购和经济增长之间的因果关系。文献[7]构建自回归移动平均(Autoregressive Moving Average,ARMA)(6,2)模型,并对模型进行白噪声检验及数据拟合,并标明该模型适合预测PMI 的未来走势。文献[8]构建了基于分布式系统的医院物资使用量精准预测方案,并对差分自回归移动平均(Autoregressive Integrated Moving Average,ARIMA)模型提出改进方法。文献[9]先将数据进行卡尔曼滤波处理,再建立自回归移动平均模型进行迭代预测,对配件需求进行了预测。文献[10]构建多组ARIMA模型并对模型进行白噪声检验及参数检验,提出了相应的几条政策建议。
上述文献中,利用或者改进算法提高预测精度在各行各业取得很好的应用。而目前算法的典型做法就是首先需要对数据进行白化操作,使得数据满足平稳性。但是企业对物资的消耗具有明显的季节特征,如果消除数据的此种内在特征,其预测偏差比如偏大。本项目根据物资消耗的季节性和延续性特点,设计了纵向和横向预测模型对数据进行预测,纵向预测模型充分利用了物资消耗的季节特性,而横向预测模型则考虑消费的趋势和延续性特点。最后通过两种预测结果的加权平均,最终实现了物资消耗更准确的预测。
1 模型选择
时间序列是同一种现象在不同时间上的相继观察值排列组成的数字序列。时间序列预测常用的模型分为3 种,分别是回归(Autoregressive,AR)模型、滑动平均(Moving Average,MA)模型以及自回归模型和滑动平均模型。AR 模型的预测方式是根据过去的观测值和现在的干扰值,构成线性组合进行预测,自回归模型的数学公式为:
其中,p 为自回归模型的参数,φi(i=1,2,…,p),εt为干扰值,yt为一个平稳时间序列。模型的目的是辨识待定系数φi,然后根据φi进行后续数据的预测。
而MA 模型的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为:
其中,q 为模型的阶数,θj(j=1,2,…,q)为模型的系数;εt为误差;yt为平稳时间序列。同样模型估计就是得到θj。
ARMA 模型,即自回归模型和滑动平均模型的组合,其数学公式为:
从回归方程可知,自回归移动平均模型综合了AR 和MA 两个模型的优势。在ARMA 模型中,自回归过程负责量化当前数据与前期数据之间的关系,移动平均过程负责解决随机误差项的求解问题,因此该模型更为有效和常用。
AR/MA/ARMA 模型适用于平稳时间序列的分析,在现实生活中,存在很多非平稳的时间序列,它们的均值和方差随着时间的变化而变化,当时间序列存在上升或下降趋势时,这些模型的预测效果会迅速变差。统计学家们发现,很多时间序列本身虽然不平稳,但是经过差分(相邻时间点的指标数值相减)之后,形成的新时间序列就变成平稳时间序列了。ARIMA 模型能够用于齐次非平稳时间序列的分析,这里的齐次是指原本不平稳的时间序列经过d 次差分后成为平稳时间序列。因此,差分自回归移动平均模型又写成ARIMA(p,d,q)。其中,p 代表自回归阶数,d 代表差分次数,q 代表移动平均阶数。因为其方法可以处理齐次非平稳时间序列,所以有更广泛的应用。
采购数据的变化和波动不是一个零均值的平稳随机过程,因此本项目采用多个ARIMA 模型对数据进行处理和预测。
2 分析和验证
物资的消耗还具有延续性,因为相邻两个月的物资消耗变化不会很大。比如项目启动时会需要特殊的物资,需求会一直延续直到项目结束,这种数据的预测用ARIMA 模型可以取得较好的结果。但是物资采购量具有显著的季节性特征,比如棉衣,其最大消耗量出现在10 月份到次年的3 月份之间;而白糖消耗高峰则出现在6~8 月。因为需求量随季节的突变,物资消耗的季节相关性特征使得无论模型如何选择和优化,直接使用上几个月的数据进行预测,都无法取得很好的预测结果。本项目中,把预测过程分为两个独立的预测模型,然后通过两种模型预测值的加权平均,得到最终的预测结果。
对历史采购数据以每年的月份为列,年份为行,构成两维数据表格。此表中横向表示了月份变化引起采购量的变化,而纵向表示不同年份中同一个月份采购量的变化。以2008 年开始到2018 年末每月某生活物资的采购量数据为例,可以构成一个11行、12 列的二维矩阵。
2.1 纵向预测
该矩阵中,沿着列的方向纵向看,可以看出每年的1 个月构成一个序列。例如,2008 年1 月,2009 年1 月,…,2018 年1 月的11 个数据构成一个序列。此序列用于预测2019 年1 月的物资采购数据。同理,2008 年12 月,2009 年12 月,…,2018 年12 月的11 个数据构成另外一个序列,用于预测2019 年12 月的物资采购数据。这样每个月的同比历史数据构成一个纵向预测序列。该序列主要用于预测物资需求的季节变化,例如2019 年12 月的棉衣量需求的纵向预测,由前11 年12 个月的棉衣量需求进行预测。
2.2 横向预测
采购数据的增加或者减小是有延续性的,纵向预测仅利用了采购数据的季节特性,没有反映数据的延续性特征。比如新的项目开始后,物资需求先持续增加,然后衰减,直到项目结束。但项目的启动或者突发需求从二维矩阵的纵向中得不到任何信息可以预测这种情况。因此再构造一个连续的以每月环比采购量构成的序列,该序列沿着二维矩阵横向进行预测。表格每行只有12 个数据,当需要取12 月份的下一个月时,该取的数据便是次年的1 月份,就是靠月的自然顺序构造序列。例如:2019 年12月的棉衣量的横向预测,由2019 年8 月、9 月、10 月、11 月,即前4 个月的数据进行预测。
综上分析,本文对一种物资的采购数据预测由纵向和横向预测共同构成,根据实际数据分析,选取纵向预测结果的0.6 倍加上横向预测的0.4 倍构成最终的预测结果。
从单位历史采购数据可知采购物资数量为一阶单整时间序列,因此逐月差分阶数d=l。对于非季节自回归和移动平均阶数p 和q,运用Eviews8.0 软件并观察序列的自相关函数和偏自相关函数,可以得到最优的模型参数为ARIMA(1,1,1)。
根据2008 年1 月到2018 年12 月、每年12 个月的历史数据为样本,建立横纵向预测模型,并对2019 年1~7 月的采购需求进行预测。其纵向预测、横向预测、加权结果和实际采购数据结果见表1。
表中可以看出,2019 年6 月横向预测的结果根据过去数据的变化趋势,需求量明显上升,所以横向预测的结果为9.4。但历史数据显示6 月份的需求量仅为6.2,加权后把明显存在超调的数据拉回到和实际采购量比较接近的水平,这组数据反映了数据的季节性特征。又如2019 年7 月,纵向预测的结果偏小,而横向预测则根据相邻的数据预测,可以看出其充分反映了数据的延续性。从表中可以看出,1 月份~7 月份的加权结果最接近实际采购信息,表明了该方法的有效性。
3 结论
本项目的方法充分利用了采购数据的季节特性,利用了横、纵向两个模型对采购数据集进行预测,实验表明该方法明显优于常规的横向预测方法。不足之处是需要的计算量变大,需要构造两个序列进行预测然后再加权平均。但是随着计算能力的提高,该缺点容易被克服。后续的研究中应该增加人为预警机制,如大项目的启动时间预警、提前启动物资采购等,以减少成本并保证供应的时效性。
表1 某物资的预测和实际采购结果 千件