间断性需求数据分类下不同预测方法预测效果研究
2018-03-28王蒙
王蒙
【摘要】在电力等行业的备件库存中,由于间断性性需求备件的缺货成本极高,提高间断性需求预测的精准度,尤其是在未来一段时间区间内控制平均库存数量对于企业库存安全和利润具有决定性作用。本文是基于间断性需求可能存在的几种数学特征:平均零值长度、需求数量分布和零值分布,调整这些不同特征的组合利用Excel生成这些特征具有显著区分性的仿真间断性需求数据,使用使用最主流的几种预测方法,根据这些数据调整平滑指数并仿照企业实际操作流程进行预测,选取了几组精度值,以及衡量库存水平、服务水平的指标,对预测效果进行衡量和比较。针对不同的间断性需求数据类型,得到预测效果最好的预测方法以及一般性预测偏差,并判断对库存、服务水平的影响。
【关键词】间断性需求 数列特征 偏差 预测精度
1、间断性需求预测方法
首先,在阅读近年来最前沿的国外间断性需求研究方面的文献后,观察近年来国外学者对于预测方法的选择和实际企业操作效果评估,选取最有实用价值的SES、Croston、SBA、SY、ModCr、shale、LS、TSB以及近年来中国自主知识产权的灰色理论作为衡量的方法。然后选取了一组精度衡量指标和两个库存水平衡量指标来作为衡量基准。并且研究了预测方法一般的偏差表现受到数据类型差异的影响,为企业预测提供实际意义。
Croston方法在国外学者的研究中,已经被作为一种默认的基准方法,其预测效果在企业实际操作中可以被接受。Croston方法之后,有许多学者针对平均需求发生预测公式中的平滑指数进行了纠正,以更正Croston方法的正偏差,降低库存水平。其中比较主要的是SBA方法、SY方法等。也有学者比较了在航空间断性备件预测中,Croston方法、指数平滑法、指数加权移动平均法、趋势调整的指数平滑法、加权移动平均法、二次指数平滑法和自适应调整的指数平滑法等等这些方法的表现效果。最终认定Croston方法和指数加权移动平均法是表现最为优秀的方法。
1972年Croston提出了这种方法,他建议滞销品的预测分为两个部分:需求规模和非零需求间隔。只有当发生需求时预测才会被从新计算
2、数据处理和指标选择
2.1间断性需求数据类型的划分及特征
根据间断性需求数据可能出现的不同数字特征,可以将其分解为三部分:平均零值长度、需求数量分布和零值分布。平均零值长度指的是:所有零值数量和非零值数量的比值。比值的大小反映了这组数据的“间断性”一即需求发生的时间频率。如果这个值接近于为0,那么这组数据就是连续需求数据,而该值越大,说明需求的发生越具有偶然性。需求数量分布指的是将非零需求数据从原序列分离出来后,这些需求量的发生服从什么样的分布,以及这些分布具有什么范围的参数。零值分布指的是零值和非零需求的排列关系。在相同平均零值长度的前提下,零值分布的不同可能会导致间断性需求数据特点具有极大的差异。
本文将采取控制变量法,分别对三种特征的变化进行研究。根据以往研究者的發现,本文将截取最具有区分性分类截点。
平均零值长度的衡量单位是ADI(average demand interval),根据Nezih和Lewis 2012年的研究,ADI在1.25时能够显著区分Croston的需求量、需求间隔分离预测方式和SES的直接预测的效果间的差别。而3,10是能够显著区分不同平滑指数修证产生的预测效果的两个值。因此,本文将选取ADI值为1,2,4,8,15五个值来进行纵向比较。这些值对应的需求发生概率分别为0.50,0.33,0.20,0.11,0.0625。
在需求值分布的选取上,在以往学者的研究经验中,最常见的假设是泊松分布和正态分布。而LS方法在提出者专门针对厄兰分布(一种特殊的伽马分布,密度函数中的一个参数r是一个大于等于1的整数)的研究,并发现LS方法针对此分布具有特别的预测优势。再次,一些受季节性影响较强的间断性需求物资在不同季节可能出现不同的需求性。因此,本文选取均匀分布、泊松分布、正态分布、厄兰分布,对数正态分布和指数分布6种来进行研究。所有分布都是ADI为2,正态分布均值为3方差为1,均匀分布区间为0-5,泊松分布单位时间内平均发生率为3,厄兰分布原gamma的alpha和beta值分别为9和0.33使r为常数,指数分布lamda值为0.03。
最后在零值分布的选取上,为了考虑一些受季节性或事件影响强烈的备件,,本文最后将考虑伯努利过程的需求序列、需求概率密度在各个点不一致(分为平时需求发生概率0.33,lamda值为3,旺季0.75,lamda值为7和平时需求发生概率0.4,lamda值为4,淡季0.11,lamda值为1)的零值分布和符合泊松分布离散序列的需求到达分布。
2.2预测精度指标的选取
本文的预测精度衡量方法选取原则通过比较,以SES方法预测效果为基准,主要通过相对和绝对误差的比较来确定预测效果的优劣。为了对企业实际库存管理有参考价值,本文还选取了衡量库存水平的衡量指标,比较每种方法带来的预测误差能够转化为直观的企业库存成本,体现每种预测方法的实际应用价值。而通过分期的平均需求率比较,可以衡量企业平均库存所受到的影响相对的强弱。主要选取了RGRMSE(相对几何均方根误差),MASE(平均绝对标准误差),CFE和NOS(累积预测误差和短缺数目),PIS(库存期数)方式来比较不同预测方法的优劣。
3、实证分析
本文用某公司的需求备件数据中进行验证。该备件总共有1092天的历史数据,将其中100周的截取作为测试范围。由于公司是按照日为单位进行统计的,首先将数据处理,加总每周需求之和,然后利用excel对其非零需求分布、零值分布进行分布拟合。
由上图分析结果可知:LS在总库存成本上表现最为糟糕,但在防止缺货,保证库存安全上却最为有效。TSB在总库存成本和偏差方面依然有最优秀的表现,防止缺货效果也不太好,但在预测精度上却并不像本文之前给出的分析中具有绝对的优势,反而在MASE指标上在七种方法里属于最差的。这可能是由于数据类型不完全与本文所列举的几种类型吻合有关。但在RGRMSE指标上依然表现最为出众。灰色预测在偏差和防止库存短缺上都有着相较于Croston方法十分明显的劣势。
4、结论
Croston系列方法在预测精度、控制库存成本、保证生产安全避免缺货方面相比SES方法具有十分明显的效果。而SBA,shale,SY修正在整体效果上除shale在避免缺货上效果略优之外,没有明显的效果优势。而LS和TSB修正则从两个不同方面具有效果优势:由于直接对需求发生概率进行预测,TSB方法粘合需求趋势上具有十分明显的优势,在预测精度、库存控制上具有良好表现;而LS方法可以有效地控制负偏差的产生,保证生产安全,但代价是较高的总库存停留时间,即较高的成本以及一定的库存报废风险。