基于物资需求特性量化预测未来需求的方法
2019-08-13黄宏和王雪峰潘永贺赵仲夏
黄宏和,吴 臻,琚 军,章 斌,王雪峰,潘永贺,郑 辉,赵仲夏
(国网浙江省电力有限公司衢州供电公司,浙江 衢州 324000)
0 引言
随着电力企业生产水平和信息化水平的不断提升、业务数据的快速积累,电力企业已经形成了海量的业务数据,步入大数据时代。 然而,现阶段的问题在于单纯的数据积累无法有效地实现数据价值转换,传统的经验决策模式难以适应实际工作需求,难以指导电力企业做出正确决策。因此,需要进行大数据挖掘分析,为企业运营决策提供依据。
目前,电力企业对于物资需求预测管理停留于统计分析层面,没有分析物资的需求特性,难以实现物资需求精准预测。 本文采用数据挖掘技术,提出实现物资高特征分类、剖析物资需求规律的方法,通过建立时间序列、灰色预测、指数平滑等预测模型,提高物资需求预测能力,辅助支撑物资部门物资采购相关工作。
1 算法理论
1.1 预测方法原理
预测是对未来尚未发生或者不明确的事物进行估算和推测,预测的依据主要是基于过去和现场的情况,采用一定的技术和方法去挖掘、解析、探索、模拟出复杂的中间过程,提取出较为明显的规律特征,形成涵盖知识性的结构化方程或函数,通过输入相应的变量值实现对未来结果的推断预测。
企业物资需求预测可从数量、资金等多个角度开展。 本文从物资管理实际情况出发,对物资历史采购数据和消耗数据进行分析,结果表明:物资需求特性分为连续性需求特征和间断性需求特征两类时,需求特征较为显著。 因此,预测方法分为连续性需求预测方法和间断性需求预测方法。
1.2 连续性需求预测方法
连续性的物资需求一般具有规律性,是基于时间发生变化的,可通过对历史数据进行挖掘分析,采用一些成熟的连续性预测方法进行物资需求预测,总结提取出其中的内在规律和关联关系,并结合实际情况对模型参数进行最优调整,从而做出准确的预测。 一般来讲,连续性预测的准确度与数据的数量和质量密切相关。
1.2.1 时间序列预测法
时间序列是指将同一统计指标的数值按其发生的时间顺序排列而成的序列,可以是月度、季度、年度等多种时间形式。 时间序列预测是基于某一个或一组分布于时间轴上的观测数据,通过挖掘分析观测数据自身的变化规律,形成符合变化的规律函数,继而按照等间隔时间预测未来的变化趋势,时间序列模型公式为:
等式左边表示对第t+1 期的预测值,等式右边表示由第1 期至第t 期时间段内的序列构成的规律函数。
由时间序列公式可以看到,只需输入历史数据即可输出未来预测数据,因此该方法预测较为简单、方便,适用于连续性的序列预测。 但该方法对于序列有平稳性的要求,对于非平稳的、间断性的时间序列,该方法的预测可信度较低。
1.2.2 LSTM 神经网络
人工神经网络是一种新兴且有效的机器学习和深度学习算法。 人类并不是每时每刻都从头开始思考,其思想具有持续性特点,传统的神经网络不具备这一特性,而递归神经网络能够有效解决这一问题。 递归神经网络中具备循环结构,能够使信息持续保存。 LSTM 神经网络即长短记忆型递归神经网络,其计算结果具备记忆之前几次结果的特点,因此在时间序列数据预测方面具有很大优势,是深度学习算法在时间序列数据预测方面的突破。
LSTM 中第一步决定哪些信息需要从单元状态中被抛弃;第二步决定在单元状态中需要存储哪些新信息;第三步决定需要输出的结果是什么,这个输出结果将会建立在单元状态的基础上,但该输出结果是个过滤版本,只输出了想要输出的那部分。
1.3 间断性需求预测方法
1.3.1 指数平滑法
指数平滑法本质上是一种特殊加权的移动平均法,常见的指数平滑法有一次指数平滑法、二次指数平滑法等,核心思想都是以历史全量数据信息为分析基础,通过对不同时期的观测值赋予不同的权重,实现对未来的预测。 该方法具备鲁棒性强的特点,由于操作简单、适应性强,常用于间断性的预测。
一次指数平滑法公式为:
二次指数平滑法公式为:
at和bt的计算公式为:
1.3.2 灰色预测法
对灰色系统建立的预测模型称为灰色模型(简称“GM 模型”),是微分方程模型,可用于对描述对象作长期、连续、动态的反映,它揭示了系统内部事物连续发展变化的过程。 灰色模型就是通过少量的、不完全的信息,建立灰色微分预测模型,对事物发展规律作出模糊性的长期描述。 灰色预测需要样本量较小,运算方便,建模精度高。
2 实证研究
2.1 物资数据获取
基于ERP(企业资源计划)电力信息系统获取某供电公司历史项目的领料数据,按照领取时间的先后顺序对各类物资进行统计排序,形成建模数据宽表,详细表字段见表1。
表1 项目领料明细数据
2.2 物资数据分类
由于物资类型较多,且物资的需求特性不一,过多的细化分类会增大研究难度,并且极大降低可行性。 因此,通过随机抽样抽取架空绝缘导线、低压电力电缆、10 kV 变压器、联结金具、锥形水泥杆等20 类物资数据开展分类特征提取,并选取两种不同特性的物资作为代表,按时间顺序形成物资时序图,结果如图1、图2 所示。
图1 连续性需求特征物资时序
由时序图可以看出,物资较为显著的分类特征为连续性和间断性,因此可将物资分为连续性需求物资和间断性需求物资,针对不同的需求特性选取合适的预测方法进行挖掘分析。
2.3 算法模型
根据物资展现出的需求特性选择合适的挖掘算法预测分析物资的未来需求,经过多种算法的筛选,最终选择时间序列分析作为连续性物资需求预测方法,选择指数平滑法与灰色预测法作为间断性物资需求预测的方法。
选取物资“架空绝缘导线”与物资“高压熔断器”代表连续性物资与间断性物资进行后续的建模预测,通过ERP 系统获取2 种物资2016—2017年每个月的物资数据。
2.3.1 连续性物资需求预测分析
(1)时间序列法实现物资需求预测分析
基于时间序列分析,对物资“架空绝缘导线”未来需求进行预测。 首先对架空绝缘导线序列进行平稳性检验。 检验结果见表2。
表2 架空绝缘导线序列平稳性检验
从表2 可知,架空绝缘导线序列的p 值为0.002 6,小于显著性水平的p 值,因此序列通过了平稳性检验,可以直接进行后续建模。 接着通过查看序列的ACF(自相关)图、PACF(偏自相关)图选择合适的模型,图3、图4 分别为架空绝缘导线序列ACF 图、PACF 图。
ACF 图显示滞后1 阶后ACF 值基本没有超过边界值,PACF 图显示序列在1 阶时就已收敛于边界内。 因此,选择AR(1)作为建立的ARMA模型。
根据建立的AR(1)模型对架空绝缘导线未来一个月的物资需求数量进行预测。 预测结果如图5 所示。
图3 架空绝缘导线序列ACF
图4 架空绝缘导线序列PACF
图5 时间序列实现未来物资需求预测
从图5 可以看出,建立的AR(1)模型拟合程度较高,误差波动小,预测的物资需求可信度高。通过时间序列分析对物资“架空绝缘导线”未来一个月需求进行预测,得到该物资在2018 年1 月的需求量可能为440.180 8 km。
(2)LSTM 神经网络实现物资需求预测分析
基于LSTM 神经网络算法,对物资“架空绝缘导线”未来需求进行预测。 首先,对LSTM 神经网络模型进行参数设置,需设置的参数见表3。
表3 LSTM 神经网络的参数
经过多次预测试验,LSTM 神经网络模型的训练次数推荐为50 次,少于50 次则模型的损失值不稳定,易造成物资需求预测结果不稳定,多于50 次会使得模型运行速度变慢;训练一次的样本数量为选择样本期的历史数据数量;用于评估LSTM 神经网络的测试序列长度推荐7 或是14,相当于建模的测试样本集;模型要预测的序列长度为选择预测期间的样本数量。
接下来开展模型搭建工作。 用Sigmoid 函数作为激活函数,并采用keras 来搭建LSTM 模型。将物资“架空绝缘导线”的时序数据输入到LSTM模型中进行训练,得到训练之后模型的参数,然后输入一个样本,用LSTM 模型中的predict_sequence_full 函数(完全序列预测函数)进行预测窗口的预测。 输入样本集和测试集对物资需求量进行预测,预测结果如图6 所示。
图6 神经网络实现未来物资需求预测
由图6 可知,建立的LSTM 神经网络模型预测的误差波动较小,模型拟合效果好,预测出的需求结果可信度高。 通过LSTM 神经网络模型对物资“架空绝缘导线”未来一个月需求进行预测,得到该物资在2018 年1 月的需求量可能为427.951 7 km。
2.3.2 间断性物资需求预测分析
间断性需求物资的特点为需求率低,通用性低,使用需求的时间间隔很长,物资消耗速度较慢,由于未发生物资领用,在需求数据中会产生大量0 值,数据存在明显的波动性和随机性,且间断性物资的历史需求数据相当有限。 因此,对于序列有平稳性要求的时间序列分析法不适合开展间断性物资需求预测分析。 鉴于间断性物资的特点,选择指数平滑法与灰色预测法对其未来需求进行预测分析。
(1)指数平滑法实现物资需求预测分析
对现有物资“高压熔断器”的数据先后应用一次、二次指数平滑法,得到物资需求预测模型,从而预测出物资“高压熔断器”未来的需求。 首先对选取物资进行一次指数平滑法计算得到物资“高压熔断器”一次指数平滑值,预测结果如图7所示。
图7 高压熔断器一次指数平滑预测
从图7 可知,运用一次指数平滑法进行预测,预测结果具有滞后作用,因此进一步运用二次指数平滑法对物资未来需求进行预测,提高模型预测的精度。
二次指数平滑法在一次指数平滑值的基础上再次进行指数平滑,通过与一次指数平滑值配合,共同建立预测数学模型,并通过模型对物资需求进行预测。 根据第1.3.1 节的二次指数平滑公式计算出物资预测结果,如图8 所示。
图8 高压熔断器二次指数平滑预测
从图8 可看出,运用二次指数平滑法拟合出的趋势线能够很好地体现原时间序列在不同时间段的变化趋势,模型预测的精准度高,根据预测模型得到物资“高压熔断器”在2018 年1 月的需求量可能为789 只。
(2)灰色预测法实现物资需求预测分析
灰色预测是一套针对间断性物资预测的方法,能够很好地解决间断性物资历史需求数据较少的不足,并通过输入数据变化的特征值对趋势进行推演,实现间断性物资未来需求的精准预测。
运用灰色预测法对物资“高压熔断器”未来需求进行预测,将其2016—2017 年间断物资数据作为原始数据进行建模。 预测效果如图9 所示。
图9 高压熔断器灰色预测法预测
从图9 可以看出,运用灰色预测法对物资“高压熔断器”进行预测,其拟合出的趋势能够很好地体现出原时间序列在不同时间段的变化趋势,模型预测的精准度较高,根据灰色预测模型得到物资“高压熔断器”在2018 年1 月的需求量为465 只。
2.3.3 模型择优
(1)连续性物资预测模型择优
前文分别通过时间序列分析与LSTM 神经网络分析对特征为连续性的物资进行需求预测,通过两者建立的模型均能有效实现对物资需求的预测,通过对比两者的模型平均预测误差率,选取预测误差更小的作为连续性物资的需求预测模型。
通过计算,时间序列分析的模型预测误差率为9.61%,LSTM 神经网络算法的模型预测误差率为6.88%。 因此,选取LSTM 神经网络算法作为预测连续性物资未来需求的算法。
(2)间断性物资预测模型择优
运用指数平滑法与灰色预测法均能有效、精准地对间断性物资未来需求进行预测,通过对比两种方法的预测误差率,选取预测精准度更高的作为间断性物资的预测模型。
通过计算,指数平滑法的模型平均误差率为16.62%,灰色预测法的模型平均误差率为25.88%。因此,选取指数平滑法作为预测间断性物资未来需求的算法。
3 应用价值
通过运用LSTM 神经网络、指数平滑法分别对连续性物资、间断性物资的未来需求进行精准预测,能够有效辅助客户决策各类电力需求物资的正确库存,改善管理人员在物资管理方面的盲目性与片面性,提升电力公司对物资需求的快速精准响应,提高电力企业的物资管理水平。
4 结语
本文通过对当前物资管理的现状进行调研分析,结合企业实际工作需要,针对电力物资管理过程中的问题制定了相应的解决策略。 采用时间序列分析与LSTM 神经网络算法对连续性物资未来需求进行预测,采用指数平滑法与灰色预测法实现对间断性物资未来需求的预测,有效地提高了物资管理人员的物资需求预测能力,极大地节约了企业采购成本,提升了企业综合竞争力。