基于LSTM神经网络的短期服装销量预测
2021-05-09陈德洪李长云
陈德洪 李长云
摘 要:为了获得精度更高的服装销量预测结果,提出一种基于LSTM神经网络的服装销量预测方法。LSTM神经网络具有较好的非线性和自适应特性,可以更好地挖掘时序数据中的时序特征和非线性特征,从而获得更加符合实际的预测结果值。使用某服装企业的服装销量时间序列数据集训练LSTM模型,设计与经典时间序列预测模型ARIMA的对比实验。实验结果表明,该模型能够有效提升服装销量预测任务的精度。
关键词:服装销量预测;LSTM;ARIMA
中图分类号:TP18 文獻标识码:A文章编号:2096-4706(2021)20-0106-03
Short Term Clothing Sales Forecast Based on LSTM Neural Network
CHEN Dehong, LI Changyun
(School of Computer Science, Hunan University of Technology, Zhuzhou 412007, China)
Abstract: In order to obtain more accurate clothing sales forecast results, a clothing sales prediction method based on LSTM neural network is proposed. LSTM neural network has good nonlinear and adaptive characteristics. It can better mine the temporal and nonlinear characteristics in time series data, so as to obtain more realistic prediction results. Using the clothing sales time series data set of a clothing enterprise to train the LSTM model, a comparative experiment with the classical time series prediction model ARIMA is designed. The experimental results show that the model can effectively improve the accuracy of clothing sales forecast.
Keywords: clothing sales forecast; LSTM; ARIMA
0 引 言
服装销量对服装生产企业进行科学生产、减轻库存压力[1]等具有重要的指导意义。随着经济社会的快速发展,影响服装物料需求的因素呈现出明显的复杂性和多样性,主要包括流行趋势、经济发展水平、消费观念、季节、节假日等。从而导致对服装物料需求进行预测较为困难。如果能有一种对服装销量进行可靠预测的方法,将为企业减少货物积压,把握市场动向,提升企业利润等具有重要的意义。
进行预测研究,常用的时间序列预测方法主要分为两类,一类是时间序列统计模型,主要是把整个时间序列放入模型中进行训练,如AR、MA、ARIMA[2]、Prophet[3]等;另一类时间序列监督模型,需要把时间序列通过滚动的方式构建对应的X和Y,如CNN[4]、RNN[5]、LSTM[6]、Attention Model[7]、Transformer[8]等。在众多时序预测算法的应用中,LSTM神经网络被广泛应用在众多领域,高海翔等[6]使用LSTM神经网络模型对数据进行分量重构,有效提升了原油价格的预测精度。刘翀等[7]引入深度LSTM建模,解决金融数据间的长依赖问题,得到一个具有高准确性和稳定性的金融领域预测模型。曹超凡等[9]使用LSTM模型进行关联预测,在股价预测领域取得了较优水准。LSTM神经网络在众多领域均取得了良好效果,证明了该方法的优越性和可行性。由此将该方法引入服装销量预测领域,提升预测精度。
针对上述问题,本文选用LSTM神经网络来完成服装销量预测任务,为企业提供的生产几乎决策提供精度更好的理论依据。首先对获取的企业服装销量数据进行数据处理得到时序数据,然后对数据进行标准化,再输入到LSTM模型中进行训练,得到短期服装销量预测值。
1 基础理论
1.1 LSTM神经网络
LSTM[6]神经网络是一种特殊的RNN,主要是为了消除RNN在进行长序列训练过程中的梯度消失和梯度爆炸问题,在处理序列数据方面表现优异。LSTM主要由输入门、遗忘门和输出门组成。LSTM神经网络的重要之处在于它独有的细胞状态与三类功能各异的“门”结构[6]。细胞状态作为各类信息传输的路径,让模块内的信息能在不用序列连中有序传递。可将其看作网络的“记忆”部门。从基础理论来说,细胞中存储的状态能够将相关序列处理过程中的各类有效信息一直传递下去。所以即使是原始时间步长的有效信息也能携带到后续时间步长的细胞中来,这有效克服了短时记忆的影响,改进了原有RNN的局限性。因此LSTM是通过“门”结构来实现信息的增添和减少,“门”结构在大量训练过程中可以自主得去学习保持或删除各类相关数据[7]。
1.2 ARIMA模型
自回归综合移动平均(ARIMA)是时间序列预测中最常用的方法之一,它是将自回归模型和移动平均模型相结合的一种方法,由于其能够使序列平稳,通常应用于非平稳时间序列。在识别步骤中,通常需要进行数据转换,使时间序列平稳。平稳性是建立用于预测的ARIMA模型的必要条件。平稳时间序列具有这样的特性,即它的统计特征,如均值和自相关结构,随时间的推移是恒定的。
1.3 预测任务流程
针对时间序列模型,考虑服装销量受到季节、流行趋势、社会经济状况、消费观念、传统文化影响等多重因素的干扰,具有很强特殊性,同时提升预测精度又非常有必要,会给企业带来可观的效益,因此提出了一个基于LSTM神经网络的短期服装销量预测方法,步骤为:
(1)获取服装销量原始数据数据。
(2)数据清洗。将销量原始数据数据整理得到销量时间序列数据,由2列数据组成,第一列是日期,第二列是销售数值。
(3)整理数据。为减少误差,降低非线性因素对预测的影响,对已有数据已月为单位重新计算,得到新的时序数据。同时另外经过序列处理,以时间为序号,销量为值,对应得到一组序列数据。
(4)划分训练集和测试集。由于是短期预测,因此只划分12个月即12条数据作为测试集。
(5)使用LSTM模型对训练集进行训练。
(6)预测评估。对预测结果进行综合评价,包括评价指标和曲线拟合情况。
2 实验结果与分析
2.1 数据集的选择和预测评估
本实验选用某服装企业的服装销量时间序列数据集进行验证实验,该数据集记录了企业从2008年1月到2015年12月的服装销售时间序列数据。首先进行数据预处理,由于销售是以天为单位,而天为单位受到当天天气、当天温度等较多因素的影响,综合考虑后认为以月为单位对数据集进行重新分配处理。以月为单位重新整理数据格式,对每个月度的各天销售数据求和,集中到各月1号,形成一个新的数据集。新时间序列数据集中由2列组成,第一列是时间序列的时间戳,第二列是月销售数据值。新的时间序列数据中得到96个样本,本实验将其中前84个样本作为训练集,后12个样本作为测试集。
本实验借助均方根误差(RMSE)和平均绝对百分比误差(MAPE)来作为预测评估指标,对预测结果进行一个综合的比较分析。RMSE和MAPE的数据越小,就表明预测的效果越好。同时还会绘制出预测数据与原始数据的对比图,通过走势和对重要节点的拟合精度来对整体的预测效果进行判断。结合预测评估指标和走势图对比效果,才能得到最终的对预测效果的评价,得出是否提升了预测精度。
2.2 LSTM模型构建
初始化LSTM模型,采用标准的三层结构,批处理个数为50,迭代次数设置为200,目标函数为均方差。为了防止梯度爆炸问题,在众多的梯度优化算法中选择了自适应估计(Adaptive Moment Estimation, Adam)算法。激活函数选用ReLU函数。原始服装销量数据经过标准化方法处理得到标准且变化平缓的数据集,数据LSTM模型中,得到的结果经过反标准化处理,最终得到服装销量预测结果值。
2.3 实验结果
图1是LSTM模型预测结果与ARIMA模型测结果与原始数据的走势对比图,由图1可知,两条预测曲线可以较为精确的预测数据走势,部分月份的数据拟合效果好,但整体的预测值都普遍偏大,形成的视觉效果较差,但认真分析图中3条曲线的走势情况,可以看到LSTM模型曲线的走势较为平稳,整体的预测效果更好,预测的12个数据点位与实际值的偏差较小,证明整体的预测效果较好。ARIMA模型的曲线的起伏和效果较为接近原曲线,在2015年1月全年销售最高点和2015年6月全年销售最低点的拟合效果较差,造成整体的预测效果偏差,同时整体数值偏高,因此造成误差大。LSTM模型对实际曲线的拟合效果更好,预测值也更为接近实际值。以上从预测结果趋势图的走势和对重要节点的拟合精度角度证明了LSTM模型整体的预测效果优于ARIMA模型。
随后使用预测评估计算公式对得到的LSTM模型的预测结果值与ARIMA的预测结果值进行对应的计算,分别计算两者的RMSE和MAPE值,汇合得到表1。由于RMSE和MAPE值的计算只与数据本身有关,因此与绝对大小无关,只与相对大小的关联性更强,几组数据比较得到的评估指标数据更大的预测值,表明预测效果相对较差,预测精度较低;评估指标数据更小的预测值,表明预测效果相对较好,预测精度较高。其中,LSTM模型的RMSE值为14.80,对比ARIMA模型降低31.23%;同时,LSTM模型的MAPE值为5.40,对比ARIMA模型降低30.68%。从预测评估角度证明了LSTM模型整体的预测效果均好于ARIMA模型,且有着较大提升。
由实验结果可知,LSTM模型自身对数据的拟合效果好,数据误差小,且预测速度较快。对比ARIMA模型,对原始数据的趋势拟合效果更好,预测评估指标也更佳。从预测评估指标和走势图对比效果两个方面均可表明LSTM神经网络在服装销量预测任务有更高的精度,能够很好地满足企业的实际需求,帮助服装企业制定精度更高的生产计划。
3 结 论
服装企业想进一步优化库存与提高生产效率,以此提高经营利润,提升行业活力。更加精准的销售预测可以为企业制定生产计划提供有效参考,为提升服装需求预测任务的精度,更好拟合发展趋势,消除误差因素的影响,提出了一种基于LSTM神经网络的预测方法,引入高效的神经网络进行预测。通过与传统方法ARIMA算法的对比实验可知,该方法对服装生产企业进行有效预测服装销量,合理安排生产计划具有积极作用。本文中LSTM模型相对于传统方法取得了一定的优势和进步,有效提升了预测精度,但整体的预测效果仍不是非常理想,后续在引入深度学习算法进行服装销量预测的基础上,尝试新的更加符合服装销量预测任务的神经网络,进一步提升服装预测任务精度。
参考文献:
[1] G?IZA J,LUQUE R,MURILLO J,et al. Integrating pricing and coordinated inventory decisions between one warehouse and multiple retailers[J].Journal of Industrial and Production Engineering,2021,38(7):536-546.
[2]王英伟,马树才.基于ARIMA和LSTM混合模型的时间序列预测[J].计算机应用与软件,2021,38(2):291-298.
[3]张家晨,左兴权,黄海,等.Prophet混合模型应用于基站网络流量长期预测[J/OL].计算机工程与应用:1-11.(2021-07-06).http://kns.cnki.net/kcms/detail/11.2127.TP.20210706.0941.002.html.
[4]魏健,趙红涛,刘敦楠,等.基于注意力机制的CNN-LSTM短期电力负荷预测方法[J].华北电力大学学报(自然科学版),2021,48(1):42-47.
[5]陈聪,候磊,李乐乐,等.基于GRU改进RNN神经网络的飞机燃油流量预测[J].科学技术与工程,2021,21(27):11663-11673.
[6]高海翔,胡瑜,余乐安.基于分解集成的LSTM神经网络模型的油价预测[J].计算机应用与软件,2021,38(10):78-83.
[7]刘翀,杜军平.一种基于深度LSTM和注意力机制的金融数据预测方法[J].计算机科学,2020,47(12):125-130.
[8]周哲韬,刘路,宋晓,等.基于Transformer模型的滚动轴承剩余使用寿命预测方法[J/OL].北京航空航天大学学报:1-17.(2021-07-12).https://doi.org/10.13700/j.bh.1001-5965.2021.0247.
[9] 赵红蕊,薛雷.基于LSTM-CNN-CBAM模型的股票预测研究 [J].计算机工程与应用,2021,57(3):203-207.
作者简介:陈德洪(1995—),男,汉族,湖南永州人,硕士研究生在读,研究方向:数据分析、智能信息处理;李长云(1971-),男,汉族,湖南衡阳人,教授,博士,研究方向:软件理论、物联网工程、人工智能。