基于改进LSTM算法的农产品价格预测研究
2020-11-16张荣臻黄成明胡坚
?张荣臻 黄成明 胡坚
摘要:农产品是人民生活的必要保障品,其价格波动对人民生活影响深远,农产品价格预测对农产品市场的发展具有指导作用。本文提出了一种基于改进LSTM的农产品价格预测方法,该改进方法引入了DAE,提取更加鲁棒的特征,提高了模型的泛化能力和整体预测精度。
关键词:价格预测;LSTM;农产品价格;DAE
中国是农业生产的大国,农产品是人民生活的必要保障品,農产品的价格波动将直接影响到生产者和消费者,因此农产品价格预测能力对农产品市场的发展具有指导作用。另外,农产品市场又可以分为现货市场和期货市场,两者密不可分,一般情况下现货价格与期货价格会保持一致性变化。期货市场的T+0交易制度和做空机制下形成市场充分交易,使得期货市场具备价格发现的功能。因此本文选用农产品期货数据进行价格预测,提升价格预测模型的前瞻性。关于农产品价格预测的研究方法,主要从神经网络算法、时间序列模型、条件异方差模型、灰色系统模型等基本方法出发,并结合经验模态、滤波分解、小波分解等数据处理方法进行研究。LSTM是循环神经网络算法中的一种典型方法,在时间序列数据的预测上具有较好的表现,本文根据农产品价格的特点,提出了一种基于改进LSTM算法的农产品价格预测方法。
1 研究方法
1.1 LSTM(Long Short Term Memory)
2 实验
图1DAE-LSTM模型 图2 模型预测效果
农产品价格是一种典型的时间序列数据,普通神经网络对时间序列数据的处理效果不佳,它只能接收当前状态的信息而无法接收上一个状态的信息。循环神经网络RNN的提出,在该问题上的处理效果显著。RNN是一种特殊的神经网络,RNN中的节点更新时,将上一个状态的输出作为输入,从而在节点中建立了前后状态之间的联系。
然而,RNN对于时间序列的历史状态记忆长度十分有限,通常会丧失对久远信息的记忆能力。LSTM是基于RNN变化而来的,该模型引入了记忆和遗忘模块,可以有效记忆长期的输入信息。LSTM的神经元结构中引入了遗忘门、输入门和输出门,通过这三个门控制所要记忆的输入信息,遗忘不重要的输入信息。[1]
1.2 DAE(Denoising Auto Encoder)
建立精确稳定的农产品价格预测模型需要对影响其价格波动的因素进行有效概括和表示,这个过程并不容易。本文引入的DAE方法为一组降噪自动编码器,是一种强大的特征提取方法,在机器翻译、自然语言处理等领域已有较为成功的应用。
DAE的基础组件是自动编码器(AE),AE是一种尝试将输入x复制到输出z的神经网络,该网络由编码器f和解码器g两个部分组成。AE的编码器f对输入x进行压缩表示得到y,解码器g又将压缩表示的产物y进行解码,还原生成新的输入信息z。AE是一种自监督的算法,不需要对训练样本进行标记,AE所设定的损失函数L通过比较输入x和输出z来衡量压缩而损失掉的信息,训练过程调整编码器和解码器的参数,通过最小化损失函数进行模型优化。不过,在AE的应用过程中,经常会出现过拟合问题,所以实际应用中使用DAE的效果会更好。降噪自动编码器DAE是Bengio在2008年的论文提出的,DAE在AE的基础上,对输入层的输入数据加入噪音以防止过拟合,使习得的编码器具有较好的鲁棒性。DAE的降噪结构类似于dropout,其中x是原始的输入数据,DAE以一定概率把输入层节点的值置为0,从而得到含有噪音的模型输入。[2]
1.3 改进的LSTM
基于上述分析,提出了一种基于改进LSTM算法的农产品价格预测模型,在LSTM输入层引入了DAE结构,其结构如图1 所示。模型由两部分组成,第一部分采用降噪自动编码器DAE从原始输入向量中提取特征,第二部分是LSTM单元用于完成农产品价格预测。
为了验证改进LSTM模型的农产品价格预测效果,本文选择了具有代表性的农产品期货数据作为建模对象,对数据进行预处理后,对糅合了DAE的LSTM模型进行训练,最后使用训练好的模型进行预测并分析预测结果。
2.1 数据说明与预处理
实验选择大连商品交易所的玉米期货价格作为研究对象,其历史交易数据在新浪网站上获得。数据涵盖2005年 1月到2020年 4月的日交易数据,本实验从原始数据中提取了有效交易日的收盘价数据,并且计算了5、10、20和 30日收盘价数据的MA和EXPMA指标,以上数据作为模型的输入。本文选用决定系数R2对模型的预测效果进行评价,计算公式为:
公式中,和 分别为预测值和实际值。R2的范围为0 到1,R2越趋近于1,模型的预测效果越好。
2.2 实验及结果分析
使用训练样本和测试样本,对DAE-LSTM模型进行训练和预测。训练300轮后终止训练,使用所得的模型进行预测,得到的预测效果如图2 所示。true曲线表示真实价格,DAE-LSTM曲线为使用模型预测的价格。模型预测结果的R2指标为0.75,结合观测效果图中的对比曲线,模型表现出较好的预测精度和稳定性。
3 结语
本文提出了一种基于改进LSTM的农产品价格预测方法,模型相对于传统LSTM结构的改进在于DAE输入层的引入,提升了模型的返回能力,达到更好的预测效果。由于数据源的限制,实验仅验证了价格因素作为输入的模型效果,对于更广泛的输入因素的模型应用效果待进一步验证。
参考文献:
[1] 杨丽,吴雨茜,王俊丽等.循环神经网络研究综述[J].计算机应用,2018,38(S2):6-11+31.
[2] 邓俊锋等.基于自动编码器组合的深度学习优化方法[J].计算机应用,2016,36(03):697-702.