结合集合经验模态分解的LSTM神经网络在大宗商品价格预测应用研究
2023-07-13蔡兆晖陈秋强
□蔡兆晖 曾 凯 陈秋强
由于新冠疫情的持续影响,国际供应链及国际商品市场秩序受到了极大的冲击;同时,中美贸易战、俄乌局部冲突等地缘政治矛盾也对国际大宗商品市场带来了较大的长期影响。因此,在国际经贸关系中针对大宗商品的价格预测领域,若仍遵循传统的预测方法,无法克服时间序列过分强调长期记忆给价格波动预测带来的负面影响,同样也无法综合考虑多变的国际环境给时间序列带来的短期冲击。例如,观察大宗商品镍和锡2013年1月—2022年6月在英国LME的官方现货价格波动趋势(见图1)均可以发现,在2014年克里米亚危机、2020年新冠疫情蔓延、2022年俄乌冲突期间,大宗商品价格均出现了与长期趋势不符的情况,但是并未根本背离长期趋势的异常波动,并且该波动带入了短期冲击所带来的长期趋势的变化,给价格曲线引入了额外的波动动力。
因此,本文从当前国际经贸环境出发,结合企业实际和我国相关公司迫切的大宗商品尤其是大宗金属原料价格的科学预测需求,引入深度学习理论中最新的LSTM神经网络模型,借助该模型适当兼顾短期波动并纳入长期记忆模型特征,对大宗商品的价格预测机制进行研究。
一、LSTM神经网络模型概述
长短期记忆网络——通常被称为LSTM,是一种特殊的循环神经网络(简称RNN),能够学习长期依赖性。公共LSTM单元由单元、输入门、输出门、忘记门组成。该单元可记住任意时间间隔内的值,并且由3个门控制进出单元的信息流。LSTM网络非常适合基于时间序列数据进行分类、处理和预测,因为在时间序列中的重要事件之间可能存在未知持续时间的滞后。开发LSTM是为了处理在训练传统RNN时可能遇到的爆炸和消失的梯度问题。对于间隙长度的相对不敏感性是LSTM相对于RNN、隐马尔可夫模型和其他序列学习方法在许多应用中的优势。
如图2所示,LSTM的单个循环结构(又称为细胞)由输入门、遗忘门、输出门和单元状态组成。其中,输入门决定当前时刻网络的输入数据有多少需要保存到单元状态,遗忘门决定上一时刻的单元状态有多少需要保留到当前时刻,输出门控制当前单元状态有多少需要输出到当前的输出值。
图2 LSTM核心结构
LSTM是一种特殊的RNN,两者的区别在于普通的RNN单个循环结构内部只有1个状态。而LSTM的单个循环结构(又称为细胞)内部有4个状态。相比于RNN,LSTM循环结构之间保持一个持久的单元状态不断传递下去,用于决定哪些信息要遗忘、哪些信息要继续传递。
大宗商品价格时间序列中所包含的预测信息往往同时存在于长期信息和短期信息中,因此LSTM兼顾长期信息传递和短期信息影响的结构,对于在外部环境较为复杂、系统外冲击较多的新时代大宗商品价格预测具有较好的应用意义。
二、面向大宗商品价格预测的LSTM与EEMD融合模型设计
基于经验模态分解理论,在当前复杂经济形势下,任何大宗商品价格序列作为非线性、非平稳、高信噪比的时间序列,都可以被分解为若干个频率特征不一样的、对称的、局部均值为零、过零点和极值点数目相同的本征模函数(简称IMF),从而实现对该时间序列的平稳化处理。经过本文实践发现大宗商品价格时间序列数据的经验模态分解(简称EMD)后IMF信号中出现了不同的时间尺度,由此,为了使时间序列的IMF分量能够实现单一模态分解,本文参考集合经验模态分解(简称EEMD)理论,将正态分布的白噪声加到原始时间序列中,经过EEMD分解后的大宗商品价格时间序列在各个IMF本征模分量上可在不同尺度上呈现更加清晰的特征和规律,从而为LSTM神经网络挖掘原时间序列的内在规律和波动特征提供有效帮助。
因此,针对大宗商品价格预测的应用,本文使用自适应的EEMD方法对大宗商品价格时间序列进行分解之后,对每个分解后的IMF序列进行LSTM建模分析。本文定义σ为门单元控制函数sigmoid函数,W为该神经网络的权重矩阵,b为偏置向量。
由此,基于该定义,首先本文借助LSTM网络,设计大宗商品价格信息的遗忘门f t,见式(1)。
其中ht-1表示上一个时间单位的隐藏层状态,x t是当前t时刻的时间序列数据,通过该遗忘门函数确定上一时刻大宗商品价格信息的保留范围,并将其作用于上一时刻的大宗商品价格规律记忆信息ct-1。
其次,结合遗忘门的机制,本文设计输入门来确定保留多少当前时刻的大宗商品价格信息输入到当前时刻的神经网络单元状态。本文以上一时刻的隐藏层状态h t-1和当前时刻大宗商品价格时间序列数据x t,通过1个tanh函数来得到1个(-1, 1)的取值作为输入门阈值,得到此刻的备选大宗商品价格规律记忆信息,见式(2):
同时h t-1和xt通过输入门确定输入范围作用于,通过遗忘门对上一刻的大宗商品价格记忆信息的保留和输入门对备选记忆信息的选择,得到了当前时刻的新的大宗商品价格规律记忆信息ct,见式(3):
其中:i t=σ·(Wi·[h t-1,xt]+bi)。
最后,本文以输出门确定大宗商品价格规律信息输出h t,见式(4):
即上一时刻的隐藏层状态h t-1和当前时刻大宗商品价格时间序列数据xt先通过输出门后确定输出范围,再通过1个tanh函数对当前大宗商品价格信息记忆信息ct进行部分选取,经过输出门确定信息输出h t。模型设计结果如图3所示。
图3 面向大宗商品价格预测的LSTM模型设计
三、结合集合经验模态分解的LSTM神经网络预测算法实现
基于EEMD和LSTM融合的模型,本文以Python语言为基础,首先借助PyEMD系统工具包构建了对时间序列进行EEMD经验模态分解的程序,在分解后序列基础上,使用Keras构建LSTM神经网络对大宗商品时间序列数据进行深度学习,在形成分别针对高频序列、低频序列和趋势序列的预测模型后,以该模型外推获取对3个序列的未来值估计,最后将其反向EEMD合并为时间序列数据,从而作出对大宗商品时间序列未来值的预测。
1.大宗商品价格数据EEMD分解
在EEMD实现过程中,首先在添加正态分布白噪声的基础上,针对大宗商品价格时间序列xt,找出局部最大值和局部最小值点。然后利用3次样条函数分别对这些局部最大值和局部最小值点进行插值得到xt的上包络线u t和下包络线l t,获取上下包络线的均值:m t=(u t+l t)/2,则m t为上下包络线的均值。最后令h t=xt-m t;检查h t是否满足IMF 的条件,如果不满足,则继续上述迭代过程至到某h t符合IMF 的条件。
以英国LME交易所镍金属官方现货价格指数为例,本文对2013年1月—2022年6月镍现货价格时间序列每日数据共2388项进行EEMD分解之后,得出10个IMF 本征模分量和1个剩余分量,LME交易所镍金属官方现货价格EEMD分解结果见图4。
图4 LME交易所镍金属官方现货价格EEMD分解结果
从图4中可以发现,IMF 1~IMF 10为频率从高到低的10个本征模分量,而Res剩余分量代表了大宗商品价格的长期走势,即趋势项。
2.基于IMF特征模分量序列的LSTM网络预测
基于对IMF各个本征模分量的波峰间距观测可以发现各个不同频率序列的时间宽度,因此以该时间宽度作为预测窗口长度,分别构建LSTM神经网络来学习各个高频、低频和趋势序列的规律,从而分别预测这些序列的未来值。
以上文镍金属现货价格为例,经过分析可以发现,除了周期未达到1个周期而无法判定时间宽度的IMF 9和IMF10以外,各个本征模分量的时间宽度如表1所示。
表1 各IMF分量时间周期宽度
由于IMF9、IMF10、Res趋势项这3个分项均为低频项并反映大宗商品价格时间趋势,其波动趋势与IMF8相似,因此本文将其时间窗口宽度设定为与IMF8相同以简化处理过程。
基于该时间周期宽度的设定,本文为每个IMF分量都构建了LSTM神经网络,以8∶2的比例分割原始数据集,其中90%历史数据作为训练数据,10%作为验证数据,取MSE作为预测误差评判指标。借助Keras库搭建了1个按照各个IMF分量时间周期为输入层,32个神经元的LSTM层和1个将32个中间结果集合到1个预测值上的Dense层的3层LSTM神经网络,对各个IMF分量的值进行预测,并将验证集中的预测结果和真实值做比较的建模结果如图5所示。
图5 LME交易所镍金属官方现货价格IMF序列LSTM预测结果
通过考察各IMF分量中验证集预测序列与真实值序列的预测结果(MSE) (见表2)可以发现,将大宗商品价格时序数据进行IMF分解后进行LSTM预测的效果较好,能较好地挖掘出大宗商品价格在各个不同频率周期中的规律。
表2 各IMF分量LSTM预测结果(MSE)
最后,针对残差序列所代表的趋势项,本文同样采用LSTM神经网络对其发展趋势进行预测,得到的结果如图6所示,预测结果MSE为2.707 0e-04,反映了LSTM算法的预测精度较好。
图6 LME交易所镍金属官方现货价格Res残差序列LSTM预测结果
3.高频、低频、趋势序列预测结果合并
由于本文所采用的EEMD分解在进行EMD分解前,加入了与大宗商品价格时间序列中的高斯分布白噪声相抵消以完成去噪功能的白噪声序列,因此在信号重构过程中,本文直接选取全部IMF分量进行重构,以保证算法的普适性,避免主观选取部分IMF带来的噪声放大问题。
基于本文所获得的IMF预测序列和Res残差预测序列,直接对所有分量序列进行加和重构后得到的预测结果序列与验证集中真实值对比如图7所示,通过该图可以发现基于EEMD和LSTM进行预测得到的预测结果较为可靠。
为了对比不同算法模型在大宗商品价格时间序列预测的效果,本文以未进行EEMD分解的原始价格序列进行LSTM神经网络建模和传统的ARIMA模型分别对LME交易所金属价格进行预测,在验证集得到的预测结果与原数据对比得到的MSE如表3所示。可以发现,经过EEMD分解后进行LSTM神经网络预测的效果明显优于其他传统算法和直接使用原始时间序列进行建模预测的效果。
表3 不同模型验证集预测结果(MSE)
针对国际动荡环境下受外部冲击较多的大宗商品价格时间序列所存在的预测难点,本文根据该时间序列特点引入了集合经验模态分解方法EEMD对时间序列进行分解,并对分解后的IMF 时间序列分量和Res残差序列分别构架不同的LSTM网络进行训练,借助深度学习算法挖掘其中的变化规律并进行预测,从而克服了传统时间序列算法存在的不同频率序列窗口重叠带来的干扰,得到的结果更加科学可靠,对于大宗商品价格的预测有科学的指导意义。○