APP下载

基于EMD-LSTM的国际黄金期货价格预测

2023-11-07杨晨陈贵词

关键词:期货价格黄金分量

杨晨,陈贵词,

(1 武汉科技大学 理学院,武汉 430065;2 武汉科技大学 冶金工业过程系统科学湖北省重点实验室,武汉 430065)

黄金是一种兼具了商品属性和货币属性的特殊的有色金属,它既具有珠宝饰品装饰美化的作用,又是重要的工业生产原料.黄金良好的延展性,稳定的化学性质决定了它成为人类商品社会中最适合充当货币的商品.同时黄金还具有良好的投资、价值储藏功能,广泛受到国内外个人、机构投资者以及政府的青睐.随着各国对于金融市场管理经验越发丰富,现有金融市场不再是全民投资股票市场,而是同时关注期货、期权等市场的投资机会.黄金市场在金融市场中的地位逐步提升,已成为与股票市场、期货市场、债券市场同等重要的金融投资市场.作为黄金市场衍生品之一的黄金期货,具有价格发现、套期保值、风险规避三项职能.但由于黄金期货会受各方面影响,其价格频繁剧烈波动给黄金期货持有者造成了很大的风险,因此黄金期货价格如何变化是学者和广大投资者关注的重点,准确有效地预测黄金期货价格也具有极为重要的理论意义和应用价值.

鉴于黄金期货价格的波动性,如何透过复杂的现象了解黄金期货价格的走势是黄金投资者非常关心的重要课题.目前,国内外学者对期货价格预测的方法进行了大量探索,从最初的线性模型[1]到非线性模型[2],从传统统计模型[3]到现在的智能模型[4].传统的统计模型主要是时间序列中的ARIMA和GARCH 等、主成分分析以及各种回归模型.梁超等[5]采用主成分分析和回归模型的组合预测方法构建黄金价格波动率的预测模型,实验显示构建的组合模型的预测精度最优.MADZIWA 等[6]建立自回归分布滞后(ARDL)模型来预测年度黄金价格,并与随机均值回归和ARIMA 模型比较,发现ARDL 模型效果最佳.智能模型主要包括机器学习模型.刘璐等[7]通过比较单向LSTM 和双向LSTM、ARIMA、SVR、RNN 模型对黄金期货价格序列的预测效果,得出双向LSTM 的预测效果是最佳.后来针对单一模型的不足,学者发现组合模型的预测效果更好.张品一[8]构建多输入的GA-BP神经网络模型预测黄金价格,结果表明GA-BP 神经网络能更加准确地预测黄金价格走势.由于黄金期货价格属于金融序列,具有非平稳非线性的特征,部分学者发现信号分解方法可以将数据变得平稳,与机器学习模型结合可以大大提高模型精度[9].王文波等[10]应用EMD分解算法、混沌分析和神经网络理论提出了一种中国股票市场建模及预测的组合模型,提高了模型对多种目标函数的学习能力,有效提高了精度.贺毅岳等[11]将CEEMDAN 与LSTM 结合提出股市指数集成预测方法,并以5个代表性股市指数为测试数据,结果表明CEEMDAN-LSTM 模型具有更低的预测误差和滞后性.景志刚等[12]应用小波分析将黄金价格分解并输入到LS-SVM-ARIMA 模型中能更为准确地预测其走势.

综上所述,为了寻找一种更适合国际黄金期货价格预测的方法,建立EMD-LSTM 模型.通过EMD对国际黄金期货价格序列进行分解,并将其与相关影响变量作为LSTM 模型的输入,并与SVR、RF、RNN 和单一的LSTM 模型进行对比,结果表明:本文建立的EMD-LSTM 模型预测精度得到了提升,且评价指标最优.

1 指标的选取与说明

本文选取国际黄金期货作为研究样本,因美国纽约COMEX 分部是全球最大的黄金期货交易市场,它的交易情况可以影响全球金价的走向,因此对COMEX 黄金期货价格进行预测,并将其作为输出层指标.

美元指数USDX(US Dollar Index,USDX)是六种主要世界货币对美元加权几何平均计算,是当前反映美元汇率的一个非常重要且有效的指标,可以用来衡量美元对与世界主要货币的强度,且目前的国际黄金期货价格主要以美元标价,与美元指数呈现负相关关系.

由于黄金期货价格会受到美国股票市场的影响,股市下跌,经济下滑,导致资金外流,黄金作为避险资产会受到投资者的追捧,出现金价上涨的情况.而纳斯达克综合指数(Nasdaq Composite Index,NDQ)、道琼斯工业平均指数(Dow Jones Industrial Average Index,DJI)、标准普尔500 指数(Standard &Poor's 500 Index,SPX)这三大股指较能彰显美国股市的发展趋势.

因此本文根据相关文献[13-17]选取美元指数、纳斯达克综合指数、道琼斯平均工业指数、标准普尔500 指数为影响国际黄金期货价格的关键因素,作为输入层指标.选取2011年1月1日至2021年12月31 日十年每日的COMEX 黄金期货、纳斯达克综合指数、道琼斯平均工业指数和标准普尔500 指数交易日收盘价进行研究,采用数据均来源于新浪财经.输入层和输出层指标数据的描述性统计如表1所示.

表1 变量的描述性统计美元Tab.1 Descriptive statistics of variables

2 理论介绍

2.1 EMD分解

经验模态分解(Empirical Mode Decomposition,EMD)是黄锷博士[18]于1998年提出的一种针对非线性、非平稳复杂时间序列的自适应数据分解算法,它克服了小波分解的基函数需要设定的问题.其本质是对一个复杂信号的平稳化处理,通过一种固定模式将任意一个信号分解为若干个固有本征模态函数(Intrinsic Mode Function,IMF)和一个残差趋势项(Residual,Res),其中每一个IMF分量代表原始信号在不同频率段的震荡变化,反映了原始变量的局部特征,残差趋势项反映信号中的缓慢变化量.IMF分量的确定需满足以下两个条件:

(1)该分量的局部极值点与过零点的数目必须相等,或最多相差一个;

(2)在任意时刻,由该分量局部最大值点通过三次样条插值定义的上包络线和局部极小值点定义的下包络线的均值为零.

EMD的具体分解过程[19-20]如图1所示.

图1 EMD分解流程图Fig.1 Flow chart of EMD decomposition

(1)找到原始信号序列X(t)的局部极大值点和局部极小值点;

(2)使用三次样条插值法拟合出局部极值点的上下包络线u0(t)和l0(t),并求出局部上下包络线的均值m0(t);

(3)用原始序列信号X(t)减去均值m0(t),得到分量h1(t);

(4)判断h1(t)是否满足IMF 的两个特点;若满足,则h1(t)为提取到的第一个IMF 分量,令X1(t)=X(t)-h1(t),用X1(t)代替原始序列X(t);若不满足,则用h1(t)替代原始序列X(t),重复上述步骤直到hk(t)满足IMF 条件,至此可以找到第一个IMF 分量imf1.

(5)将剩余序列r1=X(t)-imf1作为新的分解序列,重复步骤上述步骤,直到信号最后剩余部分rn是单调序列或者常值序列,此时已经无法再提取出新的IMF分量.

最终原始序列X(t)被分解为:

先分解出的IMF 分量为原始序列中的高频部分,也是含噪较高的一部分;rn为原始序列的趋势项,它反映了原始序列X(t)的趋势.

国际黄金期货价格序列属于金融序列,而金融序列通常都具有非平稳、非线性的特点,容易受到各方面因素的影响.本文使用EMD 分解对COMEX黄金期货价格序列进行平稳化处理,自适应地提取出几个具有周期性特征的IMF分量和res余项,从而有效提升模型的精度.

2.2 LSTM深度神经网络

长短时记忆网络(Long Short Term Memory,LSTM)是循环神经网络(Recurrent Neural Network,RNN)的一种变体,最早由HOCHREITER 和SCHMIDHUBER[21]提出.后由GRAVES[22]改进,使得LSTM 网络得到了进一步推广.LSTM 网络模型主要是为了解决传统RNN 在长序列训练过程中因时间流逝、网络层数增多而带来的梯度消失和梯度爆炸的问题[23].LSTM 网络从经验中学习,适用于处理和预测时间延迟的时间序列,且性能优异.经典的LSTM 网络的内部结构主要由三个门组成,其记忆单元如图2所示.

图2 中Ct-1和ht-1分别为上一个时刻的LSTM 细胞层的细胞状态和输出;3 个σ为对应于遗忘门、输入门和输出门的sigmoid 激活函数,tanh 层创建新的候选细胞状态LSTM细胞单元更新规则如下.

遗忘门控制t-1 时刻记忆细胞中需要丢弃的信息,读取t-1 时刻的输出ht-1和当前t时刻的输入x(t),输出ft并保存在Ct-1中:

输入门记忆t时刻的信息和经遗忘门保留后的t-1时刻的信息,并保存在候选细胞状态中,将t-1 时刻的细胞状态Ct-1和t时刻候选细胞状态合并更新,输出t时刻的细胞状态Ct:

输出门选择部分经遗忘门和输入门筛选后的信息输出为ht:

其中:σ为sigmoid 激活函数,Wf、Wi、WC和WO分别为遗忘门、输入门、tanh 函数和输出门的权重,bf、bi、bC和bO为对应的偏差,it和Ot分别为输入门的输出和输出门的输出.

2.3 网格搜索

网格搜索(Grid Search,GS)是智能优化理论中的一种最常用的基础算法,其核心思想是运用枚举的方法对模型中的超参数进行协同优化.主要原理是将待确定的超参数组合为多维空间,确定每一个超参数的寻优范围及搜索步长,以各超参数为正交轴构建多维网格,每一个网格对应一个超参数组合,并使用交叉验证对每一组超参数对应的模型进行评估,最终返回评分最高的模型对应的超参数组合,确定最优的模型.

2.4 EMD-LSTM模型的构建

基于以上讨论,本文将EMD与LSTM结合,建立国际黄金期货的价格预测模型,并应用网格搜索对LSTM 超参数进行寻优.模型的预测和寻优过程如图3所示.

图3 EMD-LSTM算法流程图Fig.3 Flow chart of EMD-LSTM algorithm

步骤1:获取原始序列,对数据进行预处理;

步骤2:对处理后的数据用EMD 分解将国际黄金价格序列分解成若干个IMF 项和残差项,将分解后的IMF 分量与影响变量重组,并划分为训练集和测试集;

步骤3:将训练集作为输入建立LSTM 模型,用网格搜索对LSTM 模型进行超参数寻优,并返回最优的超参数组;

步骤4:把测试集输入到步骤3 中训练好的模型,完成预测验证.

3 预测结果分析及对比

3.1 数据预处理

本文选取2011 年1 月1 日至2021 年12 月31 日十年每日的COMEX 黄金期货、纳斯达克综合指数、道琼斯平均工业指数和标准普尔500指数收盘价为样本.由于变量存在交易日期不一致的问题,因此日期均以COMEX 黄金期货价格数据为基准进行筛选,去除双休日及节假日共2852 个样本.各期货价格易受其滞后性影响,因此缺失值用上一个交易日的价格补充.

为消除变量之间因量纲差异对模型的影响,首先对数据进行归一化处理,以解决数据之间的可比性,加快训练网络的收敛性,提高模型的预测精度.根据数据集的特点和模型的要求,本文采用最大最小归一化法,将原始数据转化到[-1,1]之间.

其中:x为原始数据,x'为所有归一化之后的数据.

在建立LSTM 模型之前,还需要把时间序列数据转化为监督学习问题[14],再使用LSTM 输入X到输出Y的映射关系.本文使用滑动窗口来构建样本,窗宽为5,预测未来一天的COMEX 收盘价.通过数据后移形成一系列相互覆盖的样本数据,每次移动步长为1 个单位长度,输入数据t和预测数据t-1 的滑动窗口结构图[25]如图4所示.

图4 滑动窗口结构图Fig.4 Slide window structure diagram

3.2 模型评价指标

本文采用均方误差(Mean Square Error,MSE)、平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Squared Error,RMSE)和拟合优度R2作为模型的评价指标,计算公式如下:

其中:n为样本个数,yi为序列真实值,为序列预测值,为序列均值.

3.3 模型预测及对比

使用EMD对COMEX 黄金期货收盘价格序列进行分解,将其分解为9 个IMF 分量和一个Res 趋势项,如图5所示.

图5 COMEX黄金期货收盘价的EMD分解结果Fig.5 EMD decomposition results of COMEX gold futures closing price

将分解后的序列重组,建立LSTM 网络模型.LSTM 网络模型由一层隐藏层,一层dropout 层和一层全联接层构成;隐藏层的单元个数为200个;以归一化后的预测值和和真实值的MSE 和MAPE 作为损失函数;使用Adam 优化算法更新网络参数;dropout 层丢弃神经元比例为0.1,以防止模型出现过拟合问题;激活函数为tanh 函数;使用网格搜索对batch_size 和训练次数寻优,最终得到最优的batch_size为75,最优训练次数为200次.

为进一步验证所提模型的有效性,采用支持向量回归(Support Vector Regression,SVR)、随机森林(Random Forest,RF)、LSTM、RNN 四种模型对COMEX 黄金期货价格进行预测,来进行对比实验,并计算出各个模型在测试集上相应的评价指标以进行评判.通过网格搜索确定SVR 和RF 模型的最优超参数组得到:SVR 模型的最优核函数和惩罚函数为0.1 和10;RF 模型的最优迭代次数为50;为证明改进模型的有效性,LSTM 和RNN 模型的超参数与EMD-LSTM模型相同.

对比表2 的结果可知:EMD-LSTM 模型的MSE、MAE 和RMSE 比SVR 模型降低了5.59%、19.27%、19.97%,比单一的LSTM 模型降低了0.13%、1.69%、1.41%,比RNN 降低了0.05%、0.7%、0.6%,比RF 模型的MSE 和RMSE 降低了0.05%、0.54%,而MAE 增加了1.36%.从整体上看EMD-LSTM 模型的各项误差值是最小的,且EMD-LSTM 模型的R2比SVR、LSTM、RNN 和RF 分别增加了83.29%、2%、0.78%和0.59%.根据误差值和R2来看,本文使用的模型误差最小,R2最高,模型的精度相较于传统模型和单一的LSTM 模型有所提升.因此本文使用的EMD-LSTM模型能有效提升模型的精度,预测效果更好.

表2 不同预测模型在COMEX黄金期货收盘价的评估结果Tab.2 Evaluation results of different prediction models on COMEX gold futures closing price

为了直观地表现各种模型的预测差异,将2020年和2021 年收盘价预测结果分段展示.由图6 可见:这几种模型均可预测出COMEX 黄金期货价格的大致走势,但RF、RNN 和EMD-LSTM 模型的预测结果比SVR 和单一的LSTM 模型更加接近真实值,在原始数据波动较大的情况下RF、RNN 和EMD-LSTM对原始数据波动的刻画更加精确.从图6(b)可见:在2020年8月原始数据值波动较大的时,RF预测为一条水平线,与实际走势相差很大.RNN在2020年上半年的预测值与实际值相差不大,但在图6(b)-图6(d)中可见,自2020年8月后的预测效果稍有偏离实际值的曲线.而本文使用的EMD-LSTM 预测效果一直很稳定,始终与原数据保持一致的趋势,具备更好的跟随性和波动性,与实际值更加接近,且其各种误差也明显小于SVR、RF、RNN 和LSTM 模型,拟合优度更高,二者结合进一步说明了EMD-LSTM 模型比SVR、RF、RNN 和LSTM 模型的预测效果更佳,精度更高.

图6 2020—2021年预测结果Fig.6 Forecast results from 2020 to 2021

4 结语

本文以国际黄金期货价格为研究对象,选取了纳斯达克综合指数、道琼斯平均工业指数和标准普尔500 指数收盘价作为影响变量,对数据数据集进行最大最小归一化处理.针对金融序列非平稳非线性的特点,对COMEX黄金收盘价进行EMD分解.将分解得到的IMF 分量与原数据重组,并作为LSTM网络模型的输入.利用网格搜索对LSTM 模型的超参数寻优减少人为因素的影响,提高了模型的精度.通过与其他机器学习模型对比,证实了EMD-LSTM模型的预测误差更小,拟合优度更高,其精度优于SVR、RF、LSTM 和RNN 模 型,能够更好地预测COMEX黄金期货价格.

猜你喜欢

期货价格黄金分量
黄金雨
帽子的分量
盛逝
红枣期货价格大涨之后怎么走
六连跌后,黄金何去何从
论《哈姆雷特》中良心的分量
分量
基于ARIMA模型的沪铜期货价格预测研究
国际市场主要油品期货价格表
买入黄金好时机到了吗