基于LSTM神经网络模型的铁矿石期货市场实证研究
2024-01-12斯燕陈艺
斯燕 陈艺
摘要:随着国际大宗商品在金融和经济领域的影响力不断增强,会通过产业间的波及效应作用于物价水平,进而影响到国家的经济增长。近几年掀起了机器学习研究的热潮,基于机器学习的投资量化分析也越来越受到关注。文章基于LSTM神经网络模型,选取了2021年9月至12月底的铁矿石主力合约高频数据建立了趋势预测模型。实验结果表明,该模型拟合良好,能够较好地预测铁矿石期货短期内的趋势。
关键词:机器学习;LSTM神经网络模型;铁矿石期货;量化投资
一、引言
随着社会经济的不断增长,科学技术的不断提高,机器学习在对数据分析方面展现其绝对优势。在信息时代的今天,合理应用机器学习技术具有十分重要的作用,它可以科学高效地处理海量数据信息,给人们的生活和工作带去极大的便利,各行各业也在该技术的发展应用中不断进步,尤其将机器学习模型应用到量化交易市场越来越受到重视和追捧。在大数据背景下,利用机器学习技术不仅对大宗商品市场的发展与趋势预测都有很重要的影响,而且对我国经济发展也起到非常重要的影响。近几年大型证券公司、私募基金、金融机构纷纷增加人力物力财力进行机器学习量化模型构建与策略分析。
铁矿石是钢铁行业的重要原料之一,被我国广泛应用,需求量非常大,因此铁矿石价格的波动对我国相关企业以及国民经济都有重要影响。铁矿石期货是一种金融衍生产品,一般是以铁矿石原料为标的物的期货品种,并且利用期货合约的标准化特性,在未来约定的时间进行交割的交易合同。我国2013年开始可以在大连商品交易所上市交易铁矿石期货合约,至今一直保持着稳步发展,合约制度日趋合理。通过大量阅读参考文献,发现目前国内外专家学者针对铁矿石期货研究主要围绕:期货价格影响因素研究;铁矿石期货国际化研究;铁矿石期货的量化分析,其中有传统的时间序列模型分析和人工智能算法研究。专家学者们在进行量化交易的大量研究成果中提出了理论模型,并通过实证研究对模型进行检验,不断优化与完善。同时发现当前基于机器学习的量化投资模型更多集中在股票市场,大宗商品期货市场并不多。因此本文尝试通过LSTM神经网络模型对铁矿石期货市场进行量化分析,以便为后续进行更深入研究起到抛砖引玉的作用。
二、影响铁矿石期货价格因素
大宗商品主要由能源商品、基础原材料以及农副产品组成,铁矿石的价格波动在大宗商品中异常活跃,而且我国是铁矿石进口大国,对外依存度相當高,因此对其价格波动进行预测是非常必要。想了解其价格变化,需要深入研究影响铁矿石价格波动的因素。
(一)供需因素
在对铁矿石价格运用LSTM神经网络模型预测前需要分析其价格波动的影响因素。根据美国地质调查局(USGS)在《Mineral Commodity Summaries 2021》报告中公布,全球2020年铁矿石原矿的储量约1800亿吨。全球铁矿石资源主要集中在四个国家(澳大利亚、巴西、俄罗斯和中国),可用铁矿石储量共占全球储量的70%以上。铁矿石是钢铁的重要原料,基础设施、楼宇建设等领域均需大量的钢铁,尽管我国是铁矿石储量和产量大国,但每年依然进口大量铁矿石且逐年攀升,从2015年起铁矿石对外依存度突破80%,截至2021年年末,进口量为11.26亿吨,当年全球铁矿石产量约为26亿吨,近一半的铁矿石进口到我国。从我国铁矿石进口来源地来看,据统计,2021年我国主要从澳大利亚和巴西进口,从澳大利亚进口铁矿石达到6.94亿吨,尽管进口量下降2.7%;但占全部进口矿的比重为61.65%,比重依然很高。从巴西进口铁矿石2.38亿吨,进口量增长0.8%,占全部进口矿比重21.10%。铁矿石价格比2020年上升1.6%,其价格上涨并没有让非主流矿占比扩大,相反使得供给端更为集中。通过数据预计未来我国依然是全球铁矿石进口大国,铁矿石高度依赖从澳大利亚和巴西两国进口。当供给量下降或需求量提升,铁矿石的价格就会上涨。
(二)政治及政策因素
国际政治因素对期货价格波动起着非常重要的作用。澳大利亚是我国铁矿石主要输出国,但随着中澳关系日趋紧张,我国从澳大利亚铁矿石进口量明显减少,数据显示,2021年前11个月,中国自澳大利亚进口同比下降了4.9%还不到2020年全年的九成,但同年基础建设规模保持稳定增长,因此对铁矿石的需求依然强劲,在双重作用下,铁矿石在2021年6月高达214.43美元/吨,超2019年均价2倍以上。国内政策因素对铁矿石期货价格在短期内有较强的影响,我国近几年一直提倡绿色环保理念,因此对矿石开采已经钢铁厂的污水排放、环境污染等环保指标有严格要求,这让许多小规模的矿石开采企业出现成本增加,开工工时缩短,开工率不足等问题,直接导致本国铁矿石供给量下降,从而推高铁矿石价格。
(三)金融货币因素
国际铁矿石的价格是以美元计价,中国进口铁矿石需要支付外汇,汇率的波动直接影响国内铁矿石的价格。美元如果上涨意味着需要花更多的人民币进口铁矿石,购买相同数量的铁矿石将支付更高的成本,因此国内的进口商们会减少铁矿石进口量。美国进入加息缩减美债周期,美元进入强势上涨通道,2021年1美金兑换6.4元人民币,进入2022年7月之后美元汇率一路走高,已经突破1美金兑换7元人民,未来还会持续上涨,这对我国的出口贸易有着非常好的支撑,但进口铁矿石显然不利。
(四)经济发展因素
铁矿石价格在很大程度上受经济发展的影响,如2008年欧债及美债危机,全球经济都受到极大的影响,企业开工不足,钢材的需求端急剧萎缩,以至于铁矿石的需求也下降,导致库存积压。近两年,由于新冠疫情影响,铁矿石供应链的稳定性受到严峻考验,澳大利亚、巴西的铁矿石主要生产国供应持续中断,随着疫苗的推广,疫情给铁矿石生产带来的负面影响将逐渐降低,铁矿石的生产逐渐恢复正常,铁矿石尤其是2101合约的上涨空间逐渐收窄。
综上可以看出,铁矿石价格波动受供需因素、金融货币因素、政治、政策因素等诸多因素作用,当然还有国际海运价格、大资金介入的投机等因素,要准确预测其价格波动非常困难,在此通过收集大量的高频交易数据借助机器学习量化模型对铁矿石价格趋势进行分析,找到其变化的规律,从而可以有效规避铁矿石进口风险,降低进口成本。
三、铁矿石期货价格实证分析
(一)实验环境
本文中使用windows10操作系统,python3.7环境,深度学习框架为tensorflow2.3.1版本,除此以外在本文的编程中还使用numpy、pandas、matplotlib、os等python第三方数据库。LSTM在一定程度有效地弥补了循环神经网络(Recurrent Neural Network,RNN)在梯度消失、爆炸和长期记忆力不足等三个方面的问题,从而能有效地使得RNN利用长距离的时序信息。
本研究主要以铁矿石期货价格预测为研究对象,并在LSTM铁矿石价格预测模型建立、LSTM网络训练、预测结果的评价等方面进行详细研究,从而为铁矿石的价格研究以及交易策略等提供参考意义。
(二)LSTM神经网络模型
神经网络(Neural Network,NN)最早于19世纪中期提出,具有三层结构,可以从输入层输入训练样本的特征向量,然后通过隐藏层计算,最后从输出层获得分类结果,但单层感知机处理简单问题尚可,一旦后处理复杂问题就无能为力。随后出现了较为强大的RNN有效解决时序问题,通过循环的链式结构,神经元可以让不同阶段的序列数据所包含的信息得以保留。LSTM是一种改进的RNN结构,通过改变隐藏层的内部结构来解决了RNN中梯度消失的问题。LSTM保留了RNN神经网络分析时间序列的优势,只是在内部结构上进行了改变。LSTM神经网络如图1所示,对比传统RNN,LSTM在网络结构中具有“遗忘”单元,这使得它能够进行更长时间跨度的预测。一系列循环连接的记忆单元组成了LSTM神经网络,每个记忆单元包括一个或多个自连接的细胞,以及遗忘门(Forget gate)、输入门(Input gate)和输出门(Input gate)。
1. 遗忘门
在机器学习中,遗忘门控制着LSTM单元中的“记忆细胞”是否保留之前的状态。它接收上一时间步的信息ht-1和当前时间步的数据xt,并生成介于0~1之間的向量。该值表示要保留的记忆量,当其越接近 0 意味着越应该忘记,越接近 1 意味着越应该记住。计算公式如下:
公式中的ht-1表示前一个细胞单元的输出,xt表示现在细胞单元的输入。w 和 b 分别表示遗忘门里的权重矩阵、偏置向量,σ代表激活函数 sigmoid。
2. 输入门
输入门决定如何将当前的输入合并到记忆细胞中。含有σ(sigmoid)函数的输入门可以更新那些有需要被更新的信息,然后tanh层生成新的值。
3. 输出门
输出门主要控制着LSTM中细胞单元的输出。通常先用σ(sigmoid) 函数输出LSTM细胞单元状态的一部分,接着用 tanh 函数处理细胞单元的状态,最后可以获得当前时间步的输出ht。一旦输出门的输出结果被细胞单元状态确定,继续通过 sigmoid 函数输出细胞单元状态的一部分,接着tanh 函数处理细胞单元状态,最终可以获取当前时间步的输出ht。
(三)LSTM模型建立
通过以下四个步骤建立LSTM模型。
1. 数据处理
选取铁矿石期货数据,共计243天数据,数据每5分钟一条数据,每天期货数据由9:00~11:30、13:30~23:00两个时间段构成,每天共计有69条数据,数据预处理过程主要针对数据类型、数据字段、数据缺失值情况进行查看,在本文使用数据中,不存在缺失值情况,且需要字段均为浮点型数据,因此无须针对数据缺失值进行处理。
本文中选取数据中的“开”“高” “低” “收”四个字段作为输入特征,选取“收”这单一字段作为输出特征,使用当前日期前5天数据即69*5=345条形状为345*4的数据作为输入,预测当前日期后一天的收盘价格,即69条形状为69*1的数据。
2. 模型参数设定
在设定的LSTM模型中,在输入层中主要规定输入数据的大小,本文中输入数据为345*4的输入格式;其次为第一层LSTM层,其中神经元数量设置为32,紧接着设置Dropout层,参数为0.4,这一层的主要目的是针对上一层随机丢弃40%的神经元,防止出现过拟合现象;第二层LSTM层,其中神经元数量为16,紧接着设置Dropout层,参数为0.5;最后一层为Dense输出层,共有69个神经元,即预测当前日期后一天的69条数据。本文中设置的深度学习模型使用Adam为损失函数,学习率设定为0.0001,使用平均绝对误差(MSE)为损失函数,训练轮数为100轮,单次训练数据(batch_size)数量为256组。
3. 模型训练
使用时间滑窗法得到数据集,共计13654条数据,使用前9558条数据为训练数据集,后4096条数据为测试集数据;根据上一步操作进行深度学习模型参数设定,然后反复训练深度学习模型,训练过程如图2所示。随着训练轮数的增加,模型损失率在不断减小,在训练100轮左右,模型已经接近收敛。
4. 模型预测及评价
将测试数据集带入训练好的模型中,对测试数据集展开预测并获得预测结果,预测结果和实际测试集数据对应结果进行对比,以评价预测效果;模型预测结果与真实数据对比(见图3);由图3可知,预测结果整体趋势与真实数据基本相同。
为了提升量化 LSTM 模型对铁矿石期货预测的精度,本文采用了四种量化分析指标来评估预测精度。一是平均绝对误差(Mean Absolute Error,MAE),MAE可以评估模型对预测值与真实值之间偏差的大小,越小表示模型的预测精度越高。二是均方根误差(Root Mean Square Error,RMSE),RMSE与MAE相比,对预测误差的敏感度更灵敏,它对较大的预测误差会给予更高的惩罚。三是平均绝对百分比误差(Mean Absolute Percent Error,MAPE),在不同取值范围下MAPE评估模型的预测精度,并给予较大取值的更高权重,因此适用于比较不同数据集的模型性能。四是决定系数(Coefficient of Determination,R2),表示模型所解释的数据方差相对于总方差的百分比,R^2是一个标准统计指标,取值范围从0到1,越接近1表示模型的预测能力越好。四个指标计算公式如表1所示。
其中,i为 第i个时间步;N为总时间步; i为预测数据;yi表示真实数据; 表示真实数据的平均值。
依据第四步中采用四种评价方法对测试数据预测结果进行评价,评价结果如表 1 所示。根据上述评价指标可得,模型拟合良好,平均绝对误差、均方根误差较小,在100以内,说明模型在铁矿石应用中具有较好表现,R2大小为0.31,说明模型仍有优化空间。
四、结语
本文选用了2021年9月至12月月底的中国期货市场铁矿石主力合约每天的tick高频数据,基于期货市场微观结构运用LEST神经模型进行分析,选取其中的开盘价、收盘价等特征数据,并建立LSTM深度神经网络模型做时间序列预测分析,由损失函数变化情况及评价指标可得,模型训练良好,并达到收敛,在测试集上表现良好,误差较小,预测精度较高,为后续研究提供一定参考意义。
但本次研究中依然存在不足之处。一方面,存在数据的局限性,数据的观测期跨度较小,如果选取较为久远的数据带入模型进行训练是否会改善模型,还需要进一步验证。同时,也可以收集其他期货品种的数据来验证该模型的实用性,进一步比较优化。另一方面,算法模型依然有优化空间。算法没有考虑到时间外部信息特征和外部事件等的影响,数据扩充后模型预测精度是否能够提升,还需进一步验证后续可以针对一些典型的外部事件发生后,从时间截取多个特征,从时间上发掘某些潜在规律。
参考文献:
[1]Libing Fang,Baizhu Chen,Honghai Yu,Cheng Xiong.The effect of economic policy uncertainty on the long-run correlation between crude oil and the U.S. stock markets[J].Finance Research Letters,2018,24.
[2]Markus Leippold,Qian Wang,Wenyu Zhou.Machine learning in the Chinese stock market[J].Journal of Financial Economics,2021(01).
[3]雷元安,刁節文.我国铁矿石期货价格发现功能的实证研究[J].经济研究导刊,2019(36):67-68.
[4]朱才斌,段蕴珂.我国铜期货市场国际定价能力研究[J].商业经济研究,2020(04):166-169.
[5]袁祥枫.基于LSTM的商品期货高频数据趋势预测模型的研究[D].北京:北京邮电大学,2019.
[6]王超.铁矿石期货价格与现货价格的关系研究[D].杭州:浙江大学,2018.
*基金项目:国内大宗商品期货市场量化交易研究(项目编号:20KJD520007);2021年江苏高校“青蓝工程”优秀教学团队资助项目。
(作者单位:无锡科技职业学院)