APP下载

预测经济和金融时间序列:ARIMA与LSTM模型的比较

2020-04-07徐卫泽

山西农经 2020年3期
关键词:深度学习

徐卫泽

摘 要:预测时间序列数据是经济学、商业和金融学中的一个重要主题。ARIMA模型在预测下一个时间序列滞后的精度和准确性方面表现出色。随着计算机计算能力的发展,产生了基于深度学习的新算法来预测时间序列数据,如长短期记忆(LSTM)。通过实证研究,基于深度学习的算法(如LSTM)优于传统算法,与ARIMA相比,LSTM获得的错误率平均降低在84%~87%之间,表明了LSTM对ARIMA的优越性。

关键词:时间序列数据;深度学习;长短期记忆(LSTM);自回归综合移动平均线(ARIMA)

文章编号:1004-7026(2020)03-0036-02         中国图书分类号:O211        文献标志码:A

1  研究背景

经济和金融时间序列数据在数据化时代越来越受重视,然而由于经济趋势和条件的变化、信息不完整、市场波动给经济和金融时间序列预测带来了严重问题。最著名的预测方法是单变量“自回归移动平均(ARMA)”,其组合了自回归(AR)和移动平均(MA)模型。单变量“自回归整合移动平均线(ARIMA)”是一种特殊类型的ARMA,多变量ARIMA模型和向量自回归(VAR)模型,通过允许多个不断变化的变量来推广单变量ARIMA模型和单变量自回归(AR)模型[1]。

基于机器学习的技术,如递归神经网络(RNN)和长期短期记忆(LSTM),多年来在包括金融在内的许多学科都有应用。深度学习方法能够识别数据的结构和模式,例如时间序列预测中的非线性和复杂性。特别是,LSTM已被用于许多应用领域,如自然语言处理(Tarwani和Edem,2017)、手写识别(Gravesetal,2009)、语音识别(Robinson,2002;Eyben,2009;格雷夫斯等,2013;Sak等,2014)、时间序列预测(Hochreiter和Schmidhuber,1997)及在经济和金融数据中的应用,例如预测标准普尔500指数的波动性(Xiong,2015)[2]。

与基于深度学习的预测算法相比,传统预测技术的准确性和精确性是一个重要的研究问题。

本文比较了ARIMA和LSTM模型在降低预测错误率方面的表现。作为传统预测建模的代表,由于数据的非平稳特性,选择ARIMA模型处理时间序列经济变量。作为基于深度学习的算法的代表,使用LSTM方法是因为其用于在更长时间段内保存数据的特征。用一组经济和金融时间序列数据,区别ARIMA和LSTM模型进行数据处理和训练,特别是比较不同数据集中的损失率表现。对文献的贡献是使用ARIMA和LSTM模型预测各种经济和金融时间序列。研究目的:①进行实证研究和分析,调查传统预测技术和基于深度学习的算法性能。②比较LSTM和ARIMA在预测误差率中实现的最小化方面的性能。

2  时间序列预测

时间序列分析的目的是研究时间序列的路径观察,并建立一个模型来描述数据结构并预测时间序列的未来值,在商业、经济、金融和计算机科学中有大量的应用。时间序列预测传统上是使用ARIMA模型在计量经济学中进行的。尽管ARIMA模型在经济和金融时间序列建模方面非常普遍。但实际上,在简单的ARIMA模型中,很难对变量之间的非线性关系进行建模[3]。

LSTM(长短期记忆)是回归神经网络(RNN)方法的一个特例,Lee和Yoo介绍了一种基于RNN的方法来预测股票收益。比较了ARIMA模型与LSTM模型在经济学和金融时间序列预测中的表现,以便在典型的预测模型中对所涉及变量的最优质量进行评估。

3  模型背景

自回归集成移动平均(ARIMA)和基于深度学习的技术,长短期记忆(LSTM)的背景知识[4]。

ARIMA(Pesaran,2015)是自回归滑动平均(ARMA)的广义模型,结合了自回归(AR)过程和移动平均(MA)过程,并构建了时间序列的复合模型。

可以将AR和MA过程组合在一起,组成一个ARMA模型(p,q):

其中:c是常数项;?着i被假设为平均数等于0,标准差等于?滓的随机误差值;?滓被假设为对于任何的t都不变;?滋是常数项;Xt均值为0。

参数p和q分别称为AR和MA过程。ARIMA模型的一般形式表示为ARIMA(p,d,q)。季节性ARIMA模型的一般形式表示为ARIMA(p,d,q)·(P,D,Q)S。其中p 是非季节性AR顺序,d是非季节性差分,q是非季节性MA顺序,P是季节性AR顺序,D是季节性差异,Q是季节性MA顺序,S是分别重复季节性模式的时间跨度。

ARIMA预测,将非平稳问题,通过多次差分,转化为平稳问题,因此对数据有一定要求,并且由于差分过程的存在,时间数据的离散程度变大,ARIMA模型的拟合度往往不高。

4  长短期记忆(LSTM)

基于LSTM神经网络的模型建立长短期记忆网络,由Sepp Hochreiter和Jürgen Schmidhuber在1997年提出并加以完善與普及。LSTM神经网络是基于循环神经网络(Recurrent Neural Networks,RNN)改进的一种算法[5-6]。

LSTM是一种特殊的RNN,具有记忆数据序列的附加功能。RNN存在的问题在于,当时间间隔不断增大时,RNN会丧失学习过去较久远信息的能力,即梯度消失。

LSTM通过设定一组单元,训练存储数据流。每个LSTM涉及3种类型的门,目的是控制每个单元的状态:①遗忘门输出0~1之间的数字。②存储器门选择需要在单元中存储哪些新数据。③输出门决定每个单元的输出量。产生的值将基于单元状态以及过滤和新添加的数据。

5  ARIMA与LSTM比较

为了比较ARIMA和LSTM的性能,对一些选定的经济和金融时间序列数据进行了一系列實验。通过这项工作调查的主要研究问题如下:①哪种算法ARIMA或LSTM能够更准确地预测时间序列数据?②数据量和数据的性质对模型的影响有多大?

5.1  数据来源

准备两组不同的数据,对两组人为设定数据,分别是线性和非线性周期数据。两组自然数据,分别是较小数据量和较大数据量的时间序列数据,并且根据数据的不同,将其分为数据1~数据4。数据3和数据4是来自美国电力能源消耗的实际数据,本数据在真实数据的基础上,将原来每小时采集的数据整合为每月,选取不同数据量。

5.2  结果展示

通过均方根误差(RMSE)来评估模型获得的预测精度的度量。表1是经过ARIMA和LSTM训练之后获得的结果参数。

6  结果分析

通过修正LSTM的训练次数,经多次迭代,发现模型在经过多次训练之后,损失率稳定在固定值范围内,即0.064。结果报告在表1中。处理时间序列相关的数据显示,使用ARIMA和LSTM模型的平均均方根误差(RMSE)分别为511.481和64.213,平均减少87.445。LSTM实现的拟合度更高[7-8]。经济相关数据显示RMSE减少了84.394,其中ARIMA和LSTM的平均RMSE值分别计算为5.999和0.936。RMSE值清楚地表明基于LSTM的模型优于基于ARIMA的模型,具有高拟合度(即错误率降低84%~87%)。

7  结束语

比较了ARIMA和LSTM的准确性,作为预测时间序列数据的代表性技术,这两种技术并应用于时间序列数据,与ARIMA相比,基于LSTM的算法平均将预测提高了85%。此外,LSTM最为强大的地方在于,此模型在应用于处理多元回归时,对变量之间的相关性、共线性、变量的非线性等方面有着强大的适应力。

参考文献:

[1]Ayodele Ariyo Adebiyi,Aderemi Oluyinka Adewumi,Charles Korede Ayo.Stock price prediction using the ARIMA model[C].//2014 UKSim-AMSS 16th International Conference on Computer Modelling and Simulation,2014.

[2]A.Fernández-Manso,C.Quintano,O.Fernández-Manso.Forecast of NDVI in coniferous areas using temporal ARIMA analysis and climatic data at a regional scale[J].International Journal of Remote Sensing, 2011,32(6):1595-1617.

[3]王成国,邓仲元,陈海文,等.基于ARIMA模型的金融品种走势预测技术[J].计算机技术与发展,2015(7):11-14.

[4]陈瑶,余信丰,黄宏.基于ARIMA模型的金融专业人才需求预测[J].商场现代化,2009(14):297-298.

[5]于连敏.ARIMA模型在我国GDP预测中的应用[J].时代金融,2017(21):180.

[6]肖曼君,夏荣尧.中国的通货膨胀预测:基于ARIMA模型的实证分析[J].上海金融,2008(8):38-42.

[7]张蜀林,赵雄飞.LSTM模型在中国A股市场的应用[J].全国流通经济,2018(35):94-95.

[8]于水玲.基于深度学习的金融市场波动率预测和风险值计算[D].长春:长春理工大学,2018.

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究