深度学习在金融市场上应用的相关研究综述
2021-11-18朱文强
朱文强
摘要:技术创新在金融行业扮演着越来越重要的地位,尤其是机器学习算法与深度学习算法的创新,相较于传统计量经济模型对于金融市场风险、收益波动的预测效果,凭借互联网大数据,更多机构或个人通过机器学习来拟合金融市场,加强投资策略。这种具备大数据、互联网以及量化投资特征的研究将会成为金融行业的一大研究热点,而本文则依据国内外学者对金融领域与深度学习的交叉研究开展综述。
关键词:深度学习;量化投资;文献综述
1. 深度学习的发展前景
随着科技发展,智能算法逐渐成为各个研究领域较为火热的研究方法,尤其是针对于深度学习技术的优势,其在计算机视觉领域和自然语言处理领域的飞速发展。深度学习是在基于神经网络基础上更加强大的一种智能算法,神经网络是一种非常强大的非参数化工具,被广泛应用于信号处理、模式识别等诸多领域,可以有效处理模型参数之间的非线性关系。与其他计量经济学方法相比,它不需定义模型的方程形式,也无需假设变量之间的函数关系。因此,与传统的诸如ARIMA、GARCH、OLS、VAR模型等参数计量经济模型相比,其具有(1)对非线性数据的拟合能力强于线性拟合;(2)由于没有标准的函数方程约束,其更加适应动态变化的金融市场,即对于金融时间序列数据的预测也存在显著效果;(3)其是一种以数据驱动的而非参数驱动的弱计量模型,从而相对于传统的计量经济模型来说,更容易避免模型设定产生的误差。总的来说,以神经网络为基础的模型在理论上依然产生了处理金融时间序列数据方面更加强大的优势。而在实际应用方面,Hill et al.(1996)探究了神经网络与Box-Jenkins ARIMA模型、季节性指数平滑等六种统计模型对时间序列数据的预测效果,实证结果发现神经网络的预测效果优于传统的统计模型,且证实神经网络特别适用于不连续时间序列数据的预测。继而在两年之后,Zhang和Hu(1998)也获得了相同的结论。
而深度学习作为以神经网络为基础的一种更加强大的智能算法,相对于神经网络这样浅层的机器学习算法,其具有能够处理复杂高维数据的能力,从而避免了维度灾难和大数据等问题。深度学习实际上是多层神经网络所构成的高层次神经网络模型,通过叠加多个神经网络,将输入数据通过每一个神经层的抽象表达,产生相应的“学习”机能来学习输入数据内部隐含的特征,借此提取有效信息来提高数据预测能力。因此深度学习就是通过高特征提取和高表征输出两大优势,提高了样本内数据预测精度以及缓和过拟合问题,从而相对其他模型拥有更加强大的泛化能力。深度学习因其在金融时间序列过程中具有优良的表现而得到越来越多学者的重视。在广大研究者使用的多种研究方法中,深度学习具有完全图灵测试机理,缜密的思维推导过程,其由数据驱动并且不基于任何假设的特点,因此被认为非常适合于处理这类数据。
2. 深度学习的发展及其应用研究
深度学习主要包含了循环神经网络(RNN)、长短记忆神经网络(LSTM)、卷积神经网络(CNN)等。其中RNN是一种纳入了序列相关性的神经网络从而能够处理金融时间序列数据。Rather et al.(2015)通过RNN与GARCH、AMRIA模型对比股票收益率的预测效果分析,实证结果表明RNN的预测效果更优。然而,RNN结构因为存在梯度消失和梯度爆炸这两个问题,从而对于处理具有长期关系的序列数据则相形见绌。而LSTM则在一定程度上缓和了序列数据的长期依赖关系,LSTM最成功的应用领域就是机器翻译。文本翻译与金融数据除了结构上的不同,实际上都是时间序列数据,因此有许多学者将LSTM应用到股票价格波动率预测预测上来,进而相似地得出了LSTM的预测能力和稳定性要明显强于其他模型的结论。尽管LSTM在一定程度上能够处理时序相关问题,但是其并不能完全消除梯度爆炸和梯度消失问题。而为了更好提取时序数据特征,避免长期信息丢失问题,许多学者做了在LSTM上做了一些改进。基于Google Deep Mind 团队在2014年提出将注意力机制用在图像分类任务中,验证了注意力机制(Attention)在图像处理领域的有效性,同时也使结合注意力机制的神经网络成为研究的热点。随后,Bahdanau et al.(2014)将注意力机制和RNN结合解决机器翻译任务,使注意力机制成功融入自然语言处理领域。考虑到Attention机制能够更好地捕捉图像、文本数据中的有效信息,则将其与LSTM相结合构建了A-LSTM来处理金融时序数据将是一个十分明显的创新。此外,时间序列数据可以通过RNN、LSTM等方式捕捉有效时序信息,但是其空间局部相关性则被忽视,而CNN则可以通过限制隐藏单元的局部感知来提取局部特征。CNN结构广泛被用于人脸识别技术,图像处理领域。而近年来,CNN结构也在金融邻域大放光彩。例如,赵红蕊和薛雷(2020)在股票價格预测研究中将Attention机制引入LSTM和CNN模型中,验证了在LSTM与CNN结合的网络模型中加入Attention模块的预测有效性和可行性。明显可以看出,CNN结构的优越性激发了许多学者在其邻域的运用,例如热电联产供热和贷款逾期等。
3.结束语
综上所述,深度学习在各行业邻域都有所渗透,尤其对于考虑到序列数据的要求,金融领域也就成了深度学习最理想的应用场所。RNN、LSTM、CNN等深度学习算法在各个方面都有其优势,甚至相互融合能够产生更加卓越的效果。然而如何将基准算法相互混合能够在金融市场产生更加优异的效果以及如何创新地提出更加优异的深度学习算法来更好地拟合金融数据的需求,即基于不同深度学习方法对金融市场进行择时选股分析。
参考文献:
[1]Hill T.,O'Connor M.,& Remus W. Neural network models for time series forecasts[J]. Management science,1996,42(7):1082-1092.
[2]Zhang G. & Hu M. Y. Neural network forecasting of the British pound/US dollar exchange rate[J]. Omega,1998,26(4):495-506.
[3]Rather A. M.,Agarwal A. & Sastry V. N. Recurrent neural network and a hybrid model for prediction of stock returns[J]. Expert Systems with Applications,2015,42(6):3234-3241.
[4]Bahdanau D,Cho K,Bengio Y. Neural machine translation by jointly learning to align and translate[J]. arXiv preprint arXiv:1409.0473,2014.
[5]赵红蕊,薛雷.基于LSTM-CNN-CBAM模型的股票预测研究[J].计算机工程与应用,2021,57(03):203-207.