APP下载

基于压缩感知去噪和SVR的汇率预测研究

2017-03-31孟建钊

时代金融 2017年8期

【摘要】汇率在国际金融市场以及对外贸易中扮演着重要角色。由于汇率变动趋势的不确定性及复杂性,传统的汇率预测方法无法达到更好的预测效果。为了达到更好的预测效果,我们提出基于压缩感知去噪和支持向量回归(SVR)的汇率预测模型。压缩感知去噪是对原始的汇率数据进行预处理降噪的过程,支持向量回归作为预测工具用于已降噪的数据的预测。我们采用中国人民银行发布的人民币兑美元汇率数据作为样本数据,对我们新提出的方法进行数值模拟,同时与小波去噪等预处理方法进行对比,结果显示基于压缩感知去噪的支持向量回归汇率预测方法具有较好的预测效果。

【关键词】压缩感知 汇率预测 支持向量回归 时间序列 去噪

一、引言

汇率的变化是一个复杂的过程,它与一个国家的经济水平、物价水平、通货膨胀率、利率和政府干预等因素息息相关。另一方面来说,汇率对于国际经济和金融市场的影响巨大,同时对各国社会经济与生活也有着重要影响。因此,对于汇率的预测是十分必要的。

现阶段来说,由于国际金融经济形势的多变以及经济全球化的趋势,汇率的变化波动趋势复杂多变。随着对其研究的深入,汇率预测的模型也在不断的发展。在众多的预测模型中,通常可以分为传统模型和人工智能模型。其中传统模型有GARCH模型和ARIMA模型,它们本质上是线性模型,由于汇率的变化不只是简单的线性变化,其中还受很多非线性因素影响,所以线性的模型还存在许多不足和改进的空间。

随着人工智能领域的发展,支持向量回归(SVR)等该领域的模型和算法所具备的自适应和非线性性质,已经被证明在金融时间序列预测领域,面对更加复杂、非线性的数据时比传统的线性模型有更好的预测效果。另外,在传统模型中需要的数据的统计性假设,如稳定性,规则性和线性在人工智能模型中并不需要。比如,Liu和Wang(2008)[1]使用最小二乘支持向量回归和网格参数寻优方法来进行汇率预测。Sermpinis G等(2015)[2]使用了SVR模型结合遗传算法来预测欧元兑美元汇率的交易变化。人工智能模型已经广泛用于其他时间序列预测中,并且取得了很好的效果。然而,从一方面来看,人工智能模型也存在一定的缺陷,如过拟合问题及对参数变化的过于敏感等问题;此外,由于汇率受金融市场、国家经济等因素影响比较大,其产生的时间序列的变化十分复杂,由其产生的高噪声对汇率的预测造成较大的影响。

因此我们提出结合去噪算法与人工智能模型、对原始汇率数据去噪以后进行预测的设想,以达到提高模型预测能力的目标。

当前,在去噪方法还有提升的空间,目前常用的去噪方法主要有傅里叶变换、离散余弦变换、小波变换、卡尔曼滤波及中值滤波等方法。对数据去噪带来的优势,使得越来越多的学者将去噪应用到实际的预测中。如He等(2010)[3]提出了一个基于slantlet去噪的最小二乘支持向量回归模型来预测汇率。Faria(2009)[4]提出了一个基于指数平巧去噪的神经网络模型来预测股市价格。

相对上面提到的几种去噪方法,最近流行的基于压缩感知去噪方法,通过合适的稀疏基转换,能够最大程度的保留数据信息,在此情况下,结合压缩感知去噪方法和智能预测算法能够提高对汇率的预测精度。目前来说,压缩感知去噪应用的领域还不是很多,大多数是集中在图像去噪方面。应用于一维信号的去噪处理的相关工作比较少,如Yu(2014)[8]應用压缩感知去噪基于人工智能模型预测国际油价变化。

本文的创新点在于将压缩感知理论应用于数据去噪,然后使用ε-SVR模型对去噪数据进行汇率的建模预测。并使用人民币兑美元汇率数据进行模型仿真,并与传统的去噪方法进行对比,结果证明压缩感知去噪在汇率预测问题上相对来说有着更好的效果。

二、理论知识

(一)压缩感知理论

压缩感知理论首先是由Donoho在2004年提出的,它提供了一种新的信号采样方式。压缩感知理论指出:当信号在某个变换域是稀疏的或可压缩的,可以利用与变换矩阵非相干的测量矩阵将变换系数线性投影为低维观测向量,同时这种投影保持了重建信号所需的信息,通过进一步求解稀疏最优化问题就能够从低维观测向量精确地或高概率精确地重建原始高维信号。

压缩感知理论主要涉及3个核心问题:1)稀疏表示。2)随机采样。3)信号恢复。

就稀疏表示而言,信号能被精确地通过一些基函数如傅里叶基和小波基表达出来。从数学的角度来说,有限长实质信号向量X∈Rn,假设■是Rn的一个正交基,则信号X∈Rn可以线性表示为:

■ (式2.1)

si是X的第i个系数:

■ (式2.2)

通过这种方法,X能被表达为ψs,ψ是一个n×n的矩阵,其中ψ1,……,ψn是它的列向量。如果si的大部分元素为0,则系数S是稀疏的。如果信号X∈Rn在一个正交基ψ下是稀疏的,那么稀疏系数S能被表达为

S=ψTX (式2.3)

就随机采样而言,定义一个和转换基ψ不相干的m×n(m

Y=ΦψTX (式2.4)

在信号恢复方面,在压缩感知理论中,由于观测数量m远小于信号长度n,因此不得不面对求解欠定方程组Y=ΦψTX的问题。针对优化问题中的NP难情况,因此实际上可以将问题转化为求解问题:

■ (式2.5)

其中,||x||1表示向量x的l1范数。

如果信号X被污染,上述问题还可以写成:

■ (式2.6)

目前为止出现的重构算法都可归入以下三大类:贪婪追踪算法;凸松弛法;组合算法。通过上述的重构算法,信号可以被精确地从压缩后的信号恢复过来。

(二)支持向量回归

支持向量回归,通过引入核函数的概念,将输入向量映射到一个高维的特征向量空间,并在高维特征空间构造最优回归函数,解决非线性回归问题。在支持向量回归模型中,核函数的选择十分重要。核函数种类有很多,主要有:多项式函数k(xi,xj)=[(xi+x)+1]q,高斯径向基函数k(xi,xj)=exp(-||xi-x||2/(2g)2),sigmiod函数k(xi,xj)=tanh(v(xi·x)+c)等。通过引入核函数巧妙地解决了维数灾难问题,使得算法的复杂度与样本维数无关。

三、压缩感知去噪预测模型

根据上面提到的相关算法与技术,我们设计了压缩感知去噪预测模型。该模型包括两个步骤,即数据去噪和预测两部分。

步骤一:用压缩感知算法对数据进行去噪

首先,原始数据X包含有趋势T和噪声Z,它通过一个合适的转换基表示出来,比如小波基。然后用一个高斯白噪声矩阵对稀疏系数进行采样。最后,通过正交匹配追踪算法来恢复趋势T,以便进行后续的分析。

步骤二:用支持向量回归模型预测

在进行数据去噪之后,用支持向量回归模型来对去噪后的数据T进行建模,来获得原始数据X的预测结果■。

(一)数据描述

在模型仿真中,我们采用中国人民银行(所有数据均来源于中国人民银行网站:www.pbc.gov.cn)每日公布的人民币兑美元汇率中间价的数据作为实证研究对象。因为中央政府在2005年年中由以往的固定汇率制度转为实行以市场供求为基础的、单一的、有管理的浮动汇率制,所以2005年前的数据不具备参考。综合考虑,实验选取2010年8月2日到2012年9月6日共512个数据用来作为研究对象。其中前462个数据作为训练数据来训练模型,后50个数据作为测试数据。

样本数据的设定基于两个原因。首先,相比于周度数据和月度数据,日度数据中包含的噪声更多,数据特征更复杂。其次,训练数据的长度应当为2n(n>0),以便于用来创造一个正交稀疏转换矩阵。

(二)数据处理

汇率属于一种时间序列,对于时间序列的预测需要对时间序列进行平稳性检验,对于非平稳序列无法进行更好的预测。对数据进行平稳性检验发现数据是非平稳序列,因此我们对其进行差分处理,具体处理如下:

Yt=100×(logyt-logyt-1) (式3.1)

其中{yt}为原始汇率序列,{Yt}为汇率自然对数一阶差分序列。用支持向量回归做完预测后,再通过下面的公式将预测的公式将其转换为汇率形式:

■ (式3.2)

处理后的数据经检验为平稳序列,可以进行后续的步骤。

在进行支持向量回归模型仿真的时候,采用直接预测策略。即给定一个时间序列xt,(t=1,2,..,T),向前预测第m步的值xt+m由如下式子计算所得:

■ (式3.3)

其中■t代表第t期的预测值,xt是第t期的实际值,l代表滞后阶数。

(三)评价指标

对于最终预测出来的结果要进行评估,检验模型的效果的好坏,我们采取统计分析中常用的几个评价指标。

(1)绝对偏差均值(MAD)

■ (式3.4)

(2)均方误差估计(MSE)

■ (式3.5)

(3)方向性统计量Dstat

■ (式3.6)

at=1 如果(xt+1-xt)(■t+1-xt)≥0不然at=0

MAD、MSE越小,回歸决定系数越接近0,说明模型预测精确度越高。

四、实验结果

在压缩感知去噪步骤中,最重要的是选取合适的稀疏基做稀疏变换。我们采用离散余弦变换作为稀疏基,采样数目设为200。为了研究压缩感知去噪方法与其他去噪方法效果的不同,我们选取中值滤波、小波变换两种常见的去噪方法作为对比。其中小波变换采用symlet6来构建小波基。在支持向量回归算法的仿真中,采用网格参数寻优,确定合适的参数C=400,ε=0.05。

首先,通过压缩感知去噪,能够对数据中的噪声进行减弱,同时相对其他传统去噪方法来说,压缩感知去噪可以保留更多的细节,而其他去噪方法去噪效果过于明显,将部分的重要细节也一同抹去。如图所示,可以看出压缩感知去噪效果明显。

(一)压缩感知去噪的有效性

将去噪后的数据运用支持向量回归进行样本训练,使用通过训练得到的模型对验证数据集即后50个数据进行验证,发现该模型在验证集上的表现还是不错的。其中描点之后的趋势代表预测结果。

除了单纯的从该模型本身来看,我们将其与未去噪的模型的效果作对比,主要是从MAD、MSE和Dstat三个方面来做对比,发现经过压缩感知去噪过程的预测还是改进明显的。

通过图3可以得出结论:压缩感知去噪预测模型提高了预测结果的精确度。从MAD和MSE的角度来看,两种模型的值都比较小,而且经过压缩感知去噪的预测模型的MAD与MSE相比未去噪模型更小;从Dstat的角度来看,经过压缩感知去噪的模型的Dstat更高,而且达到了0.6以上,说明预测的方向性更好。

(二)压缩感知去噪的优势

通过上面的程序仿真模拟,可以发现在针对汇率预测问题时,通过压缩感知去噪确实可以提高模型的预测能力。结合传统的去噪方法,压缩感知去噪具备比其他去噪方法更好的效果。对同样的数据分别运用不同方法进行去噪再进行预测,目前来说压缩感知去噪方法使得后续的预测能力更加优越。

从表1可以看出未去噪的预测模型的MAD最大,压缩感知去噪预测模型的MAD最小,并且其他两种去噪模型的MAD均比未去噪模型要小,说明对数据预先去噪确实提高了预测能力;相比其他几种去噪模型来看,压缩感知去噪模型拥有更好的效果。此外由图中可以看出针对方向性统计量,压缩感知去噪预测模型的Dstat最大,未去噪模型的Dstat最小,说明经过压缩感知去噪的预测方向性更好,进而说明其预测效果更好;同时与其他两种去噪手段相比较而言,压缩感知去噪的预测模型预测的准确度更高。

(三)稳定性分析

为了避免选取的训练数据的特殊性,特地选取2013年3月1日到2015年4月10日共512个数据做同样的模型仿真,以便测试压缩感知模型的稳定性,证明与选取的训练集无关。

由图6我们可以看出对两组不同时间的数据,通过压缩感知去噪的支持向量回归模型MAD、MSE都比其他三种模型更小,Dstat都比其他三种模型要大。在不同的数据样本下,最终得到的结果相符,一定程度上证明了基于压缩感知去噪的支持向量回归模型的稳定性。

五、结论

考虑到国际汇率的多变性、复杂性及包含的高噪声情况,提出基于压缩感知去噪的支持向量回归的预测模型。选取人民币兑美元汇率作为研究对象,先对原始数据进行压缩感知去噪,然后对去噪后的数据进行训练预测。通过进行模型仿真、数据分析可以得出结论。

在针对汇率预测问题上时通过压缩感知去噪再进行预测的方法是可行的,并且去噪后预测效果变得更好;与其他传统去噪方法比较来看,压缩感知去噪方法在汇率预测领域更加出色。此外,稳定性分析说明该方法的普适性。

通过以上研究,今后我们可以将该方法推广到其他时间序列的预测上来。对于压缩感知去噪理论,选取合适的稀疏基是下一步工作的重点;对于预测模型来说,可以将线性模型与人工智能模型相结合进行更准确的预测。

参考文献

[1]Liu L,Wang W.Exchange Rates Forecasting with Least Squares Support Vector Machine[C].International Conference on Computer Science and Software Engineering.IEEE,2008:1017-1019.

[2]Sermpinis G,Stasinakis C,Theofilatos K,et al.Modeling,forecasting and trading the EUR exchange rates with hybrid rolling genetic algorithms—Support vectorregression forecast combinations[J].European Journal of Operational Research,2015,247(3):831-846.

[3]He K,Lai K K,Yen J.A hybrid slantlet denoising least squares support vector regression model for exchange rate prediction[J].Procedia Computer Science,2010,1(1):2397-2405.

[4]Faria E L D,Albuquerque M P,Gonzalez J L,et al.Predicting the Brazilian stock market through neural networks and adaptive exponential smoothing methods[J].Expert Systems with Applications,2009,36(10):12506-12509.

[5]Sang Y F.Improved Wavelet Modeling Framework for Hydrologic Time Series Forecasting[J].Water Resources Management,2013,27(8):2807-2821.

[6]Xin Z,Ming G U.Complicated financial data time series forecasting analysis based on least square support vector machine[J].Qinghua Daxue Xuebao/journal of Tsinghua University,2008,48(7):1147-1149.

[7]Zhu L,Zhu Y,Mao H,et al.A New Method for Sparse Signal Denoising Based on Compressed Sensing[C].International Symposium on Knowledge Acquisition and Modeling.IEEE Computer Society,2009:35-38.

[8]Yu L,Zhao Y,Tang L.A compressed sensing based AI learning paradigm for crude oil price forecasting[J].Energy Economics,2014,46(C):236-245.

作者簡介:孟建钊(1992-),男,山东邹城人,华南理工大学数学学院硕士研究生在读,研究方向:数据挖掘与机器学习。