基于最小二乘小波支持向量机的股指波动率预测
2018-01-23耿立艳张占福梁毅刚
耿立艳+张占福+梁毅刚
[摘 要] 为提高金融波动率的预测精度,用极差估算股指波动率,建立了基于最小二乘小波支持向量机(LS-WSVM)的波动率预测模型,以上证综指和深证成指的日数据、周数据和月数据为数据样本,通过LL、NMSE、NMAE指标验证了LS-WSVM在波动率预测方面的有效性。结果表明,LS-WSVM用于波动率预测是有效的,对不同频率波动率的预测精度优于高斯核LS-SVM,在预测较低频率波动率中表现更好,不同小波核之间的预测精度相差不大。
[关键词] 波动率;预测;最小二乘小波支持向量机
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 01. 042
[中图分类号] F830.9;TP183 [文献标识码] A [文章编号] 1673 - 0194(2018)01- 0104- 04
1 前 言
金融衍生品定价、资产组合配置、金融风险测度及管理都离不开对波动率的准确预测。对波动率的准确预测,一方面有助于研究者进行资产定价、套利定价和期权定价的理論研究,另一方面有助于市场监管者对金融市场运行质量进行准确评估,同时又有助于投资者对投资组合进行合理配置,有效规避投资风险。为此,国内外学者不断提出各种方法提高波动率的预测准确性。Engle和Bollerslev提出的自回归条件异方差类模型[1-2]及其扩展形式以资产收益的条件方差估计波动率,能够较好地刻画波动率的各种特征,在波动率预测中占有重要地位。
为进一步提高波动率的预测精度,Donaldson等[3]将神经网络(NN)与GARCH模型相结合预测股指波动率,Taylor[4]、Tae[5]分别利用NN预测股指波动率。这些研究证实,NN可以在一定程度上改善波动率的预测效果。但神经网络以经验风险最小化作为计算准则,在理论上存在三个问题:网络结构难以确定、存在局部极小值、收敛速度慢。由Vapnik提出的支持向量机(SVM)[6]是当前重要的机器学习算法之一,有效解决了神经网络遇到的问题。SVM的本质是求解一个带约束条件的凸二次规划问题,通过结构风险最小化准则,兼顾了学习算法的经验风险和泛化能力,在非线性回归和预测中表现优越。Perez-Cruz[7]利用SVM估计GARCH模型,进而提高了波动率的预测精度;Gavrishchaka[8]证实SVM的波动率预测效果优于“主流”波动率模型;陈诗一等[9]、王保华等[10]分别将SVM应用于波动率预测研究,证明了SVM的有效性。汤凌冰[11]利用小波核提高SVM非线性逼近能力,实证研究表明,基于小波核的SVM较基于RBF核的SVM具有更高的波动率预测精度。SVM算法的复杂性取决于数据样本的个数,样本越多,相应二次规划问题求解越复杂,计算效率越低。
最小二乘支持向量机(LS-SVM)是SVM的一种扩展形式[12],将最小二乘算法引入到SVM中,取代了SVM的二次优化算法,通过定义拉格朗日函数,并结合最优条件,将SVM中的二次规划优化变换为线性方程求解,从而降低了算法的复杂性,提高了计算效率。Geng[13]成功地将LS-SVM应用于波动率预测研究。
核函数是LS-SVM模型的关键,LS-SVM的预测性能取决于核函数的选择。以高斯核函数为代表的常见核函数,在回归分析表现出较好的映射性能。但研究发现,这些已有核函数不能使LS-SVM逼近平方可积空间L2(R2)上的任意函数,致使LS-SVM 无法逼近任意的目标函数[14]。
最小二乘小波支持向量机(LS-WSVM)以小波核为核函数,利用小波函数的多分辨率提高LS-SVM的非线性处理能力[15],在模式识别和非线性函数逼近等方面获得应用。目前LS-WSVM在波动率预测领域的应用很少,本文将LS-WSVM应用于波动率预测研究,通过对上证综指和深证成指不同频率波动率的实证分析,检验LS-WSVM的有效性。
2 波动率的最小二乘小波支持向量机
金融经济学研究中通常以方差估计资产收益的波动率。Parkinson证实极差能够捕捉到更多金融市场的变化信息,以极差估计波动率要比传统的样本方差估计更有效[16]。极差Rt定义为:
Rt=100×(log Pt,high-log Pt,low)(1)
其中,Pt,high与Pt,low分别为t时刻资产的最高交易价与最低交易价。为了获得更多数据变化信息,本文以当期和前4期极差的算术平均值估算波动率λt:
lt=Rt-k(2)
采用LS-WSVM算法建立波动率预测模型时,为减少预测误差的累积,利用当期波动率预测下一期波动率,即LS-WSVM的输入为当期波动率,输出为下一期波动率。设波动率时间序列为∧={λ1,λ2,…,λn},λt≥0,t=1,2,…,n,n为样本个数,LS-WSVM通过非线性映射函数φ( ),在高维特征空间中建立线性回归模型为:
λt+1=ωTφ(λt)+b,t=1,2,…,n-1(3)
其中λt,λt+1∈R分别表示输入和输出变量,T表示“转置”运算,ω,b分别表示权向量和阈值。根据结构风险最小化原理,LS-WSVM预测可表述为最优化问题:
J(ω,b,e)=||ω||2+et2(4)
式(4)中目标函数的第1项表示正则化项,第2项表示经验误差项,正则化参数γ用来调整正则化项和经验误差项之间的平衡,et∈R表示误差。为求解以上优化问题,引入Lagrange乘子αt∈R,t=1,2,…,n-1,构建Lagrange函数:
L(ω,b,e,α)=J(ω,b,e)-αt(ωTφ(λt)+b+et-λt+1(5)
由Karush-Kuhn-Tucker条件,Lagrange函数分别对ω,b,e,α求偏导数并等于零,得到:endprint
ω=-αtφ(λt)αt=0λt+1=ωTφ(λt)+b+etγet=αt,t=1,2,…,n-1(6)
消去式(6)中的ω和e,可得到一组线性方程组:
0 HTH Ω+I/γba=01(7)
其中:H=[x2,x3,…,xn]T,Ωj=HtHjK(λt,λj),t,j=1,2,…,n-1。I为n-1阶单位矩阵,α=[α1,…,αn-1]T,1=[1,1,…,1]。求解线性方程组获得a和b值,LS-WSVM回归模型为:
λt+1=αjK(λt,λj)+b(8)
其中,K(λt,λj)为核函数,K(λt,λj)=φ(λt)Tφ(λj),其形式决定了非线性映射函数和特征空间的结构,选择合适的核函数成为提高LS-SVM性能的关键。由于波动率序列复杂多变,高斯核等常用核函数难以刻画波动率的复杂变化特征。
核函数构建定理指出,满足Mercer定理的平移不变小波核函数是允许的支持向量核函数[17]。现已证实,Mexican母小波、DOG母小波、Morlet母小波等都可构造出平移不变小波核函数。本文选取Mexican小波核作为核函数,具体形式如下:
K(xt,xj)=1-exp-(9)
其中,d为平移尺度因子,为伸缩因子。则Mexican小波核LS-SVM预测模型为:
t+1=αj1-exp-+b(10)
3 实证研究
3.1 数据的选取
将上证综指(SHCI)和深证成指(SZCI)的日数据、周数据和月数据作为样本进行实证分析,其中,选取2009年1月5日到2013年3月15日的每日观测值作为日数据样本,共1 019组数据序列;选取2005年1月7日到2013年3月15日的每周观测值作为周数据样本,共411组数据序列;选取1991年4月30日到2013年2月28日的每月观测值作为月数据样本,共263组数据序列。按式(1)和式(2)分别计算出日波动率、周波动率和月波动率,样本总数分别为1 015个、407个和259个。
3.2 网络学习及预测
为提高LS-WSVM的收敛速度,先对三组数据样本进行归一化处理,再分别将三组数据样本分为训练样本和测试样本。对日波动率,取前715个数据作为训练样本,后300个数据作为测试样本;对周波动率,取前287个数据作为训练样本,后120个数据作为测试样本;对月波动率,取前163个数据作为训练样本,后96个数据作为测试样本。
为比较LS-WSVM的有效性,利用以高斯函数为核函数的LS-SVM模型(LS-SVM)预测SHCI和SZCI不同频率的波动率,将预测结果与LS-WSVM的预测结果进行比较。
3.3 预测性能评价指标
选取对数误差统计量(LL)、正则均方误差(NMSE)和正则均值绝对误差(NMAE)评价模型的预测性能,分别定义如下:
LL=N-1ln(t)-ln(Rt)2(11)
NMSE=(12)
NMAE=(13)
其中,N为预测样本个数,t为预测的波动率,Rt为实际波动率。以上指标值越小,表明模型预测性能越好。
3.4 結果分析
LS-WSVM和LS-SVM分别对SHCI和SZCI的日波动率、周波动率和月波动率预测结果见表1、表2和表3。SHCI中,LS-WSVM对不同频率波动率的LL、NMSE和NMAE均小于LS-SVM的对应值; SZCI中,除周波动率的NMAE外,LS-WSVM的LL、NMSE和NMAE均小于LS-SVM的对应值,表明整体上LS-WSVM对三种不同频率波动率的预测精度优于LS-SVM。计算LS-WSVM和LS-SVM对应的预测性能评价指标差值,通过差值比较不同频率波动率的预测效果。在三种不同频率波动率中,LS-WSVM对月波动的预测效果最好,差值在0.000 3~0.001 7之间;对周波动的预测效果次之,差值在0.000 1~0.001 5之间;对日波动率的预测效果最差,差值在0~0.000 3之间。
图1、图2给出了LS-WSVM和LS-SVM分别对SHCI和SZCI不同频率波动率的预测结果曲线图。由两图可看出,LS-WSVM和LS-SVM都较好地预测了SHCI和SZCI不同频率波动率的变化趋势,LS-WSVM较LS-SVM更准确地预测出了较低频率波动率的某些极值。
另选取DOG小波核、Morlet小波核作为LS-SVM核函数,分别对SHCI和SZCI的不同频率波动率进行预测,形式如下:三种不同小波核LS-SVM的波动率预测结果如表4、5、6所示。由三表可知,小波核LS-SVM在不同频率波动率预测精度方面优于高斯核LS-SVM,不同小波核之间的预测精度相差不大。
4 结 语
本文建立了基于小波核的最小二乘支持向量机波动率预测模型(LS-WSVM),利用上证综指和深证成指不同频率的实际交易数据样本,以LL、NMSE、NMAE检验其有效性。实证研究结果表明,从提高波动率预测精度角度,采用小波核LS-SVM比高斯核LS-SVM更有效,LS-WSVM对较低频率波动率具有更好的预测效果。
主要参考文献
[1]Engle R F. Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of UK Inflation[J]. Econometrica, 1982, 50: 987-1008.
[2]Bollerslev T. Generalized Autoregressive Conditional Heteroskedasticity[J]. Journal of Econometrics, 1986, 31: 307-327.endprint
[3]Donaldson R G, Kamstra M. An Artificial Neural Network-GARCH Model for International Stock Return Volatility[J]. Journal of Empirical Finance, 1997, 4: 17-46.
[4]Taylor J W. A Quantile Regression Neural Network Approach to Estimating the Conditional Density of Multiperiod Returns[J]. Journal of Forecasting, 2000, 19: 299-311.
[5]Tae H R. Forecasting the Volatility of Stock Price Index[J]. Expert Systems with Applications, 2007, 33: 916-922.
[6]Vapnik V N. An Overview of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks, 1999, l0(5): 988-999.
[7]Perez-Cruz F, Afonso-Rodriguez J A, Giner J. Estimating GARCH Models Using Support Vector Machines[J]. Quantitative Finance, 2003, 3: 1-10.
[8]Gavrishchaka V V,Supriya Banerjee. Support Vector Machine as an Efficient Framework for Stock Market Volatility Forecasting[J].Computational Management Science, 2006, 3:147-160.
[9]Chen S Y, H?覿rdle W K, Jeong K. Forecasting Volatility with Support Vector Machine-based GARCH Model[J]. Journal of Forecasting, 2010, 29(4):406-433.
[10]Wang B H, Huang H J, Wang X L. A Support Vector Machine Based MSM Model for Financial Short-term Volatility Forecasting[J]. Neural Computing & Applications, 2013, 22: 21-28.
[11]湯凌冰,盛焕烨,汤凌霄.新型小波支持向量机在波动率预测中的实证研究[J].系统工程,2009,27(1):87-91.
[12]Suykens J A K, Vandevalle J. Least Squares Support Vector Machine Classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.
[13]Liyan Geng, Zhanfu Zhang. CARRX Model Based on LSSVR Optimized by Adaptive PSO[C]//Proceedings of 2th International Conference on Computer and Management, Guilin, China, 2012, 268-271.
[14]武方方,赵银亮.最小二乘Littlewood-Raley小波支持向量机[J].信息与控制,2005,34(5):604-609.
[15]李军,赵峰.最小二乘小波支持向量机在非线性控制中的应用[J]. 电机与控制学报,2009,13(4): 620-625.
[16]Parkinson M. The Extreme Value Method for Estimating the Variance of the Rate of Return[J]. Journal of Business, 1980, 53: 61-65.
[17]ZHANG Li, ZHOU Weida, JIAO Licheng. Wavelet Support Vector Machine[J]. IEEE Transaction on Systems, Man, and Cybernetics, Part B: Cybernetics, 2003, 34(1): 34-39.endprint