g-VaR算法与上证综指收益率检验
2021-12-30胡博,王丽莉
胡博,王丽莉
摘要:设计一种基于GARCH(1,1)模型的改进VaR算法(简称g-VaR).g-VaR将GARCH(1,1)模型引入VaR值计算,描述上证综指收益的波动性和尖峰厚尾特征.实证数据表明,g-VaR能很好地检验上证综指收益率,预测上证综指风险,模型有效.
关键词:GARCH(1,1)模型;VaR算法;波动性;预测
[中图分类号]F830.91[文献标志码]A
g-VaR Algorithm and Yield Test of Shanghai Composite Index
HU Bo,WANG Lili
(School of Economics and Management,Mudanjiang NormalUniversity,Mudanjiang 157000,China)
Abstract:An improved var algorithm (g-VaR) based on GARCH (1,1) model is designed.g-VaR introduces GARCH (1,1) model into VaR value calculation to describe the volatility of Shanghai Composite Index Return and the characteristics of peak and thick tail.Empirical data show that g-var can better test the yield of Shanghai Composite Index and predict the risk of Shanghai Composite Index,and the model is effective.
Key words: GARCH (1,1) mode;VAR algorithm;volatility;prediction
商業银行、证券市场和金融衍生品市场常用VaR值作为风险管理、市场风险预测、风险测量和产品定价的工具.上证综指收益具有序列相关性、波动丛聚性、收益厚尾性等特点,这使得传统的风险测算方法不完全适用于预测上证综指的风险.本文提出一种改进的VaR算法,通过描述上证综指收益的波动性和尖峰厚尾特征,检验上证综指收益率,预测上证综指风险.
1VaR算法
1.1方差-协方差法
假设资产价值的变化与其风险因素报酬是线性的,风险因素报酬需满足多元正态分布,根据方差-协方差矩阵可以对收益的分布进行估计.方差-协方差法对线性金融资产的求解问题可以转化为对资产损失均值和标准差求解.Morgan J P's RiskMet-rics模型是较经典的用方差-协方差法计算VaR值的方法,通过推导,可以得到既定置信水平下的VaR值公式:
VaR=Zα*σ*P0.
其中,Zα是标准正态分布下的σ分位数,P0是资产的初始市场价值.
计算给定测试窗口期内两个不同置信区间的VaR值.测试时间段:2011年1月14日交易日开始,2014年最后一个交易日结束,共计962个交易日.基于2011年1月14日之前的250个交易日的数据,估算当天的VaR值.VaR值的置信区间分别为95%和99%时对应的P值,对应这两个置信区间,至多有5%和1%的情况下损失会大于估算的VaR值.
假设资产损益服从正态分布,在95%和99%置信区间计算出VaR值.当天的VaR值是基于过去的250个交易日的数据,不包括当天的数据(图1).采用方差-协方差法计算VaR的优点是计算简便,缺点是回报率必须满足正态分布的假设.
1.2历史模拟法
历史模拟法是采用历史收益计算各风险因子在过去一段时间的分布和变化,找出风险因子与资产组合价值之间的对应关系,通过映射关系模拟资产组合在未来的损益分布,得到既定置信水平下的最低收益,计算VaR值.
历史模拟法无需假设资产回报率服从某一特定的分布,假设以往的损益能够继续用来反映下一期间的损益分布情况,当天的VaR值对应的是过去N个历史回报率中第P个分位点的值.用2011年1月14日之前的250个交易日的数据,估算之后962个交易日当天的VaR值(图2).可以看出,VaR值相对稳定,这是因为随着时间的推移,只有当新的极端事件进入获取样本的窗口期时,才有可能导致相应分位点的VaR值变化.当市场发生波动时,这种方法算出的VaR值不能立刻将这些波动反映出来.标准的历史模拟法假设历史的每一天影响都占有相同权重,且这种影响是永远不变的,这要求预测者要人为判定一个时间跨度,具有很强的主观性,显然是不合理的.历史模拟法的优点是各方面限制条件少,不研究资产收益分布,不设置参数,不考虑尖峰厚尾,应用简便,且可以处理非线性组合;缺点是计算的随意性较大,样本数量的大小会直接影响VaR计算的精确性,且容易遗漏对极端事件的预测.
1.3蒙特卡洛模拟(Monte Carlo simulation,MCS)法蒙特卡洛模拟方法需要选择适当的随机模型利用计算机大量模拟出风险因子未来的变化路径,运用估值公式算出每条对应路径的资产价值,反复重复模拟过程,尽可能多地模拟风险因子的变化路径并估算相应资产价值,使估计的结果更加接近资产未来损益分布,最后算出VaR值.[1]蒙特卡洛模拟法的优点在于其不受资产的历史收益分布制约,也不受限于线性假设、正态分布等假设;缺点是依赖模型设计,存在模型风险,计算机模拟易产生伪随机数,使计算结果产生偏差.
2改进的VaR算法
股市收益存在自身的特点,这些特点使得上述三种方法计算VaR值都具有一定局限性.Engle建立了ARCH模型,它能够持续处理金融时间序列的异方差性,刻画金融资产的波动性,从而更好地拟合资本市场的特征.[2]ARCH模型通过自回归过程描述干扰项的方差序列,如果序列残差被证实存在自相关性,还需嵌入ARMA模型(即在均值方程中加入滞后项)来消除金融时间序列的相关性.ARCH模型设定为:
rt=c+et;et~N(0,S2t).(1)
Var(et)=γ+α1e2t-1+α2e2t-2+…+αpe2t-p.(2)
αt=σtεt.(3)
其中,干扰项et是一个独立同分布的随机变量序列,满足均值为0、方差为s2t的正态分布.
由于ARCH模型在描述资产收益率的波动时对参数要求极为严苛,为了适应参数数量难以解决的问题,Bollerslev提出GARCH模型,舍弃e2t-1,采用σ2t.GARCH(p,q)模型减少了ARCH的待估参数量,使计算的准确性大大提高.[3]GARCH模型最常用的一种建模是GARCH(1,1)模型[4]:
rt=c+et.(4)
σ2t=α0+α1α2t-1+β1σ2t-1.(5)
Bollerslev提出对干扰项采用T分布更能刻画金融序列尖峰厚尾的特征.T假设下的GARCH(1,1)模型设定为:
rt=c+et;et~T(k).(6)
σ2t=α0+α1α2t-1+β1σ2t-1.(7)
其中,干扰项et服从k个自由度的T分布.
3数据选取与分析
结合上证股票收益的厚尾、波动性等特征,引入GARCH(1,1)进行VaR估值,应用stata14.0和matlab R2021a软件进行统计分析.
3.1描述性統计与分布特征
选择日连续复合收益率,将收盘价的自然对数取一阶差分:
rt=lnPt-lnPt-1.(8)
其中,rt代表t日上证综指日连续复合收益率,Pt是t日上证综指收盘价.
本研究样本起止时间为2010年1月4日至2014年12月31日,共计1 212个交易日的上证综指收盘价,通过公式(8)计算其收益率.图3描述了这段时间上证综指收益率波动情况.可以看出,其收益率在-0.06~0.05波动,波动较大时,收益亏损曾4次低于-0.05,而正收益只有3次超过0.04;上证综指收益率还表现出较弱的波动丛聚性,即收益率的小幅波动跟随小幅波动,大幅波动跟随大幅波动.
表1描述性统计结果显示,相对于标准正态分布(峰度是3,偏度是0),上证综指收益严重左偏(偏度-0.291 3<0),说明收益率低于均值的时间超过收益率高于均值的时间,这是较贴合实际的.因为2008年全球金融危机后,全球股市低迷,我国股市也受到影响,2008年之后的最初几年,上证股票都处于震荡调整时期,收益率偏低;峰度5.113>3反映了收益率相对正态分布的尖峰特征.为使论述更为严密,应用Kolmogorov-Smirnov检验和Jarque-Bera type检验考察上述结论.
K-S检验和J-B检验上证综指收益是否服从标准正态分布,K-S检验结果为0.053,P值为0.002,在5%显著水平下拒绝服从正态分布;J-B检验结果(表2)无论是峰度、偏度还是联合检验,都在1%水平,显著拒绝服从正态分布,验证了上证综指日连续复合收益率分布的非正态性.
3.2模型设定
基于上证综指的各种特征,笔者用GARCH(1,1)模型计算VaR.首先,对残差进行序列相关性检验,如果残差不具有序列相关性,则只需要考虑GARCH模型,否则需要嵌入ARMA模型来消除序列的相关性.ARMA过程检验结果P值为 0.788 8,说明加入ARMA过程前后结果不存在显著区别,接受原假设,即不需要嵌入ARMA过程,可以直接用ARCH模型.其次,对数据进行异方差ARCH效应检验.对残差滞后1阶到滞后20阶进行ARCH效应检验.结果显示,在5%的显著性水平上不能拒绝原假设,可认为不存在ARCH效应,说明所选样本期的波动丛聚性较弱,故只需要考虑GARCH模型.考虑用T假设替换正态分布假设,并检验替代前后模型结果是否发生显著差异.使用LR检测,显示结果P值为0.000 0,拒绝原假设,说明T假设下的GARCH模型与正态假设下的GARCH模型差异显著.使用信息准则检测,显示T假设下aic值为-7 410.4,小于正态假设下aic值-7 335.2;T假设下bic值为-7 384.9,小于正态假设下bic值-7 314.8.说明T假设下的GARCH(1,1)模型效果更好.
使用GARCH(1,1)模型进行回归,得到T统计量自由度为4.967 3≈5,验证T(1)分布下的GARCH(1,1)和T(5)分布下的GARCH(1,1)是否存在显著差异.设定T的自由度为5,求出T(5)的极大似然值为3 710.187;T(1)的极大似然值为3 710.188,用似然比检验结果,得到P值为0.965 4,说明使用T(1)分布下的GARCH(1,1)和T(5)分布下的GARCH(1,1)得到的结果差异不显著,可以用T(1)分布下的GARCH(1,1)模型来简化计算.
表3显示了模型的回归结果,得到以下回归方程:
rt=0.000 078+et.(9)
σ2t=0.000 001 56+0.025 7α2t-1+0.965α2t-1.(10)
其中,rt=lnPt-lnPt-1,参数α1+β1=0.025 7+0.965=0.990 7<1,满足约束条件,模型有效,可用于上证综指的分析与预测.
4VaR值的计算与回测
考虑到2008年金融危机及其后续影响,股市的波动较剧烈,若选取的检验期过长,可能会破坏样本的一致性,故本文选取2011年1月14日之前的250个交易日上证综指日收盘价的观测值作为测试窗口期,从2011年1月14日到2014年最后一个交易日作为测试时间段(检验样本数据共计962个)来估算当天的VaR值.
本文用三种方法计算了在给定测试窗口期内两个不同置信区间的VaR值,再通过VaR值回测评估不同VaR值计算方法.假如置信区间为95%,那么理论上应该只有5%的当日实际损失超过VaR值,且这5%的情况不应该聚集在某一特定时间.倘若损失超过VaR值的情况集中出现在某一时段,则表明这5%的情形并非在时间上是相互独立的,而且常用的计算方法得出的VaR值应该是对于市场的变化反映比较缓慢(置信区间为99%时情况相同).
本文分别把95%和99%的置信区间下的三种方法算出的VaR值以及相应时间的回报率画在同一个图中进行对比,见图4和图5.
图4和图5表明,当回报率出现负值的时候,损失才可能会超过VaR值.T假设下GARCH(1,1)法计算的VaR值在这个时段内更加贴近也更准确地反映了回报率的趋势.因此,在采用T假设GARCH(1,1)法计算时,资产的损失较少有突破VaR值的情况.
5结论
设计一种基于GARCH(1,1)模型的改进VaR算法(简称g-VaR).g-VaR将GARCH(1,1)模型引入VaR值计算,描述上证综指收益的波动性和尖峰厚尾特征,采用T假设下的GARCH(1,1)模型计算VaR值.回测检验结果显示,g-VaR能更好地檢验上证综指收益率,预测上证综指风险,模型有效.
参考文献
[1]尤赟来.基于历史模似法和M-C方法的VaR算法改进[D].上海:复旦大学,2013.
[2]Engle R.F.Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of UK Inflation[J].Eco- nometrica,1982(50):987-1008.
[3]Bollerslev T.Generalized Autoregressive Conditional Heteroskedasticity[J].Journal of Econometrics,1986(31):307-327.
[4]张培,王晶晶,高显彩.基于自回归条件异方差 (ARCH) 族模型的收益率波动性分析[J].洛阳理工学院学报:自然科学版,2021(31):83-92.
[5]谢婉婷,谷伟.基于Bootstrap中位数—方差估计方法的改进EM算法的VaR度量及实证[J].现代商业,2018(24):164-165.
[6]尹向东,宿成建,刘星.沪深股市波动性的杠杆效应和不对称波动性研究[J].科技管理研究,2005(10):173-175.
[7]程子晋,谷伟.基于核密度估计对VaR值计算方法的改进[J].统计与决策,2017(16):32-35.
[8]熊伟,霍玉洪,胡茂林.中国股票市场收益率的R/S分析[J].牡丹江师范学院学报:自然科学版,2009(3):1-3.
编辑:吴楠