基于GARCH模型对上证指数收益风险波动的实证分析
2015-01-12王旋余显宾周漫桐
王旋 余显宾 周漫桐
摘要:金融市场的不确定性导致价格波动的随机性,而研究波动的随机性不仅可以支持金融理论,也对金融实践有重大意义。本文以上证指数的日收益率为研究对象,采用EVIEWS通过建立ARCH类模型对上证指数日收益率进行实证分析,浅释股指收益率与风险之间的关系。结果表明,GARCH(1,1)模型能够较好的拟合上证股票收益率的波动特征,如“高峰厚尾”、集聚等现象,而GARCH(1,1)-M模型在一定程度上能较好的表现出风险与收益率之间的关系。同时也验证了沪市在中长期内不存在杠杆效应。
关键词:GARCH模型;GARCH-M模型;上证指数;杠杆效应
1.引言
本文以上证指数的日收益率为研究对象,通过建立ARCH类模型对上证指数日收益率进行实证分析,浅释股指收益率与风险之间的关系。结果表明,GARCH(1,1)模型能够较好的拟合上证股票收益率的波动特征,而GARCH(1,1)-M模型在一定程度上能较好的表现出风险与收益率之间的关系。同时也验证了沪市在中长期内不存在杠杆效应。
2.样本选择与处理
上证综合指数能反映上证指数的概貌和运行状况,能作为投资评价尺度及金融衍生产品基础的基准指数。故本文选取上证综合指数作为研究对象,截取自2005年1月至2012年12月共计1939个样本点,以每日收盘价计算其对数收益率如下:
Rt=100×(lnpt-lnpt-1)
其中,pt,pt-1分别表示上证指数在t和t-1天的指数值,Rt表示第t天的对数收益率。以p代表上证综合指数的每日收盘价,对指数取对数记作:lnp,对数一阶差分(收益率)记作:R。
本文数据来源于“搜狐证券”每日收盘指数,计量分析工具为EVIEWS6.0。
3.模型建立
3.1 平稳性检验
从上证180指数对数收益率时间序列图中,可观察到对数收益率波动的“集群”现象:波动在一些时间段内较小(例如从第500个观测值到第700个观测值),在有的时间段内非常大(例如从第100个数据到第250个数据)。
图1上证180指数对数收益率时间序列图
在现代资本市场理论的基本假设中,一个核心假设是收益率序列式平稳的且服从正态分布[6]。如果收益率序列非平稳或非正态,根据统计方法做出的分析和预测具有很大的偏差。因此,保证股票收益率序列的平稳性正态性和具有重大意义。
利用Eviews6.0得到收益率序列的正态分布检验结果(图2):
图2正态性检验结果
由图可知,上证指数对数收益率序列均值(Mean)为0.031064,标准差(Std.Dev.)为1.785656,偏度(Skewness)为-0.310143,小于0,说明序列分布有长的左拖尾。峰度(Kurtosis)为6.175179,高于于正态分布的峰度值3,说明收益率序列具有尖峰和厚尾的特征。Jarque-Bera统计量为845.1714,P值为0.00000,拒绝该对数收益率序列服从正态分布的假设。
平稳性检验的方法主要有非参数检验、自相关检验以及单位根检验。单位根检验(ADF)是时间序列分析中检验序列平稳性的有效方法之一,在金融实证分析中也被广泛运用。本文运用ADF检验法来检验上证指数收益率序列的平稳性(见表1)。
表1上证指数收益率r序列单位根检验结果
t-StatisticProb.*
Augmented Dickey-Fuller test statistic
-43.863410.0001
Test critical values:1% level-2.566156
5% level-1.940987
10% level-1.616589
从表1看出,在1%的显著性水平下,ADF检验的t统计量远小于临界值,因此拒绝原假设,即表明上证指数收益率序列不存在单位根,因而是平稳序列。
3.2 均值方程的确定
ARCH类模型主要是由两部分构成:均值方程和条件方差方程。因此,对均值方程的设定是进行ARCH模型估计的第一步。首先对上证股票收益率样本数据进行分析,确定均值方程。从表2可以看出,序列的自相关和偏自相关系数均落入两倍的估计标准差内,前几期的滞后Q-统计量的对应的p值均大于置信度0.05,故序列在5%的显著性水平上不存在显著的相关性。但在滞后4期后,序列的相关性显著增强。因此,拒绝自相关系数为零的假设。可以对序列建立自回归移动平均模型,经反复筛选,对收益率可建立以下序列模型:
Rt=aRt-6+bRt-11+cRt-13+dRt-15+εt
其中,rt为上证股票收益率,a、b、c、d为常数,εt为随机扰动项。利用最小二乘估计可得:
Rt=-0.055825Rt-6+0.053562Rt-11+0.051711Rt-13+
0.064831Rt-15+εt
R2=0.011047DW=1.994449AIC=3.993
SC=3.997259
图3残差自相关图
图4上证指数股票收益率回归方程的残差
上述模型的各个统计检验都显著通过,再对残差序列进行分析。由图3的自相关图发现残差序列已不存在序列自相关。因此,用上述模型描述收益率序列的自相关性是恰当的。观察回归方程的残差图(如图4所示),发现波动的“成群”现象:波动在一段时间内较小,在另一段时间内波动又非常大,这说明误差项可能具有条件异方差性。
3.3 ARCH效应的检验
在考虑运用ARCH类模型建模前,先检验序列是否存在条件异方差。那就需要对均值方程的残差序列进行ARCH-LM检验,以验证收益率序列是否具有ARCH效应。检验结果见表2
表2残差ARCH效应检验
F-statistic26.56271Prob.F(3,1916)
0.0000
Obs*R-squared76.66588Prob.Chi-Square(3)0.0000
可以看出,检验即使在q=3时,残差序列的相伴概率也都为0.0000,远远小于显著性水平,说明序列都存在高阶ARCH(q)效应。一个高阶的ARCH模型可以用一个低阶的GARCH模型代替,此时可考虑采用GARCH(p,q)模型。
4.ARCH类模型的建立及其波动性分析
通过以上ARCH效应的检验,得知在上证指数日收益率序列的均值方程(AR模型)的残差平方序列均存在高阶的自相关。故本文在均值方程(AR模型)的基础上通过低阶的GARCH(p,q)模型来刻画收益率。其中p是GARCH项的阶数,q是ARCH项的阶数,p,q的选择是通过赤池信息准则(Akaike Information Criterion,即AIC)来确定,这里选择最高阶数为2。表3为沪市各类GARCH(p,q)模型的AIC检验。
根据AIC准则,GARCH(1,1)的AIC值最小,ARCH项系数均为正数,符合GARCH模型建立的基本要求,GARCH(1,1)模型在5%显著性水平下各参数检验均显著,故最终选择GARCH(1,1),认为GARCH(1,1)模型可以较好的描述我国上证股票收益率的波动情况,因而建立GARCH(1,1)模型:
xt=mt+εt
εt=htet
ht=ω+αε2t-1+βht-1
et~i.i.d;et~N(0,1)
对该模型进行残差检验,从残差自相关图中可以看到,残差序列不存在自相关问题。而从ARCH检验中看到在滞后12阶的情况下p值显著大于0,故说明残差序列不存在ARCH效应。从图5 Q-Q图可看出,残差序列不服从正态分布。因此,需要对残差序列进行比较正确的分布描述。一般情况下,当大样本时,t分布给出的概率比正态分布给出的概率要大。因此,我们用t分布来估计GARCH模型。
图5Q-Q图
从图5(右)可见,除个别观察值外,残差序列服从t分布。
在GRACH(1,1)模型建立的基础上,考虑能否进一步进行TGARCH或EGARCH模型进行建模,考虑是否存在杠杆效应。经过检验后,发现参数检验不显著,故说明不存在杠杆效应。
5.上证指数收益风险模型分析
金融理论表明具有可观测到的较高风险的资产可以获得较高的平均收益 [6]。Engle等人提出了GARCH—M模型,用以描述风险与收益之间的联系。它将条件均值作为条件方差的函数,也就是作为基础变量的滞后值的自回归函数。在原始ARCH模型基础上推广的GARCH模型形式如下:
ri=α0+α1ht+∑airi+εt
εt=htet
ht=ω+αε2t-1+βht-1
et~i.i.d;et~N(0,1)
考虑到股市存在风险与收益,故尝试拟合残差服从t分布的GARCH(1,1)-M模型,将受益率波动状况拟合更好,达到最优状态。
有表4可知,模型拟合各参数检验均显著。同时,该模型的AIC值也明显小于GARCH(1,1)(见附录),因此,本文可建立的关于上证股票收益率波动情况的最终模型为GRACH(1,1)-M,残差服从t分布。估计回归结果如下:
用GARCH(1,1)-M模型拟合后得到残差的ARCH-LM检验结果,F统计量值为0.041184,P值为0.9889,R2值为0.123801,P值为0.9888。因此可以看出收益率序列残差不存在ARCH效应。在GARCH(1,1)-M模型中的ARCH项和GARCH项系数大于0,满足模型的非负约束。其之和(α+β)为0.995328满足模型是平稳的过程。α反映了外部冲击对股市波动的影响程度,β值大表明波动性对市场走势变动反映较快,从而倾向于更发散;则反映了股市波动自身的记忆性,当0<β<1时,β值越大说明波动性消减越缓慢且将持续存在,当β>1时,系统本身将会放大前期波动。通常α值会小一些,而β值较大。αβ之和则反映了外来冲击对系统整体波动的影响的持续性[7]。
在收益率方程中要包含ht项,是为了在收益率的生成过程中融入风险溢价,这是许多资产定价理论模型的基础。因为预期较大值的条件标准差与高收益率相联系,在这种情况下,ht的系数应该是正数,上述实证结果也正如此。在上海股票市场的收益率方程中ht的系数为0.048584,表明当市场中的预期风险每增加一个百分点时,就会导致收益率也相应增加0.048584个百分点。这与传统的风险与收益关系的认识相,即上证指数收益率与风险是同向变动的,存在显著的风险奖励,高风险要求高收益,说明投资者对市场关注程度较高,信息传递较快,随着风险的变化,会对收益率产生影响,体现出投资者一定程度的风险偏好。
6.结论
借助GARCH类模型对上证指数进行以上分析可知:
1.使用带厚尾分布(student-t)的GARCH族模型的对上证指数收益率的拟合要优于带正态分布的GARCH模型。通过EGARCH和TARCH模型系数的估计可知,上证指数不存在杠杆效应,这可能与我国股市的交易机制有关,另一方面也说明我国股民在股票投资方面不够成熟,大多数为风险偏好型。
2.上证指数具有很强的波动集聚性和持续性。我国上证指数存在明显的ARCH效应,GARCH模型适合于拟合沪市日收益率序列,这与文献[9]中的结论是一致的。由GARCH模型估计的上海综合指数的条件方差序列表明上海
股市波动具有典型的时变性、簇集特征,这表明在波动的内在传导过程中,过去的股价变动对未来的股价波动有强烈的影响。
3.股票价格波动的短期记忆性及波动与风险存在正相关。在GARCH(1,1)-M模型中,ARCH项和GARCH项系数之和(α+β)为0.995328,满足参数约束的条件。同时系数之和非常接近1,表明条件方差所受的冲击是持久的,β值较大,这意味着上证指数的波动性的持续性越高,当证券收益一旦受到冲击出现异常波动,则在短期内很难得以消除;由这种波动的长记忆性可以看出冲击对未来所有预测都起重要作用。同时模型能很好的拟合上海股市风险与收益率之间的关系,实证结果表明上海股市的收益与波动之间存在一定的正相关关系,说明在这段检验时间内,我国上证指数的理性程度越来越高,理性投资已经逐步占据主要地位。
参考文献:
[1]Bollerslev,T.,R.Y.Chou and K.F.Kroner.ARCH modeling in finance:
A review of the theory and empirical evidence [J].Journalof Econometrics,1992,52,5-59
[2]陈千里,周少甫,中国股市收益波动的实证研究[J].华中科技大学学报,2002,(9).
[3]刘金全、于冬、崔畅,中国股票市场的信息反应曲线和股票价格波动的非对称性[J].管理学报,2006,3(3).
[4]殷玲,唐杰,GARCH一M模型与我国沪深股市的波动[J].江南大学学报.2002.4.
[5]尹清非,仇媛媛,沪市股票风险与收益关系实证研究[J].数学理论与应用.2007.6.
[6]么彩莲,王 涛,ARCH类模型及其在上证指数收益波动中的应用[J].辽宁石油化工大学学报,第29卷第3期.
[7]李红霞,中国股票市场波动性研究:模型选择及实证[J].广东金融学院学报,2007.9.
[8]严定琪,李育锋,基于GARCH族模型的沪深300指数波动率预测[J].兰州交通大学报.2008.2.
[9]耿贵珍,佟毅.GARCH模型的相依性[J].辽宁石油化工大学学报,2007,27(2):93-95.