APP下载

基于广义已实现测度的沪深300股指期货波动率预测与风险度量

2022-12-07苏小囡郝红霞

关键词:时变测度广义

苏小囡,张 蕾 ,邢 钰 ,郝红霞

(南京审计大学 1.统计与数据科学学院; 2.金融工程重点实验室; 3.金融学院, 南京 211815)

一直以来,金融资产收益波动率的建模与预测都是金融领域关注的重点。有关学者对波动率进行了大量的研究,其中Bollerslev(1986)[1]提出的GARCH模型最具有代表性,它能够很好地描述波动率的聚集性与尖峰厚尾现象。近年来随着信息技术的发展,金融高频数据越来越容易获得,而GARCH类模型采用的是低频数据,这将导致模型预测精度降低。如何将丰富的日内信息与波动率模型联系起来成为一个学术热点。Andersen和Bollerslev(1998)[2]首次基于高频数据提出了已实现波动率(Realized Volatility,RV),RV为波动率的一致估计量且计算简便,被广泛应用于高频金融数据的研究中。

Hansen等(2012)[3]将波动率模型与已实现测度相结合,提出了Realized GARCH模型, 其不仅保留了GARCH模型的优点而且有着更好的波动率拟合与预测效果。之后学者对Realized GARCH模型进行不断地拓展,王天一和黄卓(2012)[4]将模型中的残差分布推广到厚尾分布的情形。施雅丰和艾春荣(2016)[5]将周内效应引入Realized GARCH模型,发现周内特征能够提高高频波动率的样本外预测能力。Huang等(2016)[6]在模型中同时考虑日、周、月已实现测度,构造了Realized HAR GARCH模型,该模型能够更好地捕捉高频时间序列中的长记忆性,提高模型的预测精度。蔡光辉和项琳(2020)[7]实证结果显示在不同测度下Realized HAR GARCH模型有着更好的波动率预测效果。蒋伟和顾研(2019)[8]与白娟娟和师荣蓉(2021)[9]均发现广义已实现测度能够改进模型的预测效果,提高VaR预测精度。此外,基于时变波动的已实现波动模型建模,我们可以参见Gerlach和Storti (2018)[10]与蔡光辉和吴志敏(2021)[11],前者将时变波动持续性和多种已实现测度引入到Realized GARCH模型中,后者在模型中考虑了HAR结构,得到了更好的波动率拟合与预测效果。

基于上述分析,本文将综合考虑时变波动、HAR结构、广义已实现测度等因素,对波动率进行建模。其中,广义已实现测度与传统已实现测度相比,包含较少的日内收益率信息,减少了微观结构噪音,能够更好地捕捉价格极端波动,从而使模型可能具有更好的VaR预测效果。文章以沪深300股指期货的5分钟高频数据作为研究对象,在六种不同的测度下对Realized GARCH模型、SMA-Realized GARCH(Single Measure Adaptive)模型、Realized HAR GARCH模型、SMA-Realized HAR GARCH模型进行VaR后验测试与模型可信集(Model Confidence Set,MCS)检验,结果显示,在广义已实现测度下,SMA-Realized HAR GARCH模型有着最好的风险预测效果。

一、波动率模型及预测检验方法

Huang等(2016)提出了Realized HAR GARCH模型,本文在此基础上考虑时变波动持续性,得到SMA-Realized HAR GARCH模型:

log(xt)=ξ+φlog(ht)+τ(zt)+ut,

(1)

其中,yd,t=γd+δdg(RQt-1),yw,t=γw+δwg(RQWt-1),ym,t=γm+δmg(RQMt-1),RQt,RQWt,RQMt分别表示第t个交易日的日,周,月已实现四次幂差:

(2)

尽管g(·)在原则上可以选择任意函数,但Bandi(2008)[12]等认为采用对数变换能够显著地降低已实现四次幂差的相对可变性,且对估计的相对可变性有正面的影响,故这里g(·)表示为:

(3)

对于方程中已实现测度xt的选取,本文采用六个测度:RV、RBV、MedRV、RVaR、RES、RMAD,具体定义情况见蔡光辉和项琳(2020),将Realized GARCH模型、SMA-Realized GARCH模型、Realized HAR GARCH模型、SMA-Realized HAR GARCH模型分别简记为RG模型、SMA-RG模型、RHG模型、SMA-RHG模型。

文章基于偏t分布,对模型进行极大似然估计,其中RG模型的联合对数似然函数为:

(4)

在险价值(VaR)作为衡量波动率模型预测效果的重要指标,其计算公式为:

(5)

二、实证分析

(一)数据处理与描述性统计

本文选取2015年4月16日至2021年10月29日的沪深300股指期货的5分钟高频数据作为研究对象,数据来源于“聚宽量化交易平台”。

由表6可见,Co基体对Cu、As的结果影响不明显。但随着Co基体浓度的升高,Fe、Ni、Cd、Zn、Mn、Ca、Mg、Na、Si、S的测定结果逐渐降低,其中Ni、Cd、Zn、S的测定结果随Co基体浓度升高而降低的趋势尤为明显。这说明Co基体对不同待测元素的影响存在差异性。

图1给出了沪深300股指期货的高频价格及对数收益率时序图,从中可以看出沪深300股指期货的价格波动比较明显,收益率序列也存在波动集聚现象,而波动的聚集性通常反映市场信息的冲击具有一定的持续性,故可以初步判断序列存在异方差效应。

表1给出了沪深300股指期货的日收益率序列与6个已实现波动率的描述性统计结果。表中J-B统计量均在1%水平下显著,拒绝原假设,不服从正态分布,且已实现波动率的偏度均大于0,峰度均大于3,说明序列存在右偏趋势和尖峰特征,故设定残差服从偏t分布是合理的。LB(10)表示Ljung—Box检验滞后10阶的Q统计量,表明收益率序列和已实现波动率均有显著的自相关特征。 ADF单位根检验表明所有序列在1%的水平下均拒绝原假设,表明所有序列均不存在单位根,为平稳的时间序列,故可直接进行建模。

表1 沪深300股指期货日收益率序列和已实现波动率的描述性统计

(二)参数估计

本文采用极大似然估计的方法对24个模型进行全样本参数估计,此处仅展示SMA-RHG模型的参数估计结果,如表2所示。

表2 SMA-RHG 模型参数估计结果

由上述表格可知:以极大似然值、AIC、BIC作为评判标准,相比于传统已实现测度,广义已实现测度下的模型均有着更大的似然值与较小的AIC、BIC值,这说明模型在广义已实现测度下有着更好的估计效果。此外,在所有已实现测度下,相比其他模型,SMA-RHG模型的似然值最大,AIC值最小,且引入了HAR结构或者时变波动的模型均比未引入模型的似然值大。这说明考虑周、月线已实现测度、时变波动对于模型估计效果有所提升。总体来看在RMAD测度下的SMA-RHG模型是所有模型中拟合效果最优的。

从模型的参数来看,大部分参数均在 1%水平下显著,参数的符号和大小与Hanse等(2012)的理论假设基本一致。其中,杠杆参数τ1基本显著为负,τ2均显著为正,这表明沪深300股指期货具有一定的杠杆效应与波动聚集效应;偏度系数λ均小于1,峰度系数η相对较小,说明残差项的分布整体呈现左偏厚尾的现象;除了在RVaR测度下的RHG模型,所有模型的波动持续性参数π均接近于 1,说明模型具有较强的波动持续性与协方差稳定性。

从已实现测度来看,所有模型对应的参数γ(γd)高度显著,广义已实现测度均比传统已实现测度的数值大,这表明对于波动率,广义已实现测度有着更大的影响力,即昨日发生的损失或偏差会造成今日更大的波动。RHG 模型和SMA-RHG模型的日线估计值γd明显大于周线与月线估计值,显著性也更强,而周线γw大都不显著,月线γm的显著性要比周线γw强一些,在这一点上SMA-RHG模型表现的比RHG 模型更加明显。SMA-RHG模型的月线至少在5%的水平下显著,这显示了沪深300股指期货具有长记忆性的特性,对于未来一日波动的影响主要来源于前日,周波动的影响较弱,而月波动的影响却更强。表明了引入广义已实现测度对波动率进行估计的合理性。

参数γ(γd)显著为正,δ(δd)在5%的水平下显著为正,这表明已实现波动测度对条件波动率的影响主要取决于日已实现四次幂差RQt,γw部分显著,δw不显著,这表明周已实现四次幂差对条件波动率的影响随时间变化不大,γm在5%的水平下显著,δm不显著,这表明月已实现波动率测度对条件波动率的影响较大,月已实现四次幂差对条件波动率的影响随时间变化不大。

传统已实现测度的φ值近似等于 1,表明已实现波动测度和条件波动成比例。所有测度中,广义已实现测度的φ值均小于 1,取值在 0.5附近,这是由于广义已实现测度不是条件波动的有效非参数估计,不与条件波动成比例,它只反映损失的波动情况,因此两种已实现测度的估计结果有着一定的偏差。模型中残差标准差的估计值σu在一定程度上可以反映方差的拟合表现,在所有模型中广义已证实测度下的σu均比传统已实现测度下的小,这表明广义已实现测度能够更好地拟合测量方程。此外,由于传统已证实测度衡量的是全天的波动,其他测度衡量的是交易时间内数据计算出的部分波动,全天的波动大于只有交易时间的已实现波动测度,故RVt、RBVt、MedRVt测度下的ξ为正,其他测度下的均为负。

(三)样本外VaR预测及后验测试

本文采用滚动时间窗的方法估计样本外VaR预测值,样本外预测天数为570天(2019年6月26日至2021年10月29日),固定的时间窗口大小为1 000天,可得到570个预测值,再对这些预测值进行三种后验测试:无条件覆盖(Unconditional Coverage,UC)检验、独立性(Independence)检验、条件覆盖(Condition Coverage)检验,结果如表3所示。

由表3可知,在5%的覆盖水平下,各模型的失败率均接近5%,结合失败率与三个后验测试的结果,总体看来,结合了RMAD测度的模型表现最优。这从一定程度上表明了广义已实现测度的引入能够提升模型 VaR 预测的有效性。表中所有的模型均通过了检验,表明在所有测度下的模型都能够对风险进行有效的预测,说明四种模型对沪深300股指期货收益率风险值进行预测是有效的。

表3 失败率及VaR后验测试结果

(四)MCS检验

为了进一步比较各模型的波动率预测效果,本文使用MCS检验对模型的优劣进行评价,采用的统计量为范围统计量TR和半二次方统计量TSQ, 具体的定义可以参见Hansen等(2011)[13]。我们按照文献蒋伟和顾研(2019)的做法,选择ALF、RLF、FLF这三种不同的损失函数作为各类波动率模型预测精度的评判标准。

由于损失函数无法提供模型之间的预测差异是否具有统计意义,故在此基础上进行MCS检验,模型的p值越大预测能力越强,检验结果如表4所示。

在MCS检验的过程中,使用 Bootstrap的方法对数据进行处理,令模拟次数B=1000,区块长度[14]d=2,置信水平α=0.25。故p值大于0.25的模型将通过MCS检验。

由表4可知,在 25%的水平下,模型的MCS 检验通过率较高,结合HAR结构与时变波动的SMA-RHG模型普遍具有更好的风险预测表现,预测精度最高的是在RVaR测度下的SMA-RHG模型,其在三个损失函数下六个统计量的p值均为1,是24个模型中的最优模型。从模型来看,RHG和SMA-RHG模型分别比RG和RHG模型通过检验的数量多,这表明HAR结构与时变波动的引入均可提高模型对未来风险的预测能力。

表4 MCS检验结果

三、总结

本文在结合了HAR结构和时变波动的RG 模型基础上引入了广义已实现测度,对比了传统已实现测度与广义已实现测度在RG模型、 SMA-RG模型、RHG模型、SMA-RHG模型上的VaR预测效果,实证结果表明:

广义实现测度HAR结构、时变波动的引入均可以提高模型对波动率的预测机度。在本文的所有模型中,RVaR测度下的SMA-RHG模型检验最优。

猜你喜欢

时变测度广义
Rn上的测度双K-框架
平面上两个数字集生成的一类Moran测度的谱性
The Last Lumberjacks
我国要素价格扭曲程度的测度
|直接引语和间接引语|
一类特别的广义积分
任意半环上正则元的广义逆
基于马尔可夫时变模型的流量数据挖掘
基于时变Copula的股票市场相关性分析
基于时变Copula的股票市场相关性分析