APP下载

基于动态估计误差的中国股市波动率建模与预测

2017-10-13宋亚琼王新军

中国管理科学 2017年9期
关键词:回归系数方差波动

宋亚琼,王新军

(1.中共泰安市委党校,山东 泰安 271000;2.山东大学经济学院,山东 济南 250100)

基于动态估计误差的中国股市波动率建模与预测

宋亚琼1,王新军2

(1.中共泰安市委党校,山东 泰安 271000;2.山东大学经济学院,山东 济南 250100)

本文设波动率的估计误差服从异方差假定,在对已实现波动率进行建模时,根据方差变化来设定模型的自回归系数,构建基于高频数据的HARQ(F)模型。在此基础上,考虑中国股市波动的跳跃行为及杠杆效应,先后构建了HARQ(F)-CJ模型和LHARQ(F)-CJ模型,以改善波动率模型的拟合效果和预测能力。本文假设,当期已实现波动率或其连续成分的估计误差的方差越大,它对未来真实波动率的解释力度则越差,因而其对应系数越小。对上证综合指数近15年的五分钟高频数据进行实证研究发现,基于估计误差异方差假定的动态系数能够提高已实现波动率模型的拟合效果和预测能力。其中,对日回归系数进行基于估计误差方差的动态调整是模型改进的关键。同时考虑中国股市波动的跳跃行为及杠杆效应的LHARQ-CJ模型在所有模型中表现最优。

已实现波动率;动态估计误差;高频数据;跳跃行为;杠杆效应

1 引言

股市波动率的建模与预测一直以来是金融理论研究的重要命题之一。它对资产组合选择、金融资产及其衍生品定价、以及金融机构的风险管理都具有重要意义。20世纪80年代起,国内外学者提出了基于低频数据的GARCH类模型和SV类模型对股市波动率进行估计和预测,很好地刻画了股市波动的集聚性和时变性特点。进入21世纪,基于高频数据的股市波动率的建模与预测成为新的研究趋势。为了充分利用股市交易的日内信息,Andersen和Bollerslev[1]提出了基于高频交易数据的已实现波动率(Realized Volatility,RV),作为股票市场真实波动率的一致估计量。在此基础上,Andersen等[2]结合波动率的长记忆性构建了ARFIMA-RV模型,Corsi[3]综合考虑了波动率的长记忆性和异质性,建立了HAR-RV模型。通过实证研究发现,ARFIMA-RV模型和HAR-RV模型对股市波动率的样本外预测能力优于传统的GARCH模型和SV模型,而HAR-RV模型因其简单有效的形式得到广泛应用。魏宇[4]将已实现波动率作为附加解释变量加入GARCH模型和SV模型中,运用SPA检验进行评估发现,模型的预测能力有所提高。

随着HAR-RV模型的广泛应用,国内外研究者结合股市波动的诸多性质对其进行了扩展研究。Andersen等[5]基于多次幂变差理论将已实现波动率分解为连续成分和跳跃成分,在此基础上构建HAR-J模型和HAR-CJ模型,通过实证研究发现,这两种成分对波动率预测都有显著影响,提高了模型预测能力。Bollerslev等[6]综合考虑了股市波动的跳跃行为和杠杆效应,提出HAR-GARCH-BV模型,并结合收益率方程和跳跃方程提高了波动率预测水平。Corsi[7]构建LHAR-CJ模型,证明股市波动的跳跃行为和股价负收益能够影响股市波动预测。陈浪南和杨科[8]结合中国股市高频波动率的长记忆性、结构突变、不对称性和周内效应等特征,构建了自适应的不对称性HAR-CJ-D-FIGARCH模型,通过实证研究发现,该模型对中国股市的波动有很好的拟合效果和预测能力。孙洁[9]将日波动率划分为跳跃性波动、连续性波动和隔夜波动,建立HAR-CJN模型对股市波动率进行预测,提升了模型的预测能力。

在日内高频数据抽样频率足够高的情形下,已实现波动率为股市真实波动积分波动率(Integrated Volatility,IV)的一致估计量。当抽样有限时,研究者将RV与IV之间的偏差定义为估计误差,由微观结构噪声和其他测量偏差导致。当估计误差越大时,已实现波动率对股市真实波动的估计和预测就越不准确。随着研究的深入,估计误差开始成为国内外学者基于RV进行股市波动率建模和预测的新关注点。Asai等[10]运用蒙特卡罗模拟法研究了使用RV估计股市波动时的误差,发现忽略估计误差会导致由模型误设而引起的严重偏差。Dobrev和Szerszen[11]提出了状态空间形式的渐进精确波动率测量方程,运用贝叶斯估计方法,将RV的估计误差方差考虑在内对股市波动率进行建模和预测,但这种方法没有将估计误差方差设为模型的动态变量。

近年来,考虑微观结构噪声引起的估计误差的波动率建模研究开始起步。为了降低微观结构噪声引起的估计误差,Jacod等[12]提出预平均法,运用连续函数对高频数据进行光滑处理,经证明,这种方法能够对积分波动率的估计量渐进方差进行一致估计。Andersen等[13]在运用随机波动模型来估计股市波动率时,选择了多种形式的已实现波动率测量量,其中基于平均标准稀疏抽样方法的已实现波动率在建模和预测中表现最好。Bandi等[14]提出了基于时变抽样频率的已实现波动率估计量,用来解释由市场微观结构噪声而造成的估计误差中的异方差性,为股市波动预测提供了更强的有效信息。国内研究中,唐勇[15]将已实现波动分解为连续样本路径方差、跳跃方差和微观结构噪声方差,提出HAR-N-CJ模型和LHAR-N-CJ模型,实证结果表明新模型在拟合与预测方面都较HAR-CJ模型有所提高。马丹和尹优平[16]提出,门限预平均实现波动能够在微观结构噪声和波动跳跃同时存在的情况下减少股市波动的预测误差,是资产价格波动的一致估计。

综上所述,基于已实现波动率的股市波动建模和预测研究发展日臻完善,近些年,学者们开始关注已实现波动率的估计误差对建模和预测的影响。然而,现有研究对估计误差中由市场微观结构噪声引起的部分研究偏多,考虑估计误差总体效果的文献较少。在结合估计误差的波动率建模研究中,也没有将其方差的动态性体现在模型中。本文将RV估计误差的方差变化设为影响模型预测结果的因素,在对已实现波动率进行建模时根据基于估计误差的异方差假定来设定模型系数,提出了HARQ(F)模型,以及结合中国股市波动的跳跃行为和杠杆效应的HARQ(F)-CJ模型和LHARQ(F)-CJ模型,从而改善已实现波动率模型的拟合效果和预测能力。

2 动态系数的波动率建模理论

2.1已实现波动率和高频分布理论

假设资产价格服从如下随机差分方程:

dln(Pt)=μtdt+σtdWt

(1)

其中,μt表示飘移项,σt表示瞬时波动率,Wt为独立于σt的标准布朗运动。定义资产价格在t期的真实波动率为积分波动率IV(Integrated Volatility)。

(2)

已实现波动率RV(Realized Volatility)是资产价格n个日内收益率的平方和。

(3)

其中,Δ表示资产价格数据的抽样间隔。M=1/Δ,表示日内收益率的数目。rt,i≡100×[logPt+iΔ-logPt+(i-1)Δ]表示Δ时段内的收益率。

根据Barndorff-Nielsen和Shephard[17]提出的渐进分布理论,当抽样间隔Δ→0时,真实波动率可由已实现波动率进行一致估计,估计误差设为ηt。

RVt=IVt+ηt,ηt~N(0,2ΔIQt)

(4)

2.2估计误差的异方差假定

RV是真实波动率的一致估计量,同时,估计误差在一般情况下是序列不相关的。因此,我们可以用含RV的时间序列模型来预测潜在的真实波动率。

假设IV的动态相依关系可以由如下AR(1)模型表示:

IVt=φ0+φ1IVt-1+μt

(5)

(6)

现在假设,以AR(1)过程来代替ARMA(1,1)过程对RV进行拟合,有下式成立:

IVt+ηt=β0+β1(IVt-1+ηt-1)+μt

(7)

等式左侧的估计误差ηt影响的是估计参数的标准差,而等式右侧的估计误差ηt-1会直接影响参数β1的估计,从而对模型预测产生影响。

(8)

以上论述是基于估计误差的方差是常数的假设,然而,从式(4)可以看出,RV对真实波动率的估计误差随着时间的变化而改变。当IQ较小时,RV对IV的估计较为精确;当IQ较大时,估计效果减弱。因此,从预测的角度上讲,AR模型的常系数假定并不是最优的,本文构造随时间变化的自回归系数β1,t来拟合IQ变化对估计的影响。

(9)

(10)

将系数β1,t代入RV的自回归模型可得模型(10)。笔者将RV模型的自回归系数看作是IQ1/2估计量的线性函数,而没有直接采用式(8)中方差的倒数形式,是为了使模型更加稳健。同时,模型还能够用简单的OLS方法进行估计。模型的自回归系数β1,t随估计误差的方差而变化。特别地,假定β1,Q<0,当该日RV作为真实波动率的估计量误差较大时,它对未来真实波动率的预测作用较弱,而估计误差较小的RV对未来真实波动率的预测起到较强的解释作用。这就是本文建模的理论基础。

3 基于跳跃行为和杠杆效应的模型扩展

3.1HARQ模型

模型(10)作为一阶自回归模型无法描述RV对真实波动率预测的长记忆性,本文结合估计误差的异方差假定,对异质自回归模型HAR-RV进行改进,得到如下模型:

(11)

同理,该模型日、周和月的自回归系数受到相应RV估计误差的影响,它们随着平均估计误差的增大而减小,从而使得具有较大估计误差的RV对未来真实波动率预测作用降低。我们将此模型称为HARQF模型。

随着时间跨度k的增大,平均估计误差RQt-1|t-k的解释作用会随之弱化。所以,根据估计误差调整的日系数对波动率的解释能力要高于调整的周系数和月系数。据此,本文对模型(11)进行简化处理,仅对具有较强解释能力的日系数根据估计误差进行调整,定义了HARQ模型。

(12)

3.2HARQ-CJ模型

当资产价格发生跳跃时,它服从以下随机差分方程。

dln(Pt)=μtdt+σtdWt+κtdNt

(13)

本文用以下Z统计量对波动跳跃的存在性进行检验。

Zt≡

(14)

当Zt大于标准正态分布在显著性水平为α的临界值Φα时,我们认为存在波动率跳跃,Jt≡I(Zt>Φα)·[RVt-BPVt],波动的连续成分为Ct≡I(Zt≤Φα)·RVt+I(Zt>Φα)·BPVt,I(·)为示性函数。

Barndorff-Nielsen和Shephard[17]指出,若用BPV来估计真实波动率,其估计误差的渐进方差为2.61ΔIQt,而在积分变差IQ的一致估计量中,已实现三次幂变差TPQ在跳跃存在的情形下是有效的。

基于此,本文对HAR-CJ模型进行改进,使其满足估计误差的异方差假定,将波动率连续成分的系数看作是随估计误差方差的变化而改变的。形式如下:

(15)

该模型连续成分的日、周和月自回归系数受到相应已实现波动率连续成分的估计误差影响,它们随着平均估计误差的增大而减小,从而使得具有较大估计误差的连续成分对未来真实波动率预测作用降低。该模型还同时刻画了跳跃成分的日、周和月效应对未来波动率预测的作用。我们将此模型称为HARQF-CJ模型。

同理,随着时间跨度k的增大,平均估计误差TPQt-1|t-k的解释作用会随之弱化。本文定义了HARQ-CJ模型,仅对具有较强解释能力的连续成分日系数根据估计误差进行调整。

(16)

3.3LHARQ-CJ模型

杠杆效应是股市波动率的特点之一。具体表现为,在股票市场中,同等程度的负面冲击比正面冲击能够引起更大的股价波动。中国股市实行严格的卖空限制的交易制度,使得中国股市波动率的杠杆效应具有持续性特点。因此,我们结合Corsi(2009)提出的LHAR-CJ模型,考虑前期不同周期的负收益对未来真实波动率预测的影响,进一步构建LHARQF-CJ模型和LHARQ-CJ模型,以增强估计误差异方差假定的适用性。

(17)

(18)

本文构建HARQ(F)模型、HARQ(F)-CJ模型和LHARQ(F)-CJ模型,选择非线性最小二乘法,使用稳健的标准误差进行估计。通过对模型系数显著性及模型损失函数的分析,来验证基于估计误差异方差假定的动态系数是否能够提升波动率模型的预测能力,为股价真实波动率的预测提供更好的理论模型。

4 实证研究

4.1数据与分析

本文选取上证综合指数2001年1月2日至2015年12月31日的五分钟高频数据作为样本,有效数据为3843组。选择99%的置信区间,对波动率的跳跃成分和连续成分进行检验和计算。为了更加直观地分析,对上证指数的负收益取绝对值处理。表1为模型所涉及变量的统计性质,图1对模型解释变量与被解释变量之间的相关关系进行了判断。

表1 变量描述性统计表

图1 已实现波动率与变量间的相关系数图

本文检测了已实现波动率的自相关系数,以及它与股价指数的正负收益以及跳跃成分之间的相关系数。如图1所知,已实现波动率呈现出一定的长记忆性,其自相关程度随时间呈缓慢递减。已实现波动率与指数正、负收益的绝对值之间表现出一定的正相关性,相比来看,负收益对已实现波动率的相关系数更大,且相关性曲线的衰减较为平稳。这说明,指数的负收益对已实现波动率的影响作用更大,上证指数的波动具有杠杆效应,利空消息对波动的影响要大于利好消息对波动的影响。同时,这种杠杆效应还具有一定的持续性,并随着滞后期的增加而逐渐减弱,这是杠杆效应对波动率的异质性影响。由图2可知,波动的跳跃成分对已实现波动率也有一定程度的异质性影响。由此可见,我们在动态估计误差模型中添加杠杆效应和跳跃成分的不同期滞后影响,对上证综指的波动率预测具有重要意义。

4.2样本内估计

本文使用上证综合指数3843组有效数据,对HARQ(F)模型、HARQ(F)-CJ模型和LHARQ(F)-CJ模型进行样本内估计,拟合结果如下表所示。为了比较波动率模型的拟合效果,选择经典的ARMA(1,1)模型、HAR模型、HAR-CJ模型和LHAR-CJ模型作为参照。

图2所示为HAR模型和HARQ模型对上证综指2015年8月份十个连续交易日的波动率拟合结果对比图。图(a)为已实现波动率及其基于(4)式所估计的95%置信区间,其中,8月26日的已实现波动率相比其他交易日更大,且从置信区间宽度来看,其估计误差较大,估计结果更不精确。图(b)为β1和β1,t的估计结果,可见,在“正常”波动的交易日中,HARQ模型中的β1,t系数在0.5~0.6之间,而HAR模型中β1系数仅为0.35,在RV估计较为不精确的8月26日,系数β1,t均降为0.26。图(c)为两个模型对向前一期波动率的预测结果与真实值的对比,由图可知,在HAR模型中,8月26日的RV拉高了下一个交易日的波动率预测结果;而在HARQ模型中,系数β1,t的降低使得下一个交易日的波动率预测结果较少地收到8月26日高波动率的影响,更加接近当期RV的值。由此可见,当某个交易日RV的估计误差变大时,HARQ模型比HAR模型对未来真实波动率的预测更加精确。

表2 模型拟合结果

注:***、**、*分别表示在1%、5%和10%水平上显著相关;括弧中为p值。

图2 HAR模型和HARQ模型拟合结果对比图

表3 样本外预测损失函数比较

注:***、**、*分别表示在1%、5%和10%水平上显著相关;括弧中为p值。

4.3样本外预测

为了考察模型的预测能力,本文采用滚动时间窗预测(Rolling Window)和递增时间窗预测(Increasing Window)两种方式,考察模型对向前一期波动率的预测结果。其中,滚动时间窗的样本长度固定为1000个交易日,从第1001个交易日的预测开始,每一期的预测结果都是基于前1000个样本数据。递增时间窗的样本长度随时间变化从1000个交易日递增到3842个,从第1001个交易日的预测开始,每一期的预测结果都是基于前面所有的样本数据。本文选用均方误差的开方(RMSE)和平均绝对误差(MAE)两种损失函数作为比较模型预测能力的方法,并以Giacomini-White检验统计量的p值来说明不同模型间的预测能力差异是否显著。表3展示了以HAR模型作为比较基准,不同模型与它之间损失函数的比值。

首先,从对所有模型进行滚动时间窗预测和递增时间窗预测的RMSE值和MAE值来看,基于动态估计误差的系数模型表现优于传统的ARMA模型和HAR模型,说明已实现波动率及其连续成分的估计误差异方差假定可以提高模型的预测能力。其次,除一组数据外,仅对日系数进行估计误差异方差调整的HARQ、HARQ-CJ与LHARQ-CJ模型在同类模型中表现最好。虽然在样本内估计中,HARQF、HARQF-CJ与LHARQF-CJ模型的拟合结果与其相差不大,但样本外预测能力存在差距。这说明,基于估计误差异方差假定的动态系数模型可以提高模型的预测能力,并且,无论是对于已实现波动率还是其连续成分,对滞后一期的系数(即日系数)的调整是提高模型预测能力的关键。最后,在两种不同的预测方法和损失函数下,含有波动率连续成分和跳跃成分的动态系数模型优于已实现波动率的动态系数模型,再考虑杠杆效应的模型表现更优之。其中,LHARQ-CJ模型在三种情形中预测能力都是最优的。这说明,在基于估计误差异方差假定的动态系数模型中考虑跳跃和杠杆效应,可以提高模型的预测能力。

5 结语

本文设波动率的估计误差服从异方差假定,基于此得到随误差方差变化的自回归系数,从而构建HARQ(F)模型来估计已实现波动率。进一步,在动态系数模型中结合波动的连续成分、跳跃成分及杠杆效应,提出了HARQ(F)-CJ和LHARQ(F)-CJ模型。本文以上证综合指数2001年1月2日至2015年12月31日的五分钟高频数据作为样本进行实证研究,得出的结论如下:

第一,基于估计误差异方差假定的动态系数能够提高已实现波动率模型的拟合效果和预测能力。当期已实现波动率或其连续成分的估计误差的方差越大,则当期已实现波动率或其连续成分在模型中的系数越小,它对未来真实波动率的解释力度则越差。这种动态系数的性质使得HARQ(F)、HARQ(F)-CJ和LHARQ(F)-CJ模型对于未来真实波动率的预测能力有了显著提升。

第二,对模型的日回归系数进行基于估计误差方差的动态调整是提高模型拟合效果和预测能力的关键。从模型的拟合结果来看,在HARQ(F)、HARQ(F)-CJ和LHARQ(F)-CJ模型,日回归系数的变动部分系数显著为负,而周、月回归系数的变动部分系数不显著。从模型的样本外预测结果来说,仅对日回归系数进行调整的HARQ、HARQ-CJ、LHARQ-CJ模型的损失函数较低,向前一期的波动率预测能力较强。

第三,中国股市波动存在跳跃行为及持续的杠杆效应,波动的连续成分和跳跃成分、以及波动的杠杆效应对未来波动率都有一定的解释作用。LHARQ(F)-CJ模型不仅能够刻画估计误差的异方差特点,还考虑到了波动率的跳跃行为及杠杆效应对预测的作用。在对上证综合指数波动率的拟合和预测上,与现有模型相比表现较优。本文的研究结论可以应用在股市波动测量、金融资产定价和风险管理等领域。

[1] Andersen T G,Bollerslev T.Deutsche Mark-Dollar Volatility: Intraday activity patterns,macroeconomic announcements and longer run dependencies[J].Journal of Finance,1998,53(1): 219-265.

[2] Andersen T G,Bollerslev T,Diebold F X,et al.Modeling and forecasting realized volatility[J].Econometrica,2003,71(2): 579-625.

[3] Corsi F.A simple approximate long-memory model of realized volatility[J].Journal of Financial Econometrics,2009,7(2): 174-196.

[4] 魏宇.沪深300股指期货的波动率预测模型研究[J].管理科学学报,2010,13(2): 66-76.

[5] Andersen T G,Bollerslev T,Diebold F X.Roughing it up: Including jump components in the measurement,modeling,and forecasting of return volatility[J].Review of Economics and Statistics,2007,89(4): 701-720.

[6] Bollerslev T,Kretschmer U,Pigorsch C,et al.A discrete-time model for daily S&P500 returns and realized variations: Jumps and leverage effects[J].Journal of Econometrics,2009,150(2): 151-166.

[7] Corsi F,Reno R.HAR volatility modeling with heterogeneous leverage and jumps[R].Working Paper,University of Lugano,2009b.

[8] 陈浪南,杨科.中国股市高频波动率的特征、预测模型以及预测精度比较[J].系统工程理论与实践, 2013,33(2): 296-307.

[9] 孙洁.考虑跳跃和隔夜波动的中国股票市场波动率建模与预测[J].中国管理科学,2014,22(6): 114-124.

[10] Asai M,Mcaleer M,Medeiros M C.Modelling and forecasting noisy realized volatility[J].Computational Statistics and Data Analysis,2012,56 (1): 217-230.

[11] Dobrev D P,Szerszen P J.The information content of high-frequency data for estimating equity return models and forecasting risk[R].Working Paper,Federal Reserve Board,2010.

[12] Jacod J,Li Yingying,Mykland P A,et al.Microstructure noise in the continuous case: the preaveraging approach[J].Stochastic Processes and Their Applications.2009,119(7): 2249-2276.

[13] Andersen T G,Bollerslev T,Meddahi N.Realized volatility forecasting and market microstructure noise[J].Journal of Econometrics,2011,160 (1): 220-234.

[14] Bandi F M,Russell J R.Separating microstructure noise from volatility[J].Journal of Financial Economics,2006,79 (3): 655-692.

[15] 唐勇.考虑微观结构噪声与跳跃影响的波动建模[J].数学的实践与认识,2012,42(5): 25-36.

[16] 马丹,尹优平.噪声、跳跃与高频价格波动——基于门限预平均实现波动的分析[J].金融研究,2012,382(4): 124-139.

[17] Barndor-Nielsen O E,Shephard N.Impact of jumps on returns and realized variances: Econometric analysis of time-deformed levy process[J].Journal of Econometrics,2006,131(1): 217-252.

Abstract: As high-frequency data is widely used in forecasting stock volatility,we propose a new family of easy-to-implement models based on realized volatility,which is constructed from the summation of the squared high-frequency intraday returns.In this paper,the estimation error of the realized volatility is assumed to obey the assumption of heteroscedasticity.When modeling the volatility of stock market,we set the autoregressive coefficients of the model according to the change of estimation errors’ variances and get HARQ (F) model.In the meantime,we propose HARQ (F)-CJ model and LHARQ (F)-CJ model in combination with the jump behavior and leverage effect of Chinese stock market volatility to improve the fitness and predictive power of the realized volatility model.We suppose,the larger the estimation error’s variance of the realized volatility or the continuous component in the current period,the worse its interpretation of the latent volatility in the future ,and the smaller the corresponding coefficient is.Through an empirical study on the high-frequency data of the Shanghai Composite Index from December 31st,2015 to January 2nd,2001,we find that based on the assumption of heteroscedasticity in the estimation errors,dynamic coefficients can improve the fitness and the predictive power of the realized volatility model.Above all,the dynamic adjustment of daily regression coefficient based on estimation error variance is the key to improve the fitness and predictive power of the model.The LHARQ-CJ model in combination with both the jump behavior and the leverage effect of the Chinese stock market is considered to show the best performance in all related models.Finally,this research has made its contribution in modeling and forecasting Chinese stock volatility with dynamic estimation errors and dynamic autoregressive coefficients.

Keywords: realized volatility;dynamic estimation errors;high-frequency data;jump behavior;leverage effect

Modeling and Forecasting Volatility of Chinese Stock Market Based on Dynamic Estimation Errors

SONGYa-qiong1,WANGXin-jun2

(1.Party School of Taian Committee of C.P.C.Taian 271000,China;2.School of Economics,Shandong University,Jinan 250100,China)

F830.91

A

1003-207(2017)09-0019-09

10.16381/j.cnki.issn1003-207x.2017.09.003

2016-05-31;

2016-09-26

教育部人文社科规划基金项目(13YJAZH091)

宋亚琼(1988-),女(汉族),山东泰安人,中共泰安市委党校,讲师,经济学博士,研究方向:计量经济学模型及其应用、金融计量分析,E-mail:songyaqiong1988@126.com.

猜你喜欢

回归系数方差波动
概率与统计(2)——离散型随机变量的期望与方差
2021年麦市大幅波动概率不大
羊肉价回稳 后期不会大幅波动
方差越小越好?
计算方差用哪个公式
11月汇市:波动率降低 缺乏方向
微风里优美地波动
基于生产函数模型的地区经济发展影响因素分析
方差生活秀
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较