APP下载

基于损失函数的GARCH类模型波动率预测评价

2023-11-06王苏生李光路王俊博

运筹与管理 2023年9期
关键词:股指期货波动

王苏生, 李光路, 王俊博

(哈尔滨工业大学(深圳) 经济与管理院,广东 深圳 518055)

0 引言

波动率是金融资产的核心指标,是金融衍生品定价的基础,因此,金融资产尤其是金融衍生品的波动率研究一直是学术界研究的重点。研究波动率的模型有很多,最常用的模型主要有已实现波动率模型和条件异方差模型两大类,这两类模型根据不同的数据样本特征发展出各种不同的波动率研究模型,用来刻画金融资产波动率的特征。GARCH类模型因为能够很好地刻画波动率的聚集效应、不对称性、长记忆性等特征,得到了极大地发展,被认为是最为成熟的波动率研究模型之一。不同的GARCH类模型根据其模型的特点都可以从不同的角度来够刻画金融资产波动率的动态变化过程,但如何制定一个准确的波动率评价标准,选择合适的波动率研究模型,成为了众多研究者探讨的主要问题。

前期研究,我们利用GARCH模型(王苏生等[6])、ARMA模型(王苏生等[14])、eGARCH模型(WANG等[15]),RealGARCH模型拟合了沪深300股指期货日内波动过程,取得的效果较好。在GARCH类模型被用来进行日内波动预测时,选择哪个模型最合适?这是接下来我们要重点解决的难题。综合以上分析,文章在前期研究的基础上拟采用不同的损失函数评估GARCH模型、eGARCH模型以及RealGARCH模型对沪深300股指期货日内多种抽样频率的波动率的预测精度,以期能够在抽样频率固定的前提下,找到沪深300股指期货最优的波动率预测模型,基于三种模型均属于GARCH类模型,我们认为具有较强的可比性。文章后面的结构安排如下:第二部分重点介绍波动率预测的评估框架、各种不同的损失函数结构以及三种GARCH模型;第三部分使用三种不同的GARCH模型对沪深300股指期货日内不同频率的波动率做实证估计并预测,并对实证结果做细致分析;第四部分则利用不同的损失函数对三种模型的评价精度做评估,并分析产生这种结果的内在逻辑;最后是结论。

1 模型与方法

1.1 基于一般损失函数的波动率预测评价

(1)

(2)

(3)

这样就得到一个预测评价的回归方程,如公式(4)所示:

(4)

(5)

也可以把公式(5)写成公式(6):

(6)

显然,由于事前预测并不能解释事后的预测误差,因此在公式(6)里,如果系数b为负,则预测值比实际值要大,因而需要减小预测值。

(7)

(8)

因为收益率的平方包含了较大噪声,因此,并不是真实波动率的无偏估计,而且因为只使用一个观测值来估计每个周期的方差,即使波动率的预测是准确的,得到的相应拟合回归程度必然也很低。可见,准确评估一个不可预测变量的难度非常大。幸好在很多金融应用中,观测样本的频率一般都非常高。即使只是预测日波动率或者更长周期的波动率,其观测样本常常是基于日内高频数据来展开研究的。长周期的波动率可以使用短周期收益率的平方来估计,如公式(9)所示:

(9)

因此,预测精度的估计方程可以如公式(10):

(10)

所以,应用已实现波动率也可以作为波动率模型预测精度的检验标准。

1.2 常用的波动率预测评价指标

在波动率预测中,除了M-Z回归函数之外,HYNDMAN和KOEHLER[18]提出了一些最常用的预测评估指标如:平均误差(ME)、平均百分比误差(MPE)、均方根误差(RMSE)、平均绝对误差(MAE)以及平均绝对百分比误差(MAPE)等。

平均误差(ME)是指单项测定值与平均值的偏差之和,除以测定次数。用于衡量总体偏离程度,如式(11)所示:

(11)

平均百分比误差(MPE)是计算观测值与真实值之间平均误差的百分比。如公式(12):

(12)

均方根误差(RMSE)是均方误差的平方根,表示预测值与真实值的平均偏离程度。该值越小越好,其广泛应用于预测评估指标,如公式(13)所示:

(13)

平均绝对误差(MAE)是对平均误差取绝对值,避开了正负误差不能相加的问题。对于所有预测值与真实值之间的误差,取绝对值求平均后对预测效果的评估更具有代表性,如公式(14)所示:

(14)

平均绝对百分比误差(MAPE)是平均误差的绝对值之和的平均值,与单纯的相对误差相比,它避开了正负相对误差不能相加的问题,同时通过求平均值,反映了预测相对误差的平均水平,因而经常用于预测评估指标,如公式(15)所示:

(15)

使用单一损失函数作为波动率模型预测精度评价的唯一标准,会存在衡量标准过于片面的问题,难以获得认可[19],因此,合理的策略是使用更多的损失函数以多角度衡量波动率模型的预测精度。

2 实证检验与结果分析

2.1 样本选择与预处理

在确定了研究模型和损失函数之后,要比较不同GARCH模型的预测精度,我们还需要确定预测精度的参照标准并统一研究样本的抽样频率,确保在同一条件下对比不同模型的预测精度。在前述内容中提到,对波动率预测精度进行评价,必须知道资产序列的真实波动率,而一般情况下真实波动率是不可能被直接观测到的,因而,找到真实波动率的替代量就非常重要,并且这个替代量还必须是真实波动率的无偏估计。现实中,在不存在市场摩擦的条件下,已实现波动是真实波动率的无偏估计量。在市场摩擦存在的条件下,已实现波动率将不再是真实波动率的无偏估计量。在前期的众多文献中,高频出现的是用已实现波动率来替代真实波动率。本文结合前期研究成果,针对三个研究样本,分别使用1s,2s和15s最优拟合间隔合成的股指期货一分钟已实现波动率作为研究样本真实波动率的无偏估计。由于在股指期货日内高频交易中,一分钟间隔的交易策略应用最为广泛,因此,我们选择对三个GARCH模型的沪深300股指期货日内一分钟波动率做预测精度的评价就显得非常有意义了。

考虑到沪深300股指期货自2010年上市,2015年后被交易所制定了严格的限制交易措施,而选择具有代表性的研究样本对此项研究来说非常关键,既要兼顾市场平稳运行时间段,又要具有足够的代表性,能够反映股指期货的波动规律。鉴于此,我们决定在2012年1月到2013年5月股指期货全部合约内选择研究样本,这也是我们目前能获得的抽样频率足够高的样本数据。前期研究中,我们选择2012年5个连续交易日的高频数据和2013年5个随机抽取的高频数据作为研究样本。其中,5个连续的抽样样本采用沪深300股指期货合约IF1207和IF1208于2012年7月2日至2012年7月6日共5个交易日的股指期货交易数据作为研究样本,该样本选取每秒2笔的超高频数据来刻画股指期货日内模式的变化。针对同一时间不同合约同时进行交易的情况,按照交易量最活跃的主力合约来构造连续的期货合约。之所以选择七月份数据是把节假日效应对日内波动率的影响降到最小。另外五个随机抽取的样本为2013年2月19日、3月5日,3月12日,4月1日,4月12日这五天的交易样本。但十个研究样本对于三个GARCH模型来说还是太多了。为了研究的便利性,我们只选择2012年7月2日、7月3日和2013年2月19日三个研究样本的日内高频数据作为研究样本,分别表示为Sample1,Sample2和Sample5。

数据剔除成交量为零的记录,并且已实现GARCH模型所需的样本则根据1秒、2秒、5秒以及15秒间隔的样本,根据已实现波动率的模型合成1分钟间隔的样本收益率分别记为RV1,RV2,RV5和RV15,一分钟间隔样本收益率则记为r,按照前期研究的结论,选择拟合最好的三个间隔作为已实现GARCH模型的研究对象,其样本数据的稳定性检验结果如下:

全部研究样本的ADF检验中,P值都是显著的,结果都是稳定,如表1所示。检验结果表明所选序列直接应用GARCH模型进行波动率研究是可行的。

表1 样本稳定性ADF检验结果

2.2 实证检验

在检验了研究样本的平稳性后,GARCH模型实证检验还需要确定均值方程和方差方程的参数,即定阶。一般来说,GARCH模型均值方程的阶数是通过自相关函数(ACF)和偏自相关函数(PACF)来确定的,而GARCH模型方差方程的阶数一般选取GARCH(1,1)来研究时间序列的样本。在前期的研究(王苏生等[6])中,我们有详细介绍GARCH模型均值方程详细的定阶过程,这里我们就不再赘述。依据ACF与PACF准则,将GARCH模型三个样本的均值方程的ARMA的阶数分别确定为ARMA(0,1)、ARMA(0,1)以及ARMA(1,1)。

从三个GARCH模型的实证结果来看,相同研究样本条件下,带有杠杆效应的GARCH模型的系数显著性要明显优于标准的GARCH模型;RealGARCH模型的回归系数要比eGARCH模型的系数显著。在不同研究样本的eGARCH模型的杠杆系数显著不为零,这验证了股指期货日内波动具有明显的杠杆效应。从回归系数来看,除1s间隔合成的RealGARCH模型外,其他GARCH模型的alpha和beta系数之和均小于1,且alpha与beta之和非常接近1,表明GARCH类模型拟合稳定收敛,一分钟股指期货的波动受到冲击具有非常强的持续性;beta系数接近于1,表明了股指期货日内高频收益率波动具有较强的长记忆性;1s间隔样本的alpha与beta之和明显小于1,不具有长记忆性和对信息的冲击性,这可能是由于样本抽样频率过高,造成较大的市场噪音,从而导致股指期货日内波动出现较大的随机性。回归模型常数项均不显著,这与样本均值为零的统计描述结果一致。另外,在全部三个研究样本中,我们发现GARCH和eGARCH模型回归系数的大小基本一致,而RealGARCH模型的回归系数与前面两者相比有明显的不同,已实现GARCH模型实现了使用高抽样频率研究样本,研究低抽样频率波动率的先例,相比以往的GARCH研究模型,其模型往往包含了更多的市场波动信息,可以看作是GARCH模型一次质的飞跃,因此其模型的样本与日历收盘价样本的实证结果有较大的出入,模型的回归系数也出现较大的不同。

3 波动率预测精度评价

很多GARCH模型都能对波动率的做出预测,但是预测结果好的是哪一种波动率?衡量波动率模型的预测精度,我们一般选择损失函数。不失一般性,对已经建立的GARCH模型、eGARCH和RealGARCH模型进行一分钟沪深300股指期货日内波动率的预测精度评价,我们利用了多种损失函数。正如前文所述,根据以往的研究结论,我们以最优抽样频率一分钟股指期货日内已实现波动率作为衡量的标准。表2是根据不同GARCH模型对全部三个研究样本的预测精度的评价结果。

从损失函数计算的预测精度结果来看,不同样本的精度评估结果基本上一致:以损失函数最小为目标,Sample1样本已实现GARCH模型的预测效果最好,而Sample2样本与Sample3样本的eGARCH模型预测效果则最佳;以H-Z回归函数为目标,可见Sample1样本和Sample2样本的RealGARCH模型对沪深300股指期货日内一分钟波动率预测效果是最好的,而Sample5样本中,eGARCH预测效果则是最好的。整体来说,沪深300股指期货1分钟收益率波动性具有明显的不对称性,具有能够反映不对称性的GARCH模型的样本内预测精度更高。

4 结论

本文主要目的是在以往股指期货日内波动率研究的基础上,评价不同GARCH模型对沪深300股指期货日内波动率的预测效果。文章选择了三个不同的沪深300股指期货一分钟日内收益率研究样本为研究对象,通过GARCH、eGARCH模型以及RealGARCH三个模型来刻画沪深300一分钟股指期货日内波动率的动态变化过程。本文将已实现波动率作为真实波动率的评价标准,运用多种损失函数来评价三个GARCH模型对沪深300股指期货一分钟日内波动率的预测精度。研究结果表明:(1)从三个研究样本波动率拟合结果来看,能够反映非对称波动的GARCH模型对样本的拟合系数更为显著,其损失函数更小,说明其拟合效果更好。这表明一分钟股指期货日内波动率具有明显的杠杆效应,针对同样大小的正负外部冲击,市场的波动反映是不同的;(2)针对此次特定的研究对象,eGARCH和RealGARCH模型的预测精度要明显优于标准GARCH模型,Sample1和Sample2中RealGARCH模型的预测精度要优于eGARCH模型;样本Sample3中eGARCH模型的预测精度较高。因此,我们在对沪深300股指期货日内波动率展开研究时,应根据其样本特征,优先选择具有能够反映非对称特征的波动率模型来刻画波动过程,对未来波动率进行预测。

猜你喜欢

股指期货波动
美棉出口良好 ICE期货收高
国内尿素期货小幅上涨
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
平安千亿回购 股指触底回升
股指再度回落 机构逢高减仓
降杠杆引发股指冲高回落
股指震荡走高筑底之日可期
生猪期货离我们还有多远?