基于ARMA-GARCH模型的上证综指收益率研究
2023-05-31张若晖
张若晖
摘 要:股票价格变化的预测对判断我国股市的走势有着显著作用。文章选取从2015年1月2日至2020年12月30日的上证指数每日收盘价,首先对一阶差分后的对数收益率序列建立ARMA(2,4)模型,其次通过分析发现残差序列存在条件异方差性,进一步构建GARCH(1,1)模型,随后构建综合的ARMA(2,4)-GARCH(1,1)模型并对模型进行相关诊断性检验,得出上证综指对数收益率序列存在波动聚集性且短期预测效果要优于长期的结论。
关键词:上证综指;对数收益率序列;短期预测;ARMA-GARCH模型
中图分类号:F832.51 文献标识码:A 文章编号:1005-6432(2023)13-0043-04
DOI:10.13939/j.cnki.zgsc.2023.13.043
1 引言
股票市场是金融市场的重要组成部分,对推动国民经济发展和世界一体化影响重大。股票的价格每时每刻都处在变动中,股价的变动表现为市场的波动,对股价变化的研究意义重大。近年来,股票市场规模快速扩大,市场透明度也越来越高,投资者的交易策略同质化严重,股票价格的预测变得更加困难,因此,为了更好地预测股票价格的走势,探讨合理有效的预测方法十分重要。
基于计量模型的角度研究股票市场的影响因素是早期股票市场研究方法的重要方向之一。Engle[1]提出的自回归条件异方差模型能描述并分析金融资产收益率的波动性,是工具。Bollerslev[2]提出广义的ARCH模型在实际中被广泛运用,GARCH模型可以更有效地描述条件异方差的动态特征。万蔚[3]采用 GARCH 等多个模型,以沪市和深市的股票为研究对象,通过实证对其收益率进行了对比研究,并对其中存在的规律进行了总结。黄轩等[4]构建ARMA-GARCH模型实证分析了沪深300指数的波动率,得出ARMA-GARCH模型能在一定程度下有效预测其未来短期波动率的结论。李雄英[5]对四大银行的股票日对数收益率序列进行拟合与预测分析,认为ARMA-GARCH模型相较于ARM模型在拟合效果和预测能力上都能取得更为理想的效果。文章拟构建ARMA-GRACH模型对上证综指收益率进行预测,为投资者提供参考。
2 研究方法与模型建立
2.1 ARMA模型
ARMA模型是一种高精度的时间序列预测模型,能通过处理分析时间序列的历史数据,发现某种现象随时间变化的内在规律,并按照这种在时间上延续的依存关系对此规律进行延伸,预测未来该现象如何变化。一般地,ARMA模型的具体形式表现为:
Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+at-θ1at-1-…-θqat-q(1)
該模型中参数p代表自回归部分的阶数,q为移动平均部分的阶数,at则为白噪声序列。
2.2 GARCH模型
股票的价格往往具有波动率聚集、“尖峰厚尾”的特点,表现出异方差性。GARCH模型可以用来拟合随机误差项的条件方差,一般的,对于GARCH(p,q)模型具体表现形式为:
σ2t=α0+α1μ2t-1+α2μ2t-2+…+αqμ2t-q+β1σ2t-1+…+βpσ2t-p(2)
式中,p代表GARCH(p,q)模型中自回归项的阶数,q则代表ARCH项的阶数。
2.3 数据的来源与处理
文章数据来源于上海证券交易所官网,选取2015年1月5日到2020年12月30日上证综指的收盘价,共计1260个数据。为保证尽可能消除时间序列变化带来的不平稳性,在文章中对上证综指进行对数化处理,可以得到对数指数收益率:Rt=ln(Pt)-ln(Pt-1)。其中,Rt为第t天的指数收益率, Pt为上证综指在第t天的指数收盘价。
3 实证结果分析
3.1 样本数据统计描述
首先利用EViews软件对上证综指的对数收益率时间序列进行描述性分析,并得到上证综指对数收益率时间序列图,如图1所示。
从描述性分析结果来看,样本数据平均值为0.013770,标准差为1.50687,偏度为-31.2225<0,峰度为9.97098>正态分布下的3,可以发现,该序列具有较为明显的左偏性,不符合标准的正态分布。从对数收益率图1可以看出,该时间序列大致处于较为平稳的状态,序列中出现了多个异常的峰值,小波动紧随着较小的波动,大波动则伴随着较大的波动,且呈现出明显的波动集聚现象,表明时间序列波动呈现出明显的条件异方差现象。
3.2 ARMA模型建立
在构建ARMA模型之前,为保证大样本下统计推断的“一致性”要求,确定时间序列没有随机趋势或确定趋势,需对序列进行平稳性检验。由于该时间序列中可能会存在高阶的滞后相关,因此需首先采用ADF检验来判断序列是否存在单位根。ADF检验结果显示,ADF检验统计量t值为-36.08224,在1%、5%、10%的检验水平下t统计量的临界值分别为-3.434683、-2.863341、-2.567777,t统计量的值均小于1%、5%、10%检验水平下的临界值,拒绝原假设,该时间序列不存在单位根,即一阶差分后的上证综指的对数收益率序列平稳,可考虑建立ARMA(p,q)模型。
接下来绘制上证综指对数收益率时间序列的自相关和偏自相关图谱,如图2所示,可以看到该序列自相关函数在滞后1阶和14阶处显示出统计上明显的尖柱,而在其他各阶在统计上表现不显著。偏自相关函数在滞后1阶、2阶、3阶、6阶处均显著超过了95%的置信区域。初步判定ARMA模型的移动平均过程是4阶的,而自回归过程应该是低阶的。
结合AIC信息准则择优选择模型,分别对ARMA(2,4)、ARMA(1,4)两个模型进行估计并比较,结果如表1所示。对比两个模型可知,ARMA(2,4)对应的AIC、SC的值都小于ARMA(1,4)对应的值且拟合优度更高,最终构建ARMA(2,4)模型:
Xt=0.1347Xt-1-0.9737Xt-2+at-0.08486at-1+0.9285at-2+0.07757at-3+0.004344at-4+0.02118(3)
3.3 GARCH模型建立
在建立ARMA模型的基础上,需进一步判断该时间序列是否存在条件異方差性。文章在建立均值模型后的基础上生成了残差序列,并绘制残差平方的自相关与偏自相关图。由图3可知,残差平方自相关函数值绝大部分都超过了95%的置信区域,统计上显著不为0,且Q统计量对应的概率值均小于0.05,即残差平方序列存在自相关残差序列存在ARCH效应。
由于存在较高阶数的ARCH效应,需要结合AIC准则判断出适合的模型阶数,通过对GARCH模型阶数的多次设定,经多次拟合计算出各模型对应的AIC值,如表2所示。
由表2可以得出,GARCH(1,1)模型对应的AIC值最小,结合AIC最优准则,最终构建GARCH(1,1)模型,并得到GARCH(1,1)模型的各参数的估计结果,如图4所示。
由图4可得收益率波动模型为GARCH(1,1):
σ2t=0.006224+0.067589μ2t-1+0.932037σ2t-1(3)
3.4 ARMA-GARCH综合模型的建立与分析
由于在建立ARMA模型预测股票对数收益率的变化时,忽略了模型中的残差平方项存在的ARCH效应,而仅仅根据波动率建立模型亦是不全面的,且GARCH模型的建立需要在ARMA均值方程的基础上。故文章最终建立ARMA-GARCH综合模型来估计预测上证指数的对数收益率,模型形式如下:
Xt=0.1347Xt-1-0.9737Xt-2+at-0.08486at-1+0.9285at-2+0.07757at-3+0.004344at-4+0.02118
σ2t=0.006224+0.067589μ2t-1+0.932037σ2t-1(5)
图4 GARCH(1,1)模型参数
ARMA-GARCH模型的残差平方序列的自相关函数和偏自相关函数相较于ARMA(2,4)模型的自相关、偏自相关函数值都有明显的减小,且ARMA-GARCH模型对应的q统计量在5%的显著水平下,其概率值p都远大于0.05,q统计量不显著,残差平方序列不存在序列相关性,该模型的残差序列有效地消除了ARCH效应,故建立ARMA(2,4)—GARCH(1,1)模型。
3.5 模型相关诊断性检验
在完成上述模型的建立后,需要验证构建的ARMA-ARCH优化模型是否还存在异方差性,如果存在则模型不正确,若不存在,则模型正确。因此,文章对上证综指对数收益率模型中的残差平方序列进行了自相关检验,发现ARMA(2,4)-GARCH(1,1)模型的残差序列的样本自相关函数所对应的p值都远大于0.9,远大于检验水平,故不能拒绝原假设,残差序列不存在自相关,即可以认为文章构建的ARMA-ARCH优化模型不存在异方差性,模型合理。
3.6 预测结果
对于ARMA-GARCH模型的平均相对误差通过Excel表格得出,首先计算出各个数据的相对误差,在数值上等于实际值与预测值之差的绝对值与实际值之比,之后取平均值得到模型的平均相对误差,最后将所得结果平方得到MSE为0.0372。
4 结论
对于股票收益率的预测是金融研究的一个重大研究方向,在最近这些年受到越来越多的关注。文章首先运用ARMA模型对选取的上证指数的对数收益率1460个数据形成的时间序列进行拟合建立ARMA(2,4)模型,由于模型中的随机扰动项还存在明显的条件异方差性,通过检验图示检验法、自相关函数检验法检验ARCH效应是否存在、模型参数估计进一步建立GARCH(1,1)模型反映收益率的波动,最后考虑到仅根据波动率建立模型亦是不全面的,且GARCH模型的需要是建立在ARMA均值方程的基础之上的,因此最终建立了ARMA(2,4)-GARCH(1,1)综合优化模型,利用该模型对2015年1月2日至2020年12月30日上证指数收盘价对数收益率预测的平均相对误差MSE的值为0.0372。
虽然模型可以一定程度地预测股价或收益率的变动,但由于股票市场的股价时刻处在波动之中,影响股票市场的因素繁多,如国际环境的变化、政府的政策措施管理条例、行业的变化以及经济周期循环等,其预测的效果定会受到影响。所以短期的预测效果要优于长期,对股票市场的预测要不断地更新预测模型,同时预测时也需考虑一些客观环境因素的影响。
参考文献:
[1]ENGLE R F.Autoregressive conditional heteroskedasticity with estimates of the variance of U.K.inflation[J].Econometrica,1982(50):987-1007.
[2]TIM BOLLERSLEV.Generalized autoregressive conditional heteroskedasticity[J].Journal of econometrics,1986,31(3):307-327.
[3]万蔚,江孝感.我国沪、深股市的波动性研究——基于 GARCH 族模型[J].价值工程,2007(10):14-18.
[4]黄轩,张青龙.基于ARMA-GARCH模型的沪深300指数波动率分析与预测[J].中国物价,2018(6):44-46.
[5]李雄英,陈小玲,曾凯华.基于三类模型的四大银行股票收益率预测研究[J].经济数学,2018,35(4):21-27.