基于EMD和GARCH模型的股票收盘价格预测
2021-03-23马育欣王纯杰秦喜文董小刚
马育欣,王纯杰,秦喜文,董小刚
(长春工业大学 数学与统计学院,吉林 长春 130012)
0 引 言
由于股市的变化趋势与多种因素紧密相连,比如上市公司的经营状况、汇率变动、经济政策等因素,使其变化规律十分繁复,变化周期让人无法捕捉。从股市表面上看,股票价格波动缺少一定的规律性,使得股票市场的变化趋势难以预测。
美国国家宇航员Huang N E等[1]首次在1998年提出经验模态分解(EMD)的新型信号处理方法,并于次年对该方法进行了改进。这种方法的基本原理是将信号中不同特征尺度的序列逐个分离出来,分解出来的IMF序列体现了原信号的不同特征尺度,可以更准确地反映原信号的内在特征。2011年,刘海飞等[2]将EMD方法应用于股价的短期预测中,证明EMD方法比使用小波分析方法预测效果更好。2012年,蔡赟姝等[3]采用EMD方法对上证综合指数进行研究。2013年,宋国锋等[4]运用EMD分解对含噪声的数据进行噪声剔除处理,得到信噪比品质较好的数据形态,对估计和预测高频数据的走势有一定的参考价值。2014年,白洁等[5]用EMD-GARCH方法将余额宝收益率原始数据分解重组,并对其进行了预测。
1982年,美国统计学家Engle R F[6]提出了自回归条件异方差(ARCH)模型。直到1986年,Tim Bollerslev改变了ARCH模型的限制条件,提出了广义自回归条件异方差(GARCH)模型。2014年,陈双等[7]利用GARCH族模型对国际油价的波动性进行分析。2015年,史美景等[8]建立了Spline-GARCH-EMD模型,检验长期股票市场风险与宏观经济变量的关系。2015年,桑秀丽等[9]建立了基于ARIMA-GARCH与抛物线的CPI组合预测模型的方法。
文中综合EMD分解ARMA-GARCH模型,目的在于找到能够更好地预测短期内股票收盘价的模型,通过对股票收盘价数据的分析能够更精准预测短期内股票收盘价的走势,以获得更多的利润,更加有效地规避风险。
1 模型介绍
1.1 EMD
EMD方法被普遍认为是信号处理的一个重大进步,Huang N E等[1]提出的EMD引入了IMF,证明EMD方法的完备性和IMF的正交性。EMD内的算法步骤如下:
1)对于给定的原始时间序列x(t),用三次样条插值法得出的局部极大值和极小值来创建上包络线和下包络线。
2)计算上下包络的平均值m1。
3)从x(t)中减去上下包络的平均值m1,以获得第一个IMF分量h(t)=x(t)-m1。
4)通过将h(t)视为新的x(t)重复步骤1)~3),直到满足以下停止标准之一:
(i)m1接近零;
(ii)h(t)的过零和极值的数量最多相差一;
(iii)达到预定义的最大迭代。
5)将h(t)视为IMF,并计算残差r(t)=x(t)-h(t)。
6)使用残差r(t)作为新的x(t)来找到下一个IMF。重复步骤1)~5),直到获得所有IMF。
最后,原始时间序列x(t)被分解为
式中:n----取决于原始时间序列x(t);
ci----第i个IMF分量;
rn----趋势项。
1.2 GARCH模型
GARCH模型适用于随机误差存在异方差性时,自回归表示预测值与历史数据存在相关关系。GARCH模型由两个方程组成:一个是条件均值模型;另一个是条件方差方程,可分别写为以下两式:
yt=λyt-1+εt,εt∈N(0,σt),
(1)
(2)
p≥0,q>0,
式中:λ----均值方程的系数项;
ω----截距项;
1.3 EMD-GARCH模型
首先用EMD方法将序列分解为若干个不同频率的IMF和残差序列。对于这些IMF序列和残差序列分别采用不同参数的ARMA-GARCH模型进行拟合和预测,将各组预测值相加后得到最终预测值。具体流程如图1所示。
2 基于EMD-GARCH模型的预测研究
2.1 数据来源
选取贵州茅台(600519)从2017年3月15日至2019年3月27日共497个股票收盘价作为研究数据,时间间隔为1日,预测2019年3月28日至2019年4月3日的股票收盘价。在预测研究中使用了Matlab、Eviews,以及R软件3.5.3版对数据进行研究分析,EMD分解通过Matlab软件的EMD工具包实现,ARIMA-GARCH模型建立和数据预测通过Eviews实现,各种检验以及时序图是通过R软件完成的。
2.2 原始序列拟合结果
原始序列股票收盘价的时序图如图2所示。
图1 EMD-GARCH模型建模框架
图2 原始序列股票收盘价的时序图
从图2中可以看出,该序列是非平稳序列,所以对于原始序列先进行一阶差分使其平稳,再对原始序列拟合ARIMA(1,1,1)-GARCH(1,1)模型。
2.3 EMD分解结果及拟合模型
对原始序列进行EMD分解,得到6个IMF序列和1个残差序列,部分IMF序列及趋势项序列如图3所示。
图3 部分IMF序列及趋势项序列
它们分别表示原始股票收盘价在同一时间段内的不同频率和振幅,最后一个序列为趋势项。从残差序列的时序图可以看出,该股票的收盘价格是不断增大的。
对分解得到的7个序列分别拟合ARMA-GARCH模型,结果见表1。
2.4 预测结果比较
对分解后的序列和残差序列所建模型预测2019年3月28日至2019年4月3日的股票收盘价格,将得到的预测数据相加,计算得出最终的预测序列,再将其与原始数据所建模型得到的预测序列比较,并进行误差分析。
预测结果比较见表2。
从表2可以看出,与使用未分解序列建模拟合ARIMA-GARCH模型的预测结果相比,明显是基于EMD-GARCH 模型的预测结果的相对误差更小,基于EMD分解股票收盘价预测模型所得到的结果精度更高。
表1 IMF序列拟合模型
表2 预测结果比较
3 结 语
通过对原始序列进行EMD分解,得到6个IMF序列和1个残差序列后,对各个IMF序列和残差序列拟合ARMA-GARCH模型,往后预测5 d股票收盘价,然后再将这7个序列的预测数据相加得到最终预测数据。并将它与原始序列建模拟合得到的预测结果进行比较,结果表明,EMD-GARCH模型的预测效果更优。可以看到,该方法能准确地预测短期内股票收盘价的走势,相对误差较小,其预测结果在误差允许的范围内具有很大的参考价值,有助于股票投资者做出正确的投资选择,从而规避风险获取利益。