ARMA模型在股票短期预测中的应用
2020-06-15马紫璇
马紫璇
(成都信息工程大学 四川 成都 610103)
一、引言
随着金融市场体系不断完善,股票对国民经济的发展起到了愈发重要的作用。人们对于传统的投资观念和对风险的承受能力也有所转变,越来越多的人开始关注并参与到股票市场的投资中去。但高额的收益并不能使股民们高枕无忧,伴随着高额收益的同时还有高额的风险性,这是由于股票市场的价格变化走势受诸多因素的影响[1]。表面看来,股票市场缺乏一定的规律性,同时其投资者在结构上也具有一定的特殊性——投资者的心理状态对股票市场的交易行为可以产生直接的影响并导致股价波动。对投资者来说,预测股价越准确越能规避风险从而获得更大的收益;对于国民经济而言,股市关乎着国家股民的财产安全,对风险进行有效控制和管理,能促进国民经济内生动力,形成资源配置完善的股票市场,从而与我国经济发展相适应[4]。
就目前来看,股票市场大多采用非随机分析方法,如基本面分析等。但是这些方法无法准确反应股票价格的变化规律。随着实证研究方法的不断进步,数学理论研究与数据挖掘得到了快速发展。时间序列分析作为计量经济学研究的重要工具之一,现被广泛用于预测股票价格和交易量趋势。由于股票价格具有明显的不确定性,所以股价的形成是一个随机的过程[5]。也就是说,在任一固定的时刻的股票价格作为随机变量,ARMA、GRACH、ARCH等时间序列模型可用来进行金融预测[3]。
二、实证分析及预测
(一)数据来源
构建本文选自大智慧软件中选取南天信息(00098)股票在2018年7月13日到2019年6月13日(不包含节假日及双休日)共222天股票成交量的数据。作为创投盘的代表,南天信息以创新业务、智慧城市业务等五大板块作为其主体,目前经营状况良好,预测其股票具有一定的现实意义,也较为典型。
(二)平稳性检验(ADF)检验
对序列的平稳性进行一个大致的判断。时序图若是显示序列始终围绕一个常数值上下较小幅度波动,那么序列是平稳序列;若是时间序列有明显的大幅度波动趋势或周期性特征,通常情况下,它不是一个平稳的时间序列,应运用ADF单位根检验方法[7]。因此,为消除异方差,本文对南天信息的每日成交量进行平稳性检验。
检验结果如表一所示,根据置信准则将检验类型定为无截距无趋势的一次差分,其ADF值为-12.1148,临界值为-1.9423,P值为0。由于最后P值小于5%的置信水平,因此拒绝原假设,认为时间序列是平稳的。通过选择的平稳序列画出时序图,如图一所示。根据图一可以看出平稳时间序列的各观测值围绕其均值上下波动,且该均值与时间t不相关,振幅变化不剧烈[8]。
表一 平稳性检验结果表
图一 平稳时间序列折线图
(三)模型定阶及参数估计
ARMA模型可根据样本自相关函数、偏自相关函数的截尾、拖尾性来判定模型的阶数。若偏自相关函数是截尾,自相关函数是拖尾,则适用于AR模型;若偏自相关函数是拖尾,自相关函数是截尾,则试用于MA模型;若偏自相关函数和自相关函数均是拖尾,则适用于ARMA模型[9]。通过使用Eviews可得出一阶差分后的相关图。观察自相关、偏自相关系数图可得出结论——拖尾与截尾的趋势并不显著,因此初步判定认为模型的阶数p=3,q=1。但仅此判断具有很大的主观性,需进一步检验。首先尝试用ARMA(3,1)模型进行分析,观察参数估计与检验结果表可知,R-squared值为0.317283;MA模型的p值在置信区间(5%)之外。因此该模型不适合,需对模型进一步修正。
本文继续尝试用ARMA(3,0)、ARMA(3,3)、ARMA(4,1)等模型对时间序列进行了模拟,最后的检验结果如表二所示。根据不同组合试验以及AICA准则及综合各方面的参数可以得到参数估计值、模型的系数均为统计显著的,当p=3,q=0时,对应的AIC值相对比较小,为24.24473;SC信息量的值同样较小,为24.2931;R-squared的值较大,为0.312355。最终确定模型的阶数为p=3,q=0,即AR(3)。
表二 各模型检验结果
综上所述:通过对南天信息公司股票时间序列采用AR(3)进行模拟,显然比前几个模型要好,因此最终确定的模型为AR(3)。并根据参数估计表得出该模型的表达式为:Rt=-0.604180ar(1)-0.363983ar(2)-0.314467ar(3)。
(四)拟合效果以及预测
对模型的残差序列进行白噪声检验,通常采用的是χ2检验法。当残差项不是白噪声序列时,说明残差项中不包含相关信息,时间序列中的信息被完全提取,此时模拟的效果显著[10]。根据观察残差序列相关表可以得出,本文设立的模型其每个残差项的概率值均大于0.05,说明Q统计量均小于检验水平为0.05的卡方分布临界值,此时的残差项不是白噪声序列,模型可以继续下一步的操作。
通过以上步骤建立拟合效果显著、合理的模型,可以根据原始序列对未来成交量进行估计预测。利用上文中建立的AR(3)模型对成交量进行预测,首先对差分后的原始数据进行预测得到未来几期股票成交量的趋势,再通过更改原始数据的区间来来预测未来股票成交量的具体预测值。最终将预测值与真实值进行对比,得到它们之间的误差比,如表三所示。
表三 预测值与实际值的比较
由表三可知,2019年6月14日至6月19日股票成交预测值与实际值的误差比处于增长状态,6月17-19日的误差比均大于0.3,说明ARMA模型预测的准确性还有待提高,股票的成交量可能与多重因素有关。ARMA模型虽然可以对短期内的股票成交量进行预测,但是结果依然具有不确定性。
三、缺点与改进
(一)缺点
(1)在数据的处理上,由于数据存在一定和时滞性、缺失性,则会导致对序列建模时存在一定的误差。
(2)本文的模型拟合,只是对时间序列本身的属性进行了简单的分析,而没有将其他的因素考虑在内。股票市场易受到众多因素的影响,其成交量也受到开盘价、收盘价,乃至于大盘的影响。除此之外,国家政策、国际经济贸易的变化都会对股票市场产生影响,这些不是预测的期望值可以反映的。ARMA模型在长期预测方面还存在一定的缺陷,误差相对较大,短期预测比长期预测的效果更佳,因此ARMA模型不适合进行长期预测[10]。
(二)改进
为进一步提高模型的准确性和有效性,可以利用ARMA-GARCH模型对其进行进一步检验;或者利用CARR模型进行股票波动性预测,将不同的模型进行对比,预测值和真实在最为接近的就是预测误差最小的模型,即为最佳模型[6]。
四、建议
(一)健全信息披露机制
我国市场存在十分典型的羊群效应,捕风捉影投资方式大量存在。即股民们根据从各个渠道收集来的内幕消息买进卖出股票,若程度过大就将造成市场极大的波动,股民们对市场失去信心势必会影响家庭资本结构的变化,同时内需也得不到刺激。因而健全信息披露机制可以防止股市环境恶化,促进投资者进行理性投资。
(二)加强证券市场化建设
在供给侧改性改革背景下,政府对证券市场的干预不能太大,减少投机行为的产生也是在当下的实际情况中所必要的;此外,加强资源的合理配置,充分发挥市场的作用,加强市场化建设
(三)加强对投资者的理性投资教育
我国股市中的投资者以散户居多,这就导致股市中多以跟风投资、短期投资居多,无形中增加了市场风险。因此,对投资者进行理性投资教育是必不可少的,在买卖证券时要基于市场实际情况入手,不能盲目跟风,培养自身投资知识和能力的提升。