量化分析外部风险对股票投资的影响
2023-05-31耿营营刘烙轩冯洁宜
耿营营 刘烙轩 冯洁宜
摘要:文章从突发性事件新冠疫情入手,研究外部风险对股票投资的影响,利用多因子分析模型、ARIMA序列模型和残差序列分析法等方法对突发性事件(外部风险)对股票的影响进行了量化分析。文章将突发事件划分为三种类型先进行描述性统计,然后通过单位根检验后建立ARIMA模型,进而利用模型进行预测比较分析。通过研究分析发现外部性事件(新冠疫情)对股票有间接的正向冲击影响,解释了股票价格在疫情期间的波动游走现象,并结合事件进行具体分析。
关键词:多因子量化选股;主成分分析;残差序列分析;ARIMA模型
中图分类号:F224;F830.9 文献标识码:A 文章编号:1005-6432(2023)14-0000-04
[DOI]10.13939/j.cnki.zgsc.2023.14.000
1 研究背景
新冠疫情使中国股市受到较大冲击,但医药类股票却有不一样的态势。国内券商研报研究显示因多数股民对股票市场持消极态度使得股票市场利空态势愈加严重。外部风险性事件对股票的影响会给投资者带来风险。对于外部性风险事件及突发性事件的研究可更好了解股票价格的影响因子且还能帮助投资者有效规避风险。因此研究如何在利空态势下投资股票和规避市场波动的风险显得尤为重要。
文章参考了众多学者对外部性突发事件影响股票的研究。李晓林(2013)[1]根据窗口事件研究法及ARIMA模型,研究了不同突发性事件对于股票价格走势的影响,王春丽等(2018)[2]利用多因子量化选股模型来研究择时策略。陆可等(2016)[3]基于R型聚类分析方法对股票价格走势进行了研究。齐天铧(2021)[4]基于灰色模型与ARIMA模型预测了股票价格。王文胜等(2018)[5]基于动态多因子分析,选择适当的因子,根据主因子筛选与最终因子打分得出股票得分。柳思维等(2003)[6]根据有效市场假说,通过外部宏观信息对股票价格游走选择股票策略。余兴(2012)[7]基于券商研报外部性影响对股票进行预测分析研究。邓明光(2012)[8]通过对外部性重大事件对股票影响研究股票跳跃的行为特征。刘先伟(2012)[9]通过国外突发事件对国内股票市场影响研究,对突发事件进行分类并且利用ARIMA模型对股价影响进行分析预测。文章从30支大湾区股票中筛选10支股票预测股票了价格并使用ARIMA模型研究突发性事件对股票的影响并得出结论,完善了投资和风险规避的策略。从以上现有的研究成果来看,突发性事件对于股票市场的影响研究集中于多因子分析与ARIMA模型分析,很少有将其两者结合起来并且结合实际券商研报研究量化分析。因此,文章将突发事件划分为三种类型:脉冲式突发事件、渐进变化式突发事件、台阶式突发事件[10]并运用多种量化投资方法,结合多因子分析、聚类分析、残差序列分析、ARIMA模型等研究突发事件对股票的影响。
2 选取特征指标
以30支大湾区股票为例,通过对30支券商研报的进行多因子模型的筛选以及聚类分析的重组量化分析,得出券商研报对股票走势的初步影响,从而得到关于金融外部性风险对股票走势影响的初步结论。
证券研究人员对证券及相关产品的价值,或者影响其市场价格的因素进行分析,离不开券商研报。完整的券商研报,包含对证券进行综合分析,总结出关于上市公司、行业或宏观政策的看法,并对相关股票进行投资评级等。文章基于研报所提供的信息,根据历史数据,提取可用于构造市场流行股票因子分析法的因子作为特征指标,并在此基础上提出明确的投资策略及分析在外界环境下对于股票行情走势的影响。主要通过建立多因子量化选股模型、R型聚类-因子分析法用来选取股票并且分析股票走势。
因子分析中的前提需要对各个因子的有效性进行分析检验,进行效度检验。应用SPSS对各个因子指标进行分析,判断数据是否可以进行因子分析。通过KMO检验以及巴特雷特球形度检验,可以得出因子间的相关性和有效性,若KMO检验值小于0.5则表明各个因子指标的相关性过高,进行因子分析的有效性不足,检验值在0.5-1.00之间才能进行有效的因子分析。巴特雷特球形度检验的显著性则要小于0.05才能有效进行因子分析。根据具体检验结果知KMO检验统计量为0.575,偏相关系数大于0.5,且Bartlett检验对应的P值小于0.05。根据以上两个原则,9个因子指标都通过效度检验,可以进行因子分析[3]。
文章基于研报和历史数据提取了相关影响因子作为特征指标并在此基础上进行分析。文章主要通过主成分分析法建立多因子量化选股模型来选取股票。根据选出来4个主成分因子。成分X1有销售净利率反映的是盈利能力因子;成分X2有净利润增长率和预测净利润增长率反映的是成长因子和分析师预测因子;成分X3有市盈率反映的是估值因子;成分X4有換手率反映的是交投因子。利用SPSS软件进行因子打分。以各主成分因子初始特征值累计贡献率作为权数,计算出股票的综合得分,根据主成分因子初始特征值累计贡献率/累计贡献率得出公式如下:
Z=28.438/83.5X1+21.184/83.5X2+18.709/83.5X3+15.169/83.5X4
其中,Z为股票的得分,X1、X2、X3、X4的系数则为主成分因子的初始特征值累计贡献率,通过计算得出所选股票因子的评分:德赛电池排名第一得分为-0.04;格力电器得分-0.19;瀚蓝环境得分-0.22;白云山得分-0.32;保利地产、华发股份、华侨城A得分均为-0.5;海信家电得分-0.51;国药一致得分-0.57;金地集团得分-0.58。因为因子分析中文章采用了动量反转因子所以股票因子打分为负数。笔者采取负加权梯度数学理论,第一步把全部的因子打分取绝对值,第二步根据绝对值算出对应权重,得出表1的股票加权投资策略。
3 建立并验证ARIMA模型
ARIMA模型是指差分自回归移动平均模型,由Box和Jenkins在七十年代初提出的一种时间序列预测算法,又可称为Box-Jenkins模型。该模型是计量经济学常用的模型之一,其主要思想是在规定的时间窗口下将数据随时间推移产生的数据序列看作一个随机的时间序列,并用一定的数学模型来描述和分析这个时间序列。此模型可以从研究对象在时间窗口下的历史值结合现值来预测分析未来的数值。在ARIMA(p,d,q)模型中AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同包括移动平均过程(MA)、自回归过程(AR)及ARIMA过程。ARIMA模型预测的基本程序有四步。其一,根据时间序列的描述性分析、自相关函数、偏自相关函数图以及ADF单位根检验变化规律判断序列的平稳性,以此检验数据的有效性[1]。其二,建立相应模型。构建AR模型的条件是平稳序列的偏相关函数为截尾且自相关函数为拖尾;构建MA模型的条件则是偏相关函数拖尾且自相关函数截尾;文章经过数据的检验得到平稳序列的偏、自相关函数均为拖尾,因此文章构建的是ARIMA模型[1]。其三,检验参数是否具有统计意义。其四,利用已通过检验的模型进行预测分析。文章首先建立ARIMA模型然后利用该模型对突发事件下收益率序列进行预测,实证新冠疫情(脉冲式突发性事件)对股票国药的影响大小、程度及时滞性。若无突发事件预测值应为收益率序列的理论值。预测值与实际值之差即是突发事件对股票的影响数值。
3.1数据的选取
文章首先通过建立自回归积分移动平均模型,简称ARIMA,然后利用该模型以下事件收益率序列进行追溯预测,实证研究突发事件——新冠疫情(脉冲式突发性事件)对股票国药一致的影响大小、影响程度以及作用时滞。若没有发生突发事件,则预测值为收益率序列的理论值,预测值与实际值之差即是受突发事件影响而变化的数值。
静态的分析是预测将样本数据在一定时间下作为一个信息的集合,对未来数据的预测都只基于样本信息集合,即静态VAR右边项(滞后项)都基于上期的实际值。而动态都是上期的拟合值,是基于样本信息集,往样本期之后预测一期的数据,再将该预测值加入残差拟合分析,加入样本信息集合中形成新的信息集,基于新的信息集再进行下一期的预测ARIMA短期预测的效果较理想,在可接受范围之内,对于国药一致股票而言,动态预测的效果优于静态预测。因此文章使用动态预测值作为研究对象。
新冠疫情对我国经济社会发展、公众的心理产生了巨大影响,国药一致的股价发生了不同的变化。其具体影响由2019年6月10日——2020年12月31日的日收盘数据可得,在新冠疫情发生前的5个月国药一致的股价总体呈现振荡向上的趋势,中间有一段时间是振荡平稳发展,在新冠疫情发生的3个月内总体呈现振荡下跌趋势,随着疫情防控稳定以及经济恢复总体呈现上升趋势,并且医药对疫情的影响日渐凸显,其股价也比疫情前更上一个阶段。
3.2描述性统计
文章选取考察脉冲式突发事件影响的时间区间为2019年6月10日—2020年12月31日,研究样本为国药一致收盘价数据。现对新冠疫情事件期间国药一致的收盘价进行描述性统计。从描述性统计结果可以发现,在新冠疫情期间,对国民经济、社会发展、公众的心理产生了巨大的影响,股市的资金不断流出,导致股票市场价格波动较大,为了规避风险,投资者卖出股票,股票价格下降迅速,到2020年初春,疫情稳定下来之后,对医药股票的却形成了正向的反馈。国药一致收益率的均值为-0.001953,最大值是0.100040,最小值是-1.000000,标准差是0.0565000,中位数为0.000340。总体上来说新冠疫情事件对国药一致产生了正向的冲击。从峰度值、Jarque-Bera统计量及其对应的概率值可以发现,股票市场和债券市场的收益率呈现尖峰厚尾的特征。
3.3单位根检验
在建模之前,需要对数据进行单位根检验,以防止出现“伪回归”现象。对国药一致的收盘价和收益率序列进行ADF平稳性检验,检验结果对国药一致的收盘价序列进行ADF平稳性检验,从检验结果可见,国药一致收盘价序列的P值分别为0.0229,收盘价序列是不平稳的。而它们的一阶差分,即收益率序列的P值都是0.0000,收益率序列是平稳的。因此,国药一致收盘价序列是一阶单整序列,即ps~I(1),pt~I(1)。
3.4模型建立和检验
为建立ARIMA(p,q)模型,需确定模型滞后阶数即p和q的值。由国药一致收益率序列自相关性和偏相关性可知其具有拖尾衰减特征且依正弦趋近于零。采Box-Jenkins模型检验后依然符合ARIMA(0,1,1),因此可用ARIMA(p,q))模型建模。根據收益率序列的数据特征可得出其模型特征,且其AR变量与MA变量符合建模要求,ARIMA(0,1,1)的模型检验数据如表2所示。残差不存在自相关且两个重要参数对应的检验概率都小于0.05,所以模型有效。
4 模型运用
利用构建的模型对股票国药一致收盘价进行拟合预测并进行比较分析。如图1所示突发事件——新冠疫情发生前后模型拟合效果都较好,残差在正负之间徘徊。
综上所述,分析结果表明突发事件——新冠疫情对国药一致产生了间接正向冲击。国药一致受新冠疫情影响的冲击幅度较大,但在随后逐渐反转。一方面是因政府出台各项政策支持全面抗疫。另一方面是全国共同抗逐渐改变了投资者的悲观预期。文章研究了外部性风险对股票行情产生的正负面影响。但这是单方面因素对金融市场的影响,因此实际操作中还需加上基本面分析、技术分析等来对股票走势进行科学预测。
先在基于我国现存的弱式有效市场上,由于信息的不对称性,通过事件研究法对“事件窗口”计算出超额收益率,结果虽然表明券商预测不完全准确,但其研报对信息的充分收集和分析却能较好地发现错误的市场定价,通过对股票评级进行因子打分最后仍可以建议股票价格向真实值回归。
其次,将突发事件划分为三种类型:脉冲式突发事件、渐进变化式突发事件、台阶式突发事件,对于不同类型的突发事件建立ARIMA模型的建立,进行描述性统计与单位根检验,并通过对股票的实际值和预测值之间的差值判断其对市场行情产生何种影响[10]。
最后,进行基本面因子分析,即通过研究对股票价格影响存在关系的各类因素进行分析,分析研究影响价格的决定因素及变动条件,基于此基础对股票的走势进行分析预测,然后评估证券的内在价值,通过对多因子选股进行建模,选出显著性相关的因子,其作用在于为判断股票市场价格的高低确立一个参照标准,组合所选股票进行套利投资。同时关注股票的系统性风险和企业风险等相关风险,留存准备金在一定程度上减少风险带来的利益损失,得出一个比较完善的加权投资策略。
参考文献:
- 李晓林.突发事件对金融市场的影响研究[D].成都:电子科技大学,2013.
- 王春丽,刘光,王齐.多因子量化选股模型与择时策略[J].东北财经大学学报,2018(5):81-87.
- 陆可,邹启鸣,李鸣,等.基于R型聚类-因子分析的指标体系简化方法[J].计算机系统应用,2016,25(5):118-123.
- 齐天铧.基于灰色模型与ARIMA模型的股票价格预测[J].计算机时代,2021(10):83-85,89.
- 王文胜,施怡.基于动态因子分析法的中国旅游业竞争力分析[J].生产力研究,2018(10):27-30.
- 柳思维,刘凤根.股票市场弱势有效与股票价格的随机游走[J].系统工程,2003,21(6):71-74.
- 余兴.中国券商研究报告的预测能力分析[D].济南:山东大学,2012.
[8]邓明光.重大事件下中国股市跳跃行为特征分析[D].南京:南京财经大学,2012.
[9]刘先伟.国外突发事件对国内股票市场影响研究[D].哈尔滨:哈尔滨工业大学,2012.
[10]百度学术.大数据背景下风险事件对证券价格影响因子[EB].http://mathfinance.sdu.edu.cn/__local/8/7B/21/0FBD2B3B079409D300EA93DA0FC_B3F9AFFF_B3808.pdf?e=.pdf.
[作者简介]耿营营(1995—),女,汉族,河南开封人,管理科学与工程硕士,广东理工学院经济管理学院,研究方向:區域经济。