空气污染对中国股市波动率的影响研究
2022-09-26夏正兰吴江斌
夏正兰,王 璐,罗 楠,吴江斌
(西南交通大学 数学学院,四川 成都 611756)
随着经济的快速发展,中国在环境成本方面付出越来越多。经济的快速增长改善了中国人的生活条件,但随之而来的空气污染却对公民的健康造成威胁[1]。空气质量及其变化以更深入的方式触发和影响人们的心理和行为。研究行为金融学的学者[2]在过去20年调查了人们的情绪变化对股票市场的影响。其中,空气质量被认为是投资者的集体情绪或者情绪代理,并与股票收益率的波动显著相关。
国内外学者研究发现,空气污染会使投资者情绪恶化和某些生理指标改变,从而影响投资者的决策,导致股票市场的波动。例如LEVY等[3]利用中国、荷兰和澳大利亚的股票数据与空气质量数据作为样本,研究空气质量与股票市场的关系,结果发现空气污染会导致投资者之间的负面情绪和风险厌恶行为,使得空气污染和股票收益率之间呈现负面关系。郭永济等[4]发现上海市的空气质量状况对股票市场的收益率和波动率有一定的影响,并且指出空气污染对股票市场的影响由投资者情绪导致。在另一项研究中,张谊浩等[5]利用软件获取百度上人们搜索空气污染的次数作为空气污染的关注变量,并用沪深300指数作为研究样本进行回归分析,结果证实投资者对空气污染的关注程度会影响股票的换手率和收益率。WU等[6]利用公司水平的数据,发现空气污染引起的负面情绪对投资者情绪敏感的公司的股票收益率影响更加强烈。综上,空气污染是一个影响我国股票市场的行为因素,但学者们更多关注空气污染与股票收益率之间的影响关系,较少探寻空气污染与股市波动率之间的影响关系。
JIANG等[7]利用最小二乘回归调查了极端天气条件对深圳和香港股票市场的影响,研究发现极端天气条件对深圳市场的股票收益率有显著影响。两年后又使用分位数回归方法研究极端空气污染对深圳股价的波动性影响,研究发现空气质量对深圳股票市场的影响具有不对称性[8]。近年来,ENGLE等[9]提出的GARCH-MIDAS模型是应用最广泛的研究股票市场波动率的模型之一,与使用相同频率数据的传统GARCH模型相比,GARCH-MIDAS模型增加了低频和高频数据的长期成分对波动率的影响。然而标准的GARCH-MIDAS模型不能直接探究经济不确定性、地缘政治风险和天气因素等外生变量对股票市场波动率的影响。因此 构造了多因子的GARCH-MIDAS来探究外生变量对波动率的影响及预测[10]。另外,标准的GARCH-MIDAS模型无法捕捉到股市中的非对称效应和极端事件引起的极端冲击对股市波动率的影响。因此ASGHARIAN等[11]将宏观变量的长期成分的不对称性纳入GARCH-MIDAS模型,以此来探究非对称效应对波动率的影响。同时有学者[12]指出空气污染是最严重的环境风险之一,对人的健康和经济发展有长远的影响。
基于此,考虑在GARCH-MIDAS的长期方程里建模探究极端情况下的外生变量(空气污染)对股市波动率的影响。首先,在传统GARCH-MIDAS模型的基础上构建3个模型,直接探讨空气污染与股票波动率之间的影响关系。然后,使用阈值描述空气污染的极端情况,将阈值纳入GARCH-MIDAS模型的长期项中,以此来研究极端空气污染对股票波动率的影响。笔者不仅探讨了空气污染与股票市场之间的影响关系,还对股票波动率进行预测研究,可为金融学预测研究提供新思路。
1 空气污染影响股市波动率的理论机制
1.1 空气污染影响认知功能
相关医学研究为空气污染对认知功能有不利影响提供了有力的证据。特别是,一些空气污染物可以从上呼吸道转移到大脑,导致大脑信息缺失和认知障碍。同时空气污染会降低红细胞血红蛋白运输氧气的能力,导致大脑对氧气的可用性减少,从而使大脑认知能力下降。最近的研究表明,认知能力会影响股票交易的表现。GRINBLATT等[13]发现高智商投资者的交易表现优于低智商投资者,因为他们有更好的选股能力和更低的执行成本。鉴于空气污染会对认知功能产生负面影响,而股票交易决策具有认知要求,因此认为空气污染会对股票市场产生影响。
1.2 空气污染影响投资者情绪
空气污染也会影响投资者情绪,从而影响投资决策使股票市场波动率增加。LEVY等[3]提出空气污染通过影响投资者情绪从而影响股票市场投资者交易决策的2种可能方式。首先,空气污染程度的增加可能会引起负面情绪。因此,投资者可能很悲观,不太愿意购买或持有股票。其次,空气污染的增加还会使身体的皮质醇水平提高,导致个体的风险行为减少,投资者会更加谨慎和厌恶风险。
1.3 空气污染影响相关政策出台
人们对空气污染状况的关注和政府为治理空气污染而出台的相关政策也会影响股票市场。首先,投资者对空气污染关注程度的提高一定会影响投资者对其他股票市场影响因素的关注程度,使得投资者们偏向于某一种投资策略,然而这种非理性的交易策略会影响股票市场的交易情况,从而导致股票市场波动率的增加。由于信息时代媒体传播速度的加快,人们对空气污染危害性的认识更深。当某一地区遭受严重的空气污染时,投资者们对所在区域的“高投入、高污染、高能耗”上市公司的业绩和成长产生负面预期。其次,政府为建设美丽中国会出台相应的环保政策,这些政策会提高企业排污成本,从而影响“三高”上市公司的股票收益,导致投资者改变对企业环境负债的预期,使得股票市场发生波动。
2 模型构建
2.1 GARCH-MIDAS-AQI模型
GARCH-MIDAS-AQI模型是用天气指标来替代GARCH-MIDAS模型里面的已实现波动率。ENGLE等[9]使用混频数据抽样模型(MIDAS),将宏观经济变量与波动率的长期组成部分联系起来组成了新的GARCH-MIDAS模型。其模型的形式如下:
∀i=1,2,…,T,t=1,2,…,T
(1)
εi,t|φi-1,t~Ν(0,1)
(2)
式中:ri,t为第t月内第i个交易日内的收益率;Ei-1,t(ri,t)为在给定信息集φi-1,t的条件下直到i-1时刻收益率的条件期望;Nt为第t月的交易总天数;εi,t为方程的随机扰动项,服从均值为0,方差为1的标准正态分布;φi-1,t为第t月内第1天到第i-1天的信息集。在式(1)中波动率至少可以分为两个成分:gi,t为能够解释高频部分的短期成分,τt为能够捕获低频部分的长期成分。在实际的计算与建模中,通常假设Ei-1,t(ri,t)=μ,因此将公式(1)改写如下:
∀i=1,2,…,T,t=1,2,…,T
(3)
式中:μ为收益率序列的均值。根据ENGLE的研究[9],假设短期成分gi,t服从GARCH(1,1)过程:
(4)
式中:α,β为待估计参数,并且有α>0,β>0,α+β<1。在GARCH-MIDAS模型中最重要的是对长期成分τt的建模。长期成分τt由MIDAS回归表示为平滑的已实现波动率:
(5)
(6)
式中:K为长期成分中的最大滞后阶数;m,θ为参数,若θ为正,则RVt和长期成分τt正相关,θ为负,则RVt和长期成分τt负相关;RVt为金融资产的月度已实现波动率;φk(ω1,ω2)为权重函数。为了完整地构建这个模型,还需要确定公式(6)的权重函数。
(7)
其中,公式(7)中的权重总和为1并且加权函数是GHYSELS等人[14]提出的滞后结构。基于该函数的滞后非常灵活,它可以表示一种单调递增或递减的加权方案。公式(1)~(7)形成了一个具有固定时间跨度RVs和时变条件方差的标准GARCH-MIDAS模型,其参数空间为Θ={μ,α,β,m,ω1,ω2}。
在标准的GARCH-MIDAS模型中,长期成分主要受已实现波动率的影响,但是在实际应用中,能够捕获低频影响的长期成分也会受到其他宏观变量的影响,例如天气变量。运用空气质量来替代GARCH-MIDAS里面的已实现波动率,可以直接研究空气污染对股票市场波动率的影响关系。由于宏观变量数据存在正负,因此对τt作对数变换,公式(5)改为公式(8)。
(8)
式中:Xt为空气质量指数。由公式(3)~(4)、公式(7)~(8)构成的改进模型称为天气变量影响的GARCH-MIDAS模型,简记为GARCH-MIDAS-AQI。
2.2 GARCH-MIDAS-RV-AQI模型
ENGLE等[9]提出同时将已实现波动率和宏观经济变量纳入GARCH-MIDAS模型进行波动率预测,能够取得较好的预测效果。为了研究已实现波动率和天气变量对股市波动率的影响,笔者将已实现波动率和天气变量同时加入GARCH-MIDSA模型里面的长期成分中,即在GARCH-MIDAS-AQI模型的长期成分中再加入已实现波动率,其模型如下:
(9)
由公式(3)~(4)、公式(7)、公式(9)构成的改进模型称为已实现波动率和天气变量共同影响的GARCH-MIDAS模型,简记为GARCH-MIDAS-RV-AQI。
2.3 EX-GARCH-MIDAS模型
世界经济论坛在2018年全球风险报告中指出,极端天气事件在可能性方面是全球第一风险,也是仅次于大规模杀伤性武器的第二大风险。极端天气事件会造成极端空气污染,为了捕获极端空气污染对股票市场的影响,笔者在GARCH-MIDAS模型的长期项上进行建模,即对长期项里面的MIDAS回归添加门限结构以达到捕获极端空气污染效应的目的,改进后的结构如下:
(10)
3 数据与描述性统计
3.1 股票市场数据
笔者选取2014年5月13日到2021年4月24日的上证综合指数(下文简称上证综指)和深证成分指数(下文简称深证成指)作为股票数据样本,数据为日度数据,来源于英为才情网。根据收盘价可以计算出日收益率,即REt=ln(pt/pt-1),其中REt为日收益率,pt为第t天的收盘价。上证综指和深证成指的收益率和波动率的时序图如图1所示,由图可知,上证综指和深证成指存在波动聚集性。
图1 收益率与波动图
上证综指和深证成指的描述性统计特征如表1所示。上证综指峰度为5.23,大于3,偏度为-0.37,小于0,具有左偏性,呈现出“尖峰后尾”的特征。并且样本在滞后5阶,10阶的Ljung-Box自相关检验下都拒绝原假设,说明样本有较强的自相关性。由ADF检验可知,收益率序列平稳,可直接进行后续建模。同样,深证成指也具有上证综指一样的数据特征。
表1 上证综指和深证成指描述性统计
3.2 空气质量指数(AQI)
2013年以前,中华人民共和国环境保护部提供基于颗粒物(PM10)、二氧化硫(SO2)和二氧化氮(NO2)评价的空气污染指数(API),该指数可对空气质量状况进行定量评价。随后,MEPC使用了AQI指数来取代API指数对空气质量进行界定。相对而言,AQI由六种大气污染物构成:二氧化硫(SO2)、二氧化氮(NO2)、空气动力直径小于10 μm的悬浮颗粒(PM10)、空气动力直径小于2.5 μm的悬浮颗粒物(PM2.5)、一氧化碳(CO)和臭氧(O3)。因此,AQI比API更全面。空气污染数据来自中国空气质量研究平台(www.aqistudy.cn),由于新的AQI指标在2013年推出,考虑到数据的可得性,选取2014年5月13日至2021年4月24日上海和深圳的AQI数据。上海和深圳AQI的描述性统计特征如表2所示。由表可知,上海AQI和深圳AQI序列为平稳序列,可直接进行后续建模。两个序列都具有正偏斜,意味着序列右尾比左尾更长,即出现极差的空气质量比极好的空气质量的概率更大。
表2 上海和深圳AQI的描述性统计特征
4 实证分析
4.1 样本内估计
将样本划分为两个区间,一个区间是从2014年5月13日至2018年6月14日用于样本内估计(H=1 000);另一个是从2018年6月15日至2021年4月23日用于样本外预测(M=694)。为了评估极端空气污染对股票市场的影响,使用第2节提出的3个模型对第一个区间进行样本内参数估计,由于极端污染情况发生的概率较低,所以分位点水平分别设置为δ1=0.1、δ2=0.9,表示空气质量10%极好的情况或者空气质量10%极差的情况。上海AQI对上证综指和深圳AQI对深证成指的样本内参数估计结果如表3所示。
表3 不同模型的样本内参数估计结果
由表可知,除了均值μ和常数项m外,其他的参数在空气质量指数AQI的影响下都在10%显著性水平下显著,说明空气污染对股票波动率有影响,与LEVY等[3]的结果一致。
在GARCH-MIDAS-AQI模型中,参数θ表示空气污染对股票波动率的长期影响,其中,上海和深圳的空气污染对本地股票波动的影响力度都较强,分别为0.179 8与0.222,显著为正,说明空气污染对股票波动率有正向影响,即空气污染越严重(空气质量指数AQI越大),股票波动率更大。心理学家[15]指出:空气污染会造成人们情绪恶化,人在情绪低落的情况下极易产生悲观情绪和负面感知偏差,悲观情绪会给人们的投资交易行为带来显著的负面影响,投资者容易做出非理性的判断和选择,最终导致股票波动率增加。参数ω的估计值都大于1,说明随着滞后时间的不断增加,空气质量的权重系数值在不断减小,即越靠近当前交易时间,空气质量的变化对上证综指和深证成指波动率的影响也越大。
在GARCH-MIDAS-RV-AQI模型中,参数θ和γ分别表示已实现波动率和空气污染对股票波动率的长期影响。从表3可知,对于上海和深圳两地而言,参数θ和γ都在1%的显著性水平下显著,表明已实现波动率和空气污染都对股票波动率有影响。在加入已实现波动率之后,空气污染对股票波动率的影响力度减弱。
在EX-GARCH-MIDAS模型中,参数θ-,θ+,θ分别表示极好、极差、正常情况下的空气质量对股票波动率的长期影响。对两地而言,参数θ分别为0.058和0.797 6,显著为正,表明空气污染对股票波动率有正影响;参数θ-分别为-0.018 3和-0.811,显著为负,说明优质的空气质量对股票波动率有负影响,表现为优质的空气质量倾向于更低的波动率,这与郭永济等[4]的研究结果一致;参数θ+分别为2.638和0.035 9,显著为正,说明严重的空气污染对股票波动率有正影响,表现为严重的空气污染倾向于更高的波动率。LOUGHRAN等[16]发现极端天气条件引发的悲观情绪可能会导致当地公司的交易量大幅下降。投资者在空气质量差的期间,交易表现不佳,导致波动率增加。
4.2 样本外预测
判断波动率预测模型的好坏,除了比较样本内的估计结果,还要比较样本外的预测结果。将2018年6月15日至2021年4月24日作为样本外的预测区间,采取向前一步滚动预测法进行波动率预测。上证综指和深证成指在3个模型下的样本外预测图如图2和图3所示。
图2 上证综指样本外预测图
图3 深证成指样本外预测图
4.3 MCS检验
由图可知,EX-GARCH-MIDAS模型的预测效果更好,但是为了更加精准地比较3个模型的优劣,采用损失函数进行定量比较。目前为止,还没有一致的标准认为哪个损失函数更好,但HANSEN等[17]建议可以同时采用多种不同形式的损失函数来衡量预测误差。因此,笔者采用3种常用的损失函数作为各个模型波动率预测精度的评价标准,这三种损失函数记为Lk(k=1,2,3),公式如下:
(11)
(12)
(13)
为了克服SPA检验“与对照组多重比较”的缺陷,采用HANSEN等[17]提出的模型信度集合(MCS)检验比较方法。首先将m0个波动率预测模型纳入集合M0中,则有M0={1,2,…,m0}(m0=4)。然后按照3种损失函数计算相应的损失函数值,再进行一系列显著性检验,剔除M0中较差的模型。
MCS的检验统计量很复杂,一般选取常用的范围统计量和半二次方统计量,如下所示:
(14)
(15)
(16)
由表4可知,所有波动率模型的P值几乎都大于0.1,说明GARCH-MIDAS及其改进模型对上证综指股市波动率预测表现很好。考虑极端情况的GARCH-MIDAS模型优于其他3个模型。EX-GARCH-MIDAS在3个损失函数下都通过检验,并且预测精度最高。GARCH-MIDAS-AQI和RV-GARCH-MIDAS-AQI模型只在损失函数HMSE和HMAE下才全部通过检验。因此对于上海地区而言,考虑极端情况下的空气污染能够更好地预测股市波动。由表5知,4个模型的P值在损失函数HMSE和HMAE下都显著,说明就深圳而言,这4个模型都通过检验,但EX-GARCH-MIDAS模型较其他3个模型表现出更好的预测性能。因此,不管是上海还是深圳,加入极端情况的空气污染能够更好地预测股市波动率。
表4 上海AQI对上证指数样本外预测的检验结果
表5 深圳AQI对深证成指样本外预测的检验结果
5 稳健性分析
5.1 设置不同的分位点水平
为了使结论具有稳健性,设置不同的分位点讨论极端情况下的空气污染对股票波动率的影响。因此,设置分位点水平为δ1=0.2、δ2=0.8进行MCS检验,以确定模型的预测精度,结果如表6和表7所示。
由表6可知,在损失函数HMSE和HMAE下,4个模型均通过检验。总的来说在3个损失函数下,加入极端情况的EX-GARCH-MIDAS模型都通过了检验,并且预测精度最高。由表7知,对于深圳而言,4个模型在3个损失函数下都通过检验,并且加入极端情况的EX-GARCH-MIDAS模型预测精度最高。表6、表7的结果和表4、表5的结果一致,不论是上海还是深圳,加入极端情况的GARCH-MIDAS表现出更好的波动率预测性能。
表6 上海AQI对上证综指样本外预测的检验结果
表7 深圳AQI对深证成指样本外预测的检验结果
5.2 DM检验
DIEBOLD 等[18]提出DM统计量并且证明了DM检验的预测误差序列的约束更小。DM检验主要用于比较两个预测模型的预测能力,其原假设为:两个预测模型u和v的损失函数差有零期望,即E(dm,uv)=0。当接收原假设时,则说明两个预测模型的预测能力相同。DM统计量的公式如下:
(17)
DM检验结果如表8和表9所示,以考虑极端情况的EX-GARCH-MIDAS模型作为基准模型,在3个损失函数下,不论是上海还是深圳,DM统计量的值全部为负,表明相对于基准模型EX-GARCH-MIDAS,其他3个模型有更大的损失,即EX-GARCH-MIDAS模型的预测精度更高,与MCS检验的结果一致。
表8 上海AQI对上证综指样本外预测的DM检验结果
表9 深圳AQI对深证成指样本外预测的DM检验结果
6 结论
以上证综指和深证成指为股票样本,上海和深圳的AQI为空气污染变量,通过3个扩展的GARCH-MIDAS模型探究空气污染在我国股票波动率预测中的作用。结果表明:
(1)不论是上海还是深圳,空气污染对股票市场有正向影响,即空气污染越严重,股票波动越大。对于加入极端空气质量而言,空气质量极好时,对股票波动率有负影响,即股票波动率越小;空气污染的程度严重时,对股票波动率有正影响,即股票波动率越大。
(2)对于样本外预测而言,EX-GARCH-MIDAS模型表现出更好的股票波动率预测精度,因此加入极端空气污染的GARCH-MIDAS模型能够更好地预测股市波动。
研究揭示了空气污染在预测股票波动率的过程中发挥的不同作用,从而对市场效率的研究做出了贡献。投资者可能会因为糟糕的空气质量而做出有偏见的决定,也可以帮助投资者纠正投资行为中的偏差。