投资者行为和中国股票市场的关系研究
2020-11-23杨澜
杨澜
摘要:传统Granger因果检验由于忽略了经济变量的非线性特征会导致出现显著偏差,而信息熵用来计算时间序列之间的信息转移,在非线性因果关系检验中有着独特优势。研究首先对这种非线性因果检验的方法及其优势予以说明,接着在实证分析中使用优矿金融量化平台的数据,通过使用PyCausality包进行转移熵计算,并计算Z值进行显著性检验。从而对中国股票市場投资者行为和股价涨跌幅的关系进行考察,发现了两者显著的非线性信息转移。
关键词:非线性因果检验;信息熵;投资者行为;中国股票市场
中图分类号:F832 文献标识码:A
文章编号:1005-913X(2020)10-0098-03
一、引言
Granger因果关系自提出以来,就被广泛用于经济学相关问题的研究中,成为考察经济变量间因果作用的一个重要分析工具。但随着对于变量间关系的进一步认识,研究发现经济变量以及金融序列往往是一种复杂的非线性变化,而传统的Granger因果检验受限于考察变量间的线性关系,从而会导致研究结论出现明显偏差。
最新研究发现,转移熵是对Granger因果关系的天然推广,在不同领域中的应用都证明了信息论方法对于非线性关系检验的成功,这对于日后经济问题研究都有着重要价值。
二、文献综述
(一)非线性因果检验的文献综述
传统的Granger因果检验考察的是变量间的线性因果关系,常常是在VAR框架下借助F检验对变量间的线性因果关系进行检验。而在真实的经济运行中,Lee(1993)等人的研究证明宏观经济变量和金融序列往往呈现出复杂的非线性动态变化特征,并且当时间序列存在显著的非线性趋势,Hong(2012)等人发现这种方法可能导致结论出现明显偏差。
为了克服上述传统Granger因果检验方法的局限性,近年来对于非线性因果检验方法的研究一直在不断深入。李楠(2017)将非线性因果检验的前沿方法归纳为三类:基于回归模型、基于非参函数和基于信息理论,并对这些方法进行了综合评价,其中非参函数法和信息理论方法无需假定特定模型,避免了回归模型的错误识别问题,从而得到了更加广泛的应用与研究。而基于信息理论检验非线性因果关系是现在研究前沿,Schreiber(2000)形式的度量称为转移熵,源于条件互信息公式化形成,可以捕捉信息传递的方向和大小,是一种无模型统计量。它自然表现为Granger因果关系的推广,事实上Barnett(2009)已经证明对于线性关系的多变量正态分布,转移熵和Granger因果关系是等价的。
(二)投资者行为和股票价格的文献综述
随着社交媒体的发展,互联网大数据包含了越来越多的投资者信息,使用这些非结构化数据,对投资者经济行为和股市之间关系的研究已成为热点。易洪波等(2015)基于东方财富网的股票论坛数据,探究网络论坛投资者情绪与股票市场的关系,研究发现投资者情绪会影响股票成交量和收益率。国内目前这方面的研究大多是在Var框架下进行的,而对股市和投资者行为之间的非线性因果关系研究较少。
三、模型机理和数据来源
(一)模型机理
1.线性情况
在线性情况下,我们建立了等式(1)所示的时间序列,使用Granger因果检验的方法,将它与添加了另一序列过去值信息的(2)式进行比较。如果发现后者的回归残差比前者小,则说明X是Y的Granger原因。
(二)数据来源
研究样本区间为2019年1月2日至2019年12月13日,共232个交易日,数据来源于优矿量化金融平台的API。研究采用了50只成分股当天社交关注度的加总。新闻情绪值是优矿基于东方财富网等国内七十多家主流新闻网站获得,使用NPL进行情感值分析,它表示每天在主流新闻网站上某只股票关联新闻的总体看法,正数表示看涨负数看跌,0为中性,绝对值越高情感值越强烈,使用时采用了50只成分股当天新闻情绪值的平均值。因为上证50指数每半年换一次成分股,所以对股吧论坛投资者关注度和新闻情绪值都做了相应的同期调整。
四、实证研究
(一)指标趋势分析和相关性分析
(二)转移熵计算模型
1.非参数密度估计时的参数选择
使用信息论方法行转移熵的计算时,用于估计联合熵项分布密度的非参数方法会影响结果计算。研究使用直方图估计方法,和KDE相比其计算量较小且能成功返还信息转移计算值,且进行密度估计时使用基于分位数的分区方法,独立选择每维度并计算分箱边缘,这样每个维度就包含大致相等的数据点。在具体的操作中使用AutoBins函数的sigma_bins方法,以每个维度标准差为依据自动获取合适分区数量,最终使用每个维度6个类。
2.转移熵计算及结果分析
在计算时使用向后看的12个月窗口数据计算转移熵,并且计算出z得分,这样就可以检测到指标间的因果关系。通过表2我们可以观察到各方向的线性和非线性转移熵及其z值,如TE_XY指标含义为X到Y方向上的非线性转移熵。
首先,显著性测试证实了因果耦合关系的存在,将转移熵作为检测统计因果关系的代理时,可发现新闻情绪值、投资者关注度与涨跌幅之间的非线性转移熵都大于线性转移熵,即有显著的非线性因果关系。这表明金融市场上的这种致使关系是非线性的,而线性检测的自回归技术在任何方向只能发现有限的因果关系。
其次,个人投资者的行为变化可以影响股市涨跌幅变动,而涨跌幅引起了机构投资者情绪的变化。因此,在以后探究投资者行为与股市变动关系时,可以将个人投资者的行为加入预测模型或交易策略中。
参考文献:
[1] 李 楠,陈暮紫,陈 敏.Granger因果检验的非线性进展及应用研究[J].数理统计与管理,2017(5).
[2] 易洪波,赖娟娟,董大勇.网络论坛不同投资者情绪对交易市场的影响——基于VAR模型的实证分析[J].财经论丛,2015(1).
[责任编辑:王 旸]