APP下载

投资者情绪与股票收益关系的实证检验

2018-09-04金德环

统计与决策 2018年15期
关键词:交易者股票收益

李 岩,金德环,2

(1.上海财经大学 金融学院;2.上海市金融信息技术研究重点实验室,上海 200433)

0 引言

经典金融学理论往往忽视对投资者情绪的研究,他们认为理性投资者间的竞争将导致市场的有效性,少数非理性投资者对市场的影响也会被套利者的交易所矫正。然而,近年来国内外学者发现的众多金融异象无法被传统理论解释,有关投资者情绪的研究正是当前学术研究的热点问题。本文通过构建理论模型证明投资者情绪是影响股票收益的一个重要因素,同时这种影响与情绪交易者的多寡有关。

本文参考Anteiler和Frank的方法,以社交媒体——东方财富网股吧论坛为研究对象,利用计算机爬虫技术抓取了东方财富股吧数据,并借助机器学习辅加文本分析的方法对发帖人的情感进行分类处理,以过去一个月内数据为基础构造投资者情绪指标。本文的指标具有连续性,其覆盖了个股的各个时间段,这有助于进行深入研究。

相比以往研究,本文的贡献主要体现在:(1)出于数据可得性原因,现有文献较少从个股层面出发研究投资者情绪,本文对其做了补充。同时,不同于传统的实证研究,本文的网络数据是一大亮点,网络非标数据的合理使用必将扩宽现有研究的边界,本文有助于推动网络数据在金融经济学研究中的广泛应用。(2)本文的结论为上市公司利用社交媒体营造透明的信息环境具有启发意义,对监管部门制定相应的监管标准也具有一定的参考价值。

1 理论模型及研究假设

1.1 模型构建

本文考虑包含一个无风险资产和一个风险资产的单期模型,其中无风险资产的价格恒定为1,风险资产的期初价格为p,期末价格为v。假设v服从期望为,精度(方差的倒数)为τv的正态分布。模型中有两大类投资者:(1)理性投资者,占比为1-μ。为简化起见,本文假设理性投资者对于v的信息认知不包含其他噪音,服从Nˉ,1/τv);(2)情绪交易者,占比为 μ 。他们对于v的信息认知为这里ei为投资者情绪对信息的影响,ˉ衡量了投资者情绪的大小。除此之外,假定风险资产的供给恒定为1,两类投资者均按照风险厌恶系数为γ的CARA效用函数进行投资,即在期初最大化效用函数U(W)=-exp(-γW)。

1.2 模型求解

基于已有信息,投资者通过最大化期末预期资产的效用来决定最优投资决策,CARA效用函数的假定将问题归结为最大化是投资者的信息集。若投资者期初的财富为W0,对风险资产的需求为d,则期末财富 W=W0+d*(v-p)。故 E(W|F)=W0+d(E(v|F)-p),Var(W|F)=d2Var(v|F),求解最优函数 ,得到

证明:理性投资者的信息集为 F={p},则 E(v|F)=vˉ,

命题:本文的模型存在如下均衡解。情绪交易者的信息集为F=

风险资产的均衡价格满足市场出清的条件:

将dr和de带入式(2)有:

整理得:

易知命题成立。

1.3 研究假设

假设1:在其他条件相同的情况下,投资者情绪与股票收益间存在正相关关系。

假设2:情绪交易者越多,投资者情绪对股票收益的正向影响越大。

2 变量选择与研究设计

2.1 数据来源与样本选择

受限于投资者情绪指标的构造,本文样本选择沪深两市A股2010—2016年的数据,数据频率为月度的。对初始数据进行了适当处理:首先,剔除数据缺失的样本,其次,剔除样本期间被ST、*ST的样本和金融保险类上市公司;最后,为降低极端值的影响,所有指标都在1%和99%分位上做了缩尾处理。本文除了网络数据来自东方财富网以外,其他数据均来自CSMAR数据库。

2.2 变量定义与度量

(1)月收益率(Ret)

股票的月收益率是本文的主要被解释变量。

(2)投资者情绪变量(Senti)

为构造投资者情绪指标,首先利用朴素贝叶斯方法对近一亿条原始数据进行“正面”“中立”和“负面”分类处理。分类的具体步骤包括:第一,从全部样本中随机选取20000条帖子进行人工分类处理,然后从分类好的样本中随机选择15000条帖子作为可用数据集,其中“正面”“中立”和“负面”各5000条;第二,随机取13500条帖子作为训练数据集,使用朴素贝叶斯方法对训练数据集进行训练并建立分类模型,这里“正面”“中立”和“负面”各4500个样本。接着用分类模型对剩下的1500条样本进行分类处理,结果详如表1所示。一方面,模型对“正面”“中立”和“负面”正确分类的概率分别为64.4%、67.6%和68.2%。另一方面,从整个样本的角度看,模型判断为“正面”的数目是原“正面”数目的87.4%,等价于模型将12.6%的“正面”样本判断错了。同理,“中立”和“负面”的错误判断率为16.6%和4%,模型具有较高的准确度;第三,使用训练出来的模型对原始数据进行分类。

表1 机器学习分类结果

参考Antweiler和Frank(2004)的方法,投资者情绪指标构造如下:

其中,Positive为股票当月论坛讨论中正面情绪的帖子数量,Negative为负面情绪帖子的数量。Senti表示个股当月论坛讨论中正负面情绪的差额占所有正负面情绪的比例,数值越大,则投资者情绪越高涨,数值越小投资者情绪越低落。

(3)情绪交易者数量(SenNum)

用当月发帖数的对数来衡量,论坛发帖越多,中小投资者的关注度越大,情绪交易者也就越多。

(4)其他控制变量

除此之外,还控制了机构投资者持股比例(Hold)、分析师覆盖(Lanalyst)、非流动性(Ill)、市值(Size)、贝塔(Beta)、账面市值比(Bm)、动量(Mom)等变量,具体变量说明如表2所示。

表2 变量定义与度量

2.3 模型设定

首先,本文运用如下模型来检验投资者情绪对股票收益的影响,进而验证假设1:

其中,Ret为月收益率,Senti是利用文本分析和机器学习方法得到了投资者情绪指标,Senti越大说明投资者情绪越高涨,情绪交易者越容易受到影响,Control为本文所选控制变量。若假设1成立,β1系数应显著为正。特别地,本文借鉴Fama-MacBeth的方法对以上模型进行相关估计,具体分为两步:第一步,在不同时间点上对以上方程做横截面回归,得到方程系数的时间序列;第二步,对系数的时间序列数据做T检验。

其次,为进一步证实投资者情绪对股票收益的影响主要是由于情绪交易者的原因,本文还估计了以下方程:

这里,SenNum是指示情绪交易者多少的变量,如果假设2成立,则β2的系数应显著为正。

3 实证结果与稳健性检验

3.1 实证结果

表3前两列集中了投资者情绪对股票收益的影响分析。在第一列中,Senti的系数在时间序列上的均值为2.464,T值为6.66,在1%的统计水平下显著。投资者情绪与股票收益间存在正相关关系,投资者情绪高涨时,投资者一致看多。受情绪的影响,情绪交易者更容易做出买入决策,交易的不对称性驱动股价的持续上涨。其他控制变量方面:Ill显著为正,流动性差的股票收益较高;Size显著为负与小公司效应相一致;Beta不显著,高Beta股票在市场上涨时涨的多,在市场下跌时跌的多,整体看与股票收益间的关系并不明确;Bm的系数不显著,我国股票市场起步较晚,投资者的投资理念还不够成熟,市场中投机炒作现象明显,公司价值不能充分反映在股价中;Mom显著为负表明我国市场中存在着短期一月内的收益反转效应。在第二列中,还加入了Hold和Lanalyst,Senti的系数依然显著为正。表3前两列的结果表明投资者情绪越高股票收益越大,与假设1的预期一致。

表3后两列给出了模型(4)的实证检验结果。在第三列中,投资者情绪和情绪交易者数量交叉项的系数为1.444,在1%的水平下显著为正,表明市场中情绪交易者越多,股票收益受到投资者情绪的影响也就越大,投资者情绪主要通过情绪交易者的交易融入股价中。第四列中,在额外控制机构投资者和分析师的因素外,结论未变。表3后两列的研究结果支持假设2。

3.2 稳健性检验

为保证研究结论的稳健性,本文还构建了如下投资者情绪指标:

SentiNew的数值越大,投资者情绪越高。本文假设的检验结果如表4所示,假设1和假设2的结论依然成立,说明本文的研究具有较强的稳健性。

4 结论

作为传统金融学理论的重要补充,投资者情绪的研究备受国内外学者的关注,针对情绪交易者行为的研究极具重要的理论意义与实践价值。在此背景下,本文建立了投资者情绪与股票收益间的理论模型来揭示两者间的内在联系,并用数据对相关结论进行了实证检验。具体而言,本文使用网络爬虫技术从东方财富股吧论坛中抓取了股票的历史讨论数据,借助文本分析和机器学习的方法对论坛中帖子所持情感进行分类处理,构造投资者情绪指标。相比传统指标,本文的指标更直观,同时可以有效反映个股投资者情绪的变化。本文的研究结论表明短期内投资者情绪会影响情绪交易者对股价的判断,并经情绪交易者的交易融入股价,致使其与股票收益间呈正相关关系。基于此,随着网络社交媒体在公众生活中重要性的不断提升,建议监管部门有必要规范个人投资者的行为,防止虚假信息及负面谣言的传播。

表3 实证结果

表4 稳健性检验

猜你喜欢

交易者股票收益
螃蟹爬上“网” 收益落进兜
内部交易者行为及其基于Kyle模型扩展研究
内部交易者行为及其基于Kyle模型扩展研究
M个内部交易者的交易行为分析
基于随机动力系统的证券市场演化动态研究
多基本面下异质交易者竞争及流动性分析
怎么设定你的年化收益目标
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票