APP下载

在线社区支持倾向对股市收益和波动的影响①

2020-07-13李子饶

管理科学学报 2020年2期
关键词:一致性收益率卷积

钱 宇,李子饶,李 强,袁 华

(电子科技大学经济与管理学院,成都 611731)

0 引 言

有效市场假说指出,资产价格能够反映资产基础价值的信息,信息的不断揭示导致资产价格的变化[1].早期大量的文献针对公司财务报告[2]、并购重组等重大事项公告[3]、分析师调研报告[4]等的信息披露,通过考察股票的短期市场反应,对有效市场假说进行了实证检验.然而,这些相对标准化的报告或公告不仅是按照特定的信息披露规则进行披露,而且通常是由上市公司官方或专业的金融机构进行发布.近年来,信息科技的飞速发展和深度融合把人们带入大数据时代,数据呈现出体量大、多样性、密度低、速率高等属性特征[5].特别是社交媒体体验分享的用户生成内容(user generated content, UGC),对投资者尤其是非专业的“个体投资者”的信息获取与处理能力提出了巨大挑战.

越来越多的投资者通过在线金融社区(论坛、股吧)发表自己对于市场的评论,海量评论中蕴含着情绪和支持倾向等丰富的信息,并在以非专业投资者为主的用户之间分享传递.有证据[6,7]表明,人与人在社会互动过程中的信息获取与意见交换,以及乐观或悲观的情绪传播,对投资者的金融决策具有重要影响[8].Antweiler和 Frank[9]对股票留言板评论情绪的研究,以及Chen等[10]对金融社交媒体中的用户股评以及用户相互讨论形成的群体智慧的研究也支持了上述观点.

然而,区别于年报、公告、新闻报道等具有相对正式规范的信息披露形式,以及具有信息内容密度高、可靠性强等特点的传统信息来源,在线金融社区的用户评论信息不仅形式上具有短文本、不规范、错误多、口语化的特点,而且内容上也呈现出信息价值密度低、可靠性弱等特点[11,12],加之在线金融社区用户通常是整体专业水平较低的个体投资者.为此,如何充分利用在线金融社区的海量文本信息,提取并测度个体投资者对未来市场走势的看法,进而形成看涨或看跌的支持倾向?以及非专业个体投资者整体的支持倾向能否揭示未来市场的收益和波动状况?上述问题的解决,可以帮助投资者构建相应的投资策略,不仅对于丰富大数据分析技术在金融领域的应用,而且对于投资者决策实践都具有重要的意义.

需要指出的是,本文主要讨论的是用户的支持倾向而不是朴素的用户情绪,前者是指用户对未来市场看涨看跌的预期,包含了更多的用户投资行为相关的信息;而后者是指一种对市场普遍的乐观或悲观的心态,是更为朴素的个人情感[13,14].本文将在控制用户情绪的条件下讨论用户支持倾向对股市收益和波动的影响,这与以往基于用户情绪的研究有所不同.

本文利用2017年1月1日~2018年9月30日期间东方财富网的5 178 824条用户评论数据,首先基于深度学习的卷积神经网络分类算法提取并测度在线用户评论的支持倾向,并将之与传统分类算法效果进行比较.然后,在控制用户情绪的条件下,利用分布滞后模型、GJR(1,1)模型,考察了用户支持倾向对沪深300指数成分股的收益和波动的影响.进一步,本文对日间和日内用户支持倾向的成因进行了探讨,结果表明历史市场表现是用户形成支持倾向的重要原因.本文的创新点主要有三点:第一,利用卷积神经网络的分类算法,识别测度了在线用户评论中的用户支持倾向,较之以往的传统分类算法具有更高的精确度和召回率;第二,考察用户支持倾向对市场收益率和波动性的影响时引入了市场非对称效应的影响,并讨论了用户支持倾向的成因,提供了用户支持倾向具有“羊群效应”的证据;第三,将用户支持倾向和用户情绪区分开来,弥补了以往研究中将二者混淆的不足.

1 文献综述

1.1 金融文本挖掘相关研究

早期的金融文本挖掘的分析方法较为简单,主要是基于单词级别的词频统计.例如,Li使用“lingua::en: fathom”软件计算公司年报中相关字符、单词、句子和段落的频率,并构建可读性指标FOG(迷雾指数),实证发现市场参与者乐观或悲观的情绪对股票价格具有重要影响[2].此外,在文本向量表征上,TF-IDF向量模型被广泛用于金融文本挖掘[15,16].

金融文本信息提取的研究对象主要集中在新闻媒体、专业机构发布的各种形式的报告等高质量文本.这些高质量的文本在形式上具有表达正式、规范化的特点,其信息密度高,内容可靠性高.相比之下,本文的研究对象是在线金融社区,其主要用户是以“散户”为主的个体投资者,整体的信息解读、处理和分析能力较弱进而专业素质水平较低.此外,加上网络社区的开放性和缺乏监督性,用户评论往往具有短文本、不规范、文字错误、口语化、信息密度低、不可靠等特点[11,12],这些都使得从文本中提取出用户支持倾向更加困难.

1.2 金融社区、 金融社交媒体的相关研究

Tumarkin和Whitelaw对RagingBull.com论坛的研究发现,在留言板发生积极的情绪变化之前,股价出现小幅异常上涨,事件日的留言板意见和异常回报相关,且交易量在事件日当天大幅增加,并在之后一个交易日保持高位.然而,该研究认为很少有证据表明用户意见能预测未来市场的回报[17].Antweiler等对Yahoo!Finance和RagingBull.com股票留言板上的信息进行研究,他们发现留言信息的分歧有助于预测交易量,发帖活动也有助于预测股价的波动率[9].Das和Chen基于五种分类器开发了一种从股票留言板中提取投资者情绪的算法,研究发现从留言板评论提取出的情绪信息与个股股价之间并没有很强的关系[18].Chen对美国最大的投资类社交媒体网站Seeking Alpha的文章和评论区进行分析,在控制了金融分析报告、新闻报道等传统信息源后,发现社交媒体网站的信息仍然能够提供价值可观的信息,能够有效地预测投资回报率和惊喜收益[10].Renault对股评社区(stocktwits.com)的消息进行情感分析,利用开盘后30min的在线投资者情绪成功预测了收盘前30min的标普500股指收益,并认为这种预测力来源于新手交易者[19].Eli等对Twitter中个人账号发表的意见进行了正负情感极性分类,在控制了其他决定收益的因素之后,发现Twitter的综合意见有助于预测季度收益以及收益公告发布前后的异常回报[20].然而,以往的研究在进行信息提取时往往关注的是用户情绪,甚至将情绪与支持倾向混淆对待,在本文后续章节中将看到情绪与支持倾向的不同之处.

国内也有一些针对股票社区/社交媒体的研究工作,但大多数研究都基于简单的变量且高度依赖人工处理数据.刘海飞等基于关注度、信赖度和更新频率来衡量微博信息质量,研究了微博平台披露信息质量与股价的同步性[21].丁慧等研究了社交媒体“上证e互动”中问答互动的数量与股价崩盘事件的关联[22].俞庆进和张兵基于创业板股票的百度指数来构建投资者关注度指标,研究了其对市场收益率、换手率和成交量的影响[23].何贤杰等利用上市公司在新浪微博上发布的信息,讨论了上市公司在网络新媒体上披露的信息内容对股价同步性的影响[24].孙书娜等利用雪球社区用户的自选股信息构建了日度超额雪球关注度指标,对投资者关注的行为特征、投资者关注与市场表现之间的相关关系和因果关系进行了研究[25].与本文研究内容最相近的是部慧等的研究,他们用朴素贝叶斯分类算法提取了东方财富网股吧贴文中的投资者情绪,研究了投资者情绪对市场收益率、波动率和交易量的影响[26].然而,与他们的不同之处在于,本文采用卷积神经网络的分类算法分析在线金融社区用户评论,提取出看涨或看跌的用户支持倾向,在控制用户情绪的条件下利用分布滞后模型和GJR(1,1)模型,考察在线用户评论信息反映的支持倾向对股市波动和收益的影响,并进一步讨论了用户支持倾向的成因,提供了用户支持倾向具有“羊群效应”的证据.

2 数据、算法与指标

2.1 数据描述

艾瑞咨询发布了基于日均覆盖人数的《2017年6月PC网站榜单top1 000》[27],在财经类网站中,东方财富网以1 071万的日均覆盖人数高居第一,是第二名同花顺的近5倍,遥遥领先于同行,是中国目前最大的在线股票社区.为了保证实验数据具有代表性,本文选取2017年1月1日~2018年9月30日期间东方财富网中沪深300成分股的股票评论.剔除部分因停市、网站维护等原因导致用户评论不完整或无法获取的股票后,最终得到269只股票共5 178 824条评论数据,每条评论的平均字数为39,每只股票平均的评论数为19 252条.

本文使用jieba模块对评论进行分词.为了准确识别金融语境下的词汇,本文在分词模块中加入了搜狗细胞词典中的财经金融词汇大全、财会术语、股票基金词库大全以及从东方财富网爬取的所有股票名称、股票代码构成的股票信息词库.Mikolov等提出的Word2vec模型是将文本转换为数值向量的最流行和最有效的方法之一[28].本文使用python中的gensim模块训练Word2vec模型并生成词向量.经测试,语料库中的最佳模型训练参数是skip-gram模型,词表征维度为300,窗口大小为6,其余都是默认配置.

本文对投资者支持倾向的定义为投资者对某一标准的预期,当投资者预期回报高于“平均水平”时,支持倾向为看涨;当投资者预期回报低于“平均水平”时,支持倾向为看跌,且这个“平均水平”因人而异[29].将情绪定义为投资者普遍的乐观和悲观情绪[13,14],这种定义更接近于朴素的个人情感.

在标注数据时,本文判断支持倾向和情绪的基准是:评论中是否包含对未来市场或涨或跌的信息.表1给出了一些实例.有的评论中只包含用户纯粹的情绪宣泄,并不包含对未来市场涨跌信息的判断,如表1中序号①~④所示,这种特征正是在线金融社区用户评论信息价值密度低的体现;有的评论在宣泄情绪的同时也表达了对未来市场看涨或看跌的个人看法,如表1中序号⑤~⑧所示.

在用户评论中,同时包含了用户朴素的乐观/悲观的情感和对未来行情看涨看跌的期望,本文更关注后者而不是前者.在后续分类任务中,将用户对未来市场的支持倾向分为看涨、看跌和无明确倾向三种,将用户情绪分为正向、负向和无情绪三种.

表1 评论中用户支持倾向与情绪示例

2.2 CNN分类算法

卷积神经网络(convolutional neural network, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(feedforward neural networks),是深度学习的代表算法之一,广泛应用于图像识别、语音处理和自然语言处理[30],并在情绪分类问题上实现了较好的效果.

本文参考Kim[31]的CNN情感分类模型,搭建了包含一层卷积层、一层池化层和全连接层的CNN框架,如图1所示.卷积层的输入为词向量化后m×n的句子矩阵(行的大小m为句子长度、列的大小n为词向量的维度).对于文本处理来说,卷积核的大小一般取x×n,以步长i从第一行向下滑动,每次滑动都会得到一个卷积结果,滑动到最后一行便得到一个m-x维的向量(即特征图).卷积核的大小参数取决于文本类型,若文本越长、语义信息越复杂,卷积核越大.同时,为了捕获更为丰富的语义信息,需要设置几种不同大小的卷积核,且卷积核的数目应该足够多.每一个卷积核在输入的m×n句子矩阵滑动后,得到的m-x维的向量作为池化层的输入,池化层中预设的池化函数将对特征图进行特征选择和信息过滤.文本处理中的池化层一般采用k-max pooling的方法,输出一个k维的特征向量.将所有卷积核的池化层输出结果拼接起来,得到一个k×num_filters(卷积核数目)维的句特征向量.经过卷积层和池化层,词向量被映射成高维的语义句向量,已能够很好地表征语义信息.全连接层是一个浅层神经网络,通过标注的数据集和标注的结果就可以训练浅层神经网络分类器,输出支持倾向分类.

图1 卷积神经网络结构图

Fig. 1 The structure of convolutional neural network

经测试,在本文语料库中表现最好的网络框架和参数为:卷积层的卷积核大小为2×300、3×300、4×300、5×300、6×300,且每种卷积核的数目都使用了100个;卷积核以步长1在输入的矩阵滑动,从而生成特征图进入池化层;池化层采用1-max pooling的方法;所有卷积核经过池化层后的输出拼接成一个500维的高维句向量表征;500维的高维句向量作为全连接层的输入,全连接层输出支持倾向分类.

为了训练模型,对于评论的标注按照自然语言处理标签标注的一般方法,由专家标注了5 000条用户评论中的支持倾向和情绪.为了说明标注的训练样本数量能够满足算法训练,本文通过逐步增加训练样本数的方式,来考察训练样本数的增加对训练效果的影响,图2展示了实验结果.可以看到,算法在训练样本为3 000左右就趋于收敛,说明标注的训练样本数量能够满足分类算法的训练.

为了保证模型的泛化能力和稳定性,实验对模型进行了5次5折交叉验证,结果表明CNN模型在用户支持倾向分类上能够达到74.8%的精度和74.7%的召回率.进一步为了验证CNN分类算法的优越性,表2给出了5次5折交叉验证情形下该算法与其它常用分类器的对比结果.结果表明传统分类算法对于情绪分类效果较好,但对于支持倾向分类效果较差,这是因为支持倾向分类需要提取用户的潜在意图信息,比情绪分类任务更为复杂.相对于部慧等使用的贝叶斯算法[26]、Cecchini等[16]使用的SVM或是其他经典分类算法(1)算法详情参考Tan等的《数据挖掘导论》[32]和周志华的《机器学习》[33].,本文所提出的CNN算法都能实现更好的分类效果.

图2 训练样本数量对训练效果的影响

表2 不同分类器模型对比结果

2.3 支持倾向序列构建

本文使用CNN算法识别了语料库中每条用户评论的支持倾向.在讨论这些支持倾向对市场的影响之前,需要将这些意见进行汇总,并构建一个支持倾向序列,因此借鉴了Antweiler和Frank的牛市信号指标(Bullishness Signal)[9].然而,牛市信号指标的不足在于,无法体现股票市场对信息反应的非对称效应[34],即好消息和坏消息对股价波动的影响存在差异.若坏消息对市场的影响比好消息对市场的影响更大,称之为正向杠杆效应;若好消息对市场的影响比坏消息对市场的影响更大,称之为反向杠杆效应[35].非对称效应已经从理论和实证研究中得以证实[36,37].与本文研究对象最为接近的是Tetlock的研究,他们的研究表明股票收益率对负面新闻的反应比对正面新闻的反应更加剧烈[38].从本文的研究对象——在线金融社区用户评论来看,相同程度的看涨倾向和看跌倾向对市场的影响是不一致的,而Antweiler和Frank的牛市信号指标认为相同程度的看涨倾向和看跌倾向对市场的影响是相同的,从而忽略了这种非对称效应.因此,本文在结合Antweiler和Frank的研究基础上引入了股票市场中对信息的非对称效应的影响.

已经识别出每条评论中的看涨或看跌倾向,因此可以定义一段时间D(t) 内的看涨或看跌倾向为Ot,c,如式(1)所示,其中c∈{看涨(bullish),看跌(bearish),无},xi,c表示当第i条评论属于c时取值为1,否则为0;ωi表示第i条评论的权重.本文更加关注的是表征看涨和看跌的支持倾向,可以利用一段时间内看涨看跌差值来表征这段时间内整体的支持倾向,此处加入市场非对称效应的调整因子af(asymmetric factor),并进行归一化处理.当af>1时,能够表征市场的正向杠杆效应,即人们对坏消息更敏感;当af<1时,能够表征市场的反向杠杆效应,即人们对好消息更敏感.然而目前的指标还不够完善,它不能很好地表征支持倾向强度.为此,本文考虑将看涨看跌的有效评论数加入支持倾向指标中[9],得到式(2).这样,支持倾向指标不仅能用其正负符号来表征该时期内整体的看涨或看跌的支持倾向,还能用其绝对值的大小表征该种支持倾向的强度

(1)

ln(1+Ot,bullish+Ot,bearish)

(2)

式(1)中的ωi表示该条评论可靠性程度或重要程度,即具有较高专业素养的用户的意见会更加重要,因此其权重应该更大,而其他非专业个体投资者的权重应该更小.然而,用户的个人专业信息很难被观测到,且在线金融社区的评论主体是专业素养较低的个体投资者,于是本文在实验中对所有的评论赋权为1,即认为每条评论对市场的影响力相同[9],这种赋权方式实质上捕捉的是广大个体投资者(散户)的支持倾向.

投资者的意见分歧被认为可能是交易的动机[39,40],因此为了衡量这种意见分歧程度,本文直接引用了文献[9]的一致性指数At(agreement index),由式(3)给出.一致性指数At是一个区间为[0,1]的数,其值越大表明一致性程度越高.为了后续说明用户支持倾向和情绪存在差异,以同样的方法计算了情绪和情绪一致性指数.方便起见,用S1和S2分别表示支持倾向和情绪,用A1和A2分别表示支持倾向一致性和情绪一致性

(3)

结合构建的变量和沪深300指数的日收益率和日振幅数据,表3(a)给出了重要变量的描述性统计,从表中的单位根检验可知各重要变量均为平稳序列(在5%的显著性水平下).表3(b)和表3(c)给出了支持倾向强度和支持倾向一致性与沪深300指数当期收益率、振幅的简单描述性统计.从表中的结果可以看出,支持倾向与沪深300指数当期收益率正相关、与当期振幅负相关,支持倾向一致性与沪深300指数当期收益率负相关、与当期振幅正相关.本文将在下一节进一步讨论支持倾向与市场表现的关系.

表3(a) 重要变量描述性统计

表3(b) 支持倾向强度与收益率、 振幅基本统计

注:*、**、***分别代表10%、5%和1%的显著性水平,括号中为t检验的统计值,下同.

表3(c) 支持倾向一致性与收益率、 振幅基本统计

3 用户支持倾向对市场的影响

3.1 支持倾向对市场收益率的影响分析

当市场参与者在金融社区中发表自己的看法时,他们的支持倾向可能会产生投资交易活动,推动资产价格变化从而影响市场收益率.本节将讨论用户评论中的支持倾向信息能否影响市场收益率.

以支持倾向发生前10日作为基准,统计分析了支持倾向发生前后10日的累计收益率,如图3所示.其中,当af取不同值时,横坐标之上的线和横坐标之下的线分别表示了支持倾向为正和为负的情形.

图3 支持倾向发生前后10天的累计收益率

从图3中af=1.0的累积收益率可以看出,当看涨看跌倾向的程度相同时,市场对看跌的反应程度更加剧烈,这验证了已有研究关于中国沪深股市存在正向杠杆效应的结论[41].因此,本文通过增大af来调整杠杆效应.通过式(4)单独讨论了支持倾向对市场收益率的非对称性效应的调节,其中S1t-i是支持倾向,r10是过去10日的累积市场收益率.表4给出了支持倾向对市场收益率的非对称性效应的回归结果.从结果可以看出,随着af值的增大,支持倾向对市场杠杆效应的刻画就越强,显著性水平和拟合优度也随之提升,说明市场确实存在杠杆效应,通过刻画杠杆效应而使得回归效果更优.在后续回归中af被设置为1.8(在4.3中进一步讨论了af的取值以及支持倾向对市场收益率的非对称效应)

(4)

为了表征从支持倾向发生到市场发生反应这一滞后现象,与Chen等[10]类似,本文同样使用了分布滞后模型,其表达式由式(5)给出.其中,rt表示市场收益率,S1t-i为支持倾向,A1t-i为支持倾向一致性指标,S2t为情绪,A2t为情绪一致性指标,messaget-i为发帖量,X为一组控制变量,其设定参考了已有研究[42,43]以及现实交易中的常用变量,包括:前10个交易日的累计收益率和平均波动率、交易量、换手率、市盈率、市净率、市销率、市现率、波动率,εt是随机误差项.其中,市场支持倾向通过将个股等权相加整合而成,市场数据则使用了沪深300指数相关数据(下同).与Antweiler和Frank一样,本文认为只有最近期的用户倾向信息与股票收益率相关.为了更一般地探讨支持倾向在收益率回归中的影响,设置的最大滞后期为2.回归以2017年1月1日~2018年9月30日期间共427个交易日为样本.表5给出了回归结果,受篇幅限制,此处只列出了最关心的变量结果(下同).在表5中,模型(1)给出了仅有简单控制变量的情形,拟合优度较低;模型(2)~模型(4)通过逐步加入支持倾向及其滞后期来观察支持倾向对收益率的影响,支持倾向指标显著,拟合优度逐渐提高,说明支持倾向对于收益率有解释力;模型(5)进一步加入了用户情绪信息作为控制变量,结果依然稳健

(5)

表4 支持倾向对市场收益率的非对称性效应的调节

表5 用户支持倾向对市场收益率影响的回归结果

表5的收益率回归结果中,支持倾向高度显著,当期符号为正,滞后期为负,即当期看涨导致当期的正收益,而滞后期的看涨将导致当期的负收益.已有的基于用户情绪的研究表明,情绪对当期收益率有正向影响,但对未来的收益率无预测能力[26,29].本文基于用户支持倾向的研究结果与之不同,当期支持倾向不仅对当期收益率有正向影响,而且与未来收益率相反,这说明股吧用户支持倾向并不能正确预测未来的市场收益.若用户支持倾向存在“羊群效应”,则可能导致这种支持倾向与收益率方向相反的结果.本文在4.1节和4.2节中进一步讨论了用户支持倾向的“羊群效应”.在加入情绪信息作为控制变量后,回归结果依旧成立,这进一步说明用户支持倾向确实存在着不同于用户情绪的信息可以用于解释市场收益率.

3.2 支持倾向对市场波动性的影响分析

本节将讨论用户评论中的支持倾向是否会影响市场波动性.

衡量市场波动性的指标有很多,本文用振幅来代表单日市场波动,计算公式为

(6)

为了刻画从支持倾向发生到市场发生反应这一滞后现象,本文再次采用了分布滞后模型,其表达式由式(7)给出.其中,A1t-i为支持倾向一致性指数,S1t-i为支持倾向,A2t为情绪一致性指数,S2t为情绪,messaget-i为发帖量,X为一组控制变量,其设定与式(5)中一致,εt是随机误差项.在表6中,模型(1)给出了只有简单控制变量的结果;模型(2)~模型(4)通过逐步加入支持倾向一致性指标及其滞后项来探究其对振幅的影响,当加入滞后2期的一致性指标时,指标不显著且拟合优度有所下降,说明只有当期和滞后1期的支持倾向一致性指标具有解释力;模型(5)加入了用户情绪作为控制变量

Xδ+εt

(7)

表6 用户支持倾向一致性对市场波动性影响的回归结果

从表6的振幅回归结果中,支持倾向一致性指数显著且符号为正,即用户的分歧越小(一致性越高),市场的波动性越大.已有的理论认为投资者的分歧将导致交易,从而产生更大的市场波动.然而,本文的样本仅仅是股吧论坛中的广大用户,大部分都是散户投资者,仅能代表在线金融社区用户群体的看涨看跌倾向,而其他投资群体如机构券商等可能有相反的看涨看跌倾向,从而促成具有不同看涨看跌倾向的群体之间的交易.如果股吧论坛中的用户支持倾向存在“羊群效应”,用户达成一致性就可能是一种羊群行为,进而导致更大的市场波动性.为此,本文在4.1节和4.2节进一步讨论了用户支持倾向的“羊群效应”.

4 进一步的检验

4.1 日间市场表现与支持倾向的关系

在讨论用户支持倾向对市场收益和波动的影响时,可能存在反向因果的问题.用户的支持倾向可能来源于历史市场表现,即历史市场表现低迷时倾向于看跌,历史市场表现较好时倾向于看涨,从而利用用户支持倾向对未来收益进行预测时产生了不符合直觉的结果.图3显示,无论是看涨还是看跌的支持倾向,在支持倾向发生前,市场就已经有所反应,且在支持倾向发生后市场累计收益率几乎保持不变.这说明,0时刻的支持倾向可能更多地反映了投资者对过去一段时间内市场走势的态度,并认为这种趋势将得以延续.在收益率回归模型中,滞后期的支持倾向对紧随其后的股市收益率都具有显著的负向影响.

为了说明支持倾向更多的是投资者对过去一段时间市场行情的趋势延续,本文以支持倾向/情绪为因变量S1t/S2t,以历史支持倾向/情绪S1t-i/S2t-i、历史市场收益率rt-i、历史支持倾向、情绪的一致性指数A1t-i和A2t-i、历史发帖数messaget-i以及控制变量X(与式(5)中一致)为自变量,进行回归检验,如式(8)和式(9)所示.在表7中,列(1)~列(3)展示了式(8)的回归结果;列(4)展示了式(9)的回归结果.

表7的回归结果表明,用户的支持倾向与过去一段时间内的市场表现具有显著的正向关系,即当过去一段时间内的市场表现较好,用户倾向于发表看涨评论;当过去一段时间内的市场表现较低迷,用户倾向于发表看跌评论.这说明用户支持倾向信息更有可能来源于市场趋势.此外,表7显示支持倾向信息来源于过去多期的市场收益率,且重要程度随滞后期的增加而递减,而情绪信息仅与当期和滞后一期的市场收益率相关,且符号不稳定,这进一步说明了支持倾向信息不同于情绪信息,即支持倾向信息是一种相对更加有效的、与用户投资行为更相关的信息

Xδ+εt

(8)

Xδ+εt

(9)

4.2 日内市场表现与支持倾向的关系

行为金融学认为投资者群体具有“羊群效应”[44],为了讨论从在线金融社区用户评论中提取出的支持倾向信息是否存在“羊群效应”,本节以30min为周期,检验日内市场表现与支持倾向的关系.

s1i,t=c+Ri,t-1+β0S1i,t-1+β1S2i,t-1+

β2A1i,t-1+β3A2i,t-1+αYi,t+δZi+εi,t

(10)

表7 日间收益率对支持倾向、 情绪的影响的回归结果

表8 日内收益率对支持倾向、 情绪的影响的回归结果

从日内市场表现与支持倾向、情绪的回归结果可以看出,日内支持倾向/情绪与日内市场累计收益率正相关,即用户在跟随市场累计收益率并发表自己的支持倾向,这说明在线金融社区用户存在“羊群效应”.进一步,日内当期支持倾向与累计支持倾向正相关,日内当期情绪与累计情绪正相关,表明用户日内已经发表评论的支持倾向和情绪会影响后面的用户的支持倾向和情绪,这进一步加强了在线金融社区用户评论的“羊群效应”.在线金融社区用户评论的这种“羊群效应”可能导致出现在3.1节和3.2节中部分不符合直觉的结果.

4.3 股市波动性的非对称效应

本节将使用金融时间序列分析中的GJR(1,1)模型以检验第3节中回归结果的稳健性,同时讨论在构造支持倾向St时取不同的非对称效应调整因子(af)所带来的影响.

GARCH类模型是金融时间序列分析中经典的模型簇,其中在市场非对称效应下表现最好的模型是GJR(1,1)模型[35].因此,本节运用GJR(1,1)模型来检验前文得出结论的稳健性.

(11)

(12)

表9 GJR(1,1)模型结果

5 结束语

本文利用卷积神经网络分类算法提取并测度了在线金融社区中用户评论所体现的支持倾向,能够达到74.8%的精度和74.7%的召回率,优于现有文献的分类算法.并且考察了支持倾向对沪深300指数成分股的收益和波动的影响.

在对市场收益的影响方面,用户当期的支持倾向对当期的市场收益率具有正向影响,但前1、2日的支持倾向对当日收益率具有负向影响,这一结果在控制用户情绪的条件下依旧显著.进一步,通过考察日间股市表现对用户支持倾向的影响,发现在羊群行为作用下,过去10日内的市场表现是用户形成支持倾向的重要原因,当市场历史表现好的情况下,用户会形成看涨的支持倾向,反之形成看跌的支持倾向.在日内收益率与支持倾向的影响检验中,本文发现不仅日内的累计收益率会对用户支持倾向产生正向影响,而且用户已发表的评论中的累计支持倾向也会对后续用户的支持倾向产生正向影响,这进一步加强了在线金融社区用户追涨杀跌的“羊群效应”.

在对市场波动的影响方面,用户支持倾向的一致性对市场波动具有正向影响,即用户的分歧越小,市场的波动性越大.通过描述性统计和回归检验表明了股市中存在正向杠杆效应.通过引入的市场非对称效应的调整因子af(asymmetric factor),本文很好地捕捉并刻画了市场的正向杠杆效应.

未来的研究一方面可以基于本文提出的在线金融社区用户的支持倾向测度方法,将本文对市场收益和波动的影响研究扩展至个股或股票组合层面.另一方面,针对在线金融社区投资者群体与机构、券商等其他投资群体支持倾向及一致性的差异研究,也值得进一步思考.

猜你喜欢

一致性收益率卷积
关注减污降碳协同的一致性和整体性
注重教、学、评一致性 提高一轮复习效率
基于3D-Winograd的快速卷积算法设计及FPGA实现
IOl-master 700和Pentacam测量Kappa角一致性分析
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
2016年10月债券平均久期、凸性及到期收益率
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图