APP下载

网络舆情对金融市场的影响研究:一个文献综述

2019-01-20欧阳资生李虹宣

统计与信息论坛 2019年11期
关键词:金融市场舆情投资者

欧阳资生,李虹宣

(湖南工商大学 财政金融学院,湖南 长沙410205)

一、引 言

2018年中国第42次《中国互联网络发展状况统计报告》调查显示,截至2018年6月30日,中国互联网网民规模达8.02亿,普及率为57.7%;手机网民规模达7.88亿,网民中使用手机上网人群的占比达98.3%。随着计算机技术及手机设备的快速发展,便捷的上网环境促使越来越多的人们通过微博、博客及股吧等网络平台获取各类信息,并交流各自的观点。互联网由原始的信息发布平台逐渐演变成网络媒体以及用户传递获取信息的主要载体,成为信息发布、共享、交流、互动的社交网络,进一步成为网络舆论发生、发酵和爆发的平台。网民既是网络舆情的受众,也成为网络舆情的传递者,网络舆情的传播也由依靠传统专业媒体渠道向公共媒体与自媒体并行传播发展,这种开放的信息交流渠道能够对网民的情绪、态度及行为产生影响,进而影响金融市场。

中国金融网络舆情具有出现快速、消退迅速及常有反复的特点,经常因某篇报道或帖子大热产生关于投资的网络舆情信息,又由于网络热点的层出不穷而快速消散,之后又因为新的事由而再次爆发。关于网络舆情对金融市场的影响已成为行为金融学研究的重要方向。中国《证券时报》、《中国证券报》、《上海证券报》等主流财经报道能够较全面权威地反映国家经济政策以及金融市场变动的相关信息,引导投资者们对金融市场变动趋势产生初步判断,进而影响投资者的情绪及行为。由于中国投资者自身专业知识不足,且在获取信息时面临金融市场的信息不对称,导致投资者对于外界消息缺乏辨别力,但投资者的投资行为却易于受到外界消息的影响,因此网络舆情可能给金融市场带来严重影响。投资者通过在股吧、微博、博客、微信等平台浏览获取相关信息,并通过综合分析各类信息来优化自己的投资决策以最终反馈成对金融市场的直接预期,这些信息通过影响投资者情绪进一步影响投资行为。另一方面,投资者根据总结的信息分享自己的观点,进而影响他人的投资行为。因此各交流平台中以主观形式存在的舆情信息是影响投资者决策的重要因素,进而影响金融市场的稳定。

鉴于此,本文回顾了国内外网络舆情对金融市场影响的相关研究。首先对网络舆情的测度方法进行了归纳阐述,然后在总结归纳网络舆情测度方法的基础上,分别探讨了网络舆情对股票市场、衍生金融市场以及金融市场稳定性的影响,最后对未来研究方向进行了讨论,以期为进一步的研究提供参考。

二、网络舆情测度方法研究

目前,国内外关于网络舆情测度的研究多集中于社会学及新闻学相关领域,而对于金融网络舆情测度的相关文献较少。结合相关文献,本文从技术层面分析网络舆情指数的构建,可分为数据采集、关键词选择及舆情度量三个方面阐述相关的研究现状。

(一)舆情数据采集

关于舆情数据的采集,一方面通过相关搜索引擎直接获得计数或者图像数据,以此作为舆情数据进一步研究相关问题。Hamid与Heiden通过谷歌搜索引擎关于关键词“dow”的每周搜索量作为投资者关注度的度量指标,并通过经验相似模型研究投资者关注度与股市之间的关系[1]。Andrei与Hasler(2015)通过搜集测量Twitter上的投资者情绪状态分布情况,作为舆情分析。孟雪井等通过百度搜索引擎获取各关键词的搜索量,以此作为投资者情绪变动的测度指标,进而通过因子分析方法构建对沪市变动具有预测作用的投资者情绪指数[2]。

另一方面则是利用文本数据采集获取相关数据,常用网络爬虫或网站公开API等方式获取报刊、微博以及股吧平台等相关数据,之后利用自然语言处理方法获取结构化数据进行研究。Rao与Srivastava(2014)应用程序编程接口 API,在Twitter抓取道琼斯工业平均指数(DJIA)等13只大型科技股的推文信息,共获取超过400万条相关文本。Al-Nasseri与Ali由DJIA索引确定公司范围,应用API抓取所列公司一年间在StockTwits上与股票有关的所有新闻,通过数据处理最终获得超过28万条与股票相关的推特信息[3]。王夫乐与王相悦通过新浪微博开发平台对每日微博数据进行抓取,之后对数据进行清洗获取文本数据[4]。考虑到API存在使用次数及频数限制等缺点,Leitch与Sherif通过编写python代码爬取100家公司的相关推文,共获取大约1.7万条文本数据以构建舆情指标[5]。孟勇与常静爬取了2010年1月到2017年8月期间新浪财经股票板块下大盘评述专栏里的所有文章,共计11万条文本数据,对其进行相应处理[6]。

(二)关键词选择

关于关键词选择,可通过主观选词法和模型选词法两种方法来确定关键词的选取。主观选词法受研究者自身研究经验以及现有研究条件影响较大,由研究者参考相关研究并结合实际情况确定关键词。Bandhakavi等在通用情感词典(GPEL)基础上扩展特定领域情感词典,并将其应用于情感特征提取[7]。汪昌云和武佳薇利用中国主流财经媒体报道中的正负面词汇数据,并借助《现代汉语词典》等多本词典及知网中文信息结构库等词库,构建了中国财经媒体领域的正负面词库[8]。

模型选词是基于机器学习的方法而言,将大量可能的关键词全部纳入,再根据算法自动确定最终关键词。Manela与Moreira未预设关键词,通过将一段时期内所有文章中出现的词频做成一个高维向量,利用支持向量机的方法,将词频的高维向量拟合同期隐含波动率,并用所得回归系数与词频向量计算新闻隐含波动率[9]。孟雪井等运用文本挖掘技术,分别在知网CSSCI文献以“股票市场”为主题下载相关标题,获取关键词库;在新浪微博话题信息中,以“股票市场”、“股票”、“证券市场”、“证券”、“大盘”等为微博搜索关键词,利用清华自然语言处理的关键词抽取平台获取词库;之后结合百度自身关键词推荐系统,在综合三大词库的基础上确定中国投资者相关的网络搜索关键词[2]。王靖一与黄益平由和讯网上的新闻,使用Word2Vec模型获得某个词在语料库的若干近义词,以此扩展了适于金融科技领域的情感词词典[10]。

(三)网络舆情的度量

对于网络舆情的度量,主要通过构造情感词典法和机器学习法。构造情感词典法通用性较强,在所确认关键词的基础上,对金融网络舆情进行综合评价测度,且多集中于层次分析和模糊综合评价法。游家兴与吴静通过人工阅读对新闻报道的态度倾向做出判断,将媒体情绪从悲观到中性再到乐观的不同态度倾向采用5级对称计分法量化,并由低到高赋予不同分值[11]。王夫乐与王相悦将爬取的新浪微博内容进行情绪分类定性,分为愤怒、恐惧、惊奇、悲伤和喜悦五个维度,之后将各类情绪的微博量作为权值,以情绪性质的加权均值作为当日微博情绪[4]。王靖一与黄益平在金融科技语境下构建情感词典,根据正负向情感词汇在文章中出现的频数、正负向情感词典中词的数量等指标分别对报道中的情感词赋予不同的权重,之后计算每篇报道中的正负情感指数,并通过直接加总获得报道的净情感指数[10]。另外,徐映梅与高一铭运用百度搜索引擎获取与物价指数相关关键词的搜索量时间序列数据,对数据进行筛选及降频处理后,通过门限回归方法构建月度CPI舆情指数,并通过动态因子模型估计出了CPI高频舆情指数[12]。

机器学习法在不同领域文本的情感倾向性评价研究中有较好表现,前提是它需要构造训练语料库。Al-Nasseri与Ali对所列公司一年间在StockTwits上与股票有关的新闻的文本信息,使用朴素贝叶斯、决策树和支持向量机(SVM)算法在 Weka软件中训练所选消息样本,进而分析投资者意见分歧对股票收益和交易量的影响[3]。Pawar等结合递归神经网络(RNN)和长短期记忆单元(LSTM)方法对股票市场进行预测,并与支持向量机、随机森林等传统机器学习方法进行比较,讨论了投资者情绪对股票趋势变化的影响[13]。在对文本分类时,朴素贝叶斯分类器是一种基于概率的分类器,其与支持向量机对比能在保证较好分类效果的条件下简化计算。金秀等通过贝叶斯分类算法,从质化信息的“情绪基调”、量化信息的“张贴程度”和强度信息的“关注水平”三个维度构建投资者情绪指数,并以极端收益视角为切入点研究投资者情绪与上证指数的关系[14]。

三、网络舆情对股票市场的影响研究

关于网络舆情对股票市场的影响是金融网络舆情的主要研究方向之一,现有研究主要包括网络舆情对股票收益、股票市场流动性以及市场效率三方面的影响。

(一)网络舆情对股票收益的影响

现有研究发现,网络舆情积极乐观情绪较多,将对股市收益产生正向影响。Frijns等通过选取美国、英国、日本等五个国家的股市数据将股票收益分解为基本和非基本因素进行研究,发现投资者情绪解释了收益中非基本因素的水平、方差和协方差,表明股票收益率是由投资者情绪驱动的[15]。Ryu等以韩国市场2000年到2015年制造公司每日股票价格和交易量为样本数据,构建回归模型探讨投资者情绪对资产收益的影响作用,亦得出高投资者情绪导致高收益的结论[16]。姚尧之等通过对股市交易数据集的分析,发现相对乐观的投资者情绪将对当期收益产生显著的正向影响[17]。宋顺林与唐斯圆(2019)研究首日涨停板制度下,新股价值的不确定性将导致关注股市变动的投资者情绪更加乐观,进而对IPO溢价产生正向影响。另外,研究者通过网络舆情与股市收益标准差的关系研究网络舆情与股市收益间的关系。Han与Li对中国市场的研究发现,投资者情绪标准差增大将促进股票市场超额收益增加,长期而言则影响效果反转[18]。

另一方面,不同类型投资者对股票收益的影响程度存在差异。Ni等发现机构交易与股票收益正相关,而个人交易与股票收益负相关,这表明机构投资者的信息较之个人处于优势。Yang与Zhou研究发现投资者情绪对小股票超额收益的影响大于大股票,处于积极高涨情绪的投资者较之消极低落情绪者对股票收益的影响更显著[19]。高大良等关于投资者情绪对股市平均相关性和收益之间关系的影响研究发现对于高涨的投资者情绪,股市收益与股市平均相关性显著负相关;而情绪低落时,股市平均相关性与股市收益间的关系并不显著。文凤华等(2014)在研究投资者情绪与股市收益的关系中,将积极与消极情绪分开建立模型,由于在情绪低落时期理性成分对市场起主导作用,正面和向上变动情绪对股票收益存在正向影响,而负面和向下情绪变动则无明显影响,进一步由线性和非线性回归模型和VAR-GARCH模型研究发现网络舆情对股票收益的影响存在非对称性。Kumari与Mahakud以印度股票市场为研究样本,通过VAR-GARCH模型分析投资者情绪与股票间关系,发现投资者情绪对股市波动具有显著正向影响,且悲观情绪较之乐观情绪更易引起市场高度波动[20]。

再一方面,网络舆情在不同时间频率对收益率均存在正向的影响。Hamid与Heiden考虑到网络舆情在不同阶段影响的差异性,基于异构自回归(HAR)模型预测纳入谷歌搜索量后的股票波动性,从短期、中期和长期三个时间频率研究投资者关注对股票收益的影响关系[1]。姚尧之等构建日度、周度及月度三种不同频率的投资者情绪,利用MIDAS模型研究混频投资者情绪对中国股市收益率及波动的影响,发现混频情绪对当期收益率及其波动都存在显著的正向影响,并进一步借助GARCHMIDAS模型发现混频情绪能够显著影响收益的长期波动[17]。

(二)网络舆情对股票市场流动性的影响

研究发现网络舆情能够提高股票市场交易量,促进市场的流动性。Liu(2015)运用格兰杰因果关系发现,投资者情绪是市场流动性变动的原因,即当投资者情绪高涨时,市场交易量也会增加。刘晓星等(2016)发现高投资者情绪能够促进市场流动性,并且中国投资者对股市的认知度存在差异,随着投资者对股市相关消息认知能力的上升,股市的流动性相对减弱。另外,网络舆情对股市流动性的影响强度在开盘前后存在差异。部慧等利用Granger因果检验、瞬时Granger因果检验、跨期回归分析等方法探讨投资者情绪对中国股票交易量的影响能力,发现投资者情绪对股票交易量有当期影响,且开盘后交易时段的股评情绪对日交易量的影响较之开盘前更显著[21]。

另一方面,研究发现投资者积极情绪和消极情绪对股市流动性的影响效果存在差异。杨晓兰等通过本地偏好、投资者情绪对股市的影响研究,发现本地关注对股票交易量的正向影响在积极情绪下较之消极情绪影响程度更大[22]。石广平等基于2006年1月至2015年12月数据,利用TVP-SV-SVAR模型分析了投资者情绪、市场流动性对股市泡沫的动态影响效应,发现牛市中乐观的投资者情绪对市场流动性的影响较之熊市中悲观投资者情绪的影响更为显著。另外,投资者情绪分歧对股市流动性亦存在影响。Siganos等引入投资者情绪分歧的概念,测量20个国家每日积极情绪和消极情绪间的分歧程度,发现情绪分歧越大,人们对前景和风险的看法就越不同,此时市场交易量越大,伴随高流动性[23]。

再一方面,有些学者从投资者关注度以及网络舆情管理的角度探究网络舆情与股市流动性的关系。吴璇等研究发现,对公司网络舆情进行监测管理可以促进公司股票的流动性,特别在公司面对负面舆情消息时,积极的网络舆情管理能够有效改善股票流动性[24]。孙书娜与孙谦利用雪球社区用户的自选股信息构建了日度超额雪球关注度指标,运用固定效应面板模型对关注度和股市间的关系进行验证,研究发现投资者关注在短期内会对市场价格形成压力并使交易量剧增[25]。

(三)网络舆情对股票市场效率的影响

网络舆情能够影响市场定价效率。汪昌云等研究发现媒体报道在提高IPO发行价的同时,降低了IPO抑价水平,进而提高了市场的定价效率[8]。郦金梁等利用回归分析及Heckman两阶段模型对“百度股市通”选股数据样本进行实证分析,发现“百度股市通”产生的舆论影响力,加速了信息融入市场的过程,提高了市场效率,并对股票价格产生影响,同时发现对网络舆情发展的适度管理能够提高市场效率[26]。田高良等研究发现上市公司重视和管理网络舆情的发展能够向市场传递公司的特质信息,进而提高市场的信息效率,降低股价崩盘风险[27]。

网络舆情通过影响投资者的情绪及行为,进而提高市场效率。Yang等研究发现,在高涨的股市情绪下投资者通常过高估计难以估值的股票价格,机构投资者交易这些价格过高的股票进而提高股市效率[28]。适度的情绪可以促进市场效率,但过度情绪则会导致市场效率丧失。辛荣等(2016)通过进化博弈模型研究发现,噪声交易者的适度乐观情绪会增强其在股市的生存能力,进而促进市场效率,但过度乐观则会导致市场效率的丧失。孟庆斌与黄清华研究发现卖空量越大,投资者能够通过卖空反映其悲观情绪或负面信息降低高估股价的风险,进而提高市场定价效率[29]。

四、网络舆情对衍生金融市场的影响

衍生金融市场是基础金融市场派生出来以衍生品为交易对象的市场,衍生品种类主要包括期货、期权等。学者们从期权期货进行研究发现,网络舆情能够解释期权、期货市场的收益变化,其在衍生金融市场具有重要的影响作用。

网络舆情对期货及期权市场价格具有影响作用。Yang等研究发现,看涨的股票情绪将对期权价格的预期产生正向影响,反之看跌的股票情绪将产生负向影响,股票情绪和期权预期情绪将导致期权价格偏离理性价格[28]。另外,投资者正负面情绪对衍生金融市场的影响具有不对称性。Smales(2014)利用回归模型分析2003—2012年期间新闻情绪与黄金期货之间的关系,研究发现负面的新闻情绪较之正面情绪对黄金期货回报的影响更大。Lin等则对投资者情绪与期货和现货市场定价之间的关系进行了研究,他们首先利用简单回归模型证明投资者情绪对现货和期货市场价格波动具有正面影响,之后利用向量误差修正模型(VECM)研究发现在高情绪时期,期货市场的短期主导作用显著减弱,且投资者情绪对期货市场的信息份额和各因素权重产生负面影响[30]。

网络舆情对衍生金融的影响主要反映在其对期权、期货波动的解释力。Gong与Lin研究发现在构建原油期货波动模型时,加入投资者恐惧指标对波动性预测具有显著的正向影响,可以帮助改善HAR模型的拟合效果[31]。Gao与Süss(2015)利用偏最小二乘法构建投资者情绪,通过多元回归分析发现投资者情绪能够对除去宏观经济和股价变动等相关影响之外的商品期货价格联动效应提供额外的解释力。并且积极和消极情绪对期货收益的影响具有非对称性,低势头或低期货基础的商品期货对投资者情绪变化更为敏感。Seo与Kim在研究投资者情绪对期权隐含信息波动率预测能力的影响时,首先设定短期(每日或更高交易频率)、中期(每周)及长期(每月及多月)三个时间频率,之后借助HAR-RV模型对三个不同时间范围内的投资者情绪与标准普尔500指数下每日期权价格的变动关系进行分析,既利用投资者情绪在不同频率所实现波动率的线性形式来捕捉波动率的经验记忆,以此持续性帮助预测未来期权价格的波动。同时,发现基于期权隐含信息波动率预测模型的有效性随投资者情绪变动而变化,高情绪期间投资者情绪对期权交易回报的可预测性较之低情绪期间更强[32]。

五、网络舆情对金融市场稳定的影响

网络舆情影响投资者情绪和行为,进而影响金融市场的交易情况,从而对金融市场的稳定产生影响,同时投资者关注度越高引起的股市波动越大。Li等通过推特中推文间的持续时间来衡量投资者关注,通过资产类型、投资者的经验和投资方法划分投资者,运用回归模型研究发现不同性质的投资者关注对金融市场波动的影响有所差异,其揭示了不同的资产收益和波动性[33]。Ruan与Zhang等首次建立了投资者关注对市场微观结构影响的数理模型,印证了更高的投资者关注会导致更强的股票市场波动,并且与不知情的投资者相比,受关注的个人投资者更有可能购买而不是出售[34]。童中文等以2007年第三季度至2015年第一季度沪深两市14家上市银行数据为研究样本,运用SGMM和DGMM等模型研究媒体效应对银行系统性风险的影响,发现媒体报道数量越多,投资者情绪越悲观,银行发生系统性风险的可能性越小,对金融市场稳定性的影响越小,反之亦然[35]。姚登宝(2017)基于2006年10月到2015年11月的月度数据,应用TVP-SV-SVAR模型研究投资者情绪对金融市场稳定的影响机制及其动态关系,研究发现投资者情绪和金融市场稳定存在单向Granger因果关系,并且投资者情绪对金融市场稳定的冲击效应逐年减弱且存在时滞效应。

对于网络舆情适当的管理,有助于维护金融市场的稳定。游家兴与吴静以投资者情绪为中介,研究新闻媒体对金融市场运转可能存在的负面效应,新闻媒体对公司的正面报道一般会提高公司价值及并购价格,当报道所传递的媒体情绪越乐观,新股发行抑价程度越大,而之后表现为长期弱市来纠正之前的价格[11]。刘海飞等(2017)通过建立线性和非线性回归模型,发现微博信息质量将对股价同步性产生影响,并且随着信息质量的提高呈现出非线性U型关系,即随着社交网络信息质量水平的提升,股价同步性逐渐降到最小值,而后又逐渐提高。吴璇等研究发现,当公司面临负面媒体舆论情绪或者出现坏消息时,积极的网络舆情管理能够改善股票流动性,进而维护金融市场的稳定[24]。

六、结论与展望

通过对网络舆情对金融市场影响的相关研究进行梳理,发现对金融网络舆情的研究主要围绕网络舆情对股票市场、衍生金融市场以及金融市场稳定性等的影响,并且已经形成系列成果。国内外关于网络舆情对金融市场影响的研究正在逐步受到重视,在未来的研究中至少在以下几个方面还可进一步拓展。

第一,在金融网络舆情指标构建方面,现有文献关于金融网络舆情测度研究多侧重于简单使用网页搜索量或主成分分析构建投资者情绪作为替代变量,通过以上方法构建的金融网络舆情指标通常未能充分捕捉舆情事件信息。在针对金融市场网络舆情指数的构建上,关于网络舆情数据库范围的界定,情感关键词的确定以及进一步反映网络舆情倾向指标的构建还有待深入研究。对金融网络舆情的研究需要在分析热点事件和确定相关关键词的基础上,运用爬虫等数据搜集技术及数据挖掘技术,通过对媒体报道、股吧及微博等平台的挖掘,多维度构建关于金融市场变动的网络舆情指数。同时,由于对网络舆情的合理管理,能够提高市场效率,促进金融市场的稳健运行,关于金融网络舆情管理的研究也应得到加强。

第二,在网络舆情对金融市场影响的相关研究方面,国内外相关文献多从网络舆情对股市收益、市场流动性、市场效率以及衍生金融市场的变动情况来反映金融市场的稳定性。目前中国经济发展面临的不确定冲击明显增加,系统性金融风险爆发的概率显著上升,“牢牢守住不发生区域性和系统性金融风险这条底线”对实现中国经济发展稳中求进总基调具有重要意义,可以预见分析研究网络舆情对系统性金融风险的影响将是未来一段时期的研究热点之一。

第三,在网络舆情与金融市场关系的实证方法研究上,现有文献关于变量间关系的研究多集中于同一时间频率的方法研究,一方面较少考虑到网络舆情在周、月、年不同的时间间隔长度对金融市场的影响效果存在差异,今后的研究可以考虑使用异构自回归(HAR)等方法,分析在不同的时间间隔网络舆情对金融市场的影响差异;另一方面实证分析中经常存在变量数据频率不一致的情况,若简单地采用均值方法将高频数据低频化或者使用插值法将低频数据转化为高频数据,将不可避免地损失数据或使数据失真,在未来的研究中应进一步借助混频数据抽样模型(MIDAS)等方法以有效避免以上问题。

猜你喜欢

金融市场舆情投资者
金融市场:寒意蔓延【精读】
假如金融市场崩溃,会发生什么? 精读
聊聊“普通投资者”与“专业投资者”
纠纷调解知多少
新兴市场对投资者的吸引力不断增强
数字舆情
数字舆情
金融创新产品与完善金融市场探讨
消费舆情
让金融市场发力