APP下载

社交媒体舆论事件的情感趋同研究
——基于细粒度情感的实证分析

2022-05-03刘昊

关键词:博文强度疫苗

刘昊

(四川外国语大学新闻传播学院,重庆 400031)

1 引言

近年来互联网尤其移动互联网的快速普及,微信、微博等社交媒体平台成为人们日常社交、获取新闻资讯、传播热点事件的重要渠道。以新浪微博为例,2018 年底月活跃用户共4.62 亿,日活跃用户达到2 亿。新浪微博日均文字发布量1.3 亿,日均视频直播发布量超过150 万条,日均回答问题数超过5 万条(微博数据中心,2018)。互联网用户依托社交媒体平台的关注和好友关系镶嵌在虚拟网络上。社交媒体满足用户对信息的多元需求,突破地域限制,通过转发、点赞、评论,二次传播用户观点或情感。研究发现网民个体之间信息传播,带有明显的情绪宣泄性质,传播者的情绪越强,其信息传播意愿越高(赖胜强,唐雪梅,2016)。社交媒体舆论事件的研究显示,用户的情感信息和意见要么影响了事件的走向,要么对事件的发展方向起决定性作用。因此传统情感社会的研究不但应引申到网络空间,更应该对社交媒体情感现象和问题重点关照。本文选择2018 年的长生生物“假疫苗”事件作为研究案例,该事件被多家媒体报道并在社交媒体大量传播,成为社会关注的舆论事件。“假疫苗”事件中有大量的情感显现,在社交媒体上用户关于事件的互动频繁,特别是情感的互动有大量的行为数据用于研究。同时“假疫苗”事件影响特别巨大,具备涉及生存安全问题、道德底线突破、公众反映强烈等舆论热点事件的一般特征。因此“假疫苗”事件个案的研究不但能够对案例本身有较深的情感探讨,更能透过个案窥一斑而知全豹,发现舆论事件在社交媒体平台情感传播的一般规律。

2 文献综述与研究假设

现有的社交媒体舆论研究普遍将情感视为一个重要的影响因素。情感通常是指与人们的社会需要有关的体验,在意识的控制下,对稳定的态度体验和行为反应,有稳定性、持久性、内隐性、深刻性等特征(王有智,欧阳仑,2003)。社交媒体不但是公众表达情绪、发泄情绪的途径;同时也是媒体动员公众参与并增强事件的社会影响力的手段(焦德武,2014)。比如在反腐议题的微博讨论中,情绪化表达,特别是低唤醒度的负面情绪表达最为显著(周莉,王子宇,胡珀,2018)。在群体中,每种感情和行动都有传染性、人群或者大众的情绪成为人群中个体成员的情绪(古斯塔夫·勒庞)。在社交媒体发布的内容中,关心、歉意和抱怨会产生典型情感影响(Suin Kim, JinYeong Bak, Alice Oh,2012)。文本内容中包含的情感信息会对文本的被转发、被关注的程度产生影响,情感信息影响信息接受者对信息本身的关注(纪雪梅,王芳,2015)。从传播研究的视角来看,传播是指传受之间通过信息共享建立共同意识的过程。情感基于接受者社会经历和文化背景中介作用,决定信息接收者的态度和意见。情感会显著影响用户的传播行为,进而影响舆论的形成。由传播的定义推及情感传播的定义,即基于情感流动的传受之间建立共同情感的过程,即情感趋同的过程。人际情绪的分享和情绪社会分享均会促进情感趋同效应的产生(孙俊才,卢家楣,2007;Strongman, Kenneth T,2003)。群体情感传播会发生循环效应,经过反复循环加强后,群体内某种情感会在群体之间逐渐达到同质化(Eliot R.Smith, Frederica R. Conrey,2007)。文本或视频是否包含情感信息或是否能唤醒情感信息会影响到其是否更易被分享(徐翔,2017)。不同种类的情感,比如愤怒、恐慌、悲情,在群体聚合速度存在显著差异(杨国斌,2009; Christopher K. Hsee, Elaine Hatfield, John G. Carlson,1990; Lars Kai Hansen, Adam Arvidsson, Finn Arup Nielsen, Elanor Colleoni, Michael Etter,2011)。因此研究中有必要对不同情感加以区分。现有的社交媒体舆论的研究,情感是一个重要聚焦点且成果丰富。但对社交媒体情感趋同缺乏实证的分析,且在情感更细的分类下情感趋同的研究仍待拓展。鉴于此,本文以情感细粒度测量作为研究工具,以新浪微博作为社交媒体平台研究对象进行情感趋同现象研究的扩展。

情感实证研究的难点在于情感的分类和测量,情感的分类实证研究多停留在正负层面。情感的分类有“七情说”分类、6 类分类、8 类分类和18 类分类(林传鼎,2006;Ekman P,1993)。除以上一维的分类方式,情感有多维度的分类方式。基于文本符号的情感测量大多通过机器学习(Picard R W,Picard R,1997)或情感词典(王勇,吕学强,姬连春,肖诗斌,2014)实现。考虑研究的可对比性和可执行性,选择大连理工情感词本体库作为工具(徐琳宏,林鸿飞,潘宇,任惠,陈建美,2008),将情感分为三个等级分类(见表1)。社交媒体平台文本是用户情感表露的符号和载体,评论与转发是社交媒体信息传播的通道,情感传播的过程与情感趋同的结果自然可以通过文本的观测得以检验。基于可以测量情感细粒度的级别,结合文献讨论,论文提出如下研究假设:

表1 情感三级分类表

研究假设1 同级同分类微博文本情感强度与微博评论情感强度正相关。

研究假设1.1 微博文本情感强度与微博评论情感强度正相关。

研究假设1.2 同类情感微博文本一级分类情感强度与微博评论一级分类情感强度正相关。

研究假设1.3 同类情感微博文本二级分类情感强度与微博评论二级分类情感强度正相关。

研究假设1.4 同类情感微博文本三级分类情感强度与微博评论三级分类情感强度正相关。

研究假设2 同级同分类微博文本情感强度与转发配文本情感强度正相关。

研究假设2.1 微博文本情感强度与微博转发配文本情感强度正相关。

研究假设2.2 同类情感微博文本一级分类情感强度与微博转发配文本一级分类情感强度正相关。

研究假设2.3 同类情感微博文本二级分类情感强度与微博转发配文本二级分类情感强度正相关。

研究假设2.4 同类情感微博文本三级分类情感强度与微博转发配文本三级分类情感强度正相关。

研究假设3 情感博弈过程中社交媒体舆论事件的各级情感结构会趋于稳定。

3 数据提取与清洗

新浪微博数据采集选择火狐浏览器6.0编写脚本实现,时间范围为2018年7月15日0点至2018年8月9日24点,每隔两个小时采集一次数据。微博内容的提取使用关键词检索,主要关键词包括“假疫苗”“毒疫苗”“问题疫苗”“长生生物”“狂犬疫苗”“武汉生物”“问题疫苗”“高俊芳”等词。使用关键词交叉组合筛选目标事件相关微博。在数据清洗剔除错误和重复数据后共计得到有效微博223903条和微博账号166739个,并采集了微博账号公开的属性标签。数据入库前对采集的账号数据进行了匿名化脱敏处理。使用采集的数据绘制以天为单位微博数量时序图与“假疫苗”百度指数波动曲线类似,两者数据能够交叉印证,数据质量可靠。

4 核心概念测量

情感强度既是核心概念也是研究的基础工具。考虑研究的可对比性和词库的成熟性,选择大连理工林鸿飞教授的中文情感词汇本体库,使用词典标注的方式进行情感的计算。为提升情感计算的准确度。在基础情感词典的基础上,引入程度副词词典、连词词典、否定词词典用于处理情感词的强化或弱化、情感文本的反向。情感计算分为词语级、句子级和语篇级。情感强度三级测量分类汇总,低级情感强度分类汇总后得到上一级情感强度。

4.1 词语情感强度

公式(1)是词语情感强度的计算,依据情感词典查出情感的强度和正负极性。考虑程度副词的权重,并对程度副词和情感强度进行min-max映射。E(w)是单个情感词的情感强度。S(w)是情感词在情感词表中的强度值。P(w)是情感词的情感极性。P(w)的取值存在四种情况,情感词是中性词P(w)=0,情感词是褒义词P(w)=1,情感词是贬义词P(w)=-1,情感词是褒贬两性词P(w)=0。w(da)为程度词副词权重(徐琳宏,林鸿飞,杨志豪,2007;蔺璜,郭姝慧,2003;陈国兰,2016)。

4.2 句子情感强度

公式(2)是将句子中的情感词,按情感强度,对否定词进行情感取反,对不同的句型、感叹句、反问句进行句型权重min-max 标准化引入。E(s)是句子的情感强度。E(w)是单个情感词情感强度。n是句子情感词的数量。m是句子否定词出现的次数。W(s)情感词句型结构权重,处理感叹、反问等情况,疑问句W(s)值为-1,感叹句以一个感叹号结尾W(s)值为1.5,感叹句以多个感叹号结尾W(s)值为2,反问句W(s)值为-1.5(刘玉娇,琚生根,伍少梅,苏翀,2015)。W(na)是否定词权重,存在否定词其值是0.8,否则其值是1(张成功,刘培玉,朱振方,方明,2012)。

4.3 段落情感强度

4.4 二级情感强度分类汇总

公式(4)—(10)实现三级情感强度向二级情感强度的汇总,计算方法按三级情感分类层级关系,逐层累加,累加结果除以用户微博参与次数以剔除用户参与频次对强度的影响。

4.5 一级情感强度分类汇总

公式(11)—(13)实现二级情感强度向一级情感强度的汇总,计算方法按三级情感分类层级关系,层层累加。最终正向情感强度与负向情感强度的累加,得到总的情感强度值。

5 分析过程

对全部采集到的微博文本进行情感强度的计算,绘制“假疫苗”事件二级、三级情感强度分布旭日图如图1所示。从图1可以看出“假疫苗”事件中二级主导情感是“恶”和“好”,其次“哀”和“惧”。其中“恶”和“好”特别强烈,位于第一阵营,“哀”和“惧”相对强烈位于第二阵营。在“恶”的下属情感中,“贬责”“憎恶”是主导型情感。对采集的文本分词后发现,“假疫苗事件”语料“贬责”高频情感词:涉嫌、背后、违规、危害、害人,“假疫苗事件”语料“憎恶”高频情感词:行贿、恶心、恶劣、逍遥法外、黑幕。词频分析发现,情感分布中正面情感中存在大量网民的戏谑的表达和反讽修辞。比如把“假疫苗”事件中的主要涉事人高俊芳称为“疫苗女王”;引发“假疫苗”事件成为热点的关键网络文章的标题为“疫苗之王”;由“假疫苗”事件联想到三鹿奶粉,把三鹿奶粉罐子称为“文物”;使用“厉害吧”,“服不服”等词修饰不良企业的造假行为。

图1 “假疫苗”事件二级、三级情感强度分布旭日图

5.1 评论情感相关性检验

从采集的数据集中,提取微博评论量在10以上的微博,共计3781 条,采集其第一页第一屏按热度排序评论,最终成功采集评论38051 条,分别隶属于3270条微博。将采集的微博评论依所归属的微博为单位组合成评论集文本,并剔除错误数据和异常值,计算其情感强度。使用SPSS 对微博文本情感强度变量(微博情感强度、微博负向情感、微博正向情感)和微博评论情感变量(评论情感强度、评论负向情感、评论正向情感)进行相关性分析(结果见表2)。从表2 中可以看出微博情感强度与评论情感强度之间呈弱正相关关系,假设1.1被接受。一级情感分类:微博正向情感强度与评论正向情感强度之间、微博负向情感强度与评论负向情感强度之间相关系数均呈弱正相关关系,假设1.2 被接受。且与正向情感相比负向情感在微博与微博评论之间的相关性更强。

表2 “假疫苗”事件微博文本与评论一级情感相关性分析表

使用SPSS对微博文本二级情感强度变量(微博乐、微博好、微博怒、微博哀、微博惧、微博恶、微博惊)和微博评论二级情感变量(评论乐、评论好、评论怒、评论哀、评论惧、评论恶、评论惊)进行相关性分析(结果见表3)。从表3可以看出微博本文和微博评论的二级情感分类,除“惊”情感强度相关性不显著外,其它6维的情感均呈弱正相关关系,但相关系数除“恶”“哀”在0.2左右,“乐”“好”“怒”“哀”“惧”的相关系数均在0.15以下,总体呈弱正相关关系,假设H1.3被接受。对比其它类别二级情感,“恶”“哀”两种情感在微博和评论之间存在更强的相关性。

表3 “假疫苗”事件微博文本与评论二级情感相关性分析表

基于图1,筛选主要的三级情感(情感强度占比在3%及以上):“快乐”(占比4%)、“赞扬”(占比22%)、“相信”(占比4%)、“喜爱”(占比4%)、“愤怒”(占比3%)、“悲伤”(占比5%)、“慌”(占比3%)、“恐惧”(占比4%)、“烦闷”(占比3%)、“憎恶”(占比11%)、“贬责”(占比26%)。使用SPSS对筛选后的微博文本三级情感强度变量和微博评论三级情感变量进行相关性分析(结果见表4)。从表4中可以看出,主要的三级情感分类,“贬责”“憎恶”“烦闷”“慌”“快乐”均呈现弱正相关关系,假设1.4被接受,即三级情感分类的考察,三级情感分类中的主导性情感在微博文本和微博评论之间呈现弱相关关系,且越是主导性情感其相关性系数越高。

表4 “假疫苗”事件微博文本与评论三级情感相关性分析表

5.2 转发情感相关性检验

从采集的数据集中,筛选微博转发量在30以上的微博,共计2220条。以筛选的微博为目标页面,以转发量的再转发量排序,提取前20条转发,将转发配的文本构造转发配文本变量,剔除错误数据和异常值,最终得到可供分析微博转发文本样本1901个,计算三级分类情感强度并分类汇总。使用SPSS对微博文本一级情感强度变量和微博转发文本一级情感变量进行相关性分析(结果见表5)。

表5 “假疫苗”事件微博文本与转发配文本一级情感相关性分析表

从表5中可以看出微博情感强度与转发配文本情感强度之间呈正相关关系,假设2.1被接受。一级情感分类:微博正向情感强度与转发配文本正向情感强度之间、微博负向情感强度与转发配文本负向情感强度之间均成正相关关系,假设2.2被接受,且负向情感的相关性比正向情感要高。

使用SPSS对微博文本二级情感强度变量和微博转发文本二级情感变量进行相关性分析(结果见表6)。

从表6可以看出微博本文和微博转发配文本的二级情感分类,七个二级情感分类均正相关关系,其中“惧”“怒”“恶”相关性系数较高,相关性较强,假设2.3被接受。

表6 “假疫苗”事件微博文本与转发配文本二级情感相关性分析表

使用前文同样的方式筛选主要的三级情感,使用spss对筛选后的微博文本三级情感强度变量和微博转发配文本三级情感变量进行相关性分析(结果见表7)。从表7中可以看出,主要的三级情感分类均呈现正相关关系,且相关系数普遍高于0.3,假设2.4被接受。其中情感“慌”的相关性系数最高,达到0.545,为三级情感中相关系数最高的一个,其次为“快乐”“贬责”“恐惧”。

表7 “假疫苗”事件微博文本与转发配文本三级情感相关性分析表

5.3 情感传播趋同性检验

以天为时间单位计算三级情感分类21 种情感类型的情感强度占比。绘制三级情感分类情感占比时序图如图2 所示、二级情感分类情感占比时序图如图3 所示和一级情感分类情感占比时序图如图4 所示。时间轴范围为7 月15 日至7 月30 日,该时间段为“假疫苗”事件热点时间段。

图2显示,三级情感分布中7月15日,“赞扬”最高占比51%,“恐惧”和“贬责”分别占比18%和15%,其他情感均匀分布,在7 月16 日至7 月20 日之间,各种情感占比波动巨大,“赞扬”快速下跌拉升、“贬责”极速上涨后回调,“憎恶”和“怀疑”在地位高振幅波动。7 月20 日后各种三级情感占比趋于稳定,时间序列折线平稳,“贬责”为主导情感维持在25%左右,“赞扬”在情感占比第二,维持在20%左右,“憎恶”在情感占比中位列第三,稳定在10%左右,一直持续到7 月28日,小幅波动后趋于稳定。

图3显示,二级情感的波动规律与三级情感相似,其中主导性情感是“恶”和“好”,七种二级情感在7月15日至7月18日进行力量博弈后,主要情感趋同于“恶”和“好”。7月19日开始“恶”情感占比基本稳定在45%,“好”情感占比稳定在33%,仅在7月22日有小幅的波动。

图4显示一级情感分类中的负向情感在7月15日当天即开始快速攀升,并于7月17日攀升至63%,并与负向情感折线发生了第一次交叉,其后负向情感在7月18日回落至49%,正向情感上升至51%,两种情感占比折线发生第二次交叉,正负情感讲过两次力量博弈后,负向情感占据上风,在7月20日,负向情感占比稳定在62%,正向情感占比稳定在38%,分别做小幅波动。

从不同情感层级占比的时序图来,事件情感随着事件的发展,各种情感与观点经过社交媒体的传播和讨论后,最终主流情感和其情感占比会趋于稳定。基于此认为情感传播存在趋同性现象,假设3被接受。

图2“假疫苗”事件三级情感分类情感占比时序图

图3“假疫苗”事件二级情感分类情感占比时序图

图4“假疫苗”事件一级情感分类情感占比时序图

6 结论讨论

社交媒体舆论事件中存在多元情感的波动,情感传播以一种弱传播的形态在微博二次传播的时候普遍存在。微博传播的两个主要渠道评论和转发中均存在情感相关性,但情感传递的关系是一种弱关系。情感成为一种唤醒、激发或扭转舆论热点事件的公众态度和评价的手段。对比评论,转发过程情感相关性系数更高,情感相似性特征更明显。信息转发的过程数据显示,微博本文情感强度和微博转发配文本情感强度相关系数,一级情感分类最大值负向情感(相关系数0.342),二级情感分类最大值“惧”(相关系数0.423),三级情感分类最大值“慌”(相关系数0.545)。显然更细粒度的情感观察,微博转发过程中情感相关性的特征更明显,因此识别出细粒度的主导性情感,对社交媒体舆论事件的描述、归因及预测有重要的意义。且基于相关系数的高低可以推论在同级别情感中“慌”“惧”和负向情感最容易传播。这一点在相关的文献中得到佐证:“恐惧”“悲情”“愤怒”是舆论事件中驱动群体动员的主要情感(汤景泰,2016)。“慌”和“惧”高频词识别,发现“可怕”“恐慌”“害怕”“有毒”“恐惧”“地狱”“发慌”“紧张”“人心惶惶”“紧急”是高频词。恐慌意味着安全感被剥夺。恐惧的情感一旦生成,人往往会停止其他心理活动,专注于引发恐惧情感的事物或事件并保持持续的注意力,直到恐惧消除(威廉·麦独孤,2010)。“惧”和“慌”的传播性是最强的,且个体恐慌很容易演变成群体恐慌,进而引发群体恐慌的雪崩效应,社交媒体舆论负面情感疏导应该对其特别关注。评论和转发的过程带动情感快速迭代,不同情感经过舆论场的短期高频交互后,情感意见会趋于一致,舆论得以生成。且情感分布一旦达到稳定状态,没有充足的外部条件刺激,情感改变很难发生。因此负向情感的疏导,重在一个“快”字,情感趋同前的介入与疏导尤其重要。

猜你喜欢

博文强度疫苗
第一次挣钱
抢购疫苗暴露全球不平等
我是疫苗,认识一下呗!
我是疫苗,认识一下呗!
谁和谁好
防患于未然的疫苗
计算电场强度常用的几种方法
电场强度叠加问题的求解
电场强度单个表达的比较
求电场强度的新方法お