基于Logistic-SEM的突发事件微博舆情传播影响机制研究
2021-09-07李金泽夏一雪张鹏等
李金泽 夏一雪 张鹏等
DOI:10.3969/j.issn.1008-0821.2021.09.012
[中图分类号]G206 [文献标识码]A [文章编号]1008-0821(2021)09-0115-12
1现状分析
随着移动互联网的普及,社交媒体对人们生活的影响日益加大,微博作为典型的社交媒体之一,具有开放、虚拟、互动以及便捷的特性,借助现代移动智能终端的便捷性,逐渐成为重要的突发事件网络舆情源生地和助推器。掌握突发事件微博舆情传播规律,对突发事件微博舆情的传播影响机制进行阶段化、精细化和深刻化的研究,可为政府治理突发事件以及引导微博舆情提供理论支持。
突发事件微博舆情作为一个交叉研究领域,两者的结合吸引了大量的传播学、社会学、数学和计算机学等多个学科学者的关注,目前,国内外学者针对突发事件微博舆情传播已经开展了较多研究,对这些研究成果进行共被引网络聚类分析,如图1所示,主要分为4个方面:①突发事件微博舆情传播模式和规律,包括:直线式、分裂式和矩阵式等微博传播模式,传播规律呈Logistic模型的‘S型曲线,符合信息生命周期理论等;②突发事件微博舆情的研究方法,包括:主题分析、情感分析和SNA等,分析微博用户对实发事件的情感态度,发现微博舆情主题演变规律;③突发事件微博舆情预警与监测方法,包括:构建微博舆情预警指标体系,基于突发事件危险等级划分监测顺序,通过微博舆情监测进行事件画像与高危人群预测等;④对于突发事件微博舆情政府的引导策略,包括:政府依靠官方微博账号进行新闻宣传工作,联合意见领袖引导民众观点,突发事件发生后及时进行事件真相的介绍与跟进等。综上而言,对于突发事件微博舆情方面,大多学者集中于整体的、静态的视角下进行研究,需要进一步开展对微博舆情传播阶段的精细化研究和影响机制的深刻化分析。基于此,本文将微博作为突发事件舆情数据的来源和环境,研究突发事件微博舆情的传播规律,基于Logistic模型对突发事件微博舆情传播进行精细化分段,结合建立的微博舆情传播因子指标体系,构建突发事件微博舆情影响机制模型,运用结构方程模型(SEM)研究各阶段因子指标对微博舆情传播的影响方向和程度,总结微博舆情阶段化的传播规律,为引导控制舆情传播提供方向,进而促进社会稳定。
2突发事件微博舆情传播阶段研究
2.1突发事件微博舆情传播规律研究
目前,学术界对于微博舆情传播阶段的研究,主要是基于信息生命周期理论。生命周期是生命科学的术语,其本义是指生物体从出生、成长、成熟、衰退到死亡的全部过程。目前,对于“信息生命”探讨中,普遍认为“信息生命”会像生物的生命一样最终走向消亡,即“信息生命”的终点便是信息消亡。微博舆情也有这样的特点,Logistic模型用来描述种群增长规律,种群的增长也经历了“形成期”“增长期”“稳定期”等时期,曲线大致呈‘S型,两者在机理层面具有一致性。本文为了研究的客观性,根据突发事件的4种类型:自然灾害类、事故灾难类、公共卫生事件类和社会安全事件类,在每个类型中选择两个事件进行数据累加,共选取8个突发事件。基于百度指数对8个突发事件的微博舆情数据进行获取,画出微博舆情数据的累加曲线图,如表1所示。
如表1所示,突发事件微博舆情传播趋势则呈“近似S型”,符合Logisitic模型的表面曲线特征,说明Logisitic模型可以研究微博舆情的传播规律。基于此,本文选用λ-Logistic模型,假设y为舆情信息量,时间为x,r为单位时间内舆情信息值的增长率,由于受到网络环境和政府机构的限制,不可能无限制的增长,随着舆情信息量地增长,增长率就在下降,r则应是y的减函数,当Δx→0时,其微分表达式为:
3突发事件微博舆情传播影响机制模型研究
由于微博舆情具有动态性、衍生性和多维性等特点,突发事件微博舆情传播影响因子较为复杂,为了深入探究突发事件微博舆情传播影响机制,掌握微博舆情传播趋势规律,需要进行微博舆情传播因子假设,建立影响因子和效果因子的指标体系,进而基于SEM构建突发事件微博舆情传播影响机制模型,为实证分析打下理论基础。
3.1微博舆情传播因子假设
3.1.1影响因子假设
本文要对突发事件微博舆情传播的影响因子进行假设,目前而言,国内学者对微博舆情传播影响因子的研究主要集中于以下4个方面:①从信源特征和信息形式视角出发,分析粉丝数、微博数、关注数对微博舆情的传播起到中介作用;②利用多分类Logistic回归,探究用户特征、时间指标和环境因素这3个层面对微博舆情传播的作用方向和作用程度;③基于ELM模型研究信息內容(陈述型、策略型和情感型)和信息特征(引证标识和补充线索)对微博舆情传播的影响;④基于结构方程模型,从用户感知、偏好和涉入3个方面研究影响微博舆情传播意愿的因素。
通过研究以往突发事件微博舆情的传播规律,针对微博用户整合出了传播用户(X1)、博文内容(X2)、文本特征(X3)这3个层面和11个突发事件微博舆情影响因子,构建了影响突发事件微博舆情传播的指标体系,如表2所示。
由于微博舆情传播主要是通过微博用户为信息主体,在网上对突发事件进行转述和评价,加速了事件在微博中的传播,所以要基于微博用户的行为特征来研究。本文总结出“传播用户”“博文内容”“文本特征”3个维度,从中提炼突发事件微博舆情传播的影响因子,用于微博舆情影响机制的分析。
传播用户(X1)是发布微博的主体,传播用户这方面的影响因子,包括粉丝数(a1)、关注数(a2)、微博数(a3),这些因子影响该主体在发出微博后其他用户的反应程度,经调查发现,粉丝数(a1)越多证明关注他的人越多,能让更多的用户看到发表的内容;关注数(a2)越高证明接触的领域更广,传播的范围更大;微博数(a3)越高说明平时发文频率更高,发文质量相对较高,使事件更容易曝光。
博文内容(X2)是微博用户的发文详情,博文内容的差异将引发不同的关注和转发。在研究相关文献以及长期微博舆情监测的基础上,得出发文内容这方面的影响因子,包括真实性(a4)、新奇性(a5)、内容性(a6)、倾向性(a7)、敏感性(a8)。真实性(a4)、新奇性(a5)、倾向性(a7)往往会对该条微博的传播量和传播速度有很大的影响,而且微博舆情的内容性(a6)分为事件的识别信息、处理信息和反应态度,是对突发事件进行基础描述,对事件的处理措施以及后续当事人的反应态度,往往后两个能引起人们的兴趣,且传播速度更快。敏感性(a8)则是指微博用户经常对一些明星绯闻、政府公务人员工作方面的冲突或者社会上的一些尖锐问题极其敏感,引起众多围观者,进而促进舆情的传播。
文本特征(X3)是微博内容最直观的呈现。所以这部分的因子显得尤为重要。文本特征的影响因子,包括直观性(a9)、话题性(a10)、博文长度(a11)。直观性(a9)是指发文内容有无视频、图片,这些都是补充信息的一种形式,使读者有更直观的体验,感受事件发生经过,因此可能会影响微博的转发和传播。话题性(a10)是对于发文内容中含@标识和话题等,可能会影响到微博信息的转发。博文长度(a11)是指发文内容的字数,一般情况下,内容越多,事情交代得越清楚,读者更容易理解。
3.1.2效果因子假设
本文假设了4个微博舆情传播的效果因子,如表3所示,分别是:评论量(b1)、点赞量(b2)、转发量(b3)、持续时间(b4)。这4个指标用来衡量突发事件微博舆情的传播趋势,通过这4个指标可以以数据的形式观察在影响因子的作用下信息流量的变化。
3.2突发事件微博舆情传播影响机制模型构建
本文基于结构方程模型(SEM)构建突发事件微博舆情传播影响机制模型,对突发事件微博舆情的传播因子进行测量和验证,通过“路径分析”和“验证性分析”,对影响微博舆情传播各阶段的因子进行验证性研究,估计因子结构和因子关系,根据模型的因子权重提取各阶段的关键因子,进而把握微博舆情的传播路径和影响机制。结构方程模型是由测量模型和结构模型两个基本模型构成。测量模型是观测变量的线性函数,结构模型是潜变量间的因果关系模型,即本文将作为因的外因潜变量设为X、作为果的内因潜变量设为y,外因观测变量设为a,内因观测变量设为b,ε与δ皆为残差或干扰因素。本文采用常用的结构方程模型公式,以下公式作为模型研究基础。
首先,测量模型的回归方程式(4)表示为:
最终将测量模型的矩阵方程式(5)表示为:
a=ΛaX+δ (5)
同样地,将微博舆情传播作为内因潜变量,微博舆情的效果因子作为其观测变量的正向反馈,两者的回归方程式(6)表示为:
b=ΛbY=ε (6)
其中,ε与X、Y及δ无关,δ与X、Y及ε也无关。Aa与Ab为观测变量(a、b)的因素负荷量,而δ、ε为外显变量的测量误差。
将上文假设的影响因子和效果因子指标代入方程式(4)和(5)中,构建突发事件微博舆情传播影响机制模型,在测量模型中,信息流量(Y)是内因潜变量,并通过4个效果因子(b1~b4)作为观测变量进行测量,如表3所示;而传播用户(X1)、博文内容(X2)和文本特征(X3)为外因潜变量,由a1~a11进行测量,如表2所示。最终利用Mplus软件绘制突发事件微博舆情传播影响机制模型图,如图2所示,在结构模型中,传播用户(X1)、博文内容(X2)和文本特征(X3)三者之间相互影响,共同作用于信息流量(Y)的变化。
4实证分析
4.1案例来源
2017年11月22日,有家长反映北京朝阳区管庄红黄蓝幼儿园(新天地分园)的幼儿遭遇老师扎针、喂不明白色药片等情况并报警处理。事件曝光后经网络迅速传播,其中谣传更有军队人员参与虐童事件。相关舆情量在11月24日达到最高峰,在11月29日出现次高峰,截至12月1日事件舆论区域平息,图3为该事件发生前后微博平台中点赞、转发和评论信息的统计数据。本研究以新浪微博为研究对象,采用Python爬虫的搜集方法对“红黄蓝事件”进行数据采集,检索时间筛选为2017年11月21日—12月3日,采集共获得原创微博703条,其中评论量有89.9万,点赞量162.5万,转发量有17.8万,总计共有270.2万,部分数据采集结果如图4所示。
4.2红黄蓝事件微博舆情传播阶段划分
根据上文爬取的红黄蓝事件实际数据,本文将点赞量、评论量和转发量三者叠加值作为微博舆情信息量,代入λ-Logistic模型,仿真出微博舆情传播的5个阶段,拟合出红黄蓝事件微博舆情传播趋势,得到各参数值的最优解为:y=2727500,r=1.4221,λ=5.8876。由此得到其微分方程为:
将式(7)中的各个参数值带入P、P1、P2、P3、P4中,则计算出各个横坐标的节点为:
x1=0.1651,x2=1.5571,x3=6.2074,x4=7.9296,xm=3.8823(增速最大点)
则红黄蓝事件的第一阶段为萌芽期[0,0.1651],第二阶段为潜伏期[0.1651,1.5571],第三阶段为爆发期[1.5571,6.2074],第四阶段为缓解期[6.2074,7.9296],第五阶段为饱和期[7.9296,+∞],由图5所示微博舆情传播将经历这几个阶段最终达到饱和。
4.3红黄蓝事件微博舆情传播影响机制模型分析
4.3.1数据预处理
首先,要获取模型的15个因子的基础数据:①通过Python构建细粒度情感分析的程序,将发文内容输入,得出各条微博的倾向性;②通过Py-thon爬蟲直接获取微博的转发量、点赞量、评论量、发文内容、照片、视频、话题和各用户的粉丝数、关注数、微博数等数据。
其次,为了得到能在结构方程模型中直接应用和运算的有效数据,本文使用德尔菲法,对红黄蓝事件的15个因子的初始数据进行二次处理。结合突发事件的发展特征和模型运行特点,将模型中15个因子的数值转化为1~5分,分为5个等级。
最后,基于前面的精细化分段,将上述处理好的数据分成5部分,在对整体数据进行信度检验和验证性分析后,再分段提取影响较大的指标。
4.3.2信度检验
模型的合理性需要进行信度检验,一般用α系数(即Cronbach a系数)来衡量数据信度的大小,α系数越大,数据信度越高,α系数大于0.7作为数据信度是否可接受的分界线,将红黄蓝事件的数据进行信度检验后,分析结果如表4所示,变量依次都大于0.7,能够说明数据具有较好的可靠性,红黄蓝事件微博舆情传播影响机制模型的信度检验可以通过。
4.3.3验证性分析与调整
本文利用验证性因子分析(Confirmatory Factor Analysis,CFA)来检验红黄蓝事件微博舆情传播影响机制模型收敛效度。在验证性因子分析中,效度水平可以由模型的拟合指数和标准化因子载荷系数来检验。评估收敛效度的标准共有3项:①所有标准化的因子荷载(Standard Regression Weights)要大于0.5,且達到显著水平;②组合信度(CR)要大于0.6;③平均变异抽取量(AVE)要大于0.5。
第一次验证性因子分析检验的结果如表5所示,持续时间(b4)的标准化载荷值小于0.5,因此将该项删除之后进行第二次验证性因子分析。
删除b4之后进行第二次验证性分析结果,如表6所示,根据载荷值计算得出4个部分的CR在0.812~0.948之间,均大于0.6的标准,AVE在0.586~0.858之间,均大于最低标准0.5,证明红黄蓝事件微博舆情传播影响机制模型收敛效度符合标准。
4.3.4红黄蓝事件微博舆情传播阶段化分析
本文采用MPLUS进行红黄蓝事件微博舆情传播影响机制模型的路径分析,表7为模型的拟合结果,与结构方程模型的标准值相比,拟合指标均符合标准,说明模型拟合度高,适合分析。
对模型进行整体的信效度分析和验证性因子分析后,如图6所示,这是整个红黄蓝事件微博舆情传播过程中,传播用户(X1)、博文内容(X2)、文本特征(X3)对信息流量(Y)的影响路径权重和各观测变量的载荷值。结果表明:传播用户(X1)对信息流量(Y)有显著正向影响(β=0.235,p=0.000<0.001),博文内容(X2)对信息流量(y)有显著正向影响(β=0.245,p=0.000<0.001),文本特征(X3)对信息流量(Y)有显著正向影响(β=0.115,p=0.020<0.05)。
将前面阶段化后的数据分别带入模型进行分析,得到其结构模型的阶段化路径系数和测量模型的阶段化载荷值,如表8、表9所示。
根据表8和表9,将红黄蓝事件各阶段载荷值大于0.85的因子指标提取出来,作为红黄蓝事件各阶段的重要影响因子进行分析(有*的指标为各阶段新出现的重要影响因子):
1)在萌芽期,红黄蓝事件刚刚发生,网上舆情信息苗头初起,微博舆情信息量增量最小,微博用户关注度低。如表10所示,结合红黄蓝事件分析得,事件中微博内容“新奇性”越高,微博用户越感兴趣,这条微博被转发、评论、点赞的次数就会越多,进而形成热点话题;事件中微博的“话题性”越强,形成转发的概率越高,事件初期的话题热度持续升温,人们是比较关注这一事件发展的走向的,带有话题的博文会更引起人们的注意,增加了转发的可能性;在红黄蓝事件微博舆情传播过程中有些微博含有照片、视频等,其“直观性”较强,起到补充说明的作用,用户容易理解,促进微博转发。
2)在潜伏期,红黄蓝事件继续发酵,微博舆情信息量增量变大,微博用户关注度提升。如表11所示,意见领袖出现,“粉丝数”和“微博数”高的微博用户,其活跃粉丝的比例也相对较高,信息向外扩散的可能性更大,相比普通用户,更容易促成高转发量,说明此时“传播用户”的特征对突发事件的传播有很大的影响,人们更喜欢通过官博、大V等“公众人物”来得到关于突发事件的发展进程。比如在红黄蓝事件前期,由于章子怡和黄晓明的发声,导致其粉丝持续关注该事件,强烈要求查明真相,惩治相关责任人员。
3)在爆发期,红黄蓝事件的微博舆情信息量在短时间内快速增加,微博用户关注度最高,网络舆情热度最高,同时事件相关的大量小道消息、猜测信息等相互碰撞,极易出现网络流言。如表12所示,原创的博文内容中“真实性”和“倾向性”往往会结合在一起,影响红黄蓝事件微博舆情的传播,此时伴随着极端正向或者负向情感的微博,都容易被用户广泛传播,比如:一个名为“初心5566666666”的微博用户传播谣言,以极其愤怒的情绪将事件的责任推给“老虎团”,导致网民消极情绪上升,在微博中对“老虎团”的谴责也到达顶峰:对于微博的“内容性”,此时微博用户不满足对于事件进程的基本描述,更喜欢看到事件的处理办法和名人对这个事件的评价,比如在事件爆发后的几天内.由于警方迟迟没有公布监控录像,导致微博上有些明星开始对警察进行攻击,发表极端的观点,这种微博在爆发期传播的速度最快。
4)在缓解期,红黄蓝事件的原因调查、事件处理和信息公开等工作已经接近尾声,如表13所示,与爆发期相比,事件的“粉丝数”“微博数”“新奇性”和“话题性”在这个阶段影响力度不大,舆情热度开始降低。但是由于衍生舆情的出现,舆情的传播趋势出现第二个“S”型,比如在2017年11月29日,红黄蓝幼儿园发声道歉,同时北京警方公布了红黄蓝幼儿园涉嫌伤害儿童事件调查情况,导致又一波针对该事件的讨论开始,舆情热度再次升高,各阶段的“真实性”“内容性”和“倾向性”对于微博舆情的影响强度和爆发期一致,促进舆情传播的又一高潮。
5)根据上文中的表9,在饱和期,没有重要影响因子需要提取,红黄蓝事件处理完毕,没有出现像缓解期的衍生舆情,微博用户不再关注这一事件,各指标对“信息流量”的影响都不大。
5结语
为了研究突发事件微博舆情的传播规律,精细化、深刻化地分析各个阶段中突发事件微博舆情传播影响机制,帮助政府引导舆情传播趋势,治理微博舆情生态,本文基于Logisitic-SEM构建突发事件微博舆情传播影响机制模型,利用Python爬取的“红黄蓝事件”实际数据,对突发事件微博舆情传播的各个阶段进行划分,并假设检验影响突发事件微博舆情传播各阶段的各个因子指标,分析“传播用户”“博文内容”和“文本特征”在各阶段对“信息流量”的影响方向和程度。根据上文实证分析得出相应的应对策略,在萌芽期,由于微博平台每天产生大量的舆情信息,政府和公安机关要时时进行舆情监测,针对特定的、新奇性高的话题重点关注,防止其扩大成为热点,难以控制;在潜伏期,政府和公安机关要关注大V这种影响力高的微博用户,尊重并引导其报道真实权威信息,发挥意见领袖的积极作用,加强对舆情走势引导;在爆发期,政府和公安机关要及时发现情绪极端化的用户以及发布的谣言,针对谣言进行集中澄清和阶段性的舆情疏导,对于热点问题,政府要利用官博揭示事实,表明自身态度,制定处理措施;在缓解期,舆情事件的热度逐渐下降,但政府和公安机关不能放松警惕,要持续高强度的网络舆情监测,防止衍生舆情的出现,造成社会损失的扩大;在饱和期,政府和公安机关针对舆情事件,总结舆情传播规律,补充相应预案,增加有效措施。本文由于数据有限,有些因子指标未能准确量化,未来将通过完善和调整因子指标体系、不断优化和更新案例库来提高突发事件微博舆情传播影响机制模型的准确性。