突发事件舆情演化与治理研究*
——基于拓展多意见竞争演化模型
2022-01-20庄文英许英姿任俊玲王兴芬
庄文英 许英姿 任俊玲 王兴芬
(北京信息科技大学 信息管理学院 北京 100192)
0 引 言
任何风险都是在一定条件下产生和发展起来的,其存在及演化有其内在的逻辑与特征,知其然更需知其所以然,掌握风险尤其是突发事件风险的演化规律与特征对于风险预警与治理具有重要意义。突发事件的风险治理是一项复杂的系统工程,其中既涉及理念层面的方向性决策、制度层面的体系建构,又涉及治理模式的设计与治理方法的优化,还需充分考虑关键风险因子的有效疏解,而网络舆情作为以突发事件为触点的社会风险构成因子之一,对于突发事件的发展态势往往具有极大地影响。《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》提出,加强和创新市域社会治理,推进市域社会治理现代化。其中,提升舆论引导能力,要求“健全重大舆情和突发事件舆论引导机制,建立健全网络综合治理体系”。因此,在突发事件风险治理过程中,结合信息时代特征,厘清网络舆情演化的规律和传播特点,以更有效地应对突发事件,并建立与之契合的导控模式进行舆情风险监测和处理,从而减少突发事件舆情所带来的风险压力和损失,对于社会治理现代化体系的构建具有重要的管理意义。
中国互联网络信息中心发布的第47次统计报告指出,截至2020年12月,我国网民规模达9.89亿,互联网普及率达70.4%[1]。网络的普及与信息技术与多样化发展,微信、微博、微视频等新媒体手段的实时互动取代了传统载体,促使社会舆论迈向“多中心”时代,极大的便利了人与人之间的沟通交流,个体间的意见交换愈加密切和频繁,突发事件的舆情传播也有了全新的传播模式与特征。同时,随着参与主体的增加,信息的交互影响大幅增加,其社会影响力也将以几何级增长,引发蝴蝶效应。近年来,突发事件的发生往往能在网络上引起广大网民的热议,各种意见相互碰撞,增加了突发事件风险的同时,信息的传递与演化也越来越复杂,使得突发事件舆情治理的复杂性和难度也随之提升。
因此,以突发事件舆情竞争演化特征为出发点,本研究构建了多主体参与的网络舆情多意见竞争演化模型,并以LDA划分意见群体,形成拓展的SEInR模型。实证方面,因大宗商品交易市场具有交易额大、供需量大、价格波动大等特征,该领域突发事件容易引发系统风险,对于市场稳定具有重要的影响,因此本研究结合系统动力学理论,以大宗商品交易市场突发事件为例开展模型仿真与策略研究,从平台管控、媒体引导与监管干预三个角度探究导控与治理策略,具有一定的实践意义。
1 相关研究
社交媒体时代信息传播速度越来越快,呈现出多元化、多中心化特征,人们正处于一个由多元媒体构建起来繁杂的社会网络之中,突发事件舆情的演化发展对于应急决策具有重要的影响。通过对国内外文献的统计分析表明,自2010年社交网络用户行为成为研究热点[2],自2015年该领域的关键词开始以“舆情分析”为主[3],研究重点主要集中在舆情演化规律与过程的研究,常用方法包括多主体博弈分析[4]、系统动力学[5]和传染病模型(SIR)等。近年来,随着大数据与人工智能的发展,舆情演化定量研究逐渐深入,机器学习、文本挖掘、事理图谱等新兴技术逐渐应用于舆情传播领域,王晰巍等[6]学者通过对国内外社交媒体环境下的网络舆情研究动态与趋势分析得出大数据分析方法将成为此领域未来的主要研究趋势之一;田依林等[7]研究者将事理图谱应用于新冠肺炎网络舆情的演化路径分析;Tan X等[8]将BERT-LDA文本分析技术应用于大型网络舆情演化研究。
传染病模型研究领域,在传统SIR基础上,研究者们结合传播特征、管理情景与管理实践,探索了不同类型的拓展演化模型:考虑动态性的SIR-I动态传播模型[9],考虑潜伏态(Exposed)的SEIR模型[10],考虑信息派生性及传播规则的S-SEIR传播模型[11],考虑干预机制的SSIC超网络谣言传播模型[12],考虑中介变量影响的SIS模型[13],与灰色预测相结合的SIR-EGM模型[14],考虑多意见交互的SInR模型[15],考虑导控措施的SInQR模型[16]。
在多意见竞争性研究方面,多从个体特征与群体间在社交网络内的交互出发研究舆情的演化,Fang等[17]研究了个体特征与互动对意见竞争演化的研究。顾秋阳等[18]构建了融入用户群体行为的舆情传播动态演化模型研究;GAO等[19]基于符号网络探究了舆情的动态演化;苏妍嫄等[20]从演化动力学出发,探究公众风险感知交叉演变机制;Dong等[21]从图论的角度,研究合作竞争网络上意见的竞争演变。
但是,当前国内外现有针对突发事件舆情的研究多是基于一元或二元(谣言/辟谣、同意/反对等)意见演化构建模型,对多意见的划分多为人工处理,由于舆情文本具有信息破碎、口语化严重等特点,当突发事件引起群体广泛关注时,人工处理具有明显局限性;其次,针对突发事件舆情治理,部分研究[22-23]的情绪治理措施仍处于探讨阶段,未对相关措施进行具体的定量分析。鉴于此,本研究基于SEIR模型,考虑多意见竞争演化和舆情传播特征,构建拓展的SEInR多意见竞争演化模型,其中多意见的划分采用潜在狄利克雷分布 (Latent Dirichlet Allocation,LDA,即文档主题生成模型)[24]。并结合Python编程采集大宗领域中行原油宝事件相关舆情数据,开展量化与仿真研究,进而结合灵敏度分析开展治理措施研究。
2 突发事件舆情多意见竞争演化模型
针对突发事件的舆情演化特征,考虑个体接收信息至意见表达期间的时滞性,研究者构建了SEIR模型,以刻画传播的裂变性[25]。本研究在传统SEIR模型基础上,增加了从易感人群到各意见群体的转移过程以及意见群体之间的竞争交互,以使其更符合舆情的传播实际。
2.1演化模型假设结合网络舆情演化特征与传播动力学原理,舆情演化系统基于如下两个假设条件构建:
假设1:演化系统为相对封闭的动态系统。即不考虑系统人员的新增和移出,系统内各状态人群依据舆情传播规律进行转化,设网民总数为N,S(t)、E(t)、I(t)、E(t)、分别为t时刻易感者、潜伏者、感染者和免疫者的人群基数,则有N=S(t)+E(t)+I(t)+R(t)。
假设2:舆情演化具有单向性。互联网时代,碎片化信息层出不穷,网络信息具有明显的时效性,网民更容易被新鲜的热点或话题所吸引而转移关注点,故而默认舆情演化是单向的,即不存在态度反复。
2.2演化模型建立
2.2.1 传统SEIR模型 SEIR模型认为易感者在经历一段时间的潜伏期酝酿才会以一定概率被情绪感染同化并转化为感染者[25]。经典的SEIR模型动态微分方程组可表示如下:
(1)
其中,α表示易感者接收信息的概率;η表示潜伏者被感染的概率;μ表示感染者的免疫概率。模型示意图如图1所示,展示四种群体之间的转化。
图1 舆情演化SEIR模型示意图
2.2.2 拓展的SEInR多意见竞争演化模型 本文结合突发事件舆情演化机理及意见竞争机制,对已有SEIR传播模型做出如下拓展:
其一,根据舆情的长尾效应[26],舆情演化的高潮往往发生在突发事件爆发初期,一定规模的网民在事件发生后有极强意愿在网络上诉说自身对事件的观点、态度或情绪,因此对这部分网民来说,其潜伏期较短,可以忽略不计,易感者直接被感染为感染者,故相较于已有研究,新增一条转化路径S→I;
其二,部分网民并非突发事件相关者或是对该突发事件不感兴趣,这部分网民将选择不浏览或浏览到突发事件舆情时也并不会对突发事件有过多的关注,不会因此发声,故其未出现意见感染,即直接转化为免疫者,因此新增两条转化路径S→R和E→R;
其三,在完全虚拟的网络情境下,网络舆情生成的初始条件不明朗、不确定,网民针对突发事件能够公开、自由地表达、转发,使得网络成为不同意见表达的集散地,各种论调层出不穷,多元声音呈现出碎片化状态。各种意见此消彼长,相互影响、相互竞争、相互改变,在舆情演化过程中形成具有非线性和不规则特征的混沌现象[27]。因此,感染人群中存在多种意见相互竞争的现象,体现了不同意见人群间相互影响、相互竞争、相互转化的关系,因此,本研究首先可通过LDA分析将感染者依据情感表达或关注的话题划分为多意见感染群体In,并增加了各个意见群体之间的交互,从而更为符合舆情的传播实际。
综上所述,构建SEInR多意见竞争演化模型示意图如图2所示。
图2 SEInR多意见竞争演化示意图
其中,n代表感染者所持的情感或关注的话题总数,同一类情感或话题划分为一种意见群体,如:实际情况下,若情感分为积极、中性和消极三种,则共有三种意见群体;参数γi表示易感者直接感染为意见群体i的概率;ηi表示潜伏者被感染为意见群体i的概率;μi表示意见群体i的免疫概率;ρij表示意见群体i受意见群体j的影响系数;β表示潜伏者的直接免疫概率。考虑舆情演化机理与意见竞争机制的SEInR多意见竞争演化模型的动态微分方程组表示如公式(2):
系统守恒约束:
N=S(t)+E(t)+I1(t)+…+Ii(t)+…+In(t)+R(t) (i=1,2,…,n)
(2)
2.2.3 基于LDA的意见群体划分 为更精准地划分意见群体,降低主观因素影响,本研究采用LDA模型,对微博评论开展主题词分析,区分多意见群体。LDA是一个基于概率图的、包含词、主题和文档三层结构的贝叶斯主题概率生成模型[29],可用于识别大规模文档集或语料库中潜藏的主题信息(见图 3)。
图3 LDA模型变量关系及文档生成过程图
其中,阴影节点为可观测变量,其他节点为潜在变量或参数,箭头表示变量或参数间的依赖关系。假定语料库中共包含N个词、K个主题和T篇文档,文档集T={t1,t2,…,tT},βk表示主题k包含每个主题词的比例;θt表示文档t包含每个主题的比例;α和η分别是主题分布θt和主题词分布βk的狄利克雷分布超参数;wt,n和zt,n表示文档t中主题词n及其所属主题。具体提取过程表述如下:从狄利克雷分布α中随机采样生成文档t的主题分布θt,从狄利克雷分布η中随机采样生成主题k的主题词分布βk,根据θt生成文档t中主题词n的主题zt,n,根据文档指定主题zt,n及其对应的主题词分布βk采样生成主题词wt,n。通过LDA对意见群体按照上述过程进行划分,最终生成指定主题数K个意见群体。
3 基于拓展SEInR的突发事件舆情风险分析
在复杂多变的宏观市场环境中,企业风控管理显得尤为重要,尤其对于大宗商品交易属于资金密集型行业,且受市场价格波动影响大,其风险管控更是重中之重。为更好地验证模型的适应性,本研究以中行原油宝事件为例,进行模型仿真与舆情风险分析。
3.1中行“原油宝”事件梳理北京时间2020年4月21日凌晨2:30,芝加哥商品交易所(简称芝商所)WTI原油期货5月合约收报-37.63美元/桶,历史首次收于负值, “原油宝”作为一款由中国银行做市商,挂钩境外WTI原油期货合约的交易产品,出现严重穿仓[30]。上千持多单且未平仓的投资者在亏完本金和保证金的同时,还需承担所有穿仓损失,因此引发舆情风险。4月22日中行发布两则公告:一则声明了芝商所官方结算价-37.63美元/桶为有效价格,将按该价格进行移仓或到期轧差处理,另一则强调将依据原油宝5月合约规定处理。当日,该事件在全网引发广泛关注,在新浪财经关于“谁应该为中行原油宝穿仓埋单”的微博投票中,约2.9万人选择“中国银行”,约占总投票人数的68%,由此,“中行原油宝”事件成为网民热议的突发事件,该事件关键时间节点梳理如图4所示(注:本文涉及时间若无特别说明,均为北京时间)。
图4 “中行原油宝”事件时间演化主线
3.2基于系统动力学的原油宝事件分析为更好地剖析该事件各因素之间的影响,以更好地刻画其传播特征,为后续研究奠定基础,本研究首先基于系统动力学理论构建了“中行原油宝”事件因果关系图,如图5所示。总的来说,原油市场供需失衡、运输与存储难度大、交割成本高及“负价格机制”的通过,外加空头对多头的狙杀,多种因素的叠加导致芝商所WTI原油期货结算价跌至负数。而中行及“原油宝”产品在实际操作和产品设计中存在一定的缺陷[31],最终造成了“原油宝”产品穿仓。
图5 基于系统动力学的“中行原油宝”事件因果关系图
3.3原油宝事件仿真与分析“中行原油宝”事件发生后,相关话题持续发酵,引起网民们热议。本研究首先以“原油宝”和“油价”为关键词,在新浪微博平台,通过Python软件自编程序采集了4月20日至5月31日舆情数据,主要字段包括用户名、微博内容和发布时间等,其中关键词“原油宝”微博数82 889条,关键词“油价”微博数75 309条,采集数据样本共计158 198条。
数据预处理方面,考虑到同一用户同一天内发表多条微博的情况,将同一用户当天发表的最后一条微博作为该用户当天的代表意见,以此划分用户群体;对于只转发微博,但不包含任何意见的文本,判定为无效数据剔除。在对所有数据进行按天去重、去广告和去无效等预处理后,余下共96 782条微博作为有效数据样本,合计55 416名用户。
3.3.1 模型节点描述及参数含义 长久以来,“油价”一直是国内外关注的热点话题,负油价是“原油宝”事件的起因,网民对“油价”的讨论符合SEInR模型中潜伏者E的定义。因此,本文采用SEInR多意见竞争演化模型对“中行原油宝”事件进行仿真演化分析。各节点状态具体描述如下:
易感者S:尚未浏览油价或原油宝事件相关微博的用户;
潜伏者E:已浏览相关微博,且仅针对“油价”发布微博进行讨论的用户;
多意见感染者In:针对“原油宝”事件在微博上明确表态的用户(基于LDA对关注话题进行细分);
免疫者R:了解相关事件,但无兴趣传播的用户,或失去兴趣不再讨论的用户。
具体参数含义及说明如表1所示。
表1 参数含义及说明
3.3.2 LDA意见划分与SEInR仿真分析 根据对事件时间线的梳理和对微博原始文本的初步观察,可以看出,总体上网民的热议主题分为以下两点:事件发生初期,多数网民认为中行应对“原油宝”穿仓事件负主要责任;随着银保监会的发声和中行态度的软化,网民更青睐进行理性的分析,并期望该事件能依据相关法律法规得到妥善的解决。为更简明清晰地对网民意见转变进行仿真分析,本研究基于SEInR模型,采用LDA生成并划分了所有关键词为“原油宝”的主题,不同主题的前15个主题词如表2所示。
两大主题分别对应两种意见群体的意见,意见群体1聚焦“原油宝”产品穿仓事件本身,意见群体2则更为关注相关部门和法律层面上对“原油宝”事件的后续解决。
基于微博舆情数据梳理与主题划分,可形成“原油宝”事件实际演化趋势如图6(a)所示。
同时,基于LDA主题划分以SEI2R模型仿真,结合该事件数据特征,将初始参数设置如下:
E(0)=1761,I1(0)=11,I2(0)=1,R(0)=0,S(0)=N-E(0)-I1(0)-I2(0)-R(0)=53643,α=0.01,γ1=0.01,γ2=0.005,φ=0.001,η1=0.0003,η2=0.0001,β=0.0001,μ1=μ2=0.2,ρ12=ρ21=0.1.
以Python语言进行模型仿真分析可得演化比例趋势如图6(b)所示,对照可知与实际微博意见演化趋势基本一致。
由图6(a)可以看出,总的来说,“原油宝”事件舆情演化呈现“尖峰长尾”现象,4月21日芝商所油价收于负值的当日,关注“油价”话题的潜伏态人数达到峰值。“原油宝”事件发生后,意见群体1(关注事件本身的群体)占据主导地位,并于4月23日达到峰值,之后总体呈下降趋势;其中,4月27日(第8天)潜伏者E实际人数相较于前一天有所增加,是由于当日欧佩克公布全球原油储存空间将在2~3个月内用尽,再次引发网民对“油价”的担忧。后续随着事件发展,部分网民转向意见群体2,关注事件后续解决进展的人群逐渐占据多数,此后网民逐渐降低对事件的关注,转为免疫人群。
图6 “原油宝”事件舆情演化趋势仿真
由图6(b)可知,本研究演化模型与实际演化趋势相对比,总体演化趋势一致,各类人群峰值出现时间相当,一定程度上仿真了“原油宝”事件的舆情演化趋势。
潜伏态分析:在油价跌至负数后,易感者S比例迅速下降,潜伏者E比例激增并达到顶峰,表明在实际舆情演化过程中,易感者S和潜伏者E的演化大都发生于舆情前期,对两类群体的引导和干预应主要作用于舆情演化的初期。
意见转化分析:“原油宝”事件发生后,大多数潜伏者E首先转为感染者I1,网络舆情迅速发酵,并于第4天达到顶峰,之后转化为感染者I2和免疫者R。感染者I2增长速度和人群基数最小,约在第6天增长至顶峰后缓慢下降。感染者I的变化反映了舆情的热度变化,正确地对感染者进行引导能快速降低事件的影响程度和范围。
免疫态分析:微博信息具有碎片化、信息交互频繁、热点更新迭代快等特征,实际舆情演化中,随着突发事件舆情的消退,绝大多数网民最终都会转变为免疫者R,这与模型的仿真结果吻合。免疫者R在演化全过程中,一直处于增加状态,最终趋于平稳。在舆情演化前期,免疫者R主要由易感者S、潜伏者E、感染者I转变而来;而在舆情演化后期,则主要来源于各类意见群体I的转化。因此,在舆情演化中后期,应更多地关注感染者I和免疫者R,提升信息透明度和政策引导力度,从而加速感染者I向免疫者R的转化。
4 基于SEInR模型的舆情管控与仿真研究
4.1平台管控微博、微信等社交平台拥有庞大的用户群体,各类意见层出不穷,不实或极端言论容易在微博上引起轩然大波。平台通过限制分享、禁言、限流、严格内容审核条件等措施能一定程度上缩小负面舆情影响范围,促进易感者S直接向免疫者R(S→R)转化。考虑平台管控措施的影响,即改变直接免疫系数,设置参数φ=10,其余参数不变,仿真结果如图7所示。
图7 平台管控下舆情仿真结果
对照可得在舆情传播初期,随着微博等平台的介入,免疫者R增长速度加快,且潜伏者E和感染者I的峰值略有降低,但并不能明显缩短突发事件舆情的持续时间。即单方面的平台管控作用效果有限,需配合其他的引导和干预措施。
4.2媒体引导舆情传播初期,公众很难依靠个人能力判断信息的准确性,主流媒体与意见领袖的影响极大。因此在舆情传播初期,更需要权威的声音。在现代化社交媒体尤其是微博中,具有意见领袖特征的大V们拥有大量粉丝,其微博曝光性强、能被大量阅读与转发,在网络舆情传播中具有至关重要的枢纽作用。此外,主流媒体、管理机构官方号因其公信力对于舆情走向具有较大影响。已有研究表明,意见领袖在信息传播中不仅能起到扩散信息的作用,还能通过自身情绪化表达引发受众的愤怒、悲伤等情绪,引起意见群体的相互转化,从而左右网络舆情发展[32]。其作用主要体现在促进或抑制易感者S向潜伏者E(S→E)、易感者S向感染者I(S→I)、潜伏者E向感染者I(E→I)、意见群体间(I1→I2或I2→I1)相互转化。
考虑媒体的引导,将仿真实验分为两组,第一组仿真意见群体1被抑制情形,即影响参数α=0.001、γ1=0.001、η1=0.00003、ρ12=1和ρ21=0.01;第二组仿真意见群体2被抑制的情形,即影响参数为α=0.001、γ2=0.0005、η2=0.00001、ρ12=0.01和ρ21=1。仿真结果如图8所示。
图8 媒体引导下舆情仿真结果
从结果对照可以看出,媒体引导能在一定程度下左右网民持有的意见,使某一意见群体处于绝对的优势,从而抑制另一意见群体基数的增长。因此,当媒体进行积极引导时,其能在一定程度上降低舆情演化热度,减少事件的负面影响。但也正是由于主流媒体的介入,加强了事件的曝光度,媒体引导可能会略微延长总体舆情演化时间。
根据这一规律,在现实生活中,主流媒体或意见领袖通过发表正能量的评论,适当的发声、正确地进行引导,能引领突发事件舆情向积极的方向发展,从而降低其风险。
4.3监管干预当舆情对社会产生一定影响,监管层面需采取一定的措施提高舆情透明度、引导舆情走向,对舆情的发展起到一定的削弱作用。监管干预作用主要体现在促进潜伏者E、感染者I向免疫者R(E→R、I→R)转化。因此,考虑监管干预情形,保持其他参数不变,设置参数β=0.1,μ1=μ2=2,仿真结果如图9所示。
图9 监管干预下舆情仿真结果
从结果可以看出,监管干预对舆情演化影响较大,官方干预下,虽然潜伏者E的消散周期拉长,但绝大多数潜伏者E都转化为免疫者R,极少数转化为感染者I,舆情热度不高,无法形成突发事件风险并对社会产生较大影响。
4.4治理策略与建议分析综合上述灵敏性分析与舆情演化仿真,得出以下结论与治理建议:
a.及时应变,把握风险管理时间窗口。研究表明突发事件网络舆情爆发多集中在初期,此为风险管理时间窗口,且时长较短,及时有效的对初期舆情进行预警与导控,可以在很大程度上降低舆情演化热度,缩小突发事件舆情影响范围。
b.协同治理,加强主流媒体和权威信息的影响力。研究表明平台、媒体和政府三方的管控角度不同,其影响也不尽相同。因此,面对重大突发事件舆情时,明确主体责任,加强多主体协作[33],平台严格内容审核、媒体积极正向引导、政府增强信息透明度,方能够有效引导网络舆情,平息网络噪音,切实防范突发事件舆情风险。
c.科学引导,加强监管与应急能力建设。对比研究表明,政府层面的积极引导与干预,对于网络舆情走向的影响最为明显,因此后续需持续提升突发事件网络舆情风险治理与应急决策能力,构建具有系统性、科学性与长远性的治理策略,凝聚共识,稳定秩序,降低风险损失。
5 结 论
本文以突发事件舆情演化与治理为对象,以系统动力学与演化动力学相关理论为基础,以Python数据分析为支撑,开展了相关理论与实证研究,展现了多元化信息时代突发事件舆情演化特征,以提升风险预警与治理能力。
理论层面基于传统SEIR模型考虑了多意见竞争演化机制和突发事件舆情传播特点,构建一种拓展的SEInR多意见竞争演化模型,其中意见群体的划分采用LDA算法。实证研究方面以大宗商品交易领域“中行原油宝”事件为例,首先运用系统动力学方法剖析了中行原油宝事件的因果关系,结合微博文本数据采集与处理,用SEInR多意见竞争演化模型进行舆情的演化仿真,验证了模型的有效性和实用性。本文研究能在一定程度上体现突发事件的舆情演化特征,既为突发事件网络舆情预警提供了方法支撑,又为舆情引导与治理提供了一定的研究思路。
在智能化、多元化背景下,网络舆情演化也愈来愈复杂,本研究仅以新闻与新浪微博数据作为分析样本,存在一定局限性,后续研究中将提升数据覆盖面,通过多源舆情数据的融合与分析提升风险预警精准度。此外,对于文本信息的处理与意见群体的划分方法也有待进一步研究。