APP下载

基于贝叶斯网络的网络舆情危机节点诊断研究

2018-01-07周昕邱长波李瑞

现代情报 2018年11期
关键词:贝叶斯网络

周昕 邱长波 李瑞

〔摘要〕[目的]研究大数据网络环境发展新形势下,通过概率分析判断导致危机爆发的关键环节,为网络舆情危机管理决策提供依据。[方法]使用贝叶斯模型作为分析工具,探究网络舆情危机关键节点诊断的流程和机理。建立网络舆情危机分类匹配模型和关键节点诊断模型。[结果]建立60个网络舆情危机事件训练组得出模型条件概率表,3个测试组样本经实证诊断结果与事实相符。[局限]贝叶斯网络结构的构建需要进一步通过定量分析进行优化。[结论]对网络舆情危机进行分型,并精确地从复杂变量中诊断出对危机态势最具影响的关键节点。

〔关键词〕舆情危机;贝叶斯网络;节点诊断

DOI:10.3969/j.issn.1008-0821.2018.11.011

〔中图分类号〕G202〔文献标识码〕A〔文章编号〕1008-0821(2018)11-0059-07

Study on Crisis Diagnosis of Network Public

Opinion Based on Bayesian NetworkZhou XinQiu ChangboLi Rui

(School of Management,Jilin University,Changchun 130022,China)

〔Abstract〕[Objective]Studied the diagnosis procedure of network public opinion crisis control in the new tendency of development of big data network environment.[Methods]Combined the Bayesian network theory with the network public opinion crisis diagnosis,and deeply analyzed the procedure and mechanism of big datamation multimedia network crisis diagnosis.[Results]Analyzed the key variables,sorted relationship network structure,and established a big data multimedia network public opinion crisis classification matching module and a key node diagnosis module.[Limitations]The establishment of the Bayesian network structure needed to be further optimized by quantitative analysis.[Conclusions]Identified the types of network public opinion crisis,and accurately diagnosed the key nodes with the most significant influence on the crisis tendency among complicated variables.

〔Key words〕public opinion crisis;bayesian network;node diagnosis

國内外学者目前普遍认同的观点是网络舆情在内容上具有复杂性、突变性、对抗性等特点,在形式上呈现出多样性、丰富性、互动性特点,在指向上则表现出主观性、道染性、负面化等特点[1]。网络舆情传播和演化进程缩短态势猛烈,进程关键节点的数量增加,节点关系网络日益复杂。在这种情势下,网络舆情危机的预判对舆情引导和事件治理就显得尤为重要。

目前,针对舆情干预的研究多以策略分析的定性研究为主,对高校舆情、涉医舆情等专项舆情事件类别的干预机制、路径等问题展开了系统的研究,然而单纯的定性研究并不能满足舆情干预的需求。近年来,国内学者聚焦于舆情干预的定量分析并取得了相应成果,在舆情干预时机定量分析方面,有学者[2]把媒体对舆情传播的干预作用抽象为强化度及分歧度,构建新的SIaIbR模型。根据舆情传播动力学方程,求解系统传播阂值,证明传播平衡点的稳定性。分歧度对于传播的影响要远大于强化度,当分歧度低于05时候,政府介入有助于网络舆情更快平息。也有学者[3]基于元胞自动机模型对舆情传播影响因素展开定量研究,并探讨这些影响因素对舆情传播和干预机制的影响。在舆情干预阶段,主要探讨舆情干预措施强度和舆情干预措施实施的不同时间点对舆情传播的影响。在舆情干预的感控及作用效果方面,有学者[4]界定了群众类型和政府干预作用,并分析了各类群众间的状态转移关系,借鉴SEIR传染病模型的构造思路,结合舆情传播的实际特点,建立了政府干预下的舆情传播控制系统,进而运用平均场方法给出了系统的微分方程组模型,通过研究模型的平衡点和稳定性,得到了政府所应选择的管控方向。此外有学者[5]在描述我国2003年以来110起热度较高的地方政府重大舆情危机事件特点的基础上,对影响我国地方政府重大舆情危机应对效果的关键因素进行探索性研究,结果发现,舆情事件本身、舆情传播、舆情应对相关变量都会影响舆情干预效果,新闻发布充分性、真实性和是否有国家部委干预是最能影响政府干预效果的三大变量。目前的研究中学者开始借助各种模型对舆情干预进行定量研究,然而在舆情干预关键节点的诊断上尚有所空白。

本文针对新形势下网络舆情危机控制的新要求,将贝叶斯网络理论和网络舆情危机节点诊断相结合,同时基于贝叶斯网络的应用能力、复杂关联关系表示能力、概率不确定表示能力以及因果推理能力,提出基于贝叶斯网络建模的网络舆情干预诊断模型。舆情及相关研究领域中贝叶斯模型的应用集中于“自下而上”的计算,用于舆情危机等级划分及预测,而在计算机及自动化等研究领域中,学者多使用贝叶斯“自上而下”的计算,进行故障诊断及分析。贝叶斯模型的这一应用,在舆情危机研究中可以帮助舆情危机管控主体做出危机应对决策。因此本文通过贝叶斯网络在充分学习舆情危机案例的基础上,训练得到舆情危机发展态势与节点变量之间因果关系的概率集。在舆情危机发生时,首先对舆情危机进行主题分型,快速匹配案例。进而通过贝叶斯网络自顶而下追溯源头,对网络舆情危机进行分型,并精确地从复杂变量中诊断出对危机态势最具影响的关键节点。为网络舆情危机的干预提供决策依据。

2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期基于贝叶斯网络的网络舆情危机节点诊断研究Nov.,2018Vol38No111网络舆情危机节点诊断贝叶斯结构

关于网络舆情危机的影响因素及形成机理有着相对充分的研究,学者从多个研究角度对影响网络舆情危机形成和演化的要素进行机理分析和实证分析[6]。以贝叶斯网络为基础模型的研究中,贝叶斯网络结构构建是网络舆情危机预判的基础,构建过程首先要确定网络节点变量的层级关系,其次要通过分析学习,绘制表示节点关系的有向无环图[7]。本文研究过程中,充分总结前期研究的节点规划和网络结构,通过参数学习的客观数据与已有知识结合,分析变量之间的因果关系进行逻辑推理,最终构建网络舆情危机贝叶斯网络结构。

11网络舆情危机贝叶斯网络节点分析

网络舆情危机体现了大数据环境的特征,也因多媒体传播具有独特的危机演化模态,因此在变量提取过程中,本文以舆情传播维度为蓝本,构建了由网络舆情危机主体、网络舆情危机本体、网络舆情危机客体、网络舆情危机媒体、网络舆情危机空间5个变量为准则层的贝叶斯网络节点结构,如图1所示。图1网络舆情危机贝叶斯网络节点

1)网络舆情危机主体

网络舆情危机主体是在网络空间表达认知、情绪、态度、意见等言论的主体。考量舆情危机主体的演化趋势主要关注情感倾向性和主体组成结构。情感倾向性是指舆情危机主体在客观认知和判断基础上的心理趋同,当愤怒、失望、悲观等情绪在舆情危机主体族群中得到更多认同时情感倾向性高危的频率较高。主体组成结构是指管控主体、意见领袖主体、自由主体和利益相关主体的数量加权运算后形成的比例结构,其中管控主体的结构权重对高危频率有较大影响,作为主要测度指标。

2)网络舆情危机本体

网络舆情危机本体就是网络舆情信息,是网络舆情主体针对某些议题、现象或事件,在网络空间表达的认知、情绪、态度和意见等具体内容。考量舆情危机本体的演化趋势主要关注舆情爆发状态、数据结构和语义倾向性。爆发状态是最主要的测度指标集,主要是对舆情信息的发布量、浏览量、转发量、搜索量、回复量以及新闻数量变化、新闻关注时间等指标的测度,测度结果经过数据处理集中反映了舆情危机的传播演化阶段和爆发态势高危概率。数据结构是指图片、文本、音频、视频、符号等数据结构的比例及组合情况,异构数据的组合能够达成传播增效从而提高危机概率。语义倾向性是对舆情危机本体的语义特征进行提取之后,对其正向、负向和中性语义的数量加权进行比例计算,负向语义标签上升过程会提高危机概率。

3)网络舆情危机客体

网络舆情危机客体是引发网络舆情的刺激物、网络舆情的指向物,包括信息时间、热点现象和公共话题。考量舆情危机客体的演化趋势主要关注话题公共性、话题敏感性和话题真实性,这一系列指标主观性较强,在测度过程中其危机概率主要依靠专家商议评估。话题公共性决定了舆情危机的波及面,公共性越强的舆情危机其高危概率越高。话题敏感性决定了舆情危机的猛烈程度,食品安全、反腐等话题对于舆情危机主体来说极为敏感,传染性强演變速率快,具有更高的危机概率。话题真实性决定了舆情危机的演化走向,关于真实性的矛盾观点也具有高危概率。

4)网络舆情危机媒体

网络舆情危机媒体是各种传播形式和手段的总称,是信息从传播者到接受方的传播平台。考量舆情危机媒体的演化趋势主要关注数据源路径和数据终端路径。数据源路径包括社交网络、新闻门户、微博等媒介,路径越复杂则可控性越差,错误信息和谣言的传播越迅猛则相对的高危频率越高。数据终端路径包括PC、智能手机和智能电子设备。终端路径覆盖面越广则舆情危机演化的空间越大,舆情信息传播的速度越快覆盖面越广,因此在舆情危机演化过程中高危概率越高。

5)网络舆情危机空间

网络舆情的产生发展及演变离不开环境的支持,这个供网络舆情进行活动及演化的场所即为网络舆情的空间。考量舆情危机空间的演化趋势主要关注外部环境、干扰噪音和技术基础。外部环境是舆情危机所处时空中经济环境、法律环境、文化环境等社会背景的集合,其对舆情危机演化的作用评估体现为主观评价,当外部环境对舆情危机有催化作用时高危概率相应提高。干扰噪音主要是指在舆情危机传播演化过程中,可能抢占舆情主体关注度的信息或话题,例如同时期的其他舆情信息或具有争议的观点,噪音越小则舆情主体的关注越集中,进而提高舆情危机高危概率。技术基础是计算机技术和网络技术集合,技术发展可能为舆情危机传播和演化提供更大的可能,也有可能为舆情危机治理提供工具,从而影响舆情危机的高危频率。

12网络舆情危机贝叶斯网络结构构建

在上述网络舆情危机贝叶斯网络节点分析的基础上,以事实因果关系为依据,进一步构建其贝叶斯网络结构,如图2所示。图2网络舆情危机贝叶斯网络结构

网络舆情危机贝叶斯网络结构是一个有向无环的概率树图,其中箭头指向的一方为结果变量,另一方为原因变量。

其中以C为顶层父节点,其非空概率事件集包括E1、E2、E3、E4、E5,皆为其自身子节点。

节点E1的非空概率事件集包括其子节点I1、I2、I3,此外节点I5与EI存在因果关系,当舆情危机全面爆发时会激化舆情危机客体矛盾,加速舆情危机客体演进。

节点E2的非空概率事件集包括其子节点I4、I5、I6,此外节点I8与E2存在因果关系,强烈的情感倾向会影响舆情危机主体的客观判断从而促使舆情危机本体演化。节点E4与E2存在因果关系,舆情危机媒体的路径组合会对爆发状态有促进或抑制作用,同时改变数据结构,使异构舆情信息得到整合,其中节点I9对节点I4有直接因果关系。

节点E3的非空概率事件集包括其子节点I7、I8,此外节点E1与E3存在因果关系,舆情危机客体对舆情危机主体产生直接刺激,从而触发舆情,舆情危机客体的话题属性对舆情危机主体受众的结构和机泵情感认知有着决定性作用。节点I6与E3存在因果关系,舆情危机主体在进行知识加工中所赋予的语义受认知和情感影响,负向语义的比例越高则舆情危机主体高危概率越高。节点I2与E3的子节点I8存在因果关系,话题敏感性越高,舆情危机主体的情感倾向越强烈,产生极端情感的比率越高。

节点E4的非空概率事件集包括其子节点I9、I10,此外节点E5与E4存在因果关系,外部环境会对数据源路径和数据数据终端路劲产生约束作用,而E5的子节点I11对E4有直接因果关系,技术基础的适配性是舆情危机媒体作用的重要条件。

节点E4的非空概率事件集包括其子节点I11、I12和I13,不存在其他因果关系。

2网络舆情危机节点诊断贝叶斯模型构建

网络舆情危机贝叶斯网络模型的核心流程包括案例匹配和关键节点诊断两个过程,分别通过贝叶斯网络推理算法实现,将舆情信息经过语义识别和数据处理后形成训练集D={d1,d2,…,dn}和测试集T={t1,t2,…,tn},训练集和测试集有交集且可互相转换。网络舆情危机贝叶斯网络模型算法流程如图3所示:图3网络舆情危机贝叶斯网络模型算法流程

将采集的网络舆情进行语义提出和数据处理形成训练集和测试集,根据网络舆情危机的5个分类维度进行选择,并使用算法进行概率学习,概率学习的算法较为常用的有计数算法、梯度下降法和最大期望法,但是对于网络舆情危机贝叶斯网络模型的复杂性都有一定的局限,关于算法的选择和优化将在未来研究中进一步开展。经过关系概率学习后得到分类先验信息和诊断先验信息,经贝叶斯网络学习得出危机分类的主题标签,根据测试集的分类结果调用其诊断关系概率,再次经过贝叶斯网络学习诊断出其关键节点。对贝叶斯网络输出的分类主题标签和关键节点诊断进行置信度判断,满足置信度要求的,可以用于修正现有贝叶斯网络模型的关系概率。

这一算法流程遵循了贝叶斯定理中自顶而下的概率计算过程,根据前文研究的推导,网络舆情危机贝叶斯网络关键节点诊断模型的顶层父节点为舆情事件危机等级的分布概率,网络模型各节点,皆为影响舆情危机演化进程的要素变量。在算法流程的仿真训练过程中,选取训练集,获得表达舆情事件危机等级与各模型节点之间关系强度的先验概率。在模型实证过程中,对测试集的舆情危机进行分析,经模型推导得出现有危机等级概率分布下,各节点的实际发生概率,从而从中筛选出导致舆情危机演化的关键节点,完成诊断过程。

21网络舆情危机贝叶斯网络关键节点诊断过程模型网络舆情传播演化过程中存在触发机理,网络舆情客体的热度影响因素对网络舆情主体的刺激量变积累达到一定的质变临界值,从而使网络舆情主体产生应激反应,从而触发其传播意愿的过程。据此本文在贝叶斯定理的基础上[10-11],建立网络舆情危机贝叶斯网络模型指标层状态属性集{state T,state M},任一指标节点状态state T和state M的概率加和均为1。

贝叶斯网络通过父节点与子节点之间的关系概率进行推导,并构建关系概率表。關系概率表的结构由各级节点的数量和状态属性决定。国家对自然灾害、事故灾难和公共卫生事件预警分级,依据突发事件可能造成的危害程度、波及范围、影响力大小、人员及财产损失等情况,由高到低划分为特别重大(Ⅰ级)、重大(Ⅱ级)、较大(Ⅲ级)、一般(Ⅳ级)4个级别,并依次采用红色、橙色、黄色、蓝色来加以表示。据此本文建立网络舆情危机贝叶斯网络模型目标层、准则层状态属性集{degree R,degree O,degree Y,degree B}。任一节点状态degree R,degree O,degree Y,degree B的概率加和均为1。

1)对目标层节点训练得到其全概率公式:

P(C)=∑5n=1P(En)P(C|En)

2)根据贝叶斯定理,对准则层节点则有:

P(En|C)=P(En)P(En|C)P(C)

3)得出舆情危机准则层的概率集,则一定有:

P(Em|C)>P(En|C)

其中,1≤m≤5,1≤n≤5,m≠n。

从而对于每一个未知关键节点的舆情危机,诊断其贝叶斯网络准则层节点概率,从中选择概率最大的节点作为舆情危机的关键节点。重复以上算法流程,最终在指标层节点中诊断出具有最大概率的关键节点。

22模型运用实例与仿真结果分析

先验关系概率的训练与优化,是网络舆情危机贝叶斯网络关键节点诊断过程模型运行的基础。在前期研究中,往往采用直接给出条件概率表的方式进行贝叶斯网络模型的建立。但是网络舆情具有显著的复杂性,多元性及传播叠加特征,一次存在大量节点,且因果关系非常复杂。本文采用Netica软件进行贝叶斯网络仿真,通过建立训练集,通过数据学习获得贝叶斯网络的条件概率集。

为了对模型仿真所需训练数据进行采集,本研究邀请10位对舆情危机和贝叶斯网络的研究领域十分熟悉的专家组成专家组,通过会议讨论的方式进行精准问卷调查,专家组还负责条件概率集的审核和优化,已经仿真结果的测评。本文随机抽取2015-2017年6月这段时间发生的60件非常规危机事件作为训练集,及“成都女司机被打”、“马克兰大学中国留学生演讲”、“北大女硕士失踪”、“比特币勒索病毒席卷全球”4个危机事件作为测试集,训练集和测试集所选取的网络舆情危机事件所处环境均为大数据环境,涉及信息量及传播进程符合大数据特征。

通过专家组的分析得出训练集的原始数据,将贝叶斯网络模型边缘概率变量离散化,最终得到网络舆情危机贝叶斯网络模型边缘概率表,如表1。

在其贝叶斯网络条件概率集中得到集中体现,各节点之间处于动态关联特性。各边缘概率间同样存在作用关系,当出现新的证据时,网络舆情态势处于何种水平的可能性将会发生相应变化。如果获得其他证据,则可以对贝叶斯网络中的节点做出相应调整,观测舆情态势的演变。多媒体技术作用下舆情在传播过程中具有高互动高反馈的特性,因此边缘概率间的相互作用,更能准确地反应舆情演化过程。

在模型建立后,需要对其有效性进行测试,测试集危机态势及仿真运算结果如表3所示。

其中2015年发生的“成都女司机被打事件”所酿成的网络舆情风波,经专家组评定,该事件危机态势为,degree O概率为80%,degree Y概率为20%。通过仿真运算,得出该舆情危机关键点诊断结果如图6所示。

由“成都女司机被打事件”仿真结果可知,在准则层节点中,网络舆情主体的触发几率最高,而在指标层节点中,主体组成结构的触发几率最高,同时话题公共性的触发几率同时居高,诊断结果具有逻辑意义,这一舆情危机的话题被网络主体广泛关注,各阶层的组成结构均对这一话题产生了传播意愿,因此舆情危机得以不断演化。同时外部环境和干扰噪音的触发概率居高,说明该事件发生过程中,网络舆情空间内不存在强干扰信息,外部环境适宜舆情危机演化。综合说明“成都女司机被打事件”处于易于演化的弱干扰环境中,网络舆情主体普遍对这一话题给予关注。通过对测试事件的舆情危机关键节点的诊断,干预其演化走向的高效着力点可以选择利用环境噪音分散舆情主体的关注投入,可以较大概率降低危机等级。“马克兰大学中国留学生演讲”事件危机等级较低,情感倾向性图6“成都女司机被打事件”关键节点诊断结果

指标在这一危机事件中起主导作用,当群体情感倾向过于消极激进时,事件危机等级会升高。“北大女硕士失踪”作为高危等级事件,其触发几率的指标同样反应为情感倾向性,同时其受干扰噪音影响较高,这一事件相关的社会问题较多,易衍生话题。“比特币勒索病毒席卷全球”事件危机等级在测试集中最低,根据仿真结果分析,这一事件受话题公共性影响,达到了相应的传播广度,但不易发展为高危舆情事件。

3结语

网络舆情危机受到大数据网络环境和多媒体传播模态影响,具有变量复杂多变等特征,因此对网络舆情危机的研判分析需要更有效的算法。从贝叶斯网络理论出发,梳理了网络舆情危机预判分析的工作流程,对诊断机理进行全方位的分析。从舆情危机传播维度提出5个变量的网络舆情危机贝叶斯网络节点结构,并以阐述变量事件集的逻辑因果,最终构建贝叶斯网络结构。并在此基础上构建网络舆情危机贝叶斯网络案例匹配模型、网络舆情危机贝叶斯网络态势预警模型和网络舆情危机贝叶斯网络干预诊断模型,为相关领域研究提供了新的思路。

对网络舆情危机预判进行研究能够为新技术环境下政府管理网络舆情提供决策支持,可以帮助政府把握网络舆情危机的分类分型规律,在危机发生时,帮助政府诊断危机的主要作用变量,行之有效地对关键节点进行干预。为政府管理网络舆情提供理论依据,为政策制定提供决策依据,减少社会风险治理的成本。

在进一步的研究中,一是要对网络舆情危机贝叶斯网络结构的学习进行优化研究,降低主觀作用;二是对网络舆情危机贝叶斯模型的先验概率参数训练算法进行优化和实证,将人工智能算法引入参数训练过程,提高参数可信度。

参考文献

[1]王杨,尤科本,王梦瑶,等.基于博弈论的网络社区舆情传播模型研究[J].计算机应用,2013,30(8):2480-2482.

[2]张立凡,赵凯.媒体干预下带有讨论机制的网络舆情传播模型研究[J].现代图书情报技术,2015,42(11):60-67.

[3]邓青,刘艺,马亚萍,等.基于元胞自动机的网络信息传播和舆情干预机制研究[J].管理评论,2016,28(8):106-114.

[4]王治莹,李勇建.政府干预下突发事件舆情传播规律与控制决策[J].管理科学学报,2017,20(2):43-52.

[5]刘锐.地方重大舆情危机特征及干预效果影响因素——基于2003年以来110起地方政府重大舆情危机的实证分析[J].情报杂志,2015,34(6):93-99.

[6]黄微,李瑞,孟佳林.大数据环境下网络舆情传播要素及运行机理研究[J].图书情报工作,2015,59(21):38-44.

[7]张一文,齐佳音,等.基于贝叶斯网络建模的非常规危机事件网络舆情预警研究[J].图书情报工作,2012,56(2):76-81.

[8]F Jensen,T Nielsen.Bayesian Networks and Decision Graphs[M].SecondEdition.New York:Springer Science Business Media,2007:10-11.

[9]M Hanninen,P Kujala.Influences of Variables on Ship Collision Probability in a Bayesian Belief Network Model[J].Reliability Engineering & System Safety,2012,102:27-40.

(责任编辑:孙国雷)2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期区块链技术在图书馆智慧服务中的应用研究Nov.,2018Vol38No11

收稿日期:2018-05-16

猜你喜欢

贝叶斯网络
基于贝叶斯网络的分类器研究
基于分布式贝叶斯网络的多故障诊断方法研究
无人机数据链测试与评估研究
基于贝叶斯网络的流域内水文事件丰枯遭遇研究
基于贝叶斯网络的城市居民出行方式研究