APP下载

突发公共卫生事件舆情环境下的群体智慧涌现研究

2022-01-24宁,安璐,2

情报学报 2022年1期
关键词:三元组分支公共卫生

安 宁,安 璐,2

(1.武汉大学信息管理学院,武汉 430072;2.武汉大学信息资源研究中心,武汉 430072)

1 引言

群体智慧(collective intelligence),是指群体所具有的优于个体或个体总和的智慧与能力,是群体本身所固有的资产[1-2]。现代科学对复杂性的研究表明,动物常常会利用群体智慧进行集体狩猎、相互掩护和躲避捕食者等活动[3]。在人类社会中,最优决策事实上通常也是基于群体智慧形成的[4]。社交媒体的发展不仅丰富了信息交流的模式,也为群体的互动和知识的构建开辟了新的途径[5],尤其是在危机情境下,社交媒体成为公众表达观点与情感的重要渠道,同时促进了网络舆情环境的形成。从某种程度上来说,网络舆情是群体智慧涌现的一种表现形式,承载了公众对突发事件的认知与理解,甚至具有对事件演化的前瞻性,在突发事件的应急响应工作中具有重要意义[5]。因此,本研究将突发公共卫生事件舆情环境下的群体智慧涌现概述为公众在围绕突发公共卫生事件进行观点的传递、碰撞与发酵的过程中,通过自组织活动而呈现出优于个体的智慧与能力的复杂现象。

社交媒体中的信息往往具有标题化、碎片化、语言简洁等特点,那么在这看似杂乱无章的舆情信息环境下如何表征群体智慧?群体智慧的涌现是否存在某种规律?围绕这些问题,本研究提出一种从突发公共卫生事件的舆情信息中提取群体智慧的方法,即从舆情信息中提取知识三元组集合来表征公众的知识,探究微博、评论中三元组数量的分布情况以及知识密度的动态变化,实现对突发公共卫生事件舆情环境中群体智慧的结构化表示及量化分析。同时,本研究引入复杂网络的思想构建舆情知识网络,通过网络结构关系的时序变化反映和揭示突发公共卫生事件舆情环境下公众知识涌现的规律与模式,以期为管理部门在对突发公共卫生事件网络舆情进行引导与决策时提供参考。

2 相关研究

2.1 突发事件的网络舆情研究

近年来,世界各地的自然灾害、事故灾害等多种危机事件逐渐呈现出日益高发、规模扩大、危害程度加深等态势[6]。不同于其他情境,突发公共卫生事件等危机情境将严重威胁人类生活与社会秩序,通常还伴随不确定性、破坏性、聚焦性等特征[7]。在此情境下,社交媒体毋庸置疑成为公众信息交流、情感表达和维持社会化关系的重要渠道[8]。突发事件暴发后,用户在社交媒体平台上通过生成、评论和转发等多种形式,传递着与事件、新闻、思想以及情感等相关的近乎瞬时信息,形成与突发事件相关的网络舆情。然而,社交媒体虽然为信息交流带来了便捷,但也存在着不可忽视的“回音室”现象。社交媒体的“回音室”具有封闭且高度同质化的特征,即公众在“回音室效应”下常常会固守在符合自己偏好的信息圈子里,过滤与自己意见相左的观点或情感,而相近的意见与观点将被反复传播,极易造成舆情群体极化现象[9]。

网络舆情的演变关乎着社会的稳定和发展,而危机事件通常易造成公众情绪波动,产生悲伤、愤怒以及恐慌等负面情绪,进而危害社会秩序稳定[10]。因此,国内外学者逐渐开始关注突发事件网络舆情信息的相关研究,主要聚焦于网络舆情的主题和情感的分析与挖掘[11]。在舆情主题方面,现有研究多基于LDA(latent Dirichlet allocation)主题模型[12]进行主题识别,探索突发公共卫生事件舆情主题的演变模式和时间特征[13]。在舆情情感方面,学者们通常基于情感词典和机器学习等相关方法进行研究。前者需要利用已标注好的情感词典,如大连理工大学情感词典、How Net情感词典等分析用户的情感强度与情感倾向[14];后者则需要大量人工标注的语料作为训练集,提取文本特征,构建分类器以实现情感分类[15]。

2.2 群体智慧相关研究

群体智慧是在个体交流、协作、竞争、头脑风暴等过程中产生的,常出现在如公共决策、投票活动、社交网络和众包等领域中[16]。在早期,“群体智慧”概念曾遭到大多数学者的抨击,例如,MacKay[17]直接表示群体所产生的智慧远不如单独个体所拥有的智慧,甚至认为群体的汇聚是愚蠢的。直至1907年,Galton[18]在《自然》(Nature)杂志上发表了一篇文章,证明了群体在某些情况下可以超越专家的智慧,这标志着群体智慧得到了科学家们的广泛认可。群体智慧是群体内自下而上和自上而下过程相互作用所产生的新特征[19],与群体内交流的公平性和群体的社会感知之间有密切关联[2]。Web 2.0打破了传统门户网站单向传输的模式,充分发掘了个体的智慧和力量,极大地提升了互联网的整体创造力[20],例如,Yuan等[21]从Web 2.0视角构建了互联网上群体智慧新框架,分析了群体智慧在互联网上的演化机制,指出互联网中的群体智慧是一种由集体行为所产生的涌现现象。易明等[22]认为,协同标注信息行为是一个基于群体智慧涌现的分类知识产生过程,这种群体智慧的涌现是一个从量变到质变的过程。

重大突发事件的应急管理是国家治理体系现代化的重要组成部分,如何聚力情报智慧、科学应对重大突发事件,俨然成为总体国家安全观下亟待研究的关键问题[23]。突发事件中的舆情信息不仅是重要情报资源,更是群体智慧在危机情景下的一种具体表现,反映了群体对事件态势的认知与研判,是感知、理解和预测民众关于突发事件的群体决策与应对行为的重要渠道。因此,挖掘与分析社交媒体上的舆情信息,有助于探究群体智慧的形成与演化机理,对突发公共卫生事件的应急管理具有重要意义[5]。社交媒体不仅是公众信息交流的重要渠道,也是了解公众态度与行为的重要数据来源[24]。在应急管理工作实践中,已有研究将在线社交媒体信息用于开发基于GIS(geographic information system)的实时地图[25]、龙卷风预警系统[26]和网络故障检测系统[27]等,充分发挥了信息资源的选择与决策功能[28]。舆情信息作为群体智慧的一种具体表现形式,能够指导相关部门和机构科学应对各类突发事件,降低不确定性,减小风险与损失,容灾减灾,提升群体的凝聚力[29-30]。

综上所述,群体智慧得到了国内外学者的广泛认可。现有研究成果主要是探究Web 2.0模式下群体智慧框架、用户协同标注行为等,鲜有研究挖掘突发事件舆情环境下的群体智慧涌现的规律与模式。因此,本研究基于特定突发公共卫生事件下的网络舆情信息,利用依存句法分析提取舆情信息中的知识三元组,以结构化表示突发公共卫生事件舆情环境下公众的知识条目,基于舆情知识网络的拓扑结构,揭示突发公共卫生事件网络舆情环境中群体智慧涌现的规律与模式。

3 研究方法

3.1 突发公共卫生事件舆情中的知识三元组提取

突发事件的出现通常会促进公众之间的信息共享、讨论和交流,形成特定的舆情环境。在此环境下,公众在围绕突发事件进行观点的传递、碰撞与发酵的过程中,通过自组织活动将呈现出优于个体的群体智慧。三元组作为知识图谱常用的知识表示方法,可以描述真实世界中存在的各种实体或概念及其复杂联系。因此,本研究利用三元组表示突发事件舆情信息中所包含的公众的知识条目,即以所提取的知识三元组集合来表征突发公共卫生事件舆情环境下公众的群体智慧,进而展开研究。首先,本研究将所获得的微博、评论等文本内容切割成句,形成语料库;其次,利用自然语言处理工具HanLP(Han language processing)对语料库进行分词、词性标注、命名实体识别和依存句法分析;最后,基于李明耀等[31]提出的基于依存分析的开放式中文实体关系抽取方法REDP(relation extraction with dependency parsing),从语料库中抽取实体关系,从而得到<head,relation,tail>形式的知识三元组。

根据REDP方法,中文实体关系可以表述为“状语*动词+补语?宾语?”。其中,“*”表示出现0次或任意多次;“+”表示出现1次或任意多次;“?”表示出现0次或1次。其依存句法关系结构如图1所示。

图1 依存句法关系结构

实验结果[31]表明,REDP方法在中文实体关系抽取方面性能良好,其F值比基于卷积树核的无监督层次聚类方法提高了16.68%,在准确率和召回率上都有较大幅度的提高,能够保证本研究的准确性。

最后,对初步抽取到的知识三元组进行清洗。首先,剔除有缺失的无效三元组,因为这些有缺失的三元组无法完整、准确地表达出一条知识内容;其次,根据“哈工大停用词表”,剔除head或tail中含有停用词的三元组,进一步保证所获三元组更具知识含义;最后,得到突发公共卫生事件舆情环境中公众的知识三元组集合。

3.2 突发公共卫生事件的舆情知识网络巨分支识别

基于突发公共卫生事件舆情信息提取的知识三元组集合,蕴含了公众在突发公共卫生事件情景下所产生的群体智慧。随着网络思维引入图书情报学领域,基于复杂网络的思想对知识和知识关联关系进行研究已经得到了学术界的普遍认可。因此,本研究将三元组的head与tail实体作为知识单元,将relation看作两个知识单元之间的关联关系,以知识单元为节点,以关联关系为边,构建舆情知识网络。在构建舆情知识网络的过程中发现,舆情知识网络中存在自环,即一条边的两个节点为同一知识单元。鉴于该拓扑结构无法揭示知识单元之间的关联信息,因此去除舆情知识网络中的自环,形成舆情知识网络的简单图。

网络科学领域的著名学者Newman[32]曾指出,许多实际的大规模复杂网络都是非连通的,往往会存在一个包含整个网络中相当比例节点的最大分支(又称巨分支),如图2所示。其中,虚线圆圈中的节点和边构成该网络的巨分支。对于大规模网络而言,网络的连通性较为脆弱,单个节点或者相当少部分的节点的行为都可能破坏该性质,因此,往往基于巨分支探究网络的拓扑结构[33]。鉴于在突发公共卫生事件的发展过程中,大众群体所表达出的知识内容较为分散、无序,同时,知识单元及其关联关系也会发生兴衰更迭的变化,这些因素促使舆情知识网络包含不连通的小分支群落。因此,本研究基于网络的连通性,提取舆情知识网络中规模最大且连通的分支,即保留其中的节点、边等拓扑结构要素,形成舆情知识网络的巨分支。本研究以巨分支内包含的知识单元及知识关系表示公众知识的主流方向,进而探索突发公共卫生事件舆情环境中群体知识的演变模式与规律。

图2 网络结构中的巨分支

3.3 舆情知识网络巨分支的k-核分解

知识网络是一种具有层次结构的复杂网络[34],本研究基于k-核理论对舆情知识网络的巨分支结构进行分解,探索舆情知识网络巨分支的“核心-边缘”结构,以洞悉突发公共卫生事件舆情环境中群体所涌现出的知识结构。k-核是网络节点的一个最大子集,在该子集中的每个节点至少与子集中其他k个节点直接相连,是探索网络层次结构的代表性方法。从本质上来看,k-核的分解过程是根据节点的度值来划分网络层次结构,从外层向内层延伸式扩展进行的。图3所示为一个简单网络的k-核分解示意图。

图3 网络的k-核分解

在对舆情知识网络巨分支进行k-核分解时,首先,去除网络中度值小于1的节点,由剩下的节点和边构成网络1-核。需要说明的是,本研究以舆情知识网络的巨分支为研究对象,而巨分支是网络的最大连通子图,因此,1-核网络即舆情知识网络的巨分支。其次,去除巨分支中度值小于2的节点,剩下的节点和边构成巨分支的2-核网络结构。再次,去除度值小于3的节点,剩下的构成3-核网络。以此类推,重复这种去除操作,最后实现对巨分支的k-核分解,即去除舆情知识网络连通的巨分支中度值小于k的所有节点及其连边,直至网络中剩下的节点的度值都不小于k。对舆情知识网络巨分支进行k-核分解,能有效地识别出知识的核心区域,即最大k-核节点位于巨分支的最内层,是舆情知识网络巨分支中核心、稠密的区域。

4 实验过程与结果分析

4.1 数据描述与处理

突发公共卫生事件爆发后,微博平台中的用户会在相关话题下发表微博帖子,每篇微博又会被不同用户进行评论,形成“话题-微博-评论”的结构,如图4所示。在新冠疫情的社会背景下,本研究以新浪微博为基础数据源,于2020年7月1日以“群体免疫”为检索词,获取新浪微博平台上“#群体免疫#”“#世卫组织质疑英国群体免疫方法#”“#李兰娟谈群体免疫#”等相关的145个话题,以及各话题所包含的9992条微博和75905条评论数据。经过清洗、去重等预处理后,最终得到共计8798条微博、62729条评论信息,时间跨度为2020年3月13日至2020年6月30日。

图4 话题-微博-评论结构

发表微博和评论是公众参与突发公共卫生事件舆情讨论的主要形式,探究微博与评论之间的关系,有助于掌握公众在突发公共卫生事件舆情环境下的行为模式,为探索群体智慧涌现的规律与模式提供依据。因此,令g={p1,p2,…,pn}表示评论的概率分布,其中,p n为一条微博评论数量为n的概率,对突发公共卫生事件情景下的微博评论数量的概率分布进行统计,在对数坐标系下的相关结果如图5所示。

在图5中,横坐标表示一条微博的评论次数;纵坐标表示概率,是一条微博能够产生对应数量的评论的概率。可以发现,微博不被评论(即具有0条评论)的概率为71.15%,具有1条评论的概率为8.14%,而微博中所含评论数量不多于7条的概率已高达90.61%,评论的期望值约为7.13。可以初步得出结论,在突发公共卫生事件舆情环境中,公众发表的微博评论概率分布在总体上趋近于幂律分布,具有无标度特性,即大多数的微博会被少量用户评论,仅有少量微博会拥有大量评论。

图5 一条微博下评论数量的概率分布

4.2 基于舆情知识三元组的群体智慧涌现分析

根据第3.1节的方法将微博、评论的文本内容切割成句,其中从微博文本中共切割出87343句,从评论内容中切割出144216句。基于所切割出的句子提取知识三元组,共47426个,部分节选如表1所示。本研究以三元组的形式将突发公共卫生事件舆情环境下的群体智慧结构化,即一个舆情知识三元组表示了突发事件舆情信息中公众的知识条目。为判断突发事件的演变,以及舆情热度和群体智慧涌现的关系与特征,本研究分析了时间-微博评论数-知识三元组之间的数量关系,如图6所示。

图6 时间-微博评论数-知识三元组之间的数量关系

表1 突发公共卫生事件舆情环境下的三元组(节选)

群体智慧涌现与突发公共卫生事件和网络舆情的演变过程存在显著关联。通过分析时间、微博评论与知识三元组之间的数量关系,能够对群体智慧涌现、突发公共卫生事件和网络舆情三者之间的关系以及群体智慧涌现的模式特征作出直观的判断。由于微博评论与知识三元组在量纲和取值范围方面存在差异,因此,需要根据公式对数据进行Z-score标准化处理。其中,μ是平均值;σ为标准差;x是观测值。

在图6中,x轴表示时间,其刻度为“日”;y轴表示微博评论数量的Z-score标准化;z轴表示知识三元组数量的Z-score标准化。图6中的数据散点分别表示每日新增与每日累计两种。观察每日新增的变化趋势可以发现,微博数量和知识三元组数量在初期呈现爆发式增长,此后趋于平缓,但仍然会出现短暂爆发的现象。这说明群体智慧在经历初期的爆炸增长后,仍会在新热点的激发下再次被激活。群体智慧涌现的现象贯穿于突发公共卫生事件与网络舆情演变的全周期。

每日累计数据在初期经历了同样的爆发式增长后,表现出明显的阶梯式上升特征,表明累计的知识三元组数量并不是平稳线性增加的。在较长时间的平缓且微量的增长后,会突现一次短暂的大幅度跳跃式增长。这与每日新增数据是相对应的,说明在突发公共卫生事件中的群体智慧涌现是一种临界现象。群体智慧涌现不仅贯穿于突发公共卫生事件与网络舆情演变的全周期,其对于群体智慧的表达与演变的贡献也要高于长期的知识积累。

为探究公众基于微博、评论等不同形式产生知识的特征,以一条微博(或评论)中的三元组数量为横坐标,以一条微博(或评论)中能够产生的三元组数量的概率为纵坐标,对三元组数量的概率分布进行统计,如图7所示。可以发现,图7中明显存在重尾现象,即大多微博(或评论)含有较少的知识三元组,从少量微博(或评论)可以提取出较多的知识三元组。为探究微博、评论中各自的知识贡献度,本研究对每日三元组的新增总数Tall、在新增微博中提取的三元组Tw以及在新增评论中提取的三元组的数量Tc进行统计,如图8a所示。为消除规模差异的影响,本研究根据新增微博中提取的三元组Tw与微博的新增数量W之比Tw/W、新增评论中提取的三元组的数量Tc与评论的新增数量C之比Tc/C,来考察微博、评论中对知识三元组的贡献情况,如图8b所示。

图7 一条微博(或评论)中三元组数量的概率分布

由图8a可知,在3月14日至3月18日,从评论中提取出的知识三元组数量多于从微博中提取的知识三元组数量。但结合图5可以发现,在这几个时间窗口中,公众发表评论的新增数量C同样也高于微博新增数量W。因此,需结合图8b中的Tw/W和Tc/C两个比值考察微博、评论中对知识三元组的贡献情况,消除微博和评论的数量差异的影响。在3月14日窗口中,一条新增微博可以提取出0.944个知识三元组,而一条新增评论仅可提取出0.311个知识三元组。随着时间窗口的滑动,在3月21日、4月11日、5月6日等窗口下,从一条微博中提取出的知识三元组数量明显高于从一条评论内容中提取的知识三元组数量。在6月8日窗口下,一条新增微博可以提取出高达9个知识三元组,而一条新增评论仅提取出0.485个知识三元组。这一现象反映出,在突发公共卫生事件舆情环境中,评论信息数量虽然远高于微博数量,但群体智慧涌现出的知识条目主要集中于微博,而非评论信息。换句话说,在突发公共卫生事件舆情环境下,公众所发表的微博内容更具知识性,与评论内容相比,所含的知识密度更大。

图8 每日新增微博、评论中提取的知识三元组数量及比值

4.3 基于舆情知识网络拓扑结构的群体智慧涌现分析

4.3.1 舆情知识网络及巨分支的统计分析

为更好地反映群体智慧的涌现特性,本研究根据第3.2节中所涉及的方法理论,以1天为时间切片,基于累计值构建舆情知识网络,并提取其巨分支结构以表示突发公共卫生事件舆情环境中大众群体的主流知识方向。将2020年3月13日至2020年6月30日划分成110个时间窗口,即t1时间窗口含有3月13日出现的知识单元,t2时间窗口包含3月13日至3月14日知识单元的累计数据,依此类推。此外,对t1~t110各时间窗口下舆情知识网络节点数量、边数量以及巨分支的基本指标特征进行测度与统计,以期通过网络巨分支拓扑结构的时序变化反映和揭示突发公共卫生事件舆情环境下群体智慧演变的规律与模式。部分节选如表2所示。

由表2可知,与领域知识网络[35]有所不同,突发事件舆情环境下的舆情知识网络在各个时间窗口下的巨分支结构平均来看,仅涵盖了整体网络约50%的知识节点,囊括了约69%的知识单元之间的关联关系。这表明舆情知识网络的连通性较弱,在突发事件的网络舆情环境下,公众产生的知识具有分散性,知识单元一般形成了规模较小且互不关联的分支群落。表2中,在t1时间窗口下仅有2个知识节点,知识关联关系为1,说明突发公共卫生事件舆情环境初始状态之下,群体智慧涌现的知识并不多,知识关联关系也较为简单。随着时间窗口滑动,突发事件的舆情环境不断发展,逐渐涌现出大量知识单元以及知识关联关系,使得舆情知识网络巨分支的规模逐渐增大。舆情知识网络巨分支时间序列的密度在总体趋势上持续降低,说明尽管巨分支在整体上处于增长状态,但仍然是一个较为稀疏的网络结构。

表2 每日累计的舆情知识网络及巨分支的统计特征(节选)

为进一步探究舆情知识网络中知识单元的群聚程度,本研究构建了同等规模(即节点数量、连数量相同)的随机网络以作比较,发现舆情知识网络巨分支的聚类系数高于同等规模的随机网络,但整体上低于领域知识网络[35]。聚类系数是对网络拓扑结构中闭合三元组的测量,舆情知识网络巨分支的低聚类系数表明,在突发公共卫生事件的舆情讨论中所涌现的知识单元之间的传递性并不高,即知识较为松散且聚集程度不高。在时间序列下,舆情知识网络巨分支的平均路径为4.72跳,表明在大多情况下舆情知识网络中的各知识单元经较短的路径就可以相互连接。因此,与同等规模的随机网络相比,在突发公共卫生事件情景下的舆情知识网络巨分支具有较高聚类系数、较短特征路径长度的小世界特性。

4.3.2 舆情知识网络巨分支的k-核分析

经过上述研究发现,突发公共卫生事件舆情环境下的知识网络的巨分支虽然整体上处于连通状态,但仍是较为稀疏、松散的网络拓扑结构。因此,根据第3.3节中提及的k-核分解方法,观察舆情知识网络核心知识单元以及其关联关系。本研究对终态网络(即t110时间窗口)的巨分支结构进行k-核分解,获取舆情知识网络巨分支的核心-边缘知识单元的层级结构,如图9所示。

图9 舆情知识网络巨分支的k-核分解

经过k-核分解后,舆情知识网络巨分支中最高核为7-核,包含了48个知识单元节点,这些知识单元之间的关联紧密,即每个知识单元至少与子群中其他7个知识单元具有直接关联关系。在知识单元数量上,7-核中包含的知识节点数量仅占巨分支中节点数量的0.43%,说明在舆情知识网络中的核心知识数量并不多,也进一步证明了舆情知识网络中的知识较为松散,聚集程度不高。当k=7时,所划分形成的子群是舆情知识网络巨分支的核心部分,其中,“英国”“美国”“中国”“瑞典”等知识单元节点的度值较大,说明在重大突发公共卫生背景下,公众通过社交媒体交流所涌现出的核心知识多与国家层面相关,多涉及疫苗研发、隔离措施等与各国政府的角色直接相关。在k=1时出现如“购物”“BBC报道”“学校”“交通”等知识单元,涌现的群体智慧更多的是涵盖了贴近人们的日常生活信息。

由图9可知,各个节点之间连边的粗细可以反映两个知识单元之间的关联关系的紧密程度,如“群体免疫”与“疫苗”两个节点之间的连边较粗,表明这两个知识单元之间的关联关系较为紧密:在新冠疫情重大突发公共卫生事件背景下,英国政府提出的群体免疫引发了很大争议,社交媒体上的言论表明了公众对英国采取不需要医疗部门参与的群体免疫政策主要持批判性态度,认为这将是一场不负责任的“屠杀”,在突发公共卫生事件舆情环境下涌现出的群体智慧认为,通过疫苗的研发与科学的治疗才能实现群体免疫。又如,“病毒”与“变异”两个节点之间连边权重为34(即这两个知识单元共同出现的频次为34),为了进一步动态跟踪突发公共卫生事件舆情环境中大众对这两个知识单元的认知过程,本研究结合第3.1节提取出的三元组集合来追踪“病毒”与“变异”两个知识单元之间的具体关联关系,如表3所示。研究结果发现,在突发公共卫生事件舆情讨论环境下公众的知识条目并不是固定不变的,公众的认知在事件的发展和公众的交流过程中存在转变,甚至是完全否定的变化过程。如在舆情讨论初期,t2和t3时间窗口下,公众所涌现出的知识条目认为新冠病毒不会发生变异;随着时间窗口的滑动,在t24时间窗口下,公众对所涌现出的“病毒不会变异”的知识条目产生了质疑;在后期,公众的认知发生转变认为该病毒会发生变异,甚至病毒变异速度将加快。

表3 时间序列下“病毒”与“变异”知识单元关联关系变化

5 结 语

三元组作为知识图谱常用的知识表示方法,可以描述真实世界中存在的各种实体或概念及其复杂联系。因此,在探究“如何表征突发公共卫生事件的舆情环境下的群体智慧”问题时,本研究利用三元组表示突发事件舆情信息中所包含的公众的知识条目,即以所提取的知识三元组集合来表征突发公共卫生事件舆情环境下公众的群体智慧,进而展开研究。基于舆情知识三元组、网络拓扑结构来分析群体智慧的涌现是否存在某种规律,本研究得出以下突发公共卫生事件舆情环境下的群体智慧涌现的规律特征。

(1)群体智慧涌现不仅贯穿于突发公共卫生事件与网络舆情演变的全周期,而且其对于群体智慧的表达与演变的贡献也要高于长期的知识积累。随着突发公共卫生事件的演变,群体智慧在较长时间的平缓且微量的积累后,会突现短暂的大幅增长。在突发事件舆情环境下群体智慧的分布明显存在重尾现象,即大多微博(或评论)含有较少的知识三元组,从少量微博(或评论)可以提取出较多的知识三元组。公众在突发事件舆情形成的过程中,倾向于参加评论形式下的讨论,但其所含知识密度较低,群体智慧的涌现主要集中在微博内容中。

(2)突发事件舆情环境下的群体智慧涌现过程中具有小世界性和稀疏性的特征。相对于同等规模的随机网络,舆情知识网络的巨分支具有较高聚类系数、较短特征路径长度的小世界性。舆情知识网络的巨分支涵盖知识节点以及知识关联关系的数量比例远小于领域知识网络,核心知识单元的数量以及比重并不多,这说明在突发公共卫生事件的舆情环境中,大众通过社交媒体进行交流、讨论,在一定程度上促进了群体智慧的涌现,但是所涌现的知识较为分散、稀疏,体现了大数据低价值密度的特点。

(3)在突发事件舆情环境下的群体智慧涌现过程中,知识条目具有动态属性,知识单元存在核心-边缘结构。随着突发公共卫生事件的发展,公众在讨论过程中所涌现的知识条目会存在被质疑、被否定的情况,即群体认知会发生转变。舆情知识网络的巨分支具有层次结构,知识单元存在核心与边缘之分,处于核心地位的知识单元至少与网络子群中其他7个核心知识单元存在直接关联。

本研究所得出的分析结论,不仅丰富了对突发公共事件舆情环境下大众行为研究的理论与方法,而且也有助于应急管理部门及时了解并引导舆情未来发展,防止事态蔓延与升级。另外,本研究工作也存在有待完善的方面,所选择的数据源尚不能穷尽所有类型的突发事件。因此,在未来的研究中将进一步采集更加全面丰富的数据资源,从多个角度对突发事件情景下的群体智慧涌现问题进行深入研究与探索。

致谢感谢图书情报国家级实验教学示范中心为本研究提供的实验支持!

猜你喜欢

三元组分支公共卫生
基于带噪声数据集的强鲁棒性隐含三元组质检算法*
特征标三元组的本原诱导子
关于余挠三元组的periodic-模
巧分支与枝
《首都公共卫生》征订启事
一类拟齐次多项式中心的极限环分支
《首都公共卫生》征订征稿简则
公共卫生服务怎加强
公共卫生监督不是“陪衬”
三元组辐射场的建模与仿真