APP下载

基于WOS核心集的舆情反转要点研究

2022-08-09周剑锋许国威李一夫

关键词:发文舆情聚类

周剑锋,许国威,李一夫

(1.武汉理工大学 安全科学与应急管理学院,湖北 武汉 430070;2.北京邮电大学 信息与通信工程学院,北京 100876)

据中国互联网络信息中心在2021年8月27日发布的第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,我国网民规模达10.11亿,较2020年12月增长2 175万,互联网普及率达71.6%,其中,我国手机网民规模达10.07亿,较2020年12月增长2 092万,网民使用手机上网的比例达99.6%,与2020年12月基本持平[1]。随着互联网高速的发展和网民群体的不断增长,网络新媒体也迎来蓬勃的发展。新媒体时代是一个信息爆炸的时代,其给网民带来及时、大量信息的同时也兼具了信息主观化、碎片化的特征,比较考验信息受众的辨别能力。网络舆情的传播速度随用户数量的提升呈幂指数增长,这使得大量虚假信息甚至谣言在移动互联网络中迅速放大,并通过羊群效应形成移动互联网络舆情[2]。在有些信息源缺乏完整性和真实性的情况下,受众往往容易被信息发布者的主观意识所影响,形成舆论跟风现象,进而造成真相揭开后反转的舆情事件。例如2016年一篇名为《罗一笑你给我站住》的文章刷爆朋友圈,作家罗尔“卖文”救助白血病女儿罗一笑,通过文章转发共筹集善款267万元,然而这一场爱心救助活动却是父亲罗尔的营销炒作。2018年走失的乐清男孩引发全网关注,相关微博话题阅读总量超过4亿次,但牵动全网的走失案竟是一场蓄意策划制造的虚假警情[3]。

目前学术界对网络舆情反转的概念尚未形成统一定论,有学者认为,网络舆情反转的本质是虚假新闻信息的发布和传播,是网络舆情中信息不对称的一种体现,反转实际上是事实的反转[4]。自媒体时代舆情反转事件相较于一般的舆情事件具备更多的不确定性和破坏性。由于反转事件的真相往往转变多次,导致舆情的关注度出现多次爆发,其引发关注的时间也随之延长。在信息难以辨识的情况下,网民极易被错误虚假的信息所裹挟,致使舆论环境陷入混乱之中。长此以往,导致网络环境恶化,媒体缺少社会信任,政府缺失社会公信力甚至形成动乱。因此,面对当前舆论环境建设的严峻挑战,对于舆情反转的预测、监控和治理具备重要意义。

在当前研究中,针对舆情反转研究热点和研究趋势进行相关分析的文献尚少,在此笔者开创式的采用文献计量学的方法,在次领域对相关文献进行检索和研究。主要研究方法是利用Citespace软件对舆情反转相关的文献进行聚类分析并将其可视化呈现,探索舆情反转领域近年来的发展状况和前沿方向。通过对舆情反转相关文献的作者合作、机构合作、共性关键词等方面聚类分析,为舆情反转领域的探索研究提出相关建议。

1 数据与方法

1.1 数据来源

为客观地描述舆情反转研究的要点和研究前沿,笔者以Web of Science数据库为数据来源,在该数据库进行检索。文献检索条件为“主题:(reversal of public opinion)OR主题(public opinion reverse)OR主题(public opinion reversal)OR主题(reversal of public sentiment)”。限定文献年限为2011-2021年,数据库为“Web of Science核心合集”,由于目前该研究方向处于上升阶段,所命中的相关文献大多集中在几个领域内且存在普遍学科交叉的现象,故经综合考虑,剔除少量不相关研究领域后留下“social sciences”,“technology”,“arts humanities”三个具有较高代表性,文献量较多且主题内容与网络舆情相关性较强的三个主要领域,为保证数据的精确性和完整性,经过人工进一步筛查,共命中351个检索结果。

1.2 研究工具和方法

文献计量法是以学术文献为研究对象,从定量的角度分析文献规律,展现学科研究热点与发展趋势的一种研究方法[5]。其常用的分析软件包括BibExcel、Citespace、Citeexplorer、VOSviewer和Gephi等。其中,Citespace因其简单的操作方式、简洁的控制面板、标准化的切片功能及效果较好的可视化输出结果成为目前学界主流研究工具。

CiteSpace是美国著名华裔学者陈超美应用Java语言开发的一个可视化软件,它主要基于共引分析理论和寻径网络算法等。作为一种可视化分析软件,CiteSpace能够绘制共词聚类图谱和时区视图,优点在于它能够通过对前沿术语进行算法运算,动态识别共引聚类和研究热点[6]。

笔者选择CiteSpace作为舆情反转研究的主要分析软件,主要研究过程是:在Citespace中导入SCI文献数据,首先对文献样本进行去重(remove duplicates)操作,然后将其导出,选择时间切片(time slicing)为2011.1-2021.12,之后依次对作者(author)、机构(institution)、关键词(keyword)、共被引文献(reference)、共被引作者(cited author)进行聚类并可视化,对计算结果进行分析,探索舆情反转领域的研究前沿热点和发展现状等。

在研究过程中很重要的一个方法是聚类分析。聚类分析是一种以关键词之间的共现强度为基础,利用聚类的统计学方法,将众多分析对象之间错综复杂的共词网状关系简化为数目相对较少的若干类群之间的关系,并直观地表示出来的聚类的过程[7]。

2 舆情反转领域研究概况分析

2.1 文献年代分布

文献的发文量年度趋势的变化是分析该研究领域研究进展和状况的重要参考指标,如图1所示。近10年来网络舆情反转研究的发文量在整体上呈现上升趋势。数据显示,在2015年以前,该研究领域内的发文量较为稳定,数量都维持在26篇左右,可以看出2011—2014年是一个平稳发展的阶段。在2015年,发文量迎来小幅上升之后于2016年迅速回落,并触底十年来最低点,2016年度发文量仅占据总发文量的5.41%。2017—2021年年均发文量要明显多于2014年之前:其中2017年度发文37篇,占总发文量的10.54%;2019年发文30篇,占总发文量的13.67%;2019年发文45篇,占总发文量的12.82%。数据统计表明,受网络及自媒体发展的影响,舆情反转研究领域迈入了一个新的发展阶段。

图1 网络舆情反转研究发文量年代分布(2011-2021)

2.2 国家(地区)及研究机构分布

图2为舆情反转研究领域国家(地区)分布及合作知识图谱,不同的国家(地区)合作发文量以年轮形式可视化呈现,根据年轮的大小可直观看出发文量的数量对比。将节点阈值设定为7,共得到节点64个(Nodes=64),连线121条(Links=121),图中圆形节点的大小代表了各国家(地区)发文量的多少,节点的年轮越大,颜色越深代表该国家(地区)文献发表数量就越多;两个国家(地区)的节点之间连线越多,颜色越深就代表了在该领域内双方合作越为紧密。重点国家(地区)发文数量及中心统计度情况如表1所示。

图2 国家(地区)合作网络图谱

表1 重点国家(地区)发文数量及中心统计度表

如图2所示,代表美国(USA)的节点最大,年轮颜色最深,其次则为英国(ENGLAND)、中国(CHINA)、德国(GERMANY)和加拿大(CANADA)。再根据表1可知,美国发文数量为132篇,中心度为0.48,两项指标都占据了主要地位;排名第二位的英国发文量为24篇,与中国(23篇)持平,但是中心度达到了0.32,属于重要节点之一。按发文数量排名前五的五个国家之间连线颜色较深,路径形状较为粗壮,节点之间联系紧密,表明这五个国家是舆情反转研究领域内的主要核心研究地区,同时可以看出,发文量在7篇以上的国家无论是网络发展速度还是科研的水平都处于世界领先地位,由此可知,舆情反转的研究进展与国家的网络及经济发展水平息息相关,对于网络发达的国家,其面对的舆情问题更为严峻复杂,就催动了该国家相关领域发展的快速成长。我国虽然发文量居于第三位,但是中心度只有0.05,说明我国学者所发表的文章质量还需要进一步提高。

3 舆情反转领域的知识图谱分析

3.1 关键词共现分析

词频分析法是利用关键词在某一研究领域文献中出现的频次数量来确定该领域研究热点和前沿动态的文献计量方法。关键词是科学计量研究的重要指标[8],可根据关键词出现频次高低来了解国外对某一研究领域的研究热点[9]。Citespace软件中设定阈值TopN=50,TopN%=10,得到节点319个(Nodes=319),连线669条(Links=669)的关键词共现网络图谱(图3)。在图3中,节点以年轮方式呈现,每一个不同的节点代表了一个不同的关键词,节点年轮的大小就代表了该关键词出现的频次高低,在两个节点之间的路径粗细代表了两个关键词之间联系的紧密程度。由图3节点大小可以看出,形成了以“public opinion”(公众舆论)为核心的一个热点关键词图谱。除此之外,在热点视图中出现频次较高的关键词还有“attitude”(态度倾向)23次、“impact”(影响)18次、“model”(模型)17次,“politics”(政策)16次、“information”(信息)14次及“decision making”(决策)14次等,这些出现频率高的关键词在一定程度上就代表了10年间舆情反转领域内的研究热点。

如表2所示,将2011-2021年间所统计相关文献中的关键词按出现的频次高低及中心度由高到低按顺序排列而成。“public opinion”(公众舆论)作为主题词成为了最高频的关键词,紧随其后的是“attitude”(态度),而该关键词的中心度也达到了0.23,由此可以看出,十年来热度最高的关键词就是“attitude”(态度),舆情反转领域的研究与此息息相关。有学者认为,受众在获得特定信息后对事件作出的相反论定,通常情况下舆论反转会发生在事件发生后的不同阶段,而受众在各个阶段表现出来的观点也存在着巨大差异,舆论反转往往借助于特定的媒介载体进行传播[10]。对于舆情反转事件的研究,在一定程度上即为对信息受众观点和态度转变的研究,针对信息受众态度的转变过程,有大量学者进行了研究。如夏一雪等[11]在建模的过程中考虑了微博用户言论转变的价值性和话题性,分析了用户在事件发酵中的重要性,证明了其所拥有的影响力。

出现频次排在第三位的关键词是“impact”(影响),其中心度为0.23,是该研究领域内较为重要的研究热点之一。在舆情反转领域内,热点词“impact”(影响)不仅代表了事件本身的影响,也包含了事件传播中参与人的影响力。对于出现反转或者可能出现反转的事件来说,往往意味着事件影响逐步扩大并多次达到关注高潮,而且本身就属于能造成巨大社会影响的一类事件,所以对于舆情反转的研究要额外的关注事件影响力的动态。而在事件的传播过程中,可以称为网民态度风向标的一类人叫作“意见领袖”。新媒体时代,社会舆论传播呈现出新的形态,舆论管理呈现出前所未有的复杂状况,网络媒体中的“意见领袖”、“把关人”发挥着网络舆论监督、舆论引导的巨大作用。大众信息传播所必经的渠道中,“意见领袖”居于核心位置,即“大众传播—意见领袖—一般受众”[12]。无论是国内还是国外,意见领袖们的言论都会给事件的传播和发展带来巨大的影响,也会对网民对于该事件的态度产生直接的影响。因此,面向事件及参与人影响的研究也逐渐成为了主要热点之一。

在表2中,按中心度排序来看,相对重要的关键词还有“decision making”(决策)与“information”(信息),其中心度分别为0.28和0.21。信息与决策密不可分,因此两个热点词可归为一类分析。信息的权威性、充分性和多样性对于决策的作出至关重要,而决策作为信息的反馈,从侧面也反映出了信息的真实性和完整性。在事件的传播过程中,舆论的发展方向也取决于信息的来源和传播,有学者认为,信息的不完全、信息获取的不平等和不真实是导致舆情发生逆转的主要原因之一。

3.2 关键词聚类分析

为了进一步研究网络舆情反转相关的研究热点及关系,考察关键词的归类与集合,使用Citespace软件自带的LLR算法对文献关键词进行聚类,经过多次对阈值合理的调整与试验,得到Modularity Q=0.595 5>0.5,表明聚类结果具有很高的可信度,Weighted Mean Sihouette S=0.863 8>0.5,说明聚类是合理的[13]。通过对关键词聚类信息的进一步探索,整理出前10位最大的聚类群组和其包含的主要关键词,代表了2011-2021年间网络舆情反转的主要研究领域,舆情反转研究的文献共词聚类标签视图如图4所示,聚类标签信息表如表3所示。

表3 聚类标签信息表(2011-2021)

在10个聚类中,由于最后两个聚类包含文献节点不足10篇,故不纳入研究范围。经过深入分析聚类之间的共性,再对高频次和高中心度关键词进行整合统计,可将舆情反转领域研究热点大致分为3个大类,在该领域的当前研究中具有很高的代表性和延展性。

(1)以民众为中心的舆情反转事件分析

大类Ⅰ包含聚类#0 educative effect, #1 online public opinion,#5 weight rank reversal三个聚类,其中共现词有:citizenry,vote,reversal event,decision making。信息受众作为舆情传播的主体部分,也是最大的数据样本来源,学界一般是将其作为一个整体去研究。无论是网络意见领袖还是普通网民,信息受众的决策往往能够在极大程度上影响舆论的发展方向和速度,所以在事件中对于民众行为的分析是整个舆情反转事件分析的基础部分。

(2)新媒体影响下的舆论反转变化特征研究

从聚类#2 thematic analysis和聚类#3 longitudinal study的关键节点分析可得,两个聚类共现词包括了:media tone,reverse logistics,policy,behavior,大类Ⅱ的研究重点是以媒体在事件传播中的行为和影响为主。一般情况下,网络舆情反转事件传播的起始不一定来自于媒体,但是媒体往往是传播过程中由慢到快,影响力由弱至强的关键节点,可以说网络媒体起到了事件“扩音器”的作用。互联网时代由于媒体素质的良莠不齐,在信息来源未确认,信息并不完整的情况下,事件经过媒体的大肆宣传而迅速发酵,在网络上形成舆论风暴,造成不好的影响,形成反转现象,对于事件盖棺定论的多数是官方媒体的功劳。因此,从媒体的角度出发,研究舆情反转事件中的这关键一环意义重大。

(3)特定领域内的舆情反转事件探索

聚类#4 public perception,#7 duditor conservation和聚类#6 specialized psychiatric inpatient unit分别探究了商业领域及医疗领域的舆情反转案例。对于医疗领域来说,有关舆情反转的研究出现较早,文献平均年份为2012年,属于起步较早的研究领域;对于商业领域来说,研究文献平均年份在2016年,出现较晚但是文献数量众多,研究内容也涉及到了商业政策、商业法律及股市等,属于新兴的热点研究方向。对于特定领域的舆情反转研究更加具备专业性和针对性,有助于对具体案例进行更加专业的分析和深入的探索。

3.3 研究前沿分析

CiteSpaceⅣ软件中的膨胀词探测(burst detection)技术和算法,通过探究主题词词频的时间分布,将其中频次变化率高的词(burst term)从大量的词中探测出来,依靠词频的变化趋势可以预测今后体育仲裁研究的发展趋势[14]。基于此,笔者对关键词进行了突变检测,得到突变词表4,表4中罗列了突变强度最高的前8个关键词,研究主题的活跃度与关键词的突变强度呈正相关。

表4 2011-2021年舆情反转研究领域突现词表

从表中我们可以清楚的看到10年间的研究前沿动态和发展历程。从2011年起到2014年为研究发展的第一阶段,此时的研究主要以定性分析的形式发展,在此期间,突变词出现频率远胜后来的年份,以“政治”“媒体”“交流”等为主,舆情反转作为一种较为前沿的研究理念,这个时期的主要研究方向集中在对政策的研判和对网络媒体的探索。从2014年开始,舆情反转领域的研究呈现多点开花的状态,新兴的研究方向包含了“系统理论”“风险”及“信息与决策”等。首先是在互联网发展的大势下网民也随之增多,学者渐渐认识到舆情的反转更多受到了来自信息受众的影响,因此开展对普通网民的研究十分必要。其次,从研究方法上也产生巨大的转变,在此之前的研究以定性分析为主,主要是偏向于心理学和新闻学两个学科板块;之后的研究更多的是采取定量分析的方法,引入数学模型和系统理论,充分利用计算机技术的发展,文献来源更偏向于信息与技术板块,说明了在这一时期研究热点正在朝着另外的方向蓬勃发展。

4 结论

笔者运用文献计量学方法,利用CiteSpace软件对Web of Science核心集数据库中2011-2021年间网络舆情反转领域相关的文献进行可视化分析,研究得出结论如下:

(1)有关舆情反转的研究对舆情的预测、治理和控制具有重要意义,该领域的研究成果在2016-2017年有明显的增长,进入了发展的新阶段,受到了学界更高的关注;但总体来说,现今国外高水平相关研究文献数量依旧偏少,有待更多学者进行相关研究和探索。

(2)参与网络舆情反转研究的国家和地区较多,其中影响力较大的经济发展都较为迅速,这些国家和地区网络发达,舆情环境发展迅猛,因此催生出大量舆情相关的研究成果。现阶段进行舆情反转领域的研究机构分布广泛,以各大学及其下属研究机构为主体,各单位之间研究方向和内容大相径庭,彼此之间合作较少。在未来有待加强合作,形成研究共识。

(3)知识图谱表明,研究主题词为“public opinion”“attitude”“impact”“model”等。关键词共现图谱呈现多极化分布,其结构凌乱,研究方向百花齐放但是研究深度不够,在未来研究者们在各自的研究领域内需深耕以提升研究纵深。针对舆情反转领域内的研究,图谱表明现有研究成果可以归结在民众、媒体及特定领域三个方面,分别对应了舆情传播过程中的基础部分、传播途径和事件本身,从三个角度出发都可以对舆情反转进行深刻的探索和剖析。

(4)结合关键词突显图表可以看出10年间舆情反转领域的前沿发展和动态。随着技术的发展,相关研究方法大体上从定性分析逐步转变为定量分析。研究从“政治”“媒体”“交流”等主题,到“系统理论”“数据挖掘”“信息与决策”等主题,体现了舆情反转领域的研究正向信息化、系统化方向发展。在未来,学者们需将研究与大数据技术结合,引入更为精确的数学模型和系统理论,合理利用计算机和信息技术的技术支撑,开拓更多的研究方向与主题,提升研究广度并加深研究深度。

猜你喜欢

发文舆情聚类
七部门联合发文 进一步完善和落实积极生育支持措施
一种傅里叶域海量数据高速谱聚类方法
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
校园拾趣
爷孙趣事
以牙还牙
数字舆情
数字舆情
消费舆情