1998-2019年国内舆情研究热点及主题演化可视化分析
2021-06-10张福俊李玉华张海艳
张福俊 李玉华 庄 晓 张海艳
(1.山东科技大学图书馆 青岛 266590;2.山东科技大学计算机科学与工程学院 青岛 266590)
0 引言
《舆情学》中对舆情的定义为:舆,公众也;情,情绪也[1]。传统时代的舆情结构简单,传播途径单一,多以民众街头巷尾的议论为存在形式,而以互联网平台为依托的网络舆情作为社会舆情在互联网空间的映射,能够搭载海量数据,实现舆情快速多维的传播。根据中国互联网络信息中心(CNNIC)最新统计数据,截至2019年6月,我国网民规模达8.54亿,互联网普及率达61.2%。日新月异的科技手段和庞大的网民数量为网络舆情的诞生和繁荣提供了保障,网络舆情正以空前的速度迅猛发展,与此同时,诸如信息真假难辨、网络噪音干扰等诸多社会问题接踵而至。
因此,越来越多的研究者把目光转向了网络时代舆情的监控与防治,从新闻学、社会学、情报学等学科角度出发,探究新媒体环境下舆情治理新模式。如张宝生等[2]以CNKI数据库为数据源,利用Citespace软件识别出网络舆情基础理论、网络舆情传播渠道、网络舆情政府治理和高校网络舆情4类舆情研究热点;刘岩芳等[3]使用文献题录工具SATI进行数据预处理,基于共词矩阵联合可视化技术,对高频词共现矩阵进行网络关系研究和聚类分析;陈叶叶等[4]对2006-2015年国内网络舆情研究的热点研究主题及重要前沿趋势进行挖掘;李永忠等[5]基于共词网络分析法,分阶段对网络舆情共词网络结构进行研究,通过学科知识网络可视化,展示并对比了国内外网络舆情各阶段的研究热点和演化情况。
基于上述情况,本文应用文献计量学和共词网络分析方法,借助Citespace软件对CSSCI数据库收录的我国1998-2019年发表的舆情研究文献进行可视化分析,以梳理舆情领域研究主题发展脉络,探究舆情领域研究的热点、现状及未来发展趋势,以期对我国舆情研究领域的发展有更加直观清晰的认识。
1 数据来源与研究方法
本研究选取中文社会科学引文索引数据库(CSSCI)作为数据来源,以“舆情”为检索词进行全字段检索,检索时间范围设置为1998-2019年,共检测出舆情相关文献1 742篇,经过比对筛选、数据清洗和格式转化,最终得到有效文献1 697篇。
应用文献计量学方法和Citespace可视化工具了解国内舆情发展基本脉络和未来发展趋势。绘制关键词共现网络和文献共被引网络等科学知识图谱,采用共词分析原理和关键词聚类算法挖掘当前研究热点,梳理近年来舆情研究主题演化路径,识别未来舆情研究的重点方向。
2 研究结果与可视化分析
2.1 发文量年度分布
文献发文数量的变化可以直观的反映某学科在特定时间段内研究热度的变化,是衡量该学科在该时间段内发展态势的重要指标[6]。根据发文时间对舆情领域1 967篇文献进行统计整理,绘制1999-2019年舆情研究领域年度发文量趋势图,如图1所示。
图1 1999-2019年舆情研究领域发文量年度统计
由图1可知,我国舆情研究在2008年以前发展缓慢,2009-2014年处于快速上升期,2015年以后处于长期的平稳发展阶段。2003年之前关于舆情研究的文献极少,多以新闻报道为主要表达形式,并未有学者对舆情进行系统的理论研究,而2003年非典的爆发使得研究界注意到舆情领域的空白。南京大学杜骏飞在《流言的流变:SARS舆情的传播学分析》一文中提到了以“手机短信”为代表的新媒体势力对传统主流媒体的推动作用。此后的几年间,中国网民数量呈现逐年快速增长的趋势,关于舆情研究的文献也逐步增多。直至2008年,中国的网民数量超过美国,跃居世界第一,加之同年北京奥运会、汶川大地震等重大事件的发生,舆情领域的研究文献实现了翻倍式增长,2009年新浪微博的普及为网络舆情的发展提供了广阔的平台。此后五年间,各界学者对舆情的研究热情空前高涨,发表的文献数量呈高速发展,2014年,仅收录在CSSCI来源期刊中的舆情文献已达到207篇。2015年至今,舆情领域研究趋于平稳,文献发表数量随当年有无热点事件发生而上下波动,但总体维持在一个较高水平,进入长期稳定的发展阶段。
2.2 作者发文与合作情况
论文作者是研究领域产出主体的最小单元[7],也是某一科学领域研究的直接贡献者。运用Preiss定律[8]计算舆情研究领域的核心作者,即高产作者群中最低产作者的发文数量(MP)为最高产作者发文数量(NPMAX) 平方根的0.749倍,计算公式为1999-2019年舆情研究领域作者发文量最大为47篇,取整后为5,因此本文将论文发表量在5篇以上的作者认定为舆情研究领域的核心作者。
舆情研究文献中共有作者458人,发表5篇以上文章的作者52人,占作者总人数的11.4%,核心作者累计发文量552篇,占总发文量的32.5%,距离50%仍有较大差距,因此,我国舆情研究领域尚未形成严格意义上的核心作者群[9]。导出发文量排在前十位的核心作者统计表,如表1所示。为进一步展现作者间的合作关系,利用Citespace软件绘制舆情研究领域作者合作网络知识图谱,如图2所示。
表1 舆情研究领域高发文量作者(前十位)
图2 舆情研究领域作者合作网络
在作者合作网络中,节点大小代表论文产出数量,作者之间的连线表示合作关系。从核心作者发文量来看,福州大学陈福集教授在舆情研究领域发表的文献最多,总发文量达到47篇,其主要研究方向为网络舆情和数据挖掘,中国人民警察大学兰月新教授总发文量为45篇,主要研究方向为网络舆情;重庆大学曾润喜教授发文35篇、吉林大学黄微教授发文30篇、中国人民警察大学夏一雪教授发文量25篇。从高产作者之间的合作关系上来看,陈福集教授仅与华侨大学郭韧教授形成合作关系,兰月新教授与夏一雪教授合作关系较为密切,而与曾润喜教授之间的合作关系较微弱。对舆情研究领域作者的中心度进行计算后发现,兰月新和曾润喜两位教授的中心度为0.01,其余作者均为0,这说明在作者共现合作网络中,以上述两位作者为中心形成的学术研究联盟相对紧密,而其他作者之间的联系较弱,大多未形成科研合作团队。对作者所属机构分析可知,尽管高校为舆情研究的主阵地,但目前各高校之间的联系较弱,我国舆情研究领域尚未形成规模较大的研究机构和科研团队。
2.3 作者共被引分析
借助Citespace软件绘制我国舆情领域文献作者共被引知识图谱,可视化结果如图3所示。对舆情领域作者被引频次进行统计,排在前十位的作者如表2所示。由表2和图3可知,重庆大学曾润喜教授总被引次数达到246次,为舆情研究领域被引频次最高的作者,其主要研究方向为政治传播和网络舆情。高被引作者排在第二位的是唐山学院刘毅,其总被引频次为239次,研究方向为新闻与传媒;天津社会科学院王来华被引159次,位于高被引作者第三位,排在第四位和第五位的分别是中国人民警察大学兰月新153次、北京师范大学喻国明131次。综合作者发文情况来看,同为高产和高被引作者的共有五位,分别是曾润喜、兰月新、陈福集、王国华和朱恒民,可以认为上述作者为舆情研究的权威性作者,而从突变强度来看,夏一雪、黄薇、张鹏等作者突变强度较高,成为舆情研究的新兴力量。
表2 舆情研究领域高被引作者(前十位)
图3 舆情研究领域作者共被引网络
2.4 文献共被引分析
在一段时期内被引的次数可以反应出该文献在相关领域内的重要性和影响力,被引频次高,说明文献占据着重要位置或得出过重要结论[10]。Citespace可以提供科学直观的可视化引文文献信息,使研究者直观地辨别出学科前沿的奠基性文献与核心文献[11]。经统计可知,与舆情主题相关的1 696篇论文共引用了17 822篇参考文献,以参考文献为节点,提取1999-2019年每一年中被引TOP 50的论文,构建由615条参考文献和1 494条共被引关系组成的共被引网络,以此挖掘参考文献中由于成对引用而形成的共被引关系。图4所示的引文网络中展示了被引频次不少于10次的文献信息,包括作者和发表时间,表3列出了被引频次排在前十位的参考文献。
表3 舆情研究领域高被引作者(前十位)
图4 舆情研究领域文献共被引网络
由文献共被引网络和被引频次表可以看出,被引频次排在第一位的是曾润喜于2009年9月发表的《网络舆情管控工作机制研究》,文章提出健全网络舆情管控工作机制[12],加快制定应急预警法案、利用网络舆情规律不断完善网络监控体制、改善国家社会关系,为后续学者思考舆情监测和舆论管控提供了研究方向。排在第二位的是刘毅在2007年发表的《略论网络舆情的概念、特点、表达与传播》,该文献对舆情的定义、特征和传播方式进行了系统梳理[13],奠定了舆情研究的理论基石。陈波在2011年发表的《泛在媒体环境下的网络舆情传播控制模型》中,提出建立SEIR舆情传播控制模型[14],从网络舆情传播环境入手,在舆情形成初期进行干预,该文献引用量为29次,位于第三位。排在第四位的是张一文于2010年发表的《网络舆情与非常规突发事件作用机制——基于系统动力学建模分析》,该文利用系统动力学建模认识非常规突发事件涨落规律,分析系统中作用主体之间的相互影响关系[15], 从而控制非常规突发事件网络扩散和舆情传播。曾润喜2009年发表的《网络舆情突发事件预警系统、指标与机制》引用频次排在第五位,他提出在建立网络舆情分级预警机制的基础上,构建警源、警兆、警情三类指标体系[16],同时建立网络舆情突发事件预警机制的组织体系和制度体系。
对舆情文献共被引网络进行聚类分析,文本挖掘算法选择LLR,提取各聚类施引文献的关键词中能够表征对应参考文献的术语,作为聚类标签。据聚类中所含文献数量进行排名,选取前20个聚类,如图5所示。轮廓(silhouette)取值范围为[-1,1],越接近1,说明这个聚类的主题越明确,聚类内文章内容越相近,网络的同质性越高。由表4可知,本次聚类中mean silhouette取值均大于0.7,说明聚类主题较明确,聚类结果具有高信度。
表4 舆情研究共被引文献聚类信息
?
图5 舆情研究文献共被引聚类图谱
从高被引文献的聚类结果看,被引频次较高的文献研究重点主要集中在以下三个方面:(1)利用挖掘算法等先进手段,从社会舆情中识别当前舆论热点,对舆情的传播规律进行探究。如聚类#1、#2、#3,代表性关键词包括web日志、垂直搜索、情景模型;(2)探讨舆情监管机制,加强网络舆情治理,建立多方评价机制,对网络中的言论进行甄别和筛选,代表性聚类#8、#9、#13,相关关键词如风险预警、谣言治理、引控系统等。(3)从舆情治理研究的参与主体及其相互间关系入手,对新媒体、大学生、政府等舆情参与对象展开研究,如聚类#6、#14、#17,代表关键词如政府网媒、自媒体、网络推手。
3 舆情领域研究热点与前沿
3.1 研究热点分析
共词分析法属于内容分析法的一种,通常用来分析某一个学科或研究领域内不同的专业词汇在同一篇文献里面的共现情况,其共现频次和关联程度成正相关,能够反映出该学科或领域的研究热点和发展趋势[17]。选取文献数据中的关键词作为节点,分别构建舆情领域关键词共现网络和关键词聚类知识图谱,如图6和图7所示,表5为舆情领域排在前20位的关键词词频统计结果。
表5 舆情领域关键词词频统计表(前20)
图6 舆情研究领域关键词共现网络
图7 舆情研究领域关键词聚类知识图谱
根据聚类和关键词统计结果,近年来我国舆情研究的热点主题大致可分为以下五类:
(1)舆情理论和传播机制研究。包括舆情的蔓延规律、传播途径,舆情主题演化的机制机理以及近年来学者开展的研究活动等,重点关注舆情的内在特征和外在交互手段,对舆情的传播发展进行正确引导。如姜胜洪2008年发表的《网络舆情热点的形成与发展、现状及舆论引导》、陈福集2015年发表的《基于演化博弈的网络舆情热点话题传播模型研究》等相关论文,
(2)舆情信息挖掘和分析监管研究。运用k-means、bp神经网络等数据挖掘算法,从大量信息中提取舆论热点,开展舆情监测和预警,健全舆情监管机制,建立科学的评价体系。代表文献如吴绍忠发表的《互联网络舆情预警机制研究》和张一文《非常规突发事件网络舆情热度评价指标体系构建》。
(3)社交网络平台舆情研究。以微博、微信等社交网络平台为依托,根据平台特点探索其舆情扩散规律,建立针对性的管控机制,引导舆论积极健康发展。代表文献如兰月新2013年发表的《突发事件微博舆情扩散规律模型研究》以及夏一雪2017年发表的《面向突发事件的微信舆情生态治理研究》。
(4)舆情主体关系研究类。通过分析政府网媒、网民、自媒体作者等舆论主体间的关系,建立多主体模型及多方干预机制,营造和谐健康的网络舆情环境。如刘志明于2011年发表的《微博网络舆情中的意见领袖识别及分析》以及陈福集2013年《三方博弈视角下的网络舆情演化研究》。
(5)针对特定对象或突发事件的研究。包括在传染病、地震等突发公共事件中如何快速甄别信息,正确引导舆论以及如何建立大学生网络舆情监控机制等问题。代表文献如张义庭《信息化环境下高校网络舆情与危机管理研究》以及兰月新《突发事件微博舆情扩散规律模型研究》。
3.2 舆情领域主题演化路径和前沿分析
突变术语是指一个学科内突然发生变化的专业术语,表现为在某些年份发表文献中骤增,可用来表征研究前沿[18]。根据Kleinberg在2002年提出的突现检测算法[19],对舆情领域的研究文献进行关键词突现检测,将检测到的术语按照突变年限进行排序,形成舆情领域关键词突变演化表,如表6所示。时区视图, 是以时间为横坐标进行时区分割, 通过对某个知识领域进行时序“抓拍”, 并将这些分时抓拍的图片连接起来, 形成历时性研究视角下的知识图谱[20]。时区图又称为主题路径图,圆圈代表关键词,线条代表关键词之间的联系,节点所在位置表示关键词首次出现的年份。在主题路径图中,可以清晰直观的展示某个领域研究主题随时间的变化趋势。图8为1999-2019年舆情领域研究的主题路径图,根据关键词的突变情况和研究主题的变化趋势,可以看出近年来我国舆情研究的主题演化和前沿趋
图8 舆情研究领域主题路径图
表6 舆情领域研究关键词突变演化
由表6和图8可知,2003年非典的爆发,使更多的人注意到网络和手机短信等新媒体方式在舆情传播中的作用,而2004年恰逢中国互联网诞生十周年,于是“互联网”作为关键词首次出现在舆情研究的文献中,2005年,“网络舆论”一词诞生。2006年,如何对网络内容及舆情核心元素进行甄别和分析成为一个新的研究方向,与此同时,随着信息化的发展,作为传统信息服条中心的图书馆开始寻求新形势下的转型,网络新闻成为当时的热门。2007年网络舆情被正式提出,昭示着舆情产生与传播的方式从报纸等传统媒体逐步实现了向网络等新媒体的转化。由于2008年先后发生雪灾、汶川地震、毒奶粉事件等重大突发事件,加之2009年新浪微博开始普及,各界学者开始思考建立舆情预警机制,加强政府在舆论引导方面的专业性和高效性。2010-2011年,网络、政府、预警、引导等关键词开始发生突变,舆情研究领域涌现出包括突发事件、高校、新媒体等舆论研究主体以及舆情引导、舆情监测、预警等众多研究热点。2012-2014年,随着移动社交平台的传播力和影响力逐步扩大,新浪微博成为用户众多的综合性舆论场域,同时带动了政府官媒的入驻,高效透明的政条微博出现在大众视野。在这一阶段,大数据开始出现在舆情研究领域,庞大的数据量在推动社会发展的同时也为网络谣言的产生提供了便利,大数据时代舆情的传播、引导和管理成为学者研究的新问题。2015-2016年,研究的热潮转向应用系统动力学、仿真学等方法建立网络舆情风险模型以及对网民观点进行情感倾向性分析。2017年至今,伴随着5G技术的发展和全媒体时代的到来,在新形势下增强政府对突发事件的应对能力、加强政治安全、维护国家形象成为舆情领域新的热点。
网络舆情发展的前沿方向与其特点密不可分,舆情的自由性给与了所有人自由表达自己观点的权利,由此使得不同群体的价值观纷纷呈现;舆情的交互性各种价值观相互交汇、相互碰撞;舆情的多元性体现在主题宽泛、主体众多,其话题涉及社会生活的各个方面,其参与主体也覆盖社会各阶层和领域,舆情的偏差性表现为参与在其中的主体极易受某些情绪化和感性化言论的影响,从而发展成有害舆论;舆情的突发性是指舆论的形成往往非常迅速,一个热点时间的存在加上一种情绪化的意见,就可以迅速成为点燃一片舆论的导火索。基于上述五个特点,结合近年来舆情发展的热点话题,不难看出,网络舆情发展的前沿方向包括以下几个方面:
(1)传统主流媒体在意识形态领域的引领作用将有所加强。近年来,门槛低、受众广、影响力大的自媒体相继涌现,争先在热点事件发生的第一时间表达自己的观点,由于缺乏对事件系统的了解和客观的评价,带有感性化和情绪化的言论往往有失偏颇,这也导致了“舆论反转”现象的出现。面对这一现象,传统主流媒体的引领作用显得尤为重要,在铺天盖地的舆论中,通过政府媒体对事件的客观陈述和全面解读,使主流媒体取得舆论阵地主导权,奏响主旋律。因此,新时代需利用好新媒体,加快建设主流媒体,传播主流声音。
(2)继续完善舆情监测系统,提高网络治理能力。互联网背景下,更应该加强政治敏感度,针对矮化英雄、黑化历史的事件要加强警觉,优化舆情检测系统,坚持质量导向,摒弃流量导向,向社会和公众传播正能量,维护国家、民族的统一安定,加强对网络谣言和不法言论的治理力度。
(3)建立快速反应的舆情应对机制。面对突发事件,行之有效的舆情应对机制可以在黄金24小时内最大限度地做出应对,避免负面言论的发酵和扩散。事前建立完善的突发事件预案,借助大数据、人工智能等先进的新技术建立完善、智能化、全面的系统化监测应对体系,为突发舆情管理应对工作抢占先机。
4 结论
本文应用文献计量学和知识图谱可视化分析方法对我国1999-2019年CSSCI收录的舆情相关文献进行统计分析,得到如下结论:
(1)从舆情发展阶段的整体脉络来看,我国对舆情的相关研究始于1999年,迄今已有20年的发展历程。最初依托报纸、杂志等传统媒体以新闻报道的形式对时事热点进行评述,随着网络时代技术的发展,“人人都有麦克风”的网络领域成为舆论产生和传播的主阵地,而大数据、全媒体、5G技术的到来,引发了网络舆情向大数据舆情的新一轮转化。
(2)从舆情领域年度发文量来看,我国舆情研究在2008年以前发展缓慢,2009-2014年处于快速上升期,2015年以后处于长期的平稳发展阶段。从作者的发文情况及合作关系上看,高产作者之间的合作关系并不密切,尚未形成严格意义上的核心作者群,对作者的所属机构进行统计后可知,目前我国舆情研究领域尚未形成规模较大的研究机构和科研团队。
(3)从舆情领域高被引文献来看,被引频次较高的文献研究主题可以划分为3大聚类,以#0模式识别为代表的舆情热点挖掘研究、以#9安全评估为代表的舆情监管机制研究,以#14三方博弈为代表的舆情参与主题治理研究。
(4)从舆情领域研究热点来看,我国舆情研究的热点可分为五个方面:舆情理论和传播机制研究、舆情信息挖掘和分析监管研究、社交网络平台舆情研究、舆情主体关系研究以及针对特定对象或突发事件的研究。
(5)从舆情领域主题演化路径和前沿探测来看,舆情研究受到科学技术手段和社会环境变化的影响。随着5G时代的到来,大数据舆情的交互性和多元性更加显著,如何增强政府对舆情的监管治理,充分发挥主流媒体的正能量引导作用,建立健全突发舆情应对管理体系,提高网民对信息甄别的能力,以及在面对重大网络舆情危机时,如何准确的掌握舆情动态,积极引导社会舆论都将成为研究者的新课题。