基于社会网络分析的网路舆情管理研究
2015-09-11王顺晔刘大勇
王顺晔++刘大勇
摘要:随着网络技术的繁荣发展和网络用户的不断增加,网路言论更加自由,加强网络舆情的研究分析和管理导控就显得尤为必要。论文介绍了网络舆情及社会网络分析方法的基本知识,研究了用社会网络方法进行网络舆情分析的一般过程,并选取具体实例进行分析。其次采用社会网络方法中的重要指标,如网络密度、凝聚子群、度、网络直径、聚类系数等进行了定量分析,尤其分析了网络中各节点的度分布特征和中心性。最后,对网络舆情的管理监督给出意见建议。
关键词:网络舆情;社会网络分析;Ucinet
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)17-0038-03
Research on Management of Network Public Opinion Based on Social Network Analysis
WANG Shun-ye, LIU Da-yong
(Langfang Teachers University, Langfang 065000, China)
Abstract: With the development of the network technology and the increase of the network users, the network opinion becomes more and more freedom. So research and analysis, guidance and control of the network public opinion are becoming more and more important. This article introduces the network public opinion and the social network analysis method, explains the general process of the network public opinion through social network analysis method, calculates the normal attributes such as density, components, especially weak-components and strong-components, degree, especially the degree, closeness, betweenness, clustering coefficient, distance. At last, many management and supervision methods are given.
Key words: network public opinion; social network analysis; Ucinet
1 网络舆情
舆情是公众关于现实社会及社会中的各种现象、问题所表达的信念、态度、观点等的总和,具有一致性、强烈性和持续性,对社会发展及有关事态的进展产生影响[1]。在中国,网络舆情主要由网络中的媒体言论、论坛新闻跟帖、博客微博的关注情况等共同反映与形成,网络舆情是对社会舆情的反映,也是舆情在互联网上的映射[2]。
网络舆情具有信息功能、导向功能、沟通功能、监督功能,有效控制网络舆情信息的真实性、准确性和及时性对规范网络信息起着至关重要的作用,对社会监督和稳定社会秩序产生一定的影响。网民不但通过互联网曝光一些热点事件,为加强对政府舆论监督起到推动作用;同时也有相当数量的网民通过互联网造谣传谣,对构建和谐社会造成不良影响[3]。所以,网络舆情的研究分析和管理导控是十分必要的。
2 社会网络分析
社会网络的研究出发点是行动者之间存在的各种联系,社会网络分析采用数学方法中的图论来描述,社会网络分析研究的是深层次的、隐藏在复杂社会系统表面之下的一定的网络模式[4]。一个社会网络由多个点和各点间的连线组成,“点”是各个社会行动者,“边”是行动者之间的各种社会关系,社会网络分析就是建立这些关系的模型,力图描述群体关系的结构,研究这种结构对群体功能或者群体内部个体的影响[5]。
对于网络舆情的研究主要分为两个方向:一是对网络传播的信息内容进行研究,发现重要舆情内容;二是对网络中结点构成的网络结构进行研究,发现该网络的特征[3]。因此,如果将社会网络分析方法应用于网络舆情研究领域,将有助于实现系统化分析,通过定量定性方法,从结构和内容两方面得到网络舆情分析结论,进而有效地协助相关部门监控、管理互联网用户的上网行为、维护互联网舆论氛围的健康,及时地控制和规范网络信息的传播是亟需研究解决的问题[1]。
3 基于社会网络的网络舆情分析
3.1 研究方法和步骤
基于社会网络的网络舆情分析中所采用的通用的研究方法是:确定研究对象、数据采集、数据预处理及存储、数据分析、结论讨论。
选择确定研究对象。选择所要进行分析的事件或话题,确定网络舆情研究的方向,是发现舆情内容还是网络舆情结构分析。
数据采集。需要根据选定的研究对象,从网络中尤其是从论坛、博客、微薄等虚拟社区中获取相关信息,根据网民之间通过发言和回复形成交流关系、相互关注关系、互为粉丝关系等,建立行动者间的关系数据。数据采集的方法可以通过编程实现,也可以选择适当的网络爬虫软件爬取所需要的原始数据。
数据预处理及存储。收集到的原始数据需要进行预处理才能存储分析。数据预处理首先是内容上的筛选,且有回复关系或关注引用关系等。如果社会网络很大,便于分析需要删除关系较简单的点,这些点对整体网络的特征不会产生根本影响。根据研究目的不同有时以所有帖子或博文为研究对象,有时则需要选择某一时间段内的帖子或博文为研究对象。预处理后的数据按照社会网络分析软件的要求进行存储,建立关系矩阵。
数据分析。以存储数据为一局,选择恰当的社会网络分析指标以得到所研究网络的特征,通过定量计算和定性分析相结合的方法,挖掘网络舆情信息。
结论分析讨论。通过上述分析结果,获得舆情网络信息,明确舆情应对策略,采取科学的方法对相关网站进行管理和监督,并关注意见领袖,对其采取正向引导以期引导整个舆论网络向积极的方向发展。
3.2 实例分析
本文选取天涯网络社区中题为“京津冀一体化下的中国经济将何去何从”的主题帖及相关回复作为研究对象,时间截点从2014年4月5日20时33分到2014年4月11日13时56分,共有有效贴188个,涉及网民120人,有发帖回复关系的网民49人,有效的发帖回复关系为106个。为了充分保护网民的隐私,文中用1-49编号代表这49位网民。本文使用Ucinet社会网络分析软件对数据进行分析。将存储在Excel中的关系数据读入Ucinet中,形成的关系网络如图1所示。
3.3 社会网络指标分析
3.3.1网络密度
通过计算,整个网络的密度为0.0451,网络中关系的标准差为0.3984,网络密度值很低,表明该网络涉及的网民并未形成紧密联系,仍然比较松散。但是网络舆情是动态发展的,舆情发展后期可能会出现参与网民不断减少的情况,此时网民的凝聚力可能会增强,还应时刻关注网络舆情变化。
3.3.2凝聚子群
文中通过“成分”分析该网络的凝聚子群。如果一个图可以分为几个部分,每个部分内部成员之间存在关联,而各个部分之间没有任何关联,在这种情况下,我们把这些部分称为成分[5]。有向网络数据中的成分的定义分为“弱成分”和“强成分”两种。
通过Ucinet对该网络分析得到7个弱成分,含有至少3个节点的弱成分有两个,第一个弱成分包含36个节点,即图中最大的连通子图,第二个弱成分包含3个节点,分别是14、34、40。对该网络进行分析得到40个强成分,含有至少3个节点的只有1个强成分,包含5、7、15、24、30、31、41、46、48这9个节点。通过凝聚子群的研究揭示了群体内部的子结构。
3.3.3度
通过Ucinet软件得到所有网民对应节点的出入度值,出度代表回复他人的次数,入度表示被回复的次数。出度越高表示网民越活跃,入度越高表示越被关注,一般总度值越大的节点在网络中越重要,“权力”越大。
在所有节点中入度最高的两个节点分别是17和31,入度值分别是19和14;出度最高的两个点分别是31和30,出度值分别是52和9。总度数前三名分别是31、30、17,度值分别为66、22、19。这说明该三个人在整个网络中最活跃,易被其他网民关注和回复,在整个网络中处于“权力”中心地位,即意见领袖,需舆情管理部门重点关注。
同时,该网络的点出度中心势为9.635%,点入度中心势为3.255%,该网络的中心势较低,说明网络结构比较松散。中心势越接近1说明网络越具有集中趋势。
另外,由于该网络不是一个连通图,则最短路径的计算就会不准确,由此得到的中间中心度就不够准确,所以选择最大的弱成分子网,得到的各点标准化中心性分析如图2所示,分别包含度数中心性、接近中心性、中间中心性。
度数中心性一般指在网络中一个节点与其他节点有直接关联,则该节点处于中心地位[6]。该值越大,说明该网民在该网络中越活跃。
接近中心性表示一个节点传播信息时不依赖其它节点的程度。当某行动者离其他人越接近,则在传播信息过程中越不依赖其他人。一个非“权力”中心成员必须要通过他人才能传播信息,易受他人控制。所以该属性关注的是不受别人控制的能力。
中间中心性主要反映行动者在中间路径上的控制能力,如果有很多节点与其相连,其地位就比较重要。如果一个行动者占据网络中的位置越多,其中间中心性也就越高,就存在更多依赖这个中间中心点的行动者。所以该属性衡量怎样使行动者控制其他行动者的能力问题[7]。
通过对图2这三个属性的观察发现,节点31、30、17在网络中的活跃度最高,其不受其他节点控制的能力最强,节点31、41、30对其他节点的影响控制能力最强。
3.3.4网络直径
由于该网络是不连通的,所以直接研究网络直径无意义。计算最大弱成分组成的子网络其平均网络直径为2.163,值较小,表明节点间建立关系较容易,平均2-3个人就可以发生关系,呈现“小世界”现象,符合“小世界”理论。
3.3.5聚类系数
通过计算最大弱成分组成的子网的聚类系数为0.183,水平偏低,说明网络中节点间交流较少,未形成长期稳定的关系,同时也说明在主题帖发表初期,参与者相互之间交流不会很多,随着事件发展和时间推移,参与者针对该主题进行广泛交流后,网络的聚类系数可能变大[3]。
3.4 结论讨论
从整体上来看,这个网络舆情所组成的网络密度小、结构松散、不连通,不能用单纯的网络直径及聚类系数进行描述,所以这两个参数是基于网络中最大的弱成分组成的子网的。网络直径比较小,聚类系数较小,网民之间易于建立联系,网民之间交流较少,未形成稳定的交流关系。网络中的关键节点31、30、17的活跃度最高,不受其他节点控制的能力最强,节点31、41、30对其他节点的影响控制能力最强。结合前面分析,虽然节点间的关系较少,但两者建立关系则较容易。另外,对像31号这样的意见领袖需要重点关注,他们对整个网络的连接贡献较大,对整个舆情的演变起到关键作用,在一定程度上引导着舆情的发展方向。
4 管理对策研究
对网络舆情的分析不仅是对舆情内容的分析,同时需要分析舆情行动者之间的社会结构,探究舆情形成和发展的一般规律。通过定量和定性的分析,挖掘网络的相关特点,寻找意见领袖和核心小群体,通过对他们的引导,以达到对整个网络舆情发展的引导。
网络舆情管理具体措施分两步:第一步网络舆情的防范,政府或相关部门充分利用论坛、微博、博客等虚拟社区主动公布相关信息,构建自己的社会网络,引导舆情发展,防患于未然。第二步网络舆情监管处理,相关组织通过网络舆情处理平台,及时分析舆情内容并持续不断的追踪舆情发展动态,充分利用虚拟社区传播快的特点,对不良事实拿出相关证据予以反驳,传播正能量,消除负能量。另外,监管部门对舆情发展后期往往疏于管理和关注,致使因关部门处理不当或者是网民对处理结果的不满而产生的一些负面消息不能得到切实有效的关注,导致舆情的发展出现新的发展动态,所以,看似结束的事件仍需要后期的舆情监督和管理。
5 总结
本文介绍了网络舆情及社会网络分析的基本知识,研究了用社会网络的方法进行网络舆情分析的一般过程,并选取了具体实例进行分析。对于所构建的网络密度小、结构松散、不连通的特点,定量分析了社会网络分析方法中的关键指标,如网络密度、度和中心性、网络直径、聚类系数等。凝聚子群分析是社会网络分析中很重要的组成部分,本文选取了成分作为凝聚子群的分析工具,并具体进行了强弱成分的划分。另外,对于不连通特点选择了最大的弱成分组成的子网进行分析。最后,对网络舆情的管理监督进行了分析研究。
参考文献:
[1] 张璇.基于社会网络分析的舆情管理研究[D].合肥工业大学,2013.
[2] 曾润喜.网络舆情管控工作机制研究[J].图书情报工作,2009,53(18).
[3] 石彭辉.基于社会网络分析的网络舆情实例研究[J].现代情报,2013(2).
[4] 赵德伟.徐正巧.基于社会网络分析的网络舆情数据挖掘[J].福建电脑,2014(8).
[5] 刘军.社会网络分析导论[M].北京:社会科学文献出版社:2004.
[6] Drezwski R. Sepielank J. Filipkowski W, The application of social network analysis algorithms in a systm supporting money laundering detection [J]. Information Sciences, 2015(295).
[7] 王昕巍,邢云菲,赵丹,李嘉兴.基于社会网络分析的移动环境下网络舆情信息传播研究——以新浪微博“雾霾”话题为例[J].图书情报工作,2015(7).