基于复杂网络的微博网络舆情图谱分析方法研究
2015-05-25贾红雨赵雪燕邱晨子
贾红雨 赵雪燕 邱晨子
(1.大连海事大学交通运输管理学院,辽宁大连116026;2.交通运输部规划研究院,北京100000)
基于复杂网络的微博网络舆情图谱分析方法研究
贾红雨1赵雪燕1邱晨子2
(1.大连海事大学交通运输管理学院,辽宁大连116026;2.交通运输部规划研究院,北京100000)
本文针对微博网络舆情的控制和引导问题,提出一种基于复杂网络的图谱分析方法。本文以微博用户间转发和评论某一话题下用户关系数据作为基础研究数据,生成用户节点网络关系图谱,通过对微博网络模块化图谱、路径图谱和中心性图谱分析,定性和定量评估出对舆情活跃度高、传播范围广、传播速度快的微博用户节点,作为控制微博舆情的传播、引导舆情舆论导向的关键用户节点。本文以某一微博社区为样本数据,采用复杂网络分析工具Gephi,验证了基于复杂网络的图谱分析对识别舆情控制中关键用户节点的正确性和有效性。
网络舆情;复杂网络;图谱分析方法;舆情控制引导
微博拥有庞大的用户群,由于其传播过程具有广泛性和快捷性,如不能有效地控制和引导舆情传播,会造成较大的负面影响,这已成为专家学者关注的热点问题。针对微博网络的裂变式、及时性以及圈群性等特点,借鉴复杂网络的概念,以微博用户间的关系代替社会关系,以用户节点代替个人,贾红雨[1]等建立起了微博网络的概念,验证了微博网络的无标度性,而复杂网络的图谱分析方法在表现网络中节点间、节点与边以及边与边的复杂连接关系方面具有形象直观,一目了然的效果,本文首次将基于复杂网络的图谱分析方法运用到微博网络的分析中,应该是一次有益的尝试。
目前,随着复杂网络理论的深入探究,该方法应用范围十分广泛,专家学者们在竞争情报、知识管理、图书馆资源配置、学科热点、引文分析[2]、科研人员合著、网络链接、博客网络[3]等方面展开了一系列研究[4]。在微博网络舆情方面,复杂网络分析方法已经被应用到微博舆情复杂网络构建,传播机制和演变阶段分析等方面,金鑫[5]等应用复杂网络分析方法构建了微博社会网络;康书龙[6]基于微博网络中用户行为及关系,应用复杂网络分析,评估微博网络节点影响力;熊会会[7]应用复杂网络分析方法,对微博客的拓扑结构进行分析,提出了微博网络信息传播模型。
本文旨在以复杂网络理论和微博用户间的评论及转发关系的用户关系数据为基础,构建微博网络舆情的图谱模型,利用复杂网络Gephi软件,通过模块化图谱、路径图谱和中心性图谱分析,定性或定量地评估出微博社区中的舆情控制关键节点,给出控制和引导影响力强、具有领导作用的关键用户节点的建议,提高正确信息的传播效果,及时发现和阻止负面舆情的传播,维护正常的微博社区秩序,避免引起网民的恐慌,维护社会的稳定和安全。
1 微博网络舆情图谱分析模型的建立
1.1 分析模型的建立
微博网络舆情与其他类型的舆情传播一样,受传播源头、传播路径以及传播速度等因素影响,研究微博网络舆情的传播,同样从以上三个方面入手。在微博网络中,微博网络舆情的传播源头是用户节点,传播路径和传播速度决定于微博用户节点和边的属性以及两者之间的连接关系。因此本文将从微博网络舆情的关键用户节点,节点与边和边与边之间的关系对微博网络舆情的传播进行分析研究。在复杂网络理论方法中,表示节点及边和该两者两两之间的特征量度有节点的度与节点度分布、平均路径长度、簇系数以及介数。
1.1.1 微博舆情关键节点模型参数
微博舆情可以使用度和度分布来评估用户节点的影响力和重要程度。
复杂网络中节点的度是指与此节点直接相连的边的数量。在有向网络中,入度是指从其他节点指向该节点的边的数目,出度是指该节点指向其他节点的边的数目[8]。微博舆情的每个用户都是一个节点,在某一话题下,X节点的微博被其他用户转发或者评论的次数即是X节点的的入度;相应的,X节点在该话题下评论或者转发其他用户的次数是出度。节点的度称作点度中心度(Degree Centrality),点度中心度越大的节点,其影响力越大,在整个网络中的作用也就越大。
度分布(Degree Distribution)是指复杂网络中节点的度的概率分布,许多统计实验的数据表明,无标度网络具有幂指数的度分布[9],即:
P(k)为一个随机选择的节点恰好具有k条边的概率。其中γ称为幂指数,其范围为1≤γ≤4[10]。
网络中的幂律显示,节点的度值相距很大,极少数节点的度值很大,而绝大多数的节点度值很小[11]。
1.1.2 微博舆情传播效率模型参数
微博网络舆情的传播效率取决于用户节点间边的长度,复杂网络中衡量边的指标可以用平均路径长度。
复杂网络中的路径长度(Path Length)是节点与节点间最短路径上边数。网络中节点与节点之间的距离的最大值称为网络的直径,记为D,即:
平均路径长度定义为网络中节点i与j之间的最短路径长度的平均值L,即:
其中,N表示网络中节点的数量[12]。微博舆情的平均路径长度是指网络中所有用户节点对的平均距离,表示微博舆情传播的时间长短。
1.1.3 微博舆情传播路径模型参数
采用介数中心度和紧密中心度对微博网络中用户节点处于此网络的中心地位的程度进行定量分析,找出微博网络舆情传播路径上的关键节点或脆弱点。
(1)介数中心度
介数中心度(Betweenness Centrality)是度量一个节点出现在网络中最短路径上的效率。微博舆情中用户Y相对于一个用户对X和Z的介数中心度指的是经过用户Y并且连接这两个用户的捷径占这两个用户节点之间的捷径总数之比,即用户Y在网络信息流动中的传输负载量。介数中心度可表示为:
gst,i表示用户对s和t最短路径经过用户i点的路径数,nst表示节点s和节点t之间存在所有最短路径的路径数[13]。
(2)紧密中心度
紧密中心度(Closeness Centrality)是刻画微博网络中某一节点对网络中其他可达节点的难易程度。其值定义为该节点到达其他节点的的距离之和的倒数,是网络的拓扑中心:
dG(v,t)表示网络G中v节点到t节点的距离[14]。拥有高紧密中心度的用户节点可以在较短的路径上将信息传递给更多人[15]。
2 微博网络舆情图谱分析
进行图谱分析的前提是确定数据来源并对数据进行处理。为了避免某些特定领域话题的特殊性,不具有普遍的代表性,本文采用的数据来源于腾讯微博,利用迅雷批量下载“缅怀!乔布斯逝世一周年”这个话题下的所有数据,然后对这些数据进行数据分析,分析过程包括数据提取,解析和清洗,提取用户评论或者转发该话题的具体文档内容,对内容进行解析,确定用户是仅自己发表观点还是对话题进行了转发和评论,在数据清洗中,对重复的昵称和假的孤点进行过滤剔除。
2.1 网络图谱模块化分析
经过上文对微博数据进行收集、提取、解析和清洗后,转换成可供复杂网络分析工具Gephi识别的.csv数据表格文件,将数据导入Gephi软件中,利用Gephi对网络数据进行模块化分析,将网络所有用户分为840个社区,得到如1图网络模块化分布结构图。
图1网络模块化分布结构
图2 是图1的模块化图示与各模块节点的度数所占比例,从图2中可以看出,节点颜色和大小都不同,不同颜色的节点代表的社区不同;节点的大小影响社区的大小,该节点所影响的范围也不同。为了更清晰的分析网络结构,将网络图中度数较大的点按照度数从大到小排序标记为A~F,每种颜色的社区中间较大的节点代表一个中心节点,这些中心节点拥有很大的出度及少量的入度,只有极少数的社区拥有很多的关联节点,大多数社区拥有的连接节点都很少,这一点充分体现了微博网络用户节点关系网络中,少数节点间的连接关系强,大多数节点只是受影响节点,连接关系强的中心节点在网路图谱中可以很容易被识别,并且对本社区的多数节点具有很大的影响作用。
2.2 网络图谱路径分析
从生成的网络图中突出显示以A节点为中心节点的社区网络,如图3所示。
对于以A点为中心的社区,其影响广度在整个网络中最强。舆情传播速度在该社区内传播最快。但是,由于该社区内其他节点对热点舆情的兴趣度不高,导致网络舆情传播深度不够。在网络舆情控制时,只需高度关注核心节点A的动向,就可以对该社区的舆情进行有效监控。
图2 模块化分层的节点度比例
图3 节点广度传播图
研究微博网络舆情传播既要从节点传播广度上分析,也要从影响深度上分析。突出显示以B节点为中心节点的社区网络,得到如图4所示的节点深度传播图。
图4 节点深度传播图
在以B点为中心的社区网络中,其传播深度为六层,与整个网络的直径相同。可以说明,该社区纵向影响程度最大。即与B为直接相邻的节点还有其他外层节点,对其发布的网络舆情敏感度较高。对于B作为舆情原点,在整个网络中影响较深。
综上所述,虽然与A点直接相邻的节点在整个网络中最多,即度数最大,但与度数较小的B点相比,其影响深度不高。而影响深度大的B点也没有A点对舆情传播影响个体多。所以在对网络进行合理引导和控制的时候,既要考虑核心节点的影响广度,同时也要考虑其影响深度,这样才能完善舆情监控机制。
2.3 微博网络介数中心性分析
通过对网络进行介数中心性分析,得到图5。
图5 介数中心性分析
由图5可以看出A、B、C、D、E、F都是在一条以O为舆情源,进行信息传播的关键路径上的重要节点。这些节点在整个网络的关键路径中出现的频率是最多的,同时也表示这些节点对网络中舆情的关注度也是最高的,其中D点最大,表示该点对网络舆情兴趣度最高,即出现在关键路径上的次数是最多的,在整个网络中,D点对于舆论事件的活跃度是最高的。
如在O点为核心的社区内进行舆情控制,只需对A、B、C、D、E、F这六个节点加以控制,就能及时有效的发现和控制负面舆情的传播。同时,对于整个网络来说,在这些点上也设立相应的监控和应变机制,将会对微博网络舆情引导与控制起到事半功倍的效果。
2.4 微博网络紧密中心性分析
通过对网络的紧密中心性分析,得到图6。
如图6所示,颜色和大小的不同代笔该节点在网络中的紧密度的不同。其中,A、B、C、D、E等具有较强的紧密中心度,即它们能够以最短的距离到达网络中能够到达的其他节点。对于整个网络来说,这几个核心节点对网络中舆情热点的传播速度最快。这些点分布在网络的不同社区内,属于各个社区的积极因子,能够以最快的速度使舆情得到扩散。
图6 紧密中心性分析
所以,对于网络中紧密度较高的节点,在控制过程中可以对这些节点加以实时监控,起到检测舆论传播速度的作用;另一方面在引导舆论走向的过程中可以利用这些节点的感知能力将正面积极的信息发布到网络中,使微博网络舆情得到有效的引导。
3 微博舆情信息传播控制和引导建议
3.1 控制手段
对与网络舆论形成和传播有关环节实施有效的管理。即删除具有影响网络传播范围的节点以及在网络中起到桥梁作用的节点。
点度连接度大的节点是微博社区中的核心节点,在舆情蔓延初期,可以删除此类节点,抑制负面舆情从他们的位置扩散。但是点度连接度大的节点的作用仅限于自己的社区,而传播深度大的节点有大量与外部网络联系的节点,删除此类节点可以及时隔断舆情信息传播的深度,减少信息的传播层次。
介数中心度大的节点虽然只有很少的联系节点,但它们处于网络与外部连接的交接处,具有信息通道的作用,删除这类节点后网络就无法与外部网络交换信息,可以阻断舆情信息向外部蔓延。
紧密中心度大即传播速度快的节点可以以最近的距离联系到网络中的每一个可能到达的节点,处于感知整个网络舆情信息最有利的位置,删除此类节点可以抑制舆情信息的快速传播,争取更多的时间控制舆情传播。
3.2 引导手段
利用“核心成员节点”的影响力,从理性、知识性和情感等方面对参与网络舆情的网民的认识和情感进行潜移默化的影响,将不正确或非理性的舆论引导到正确的方向。
当负面信息传播时,可以跟随辩驳,将正确的信息及时推送到用户手中。另外,主动辟谣也是一种有效的手段,对于已经证实的不实消息,将其标识为“谣言”,对正在传播谣言的用户给予通知警告,限制其传播。此外,建立官方平台,主动澄清事实也是目前较为普遍的引导手段。最后,人为引出新话题和核心成员,出现多个次级话题或次级核心成员,分散话题或者核心成员的影响力,也是引导舆情传播的有效手段。
4 结论与展望
本文从定量和定性的角度,对微博网络用户群进行了网络图谱模块化分析,网络图谱路径分析以及微博网络中心性分析,并最终更加合理和准确地得到了所研究微博社区的舆情核心节点。在微博网络舆情演变所处的不同时期,根据各阶段舆情不同的特点,通过对核心微博用户实施有力的控制手段和引导策略,进行综合调控,引导舆情走向,维护微博社区秩序。
目前专家学者们对于微博网络的研究方向还处在微博信息的静态分析上,但是随着网络微博的广泛使用,舆情话题不只是一个,微博信息也达到海量级,如何采用海量的微博数据源信息,并对其进行有效的分类、组织和存储管理并快速、准确、全面地管理数据,是日后对微博进行监管和引导的重要前提基础,也是今后的研究方向。
[1]Jia Hongyu,Hao jianwei,Qiu chenzi.A Model for Studying Public Opinion Hotspot Growth Regulation in Microblog Network[C].International Conference On Managenment Science&Engineering 20th Annual Conference Proceedings(Volumn I)(C),2013:173-178.
[2]宋歌,叶继元.基于SNA的图书情报学期刊互引网络结构分[J].管理观察,2014,(4):141.
[5]刘婷婷,马海群.信息安全政策绩效评价的指标体系框架构建[J].农业网络信息,2014,(3):25-28.
[6]韩伯棠.管理运筹学(第二版)[M].北京:高等教育出版社,2005:390-397.
[7]崔清新,邹声文.信息安全条例已起草[N].新华每日电讯,2010-11-09,(001).
[8]工信部正在起草信息安全条例[EB/OL].http:∥www.lawlib.com/fzdt/newshtml/fzjd/20121219105106.htm,2014-12-09.
[9]中央网络安全和信息化领导小组第一次会议召开[EB/OL]. http:∥www.gov.cn/ldhd/2014-02/27/content_2625036.htm,2014-12-09.析[J].中国国家图书馆,2009,(3):27-34.
(本文责任编辑:马卓)
[3]赵广利.社会网络分析技术在博客媒体信任度中的研究与应用[D].包头:内蒙古科技大学,2011:15.
[4]D.KNOKE,J.H.KUKLINSKI.Network Analysis[M].Beverly Hills:Sage Publications,1982.
[5]金鑫.基于复杂网络的微博舆情传播[J].吉林大学学报:工学版,2012,(S1):272.
[6]康书龙.基于用户行为关系的社交网络节点影响力评价[D].北京:北京邮电大学,2011:3.
[7]熊会会.基于复杂网络的微博客信息传播机制研究[D].广州:华南理工大学,2012:4.
[8]田庆飞.基于复杂网络理论的城市公交网络生成与优化研究[D].吉林:吉林大学,2013:31-34.
[9]罗熹.基于新浪微博的社交网络复杂特性研究[D].武汉:武汉理工大学,2012:22.
[10]Zhang G Q,Yang Q F,et al.Evolution of the Internet and its cores[J].New J.Phys.2008,(10):8.
[11]张贵清,复杂网络拓扑结构对OFC模型动力学行为影响的研究[D].天津:南开大学,2009:8-9.
[12]曾小舟.基于复杂网络理论的中国航空网络结构实证研究与分析[D].南京:南京航空航天大学,2012:17.
[13]Huang Jinshan,Zhang Xunfeng.Advances in Artificial Intelligence(Volumn 4)——Proceedings of 2011 International Conference on 2011 2nd International Conference on Management Science and Engineering(MSE 2011)[C].成都:2011.
[14]吴柱,李斌,许腾.舰艇编队通信网络中心化研究[J].指挥控制与仿真,2012,(2):13-14.
[15]孙超.微博网络信息流的影响因素研究[D].北京:清华大学,2012:19-20.
(本文责任编辑:郭沫含)
A Study of Complex-network-based Graph-analytical Approach on Microblog Net-mediated Public Sentiment
Jia Hongyu1Zhao Xueyan1Qiu Chenzi2
(1.Transportation Management College,Dalian Maritime University,Dalian 116024,China;2.Transport Planning and Research Institute,Ministry of Transport,Beijing 10000,China)
Considering how to control and guide microblog net-mediated public sentiment,a complex-network-based graph-analytical approach was proposed.Based on the analysis of relationship data generated by users that commented on and forwarded one topic of the microblog,graphs of user nodes network are built,and by analyzing the modularity graph,path graphs and centrality graphs,user nodes that are highly active on public sentiment and have wide breadth propagation,deep depth propagation and fast speed propagation are evaluated quantitatively and qualitatively.Besides,these nodes are controlled and guided effectively,which may be used to slowly spread the net-mediated public sentiment and guide the direction of the public topic. Taking some microblog community data as sample data,and using complex network software Gephi as analysis tool,the correctness and effectiveness of the a complex-network-based graph-analytical approach which was used to identify the key nodes in the process of the public sentiment control were verified.
net-mediated public sentiment;complex network;graph-analytical method;public sentiment control and guide
10.3969/j.issn.1008-0821.2015.03.012
G250.252
A
1008-0821(2015)03-0064-04
2014-07-09
贾红雨(1965-),女,副教授,博士,研究方向:信息系统工程,管理科学与决策支持系统研究等,发表论文数篇。