社交网络中话题传播结构的可视化研究与实现
2017-04-22陆斌斌
陆斌斌
(四川大学计算机学院,成都 610065)
社交网络中话题传播结构的可视化研究与实现
陆斌斌
(四川大学计算机学院,成都 610065)
以新浪微博为例,以话题为信息传播研究的基本单位,分析信息的传播路径,提出话题信息传播网络构建算法,实现话题传播结构可视化分析系统,并对可视化布局进行优化。
话题传播;可视化;网络结构;网络布局
0 引言
移动通信网络已拥有4G技术的带宽,智能移动终端也达到了较高的保有量,社交网络平台顺势以前所未有的深度和广度渗入人类的生活。例如国内社交网络平台新浪微博,其注册用户已就经超过了6亿,用户活跃度的增长也呈现出抬头的趋势。人们进行信息传递的方式因此也发生着巨变,社交网络中的每一个独立个体都可以通过这个平台随时随地接收、生产和传递信息。随之产生的通信数据潜藏了社会活动规律和人们的行为模式,研究人员可以通过这些规律和模式探索信息在社交网络中的传播扩散情况,辅助社会科学的研究与应用。而且由于在线社会网络与其用户在线下真实世界中组成的社会网络是相互映射相互影响的,通过研究在线社会网路中的信息传播问题,还可以帮助研究者进行线下不易开展的研究活动。
然而大规模的微博流却给研究者们带来了挑战:社会科学研究者在研究社会网络时,多使用的是类似于问卷调查的方式采集真实社会中的数据,非常麻烦耗时。所以社会科学家在分析社会网络时通常处理的数据集都很小,分析方法也大多是统计学方法[1],无法很好地运用大规模的在线社交网络通信数据。与此同时,计算机科学研究者使用社交网络的通信数据研究社会网络时也面临着困境,他们在使用计算机技术进行大规模数据的收集、存储、过滤和分析时,都需要学习社会科学相关领域的知识,然而学习的过程通常是相当耗时且较为昂贵的。
运用可视化技术[2-3]研究社会网络中的大规模数据为以上问题提供了有效的解决方法,它主要用于微博数据流这样的大规模非数值型数据,将源数据转化为简洁易懂符合人们认知习惯的的视觉图像信息。既为研究者解决了数据量大所带来的研究难度,又免去了许多社会科学背景知识的学习。本文通过有效算法构建信息传播网络并利用可视化分析方法对信息传播模式进行了探索。
1 话题信息传播网络构建算法
话题传播结构可以以图(Graph)结构的形式进行描述。图由顶点(Vertex)和边(Edge)两个有限集合组成,形式化定义为Graph=(V,E),其中V称为顶点集,V中的每一个顶点对应于话题传播网络中的一个用户;E={|P(u,v)∧(u,v∈V)},其中顶点对称为边,对应于话题传播网络中的转发或评论。此算法有两个前提:(1)假设转发列表中的所有元素都是按照时间顺序排列的。(2)不考虑同一个用户换发来自不同用户的同一条微博的情况(事实上这样的情况在真实世界中对信息传播的作用确实可以忽略不计)。
话题传播网络的构建过程通过以下算法详细描述:
2 话题传播结构可视化
话题传播网络构建完成后,本文采用了基于能量模型的力导引算法对节点进行布局。FR[4]算法是力导引布局算法的一种实现版本,它能够将网络中的节点和边进行均匀的分布,同时能够减少边的交叉。下面的伪代码是FR布局算法的实现表示:
在其基础之上,进行三点优化:
(1)斥力计算优化:力导引算法计算斥力时需要考虑所有节点之间的相互作用力,时间复杂度为O(|V|2),为了减少该时间复杂度,对于两点之间距离较远的点,不作考虑。
(2)边缘限制:力导引算法不会限制点的位置范围,这样会导致图中的节点位置超过了绘制画布,造成可视化结果不全。本论将位置分为水平方向和数值方向,当某一个方向的位置超过范围时,把该方向的坐标值设置为边缘坐标,但另一个方向依然会因为力的作用产生位移。
(3)中心控制:力导引算法的布局结果通常为了节点和边的对称性都会排布得很均匀,比较靠近中心。然而因为算法并没有明确地限制节点在整个屏幕的整体分布位置,加上所有节点的初始位置都是随机的,所以偶尔会出现最终的结果偏离屏幕中心的情况。本文引入了一个“中心节点”对布局结果的整体位置进行中心控制。在屏幕中央有一个固定不变的点,该点持续不断地对其他节点产生引力,而引力的大小最终由实验数据和经验值确定。
除了布局算法以外,设计了具有高分辨度的视觉映射以及灵活的交互方式,最终实现了面向话题传播结构的可视化分析系统。可视化效果如图1所示:
图1 可视化效果图
3 结语
本文针对国内主流的社交网络平台——新浪微博,以话题为信息传播的基本单位,对信息在社交网络中的传播结构采用可视化手段进行了研究。提出了一种话题信息传播结构的构建算算法,实现了话题传播结构可视化分析原型系统,并对布局方法进行了优化。
[1]Marin A,Wellman B.Social Network Analysis:An Introduction[J].The SAGE Handbook of Social Network Analysis,2011:11-25.
[2]McKelvey K R,Menczer F.Truthy:Enabling the Study of Online Social Networks[C].Proceedings of the 2013 Conference on Computer Supported Cooperative Work Companion.ACM,2013:23-26.
[3]Ren D,Zhang X,Wang Z,et al.Weibo Events:A Crowd Sourcing Weibo Visual Analytic System[C].Pacific Visualization Symposium(PacificVis),2014 IEEE.IEEE,2014:330-334.
[4]Tomas Fruchterman,Edward Reingold.Graph Drawing by Force-Directed Placement[J].Software Practice and Experience,Vol.21,1991.P1129-1164
Research and Implementation of Topic Diffusion Structure Visualization Based on Online Social Network
LU Bin-bin
(College of Computer Science,Sichuan University,Chengdu 610065)
Takes Sina Microblog as an example,proposes a structure-build algorithm for topic diffusion and realizes a visualization system with an improved network layout to analyze propagation path of topic information.
Topic Communication;Visualization;Network Structure;Network Layout
1007-1423(2017)07-0058-04
10.3969/j.issn.1007-1423.2017.07.015
陆斌斌(1991-),男,浙江慈溪人,研究方向为信息可视化、可视分析
2017-01-10
2017-03-02