APP下载

虚拟网络中不同位置节点的行为差异研究

2015-05-15赵群

电脑知识与技术 2015年8期
关键词:社区

赵群

摘要:网络中结构洞和非结构洞节点所处位置不同,获得信息的方式和信息量均不同,从而可能导致这两种节点的行为方式不同。该文主要通过数据挖掘、统计学、社会学等方法,分析在新浪微博虚拟网络中结构洞和非结构洞節点的投票观点统计数据,发现结构洞与非结构洞两种节点的行为存在差异。同时,该文还对虚拟网络的社区中观点的抱团现象进行了统计分析,并发现了在虚拟网络社区中不存在“沉默的螺旋”现象。

关键词:结构洞;行为差异;社区;虚拟网络

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)08-0257-04

Abstract: In the network,the structural holes and non structural holes of different node position,the way to get information and information content are different,which may lead to the two node in different ways.This paper mainly through data mining, statistics,sociology method,analysis on Sina micro-blog virtual network structural holes and non structural hole nodes vote view statistical data,found that the structural holes and non structural holes two node behavior differences.At the same time,this paper also Baotuan phenomenon view of virtual network community are analyzed,and found in the virtual network community does not exist in "the spiral of silence"phenomenon.

Key words: structural holes; behavioral differences; community; virtual network

在社会网络研究中,人们通常把紧密联系在一起的节点集合看作一个网络社区,结构洞是连接不同网络社区之间的捷径,看上去就是存在于网络中两个没有紧密联系的节点集合之间的‘空地[1]。相比非结构洞节点,结构洞节点连接多个不同的社区群体,能够获得网络中多种互不交叉部分的信息,得到更多的信息量。而信息量不同对节点行为有可能存在影响。

目前在社会网络研究中对结构洞的研究较少,缺乏数据支持,存在主观性。随着虚拟网络的日益普及,越来越多的用户选择在虚拟网络上表达自己对某个事件的观点,这为本文的研究提供了便利条件。新浪微博在中国是最大的虚拟网络之一,用户可以通过新浪微博的投票应用对自己就某个事件的观点进行投票,以此来表明自己的态度立场等,本文选取了新浪微博比较有代表性的三个投票内容作为研究对象,首先对投票内容进行了抓取并构建出相应的网络,然后利用[2]中的社区发现算法找出网络中的社区,利用[3]中所提出的算法找出结构洞,最后对结构洞和非结构洞节点对各种观点的投票比例进行统计分析,验证了在虚拟网络中结构洞的行为和非结构洞节点确实存在不同。同时,本文还通过比较虚拟社区中各观点所占比例与样本空间中各观点所占比例的差异,对社区中观点抱团现象进行了统计;并且通过对社区中各观点比例随时间的变化进行统计,发现了在虚拟网络社区中不存在“沉默的螺旋”现象。

1 相关设定

设每个投票事件的全部用户集合为T,此投票中给观点i投票的用户集合为Topi,则全部投票中观点i的投票比例为|Topi|/|T|。

设每个投票事件所被抓取到的样本空间中所有用户集合为C,在此样本空间中给观点i投票的用户集合为Copi,则样本空间中观点I的投票比例为|Copi|/|C|。

设每个投票事件中结构洞用户集合为 H,在此结构洞集合中给观点i投票的用户集合为Hopi,则结构洞集合中观点i的投票比例为|Hopi|/|H|。

设每个投票事件所构建网络中的某个紧密连接的用户集合为社区Sj,社区Sj中给观点i投票的用户集合为Sjopi,则社区Sj中观点i的投票比例为|Sjopi|/|Sj|;设社区Sj中观点i在日期Dl的累计票数为SjDlOpi,社区Sj中所有观点在日期Dl的累计票数和为SjDl,则社区Sj中观点i在日期Dl累计的投票比例为|SjDlOpi|/|SjDl|。

社区的抱团现象指在社区中某观点i的投票比例与样本空间中观点i的投票比例差值高于阈值β。

2 数据收集

2.1 数据选取

为了研究虚拟网络中用户的行为,本文选取了新浪微博中投票数据作为研究对象,投票可以明确地反映出用户的行为和态度。本文选用三个有代表性的投票内容:“运营商准备向微信业务收费,你是同意还是反对?”(下文称为微信事件),“舒淇退出微博你怎么看?”(下文称为舒淇事件)以及“你赞成清明节上坟烧香吗?”(下文称为清明节事件)。三个投票的具体信息如表1所示。

2.2 投票数据抓取方法及结果

新浪微博api没有相应的投票数据接口,本文使用java程序抓取投票数据,使用投票的关键词在新浪微博页面进行搜索,解析返回的结果页面,提取出需要的投票详细信息:投票人昵称,投票观点和投票时间。由于新浪微博的数据保护措施,利用程序抓取数据存在一定的时间限制和数量限制,无法获取每个时间节点的所有数据,最终抓取到的三个话题的用户及内容数据如图1所示。

原始数据中存在重复抓取户和未投票只转发的用户,所以去除重复抓取和未投票的用户后,三个投票的用户及内容数据如图 2 所示。

2.3 网络构建方法及结果

为了构建虚拟社交网络,需要投票用户之间的关注信息,新浪微博用户关注列表和粉丝列表对构建虚拟网络效果相同,并且关注列表相对较小,因此本文使用微博api抓取了上述三个投票用户的所有关注列表,进而形成投票用户间的社交网络。投票用户关注列表数据如图3所示。

使用上述投票用户及其关注列表,去除对结果没有作用的孤立点,构建出三个话题数据投票用户之间的虚拟社交网络。投票用户网络规模如表2所示。

2.4 社区发现

为了发现网络中的结构洞,需要先将社交网络中的社区寻找出来。本文使用[2]中的社区发现算法,通过pagerank得到节点在投票用户网络中的全局重要度排序,使用值传播,发现用户的局部重要度;然后根据核心团体中节点重要度都比较高的特点构建核心团体;最后基于同心圆模型对核心团体进行扩展发现社区。 三个投票的社区数据如图4所示。

可以看出,三类投票网络分别代表了不同的网络结构,微信事件投票社区规模分布极端,存在少量特大规模的社区和绝大多数的小规模社区;舒淇事件投票社区规模分布均匀,社区规模大小比较平均;清明节事件投票社区都是较小规模。

2.5 挖掘结构洞

使用[3]中的算法找出结构洞,论文针对twitter数据集设计了两个算法HIS和MaxD来找出结构洞。本文选择了其中效果稍好的HIS算法,该算法的主要思想是:如果某个节点连接了许多社区的意见领袖节点,那么它更有可能是结构洞节点;而如果某个节点连接了许多的结构洞节点,它将更有可能是意见领袖节点。HIS算法通过对每个节点计算它在许多社区中的Influence(v,Ci)值来表示它在这些社区中的重要性,Influence(v,Ci)值越大表示节点v越可能是社区i的意见领袖节点;同时,用sh(v,S)表示节点v在节点集S中的结构洞值,即该值越大,节点v越有可能是结构洞节点。根据算法的主要思想,节点v的Influence值是由v的邻居的Influence值和sh值共同决定的;而节点v的sh值是其在所有社区中的Influence值的最小值。使用如此方法,Influence值和sh值的计算过程中相互迭代求解。

本文利用HIS算法对三个投票的数据集进行结构洞挖掘,对三个投票网络中节点的sh值按照从大到小的顺序排列,取前15%的节点为结构洞,各事件结构洞节点数量如表3所示。

3 数据分析及结果

3.1 结构洞投票差异分析

本文比较了结构洞节点投票比例,样本总体投票比例,微博上总体投票比例 之间的差异,在统计中发现微信事件用户存在重复投票的情况,在样本空间中共 有 49 个用户重复投了两次票,每次都投了不同的观点,在结构洞节点中共有 6 个用户重复投了两次票,每次都投了不同的观点。则,样本空间中重复投票用户 占比为 49/14350=0.34%,结构洞节点集中重复投票用户占比为 6/450=1.33%,如 图 6 所示,蓝色为结构洞节点中重复投票用户所占个数的比例,红色为总体样本 节点中重复投票用户所占个数的比例。舒淇事件和清明节事件中不存在重复投票的现象。图 6 可以从一定程度上反映出结构洞节点更倾向于重复投票,即给两个观点都投了票,说明可能结构洞节点比普通节点的观点更摇摆。

接下来分析各事件的结构洞节点集合各观点的投票比例与样本空间中各观点的投票比例,以及全部投票中各观点的投票比例(计算定义见第二章)之间的差异,从而分析结构洞节点是否和非结构节点的行为存在差异,数据分析结果如图7所示。

由图7可以看出,三个事件的样本空间中各观点投票比例和微博投票应用公布的全部投票比例相差在4.1%以内,说明了样本空间的有效性。还可以看出,舒淇事件和清明节事件的结构洞节点集合中各观点的投票比例与样本空间中各观点的投票比例相差普遍在20%左右,可以说明在这两个事件中结构洞节点与非结构洞节点的行为是有差异的;而微信事件中此两种比例却相差较少,一方面可 能由于微信事件比较特殊,用户几乎都是一边倒的支持一类观点(反对观点),同意观点只占3%左右,其一点点提升都非常不易,由图7可以看到尽管相差较少但还是有差别,可以理解为结构洞节点与非结构洞节点的行为存在差异,另一方面对于微信事件,由图6可以看出结构洞中重复投票的用户占比与样本空间中 重复投票的用户占比相比,从0.34%提高到了1.33%,提高了3倍左右,由此可 以看出在微信事件中结构洞节点的观点可能要比非结构洞节点的观点更加摇摆不定,这也可以理解为结构洞节点与非结构节点的行为差异。

由以上数据结果及分析可以看出,在虚拟网络中结构洞节点与非结构洞节点确实存在行为差异。

3.2 社区分析

3.2.1 社区中的抱团现象

为了研究社区中是否存在用户抱团现象,本文统计了三个投票数据中规模大于一定阈值的社区中各观点投票比例和样本空间中各观点投票比例差异,在设定社区规模阈值时,可以认为小规模社区不存在抱团现象,根据实验经验将三个事件中社区规模阈值和观点差异阈值设置如表4,统计结果依然用表4展示。

可以看出微信事件中社区规模大于20的社区有7个,其中14.3%的社區在观点1上存在抱团现象,舒淇事件中社区规模大于20的社区有4个,其中全部都在观点1和观点2上出现了抱团现象,清明节事件中社区规模大于10的社区有3个,分别有33.3%的社区在观点3和观点4上出现了抱团现象。因此可以得出在社区中抱团现象跟事件性质和具体观点有关,不具有一般性。

3.2.2社区中“沉默的螺旋”理论

根据社区投票数据,本文通过统计各个事件中规模top2的社区中各观点随时间累积的投票比例的变化趋势,分析社区中是否存在“沉默的螺旋”[4]现象,具体的统计信息如图8所示。

通过图8可以看出,三个事件中各观点的投票比例随时间变化并不明显,最终都趋于稳定,没有出现强势观点比例随时间明显增多,弱势观点随时间逐渐消失的现象,可以得出在社区中不存在“沉默的螺旋”现象。

4 结论

本文选取了新浪微博比较有代表性的三个投票内容作为研究对象,所做工作如下:

1)利用网页解析和新浪微博API对投票内容及用户关系进行了抓取并构建出相应的网络;

2)利用[2]中的社区发现算法找出各事件网络中的社区;

3)利用[3]中所提出的算法找出各事件网络中的结构洞;

4)对结构洞和非结构洞节点对各种观点的投票比例进行统计分析,验证了在虚拟网络中结构洞的行为和非结构洞节点确实存在不同。

5)通过比较虚拟社区中各观点所占比例与样本空间中各观点所占比例的差异,对社区中观点抱团现象进行了统计;并且通过对社区中各观点比例随时间的变化进行统计,发现了在虚拟网络社区中不存在“沉默的螺旋”现象。

另外,由于新浪微博的数据限制,本文中所能获得的每个事件的样本量有限,同时由于抓取数据时间较长,时间限制只选择了三个有代表性的投票网络进行了分析,这是本文还存在的一些可以提升改进的地方。

参考文献:

[1] 李晓明,等,译.网络、群体与市场[M].北京:清华大学出版社,2011.

[2] Cheng X,Lu Q,He L,et al.Communities discovery in mobile call records[C]//Fuzzy Systems and Knowledge Discovery (FSKD), 2010 Seventh International Conference on IEEE,2010,6:2541-2545.

[3] Lou T,Tang J.Mining structural hole spanners through information diffusion in social networks[C]//Proceedings of the 22nd international conference on World Wide Web. International World Wide Web Conferences Steering Committee,2013:825-836.

[4] http://baike.baidu.com/view/18306.htm.

[5] 劉军.社会网络分析导论[M].北京:社会科学文献出版社,2004.

[6] 朱伶俐,刘黄玲子,黄荣怀.基于交互分析的协同知识建构的分析[J].开放教育研究,2005(2):31-37.

[7]王艳,李玉斌.虚拟社区学习动力机制研究——以新浪UC网络社区为例[J].中国电化教育,2011(1):57-60+65.

[8]朱永真,夏正友,卜湛,等.虚拟社区中的社团结构研究与分析[J].计算机技术与发展,2011,21(1):46-49.

[9]楼天阳,褚荣伟,李仪凡,等.虚拟社区成员参与心理机制研究述评[J].外国经济与管理,2011,33(5):33-40.

猜你喜欢

社区
仁·社区美术馆
郎官驿创意社区
3D打印社区
在社区推行“互助式”治理
如何积极应对社区老年抑郁症
社区统战与社区管理