APP下载

用NetLogo仿真在线社区中幂律分布的形成

2016-06-02张丹

科教导刊·电子版 2016年10期

张丹

摘 要 在线社区把不同群体以及不同个人聚集起来形成了一个社交网络,幂律分布应运而生,本文将进一步探讨社交网络中幂律分布的形成机理,提出四种机制,即“偏好依附”、“最小努力”、“直接互惠”、“间接互惠”。本文使用NetLogo软件,对四种机制进行了仿真,通过可视化界面得出了幂律分布。

关键词 在线社区 幂律分布 NetLogo仿真

中图分类号:TN915 文献标识码:A

0前言

近些年,在线社区作为一种新颖的组织形式,不同于传统的市场,通过不断的互动,将具有共同兴趣的个人聚集到一起。当有共同爱好的人依靠社交媒体相互交流时,在线社区应运而生。他们在很大程度上依靠IT基础设施,现在更多更好的社会网络平台进入了人们的生活。

随着网络科学的发展,研究者已经通过研究表明许多复杂的物理、生物、信息以及社会系统都可以用幂律分布来刻画。这些网络通常满足一个无标度的分布,而不是正态分布,在这些网络中,存在一些连接,很少一部分的参与人与其他参与人建立了很多的联系,而其他大部分的参与人和别人建立较少的关系。尽管有许多不同幂律形成的理论,大部分的解释都是“偏好依附”,本文还将考虑另外三种因素对幂律分布形成的影响,即:最小努力、直接互惠、间接互惠。

本文的目的是进一步了解幂律分布在在线社区中是如何形成的。

1在线社区模型

1.1模型描述

在线社区中,参与人进入系统建立帖子,并回复其他人发表的帖子,以下,我们先对参与人、帖子、以及回复一一进行描述:

(1)参与人:进入系统;发表一条消息开始一个新的帖子或者主题;对以后的帖子进行一条回复;离开系统。所有的参与人都有一样的行为:新的参与人可能随时到来;任何一个活跃的参与人能发表一条消息开始一个帖子;任何一个活跃的参与人能对一个开放的帖子进行回复;活跃的参与人可能随时离开系统。

为了促进建模,我们假设参与人是按如下的规则行动的:一个参与人一到来就发表一条消息开始一个帖子;参与者一旦离开系统后,他们不能再重新进入;当仿真开始的时候,系统中没有参与人;参与人将会有0到预设的最大值之间的机会对别人的帖子进行回复。

(2)回复:每条回复属于并且仅属于一个帖子;所有的回复被视为开始帖子的那条回复的。

(3)帖子:新的帖子是由处于系统中活跃的参与人或者新进入的参与人在任何时间创建的;任何活跃的或者新进入的参与人可能对开放的帖子进行回复。一般而言,人们更希望看那些最近较新的帖子,我们为了跟现实更近似,假设:在帖子被创建8个时间单位以后,帖子变得不活跃。

参与者进入到系统中,首先发一条新消息,从而开始一个新的帖子,当他还是活跃的时候,可以按照四种回帖机制对其他参与者的帖子进行回复,其中,参与者按照一定的到来规律进入系统不断发帖或回帖,最后当参与者变成不活跃的时候会离开系统。

2幂律分布产生机制

在“偏好依附”的机制中,各参与人更愿意选择查看热门、回复率高的帖子并回复,选择一个主体进行回复的可能性与这些主体在之前得到的回复正相关,这里把每个主体得到的总回复数量定义为入度,因此,选择一个主体进行回复的概率与这些主体的入度是成正比的。

在“最小努力”的机制中,每个活跃的主体在发表帖子上表现出不同的难易程度,因此,根据每个参与人的简易性程度,给予每个参与人一个相对的权重。给每个参与人一个权重以后,这个值在整个网络形成的仿真中保持不变。一个焦点主体在决定回复哪个参与人的帖子时,他会根据前面所说的最小努力权重随机地选择参与人。如果这个被选择的参与人有不止一个活跃的帖子时,那么就回复他所创建的第一个帖子。

在“直接互惠”的机制中,选择一个主体进行回复的可能性是基于先前的交流历史的。首先要估计每一个潜在主体的权重:rij表示焦点主体i对潜在主体j的回复数量,rji表示潜在主体对焦点主体的回复数量:

如果rij=0且rji>0,设潜在主体的权重为2

如果rij=0且rji=0,设潜在主体的权重为1

如果rij>0且rji>0,设潜在主体的权重为(1+(rij€Harji)/(rij+rji))

在“间接互惠”的机制中,一个主体创建新链接的可能性是由他之前发表回复以及收到回复的历史决定的,所以,我们用主体的入度与出度的比例来表示。如果一个主体收到许多回复,但是很少回复其他的主体,则他们的入度将会超过他们的出度,那么入度与出度的比例大于1,且主体会有更大创建新帖子的可能性;如果一个主体给其他主体很多回复,而没有收到很多回复,则入度和出度的比例小于1,那么主体创建新帖子的可能性就会很小。开始时,一个主体还没有给别人回复时,即出度为0时,给他们一个平均倾向建立新的联系。

3 NetLogo仿真及结果

3.1变量

首先定义了两个主体——参与人和帖子,并给他们定义了一些局部变量,其中每个参与人有入度、出度、到来时间、最小努力权重、入度/出度比,每个帖子都应该记录创建时间,以及帖子收到的回复数量。

另外,还定义了一些有向连接和无向连接,用无向连接建立参与人与帖子的关系,用有向连接来建立参与人与参与人之间的关系。

3.2 程序模块

程序模块包括了参与者的到来、发帖、回帖、回帖机制、离开动作。

(1)参与者的到来。根据雅虎提供的数据参考,平均的参与人是165,因此到来间隔为165/365,所以到来的累积分布为:y = 0.452x,离开的累积分布为:y = 0.067lnx + 0.431。

参与者到来之后,用 ticks记录到来的时间,随机给参与者一个位置,设置一些属性,包括大小、颜色等,并创建一个帖子。初始状态下,出度和入度都为0。由于回帖机制“最小努力”中,需要给每个参与者一个最小努力的权重,因此在参与人到来时就给他产生一个随机数来表示最小努力权重。

(2)发帖。创建一条新的帖子,首先记录发帖的时间,其他参与人只能在8天(ticks)内对该帖子进行回复,还能设置帖子的大小、颜色等。在创建帖子初始就生成了一条回复,因此一条新的帖子的初始回复数量为1。创建帖子之后,还需要在参与者与帖子之间建立一个无向连接,才能保证帖子是属于该创建者的。

(3)回帖。本文考虑的是一种混合的机制,因此将全部活跃的参与者随机地均匀地分成4组,分别给予标签,按“偏好依附”、“最小努力”、“直接互惠”、“间接互惠”的机制选择帖子回复。每个参与者可以有0到预设的最大值之间的机会进行回帖,最大的回复数量可以在按钮中进行设置。回帖的数量也是个随机变量,需要在0到最大值之间随机选择。

(4)回帖机制。在“偏好依附”机制中,每个参与人会根据参与人的入度来决定回复哪个参与人的帖子,在0到最大入度之间生成一个随机数,在入度大于这个随机的参与人之间任意选择一个进行回复。另外,回帖的数量应该由小于最大值的随机数产生。在回复过程中,需要建立参与者与参与者之间的回复与被回复关系,本文规定每个参与者在选择某个参与人之后,回复他的第一条帖子。当回复成功,该参与者的出度加上1,而被回帖的参与者的入度加上1,且被回复的帖子的回复数也应该加上1。在“最小努力”机制中,最小努力,参与人是根据其他每个参与者的“最小努力”权重来选择回帖的,权重越大,表示参与者的帖子越容易被回复,同样引入一个随机数,在0到最大的权重之间随机产生一个随机数作为临界点,然后在权重大于这个临界点的参与者之间任意选择一个参与者回复,另外,回帖的数量同前面一样,应该由小于最大值的随机数产生。在“直接互惠”机制中,为每个潜在的参与人制定直接互惠的权重(在0到2之间)。在这种机制中,选择哪个参与者的帖子进行回复取决于权重的大小,同前面一样,并不是一定选择权重最大的参与人的帖子进行回复,而是权重越大,被回复的可能性越大。同样的,在0到2之间随机生成一个浮点数作为临界值,在权重大于这个临界值的参与人中选择一个进行回复,且回复这个参与人创建的第一个帖子。回复帖子的次数如前面一样,应该在0到最大值之间任意产生一个随机数,用一个循环实现多次回复。确定回复次数,回复谁的帖子之后,被回复的参与者的和第一条帖子的回复分别应该加1,而该参与者本身的也应该加1。在“间接互惠”机制中,选择回复的标准是入度与出度的比,当参与者的这个比例越大,那么被回复的可能性越大。在活跃的参与者中找到该比例最大的参与者,在0到最大的比例之间产生一个随机数作为临界点,在比例大于临界点的参与者中任意选择一个回复,回复的次数跟前面一样随机产生。

(5)离开。当参与者进入系统一段时间,按照离开的累积分布使其变为不活跃状态,在NetLogo中,因为需要统计参与者的人数,帖子数目以及回复数量。

3.3结果

通过各个模块的实现,可以得出结果如图1:

从输出的图可以看出,入度较大的参与者较少,因为各个参与人在选择帖子回复时,会集中地选择这类入度较大的参与者的帖子回复,因此在365天之后,入度越大的参与者被回复越来越多,而绝大多数群体的这些入度较小的参与者收到的回复越来越小,这种在线的网络社区就形成了幂律分布。

4结论

本文运用NetLogo对在线社区进行了仿真,模拟了网络中的写贴回帖交流平台,根据提出的四种回帖机制——“偏好依附”、“最小努力”、“直接互惠”、“间接互惠”,对系统各个模块进行了构建。最后通过可视化界面输入结果,结果表明:这种在线的社区形成了幂律分布。

参考文献

[1] 贺爱忠,李雪.在线品牌社区成员持续参与行为形成的动机演变机制研究[J].管理科学, 2015,12(5):733-743.

[2] Ren,Y.,Kraut,R.,and Kiesler,S.Applying Common Identity and Bond Theory to Design of Online Communities[J].Organization Studies,2007,28(3):377-408.