APP下载

基于复杂网络的开源软件社区的结构异质性*

2013-08-16杨建梅曾进群张建功

关键词:幂律生产者异质性

杨建梅 曾进群 张建功

(1.华南理工大学 工商管理学院,广东 广州 510640;2.华南理工大学 环境与能源学院,广东 广州 510006)

《科学》杂志近期发表了知识团队生产的相关研究成果[1],而物理学界从本世纪初开始就一直重视科学家的合作结构与功能的研究[2].开源软件社区就是一种网络上的基于团队合作的知识生产组织,但是对开源社区的研究才刚刚起步[3].按照笔者的定义[4-5],这种社区是一个人类活动系统,其结构不再是层级部门的结构,而是由其基本活动形成的活动结构.在这种思想的指导下,文中的社区组织结构包含以下3 种类型:人员参与项目开发活动而形成的生产结构,伴随生产活动的与bug 有关的质量保障活动结构,以及搜集对软件产品需求及其他信息的沟通活动结构.生产、质量保障与了解需求的活动,是非商业的、开放的大众生产社区的最为重要的活动,从这3 个维度可以揭示出这种组织结构的特点.

1 异质性探讨

近年来异质性一词频频在文献中出现,但是较多的是口语化采用,即使是专业性采用,也往往局限在各自学科的语境下,对何为异质性、异质性分类以及如何测量异质性鲜有一般性的简明阐述.在复杂网络学界,有的人认为幂率分布指数的绝对值大时异质性强,有的人却有完全相反的看法.下面先给出笔者对异质性的一些思考.

1.1 帕累托世界

长期以来,人们认为我们生活的世界仅仅是高斯正态分布的世界.在高斯世界,事件之间具有加法独立性.这些事件的数据点产生的钟形分布曲线由均值与方差就可以完全描述.因为其数据点以99.7%的概率落在均值加减3 倍标准差的范围内,而标准正态分布的期望为0,标准差仅为1,所以可以认为在高斯世界,事件的属性是同质的,就像人的身高那样,存在一个典型的高度,也就是说具有代表性的尺度.

1897年意大利经济学家帕累托研究个人收入时,发现20%的人口占据了80%的社会财富的所谓帕累托分布.帕累托分布完全不同于正态分布,由于研究对象的数据极不均匀,其均值和方差失去意义,这样在个人收入中就不存在一个财富值可以作为个人财富的代表尺度.帕累托分布不仅存在于经济领域,还广泛地存在于其他领域,因此我们生活的世界不仅有高斯世界,还包括异质的无代表性尺度的帕累托世界,在今天的互联网与大数据时代尤其如此.

1.2 异质性含义与分类

异质性来源于帕累托分布,受帕累托分布以及各种专业文献的启发,文中认为异质性具有多样性与非均匀性两方面的含义.这里的多样性指的是对象的某个指标的取值范围广因而差异大,非均匀性指的是各种取值出现的频率具有较大的差异.这样,对象的某种指标仅取值的范围广还不能说具有异质性,因为它可能是均匀分布的;同样,仅取值的频率有较大差异,也不能说具有异质性,因为它的取值范围可能很窄.因此,对于一个研究对象来说,只有当其某种指标的取值范围广,而且其分布也不均匀时,才能称得上在某方面具有异质性.简言之,异质性等于多样性加非均匀性.

互联网时代造就了更多的连接关系.统计物理学家巴拉巴斯发现,由实际连接关系形成的大规模网络,不像随机网络那样,节点具有大致相同的连接,而是少数节点具有大量的连接、大量的节点仅具有少数的连接[6].这样,节点之间连接关系的多寡就具有了异质性.基于巴拉巴斯的发现,笔者将异质性分为两类:属性异质性与关系异质性.比反映财富属性异质性的帕累托分布大约晚100年的巴拉巴斯的无尺度复杂网络模型,为分析关系的异质性提供了工具.

1.3 基本测量方法

对象属性的异质性可直接用帕累托分布来测量.在帕累托分布中X 是随机变量,对X 的累积分布函数,复杂网络学界常用以下形式:

概率密度函数

式中,x 为任何一个大于xmin的数,xmin为X 最小的可能值(正数),k 为正的参数.图1 所示的累积分布的示意图摘自维基百科,这里画的是常见的累积分布表达式F(x)=P(X≤x)的曲线.帕累托分布属于幂律分布,幂律分布在双对数坐标下是一条斜率为负数的直线,因此属性的异质性可通过累积分布图,尤其是双对数坐标下的累积分布图是否是长尾的幂律分布来确定.由图1 可以看出:k 越小分布越均匀,但取值的范围广、差异大;k 越大分布越不均匀,但取值的范围窄、差异小.兼顾多样性(取值有数量级的差别)与非均匀性两个条件,并考虑复杂网络有关度分布幂指数的研究,这里用k 是否在1~3 之间来判断异质性(概率密度的幂指数比k 大1,若用概率密度指数,则是在2~4 之间),这意味着属性的幂律分布并不总是表示其存在着异质性.

图1 帕累托累积分布示意图[7]Fig.1 Pareto cumulative distribution function[7]

与属性不同,在测量大规模活动关系的异质性时,首先要确定关系是什么,并建立描述此关系的复杂网络模型[8-11],在找到复杂网络的相关特征参数后,再使用分析属性变量异质性的方法去分析这些特征参数,以测量关系的异质性.

下面以CodePlex 为例,分析开源软件大众生产社区结构的异质性.由于结构是关系的总合,因此用到的是关系的异质性测量方法,不同的关系可以从不同的角度来揭示结构的异质性.此外,在数据缺少时还可使用传统的定性方法作为辅助分析手段.

2 数据来源及说明

CodePlex 是微软建置的开源软件社区(http:∥www.codeplex.com),2006年开始运作,截至2012年11月,社区共有32118 个项目,其中最活跃的有C#、Sharepoint 等子社区,每个子社区的主页都分8 个栏目记录了所有数据.我们用火车头软件,挖掘了Codeplex C#子社区(下文简称社区)从2006年5月至2012年7月间的下列数据:1)所有生产记录,共计198616 条,包含项目2136 个,参与者3233 人;2)所有bug 讨论记录,共计6 万多条;3)所有沟通记录,共144342 条.社区组织的结构是由其基本活动形成的网络结构,将参与者与项目看成节点,将活动形成的联系看成边,就得到了相关活动结构的复杂网络模型.这里的静态复杂网络模型基于2006年5月至2012年7月的全部记录,而动态网络模型以半年为一期,基于2006年下半年到2012年上半年的记录.由于篇幅所限,复杂网络模型的大量数学计算在下文中将不予列出.

3 生产结构的异质性

从生产模式与网络结构两个方面来分析生产结构的异质性.

3.1 生产模式的异质性—— 洞穴与网络式并存

(1)模型构建 为分析生产模式,首先建立了生产者与项目的二分布尔复杂网络模型.网络是点与边的集合,将Codeplex C#社区的所有生产者定义为底部节点,所有项目定义为顶部节点,如果一个生产者在2006年5月至2012年7月之间开发过某个项目,那么就在他们之间连一条边,这样就得到了该社区的2006-2012年间的生产者与项目的二分布尔复杂网络模型,简称2006-2012 二分布尔网络.2006-2012 二分布尔网络共有5 369 个节点,其中顶部节点2136 个、底部节点3233 个,3785 条边.为动态分析生产结构,文中还按照同样的思路,建立了从2006年下半年到2012年上半年、以半年为一期的、生产者与项目的二分布尔网络序列模型.

(2)分析思路 笔者认为,生产模式体现在生产者对项目的生产关系所形成的生产圈子中,而连通图是生产圈子的数学描述,因此通过分析二分布尔网络的连通图来寻找开源社区的生产模式.

(3)连通图的发现 网络中的连通图是其内部任意节点对之间都有路径相连的网络子图,网络常常含有多个独立的连通子图.经计算,2006-2012二分布尔网络共有1614 个连通图,其中的1 039 个连通图是由1 个项目与1 个生产者形成的(见图2中的A 型);299 个是1 个项目与多个生产者节点形成的(见图2 中的B 型),这样含有1 个项目的连通图共有1338 个;而130 个连通图则是由多个项目节点形成的(见图2 中的C 型),剩下的146 个连通图是1 个生产者开发2 个及以上项目形成的(见图2中的D 型).

图2 洞穴式与网络式生产模式Fig.2 Cave and network-based pattern

图2 中A 型生产模式就像1 个人在挖1 个洞,B 型就像多个人在挖1 个洞,它们都仅含1 个项目“洞”,因此都可形象地称为洞穴式生产模式[12];而C 型与D 型(尤其是C 型)与A、B 型截然不同,是多个项目的多“洞”网络化生产模式,在网络化模式中不同项目节点之所以能够相连,是因为有人开发了2 个及以上的项目.2006-2012 二分网络中,规模最大的C 型含有239 个节点,其中项目节点29个,生产者节点211 个.

(4)结论 对2006-2012 二分布尔网络连通图的分析说明,开源大众生产模式是洞穴与网络式并存的,1614 个生产圈子中有82.9%(1388/1614)的生产方式是洞穴式.进一步统计分析还显示,2006-2012 二分布尔网络1 614 个连通图规模的累积分布,是k 为1.5 的幂律分布(可决系数R2=0.89),也就是说,大多数连通图包含的节点很少,少数的连通图包含的节点很多,而节点数很少的连通图都是仅有1 个项目节点的洞穴式生产圈子,因此可以说,开源大众生产模式是洞穴与网络式共存,具有明显的异质性,但是以洞穴式为主.

时间序列的二分布尔网络根据每半年实际发生的生产行为建立.从2006年7月到2012年6月,实际有开发行为的人数从140 人增加到828 人,涉及的项目数从81 个增加到566 个,但是在生产圈子中,网络型占有的比例却基本稳定在10%~12%左右.网络型的比例虽然不高,但是毕竟占有10%以上,因此支持了2006-2012 二分布尔网络模型的分析结论(即开源大众生产模式是洞穴式与网络式并存,具有明显的异质性).

3.2 网络结构的异质性

3.2.1 二分网络的异质性

在2006-2012 生产者与项目的二分布尔网络模型的基础上,以生产者参与相应项目的累计次数作为相关边的权重就得到生产者与项目的二分加权网络模型.节点的边权之和就是该节点的权重.二分网络顶部节点度值表示项目的生产者人数,底部节点度值表示生产者参加的项目数.二分网络顶部节点的权值表示项目被生产的次数,底部节点的权值表示生产者对所有项目的生产次数.图3 显示出二分网络的度或权的累积分布与随机网络零模型有明显不同,加权网络与布尔网络的累积权和度都呈现幂律分布,除底部节点的度之外,它们的取值都有数量级的差别,且k 大约在1~3 之间,因此可以说二分网络的结构具有异质性.

图3 二分网络节点度与权的累积分布Fig.3 Cumulative distribution of node degree and weight in bipartite network

底部节点度表示生产者开发的项目的个数,由于人的能力的同质性,虽然仍是幂律分布,但按文中的标准就不具有异质性了.

3.2.2 合作网络的异质性

3.2.1 节是从生产者与生产任务的关系来看生产结构,下面将从生产者之间的合作关系来看生产结构,这需要建立生产者合作关系的网络模型.

(1)模型构建 将2006-2012 生产者与项目的二分布尔网络向底部生产者节点投影,就得到生产者的布尔合作网络.布尔合作网络节点间的连边表示这对生产者至少共同开发过一个项目.进一步找出两个生产者共同开发的每一个项目各自的生产次数,然后以较小的生产次数作为他们在这个项目上的合作强度,并以他们共同开发的所有项目的合作强度之和作为两个生产者之间连边的权重,这样就得到生产者的加权合作网络.

(2)从权与度值看异质性 加权合作网络的节点最大权值为5221,权值为0 的节点共有1185 个,占节点总数的36.7%,累积权值呈k 为0.85(R2=0.90)的幂律分布;而度呈分段幂律分布.以上说明,36.7%的节点的合作强度为0,而节点的最大合作强度为5221,因此从合作强度来看网络近似具有异质性(图4).

图4 合作网络的累积度与权的分布Fig.4 Cumulative distribution of node degree and weight in cooperation network

(3)从拓扑指标看异质性 布尔合作网络反映了合作关系的结构.经计算3233 节点布尔合作网络的介数呈现k 为0.36 的幂律分布(R2= 0.86),而紧密度值较集中,集聚系数大多分布在0 或1.点的介数表示通过该点的最短路的条数,介数的计算结果表示从中介位置来看网络存在着多样性但不具有非均匀性,因此布尔合作网络从3 个拓扑指标来看都不具有异质性.

(4)从连通图看异质性 加权合作网络共有3233 节点、25 188 条边,其中1 185 个孤立点.除过孤立点外,共有429 个连通图,最大连通图有210 个节点,占非孤立点的比例为10.25%,6 632 条边,这些连通图所含节点的数量呈幂律分布,累积分布的k 为1.27(R2=0.95),因此从连通图的规模来看网络具有异质性.

(5)从社团结构看异质性 从连通图规模看异质性,是从节点之间有无连接通路的角度来看的,而从社团结构看异质性,则进一步从连通图内部连接关系的多寡与强弱来看.社团内部节点之间的联系比社团之间节点的联系既多又强.经分析发现,社团的实际背景就是项目的团队.社团划分有许多算法[13],最新算法是与随机图比较的Potts 算法[14].Potts 算法有0 阶(保持平均度不变)与1 阶(保持度序列不变)零模型算法.Q 值是衡量社团性强弱的指标,一般以Q=0.3 作为网络具有明显社团结构的最低标准.采用Potts 的1 阶零模型算出布尔与加权合作网络的最大连通图分别有10 个与11 个社团,最大社团含有50 或51 个节点,而最小的社团仅有2 个节点,所以不同社团之间在规模上也存在着多样性(如表1 所示).

表1 合作网络社团结构1)Table 1 Community structure in the cooperation network

(6)从富人俱乐部看异质性 社会上富人和富人来往多的现象被称为富人俱乐部现象,通常采用以下指标来判断[15]:

式中:r 表示财富,财富大于等于r 的富人为俱乐部成员;Wl,rank是边权(交往强度),表示排序为第l 大的边的权值,W>r是俱乐部内的边权之和;E>r是俱乐部成员之间的边数;φw(r)表示俱乐部内的边权之和与整个网络边权从大到小排列的同样边数的边权之和的比值.进一步以相应的随机化网络为比较对象就得到ρw(r),若ρw(r)大于1,则表明实际的加权网络存在富人俱乐部现象.

以节点权表示财富指标r,从图5 可以看出,加权合作网络存在着明显的富人俱乐部现象,尤其是在r 大于2000 以后.这说明合作活跃的生产者主要是在彼此之间进行合作的,因此活跃者之间的合作强度与其他类型的合作强度之间存在着差异性.

图5 加权合作网络的富人俱乐部系数Fig.5 Rich club coefficient curve of the weighted cooperative network

开源软件的生产必然伴随着信息的流通,因此开源社区不仅是生产的平台,也是信息沟通的平台.Codeplex C#社区有两个信息沟通的版块:issues 栏目下的bug 讨论版块与discussions 栏目下的更一般的信息沟通版块.

4 bug 讨论结构的异质性

4.1 模型构建

为分析bug 讨论结构的异质性,首先需要建立bug 讨论关系的复杂网络模型.与生产、项目的二分关系不同,bug 帖子与讨论人的二分关系主要是网络模式,而且对于社区结构来说,帖子远没有项目重要,因此不需要建立帖子与讨论人的二分网络模型.这样Bug 讨论网络以参与bug 讨论的人为节点(删除了仅提交了bug 但没有人回应的人),在bug 的提交人与回复人之间建立有向边,方向指向回复人,有向边的权等于这种提交与回复关系的次数.按照上述规则,2006年5月至2012年7月整个时间段的bug 讨论加权有向网络共有5842 个节点、5741 条边.

4.2 从度与权值看异质性

bug 讨论有向加权网的节点的入度表示该节点回复过多少人所提出的bug,入权表示该节点回复过多少次别人所提出的bug;出度表示回复过该节点所提交的bug 的人数,出权表示回复过该节点提交的bug 的次数.一般来说,入度或入权越大,表示节点所解决的bug 越多;出度或出权越大,表明节点所提出的bug 越多.

2006-2012年bug 讨论有向加权网的5 842 个节点中,入度为0 的节点共有2 876 个,占总数的49.2%,最大的入度与入权值分别为49 与89;出度为0 的节点共有2377 个,占总数的40.6,最大的出度与出权值分别为117 与344.剔除这些出度或入度为0 的节点后,累积度和权的幂律分布如图6 所示.从图6 可见,节点的度或权的取值都有着数量级的差异,且出度与出权的k 在1~2 之间,入权的k为1.91,而入度的k 接近2,因此bug 讨论结构从节点讨论广度(度)与强度(权)来看都具有异质性,不过节点的回复bug 的多样性略小于提交的,与强度有关的异质性大于广度.

图6 bug 讨论有向加权网的累积度和权的分布Fig.6 Cumulative distribution of node degree and weight in directed and weighted bug discussion network

4.3 从拓扑指标看异质性

经计算5842 个节点的bug 讨论网络,其节点的介数呈幂律分布,累积分布的k 为0.48(R2=0.88);紧密度分布与布尔合作网络的相似,而集聚系数与布尔合作网络的双峰不同,呈多峰分布,且多在0.5 以下.bug 讨论网络从介数来看具有多样性,而从3 个拓扑指标来看都不具有异质性(如图7所示).

图7 bug 讨论网络拓扑指标的直方图Fig.7 Topology index histogram of bug discussion network

4.4 从连通图看异质性

5842 个节点的bug 讨论有向加权网络共有860 个连通图(有边就算连通).最大连通图有2 630 个节点,占总节点数的45%,规模最小的含2 个节点(不包括孤立节点),但连通图的规模呈指数分布(指数为-0.00167,R2=0.81),说明从连通图规模来看bug 讨论网不具有异质性.另外,生产结构的二分网络与加权合作网络的最大连通图的节点比例分别仅为4.45%与10.25%,可见生产结构有较大的碎片性,而bug 讨论网络的整体性较强,这进一步说明开源社区的bug 讨论结构与生产结构之间也有差异:bug 讨论的圈子大而生产合作的圈子小.这是由生产的专业性与信息沟通的广泛性造成的.

5 信息沟通结构的异质性

5.1 模型构建

为分析信息沟通结构的异质性,首先需要建立沟通关系的复杂网络模型.文中不仅建立了2006年5月至2012年7月的整个时间段的沟通关系网络模型,也建立了以半年为一期的时间序列沟通网络模型,后者具体的时段划分与生产者和项目的时间序列二分网络一样.模型中沟通者为节点,如果两个沟通者讨论过共同的主题,则它们之间就有一条边,这样得到的是无权的沟通网络模型;进一步以讨论次数代替生产次数,采用与加权合作网络同样的边权生成方法,就得到加权的沟通网络模型.2006-2012 时段的沟通关系网络共有个26481 个节点(包括孤立节点)、467622 条边.

5.2 从度与权值看异质性

沟通网络节点的度表示沟通者沟通过的人数,26481 个节点2006-2012 沟通关系网络的度呈幂律分布,累积分布的k 为1.52(R2=0.86)(见图8).边权表示两人之间沟通的强度,节点权是边权之和,代表了节点的总沟通强度.从时间序列沟通网络分布的相关数据可知,各时段网络的节点权也都呈现幂律分布,累积分布的k 值接近,从1.01~2.00(R2从0.92~0.97),且各有数量级的差别.权值最大的沟通者是项目的核心人员或者项目的发起人.以上说明,沟通网络的节点在沟通的广度与强度方面都存在异质性,核心成员与一般成员之间的差异最大.

图8 2006-2012 沟通网络累积度分布图Fig.8 Cumulative distribution of node degree in communication network in 2006-2012

5.3 从拓扑指标看异质性

26481 个节点2006-2012 沟通关系网络的介数、紧密度与集聚系数的分布见图9.介数呈幂律分布,累积分布的k 为0.39(R2=0.74),说明沟通网络在中介位置方面存在多样性.同样,沟通网络从这3 个拓扑指标来看不存在异质性.

图9 2006-2012 沟通网络拓扑指标的直方图Fig.9 Topology index histogram of communication network in 2006-2012

5.4 从连通图看异质性

以2011年上半年为例,其沟通网络共4 125 个节点、14690 条边,经计算共分为833 个连通图(包含孤立点),833 个连通图中最大规模的含有2458 个节点,占总节点数的59.6%.规模最小的仅含1 个节点(但有577 个),连通图节点个数呈幂律分布,累积分布的k 为0.94(R2=0.80).这说明沟通网络从连通图规模来看近似具有异质性.但与bug 讨论网络一样,与生产网络相比,信息沟通网络的整体性也较强,这也是由生产的专业性与信息沟通的广泛性造成的.

5.5 从社团结构看异质性

采用Potts 算法,得到每半年沟通网络最大连通图的社团分析结果,发现无权沟通网络存在社团(Q大于0.3),但从各种零模型的Q 值在0.1 附近可知,与加权生产网络不同,加权沟通网络没有社团,这说明生产与沟通的强度结构存在差异性.

5.6 从富人俱乐部看异质性

采用与加权生产网络同样的分析方法,发现加权沟通网络也具有显著的富人俱乐部现象.2008年下半年的分析结果如图10 所示.图10 说明活跃的沟通者主要是在彼此之间进行沟通,活跃者之间的沟通与其他类型的沟通之间存在着异质性.

图10 加权沟通网络的富人俱乐部现象Fig.10 Rich club phenomenon in weighted communication network

在对异质性进行思考的基础上,建立了开源社区结构的复杂网络模型,在对复杂网络的参数进行分析中,找出可反映社区结构异质性的参数.以上结果汇集在表2 中.

6 结语

Codeplex C# 开源社区结构的异质性.首先,连通图分析反映出,存在两种性质不同的生产模式:洞穴式与网络式,且生产的二分与合作网络的连通图规模都呈现出异质性与碎片性;bug 讨论结构与沟通结构则不同,它们以网络式为主且大多数成员都处于最大连通图内,从而具有整体性;信息沟通连通图的规模具有异质性,但bug 讨论网络的连通图规模具有同质性,由此可见,从连通图来看,生产结构的异质性最强,信息沟通结构次之.其次,3 种活动结构网络的节点的权都有很好的幂律拟合且满足异质性标准,因此从节点的各种强度来看社区都具有异质性,而bug 讨论结构的节点强度最符合异质性的标准.度的幂律分布说明,社区从项目的参与人数、bug 发帖人数与回帖人数以及沟通的人数方面也具有异质性.再次,社区的各种结构的介数尽管存在多样性,但是介数、紧密度与集聚系数这些重要的拓扑指标都不具有异质性.最后,加权合作网络与加权沟通网络都具有显著的富人俱乐部现象;生产网络、无权沟通网络的最大连通图存在着社团结构,这些也反映出社区结构的异质性.

开源社区结构异质性复杂网络分析的具体步骤如下:开源社区结构的异质性常常体现在复杂网络模型的度、权等指标以及连通图、社团结构与富人俱乐部等方面,所以在建立社区结构的复杂网络模型后,先用生产者与项目的二分网络连通图去分析生产结构在生产模式方面的异质性,然后从度、权等指标的分布去探讨其他各种网络结构在节点关系的广度、强度以及信息中介地位方面表现出的异质性,再从连通图的规模以及最大连通图内社团的规模,分别看关系有无以及关系的密切性反映出的结构异质性,最后用富人俱乐部方法从节点强度与成对关系的强度(边权)来看结构的异质性.

我们认为,有关Codeplex C#社区的结论对开源社区是否具有普遍意义还需要多个案例的验证,但由此社区总结出的开源社区结构异质性的复杂网络分析步骤却具有普适性.

文中用幂律分布来测量异质性,另一方面,物理学的自组织临界态(复杂态,相变态)也是由幂律分布体现的,这样通过幂律分布,异质性与物理学的自组织临界性就联系在一起了.我们认为这就是组织异质性研究的物理背景.另外,世界上,有的组织是他组织的,有的组织是自组织的,大众生产社区是一种典型的自组织的组织.自组织的组织会自发地向临界态(吸引子)进化,所以临界性是自组织进化程度的判据,由此可知组织异质性研究的意义.

[1]Wuchty S,Jones B F,Uzzi B.The increasing dominance of teams in production of knowledge[J].Science,2007,316(5827):1036-1039.

[2]Newman M.Scientific collaboration networks network construction and fundamental results [J].Physical Review E,2001,64:016131.

[3]Crowston K,Wei K,Howison J,et al.Free/libre open source software development:what we know and what we do not know[J].ACM Computing Surveys,2012,44(2):7-35.

[4]杨建梅.组织的系统结构定义探讨[J].系统工程学报,2002,17(5):441-444.Yang Jian-mei.Research on definition of system structure of organization[J].Journal of System Engineering,2002,17(5):441-444.

[5]杨建梅.人类活动系统的复杂性[J].华南理工大学学报:社会科学版,2011,13(4):1-1.Yang Jian-mei.Complexity of human activity systems[J].Journal of South China University of Technology:Social Science Edition,2011,13 (4):1-1.

[6]Barabasi A.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.

[7]维基百科.Pareto distribution [EB/OL].http:∥zh.wikipedia.org/wiki/Pareto DistributionCDF.png.

[8]方卫东,李坤,张建功.香港恒生指数的波动性分析[J].华南理工大学学报:自然科学版,2008,36(12):138-141.Fang Wei-dong,Li Kun,Zhang Jian-gong.Analysis of fluctuation of Hong Kong Hang Seng index[J].Journal of South China University of Technology:Natural Science Edition,2008,36(12):138-141.

[9]Yang Jianmei,Lu Lvping,Xie Wangdan,et al.On competitive relationship networks:a new method for industrial competition analysis[J].Physica A,2007,382(2):704-714.

[10]Yang Jianmei,Wang Wenjie,Chen Guanrong.A two-level complex network model and its application[J].Physica A,2009,388(12):2435-2449.

[11]Yang Jianmei,Yao Canzhong,Ma Weicheng,et al.A study of the spreading scheme for viral marketing based on a complex network model[J].Physica A,2010,389(4):859-870.

[12]Krishnamurthy S.Cave or community an empirical exa-mination of 100 mature open source projects [J/OL].First Monday,2002,7(6).http:∥www.firstmonday.dk/issues/issue7_6/krishnamurthy

[13]Lancichinetti A,Radicchi F,Ramasco J.Statistical significance of communities in networks[J].Physical Review E ,2010,81(4):046110.

[14]Reichardt J,Bomholdt S.Detecting fuzzy community structures in complex networks with a Potts model[J].Phys Rev Lett,2004,93(21):218701.

[15]Opsahl T,Colizza V.Prominence and control:the weighted rich-club effect[J].Phys Rev Lett,2008,101(6):168702.

猜你喜欢

幂律生产者异质性
1月巴西生产者价格指数上涨3.92%
基于可持续发展的异质性债务治理与制度完善
2019德国IF设计大奖
家禽福利的未来:生产者能期待什么?
四川地区降水幂律指数研究
一场大风带给生产者的思考
幂律流底泥的质量输移和流场
现代社区异质性的变迁与启示
区域异质性:农村人力资本与农民收入增长
从EGFR基因突变看肺癌异质性