基于基尼系数的网络结构洞测量
2011-06-23邓世果吴干华杨会杰
邓世果, 吴干华,2, 杨会杰
(1.上海理工大学管理学院,上海 200093;2.华南师范大学南海学院,佛山 528225)
基于基尼系数的网络结构洞测量
邓世果1, 吴干华1,2, 杨会杰1
(1.上海理工大学管理学院,上海 200093;2.华南师范大学南海学院,佛山 528225)
用结构洞分析网络结构是评价网络结构引起的竞争优势的一种重要方法.本文提出了一种新的结构洞定量描述方法,即基于主成分分析(PCA)的结构洞的测量.给出了类似于基尼系数的网络贡献度的概念,在满足度分布不变的条件下利用贡献度分析对比无标度网络与对应的随机网络,证实用贡献度评价网络有效性的优越性.得出结论:贡献度S越大,说明网络中每个节点的重要性越平均,结构洞程度越大;反之,贡献度S越小,则说明网络结构信息主要集中在部分节点上,结构洞程度越小.
结构洞;主成分分析;网络贡献度;复杂网络
1 结构洞的概念及计算方法
随着社会关系网络研究的进展,网络结构对社会关系的影响日益受到关注.普遍存在的信息壁垒导致不完全竞争,选择往往集中在具有支配地位的玩家手里,其他的每个玩家一定程度上附属于具有支配地位的玩家.竞争场中处于某种特殊关系结构中的个体,可以透过信息过滤(information filtering)获得更多竞争优势与创新能力.关系结构对信息利益和控制利益的影响是社会竞争网络研究的核心问题[1].
结构洞[2]是关系结构分析方法中引起广泛关注的概念,该理论试图对个体在群体之中的关键位置进行深入的解释.结构洞指在社会关系网络中两个个体或两个群体之间不存在直接连接,且它们之间不存在间接冗余关系(redundancy),那么,两者之间的阻碍就是结构洞.如图1所示,3个菱形和三角形B均与三角形A直接相连,但3个菱形与三角形B之间没有边,要通过三角形A产生联系,这样它们之间就产生了间隙,形成结构洞,三角形A具有较好的竞争优势,更容易获得信息又没有造成冗余.三角形B的地位同于三角形A,但与三角形B直接相连的3个菱形彼此之间也有直接联系,这就造成了网络冗余,B在网络结构中的优势和控制力会明显低于A.拥有较多结构洞的个体,越趋向于财富的快速积累、地位的快速提升.竞争的社会结构不仅要有个体的资源优势比较,还应包括对拥有结构洞数量的关系优势(relations advance)比较.个体的最佳方案是尽量占据多的结构洞,然后跨越结构洞,连接原来没有关系的群体,使个体成为信息流的媒介[3-4].
图1 结构洞示意图Fig.1 Illustration of structural holes
网络约束系数(network constraint index)是Burt在1992年提出的计算结构洞系数的方法[1].设节点i花费在j上的时间或者精力占其总时间或精力的比例为Pij.节点i的网络约束系数
该约束系数描述的是网络中某一节点与其它节点直接或间接联系的紧密程度.网络约束系数越高,网络的闭合性越高,结构洞程度越小;反之,结构洞程度越大.此方法成功地应用于中等类型公司中信息扩散路径和行动者的心理研究[5-6].但是,这一概念只是考察了节点最近邻和次近邻的影响,没有考虑到更加宏观的结构信息,并且没有考虑到邻居间的联系对控制力的影响.
介数中心性(betweenness centrality)广泛地用于定量描述结构洞.关系网络中某节点的介数中心度是所有节点对之间的最短路径中途经该节点的最短路径数目.其中包含两个假设:每条路径的权系数相等,且信息从起始节点到目标节点传达的过程中总是走最短路径.因此,可测量单个节点对网络资源控制的程度.这一方法的缺点是假设节点之间通过
最短路径传递信息,这并不是普遍的行为策略[7-8],且在网络中只有聚类系数(cluster)小的节点,介数(betweenness)大时才处于结构洞位置.
网络有效结构尺度(network effective size)[9]定量地考虑了结构洞的部分内容,简单地认为,如果间接看来节点之间不存在冗余关系,那么两者之间的空隙就是结构洞,即节点度的规模减去冗余连接的数目[10].节点i的有效结构尺度
式中,j为所有与i相连的节点;q为不同于i和j的第三点;PiqPjq为节点i与节点j的冗余边数.
总之,这些结构洞的定量描述提供了关系网络上节点在结构上的特异性,为评价这些节点的结构上竞争性提供了重要的参考指标,但是,仍然存在一些问题需要改进,特别是没有提供一个有效的量对关系网络整体进行有效的评价[11].实际上,结构洞的核心思想是节点之间传递信息通路的非冗余性.冗余性的存在会削弱节点的竞争力,增加维护网络结构的耗费.因此,本文将从这一思想出发,采用主成分分析方法,将基尼系数应用于结构洞特性的描述,给出网络结构的一个整体性的评价.
2 方法与材料
2.1 主成分分析测量结构洞
主成分分析(PCA)是一种从对象中提取主要信息,而忽略相对次要信息的多元统计分析方法[12],可有效消除数据结构中的冗余信息,从而对数据进行有效的压缩.本文基于PCA的信息压缩思想,提出了一种新的测量结构洞程度的方法.
一个社会关系网络可以采用邻接矩阵描述.邻接矩阵的矩阵元A(i,j)表示节点与节点之间的连接状态.当两者直接相连时该元素为1;否则为0.现
在将该矩阵的节点看作一个复杂系统的N个成分.而将邻接矩阵的每一列看作对该列对应的成分的一个测量,也就是该成分的属性.当网络上两个节点处于对称位置时,属性将几乎完全相同,相关系数接近1.这种对称结构在网络上对应的是大量的冗余结构,结构洞会显著减少.一个高效率的关系网络应该是尽可能少地存在冗余结构,也就是可压缩性尽可能达到最小,从而使每个节点和边的存在都有其独特的性质.当然,冗余会带来结构的鲁棒性,也是必不可少的,实际的最优关系网络是达到两者的平衡.
各成分的状态表示为
PCA算法过程如下:
a.计算观测值的协方差C
b.计算C的N个特征值,并将特征值按大小排序,记为λ1≥λ2≥…≥λN.
c.以前m个λ的和,即以可解释百分率P为横坐标,以m/N为纵坐标做曲线.仿照基尼系数的定义,可定义关系网络的基尼系数,本文中将其称为关系网络的节点贡献度S,如图2所示,即所得曲线与X轴组成的面积(图中黑色部分面积)与直线X=Y 与X轴组成的面积(图中紫色线与X轴组成的面积)的比值.该系数越大,说明要达到同样的可解释百分率需要的节点数目越多,即结构冗余程度越低,结构洞越多.
图2 贡献度SFig.2 Contribution degree S
2.2 数据
本文选用了两个真实的社会关系网络,圣塔菲(Santa Fe)研究所科研合作网络和足球运动员网络.在保持节点度不变的条件下,随机交叉互换边,得到这两个网络对应的随机交叉网络.
3 结 果
3.1 扩展的BA增长模型
运用主成分分析方法计算了28个网络的节点贡献度S,结果发现,在同一e的条件下,扩展的BA增长模型生成的网络的节点贡献度SBA均随着α的增大而减小,如图3所示,即α越大,网络的结构洞程度越小.这是因为新增节点与旧节点连接的偏好程度增大,即新增节点偏向于与度大的节点相连,这样就会导致网络中大部分节点都与部分中心节点相连,因此,网络的信息主要集中在这些中心节点上,使其它节点的重要性降低,网络的可压缩性增强,造成网络冗余.
现分别对扩展的BA增长网络的节点贡献度SBA和扩展的BA网络对应的随机交叉网络的节点贡献度SBAr进行比较,结果如图3所示.在e=1,2, 3,4时,BA增长网络的节点贡献度SBA均大于BA网络对应的随机交叉网络的节点贡献度SBAr,即BA网络对应的随机交叉网络的结构洞程度较低,因为扩展BA网络对应的随机交叉网络是在度不变的条件下随机交叉互换边得到的网络,这一网络在原有网络的基础上破坏了原有网络的网络结构,降低了结构洞程度,造成网络冗余.因此,扩展的BA网络的网络结构优于扩展的BA网络对应的随机交叉网络的网络结构.这说明,虽然与随机网络相比BA网络的贡献度SBA较小,即结构洞程度较小,但是,BA网络也存在一定的网络结构优势,这一网络结构要优于随机交叉网络的网络结构.
图3 e相同时S与α的关系图Fig.3 Relation of S versusαwith same e
现比较不同e之间的扩展BA网络节点贡献度S,如图4所示.在图4(a)中发现,随着e的增加,S增大,且S增大的速率越来越缓慢,当e从3增大到4时,S的变化已经很小,这说明e越大,BA网络的网络结构性越明显,结构洞程度越高.但是,S又不会无限制地增长,它会慢慢趋向一个稳定值.而BA增长网络对应的度不变随机交叉网络的S的变化趋势没有BA增长网络的明显.
3.2 真实社会网络
基于圣塔菲科研合作网络和足球运动员网络的成员在俱乐部内部以及外部的社会关系,比较真实网络与其对应的随机交叉网络的贡献度,如表1所示.在表1中可以看出,真实网络的节点贡献度St大于随机交叉网络的节点贡献度Ste,这表明真实的社会网络结构优于随机交叉网络的网络结构.
图4 e不同时S与α的关系图Fig.4 Relation of S versusαwith different e
表1 真实网络与对应随机交叉网络的S比较Tab.1 Comparison of S for real-world networks and the corresponding shuffled networks________
4 结 论
提出了一种新的结构洞测量方法,即基于主成分分析(PCA)的结构洞的测量方法,并用此方法得出如上结果.通过扩展的BA网络在同一e下分别选取不同的α值,得出网络节点贡献度S随α的增大而减小,即α越大,网络结构洞程度越低,在扩展的BA模型对应的随机交叉网络中也得出相同的结论;通过对扩展的BA增长网络的节点贡献度SBA和扩展的BA网络对应的随机交叉网络的节点贡献度SBAr进行比较,得出SBAr<SBA,即扩展的BA网络对应的随机交叉网络的结构洞程度低于扩展的BA增长网络;通过比较不同e之间的扩展BA网络节点贡献度S,得出e越大,网络的结构洞程度越高,但结构洞程度又不会无限制地增高,随着e的增长会趋向于稳定状态,且扩展的BA网络对应的随机交叉网络也有相同结论,但扩展的BA网络对应的随机交叉网络结构洞程度变化没有扩展的BA网络明显.
通过比较真实网络与其对应的随机交叉网络,得出真实的网络的贡献度高于其对应的随机交叉网络,真实的网络结构优于其对应的随机交叉网络.结合各研究领域的应用可以说明,从节点关系和网络结构的角度可以界定节点所处的位置及拥有的控制知识的力量.结构洞在网络结构研究中起导向性作用,该理论和方法定会对商业网络分析、情报分析及计量领域等诸多社会关系网络研究起到强有力的推动作用.通过对各种结构洞算法的理解和掌握,可以促进对更大范围的网络知识的挖掘,并能够更好地理解相关网络的关系和结构,有利于对网络结构展开更深层次的研究.
[1] BURT RS.The Social Structure of Competition[M]. Cambridge:Harvard University Press,1992.
[2] BURT RS.The social capital of opinion leaders[J]. The Analysis of the American Academy of Political and Social Science,1999,556(1):37-54.
[3] BURT RS.The contingent value of social capital[J]. Administrative Science Quarterly,1997,42(2): 339-365.
[4] BURT RS.Structural holes and good ideas[J].American Journal of Sociology,2004,11(2):349-399.
[5] BURT R S.The gender of social capital[J].Rationality and Society,1998,556(1):37-54.
[6] GIUSEPPE S.Network memory.The influence of past and current networks on performance[J].Social Network,2004,47(6):893-906.
[7] FREEMAN L C.A set of measures of centrality based on betweenness[J].Sociometry,1977(1):35-41.
[8] FREEMAN L C.Centrality in valued graphs:A measure of betweenness based on network flow[J].Social Network,1991(13):141-154.
[9] NEWMAN M E J.A measure of betweenness centrality based on random walks[J].Social Networks,2005, 27(2):39-54.
[10] MCEVILY B.ZAHEER A.Bridging ties:A source of firm heterogeneity in competitive abilities[J].Strategic Management Journal,1999,20(12):1133-1156.
[11] 胡蓉,邓小昭.基于结构洞理论的个人人际网络分析系统研究[J].情报学报,2005,24(4):485-489.
[12] 郭崇慧.基于PCA的复杂网络社区结构分析方法[J].运筹与管理,2008,17(6): 144-149.
Gini-coefficient-based measurement of structural holes
DENGShi-guo1, WUGan-hua1,2, YANGHui-jie1
(1.Busimess School,Umiversity of Shamghai for Sciemce amd Techmology,Shamghai 200093,Chima;2.Namhai School,South Chima Normal Umiversity,Fosham 528225,Chima)
Structural hole is an important concept to estimate pattern-induced competitive power for each node in a social network.Principal component analysis(PCA)was proposed to evaluate the structural holes in a global way.Gini-coefficient for social network was defined to measure quantitatively the structural holes.As examples,the Gini coefficients for some real-world networks and the extended Barabási-Albert scale-free networks were calculated.It is concluded that the bigger the contribution of S in the network,the more uniform the importance of modes and the greater the degree of structural holes;Conversely,the smaller the contribution of S,showing the network structure information mainly concentrated in part of nodes,the smaller the degree of structural hole.
structural hole;primcipal compomemt amalysis;metwork comtributiom;complex metwork
N 941文献标示码:A
1007-6735(2011)05-0452-05
2011-10-08
国家自然科学基金资助项目(10975099,10635040);上海市重点学科建设资助项目(S30501)
邓世果(1985-),女,硕士研究生.研究方向:系统理论.E-mail:guobingpeng123@163.com
杨会杰(联系人),男,教授.研究方向:经济和生物复杂系统.E-mail:hjyang@usst.edu.cn