社会网络分析在兽医流行病学中的应用
2013-09-11吴洋丽王幼明康京丽于丽萍黄保续宇传华孙向东
吴洋丽,李 鹏,王幼明,康京丽,于丽萍,黄保续,宇传华,孙向东
(1.武汉大学公共卫生学院 武汉大学全球健康研究中心,湖北武汉 430071;2.中国动物卫生与流 行病学中心,山东青岛 266032)
1 前言
社会网络是众多复杂网络中的一个类型,包括疫病传播网络、社交关系网络、贸易关系网络等。社会网络分析法(social network analysis,SNA)是研究社会网络实体之间的关系结构及其属性的理论和方法,已广泛应用于社会学、心理学等多个领域。近20年来,社会网络分析也用于研究动物调运网络中的动物疫病风险,包括分析动物疫病传播与流行过程[1]、评估疫病传播范围[2]、探索网络结构对疫病传播的影响[3]和探索干预措施的有效性[4]等。近年来,动物调运网络中的疫病风险分析依靠网络科学的兴起以及社会网络分析法的进一步发展而逐渐成为兽医流行病学领域中的热点。
2 社会网络分析概述
2.1 基本原理
社会网络分析是在社会计量学和图论基础上发展起来的一种分析社会关系结构及其属性的方法,这种方法起源于20世纪30年代的心理学和人类学研究,在多种多样的学科和学派的相互影响和汇聚交融中逐渐发展起来。近20年发展迅速,已广泛应用于社会学、政治学、人类学、心理学、组织管理、大众传播和社会政策研究等多个领域。社会学家巴瑞-威尔曼于1977年建立国际社会网络学会(INSNA)。
社会网络分析又称为结构分析,是社会研究的具体方法,也是社会结构关系研究的新范式。它关注行动者之间的关系,而不是行动者属性;也关注社会网络的整体结构,而不是个体。社会网络分析从“关系”的角度出发研究社会现象和社会结构,行动者之间相互联结而形成的关系是社会网络分析的基础。总体来说,社会网络分析通过描述群体中个体之间的相互作用关系,从个体之间的互动出发去研究群体行为[5]。
社会网络分析不是运用传统变量分析方法对属性数据(如年龄、性别、发病率、免疫率等)进行分析,而是对个体之间的接触、交易、动物调运等关系数据进行网络分析。社会网络分析法分为个体网分析法和整体网分析法,个体网分析法研究社会行动者及其直接关系者构成的网络,整体网分析法研究有明确边界的群体内部的行动者之间的关系。
2.2 动物调运网络
社会网络是行动者之间连接而成的关系结构,每个行动者在网络中的位置称为“点”或“节点”,也有学者称之为“结点”;行动者之间的关联称为“关系纽带”。因此也可以说,社会网络是由多个点(社会行动者)和各点之间的连线(代表行动者之间的关系)构成的集合。其中节点可能有很多属性,连线也有很多形式。例如,一个养殖场内的动物接触网络(动物个体为网络中的点,动物之间的直接或者间接接触为点之间的连线)、一个地区牧户之间的交易关系网络(点为该地区内的牧户,连线为牧户之间的动物买卖关系)等。同一个网络中的节点也可能有不同的属性,例如养殖场的养殖动物种类、养殖场地理坐标和养殖规模等。
动物之间的接触是引起疫病扩散的主要原因,动物调运是造成分布于不同区域的动物群体之间直接或间接接触、引起病毒长距离传播的重要因素。动物调运网络结构影响动物疫病传播的模式和特点。在实际研究工作中,对网络的选取取决于所研究的动物疫病种类以及研究目的,例如口蹄疫这样的多种动物共患病来说,猪、牛、羊等易感的偶蹄动物调运信息都必须包含在网络中。
2.3 社会网络的表达形式
社会网络主要有两种表达方法:一是图论法,用于构建社群图;二是矩阵代数法,用于构建关系矩阵。这两种方法有着内在的联系,根据社群图可以构造关系矩阵。反过来,根据关系矩阵也可以构建社群图。
社群图由点和线构成,点代表行动者,线代表行动者之间的关系,适用于小型群体的分析。行动者之间的关系可以是二值的,也可以是多值的;可以有方向,也可以无方向。社会网络分析中最常用的关系矩阵是邻接矩阵,即方阵。矩阵中的要素一般是二值的,矩阵要素中的“1”或者“0”,分别代表关系的存在与否。
表1 社会网络的关系矩阵表达法示例
表1是一个虚拟的二值有向邻接矩阵,表示某行的节点到某列的节点是否存在某种关系,图1是将表1中的关系矩阵输入Ucinet 6.0软件后得到的社群图。假设A、B、C、D均代表某个牧户,表1中的关系矩阵表示农户/牧户之间的羊只交易关系,矩阵要素0表示0所在行的牧户和所在列的牧户之间不存在羊只交易关系,矩阵要素1表示1所在行的牧户和所在列的牧户之间存在羊只交易关系,行牧户将羊卖给列牧户。这些牧户之间的羊只交易关系可以在图1中一目了然。矩阵代数法和图论法各有特点,矩阵代数法较为系统,图论法较为清晰简洁,特别是网络节点很少、网络构型较特殊(如等级化结构)时,通过社群图能一目了然地获知网络结构的特点,更有利于后续分析。
图1 社会网络的图论表达法示例
2.4 社会网络分析中的主要测度简介
量化分析和可视化分析是社会网络分析法中的两大支柱。其中,可视化分析是从直观上对社群图进行分析与解释,而量化分析则建立在对关系矩阵的运算之上,通过计算相关指标,探察网络的结构和特征。整体网分析法主要有三个水平上的测度,即网络整体水平、凝聚子群水平和单个节点水平。
2.4.1 网络整体水平上的测度
网络整体水平上的测度,反映网络的结构特征,主要有以下几种测度:
(1)密度(density):整体网密度的计算方法是“实际关系数”除以“理论上的最大关系数”,即社群图中实际存在的线条占所有可能线条的比例。
(2)捷径(geodesic):捷径指图论意义上的捷径,即连接两个节点之间最短途径的长度,即边的数目。
(3)直径(diameter):直径指整个网络中最长的捷径。
(4)中心势(centralization):中心势表示整个网络呈现中心化结构的程度。
2.4.2 凝聚子群水平上的测度
在群体内部通常存在许多小群体,即在网络内部有不同的子结构。凝聚子群研究的目的在于揭示网络的结构,分析网络中存在的子结构以及网络的整体结构如何由各部分子结构构成。凝聚子群的主要测度有:
(1)派系(cliques):派系指的是至少包含三个点的最大完备子图,即其中任意两点都是直接相连的。
(2)n-派系(n-Cliques)和n-宗派(n—Clan):n-派系是指任意两点之间(在总图中)的距离都不超过n的子群。n-宗派是指任意两点之间在子群内部的捷径距离都不超过n的子群。任何n-宗派都是n-派系,反之则不成立。
(3)k-丛(k-Plex)和k-核(k-core):k-丛指的是在节点总数为n的子图中的任何点都与至少(n-k)个节点相连接的凝聚子群。k-核指的是子图中的任何节点都与至少k个其他节点相连接的凝聚子群。
(4)成分(components): 任何两点之间都能通过一定途径相连的凝聚子群称为成分,在有向图中,忽略关系方向的成分称为“弱成分”,任何两点之间都存在双向关系的成分,称为“强成分”。
2.4.3 单个节点水平上的测度
这类测度指标从不同角度反映单个网络节点的特征及其在网络中的地位。主要有以下几种测度:
(1)度数中心性(degree centrality):节点的度数中心性是对网络节点重要性最直接的度量指标,一个节点的度数越大就意味着这个节点越重要。点入度指的是指向该节点的点数总和,点出度指的是该节点指向的点的总数[6]。
(2)中间中心性(betweeness centrality):中间中心性以经过某个节点的捷径的数目来刻画节点重要性,如果一个点处于许多其他点对的捷径上,那么该点具有较高的中间中心性。与度数中心性不同,中间中心性主要用来辨识网络中作为桥梁的节点[7]。
(3)接近中心性(closeness centrality):接近中心性表示节点与网络中所有其他节点的接近性程度,体现节点不受其他节点“控制”的能力。如果一个节点通过比较短的路径与许多其他节点相连,我们就认为该点具有较高的接近中心性。
2.5 社会网络分析软件
近年来,随着社会网络分析技术的发展,也出现了许多应用软件。Peter Carrington等[8]在《Models and Methods in Social Network Analysis》一书中综述了目前被学术界用于社会网络分析的23种软件。目前,大部分社会网络分析软件都可以从网络上获得,这些软件都具备社会网络分析基本的量化分析功能和可视化分析功能。Ucinet和Pajek是兽医流行病学领域中应用最多的两个社会网络分析软件,Ucinet软件凭借其易操作性而受到许多研究者的欢迎,但是Ucinet软件是商业软件,不经注册仅可以免费使用30天,而Pajek软件是免费的,其功能比Ucinet更强大,并且适用于处理大型数据。
3 社会网络分析在兽医流行病学中的应用
以网络的视角看,传染病的传播过程是由传染源和易感者通过某种传播途径相连的无形网络。大多数传染病通过人与人之间、动物与动物之间、人与动物之间、群体与群体之间的直接或间接接触传播。潜在的社会接触网络(SCN)对传染病传播过程的影响至关重要,传染病病毒通过SCN传播,疫病传播网络成为潜藏在个体接触网络中的无形网络。在流行病学领域,社会网络分析用来研究传染病特别是接触性传染病如艾滋病、淋病、梅毒、支原体肺炎、乙型肝炎和肺结核的传播与防控。艾滋病和其他性传播疾病(STD)最早应用了社会网络分析技术,其研究数量也是最多的。在传染病的研究中,社会网络分析通常与数学模型或者统计学模型结合[9-12],用以评价传染病的传播动力。Keeling和Eames[13]总结了在流行病学研究中与社会网络分析法结合的数学模型。另外,O’Malley和Marsden[14]总结了适用于关系数据的统计模型。社会网络分析在流行病学领域中主要用来揭示疾病传播网络的拓扑性质,识别、分析疾病传播过程中的高风险节点,探索、理解疾病与健康的关系因素,从新的视角理解疾病传播机制。
近些年来,社会网络分析技术开始应用于兽医流行病学领域。目前为止,关于这方面研究的大部分文献来自于英国的研究者,并且大多数研究是在2001年英国口蹄疫疫情后,对口蹄疫易感动物调运数据进行分析得出的结果[15]。Corner等[16]发现,比起未被感染的野生负鼠,那些被牛分枝杆菌感染的野生负鼠具有更高的接近中心性与中间中心性。Christley和French[17]运用“小世界网络”理论揭示了驯马师在英国动物疫病如马流感的传播中的作用。Christley等[18]运用“小世界网络”理论和随机网络理论,并结合SIR模型识别疫病网络中的高风险节点、预测感染的风险大小。S.Rautureau等[19]认为活畜调运网络中强成分的存在、规模和地理范围反映了网络对疫病传播的脆弱性,验证了消除强成分最有效的办法是将中间中心性较高的一些关键节点移除,该方法可用于突发状况下的疫情控制,此方法被应用于2005年法国肉牛交易网络的疫病防控。Kiss等[20]检验了追溯系统在随机网络和无标度网络中疫病防控中的效用。Bigras-Poulin等[21-22]通过对丹麦牛、猪交易模式特点的描述,评估其潜在的动物疫病传播风险。Turner等[23]运用社会网络分析评估英国某个奶牛群中大肠杆菌O157传播的危险因素。Dent等[24]构建了英国家禽产业链中养殖场之间的接触网络,探索禽流感的传播与流行过程。另外,有一些学者在研究动物调运网络中的疫病传播风险时,将时间和距离因素也考虑在内,他们认为接触的数量和频率、时间以及节点之间的距离都是影响疫病传播的风险因素。如果忽略了农场/牧户之间的地理距离,将会低估疫病在当地传播的概率, Noremark, Maria等[25]对不同月份、不同年份的瑞典牲畜调运网络进行了对比,其中牛的调运网络呈现出季节性而猪调运网络并没有表现出季节性的性质。Firestone, S.M等[26]将空间聚类与接触网络拓扑结构结合,对2007年澳大利亚马流感前30天的疫情进行了分析。B.Martı´nez-Lo´pez 等[27]结合社会网络分析和集群探测分析描述了西班牙萨拉曼卡动物调运网络的时空特征。
对引发动物疫病并造成传播的高危个体或群体的早期识别是兽医流行病学的基本目标。随着网络科学的兴起,近两年也涌现出分析网络节点传播影响力的研究。节点中心性指标刻画了节点的传播影响力。在无向网络中,从直观上看,度数中心性(与该节点直接相连的节点个数)高的hub节点的传播影响力应该相对较大,如果某个节点为阳性,则与之直接相连的节点很容易被其感染,造成疾病的局部传播。在有向网络中,点入度高的节点感染风险较高,而点出度高的节点成为传染源的几率较大,但这并不包括点入度高而点出度为零(如屠宰场)或者点出度高而点入度为零(如自繁自养的养殖场)的节点。另外中间中心性(通过该节点的最短路径的条数)高的节点对病毒的扩散也起着相对重要的作用,某个节点的中间中心性可以反映该节点连接网络不同部分的作用大小,一个中间中心性较高的节点可能是引起疾病蔓延至整个全局网络的罪魁祸首。但是,部分学者发现,虽然度数中心性和中间中心性是刻画节点传播影响力的重要指标,但在许多情况下未必是最合适的指标。Kitsak等[28]在基于SIR和SIS模型的实际网络数据研究中发现,在单个传染源的情况下,最具传播影响力的节点并非是那些度数中心性或者中间中心性最大的节点,而是k-丛最大的节点。而在多传染源的情况下,度数中心性较高的节点的传播范围要明显高于k-壳值最高节点的传播范围。而同样是基于SIR模型的单个传染源的传播网络研究,Duanbing Chen等[29]提出了一种两层的、将临近节点考虑在内的局部中心性指标,可能比中心性指标能够更好地刻画节点的传播影响力。Bonan Hou等[30]探索了一种将度数中心性、中间中心性、K-核值这些指标结合起来的、刻画节点传播影响力的综合指标,并将它命名为“综合距离”,并运用SIR模型证实了综合距离指标比其他节点重要性指标在刻画节点影响力上更加准确、可靠。
4 社会网络分析在兽医流行病学中的发展前景及其优缺点
4.1 社会网络分析发展前景
潜藏在动物接触网络中的疫病传播网络是由感染动物逐渐蔓延至网络全局的动态网络,网络结构的拓扑性影响疫病传播的速度和特点。20世纪初,社会网络分析法开始应用于兽医流行病学的研究。今后,社会网络分析在兽医流行病学中的应用范围将日益深化与发展。一是网络类型将呈现多样化,不同层次的网络节点和连线可以构建不同类型的网络,例如某养殖场内的牲畜接触网络、牧户之间的牲畜交易网络、地区之间的牲畜交易网络等,所选取的网络依据研究内容而定。二是研究方法本身将不断完善与改进,将会有更多的分析性方法支撑社会网络分析在动物疫病防控中的应用,例如流行病学模型、风险分析、时空模型和危害分析和关键控制点(HACCP)等。
4.2 社会网络分析研究的发展方向
一是社会网络分析与风险分析的结合将更完善。在病原体入侵和传播过程中起识别作用的节点对开展防控工作具有重要意义,社会网络分析技术提供了识别这些关键节点的可能性,并使风险识别更加有效、迅速。不同网络中的关键节点的识别方法是不一样的,兽医流行病学家将努力寻找更有效的定义关键节点的方法,这也是社会网络分析在风险分析的应用中的趋势之一。社会网络分析的可视化功能为可视化风险分析提供了可能性,运用社会网络分析的凝聚子群研究和可视化分析技术能更好地预估风险的大小与范围。
二是将社会网络分析技术与动物调运追踪系统结合,能更好地对重大动物疫病进行监测与预警。目前,许多国家已经立法并实行相关政策,对动物交易、调运的来源和路径等信息进行登记,建立专项数据库,例如瑞士动物调运数据库(TVD)。一些欧洲国家启动动物调运的实时追踪系统,以便在疫情发生时能尽早获知病原走向。在重大动物疫病的监测中运用社会网络分析与动物实时追踪系统,也是疫病防控的趋势之一,在动物疫病暴发时,及时发现在动物调运网络中加速疫病传播的节点,有效地切断传播路径,从而控制疫情。另外,许多国家的动物调运追踪系统显示,动物的调运模式具有季节差异性和聚集性。对不同时段的动物调运网络的纵向分析、对比不同时段的网络结构及其脆弱性、预测动物疫病发生发展的趋势也是兽医流行病学研究的趋势之一。
4.3 社会网络分析的局限性
社会网络分析法尤其适用于传染病的研究,有助于我们深化对接触性传染病的传播的理解,探索网络结构对疫病流行的影响,为流行病学研究提供全新的视角,在疫病监测和暴发中显示出重要的应用价值。但是,社会网络分析有其自身的局限性。一是如果数据量过大,网络节点和连线过于密集,社会网络分析软件无法清晰地绘制出社群图,缺乏可视化分析的可行性。二是如果缺乏有效的数据,社会网络分析也难以开展。三是如果抽样方法不当,所构建的网络代表性差,分析所得的结果可能会存在偏倚。四是社会网络分析的是关系数据,而不是分析属性数据,所得结果的概括性与推广性相对较差。关系数据违背了传统的统计学方法的数据独立的原则,因此不适用传统的统计学方法,必须谨慎选择与社会网络分析结合的分析方法。
[1]Kao R R, Danon L, Green D M, et al.Demographic structure and pathogen dynamics on the network of livestock movements in Great Britain [J].Proceedings.Biological sciences / The Royal Society, 2006, 273(1597):1999-2007.
[2]Natale F, Giovannini A, Savini L, et al.Network analysis of Italian cattle trade patterns and evaluation of risks for potential disease spread[J].Preventive veterinary medicine, 2009,92(4):341-350.
[3]Ortiz-Pelaez A, Pfeiffer D U, Soares-Magalhães R J,et al.Use of social network analysis to characterize the pattern of animal movements in the initial phases of the 2001 foot and mouth disease( FMD ) epidemic in the UK[J].Preventive veterinary medicine, 2006,76(1/2):40-55.
[4]Tildesley M J, Smith G, Keeling M J.Modeling the spread and control of foot-and- mouth disease in Pennsylvania following its discovery and options for control[J].Preventive veterinary medicine, 2012,104(3/4):224-239.
[5]林聚任.社会网络分析:理论、方法与应用[M].北京:北京师范大学出版社,2009:44-47.
[6]刘军.社会网络分析法[M].重庆:重庆大学出版社,2007:56-57.
[7]刘军.整体网分析讲义——UCINET软件实用指南[M].上海:格致出版社,2009:100-101.
[8]Carrington P J, Scott J, Wasserman S.Models and Methods in Social Network Analysis[M].Cambridge:Cambridge University Press, 2005:270-316.
[9]Green D M, Kiss I Z, Kao R R.Modelling the initial spread of f oot-and-mouth disease through animal movements[J].Proceedings.Biological sciences/ The Royal Society, 2006,273(1602):2729-2735.
[10]Saramäki J, Kaski K.Modelling development of epidemics with dynamic small-world networks[J].Journal of Theoretical Biology, 2005,234(3):413-421.
[11]Tao Z, Zhongqian F, Binghong W.Epidemic dynamics on complex networks[J].Progress in Natural Science, 2006,16(5):452-457.
[12]Kenah E, Robins J M.Network-based analysis of stochastic SIR epidemic models with random and proportionate mixing[J].Journal of theoretical biology,2007,249(4):706-722.
[13]Keeling M J, Eames K T D.Networks and epidemic models[J].Journal of the Royal Society Interface, 2005,2(4):295-307.
[14]O’Malley A J,Marsden P V.The analysis of social networks[J].Health Services and Outcomes Research Methodology, 2008,8(4 ):222-269.
[15]Dubé C, Ribble C, Kelton D,et al.A Review of Network Analysis Terminology and its Application to Foot-and-Mouth Disease Modelling and Policy Development[J].Transboundary and Emerging Diseases,2009,56(3):73-85.
[16]Corner LAL, Pfeiffer D U, Morris R S.Socialnet work analysis of Mycobacterium bovis transmission among captive brushtail possums (Trichosurus vulpecula)[J].Preventive veterinary medicine, 2003, 59(3)147-167.
[17]Christley R M,French N P.Small-world topology of UK racing: the potential for rapid spread of infectious agents[J].Equine Veterinary Journal, 2003,35(6):586-589.
[18]Christley R M, Pinchbeck G L, Bowers R G, et al.Infection in social networks: using network analysis to identify high-risk individuals [J].American Journal of Epidemiology, 2005, 162(10):1024-1031.
[19]Rautureau S, Dufour B, Durand B.Vulnerability of Animal Trade Networks to The Spread of Infectious Diseases: A Methodological Approach Applied to Evaluation and Emergency Control Strategies in Cattle,France, 2005[J].Transboundary and emerging diseases,2011,58(2):110-120.
[20]Kiss I Z, Green D M, Kao R R.Infectious disease control using contact tracing in random and scale-free networks[J].Journal of the Royal Society Interface,2006,3(6):55-62.
[21]Bigras-Poulin M, Thompson R A, Chriel M, et al.Network analysis of Danish cattle industry trade patterns as an evaluation of risk potential for disease spread[J].Preventive veterinary medicine, 2006, 76(1):11-39.
[22]Bigras-Poulin M, Barfod K, Mortensen S, Greiner M.Relationship of trade patterns of the Danish swine industry animal movement network to potential disease spread[J].Preventive veterinary medicine, 2007, 80(2-3):143-165.
[23]Turner J, Bowers R G, Clancy D, et al.A network model of E.coli O157 transmission within a typical UK dairy herd: the effect of heterogeneity and clustering on the prevalence of infection [J].Journal of Theoretical Biology, 2008, 254(1):45-54.
[24]Dent J E, Kao R R, Kiss I Z, et al.Contact structures in the poultry industry in Great Britain:Exploring transmission routes for a potential avian influenza virus epidemic [J].BMC Veterinary Research,2008, 4 (1): 1-14.
[25]Nöremark M, Håkansson N, Lewerin S S, et al.Network analysis of cattle and pig movements in Sweden:measures relevant for disease control and risk based surveillance [J].Preventive veterinary medicine, 2011,99 (2/4):78 -90.
[26]Firestone S M, Ward M P, Christley R M, Dhand N K.The importance of location in contact networks:Describing early epidemic spread using spatial social network analysis [J].Preventive veterinary medicine,2011, 102(3):185-195.
[27]M ar tínez-Lóp ez B, Per ez A M, Sánc hez-Vizcaíno J M.Combined application of social network and cluster detection analyses for temporal-spatial characterization of animal movements in Salamanca,Spain [J].Preventive veterinary medicine, 2009, 91(1): 29-38.
[28]Kitsak M, Gallos L K, Havlin S, et al.Identification of influential spreaders in complex networks[J].Nature Physics, 2010, 6(1): 888-893.
[29]Chen D, Lü L, Shang M S ,et al.Identifying influential nodes in complex networks [J].Physica A ,2012 , 391 (4) : 1777-1787.
[30]Hou B, Yao Y, Liao D.Identifying all-around nodes for spreading dynamics in complex networks [J].Physica A, 2012, 391(15): 4012-4013.