基于交通网络传递的传染病风险传播模型研究∗
2018-01-04刘新新蔡传锋贾志娟
张 玉 刘新新 蔡传锋 贾志娟
(郑州师范学院 郑州 450044)
基于交通网络传递的传染病风险传播模型研究∗
张 玉 刘新新 蔡传锋 贾志娟
(郑州师范学院 郑州 450044)
针对我国复杂交通网络对传染病传播的巨大影响,提出一种基于马可夫链(Markov Chain)模型构建复杂社会交通网络中传染病动态的传播模型。模型以公路、高铁、自驾及航空等人口流动常见交通网络作为传染病传播模型研究的切入点,建立真实环境下的社会交通网络拓扑结构,并构建传染病风险指标模型。论文以近十年的新型流感病毒传染病为例,以感染人数重症病例数为验证标准进行验证。实验结果表明,经过该模型计算传染病传播的结果与实际病例数据呈现正相关性,因此该模型对预测传染病的潜在传染风险程度具有一定的研究价值。
复杂社会交通网络;马尔可夫链;传染病;风险指标模型
1 引言
在当今社会信息与科技发达的社会中,人与人之间无时无刻不在经过面对面接触或是网络等各种途径进行频繁的互动与交流,在这样频繁的人口流动下,伴随而来的是人类的各种行为、思想和疾病的传播与影响。尤其对于传染病的传播[1~2],频繁的人口流动更容易成为传染病的易感人群,使得预防接种等防控措施难于落实。随着我国各类交通运输网的迅速发展,规模庞大的流动人口群体使得传染病的扩散更为迅速、猛烈,为人类的生活带来健康隐患,也给我国疫情防控带来严峻挑战。文献[3]中指出,自1990年以来,我国国内客运量稳步增长,至2012年,全年总客运量已经超过380亿人次,连续三年全年总客运量增速超过7%,其中公路系统全年发送旅客量355.7亿人次,铁路系统18.9亿人次,水运系统2.6亿人次,民航系统3.2亿人次。交通系统的高度发达加速了传染病的扩散。以2003年SARS疫情为例,SARS疫情于2002年11月首次在广州佛山出现,短短数月之内迅速扩散,至5月20日,我国已有5248例确诊病例。截至2003年8月7日疫情结束,此次传染病共波及我国内地26个省、市、自治区和世界上19个国家和地区。
本文考虑到人口流动的动态因素,以各地区的人口流动产生的链接形态构建实际交通网络拓扑,将马尔可夫链计算模型应用到构造的网络拓扑矩阵模型中,不仅能够根据概率矩阵推算个体状态的改变,而且能够通过改变概率数组,实现能够根据网络状态的随时改变而动态改变转移矩阵的效果,减少由于网络状态的随时改变对传染体通过网络传播过程的影响。同时,构建传染病风险指标模型用于计算传染病的危险程度。通过对本省案例的计算验证,本模型的计算结果与本省案例结果呈正相关性,因此,本模型能够在传染病扩大前预先构建网络拓扑结构模型,计算传染病可能造成的危险程度,防患于未然。
2 基本理论介绍
2.1 传染病与网络结构的传递性
传染病在人群中的传播不仅取决于病原体本身,还受到人群社会网络结构的影响。人群的复杂社会网络结构[9~10]很大程度上决定了传染病由一个个体传播到另一个个体的可能性。即传染病传播的可能性由人群接触网络决定,在该接触网络中,每个个体表示为顶点,个体中可能导致传染病传播的接触表示为个体之间的边。这也表明了构建真实的人群接触网络对理解传染病的传播动态具有决定性的影响。因此,近年来,诸多学者加快了对城市公路、铁路以及世界航空等接触网络对传染病传播动态影响的研究。
病原体与社会网络结构[11]之间也存在着密不可分的关系。同一人群中,不同疾病构成的接触网络结构也可能存在较大差异,这主要取决于传染病的传播途径。对于具有高度传染性的疾病,其主要通过飞沫等传播,此类疾病的接触网络会形成大量的边,例如同一辆公共汽车、同一节车厢或者同一架飞机上相邻的两个人。而对于密切接触传播疾病或性传播疾病,接触网络则较为稀疏。
2.2 马尔可夫链模型
马尔可夫链模型[12]常常被用作研究状态转移的预测模型,它描述了这样一类随机动态系统过程:系统在每个时间所处的状态是随机的,从一个时间的状态按照一定的概率可以转移到另一时间状态,因此,从前一个状态和转移概率可以模拟出后一个状态。网络模型中状态的转移使用概率数组表示,利用上一次的状态乘概率矩阵来计算和预测未来的状态改变。模型中不同个体之间传播的概率便组成了概率矩阵。因此,概率矩阵即表示整个复杂网络拓扑结构。
设某系统在时刻t=n有k个可能状态,即xn=1,2,3,…,k(n=0,1,…),ai(n)表示系统在时刻 t=n处 于 状 态 i的 状 态 概 率 ,即ai(n)=P(Xn=i),其中ai(n)=1,i=1,2,…,k 。系统在时刻n状态为i,时刻n+1转移到状态 j的概率为pij(i,j=1,2,…,k),即 pij=P(Xn+1=j|Xn=i),称 pij为一步转移概率,P={pij}为一步转移概率矩阵,简 称 转 移 概 率 矩 阵 ,其 中 pij≥0,pij=1,i=1,2,…,k。k步转移概率矩阵由一步转移矩阵求k次幂求得。
假设系统在初始时刻t=0的状态概率向量为a(0)=(a1(0),a2(0),…,ak(0)),则系统在时刻 t=1 的状态概率向量为 a(1)=(a1(1),a2(1),…,ak(1))=a(0)P ,经过多次递推过程之后,马尔可夫预测模型为a(n)=a(0)Pn。
由马尔可夫预测模型可知,在已知系统初始时刻t=0的状态概率向量a(0)和状态转移概率矩阵P的情况下,都可以通过模型计算获得任何时刻系统的状态转移概率。
3 模型设计
本文研究模型主要以河南省各地区公路、高铁、自驾以及航空等日常交通网络作为传染病传播网络,以河南省内新型流感传染病数据为例建立完整的传染病指标模型,整体模型框架如图1所示。
图1 整体模型框架
3.1 人口流动交通网络模型构建
本文选用河南省各地区的包含公路、高铁、自驾、航空等日常人口出行方式建立人口流动交通网络模型。主要选取河南省内管辖的18个省直市共计1892个乡镇构建交通网络模型。流动人口情况由我省各交通部门汇总提供。病例数据选取近十年来新型流感病毒传染病,由河南省卫生厅提供相关数据。
每日的交通流动人数计算公式如下:
其中,Rij表示每日由i乡镇到乡镇 j的人口数,rab表示每日由地区a到地区b的人口数,Pi和Pj分别表示乡镇i和乡镇 j的人口数,Pa和Pb分别表示地区a和地区b所包含的乡镇总人口数。
由公路、高铁、自驾以及航空等各个交通出行方式构成的总的交通网络结构如下所示:
其中,W 表示整个交通网络结构,C、R、D、A分别表示由公路、高铁、自驾和航空出行构成的交通网络。w1、w2、w3、w4分别表示各交通出行方式所占的比重,即通过公路、高铁、自驾和航空出行人数占比。
3.2 流行病风险指标模型
根据在河南省建立的人口流动交通网络状态仿真现实社会的人口流动情况,基于马尔可夫链模型构建网络传递特征模型,来计算病原体随人口流动在各地区传播造成的流行病风险。其中,每一个个体的移动都代表着一条潜在的感染路径。
根据病原体传播方式,以地区A和地区B之间的人口流动传染病传播为例,在计算流行病风险时需要考虑以下三个问题:
1)每日从地区B流动至地区A的人口带来的传染风险,如图2(b)所示。
2)白天流动到地区B受到感染后,晚上回到地区A的人口造成的传染风险,如图2(c)所示。
3)在本地区A范围内进行流动造成本地区其他人口感染造成的传染风险,如图2(a)所示。
与此同时,通过其他方式造成传染病的传播风险也要考虑在本模型内。
图2 地区间人口流动感染情况
传染病风险指标模型计算公式如下所示:
其中,公式参数描述如表1所示。
现实世界网络传递过程会因某些政策的更改而随机做出改变,而本模型中建立的人口流动交通网络矩阵,能够随着迭代的过程随时更改结构,达到了模拟真实世界的效果。
为方便各地区卫生防疫行政部门有效利用传染数值,特定义以下三个概念,为行政处理提供相应参考。
ERV:染病风险值,计算公式停止迭代后可得到各地区的染病风险值。
ERR:染病风险排序,依据染病风险值将各地区危险程度由高到底进行排序而得,为行政决策提供依据。
ERI:染病风险指标,将各地区染病风险值除以所有地区染病风险值总和得到传染危险程度百分比,用来比较各地区相对危险程度,为各地区加强预防与治理提供数据基础。
表1 传染病风险指标模型计算参数描述
3.3 流行病风险指标评估
根据本文建立的模型和实际传染病病例数据,使用Pearson相关系数来检定本文建立模型的准确性。具体步骤如下:
1)根据各地区的传染病人数进行实际风险程序的计算排序,得到18个省直市地区的风险排序序列Re。
2)通过模型计算18个省直市地区风险程度进行排序,得到各地区的风险排序序列Pe。
3)使用Pearson相关系数将实际数列和计算数列进行相关程度的验证,评估本模型计算结果的正确性。
流行病风险指标评估计算如下所示:
其中,Re=<r1,r2,r3,…,r20> 为实际风险排序序列,Pe=<p1,p2,p3,…,p20> 为模型计算风险排序序列。
4 结论验证
通过实际分析与参考,我们发现新流感[13]的染病风险存在于各年龄阶层,潜伏期一般是三天左右,而且在潜伏期也具有一定的传染力,一般多经由接触或飞沫传染。因此,新流感多是通过青壮年人口交通流动造成传染。
因此,我们假设模型中的传染影响因素为人口交通流动进行计算。设w1=0.3,w2=0.5,w3=0.1,w4=0.1只考虑人口交通流动因素的影响,设定 o=1,设定 d∈[ ]0,1进行计算,并使用Pearson相关系数做验证。另外,由于不同时期实际交通网络拓扑随时变化着,因此,我们又选取另一个时期构建交通网络,即假设w1=0.3,w2=0.4,w3=0.1,w4=0.2,其他参数不变的情况下进行计算,同样使用Pearson相关系数做验证,验证分析结果如图3所示。当参数d=0.9时,采用第一种网络拓扑进行计算,模型计算结果与实际病例的Pearson相关系数检定值为0.542与采用第二种网络拓扑进行计算的相关系数检定值0.523大致相同,表明经过本模型的人口流动交通网络计算各地区传染病风险程度结果,与经由接触及飞沫传染的实际流行病呈现正相关性。
图3 Pearson相关系数分析
5 结语
本文根据实际人口流动情况,建立包含公路、高铁、自驾和航空在内的实际交通网络拓扑结构,基于马尔可夫链模型状态传递功能计算存在于网络拓扑中的传递现象,建立真实环境下的社会交通网络拓扑结构,并构建传染病风险指标模型。最后以河南省18个省直市共计1892个乡镇的新流感传染病数据为例,以感染人数重症病例数为验证标准进行验证。证明了经本模型计算传染病传播的结果与实际病例数据基本吻合。同时,本模型的建立能够有效根据动态社会网络的动态发展进行变化,对有效预测传染病的潜在传染风险程度提供帮助,为卫生防疫部门有效预防和控制传染病的传播并及时做出应急响应提供有效参考价值。下一步将考虑网络拓扑中家庭、学校、社区等小范围内影响因素,将构建更加细化与准确的社会网络拓扑结构。
[1]胡明生,贾遂民,陈巧灵,等.基于常数输入的蠕虫传播模型及其分析[J].计算机工程与科学,2014,36(8):1482-1485.HU Mingsheng,JIA Suimin,CHEN Qiaoling,et al.Analy⁃sis of the worm propagation model with constant immigra⁃tion[J].Computer Engineering and Science,2014,36(8):1482-1485.
[2]Hu M,Jia S,Chen Q,et al.The Analysis of Epidemic Dis⁃ease Propagation in Competition Environment[J].Lecture Notes in Electrical Engineering,2013,256(1):227-234.
[3]徐致靖.复杂社会系统中的传染病动力学建模与案例研究[D].北京:军事医学科学院,2015:13-16.XU Zhijing.Modelling the Spreading Dynamics of Infec⁃tious Diseases in Complex Social Systems[D].Beijing:Academy of Military Medical Sciences,2015:13-16.
[4]Tao Li,Qiming Liu,Baochen Li.The Analysis of an SIRS Epidemic Model with Discrete Delay on Scale-Free Net⁃work,Applied Mathematics,2015,6(11):1939-1946.
[5]汪小帆,李翔,陈关荣.复杂网络理论及其应用[M].北京:清华大学出版社,2006:345-560.WANG Xiaofan,LI Xiang,CHEN Guanrong.Complex Net⁃works Theory and Applications[M].Tsinghua University Press in Beijing,2006:345-560.
[6]汪小帆,李翔,陈关荣.网络科学导论[M].北京:高等教育出版社,2012:121-135.WANG Xiaofan,LI Xiang,CHEN Guanrong.Network sci⁃ence:an introduction[M].Higher Education Press in Bei⁃jing,2012:121-135.
[7]Cauchemez Simon,Bhattarai Achuyt,Marchbanks Tiffa⁃ny L.Role of social networks in shaping disease transmis⁃sion during a community outbreak of 2009 H1N1 pandem⁃ic influenza[J].Proceedings of the National Academy of Sciences of the United States of America,2011,108(7):2825-3015.
[8]Constantinos I.Siettos,Lucia Russo.Mathematical model⁃ing of infectious disease dynamics[J].Virulence,2013,4(4):295-306.
[9]Alexander Schaum,Roberto Bernal Jaquez.Estimating the state probability distribution for epidemic spreading in complex networks[J].Applied Mathematics and Computa⁃tion,2016,291:197-206.
[10]胡明生,贾志娟,雷利利.基于复杂网络的灾害关联建模 与 分 析[J].计 算 机 应 用 研 究 ,2013,30(8):2315-2318.HU Mingsheng,JIA Zhijuan,LEI Lili.Modeling and analysis of disasters relationship based on complex net⁃work[J].Application Research of Computers,2013,30(8):2315-2318.
[11]Yasar Tonta,Hamid R.Darvish.Diffusion of latent se⁃mantic analysis as a research tool:A social network anal⁃ysis approach[J].Informetrics,2010,4(2):166-174.
[12]Michela Ottobre.Markov Chain Monte Carlo and Irrevers⁃ibility[J].Reports on Mathematical Physics,2016,77(3):267-292.
[13]靳祯,孙桂全,刘茂省.网络传染病动力学建模与分析[M].北京:科学出版社,2014:203-289.JIN Zhen,SUN Guiquan,LIU Maosheng.Modelling and Analysis of Epidemic Spreading on Networks[M].Bei⁃jing:Science press in Beijing,2014:203-289.
Model of Transmission of Infectious Diseases Based on Traffic Network
ZHANG Yu LIU Xinxin CAI Chuanfeng JIA Zhijuan
(Zhengzhou Normal University,Zhengzhou 450044)
In view of the huge impact of the complex transportation network on the transmission of infectious diseases,a dy⁃namic model for the transmission of infectious diseases in complex social traffic network is proposed based on Markov Chain model.In the real environment,the social traffic network topology is established,which is based on the road,high-speed rail,car and air traffic network as the starting point of the study of the transmission model of infectious diseases,and construct the infectious disease risk index model.This paper takes the ten years of new influenza virus infectious disease as an example,the number of infections in the number of severe cases in order to verify the standard was verified.The experimental results show that the calculation model of the spread of infectious diseases results and actual case data showed positive correlation,so the potential infection risk degree of the model for predicting infectious disease has certain research value.
complex social traffic network,markov chain,infectious diseases,risk index model
Class Number TP391
TP391
10.3969/j.issn.1672-9722.2017.12.008
2017年6月2日,
2017年7月23日
国家自然科学基金项目“基于复杂网络的传染病溯源方法研究”(编号:U1304614)资助。
张玉,女,硕士,讲师,研究方向:数据挖掘方向。刘新新,女,硕士,讲师,研究方向:数据挖掘、软件工程方向。蔡传锋,男,助教,研究方向:软件工程方向。贾志娟,女,博士,教授,研究方向:人工智能、数据挖掘等。
如何构建现实世界的交通网络模型,分析其对传染病扩散的影响是近年来传染病网络传播的一个重要研究方向。文献[4]在无标度网络的基础上构造了具有社团结构的网络模型,它将一个网络划分为不同的社团,以最大化提取网络本身的主要信息,略去相对次要的信息。汪小帆[5~6]等基于节点优先提出一种新的寻找社会网络结构中局部社团的算法,可以快速准确地寻找大规模复杂网络的社团结构。文献[7~8]则根据一些人口统计学数据,如年龄分布、职业分布等采用计算机生成具有某些社会网络特征的网络模型,但此方法构造出来的网络一般都是静态的并且依赖实际的研究对象,而现实中的人群结构往往是随时间演化的,因此,无法知道网络结构的演化对传染病传播的具体影响。