空间流行病学模型在鼠疫防控预警中的应用综述
2021-11-22朱大明
陈 璐,朱大明
(昆明理工大学国土资源工程学院,云南昆明 650093)
0 引言
鼠疫是一种人畜共患的传染性疾病,其病原体为鼠疫杆菌(Yersiniapestis),主要宿主为啮齿类动物,传播媒介为跳蚤[1-3]。作为长期稳定存在的自然疫源性疾病,实践证明,鼠疫只能控制,无法根除。在自然疫源地内,宿主种群密度一旦恢复,在特定环境下鼠疫可能继续流行,甚至蔓延到人群中。近年来,世界人口飞速增长、城市面积加速扩张,使得人类对鼠疫自然疫源地的侵扰和破坏不断加剧,人类与鼠疫动物宿主的接触愈发频繁。作为威胁世界人类生命健康的第四大传染性疾病,鼠疫已成为威胁人类生命健康的巨大隐患。
目前人们对鼠疫时空传播规律仍缺乏充分认识,为更好地控制与预防鼠疫的流行,空间流行病学通过融合时空统计分析方法、传统统计回归模型、传染病动力学模型、生态位模型等,在鼠疫传播机制探索、危险因素识别、疫情发生与流行预测、时空风险制图等研究中的应用越来越广泛,有效促进了鼠疫防控与监测预警工作的开展。
1 鼠疫流行与防控
作为一种大规模传染病,世界历史上曾发生过三次鼠疫大流行,均给人类与动物群体带来巨大灾难,甚至改变了人类的社会结构[4-5]。20 世纪50 年代,鼠疫在我国得到了有效控制,90 年代人间鼠疫在世界范围内盛行,流行范围超过25 个国家,疫源地遍布亚、非、美58 个国家和地区[6],我国的人间鼠疫病例也显著上升。2017 年以来,非洲的马达加斯加,中亚的印度、缅甸、哈萨克斯坦,北亚的蒙古,我国的云南、四川和内蒙古都曾出现散发的人间鼠疫病例,但未造成大规模的鼠疫流行,此后全球鼠疫进入新的静息期[7-8]。10 月26 日,中国云南勐海县发现两例腺鼠疫病例,昭示着国内鼠疫有复苏迹象。
鼠疫是我国严重危险人类健康安全与社会发展的甲类烈性传染病之一[9],我国鼠疫防控以监测为主。自20 世纪80 年代起,通过建立全国范围的县级疫情监控网和系统对全国疫点进行定期监测,主要工作包括:记录当地人间疫情和动物疫情发病情况的人间鼠疫疫情监测;采集当地啮齿动物和跳蚤标本进行血清分型、细菌和生物分型及毒力基因检测的动物间疫情监测[10-12]。
2 空间流行病学
空间流行病学(Spatial Epidemiolopy)是健康地理学的一个分支,其研究对象为环境地理和人类疾病,内容涵盖人类疾病的时空分布和影响因素,涉及的数据包含时间、空间和属性等多维信息。空间流行病学融合了信息技术、计算机技术、3S 技术等,同时随着信息理论与景观生态学理论等基础理论的不断发展,为未来的流行病研究打下了良好基础。鼠疫流行具有区域性、季节性和周期波动性等特征,为空间流行病学在鼠疫防治中的应用提供了前提条件[3],其中对于大区域尺度的研究以遥感影像数据作为基础数据支撑。GIS 技术的引入则通过地图直观展示疾病的空间分布情况,实时、动态地显示疾病的时空变化特征;对疾病分布进行可视化展示,结合回归统计和空间分析技术研究疾病病因及各种影响因素,分析疾病的空间聚集性,探索流行病生态系统的分布格局及演化过程[13-14]。
3 空间流行病学方法及其在鼠疫防控预警中的应用
空间流行病学在鼠疫防控预警中的应用主要包括以下3 方面内容:①基于计算机仿真技术与回归统计方法的鼠疫传播机制探索;②基于时序分析与GIS 空间分析方法的潜在危险因素识别及疫情预测;③基于遥感信息处理与贝叶斯统计的鼠疫风险探测及预测。
3.1 鼠疫传播机制探索
传染病动力学模型是一种根据种群增长特性和传染病在种群内的传播机制与疾病风险因素而建立,以反映传染病传播动力学特征的数学模型。该模型主要基于计算机仿真技术和模型预测方法,定量模拟与分析传染病的传播途径、流行动态及重要风险因素。
鼠疫传染病动力学模型的构建最早可追溯到Kermack等[15-16]对1665-1666 年伦敦黑死病流行规律研究中的SIR(Susceptible-Infected-Recovered)模型和SIS(Susceptible-Infected-Susceptible)模型,同时提出的决定传染病流行是否发生的“阈值理论”奠定了后续传染病传播动力学研究的理论基础。此后,Samia 等[17]构建了巴基斯坦地区完整的跳蚤—野生动物—人类—鼠疫动力学模型,该模型包含了啮齿动物增长率模型、跳蚤负担模型、季节性野生动物疫源地模型和人间鼠疫模型;Dean 等[18]建立了人类传染性—媒介寄生蚤的SIR 模型,将该模型与肺鼠疫和鼠蚤传播模型进行比较分析,并利用贝叶斯估计方法对第二次鼠疫大流行期间动物鼠疫每次暴发过程中的重要参数——基本繁殖数进行了预估;White 等[19]为研究第一次鼠疫大流行期间肺鼠疫的传播机制,通过专家经验假设初始化条件和估计参数,构建了肺鼠疫SIR 与SEIR 模型、腺鼠疫SIR 与SEIR 模型、腺鼠疫/肺鼠疫SEIR 模型等7 个模型;Sichone等[20]使用系统动力学建模软件Vensim 对2015 年Nyimba 鼠疫发病模式进行仿真建模,利用SEI 模型估计易感人群中单个感染个体在感染期间的平均继发感染数等。
目前基于鼠疫传染病动力模型的应用研究主要集中于国外,众多学者通过构建预测模型实现对鼠疫传播机制的深入挖掘,明确鼠疫历史流行事件的传播途径。模型模拟精度越高,纳入模型中的因素则越多,对鼠疫传播规律的认识程度将极大地影响阈值参数设置与因素选取的客观性和准确性。采用仿真软件对鼠疫历史传播过程进行模拟与模型验证需要时空数据库的支持,其中涉及计算机图形处理、数据库、模型仿真等相关技术。目前国内对鼠疫传播动力学机制的探索尚处于空白阶段,因此还需作进一步研究。
3.2 疫情影响因素识别与疫情发生预测
鼠疫作为一种自然疫源性疾病,其潜伏、发生、传播及流行均与本地自然疫源地的生态环境紧密相连[21]。因此,可通过融合区域的多源遥感数据和地理信息数据,采用统计回归和空间分析方法探索分析气候、环境、生物等因素与鼠疫之间的相关关系,以此预测某地是否存在鼠疫风险及其风险指数。
回归分析可根据疾病数据的分布规律,建立疾病数据与环境因子的统计回归数学表达式,进行潜在因素的识别与疾病发生数预测。时间序列分析根据历史发生疾病的时间序列数据,采用曲线拟合和参数估计建立数学模型,以反映疾病在时间上的传播规律。结合时间序列分析与回归分析方法,可根据预测对象与影响因素之间的相关性预测未来鼠疫发生情况。已有鼠疫预测研究中较为经典的方法有:多元logistic 回归模型、结构方程模型、零膨胀的广义相加模型等。在鼠疫疫情预测及因子分析应用方面,可分为以下两部分:
(1)人间疫情预测。Sun 等[22]采用零膨胀广义相加模型研究第三次鼠疫大流行期间全国物种丰富度与每年鼠疫发生病例数之间的关系。首先将整个中国区域划分为一度的公里格网,并统计格网内每年平均人间病例数和物种丰富度以及环境变量属性均值。由于格网内人间鼠疫病例数存在大量零值,分别选择零膨胀二项分布和零膨胀泊松分布统计模型,研究显示啮齿类动物物种多样性与人间鼠疫病例数和流行强度均呈正相关关系。同时,以历史气象数据为数据源的小波分析作为一种时间序列分析方法,近年来也常被用于探索历史气候条件对鼠疫发生的影响。如Tennant 等[23]采用小波分析确定了在第三次鼠疫大流行期间英属印度人间鼠疫的传播是由湿度变化引起的,且疫情发生前一个月的大气湿度与当前月份鼠疫的发生呈正相关关系。
(2)动物间疫情预测。钱全[24]应用logistic 回归和静息二元时间序列分析方法建立鄂托克前旗长爪沙鼠鼠疫预测模型,研究显示当年秋季平均气温与鼠疫流行之间具有较强的相关性,降水对长爪沙鼠鼠疫流行的影响具有2~3年的年际滞后效应。此外,基于系统发生学与层次分析理论的结构方程模型的引入,也为区域疫源地内鼠疫的环境因子探索提供了内在动力。如Xu 等[25]利用结构方程模型识别气候与内蒙古沙鼠鼠疫及达里尔松鼠鼠疫的相关性,采用自下而上和自上而下的传播路径,研究温度、降水、植被覆盖度对啮齿动物—媒介—鼠疫的系统性影响,明确了降水和温度对当地两种宿主动物间疫情的发生均有积极影响,而植被覆盖度对当地动物间鼠疫发生的影响存在明显的种群差异。
综上所述,在统计回归中,以鼠疫病例数为因变量的回归建模需要考虑鼠疫数据的统计学特征,再选择合适的数学模型。传统回归模型往往忽视了微生态环境以及时空相关性和交互性的影响,导致预测结果不太符合实际情况,后续研究需要结合空间分析方法,加入时间和空间变量。时空地理加权回归和时空插值等时空统计分析方法的引入,能更好地解决鼠疫数据的时空自相关问题。同时,建模中考虑到空间分异的影响,对具有分层异质性的环境变量采用如地理探测器Q 统计方法进行时空分层,再建立多水平时空模型进行因子识别与疫情预测。
3.3 鼠疫疫情风险探测
空间流行病学研究内容包括疾病风险探测、危险因素识别和聚集性分析。其中,用于鼠疫疫情风险探测的空间流行病学方法包括时空聚集性分析以及生态位模型与贝叶斯时空模型。
3.3.1 时空聚集性分析
基于时空分析与风险制图技术的时空聚集性分析是目前空间流行病学中最常用的时空统计方法之一,旨在识别疾病在时间、空间或时空上分布的聚集趋势和倾向,帮助找出疾病发病风险较高的地段和时间段,主要识别的疾病有:肾综合征出血热[26]、H7N9 禽流感[27]、新冠肺炎[28]等传染病和慢性疾病。在疾病探测中,该方法主要应用于3个方面:时间聚集性探测、空间聚集性探测和时空聚集性探测。
(1)时间聚集性探测。只考虑疾病在时间上的聚集效应,常用方法有圆形分布法、集中度法与时间序列分析方法。其中,时间序列分析可通过已有的疾病发病时间规律预测未来发病情况。自回归滑动平均模型(ARIMA)是一种常用的时间序列方法,该方法采用差分阶数(Gap),通过绘制时间序列的自相关函数图和偏自相关函数图并与标准图进行对比,从而识别疾病的时间滞后效应。如Ben-Ari 等[29]采用一种基于时间相似度原理对疫情发生点进行时间序列分组的聚类方法,将中国鼠疫疫源地分为4 个部分和南北两大类。
(2)空间聚集性探测。可分为全局空间聚集性和局部空间聚集性探测,前者探测区域整体聚集程度,后者用于定位聚集区。其中,空间自相关法主要根据空间位置的远近度量空间现象或事物的相似及相关程度。空间聚集性探测主要用于自然鼠疫疫源地划分和病灶识别。如李海蓉等[30]通过空间聚类分析,按照形成环境将我国的鼠疫疫源地划分为3 类;Galanaud 等[31]基于空间自相关方法和历史流行病信息,绘制了15 世纪初期3 种流行病中的鼠疫死亡分布图。
(3)时空聚集性探测。主要目的在于获取疾病的高发期和聚集位置,如Sun 等[32]采用基于机器学习的时空聚类方法重构了1772-1964 年间中国区域鼠疫流行的传播路线,并将中国分为2 个核心区和13 个聚类,这些研究可为未来鼠疫及其他传染病防控与决策提供参考。
综上所述,疾病时空聚集性分析为近年来较为热门的一个研究方向,可用于探索鼠疫发生的时空分布模式,包括热点探测和流行高发时区识别。目前在鼠疫风险探测研究中,可采用自相关分析、核密度估计、时空扫描统计等空间分析方法联合进行分析,利用GIS 技术和计算机技术通过可视化地图进行时空展现,将进一步推动鼠疫时空分布模式信息的表达与传播。
3.3.2 生态位模型
生态位模型(Ecological Niche Models,ENM)是一种用于预测生态风险和物种地理分布的模型,已在如肾综合征出血热[33]、血吸虫[34]等传染病传播研究中得到了广泛应用。其中,最大熵模型(Maxent)和规则集遗传算法(GARP)模型在鼠疫研究中应用最为广泛[35]。Maxent 模型输入分布数据为存在点数据,基于机器学习算法选择分布点环境信息熵最小的最优拟合模型进行物种潜在分布预测。GARP 模型在Maxent 模型数据基础上还需要增加不存在点,采用预设预测规则的遗传算法从所有样本点提取的环境特征中选择具有最优规则集合的组合模型,总结物种分布生态需求,以预测物种潜在分布。
Maxent 模型和GARP 模型在鼠疫监测预警中的主要应用包括以下两方面:
(1)疫源地内鼠疫潜在风险预测。Walsh 等[36]利用Maxent 模型预测2000-2015 年美国西部鼠疫风险及重要共生宿主的潜在空间分布时发现,对宿主分布有较大影响的因素为海拔、最干季降水量和最湿季降水量及土地覆盖率。为提高中国长爪沙鼠疫源地动物间疫情潜在分布的预测精度,闫东等[37]采用Maxent 和GARP 两个生态位模型,模型中只考虑气候因素对鼠疫的影响,通过比较分析,显示Maxent 模型预测精度更高。
(2)宿主和媒介生物物种的适生区预测及疫源地识别。如Ben-Ari 等[29]为了确定中国鼠疫可能存在的新自然疫源地,同时采用GARP 和Maxent 两个生态位模型进行鼠疫适生区识别,发现了至少4 个独立疫源地;闫东等[38]采用Logistic 回归筛选秃病蚤蒙冀亚种的气候环境因素,利用GARP 模型预测秃病蚤蒙冀亚种的适宜分布区。
综上所述,Maxent 模型和GARP 模型对于小样本鼠疫分布预测具有极大优势,可适用于大范围的鼠疫疫源地和宿主/媒介分布预测,但针对小范围区域的预测精度较低。多源遥感数据是生态位模型主要的数据源,未来将融合遥感信息技术、数据库技术、计算机图像处理技术和GIS 空间分析技术等,建立历史鼠疫监测数据库及精度更高的多源遥感数据库,采用广义相加模型(Genneral Additive Model,GAM)、广义线性模型(Genneral Linear Model,GLM)等基于回归统计的生态位模型实现疫情风险和物种分布定量预测。
3.3.3 贝叶斯时空模型
贝叶斯时空模型是一种基于贝叶斯统计的时空回归模型,可分析疾病的空间效应、时间效应与时空交互效应及其环境风险因素,帮助人们了解疾病的地理分布,并预测发病趋势。目前主流的贝叶斯时空模型有3 种:BYM(Besag,York and Mollie Mode)模型、层次贝叶斯时空模型和FBM(Familiar Bayesian Spatio-temporal Model)模型。BYM 模型可有效解决时空交互和过度离散化等问题;层次贝叶斯时空模型将分级结构纳入BYM 模型中,对于多水平结构数据具有良好的稳定性,但只适用于空间多尺度分析[39];FBM 模型充分考虑了疾病周期性变化和传播的空间异质性,进行分区时间趋势估计,使得模型更加精准,因此在未来的空间流行病研究中有着广阔的应用前景[40]。
贝叶斯时空模型对于较小区域范围的疾病空间分析有着较大优势。近年来,随着计算机技术的发展以及马尔科夫链蒙特卡罗方法(MCMC)的引入,贝叶斯时空方法主要应用于癌症[41]、布鲁氏疾病[42]、手足口病[43]、疟疾[44]等空间流行病研究中。张俊辉等[42]在研究北方六省布鲁氏菌病的时空分布特征时,从县区和地市两个尺度构建层次贝叶斯时空模型,发现分层多尺度联合模型可单独分析地区传染病和慢性疾病,为同类研究提供了一种新的方法作为参考;Snäll 等[45]基于宿主—寄生虫系统的联合空间动力学原理,提出一种适用于黑尾土拨鼠的区域长期鼠疫动态和种群动态研究的分层贝叶斯模型。但目前国内仍缺少基于贝叶斯时空模型的鼠疫疫情相关研究。
综上所述,鼠疫作为传染性疾病,其传播流行在空间和时间单元上具有尺度依赖性。采用分层贝叶斯时空模型可实现多尺度空间的鼠疫疫情探索,研究不同区域鼠疫相对风险的时间变化规律,同时结合不同历史时期的环境因子数据实现对危险因素的识别。贝叶斯统计在我国鼠疫研究中尚处于空白,因此在未来的空间流行学研究中,采用贝叶斯时空模型对鼠疫流行规律的时空信息进行挖掘具有较高的应用价值。
4 结语
目前,国内外学者针对鼠疫疫情预测、危险因素识别和风险评估等方面已开展了大量工作,但深度仍远远不够。我国空间流行病学在鼠疫监测中的应用多集中于疾病风险制图领域,在鼠疫时空传播方面的研究尚处于初级阶段。分层贝叶斯时空模型、结合时序分析的传染病动力学模型和时空聚集性分析方法等在鼠疫时空分析中的应用将是未来鼠疫预测预警研究的主要方向。在应用研究方面,至今仍缺乏对中国区域历史鼠疫大流行事件的传染性动力学探究,主要原因在于我国鼠疫宿主媒介种类多,传播机理十分复杂,先验参数难以确定。贝叶斯估计方法等方法的应用将对动力学参数估计具有一定启发作用。未来可通过结合多源遥感数据和空间流行病学方法研究鼠疫的环境风险因素,建立时空传播与分析模型,将能更深入地探索鼠疫的时空传播规律和发病机理,对鼠疫自然疫源地内的鼠疫疫情防控与决策具有重要意义。