传染病预测预警方法及应用进展(一)
2012-01-29翟志光
翟志光
(中国中医科学院中医基础理论研究所,北京100700)
传染病预测预警方法及应用进展(一)
翟志光
(中国中医科学院中医基础理论研究所,北京100700)
传染病;预测;预警;预防医学
传染病预测是将数学与传染病流行病学相结合的一种统计学分析方法,应用于各种传染病的预测、预警,对传染病的预防与控制有积极的意义。传染病预测预警是根据传染病的发生、发展规律及有关因素,用分析判断和数学模型等方法对可能发生的传染病的发生、发展和流行趋势做出的预测,对于提高传染病预防控制工作的预见性和主动性、提高效率和效益起重要的作用。随着计算机的逐步推广应用以及预测理论的迅速发展,已有多种预测方法在传染病的预防与控制中得到了实际应用,成为传染病预防与控制的一项有效手段。本文就国内传染病预测预警方法应用情况进行综述。
1 传染病预测预警的意义
传染病的预测可以及早发现疾病发展趋势,为深入开展疾病的预警奠定基础,也为制定防制策略及措施提供理论依据。由于传染病具有在人群中传播蔓延的趋势,在人们日益受到新旧传染病双重威胁的今天,传染病预测预警工作愈加受到重视。良好的预测是制定预防和控制传染病的近期或长远应对策略的前提,建立合适的预测模型,提高预测的准确性,对于传染病控制工作意义重大。
通过建立统计分析和数学模型的建立,探讨传染病发生、发展和流行的规律,一方面可根据预测的数据有的放矢地提出和采取预防控制措施,并通过跟踪印证来评价预防措施的效果,能使预防控制工作更具针对性、预见性和主动性,从而达到防止暴发或流行的目的;另一方面可将实时疫情信息与同期历史资料比较,对于发病率超出所确定可信限范围者作为异常来处理,以此发出暴发或流行的警示,从而实现疾病的早期预警。
2 传染病预测的步骤
在进行传染病预测之前首先要掌握需预测疾病的流行病学基本因素和过去在人群中的流行情况,分析发生变化的原因,要充分考虑影响相关疾病预测的病原、宿主、环境因素,以及疾病的分类方法、新诊断方法的引进或特别的干预措施的实施等。
2.1 确定预测对象和预测时限 一般来说,预测都是为预防和控制传染病服务的,需预测的传染病应该是构成重要卫生问题的重点疾病;同时要根据预测的目的确定预测的时限,如果预测是为了控制近期内传染病的暴发与流行,可确定为短期预测,如果预测是为了制定传染病流行控制策略,则确定为长期预测。
2.2 收集资料 包括疾病监测资料、历史记录、专题调查和纵向调查,其中疾病监测资料是最全面和最重要的,是其他资料所不能取代的基础资料。为了保证资料的完整性和可信度,要采用条件下方法对资料进行认真检查,对资料中的缺损值、异常值进行校正。
2.3 分析资料 首先确定资料的性质,分析资料是否属于线性资料,是否有周期性和季节性变化等;其次根据资料的性质和预测的目的选择不同的预测方法进行预测。
2.4 考核预测效果 预测结束后,应对预测效果进行分析和评价,观察实际值与预测值之间的偏差,对模型进行修正。
3 传染病预测预警方法的分类
传染病预测方法种类繁多,一般按预测时期长短可分为短期预测(月、季、半年和 1 年)、中期预测(1~3 年)及长期预测(>3年)。按照时间状态分为静态预测和动态预测。静态预测是在一定时间上对事物间因果关系的预测。而动态预测是对事物未来发展的预测,即动态外推预测。根据预测性质,分为趋势预测和强度预测。趋势预测包括综合分析法;预测指数;流行临界阈值(曲线);病原变异和人群免疫水平分析。强度预测包括比例法;外推法;数学模式。根据是否基于随机过程建模,可分为两类。一类方法基于非随机过程的建模,如回归分析、灰色动态模型,神经网络等;另一类方法基于随机过程的建模,如Markov模型,指数平滑法、ARIMA模型预测方法和小波分析理论等。按预测方法可以分为定性预测、定量预测和组合预测。一般来说,短期预测为控制流行或暴发服务,而长期预测则为制订长期的预防控制策略服务,预测时期越短,预测精度越高。定量预测则比定性预测的预测精度高。
4 传染病预测预警方法介绍
从定性预测、定量预测和组合预测分别介绍。
4.1 定性预测 是通过对当地传染病发生、发展规律及其有关因素的具体分析,判断该病即将流行的趋势和强度。定性预测主要包括流行控制图法、比数图法、“Z-D”现象传预测法、模糊数学理论、马尔可夫链等。另外,地理信息系统(GIS)和遥感技术(RS)作为新兴的高科技技术,近年多应用在寄生虫病和虫媒传染病的预测上,如对血吸虫病和疟疾的预测,可以准确、快速地预测流行强度和范围。
4.1.1 流行控制图法 流行控制图法是由美国W.A.Shewhart于1924年首创,最早用于检验和判断重复实验的准确度和精密度。控制图法适用于各种分布的传染病,对于具有季节性流行或周期性流行规律的传染病,效果较好。图中有3条曲线分别代表上警戒线、下警戒线和中位数线,根据发病率的大小和疫势发展的快慢可以推测传染病发生或流行的趋势或强度。警戒线是可以调整的,流行控制图法方法简单,指标容易得到,在疾病监测中是一种较好的“预警”方法。
杨倬[1]根据深圳市龙岗区1993~2002年菌痢发病资料,利用质量控制图原理绘制该地菌痢流行控制图。由菌痢流行控制图,可以预测出菌痢每月在该地的病强度,根据上限线(流行警戒线)判断该地菌痢某时间是否存在发生流行的危险,认为流行控制图在疾病监测中是一种较好的“预警”方法。
杨维中等[2]以湖南省、辽宁省等省份共366个县1997~2002年7种传染病月报数据建立数据库,采用控制图法建立预警模型,专家咨询法确定流行参照标准,通过计算、比较灵敏度、特异度、阳性预测值和绘制ROC曲线,选出合适的预警戒值。结果表明,预警肾综合征出血热、甲型肝炎、细菌性痢疾、流行性脑脊髓膜炎、疟疾,选用P80预警戒值预警功效较好,灵敏度和特异度均在90%以上;预警麻疹、肺结核,选用选用P50作为戒值预警功效较好,灵敏度和特异度均在85%以上。
曹明华等[3]利用杨维中等的方法,以安徽省62个县和43个区的2000~2005年细菌性痢疾、其他感染性腹泻和腹泻症候群每年5~10月的腹泻病门诊监测周报的就诊和发病人数数据建立数据库并建立模型。用2000~2004年研究病种的周发病率数据作为基线数据,代入模型,用各候选预警界值对2005年5~10月份腹泻病门诊监测疫情分县分病分周进行预警,同时用流行参照标准对其分县分病分周判断是否流行,从而计算各候选预警界值预警的灵敏度、特异度、似然比和阳性预测值等指标,并绘制ROC曲线。在综合平衡灵敏度、特异度、阳性似然比、阳性预测值、预测功效和预测疾病的特点后,优选出所研究疾病和症候群的合适预警界值:菌痢、其他感染性腹泻和腹泻症候群均为第75百分位数。灵敏度为100%,特异度均在94%以上,阳性似然比在17.5,阳性预测值也均在82%以上,异常信号共2188起。
4.1.2 比数图法 比数图表法适用于发病数呈正态分布的传染病,通过比数与其可信区间,来判断某传染病是否有流行征兆。美国早在80年代就将比数图法应用于国家传染病监测系统,其后研究亦证实该方法在公共卫生监测中是一种可行的好方法。
谭德斌[4]运用比数图法,以1996~2000年东风汽车公司病毒性肝炎发病数,预测2001年的流行情况。所得R值0.83在95%可信限之内,说明2001年3月的病毒性肝炎发病水平与近5年同期相比没有明显差异,即病例没有明显增多现象,不符合传染病流行特点,因此,预测2001年东风汽车公司内病毒性肝炎不会流行。2001年东风汽车公司病毒性肝炎实际发病率与近5年相比略有减少,没有发生病毒性肝炎流行,说明年初的预测结果与实际情况相一致。
邓志红,谭红专等[5]为探讨一种简单、敏感、有效的甲肝疫情预警方法,建立了4种预警模型进行优选。结果表明,比数图法和控制图法均是5年模型的功效优于3年模型;无论是3年模型还是5年模型,控制图法的功效均高于比数图法;湖南省的甲肝发病率为非正态分布,控制图法5年模型取第65百分位数为预警界值时约登指数最大。证明控制图法5年模型是预警甲肝流行的有效方法,其最适预警界值为第65百分位数。
4.1.3 “Z-D”现象预测 1997年,曾光和丁雁鹏等[6]通过对全国29省17种法定报告传染病的历史资料进行分析,发现某病流行年发病曲线波峰向右偏移时,则下一流行年发病率将可能上升,且向右偏移程度越大,上升的概率越大,反之则下降,他们将传染病的这种现象称为“Zeng-Ding”即“Z-D”现象。通过分析还发现“Z-D”现象在病毒性肝炎、百日咳、流行性脑脊髓膜炎、猩红热中的表现比其他疾病更典型。传染病季节发病曲线波峰的偏度在一定程度上综合反映了众多因素对流行过程的影响,利用“Z-D”现象分析传染病疫情资料进行预测研究,对指导制定传染病控制措施有积极意义。
程颖恺等[7]进一步论证了疾病流行中“Z-D现象”的存在,并探讨其与病种和时间序列的关系。张岚[8]应用疾病流行中存在的“Z-D”现象,对管区1970~1999年细菌性痢疾、病毒性肝炎两种疾病的时间序列资料进行了分析并作出了预测。回顾性验证结果表明,两病种最佳截取点的月累计百分位数与流行年前兆升降比均呈负相关,显著性检验P<0.01。回顾性预测符合率分别为66.67%和68.67%。利用建立的模型进行外推性验证,分别做出1998年、1999年和2000年细菌性痢疾和病毒性肝炎两种传染病上升与下降的预测,并与实际情况比较,基本一致。外推性预测结果与回顾性验证结果基本一致。证实了“Z-D”现象存在于细菌性痢疾和病毒性肝炎两种疾病的流行过程中。
4.1.4 马尔可夫链 马尔科夫链是描述一类随机动态系统的模型,它是指系统在每个时间所处的状态是随机的,从当前时间(现在)到下一时间(未来)的状态按一定的概率转移,而未来状态仅与现在状态及其转移概率有关,而与以前状态无关,即无后效性。利用马尔科夫链进行预测就是根据系统变量的现在状态及其变化趋势,预测其在未来某一特定时间可能出现的状态,从而为决策提供依据。马尔科夫预测是马尔科夫链在预测领域的一种应用。
付长贺、邓甦等[9]运用马尔科夫链建立传染病预测模型,并根据辽宁省干旱地区朝阳市1981~1993年呼吸道传染病-流行性脑脊髓膜炎的年发病率资料对该预测模型进行了验证,根据计算所得的初始时刻的状态概率向量a(0)和状态转移概率矩阵P,对1994~1996年的流行性脑脊髓膜炎发病率进行预测。
马尔可夫过程是随机过程的一个分支,它最基本最重要的特征是:“无后效性”,即在已知随机过程“现在”状态的条件下,其“将来”的状态与“过去”的状态无关。加权马尔可夫链预测思想认为,传染病在各个不同时间段的发病情况都符合或者近似符合一个时间序列。由于大多数传染病在某个时间段(如:周、月或者季节)的发病人数和发病率,与之前若干个时间段的发病情况关系较为密切,每个时段传染病的发病人数(或发病率)序列是一列相依的随机变量,各阶自相关系数刻画了各种滞时(各个时段)的发病人数之间的相关关系的强弱。因此,可考虑先分别依其前面若干时段的发病人数(对应的状态)对该时间段发病人数的状态进行预测,然后,按前面各时段与该时段相依关系的强弱加权求和来进行预测和综合分析,即可以达到充分、合理地利用历史数据进行预测的目的,而且经这样分析之后确定的结论也应该是更加合理的。这就是加权马尔可夫链预测的基本思想。
彭志行等[10]用加权马尔可夫链理论建立预测传染病发病情况的数学模型,以江苏省1990年1月至1999年12月逐月乙型肝炎发病人数的监测资料为样本,运用加权马尔可夫链对2000年的发病人数进行预测和其他相关分析。根据江苏省1999年7~12月六个月乙型肝炎发病人数及其相应的状态转移概率矩阵对2000年1月的乙型肝炎发病人数进行预测,预测发病人数对应的状态为3,即发病人数x满足:1369<x≤1641,江苏省2000年1月乙型肝炎的实际发病人数为1390人。同理,以1999年8月至2000年1月的资料序列预测2000年2月的发病人数,预测发病人数对应的状态为2,即发病人数x满足:1029<x≤1369,而200年2月的实际发病人数1178,两次预测都是准确的。
4.1.5 地理信息系统 地理信息系统(geographic information system GIS)是以地理空间数据库为基础,在计算机软、硬件的支持下,对空间相关数据进行收集、管理、操作分析、模拟和显示,并采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究和地理决策服务而建立起来的计算机技术系统。地理信息系统是一门集计算机科学、地理学、测绘学、空间科学、信息学等为一体的新兴高科技学科,目前已用于疾病的监测和卫生管理决策的制定。血吸虫病的分布、流行与地理因素密切相关。
GIS应用于疾病监测,可以实时、动态地显示发病变化情况,并可展示疾病的时空分布,从而达到信息的可视化。目前我国GIS在疾病监测方面的应用主要有疟疾、血吸虫病、莱姆病和霍乱等疾病的研究。以我国常见的血吸虫病为例,血吸虫病与自然生态环境密切相关。我国血吸虫病的分布与钉螺(特别是感染性钉螺)的分布相一致,有着严格的地方性。地表植被、光照、温度、水分和土壤等都会影响钉螺的生存繁衍,进而影响血吸虫病的地理分布。利用GIS预测模型和多层叠加分析可以为螺情及血吸虫病的监测提供有力的工具。GIS用于暴发疫情调查时,其地图展示功能可以让研究者对疫情发展情况一目了然。
汪天平等[11]利用气象参数建立模型来预测长江下游血吸虫病流行情况。将各季节的传播指数和NDVI在ArcView3.2软件进行叠加分析。将选取的观察点实际血吸虫病流行情况按流行程度和流行与否,与预测结果进行等级相关性检验,以判别相关吻合程度。结果表明血吸虫传播指数的大小与流行程度密切相关。认为 GIS技术可以作为血吸虫病分布、流行程度的监测和预测工具。
李朝晖,董毅[12]等应用地理信息系统(GIS)分析云南省大理市血吸虫病流行状况及钉螺分布情况。收集云南大理市2002~2008年血吸虫病疫情资料,并输入计算机建立GIS数据库,用ArcGIS9.2软件对7年来大理市的血吸虫病流行状况、钉螺和急性血吸虫感染(急感)分布变化进行描述和分析。结果表明,2008年血吸虫病流行于11个乡(镇)、91个行政村、401个自然村。2008年趋势面分析显示钉螺分布有向西北方向聚集的趋势,而人群感染则向东南聚集。急感病例分布于6个乡(镇),23个行政村;时空聚类分析显示病例分布呈现明显的聚集性。2002年大理市喜州镇的3个流行村为一级聚类区。认为GIS作为数据库和图形管理的工具,能更直观、形象和宏观地描述、分析血吸虫病疫情。
杨国静等[13]建立江苏省疟疾地理信息系统(GIS)数据库和疟疾流行GIS模型,对江苏省的疟疾流行区进行空间分析。认为基于TGDD的GIS预测模型可应用于江苏省疟疾流行的监测。
[1] 杨倬.流行控制图法在预测传染病发病趋势中的应用.现代预防医学, 2003,30(5):665-667.
[2] 杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究.中华流行病学杂志,2004,25(12):1039-1041.
[3] 曹明华,李群,吴家兵,等.肠道传染病控制图法预警技术研究.现代预防医学,2007,34(8):1441-1443.
[4] 谭德斌.运用比数图表法预测病毒性肝炎年度疫情趋势.湖北预防医学杂志,2002,13(2):41.
[5] 邓志红,谭红专,胡世雄,等.甲型病毒性肝炎流行预警方法研究.中国预防医学杂志,2007,8(5):635-639.
[6] 曾光,丁雁鹏,程颖恺.传染病流行中存在“Z一D现象”的论证.中华流行病学杂志,1997,18(5):270-274.
[7] 程颖恺,曾光.麻疹、猩红热流行中存在“Z-D现象”的进一步论证及其预测价值研究.中华流行病学杂志,1999,20(4):200-203.
[8] 张岚.应用“Z-D现象”进行传染病疫情预测的研究.数理医药学杂志, 2002,15(3):268-269.
[9] 付长贺,邓甦.马尔科夫链在传染病预测中的应用.沈阳师范大学学报, 2009,27(1):28-30.
[10] 彭志行,鲍昌俊,赵杨,等.加权马尔可夫链在传染病发病情况预测分析中的应用.数学的实践与认识.2009,39(23):92-99.
[11] 汪天平,周晓农,等.地理信息系统(GIS)用于江苏、安徽和江西省血吸虫病流行预测的研究.中国血吸虫病防治杂志,2004,16(2):86-90.
[12] 李朝晖,董毅,董兴齐.基于地理信息系统的血吸虫病疫情分析.中国血吸虫病防治杂志,2009,21(6):535-537.
[13] 杨国静,周晓农,等.江苏省疟疾流行地理信息系统预测模型的研究.中华预防医学杂志,2002,36(2):103-105.
10.3969/j.issn.1672-2779.2012.18.112
1672-2779(2012)-18-0159-04
2012-06-23)