传染病预警方法及应用概述
2018-01-20焦锋董蓬玉刘晓强徐鹏杨光刘宏张舒惟何国忠
焦锋, 董蓬玉, 刘晓强, 徐鹏, 杨光, 刘宏, 张舒惟, 何国忠
传染病全球化随着经济一体化和生态环境的快速恶化愈发明显。虽然我国暂未受到全球化疫情的影响和冲击,但对难以防控的新发、突发和全球性传染病的蔓延仍需提高警惕。同时,在新老传染病的双重夹击下,大力提升重大传染病预警能力成为降低疫情危害的关键。传染病预警是根据收集到的病例、病原体、媒介昆虫等监测资料,对疫情发生的性质、规模、地域、影响因素、危害程度等进行综合评估和预测,以便采取相应级别的预警行动[1],以高灵敏精确地检测出传染病暴发迹象,及时采取应对措施,达到降低发病率和死亡率[2],减少对经济、社会带来的损失[3]。传染病预警系统在我国建成晚、预警阳性率低、疑似事件信号占全部预警信号比例较高、系统评价建设落后。因此,明晰预警方法、确认预警措施,成为摆在我们面前的课题。
1 传染病预警方法的理论基础
基于数学理论形成的传染病预警理论主要有信号检测论和决策理论,这两大理论提高了检测和预警系统的及时性[4]、灵敏度和特异度。
1.1 信号检测理论
指将已获得的一系列指标信号(数据)的幅度与阈值进行比较,用以判断一个传染病暴发流行与否[1,4],根据ROC曲线来确定灵敏度和特异度的最优组合,结合所要预警疾病的具体特征、预警系统精确度及所要求的时限来确定预警的指标和方法[5]。
1.2 决策理论
决策理论是决定是否发出预警的关键。它通过对正确预警所带来的收益或发生错误预警所需的费用成本进行评价,结合疾病潜伏期、病程长短等疾病信息,做出是否发出预警,以及什么时间发出预警的决策[4]。
2 传染病预警方法
传染病预警方法研究在20世纪90年代后期发展较快[6]。基于传染病流行的三间(人群、时间、地区)分布特点,根据分析数据项的类型将预警模型分为时间、空间和时空模型三大类[7]。
2.1 时间模型
时间预警模型是将一定空间区域内监测到的发病率与预警阈值进行比较,超过预警阈值则发出预警信号[8]。它是一种考虑病例时间聚集性的“时间扫描分析”方法,对预测一个大区域内的暴发能力较强[1],分定性和定量两大类。
定性预警是根据疾病历史数据的发生、发展规律,对疾病的发展趋势和流行强度进行估计,主要有综合预测法、比数图法、控制图法、专家咨询法等[9]。控制图预警模型具有简单易行、指标固定容易得到、预警功效高的特点[5],可优选传染病预警界值[5]。定量预警方法则根据疾病的时间进程来绘制流行或发病曲线,建立模型并定量预测未来发病水平,评估异常变化。定量预警方法主要有时间序列法、EARS(C1,C2,C3))、回归分析法、Markov和灰色模型[9]。定量预测模型多为时间序列ARIMA模型,它综合考虑了序列的趋势、周期变化与随机干扰等因素,被广泛应用于实践当中[10],可用于模拟乙型肝炎的发病规律和趋势[11]。基于短时间序列(至少1周)和累积方法,美国CDC发展了EARS C1(低预测敏感性)、C2(中度预测敏感性)和C3(高预测敏感性)三个模型,主要用于对日常监测数据进行预警[12]。Markov模型是一种非参数离散型时间序列分析方法,通过归纳某一随机过程不同时刻所处状态之间的变化规律,来预测这一过程下一时刻和下几个时间点所处的状态[13]。该模型特别适合预测有波动性改变的疾病,它近年开始在急性传染病预警中发挥作用。GM(1,1)是灰色系统中的最基本模型,它对短期内传染病发病规律预测效果较好,对样本容量和概率分布没有严格要求,运算处理简单、模型精度好,是一种值得推广的传染病预测工具[14]。该模型比较适合肠道传染病的发展趋势预警[15]。
2.2 空间模型
空间预警模型适用于具有明显空间聚集性的传染病,方法是利用患病者的地理位置信息探测病例是否存在空间上的聚集性,如有则发出预警[8]。主要有空间扫描统计、3 S技术等。
基于传染病空间聚集性建立的“空间扫描分析”方法,因不需精确考虑时间问题[1],主要用于探测局部的病例聚集性、发出预警信号、布置防控措施等[16]。空间自相关分析是研究空间中某位置观察值与其邻近位置观察值是否相关,相关程度大小的数据分析方法,对数据空间分布特点描述具有重要意义[17]。该方法适合对艾滋病流行热点地区进行预警,具有高值聚集区价值[18]。同时,对结核病发病数据中的空间聚集性探测、确定重点防控及监控亦能提供重要依据[19]。随着信息技术的飞跃,“3 S”技术[地理信息系统(GIS)、卫星遥感遥测技术(RS)、全球定位系统(GPS)相结合]在预防医学领域获得充分应用[20],尤其在探测病例呈暴发增加、跨地域传播提供地域信息、控制疫情蔓延范围等方面更具优势。
2.3 时空模型
传染病实时研究和聚集性分析是时空模型建立的重要基础,时空模型借助于时间和空间聚集性探测方法,来判断固定区域内的病例数、空间聚集热点区域是否达到预警阈值,如果达到,系统则发出预警信号[21]。
为更加准确预测传染病异常变化情况,时空扫描法综合利用病例发病时间、病程以及病例的空间信息来探测病例的时空聚集性[22]。主要分析方法及工具有SatScan、贝叶斯网络、PANDA、WSARE等[23]。整合时间和空间两个维度而开发的SatScan软件,被广泛用于疾病的时间和空间聚集性分析中,相对时间、空间模型而言,它的准确性更高[18]。贝叶斯网络时空模型,对数据的完整性要求不高,当模型相关风险数据存在缺失时,仍可进行风险分析和预警。适用于手足口病预警,优势是发现预警精度高[24]。基于贝叶斯探测理论建立的PANDA时空模型,可模拟中等规模城市人口的疟疾暴发,它在管理和推断时间处理方面优于贝叶斯网络[25]。WSARE是由Wong等[26]提出的一种基于规则的异常模式探测方法,针对性、灵活性较强,对疾病暴发早期探测具有重要意义。适用于对猩红热监测数据中的异常信号探测,并能早期提示可能出现的暴发疫情[27]。
2.4 传染病预警方法总结
基于传染病流行的三间分布特点,结合两者优势,时空模型在灵敏度、特异度、及时性和热点定位方面具有优势[21]。时空模型预警效果总体好于时间模型[28-29],对发病水平较低的传染病,两种方法探测效果相近;对发病水平较高的传染病,前者的灵敏度略低于后者[28]。时间模型对整个城市发病率上升的疫情探测聚集性效果好,但对局部地区的散发病例探测效果不如空间模型。
3 我国传染病预警系统的发展应用及展望
2003年SARS疫情暴发后,为及时识别传染病暴发与流行的早期迹象,基于全国法定报告传染病数据,2004年中国疾控建立了移动百分位数法预警模型(时间模型),在此基础上,国家传染病自动预警信息系统于2008年4月投入运行。为充分利用传染病空间分布特点,弥补单纯时间探测方法在空间准确性方面可能存在不足,在时间模型基础上,采用空间扫描统计量方法,建立了时间-空间聚集性探测预警模型(时空模型),该系统于2009年12月6日在全国试点运行,是目前国内最为庞大的法定传染病监测数据系统。
基于病例、症状、病原学、媒介等监测数据建立的传染病自动预警系统已开始应用于疾病监测预警[30]。2009年,Google利用用户在搜索引擎中输入的流感关键词,比美国疾控中心提前一周预测了流感暴发[31]。Ginsberg[32]通过汇总用户在Google中输入的关键词,建立的流感流行模型与当地美国疫情流行几乎吻合。Woo等[33]利用韩国社交软件Daum预测流感,发现具有现实意义。2013年12月,埃博拉病毒在几内亚、利比里亚、塞拉利昂和尼日利亚4国暴发;2015年美洲暴发大规模的寨卡病毒疫情。新发传染病出现预警的最佳方式是增加新的数据源监测点,国务院于2016年6月21日发布的《关于促进和规范健康医疗大数据应用发展的指导意见》中指出,推进公共卫生大数据应用的同时,要加强健康大数据存储、分析、挖掘、安全等关键技术的攻关。同年10月25日,国务院印发《“健康中国2030”规划纲要》,提出要加强重大传染病防控,完善传染病监测预警机制。
综上,传染病预警理论与大数据应用在预防传染病传播方面具有提升早期预警时间的优势,但在实际应用中,需在准确度、数据公开、隐私保护等方面加强监管。同时,要避免在数据采集、分析时出现信息孤岛,尤其在数据来源趋于多变与碎片化整合时,需主管部门牵头,多机构协同沟通、联合攻关、联合预警和公报。