APP下载

移动流行区间法在我国北方15省份流感流行阈值制定中的应用效果评价

2017-01-10程勋杰陈涛舒跃龙胡国清

中国卫生统计 2016年6期
关键词:指标值流感预测值

程勋杰陈 涛舒跃龙胡国清△

移动流行区间法在我国北方15省份流感流行阈值制定中的应用效果评价

程勋杰1陈 涛2舒跃龙2胡国清1△

目的介绍移动流行区间法的基本原理,评价其在我国北方15省份流感流行阈值制定中的应用效果。方法利用中国流感监测信息系统收集中国北方15省份2010-2014年的流感监测数据。为不提及具体省份名称,用字母A~O分别代替15个北方省份。应用移动流行区间法制定各省份的流感流行开始和结束阈值,利用灵敏度、特异度、阳性预测值和阴性预测值四个指标评价该方法的应用效果。结果移动流行区间法得到的北方15省流感流行开始和终止阈值波动较大,开始阈值介于3.27%~18.03%,结束阈值介于5.04%~17.68%。其中8个省份的流行开始和结束阈值非常接近,但在3个省份相差很大。15省份平均灵敏度、特异度、阳性预测值和阴性预测值不高,平均值分别为54%、81%、65%和73%,但在5个省份的应用效果较好(灵敏度≥60%,特异度>80%)。结论移动流行区间法对我国北方5个省份流感流行阈值制定的应用效果较好,但对其他北方省份的效果相对较差,表明该方法还有改进的余地。

移动流行区间法 流感 流行 阈值

流感是由流行性感冒病毒引起的急性呼吸道传染病,容易在人群中形成流行或大流行,是危害公众健康的重大公共卫生问题。应对流感流行的一个重要举措是提前对可能的流行进行预警,以便及早采取措施避免可能的大流行或降低流行的强度。早期有研究利用数学模型预测流感的流行[1-2],目前研究多集中于探讨利用监测数据制定流感流行阈值的方法。常见的方法有百分位数法、往年同期均值加2倍标准差和实验室检测流感阳性率超过流行季节最大值的30%等[3-6],但这些方法均因缺乏外部金标准而无法对判断结果的准确性进行评估[7]。特别是在这些方法应用到其他地区时,因缺乏外部评价指标,很难对他们在不同地区的应用效果进行比较。

移动流行区间法(moving epidemic method,MEM)是Vega等学者在2008年提出的一种新的制定流感流行阈值的方法[8-9]。与上述方法比较,这种方法能对所制定流行阈值的灵敏度、特异度、阳性预测值和阴性预测值进行评价,并在欧洲地区显示了较好的效果。本文旨在介绍移动流行区间法的基本原理,并评价该方法在中国北方15省份的应用效果。

数据和方法

1.数据来源和指标选择

中国疾病预防控制中心印发的全国流感监测技术指南(2011)将每年4月1日所在周至次年4月1日所在周前一周定义为一个流感监测年度[10],按流感监测年度的划分准则,利用中国流感监测信息系统,本研究收集了中国北方15省份2010年第14周至2014年第13周每周的流感样病例(influenza like illness,ILI)百分比(ILI%)、咽拭子检测阳性率(positive rate,PR),一个省份由于监测数据不全而没有纳入分析。ILI%和PR是流感监测的两个不同指标。两者相比,基于实验室检测结果的PR更加准确地反映了流感流行的规律。因此,本文采用PR作为流感流行阈值的计算指标。鉴于O′Brien等人指出对监测数据使用五周移动平均值的方法平滑能更加清晰地反映其流行规律[11],作者对原始PR数据进行了平滑处理。

移动流行区间法需预先确定流感流行季节。已发表文献显示,中国北方15个省份的流感流行规律相对稳定,流感流行高峰期基本处于上年度12月份至下年度4月份之间,而中部和南方省份流感流行月份变异较大,难以准确划分流行季节[12-15],因此本文选用中国北方15省份数据评价移动流行区间法的应用效果。为避免提及具体省份名称,下文用字母A~O分别代替15个北方省份,利用随机数字表将15个英文字母随机分配给15个省份。

2.移动流行区间法的原理和计算步骤

移动流行区间法是Vega等学者在研究欧洲地区流感流行阈值时提出的一种新方法,该方法主要包括三个步骤[7]:(1)确定流感流行季节的开始和结束周,计算流感流行季节长度,将流感流行季节划分为三个不同的时段:流行前(流感流行季节开始到流感流行开始前)、流行期(流行开始到结束)、流行后(流行结束到流感流行季节结束)(图1);(2)利用流行前期和流行后期的监测数据计算流行开始阈值和结束阈值;(3)利用流行期监测数据计算一级、二级和三级流感流行阈值,实现分等级预警。

此处简要介绍各步骤的核心思想和具体做法如下:

第一步:Vega等人认为在一个给定的流感流行季节内流行期是连续的,且流行期的累计监测指标值(ILI%或PR)大于流行前和流行后两个时期的累计监测指标值。此时,可以通过寻找连续监测时间段内累计监测指标值占流感流行季节总累计指标值百分比的相对最大值来划分流感流行季节。以每周流感监测PR为例,假设某流感流行季节的长度为S周,每周流感监测PR值用ti表示,r表示连续r周,tr表示连续r周监测PR累计和的最大值,pr表示连续r周监测PR累计所占百分比的最大值,公式表示为:

图1 移动流行区间法对流感流行季节的阶段划分

其中k表示连续r周的起始周,k+r-1表示连续r周的结束周。

利用回归平滑技术对(p1,p2,…,pS)进行平滑处理[16],对应的平滑后数值为预先规定一个最小增量δ,δ一般介于2%~4%。对于具体的监测PR数据可通过灵敏度和特异度的最优化来确定合适的δ,逐步增大r,计算的差值,第一次出现对应的r*为该流感流行季节流行期长度,然后通过公式(1)可推导出该流感流行季节流行期的开始周k*和结束周k*+r*-1,从而确定流行前期(1~k*-1),流行期(k*~k*+r*-1)和流行后期(k*+r*~S)。

第二步:选择某地区各流感流行季节流行前期中PR最大的n个数(n=30/N,N为某地区纳入分析的流感流行季节数)。原方法建议每个国家纳入分析的流行季节最好不少于5个[9]。汇总该地区的30个数据,取其算术平均数的单侧95%置信区间的上限作为该地区流感流行开始阈值。采用相同方法可依据流行后期数据得到该地区流行结束阈值。

第三步:取某地区各流行期内最大的n个数,然后分别取30个流行期监测数据几何均数的单侧50%、90%和95%置信区间的上限作为低、中、高3个等级的流感流行预警阈值。

3.数据分析

首先根据参考文献分析中国北方15省份的流感PR监测数据,确定各省份季节性流感的流行周期及流行开始和结束时间,通过移动流行区间法确定三个不同的流行时期,计算各省份的流感流行开始和结束阈值。

按照移动流行区间法第一步中确定的各省份所有纳入分析的流感流行季节3个时期的划分,将处于流行期的所有监测周判定为流行周,处于其他两个时期的监测周判定为非流行周。移动流行区间法将此判断结果视为判断依据,对按照各省份计算的流行开始阈值和结束阈值对各监测周的判断结果(流行周、非流行周)进行评价。按照移动流行区间法的要求,流感流行季节最高点以前周监测数据超过流行开始阈值被判定为流行周,否则为非流行周;流感流行季节最高点以后的周监测数据超过流行结束阈值被判定为流行周,否则为非流行周。

以移动流行区间法确定的流行周与非流行周为判断依据,对用流行开始和结束阈值确定的各省份四个流感流行季节内各监测周的结果进行评价。计算各省份基于所确定流感流行开始和结束阈值的灵敏度、特异度、阳性预测值和阴性预测值,具体计算公式如下[9]:

灵敏度=(流行期内监测指标值大于流行阈值的监测周数)/(流行期包括的总周数)

特异度=(流行前和流行后两个时期内监测指标值小于流行阈值的总周数)/(流行前和流行后两个时期总周数)

阳性预测值=(流行期内监测指标值大于流行阈值的周数)/(监测指标值大于流行阈值的总周数)

阴性预测值=(流行期外小于流行阈值的周数)/(监测指标值小于流行阈值的总周数)

所有分析和计算均采用R3.2.1实现。

结 果

1.北方15省份流感季节的确定

2010-2014年北方15省份流感监测数据有明显季节性流行趋势,通常每年有一个流行峰,部分省份个别年份出现多个流行峰(如C省、F省和N省)。各省份周平均监测PR存在较大差异,最小平均监测PR为4.76%,最大为13.27%。总体来看,将每年第27周到次年第26周作为一个流感季节可较好描述北方15省份的流行规律,也符合有关文献的研究结果[12]。因此,本文最终设定流感季节的长度S=52周,将每年第27周到次年第26周作为流感季节的开始周和结束周。

2.各省的流感流行开始和结束阈值

图2结果显示,不同省份间流感流行开始阈值和结束阈值波动较大。流行开始阈值中最小的为G省(PR=3.27%),最大的为N省(PR=18.03%);15省流行结束阈值中最小的为O省(PR=5.04%),最大的为C省(PR=17.68%)。其中,K省和L省的流行开始和结束阈值比较接近(差值绝对值小于0.5%),而C省、D省和N省的流行开始和结束阈值相差较大(差值绝对值大于5%)。

图2 移动流行区间法各省份流感流行开始和结束阈值

3.移动流行区间法在北方15省份的应用效果

按照移动流行区间法中建议的评估方法,15省基于此方法得到的流行开始和结束阈值对应的灵敏度、特异度、阳性预测值和阴性预测值的平均值分别为54%、81%、65%和73%(表1)。

灵敏度最小的是N省(32%),最大的是C省(71%),且60%以上的仅有3个省份。特异度最小的是D省(74%),最大是C省(90%)。阳性预测值最小的是N省(42%),最大的是C省(87%)。阴性预测值最小的是I省和N省(68%),最大的是G省、K省和O省(77%)(表1)。

表1 移动流行区间法各省份四个评价指标值(%)

讨 论

移动流行区间法原理中提出用于计算的数据需包含5个或以上的流感流行季节,由于数据限制,本研究仅纳入了4个流感流行季节,可能会带来一定的结果不稳定性。与该方法在欧洲地区所得的流感流行阈值的应用效果相比[9],该方法在我国北方15省份的应用效果相差较大。尽管在5个省份的应用效果与在欧洲地区的效果相当,但在其他省份的应用效果要差很多,直接造成15省份的平均灵敏度、特异度、阳性预测值和阴性预测值分别比欧洲地区的研究结果下降了18%、15%、26%和16%,特别是15省份的平均灵敏度仅为54%。此外,采用移动流行区间法所得流行开始阈值和结束阈值在2个北方省份相差极大(6.24% vs.17.68%,18.03%vs.5.04%),而在欧洲地区利用ILI和急性呼吸道感染(acute respiratory infections,ARI)作为指标所得的流感流行开始和结束阈值相差均未超过2倍[9]。这些结果提示,移动流行区间法对我国不少北方省份的流感流行阈值制定的应用效果并不理想,需要对该方法做进一步的完善。

从移动流行区间法的原理来看,该方法有两个明显缺陷:

(1)未消除数据波动对流行阈值制定的影响。该方法利用流行前或流行后两个时期部分取值较大的监测值(单侧95%置信区间的上限)定义流行开始和结束的阈值。当流行前或流行后两个时期的监测数据存在较大波动时,数据集的方差偏大,进而导致所制定的流行阈值偏大,如本文中C省的流行开始阈值和N省的流行结束阈值。在未来的研究中,一方面可考虑对方差进行调整,如删除离群值后再做数据分析;另一方面可考虑改进中间的一些步骤,如对第二步中流行阈值的计算方法进行修改,取汇总数据的平均数或者某特定百分位数作为流感流行阈值等。原文作者建议的汇总30个数据可能是作者多次尝试后的结果,可能因为选择30个数据所得阈值的灵敏度和特异度相对较高。虽然原方法利用30个数据来计算欧洲地区流感流行阈值有较好的效果,但将此方法应用到我国时可根据灵敏度和特异度大小确定包括数据量的最佳取值。

(2)未利用流感流行季节内监测指标最大值的信息。此缺陷直接造成两个方面的影响。一是该方法利用移动流行区间方式寻找连续时间段内累计监测指标值的最大值,然后比较不同连续时间段累计监测指标值占流感流行季节总监测指标值的百分比来划分流感流行季节,忽略了流感流行季节内监测指标的最大值必然处于流感流行期这个事实。如果限定连续时间段包含最大值,可以避免计算很多不包含最大值的连续时间段,从而加快计算速度,同时使得计算结果更加合理。当监测数据变异较大而又未对其做出相应限制时可能会带来较大偏差。本研究中D省、J省均出现了流感流行季节监测指标最大值未被包含在流感流行期的异常现象。二是当一个流感流行季节内连续出现两个流行高峰时,该方法无法保证能够同时将两个流行高峰的最大值纳入所判断的流感流行期。此时,如能限制连续时间段包含两个最大值可使结果更加合理。本研究中I省、J省和K省均出现了多个连续流行高峰的最大值仅有1个被纳入流行期的不正常现象。

移动流行区间法在我国北方省份的应用效果相差较大,对部分省份的应用效果较好,但对其他省份的应用效果不理想。在未来的研究中,研究人员应考虑对此方法进行改进,如增加一些限制条件,或重新提出一种更合理的方法来确定流感流行阈值。

[1]王瑞平.两种季节趋势模型预测法的应用比较.中国卫生统计,2011,28(1):77-78.

[2]胡兴,胡锡健.新疆H1N1甲型流感疫情预测模型的比较研究.中国卫生统计,2011,28(3):342-343.

[3]Hashimoto S,Murakami Y,Taniguchi K,et al.Detection of epidemics in their early stage through infectious disease surveillance.International Journal of Epidemiology,2000,29(5):905-910.

[4]王瑞平,春雅丽,毕安华,等.上海市松江区流行性感冒控制图法预警界值优选研究.中国初级卫生保健,2010,24(7):77-78.

[5]杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究.中华流行病学杂志,2004,25(12):1039-1041.

[6]Cow ling BJ,Wong IO,Ho LM,et al.Methods formonitoring influenza surveillance data.International Journal of Epidemiology,2006,35(5):1314-1321.

[7]Unkel S,Farrington CP,Garthwaite PH,et al.Statisticalmethods for the prospective detection of infectious disease outbreaks:a review.Journal of the Royal Statistical Society:Series A(Statistics in Society),2012,175:49-82.

[8]Vega T,Lozano JE,Paget J,et al.Validation of themoving epidem ic method for detecting influenza epidem ics in Europe.In:Proceedings of the International Conference on Options for the Control of Influenza VI.London:International Medical Press Ltd,2008,657.

[9]Vega T,Lozano JE,Meerhoff T,et al.Influenza surveillance in Europe:comparing intensity levels calculated using themoving epidem ic method.Influenza and Other Respiratory Viruses,2015,9(5):234-246.

[10]中国疾病预防控制中心.全国流感监测技术指南,2011.

[11]O′Brien SJ,Christie P.Do CuSums have a role in routine communicable disease surveillance?Public Health,1997,111(4):255-258.

[12]Yu H,Alonso WJ,Feng L,et al.Characterization of Regional Influenza Seasonality Patterns in China and Implications for Vaccination Strategies:Spatio-Temporal Modeling of Surveillance Data.PLoS Medicine,2013,10(11):e1001552.

[13]李明,冯录召,曹玉,等.中国2005-2013年流感暴发疫情的流行病学特征分析.中华流行病学杂志,2015(7):705-708.

[14]张静,杨维中,郭元吉,等.中国2001-2003年流行性感冒流行特征分析.中华流行病学杂志,2004,25(6):461-465.

[15]高燕,方立群,张勇,等.中国大陆季节性流感活动的时空分布特征.中华流行病学杂志,2009,30(11):1097-1101.

[16]Hurvich CM,Simonoff JS,TsaiCL.Smoothing parameter selection in nonparametric regression using an improved Akaike information criterion.Journal of the Royal Statistical Society,2002,60(2):271-293.

(责任编辑:郭海强)

1.中南大学湘雅公共卫生学院流行病与卫生统计学系(410078)

2.中国疾病预防控制中心病毒病预防控制所病毒基因工程国家重点实验室

△通信作者:胡国清,E-mail:huguoqing009@gmail.com

猜你喜欢

指标值流感预测值
IMF上调今年全球经济增长预期
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
冬春流感高发 加强防治最重要
法电再次修订2020年核发电量预测值
浅谈食品中大肠菌群检测方法以及指标值的对应关系
维修性定性要求评价指标融合模型研究
秋季谨防牛流感
1995年—2013年地方预算内财力、中央返还及上解情况
猪流感病的预防与治疗