基于移动百分位数法的深圳市南山区社区级肺结核疫情预警
2017-06-27朱闵敏郭旭君范玉铮钟涛刘盛元黄垚王健
朱闵敏, 郭旭君, 范玉铮, 钟涛, 刘盛元, 黄垚, 王健
·社区卫生服务·
基于移动百分位数法的深圳市南山区社区级肺结核疫情预警
朱闵敏, 郭旭君, 范玉铮, 钟涛, 刘盛元, 黄垚, 王健
目的 探寻深圳市南山区社区一级肺结核疫情预警最优阈值。方法 采用移动百分位数法,以2010年1月—2015年5月为基线,2015年3月—2016年3月为预警期,以社区为单位,以月为观察期,建立两种5年基候选阈值。根据ROC曲线下面积选择基线历史同期摆动周期,根据约登指数结合特异度优选阈值。结果 以25个历史数据(前后摆动2个月)与15个历史数据(前后摆动1个月)建立肺结核移动百分位数预警,其ROC曲线下面积分别为0.936,0.945,差异无统计学意义(P=0.131)。15个历史数据的候选阈值中,P80的约登指数与P60接近(最大者),特异度>90%。结论 综合考虑操作性及后续处置成本,建议深圳市南山区采用5年基前后摆动1个月的P80作为社区一级肺结核预警暴发的阈值。
肺结核; 暴发预警; 移动百分位数法
我国于2008年启动了基于移动百分位数法的传染病自动预警信息系统,以P50为阈值进行预警,为传染病暴发的早期发现奠定了基础[1]。在后期运行中,中国疾病控制中心根据疾病病种[2],以及地区疾病发病水平的差异进行了阈值优化[3]。社区级肺结核疫情预警是指在社区一级行政区域范围内进行肺结核疫情预警。因社区行政区域空间范围小,与县级等较大范围病例数据以正态分布为主不同,社区级肺结核报告发病数变动大,不能简单套用现有研究建立的阈值。因此,本研究采用移动百分位数法,探寻适宜于深圳市南山区社区级小范围空间尺度内的肺结核疫情暴发预警的5年基摆动周期及对应的最优阈值,从而从源头上更早地识别疾病的暴发,实现精准、高效、低成本的疾病防控目标。
1 资料与方法
1.1 数据来源及整理
将病例报告订正终审时间为2010年1月1日—2016年3月31日现住址为“深圳市南山区”的肺结核确诊病例从中国疾病预防控制信息系统中导出。将个案按照现住址清晰至社区[4],结合人口数据计算社区一级肺结核发病率,并与基础地图行政区域进行匹配。人口数据来源于南山区统计局,地图来源于国家基础地理信息中心网站(1:10万比例)。
1.2 移动百分位数法
以2010年1月—2015年5月为基线,2015年3月—2016年3月为预警期。按照移动百分位数法原理,以社区为单位、以月为观察期,分别采用以下两种基线期数据计算各候选百分位数(P50、P60、P70、P75、P80、P85、P90及P95):①观察期每年同期前后摆动1个月,5年共15个历史数据;②观察期每年同期前后摆动2个月,5年共25个历史数据。当预警期某月发病率>0且≥基线期候选百分位数值时,记为“暴发”预警。
1.3 阈值优选标准
依据杨维中等[5]的研究结果,以大于基线5年同期平均发病率的“+2 S”作为判断暴发的标准。根据候选百分数判断预警信号与暴发标准比较,绘制受试者工作特征(receiver operator characteristic,ROC)曲线。根据ROC曲线下面积大小选择基线摆动的月数,根据约登指数并结合特异度选择候选百分位数。
1.4 统计分析
采用Excel进行数据汇总以及全区月发病率作图,采用Stata 11.0软件进行百分位数计算,绘制ROC曲线及假设检验。用ArcGIS 10.2软件在南山区行政地图上呈现产生预警信号的社区。
2 结果
2.1 南山区肺结核报告发病率情况
2010年1月—2016年3月深圳市南山区共报告确诊肺结核4 636例,年均报告发病率为68.77/10万。2010—2011年每月报告发病率变动振幅大,2012—2013年变动振幅小;每年1—2月为低谷(春节期间),高峰期每年有差异、较多出现在9和11月,各月报告发病率见图1。
图1 南山区2010年1月—2016年3月月报告发病率(单位:1/10万)
2.2 基年摆动月数
经非参数统计分析显示,以5年为基数前后摆动2个月或前后摆动1个月,进行肺结核暴发预警,其ROC曲线下面积分别为0.936和0.945,差异无统计学意义(χ2=2.28,P=0.131)。见图2。
注:AUC-受试者操作特征曲线下面积图2 5年基肺结核疫情暴发预警ROC曲线:前后摆动2个月与摆动1个月比较
2.3 阈值优选
选择ROC曲线下面积最大的15个月历史基数(观察期同月前后摆动1个月)进行预警,各候选百分位数的灵敏度、特异度、阳性预测值、阴性预测值和约登指数如表1。其中P50~P80的约登指数均在70以上,P60的约登指数最大为76.90。考虑到预警信号后续处置,减少调查成本,综合灵敏度、特异度、阳性预测值和阴性预测值四者的平衡,本研究建议深圳市南山区采用P80作为肺结核暴发的预警阈值,其灵敏度>80%,特异度>90%,相对于P60可以减少9%的假阳性预警信号。
表1 南山区肺结核候选阈值灵敏度、特异度、阳性预测值、阴性预测值及约登指数
2.4 2016年3月预警信号展示
以80分位数为阈值,南山区2016年3月共有10个预警信号,月报告发病率最小8.07/10万,最高28.41/10万,见表2。10个暴发预警社区较为分散,其地理分布见图3。
表2 2016年3月按照15个历史数据80分位深圳市南山区暴发预警情况
图3 深圳市南山区社区级肺结核疫情暴发预警:基于移动百分位数法P80阈值
3 讨论
本研究初步确定了南山区社区一级移动百分位数法肺结核预警历史同期前后摆动周期及最优阈值,为在较小空间范围内核实和处置肺结核暴发疫情提供了基础。目前,已有应用移动百分位数的研究一般以县或以上行政区域为单位进行预警[6-8],最小到乡镇/街道一级[9],主要应用于急性传染性疾病,如手足口病、流感、痢疾、风疹等。在社区级小范围空间尺度内开展疫情预警,较县区级或更大区域,可以从源头更早识别暴发,介入控制更精准、更具可操作性,具有高效、低成本的优势。
2004年,基于疾病“流行”概念的基础上,借鉴比值图法,杨维中教授[5]建立我国传染病移动百分位数预警法。移动百分位数法与移动平均控制图法原理相似,区别在于移动百分位数法计算基线同期数据的百分位数,可适宜于任意分布数据,而移动平均控制图法计算基线参比周期所有数据的平均值,对于正态分布数据预警效果较好。移动百分位数法预警具有简单易操作、可自动调整季节因素影响以及应用范围广等优点[10],但基线数据中暴发疫情可能导致预警上限过高、预警信号假阴性增多[11],后期研究中可尝试剔除历史数据中部分极大值来进行控制(如最高的15%数据)[12]。
受患者就诊延迟(如Xu等[13]调查结果显示,深圳市肺结核患者平均就诊延迟10天)、医疗机构报病周末效应(周一和周五报告病例最多)[14]、中等发病率水平及人口流动等因素影响,在以天或周为观察周期内病例数波动性大,预警效果差。因此,本研究选择以月为观察周期,以增加观察数据的稳定性。
本文研究结果显示,5年基观察月同期前后摆动2个月与摆动1个月,预警效果差异无统计学意义。因肺结核发病存在一定季节性,考虑到选择前后摆动2个月作为基线跨越季节过多,可能导致低估或高估预警月份肺结核疫情水平,建议选择前后摆动1个月作为基线。
本研究得出的最优阈值P80低于杨维中教授等[5]以全国范围研究确定的最优阈值(P90),可能是因为南山区与全国肺结核发病率不同导致。发病率越低的地区,在相同百分位数阈值情况下灵敏度与特异度高于发病率高的地区[2-3]。张洪龙等[3]研究结果显示,在发病率水平不同地区,流行性腮腺炎等6种疾病的最优阈值不同。同时,其他以较小区域范围进行肺结核预警的研究,所确定最优阈值与本研究接近,如杨春梅等[15]研究得出2012年兰州军区某部队的预警阈值为P80,孙利文等[16]得出北京市怀柔区2016年肺结核预警阈值为P85。
在较小空间范围内应用移动百分数法进行预警时尚需慎重,从本研究表2中看出,4个预警社区的病例数只有1例,可能存在偶然因素。因此,建议单一预警信号应结合病例绝对数(如≥2例),或数据产生连续多个预警信号(如连续2个)才发出暴发预警[17]。合适的病例绝对数或连续信号数需进一步研究,并通过实际应用中核实的暴发疫情来确定。
[1] 杨维中,兰亚佳,李中杰,等.国家传染病自动预警系统的设计与应用[J].中华流行病学杂志,2010,31(11):1240-1244.
[2] 孙乔,赖圣杰,张洪龙,等.移动百分位数法不同阈值在传染病暴发预警中的效果比较[J].中华流行病学杂志,2011,32(5):450-453.
[3] 张洪龙,孙乔,赖圣杰,等.移动百分位数法分地区设定预警阈值对传染病预警效果的影响分析[J].中华流行病学杂志,2014,48(4):265-269.
[4] 朱闵敏,范玉铮,郭旭君,等.基于社区水平的深圳市南山区2011-2015年肺结核疫情时空分析[J].热带医学杂志,2016,16(9):1194-1197,1084.
[5] 杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究[J].中华流行病学杂志,2004,25(12):1039-1041.
[6] 陈小英,张义,金艳,等.宝鸡市手足口病移动百分位数法预警界值优选分析[J].公共卫生与预防医学,2015,26(5):34-36.
[7] 王瑞平,陈立凌,刘成,等.苏州市重点传染病移动百分位数法预警界值优选分析[J].中国卫生统计,2014,31(4):598-601,605.
[8] 熊田甜,周小涛,朱奕,等.基于移动百分位数法流感预警模型的探讨[J].中国热带医学,2013,13(7):822-825.
[9] 杨林清,吴明苏,居燕珍,等.2008—2014年三江县传染病自动预警信息系统运行情况分析[J].应用预防医学,2015,21(6):424-425.
[10] Kuang J,Yang WZ,Zhou DL,et al.Epidemic features affecting the performance of outbreak detection algorithms[J].BMC Public Health,2012(12):418.
[11] 白杉,穆金萍.控制图法在传染病暴发探测中的应用现状[J].疾病预防控制通报,2012,27(1):89-91,94.
[12] Unkel S,Farrington CP,Garthwaite PH,et al.Statistical methods for the prospective detection of infectious disease outbreaks:a review[J].J Royal Statist Soc:Series A,2012,175(1):49-82.
[13] Xu X,Liu JH,Cao SY,et al.Delays in care seeking,diagnosis and treatment among pulmonary tuberculosis patients in Shenzhen,China[J].Int J Tuberc Lung Dis,2013,17(5):615-20.
[14] Amirov C,Walton RN,Ahmed S,et al.Distribution of outbreak reporting in health care institutions by day of the week[J].Am J Infect Control,2012,40(10):979-982.
[15] 杨春梅,王辉,卢娟,等.控制图法对某部三种主要传染病预测预警的效果评价[J].中华疾病控制杂志,2012,16(9):809-811.
[16] 孙利文,刘羽.北京市怀柔区重点传染病预警技术优选研究分析[J].职业与健康,2015,31(12):1659-1663.[17] Pelat C,Bo⊇lle PY,Cowling BJ,et al.Online detection and quantification of epidemics[J].BMC Med Inform Decis Mak,2007(7):29.
Outbreaks Detection of Community-level Pulmonary Tuberculosis based Moving Percentile Methods at Nanshan District,Shenzhen City
ZHU Minmin,GUO Xujun,WANG Jian,et al.
ShenzhenNanshanCenterforChronicDiseaseControl,Shenzhen,518054,China
ObjectivesToexploretheoptimalthresholdforoutbreakearlywarningofpulmonarytuberculosis(PTB)atcommunitylevelinNanshanDistrict,Shenzhen.MethodsWeusedthemovingpercentilemethod(MPM)tocalculatetwotypesoffive-yearbasedcandidatethresholdsformonthlyPTBoutbreaksdetection,withdatafromJanuary2010toMay2015asabaselineanddatafromMarch2015toMarch2016asatestingdata.Thenwedecidedreferencemonthsatbaselinebasedonareasunderreceiveroperatingcharacteristiccurve(AUC)andchosethethresholdbasedonYoudenindex.ResultsTheAUCswere0.936and0.945,respectively,forthe25historicaldata(dataatcorrespondingmonth,twoprecedingmonths,andthetwofollowingmonths)and15historicaldata(dataatcorrespondingmonth,theprecedingmonth,andthefollowingmonth),andthedifferencesbetweenthemwerenotstatisticallysignificant(P=0.131).Forthe15baselinedata,theP80gotaclosevalueofYoudenindextothatofP60,whichwasthemaximum,withaspecificity> 90%.ConclusionsConsideringthepracticalityandcost,itissuggestedthatdataatcorrespondingmonth,theprecedingmonth,andthefollowingmonthfortheprevious5yearsshouldbethereferencedata,andP80shouldbeawarningthresholdoftheMPMforcommunity-levelPTBoutbreakdetectionatNanshanDistrict,ShenzhenCity.
Pulmonarytuberculosis;Outbreakdetection;Movingpercentilemethod
深圳市南山区科技创新局科技计划项目(南科研卫2014033)
深圳市南山区慢性病防治院,广东深圳,518054
王健
R181.3
A
10.3969/j.issn.1673-5625.2017.03.017
2016-09-15)(本文编辑 王芳)