卫生相关事件数据时间聚集性的综合分析与判定*
2017-06-05孙建伟王大江许汴利黄学勇
孙建伟 王大江 许汴利 黄学勇△
卫生相关事件数据时间聚集性的综合分析与判定*
孙建伟1王大江2许汴利1黄学勇1△
目的 探讨卫生相关事件数据时间聚集性的综合分析与判定。方法 应用集中度、负二项分布、聚类分析、圆分布四种方法对河南省某县狂犬病门诊就诊人群月分布数据进行分析。结果 集中度法M=0.54,说明就诊人群具有较强季节性;负二项分布P=0.3119,可认为就诊人群时间分布以天为单位具有时间聚集性;聚类分析显示春夏季是就诊人群集中季节,3-6月为就诊高峰,5月就诊人数最多;圆分布法计算结果显示日就诊高峰在5月8日。结论 集中度、负二项分布、聚类分析、圆分布等方法可用于卫生相关事件数据时间聚集性的综合分析与判定。
时间聚集性 集中度 负二项分布 聚类分析 圆分布
卫生相关事件年度数据,如某种疾病发病时间分布、门诊就诊人群时间分布、病媒数量的月分布等,其有无时间聚集性及时间聚集性综合分析与判定是相关科学研究的重要内容之一。通过卫生相关事件年度数据时间聚集性分析,既可为疾病病因研究提供线索,又可为疾病暴露时间或潜伏期研究提供支持,还可以用于评价不同时期某种疾病防控效果,为制定有效防制措施和卫生决策提供科学依据。本文以河南省某县2015年狂犬病暴露预防处置门诊就诊人数月分布数据的综合分析为例,介绍集中度、负二项分布、聚类分析、圆分布四种方法在数据时间聚集性分析与判定中的应用,并对结果进行比较,探讨适用范围和价值。
资料与方法
1.资料
来自2015年河南省某县狂犬病暴露预防处置门诊监测数据报表门诊就诊人群分日、分月数据。
2.方法
(1)集中度[1]表示发病时间季节性强弱的指标,由各月发病数与全年发病总数之比通过下式计算:
M表示集中度,R表示离散度,ri表示月发病数与全年发病总数之比。M为1时说明病例集中在一个月内;在0.9以上说明发病有严格季节性;在0.7~0.9之间,说明发病有很强的季节性;在0.5~0.7之间说明发病有较强季节性;在0.3~0.5之间说明发病有一定季节性;在0.3以下说明发病时间分布比较均匀; 为0表示病例均匀分布在12个月内。
(1)
(2)
再根据
(3)聚类分析[4]聚类分析是研究事物分类的一种统计方法,是在所关注对象分类面貌尚不清楚情况下,通过彼此之间的比较而将性质相近的归为一类,性质差别较大的归为不同类。在Q型聚类(对样品的聚类)中衡量对象性质相近程度的距离指标常用欧式距离,其计算公式如下:
式中:Xik表示第i对象的第k个指标的观察值,Xjk表示第j个对象的第k个指标观察值;m是观察指标的总数。dij表示第i个对象与第j个对象间的距离,dij越小,对象“性质”越接近。在实例分析中,对象为月份,指标是不同年份,观察值是发病数。
(4)圆分布法[5]是将具有周期性变化的资料通过三角函数的变换使原始数据成线性资料的一种统计学方法。一组圆分布资料如果有集中分布的倾向,这一倾向性可用平均角表示。将1年365天转化为360°,1天则对应0.9863°,以每月中间一天为组中值,换算成对应的角度,如1月16日对应16×0.9863°=15.78°,2月14日对应(31+14)×0.9863°=44.38°,余类推。通过以下公式求得平均角 ,换算成对应的月日即为发病高峰期时间。
结 果
1.门诊就诊人群时间分布概况 该县狂犬病暴露预防处置门诊2015年共接诊9800例,就诊时间多在2-8月,占全年病例的92.27%,其中5月发病数最多为1782例。
图1 河南省某狂犬病门诊就诊人数月分布
2.集中度法M=0.54,表明该狂犬病门诊人群就诊时间有较强季节性。
表1 门诊人群就诊时间(日)分布的负二项分布拟合
*:χ2=2.33,P=0.3119。
4.聚类分析 若聚为两类,则2-8月为一类,1月、9-12月为一类;2-8月又可分为两类,3-6月为一类,2月、7-8月为一类;3-6月又可分为5月及3、4、6月两类。结果见图2。
图2 河南省某狂犬病门诊就诊人群分月聚类分析
讨 论
表2 门诊人群就诊时间聚集性的圆分布法统计
在该狂犬病门诊就诊人群时间聚集性分析中,四种分析方法得出了相一致的结论,即发病具有时间聚集性,但结论侧重点各不相同。集中度分析认为发病具有较强季节性[6];负二项分布以某一时间或空间单位为观察对象,得出事件数据在该时间或空间单元层面具有聚集性[7];聚类分析侧重于按某一事件数据对月份进行不同层次的归类[8];圆分布法除得出具有聚集性外还推算出具体的发病高峰[9]。从方法的繁易程度看,聚类分析可通过SPSS、SAS等快速实现,最为简便,其次是集中度分析,而圆分布法和负二项分布的计算相对繁琐。从适用的时间范围看,集中度分析最为局限,其余三种方法适用时间范围则广泛、灵活[10]。负二项分布常用于传染病空间与时间聚集性的分析[11],有文献曾用于钉螺分布的拟合[12],这种方法关注的时间单位可以为时、日、周、年等,关注的空间单位可以是县、乡、村、街道等,可得出在所关注的时间或空间单位层面发病是否具有聚集性,若有2组以上结果,可以通过聚集参数 的大小比较聚集程度。聚类分析更适宜于某一事件连续多年数据时间分布特征的分析,得出所关注时间单位的不同聚类结果。圆分布法适宜的时间范围更广、更灵活,关键是所关注的单位时间与角度的互算,同时需要进行平均角的雷氏检验,这种方法最大的优点是能推算出发病高峰的时间点及不同置信度可信区间所在。
综上所述,在卫生相关事件时间聚集性分析和判定中,根据事件特点不同、关注时间范围不同、分析研究目的不同,可以灵活采取不同方法。若是以月份为单位进行年度分析,如对于流行性乙型脑炎、细菌性痢疾等具有显著发病高峰季节的传染病,用图示法或者聚类分析即可,对于事件或疾病无显著高峰期的,首选集中度法判定发病季节性的强弱;若研究关注的是不同年代或不同地区某事件某一数据高峰期的比较及动态变化,则首选圆分布法;若要比较前后不同时期数据聚集性强弱则可由负二项分布拟合实现。同时,应以动态变化的观点看待卫生相关事件数据时间聚集性,其分析和判定的主要目的是为该事件存在、发生、流行等相关影响因素分析提供线索,为疾病潜伏期或者暴露时间等事件关键点研究提供支持,为有效控制事件发展或者疾病防制措施的制订和完善提供科学依据。
[1]聂轶飞,王海峰,李孟磊,等.应用集中度和圆形分布法探讨河南省2010年手足口病流行规律.中国卫生统计,2013,30(3):410-411.
[2]索瑞鑫,仇玉兰,王彤.基于负二项分布的确切推断在微核试验数据分析中的模拟研究.中国卫生统计,2012,29(1):2-5.
[3]金丕焕.医用统计方法.第2版.上海:复旦大学出版社,2008.
[4]张英杰,王超,曹凯,等.中国大陆2008-2010年手足口病流行特征聚类分析.中国公共卫生,2015,31(5):541-544.
[5]梁筱露,白海涛,苏喆,等.圆形分布法分析北海市流行性感冒的季节性和长期趋势.现代预防医学,2015,42(8):1383-1385.
[6]雷静,李霞,杨浩,等.应用集中度分析银川市2004-2010年细菌性痢疾的发病季节和年龄分布特征.宁夏医学杂志,2012,34(1):60-62.
[7]孙建伟,陈豪敏,许汴利.河南省2010年县区层面狂犬病病例空间聚集性的Poisson分布与负二项分布拟合.郑州大学学报(医学版), 2012, 47(1):98-100.
[8]李亮,梁祁,祁贤.江苏省2009年手足口病流行特征的聚类分析.江苏预防医学,2010,21(6):4-6.
[9]张世勇,高秋菊.圆形分布法分析石家庄市2004-2010年布鲁杆菌病的高发季节.中国人兽共患病学报,2012,28(3):312-314.
[10]李凯杰,林文,范志诚,等.湖北省间日疟发病与传疟按蚊关系的圆形分布法分析.中华疾病控制杂志,2015,19(10):983-985.
[11]韩新焕.负二项分布的性质特征及在流行病学研究中的应用.数理医药学杂志,2009,22(2):138-140.
[12]张志杰,彭文祥,Ong Senghuat,等.广义负二项分布对钉螺分布的拟合.中国卫生统计,2008,25(1):2-6.
(责任编辑:张 悦)
河南省医学科技攻关计划项目(201503193)
1.河南省疾病预防控制中心传染病预防控制所(450016)
2.河南省桐柏县疾病预防控制中心
△ 通信作者:黄学勇,E-mail:hxyzzu@163.com