全国各省狂犬病发病率的聚类分析
2012-06-06刘洁,曲波
刘 洁,曲 波
狂犬病在全球广泛流行,是迄今为止人类病死率最高的疾病[1]。卫生部公布的全国重点传染病疫情显示,2008年至2010年狂犬病的死亡人数均位居前列。其中,2010年全年狂犬病死亡人数2014例,仅低于艾滋病、肺结核死亡[2]。因此深入分析狂犬病流行病学特点,为了解该疾病的流行规律提供素材,为进一步有针对性的提出预防控制措施提供依据具有重要的现实意义。
聚类分析是研究事物分类的一种多元统计方法,是在没有先验知识的情况下,根据多个观测指标,找出能够度量样本或变量之间相似程度的统计量,并以此为依据,采取某种聚类方法,将所有样本或变量分别聚合到不同的类中。其中将多个指标归类的方法又称R型聚类,将多个样品聚类的方法又称 Q 型聚类[3-5]。本文利用我国2008-2010年的狂犬病发病率资料,分析其变化趋势,采用样品聚类分析法,对其进行综合评判并进行分类,为有关部门制定相关卫生政策提供理论依据。
1 材料与方法
1.1 资料来源 收集整理2008-2010年《中华人民共和国卫生部公报》转载的历年我国狂犬病的发病相关资料。人口资料来自历年《中国统计年鉴》。
1.2 分析方法 本文采用的层次聚类(hierarchical clustering analysis,又称系统聚类)是实际工作中应用最多的一种将相似的样品或变量归类的聚类方法。层次的含义是:开始时将每个样本(或变量)独自视为一类,将距离最近的两类合并;重新计算新类与其他类的距离,再将距离最近的两类合并;重复以上步骤,直至所有的样本(或变量)被并为一类。类与类之间的距离有各种不同的定义方法,常用的方法有类间平均法、类内平均法、最近距离法、最远距离法、离差平方和法等。本研究将每个省视为一个样品,其2008-2010年狂犬病发病率作为聚类指标,进行Q型聚类。类间距离采用常用的类间平均法。
1.3 统计分析软件 采用SPSS 16.0软件对数据进行统计分析。
2 结 果
2.1 一般情况 2008-2010年各年我国31个省具体发病情况见表1。2008年全国狂犬病发病率较高的省区有:海南、广西、贵州、重庆、湖南、广东。2009年全国狂犬病发病率较高的省区有:贵州、广西、海南、重庆、广东、湖南。2010年全国狂犬病发病率较高的省区有:海南、贵州、广西、重庆、广东、云南、湖南。
2.2 聚类分析结果 以狂犬病发病率值为聚类指标,对全国31个省、区、市进行层次聚类,结果见图1-3。从图1可以直观地看出,2008年我国各省区狂犬病发病情况分为两大类时,海南单独作为一组,其余省区为一组,当各省区分为3类时,重庆、贵州和广西也聚为一组。继续细分组,广东省和湖南省又被聚为一组。其余各省区报告发病率均不太突出,具体聚类结果见图1。图2结果显示,2009年我国各省区狂犬病发病情况分为两大类时,重庆、海南单独作为一组,其余省区为一组,当各省区分为3类时,广东省和湖南省也聚为一组。继续细分组,贵州和广西又被聚为一组。其余各省区报告发病率均不太突出,具体聚类结果见图2。图3结果显示,2010年我国各省区狂犬病发病情况分为两大类时,海南单独作为一组,其余省区为一组,当各省区分为3类时,贵州和广西也聚为一组。继续细分组,湖南省、重庆、云南、广东省又被聚为一组。其余各省区报告发病率均不太突出,具体聚类结果见图3。聚类结果提示,全国狂犬病发病率高的省份,其发病与一般省区的相似程度较低,易被单独分组,而发病率较低的省份,在分组数较少时,不易被单独分列为一组。
图1 2008年我国各地狂犬病发病率的聚类分析图Fig.1 Hierarchical clustering analysis of actual incidences rabies reported in China in 2008
图2 2009年我国各地狂犬病发病率的聚类分析图Fig.2 Hierarchical clustering analysis of actual incidences rabies reported in China in 2009
图3 2010年我国各地狂犬病发病率的聚类分析图Fig.3 Hierarchical clustering analysis of actual incidences rabies reported in China in 2010
表1 2008-2010年全国各地狂犬病报告发病率(1/10万)Tab.1 Incidence of rabies in China during 2008-2010(1/100 000)
3 讨 论
亚洲是全球狂犬病流行最为严重的地区,近年来,80%以上的病例出现在亚洲,传播宿主仍然以狗为主[6]。我国从1950-2004年人狂犬病死亡约102 280例,共出现5次高峰,前4次高峰约每10年出现1次,流行范围几乎遍及全国。从2008-2010数据显示,狂犬病仍为公共卫生重大疫病。
本文利用全国不同地区狂犬病的发病率,应用层次聚类分析法,分析疾病的地区分布,为进一步做好狂犬病的防控工作提供参考依据。聚类结果提示的全国狂犬病高发省份为海南、广西、贵州、重庆、湖南、广东。这些省份有其共同的特点,均属于南方城市,温度较高,室外活动频率较高,这些因素可能与狂犬病高发率有关。发病率较低的省份,发病率与一般省份的相似程度较高,在分组数较少时,个别狂犬病发病率较低的省份未被单独分列为一组。本次研究中聚类分析结果和全国各地狂犬病的实际发病特点一致。鉴于狂犬病的高病死率,及对社会的严重危害,应进一步加强综合防控措施,尤其是高发地区的防控措施,努力降低疾病的发生,减少其对社会的危害。
[1]Sun JW,Chen HM,Xu BL.Incubation period and survival-hazard tendency after exposure to human rabies by Cox regression analysis[J].Chin J Zoonoses,2011,27(8):734-737.(in Chinese)孙建伟,陈豪敏,许汴利.狂犬病潜伏期及病例暴露后生存与风险变化的Cox回归分析[J].中国人兽共患病学报,2011,27(8):734-737.
[2]Ministry of Health of the People's Republic of China.China health statistical yearbook 2011[M].Beijing:Peking Union Medical College Press,2010:255-261.(in Chinese)中华人民共和国卫生部.2011中国卫生统计年鉴[M].北京:中国协和医科大学出版社,2010:255-261.
[3]Chen JS,Chen WK.Exploration of cluster analysis and logistic analysis on quantitattive diagnosis of syndromes in Chinese medicine[J].Chin J Health Stat,2009,26(4):379-382.(in Chinese)陈建设,陈文垲.聚类分析结合logistic回归分析在中医证候诊断量化研究中的应用探讨[J].中国卫生统计,2009,26(4):379-382.
[4]Li XS.Medical statistics[M].Beijing:Higher Education Press,2008:12.(in Chinese)李晓松.医学统计学[M].北京:高等教育出版社,2008:12.
[5]Song MH,Sui H,Wang TT,et al.Hierarchical clustering analysis on the food intake patterns[J].Chin J Health Stat,2009,26(2):198-199.(in Chinese)宋忙华,隋虹,汪婷婷,等.聚类分析在膳食模式研究中的应用[J].中国卫生统计,2009,26(2):198-199.
[6]Qiu H,Deng ZJ,Hong J.Epidemiological characteristics of rabies in Kunming city during 1981-2010[J].Chin J Zoonoses,2011,27(9):854-856.(in Chinese)邱泓,邓智杰,洪劲.1981-2010年昆明市狂犬病流行特点[J].中国人兽共患病学报,2011,27(9):854-856.