空间扫描统计在中国菌阳结核病分布中的应用
2012-03-11北京市结核病胸部肿瘤研究所101149康万里郑素华
北京市结核病胸部肿瘤研究所(101149) 康万里 郑素华
近年来,在流行病学研究领域,空间信息技术已逐步应用于分析疾病的空间分布特征、空间聚集性、绘制疾病风险地图等方面,在疾病防控中发挥了重要作用〔1〕。结核病(tuberculosis)是由结核分枝杆菌引起的全身慢性传染病。我国是全世界结核病高发的国家之一,为了掌握我国结核病的流行规律,获得全国结核病疫情基线资料,我国已经进行了四次全国结核病流行病学抽样调查(第五次流调详细结果有待公布)。
疾病的空间聚集性(spatial clustering)是指疾病的发生在空间上表现出的聚集倾向或趋势及疾病的空间分布特点和规律〔2〕。本研究利用我国2000年第四次结核病流行病学抽样调查资料,应用空间扫描统计(spatial scan statistics)和克里格插值(Kriging interpolation)方法研究我国菌阳肺结核的空间分布特征和空间聚集性,结果汇报如下。
资料与方法
1.资料来源〔3〕:菌阳肺结核资料来自我国2000年第四次全国结核病流行病学抽样调查,并建立空间扫描统计数据库。
2.研究方法:
(1)空间扫描统计〔4-5〕:空间扫描统计采用移动窗口法,应用一系列扫描圆探测研究区域疾病的空间聚集性,窗口的大小和位置处于动态变化之中。扫描半径按调查人口范围划分,在0到总人口一定比例之间变动(一般为总人口的50%)。开始探测时,随机选取某一研究点为圆心,以从0到规定的上限按照一定的步长逐渐变化的距离为半径,生成一系列的扫描圆。当扫描圆半径达到规定的上限后,又以研究区域内另一个研究点为圆心开始新的扫描,直到扫描完所有研究地点。空间扫描统计在研究区域内生成无数个大小、位置不同的扫描圆,利用圆内外病例的实际数和期望数计算对数似然比(log likelihood ratio,LRR)。将扫描圆的对数似然比由大到小排序,寻找所有位置所有窗口中较大的对数似然比值,这些区域是最有可能存在聚集性的区域,然后进行蒙特卡罗随机化法(Monte Carlo randomization method)检验,以探测疾病的空间聚集性,确定窗口所包含的地区,并计算该地区的相对危险度(RR)及检验有无统计学意义,通过检验的扫描圆就是探测到的疾病聚集区。
本研究应用空间扫描统计分析中的Poission分布模型(Poission model),在SaTScan8.0的操作平台上对研究区域菌阳结核病进行高患病率(high rate)和低患病率(low rate)空间扫描统计分析。
(2)克里格(Kriging)插值法〔6-7〕:克里格插值是以变异函数理论和结构分析为基础,根据未知样点有限邻域内的若干已知样本点数据,在考虑了样本点的形状、大小和空间方位,与未知样点的相互空间位置关系,以及变异函数提供的结构信息之后,对未知样点进行的一种线性无偏最优估计,是空间统计学中的一种空间插值定量绘图方法。
其中s0表示某处未流调点预测值,Z(si)为临近区域si的测量值,λi为 si的权重,其和为1,即∑λi=1,n为已知样本点的个数。
本研究应用ArcGIS 9.0克里格插值功能,绘制我国菌阳肺结核发病风险比的空间插值地图。
结 果
1.一般情况:2000年第四次全国结核病流行病学抽样调查共调查257个抽样点,调查365 097人,发现菌阳肺结核患者584例,菌阳肺结核患病率160.0/10万。
(1)菌阳肺结核与性别的关系 第四次流调共调查男性182 183例,女性182 914例;其中菌阳肺结核患者男性411例,女性173例。男性菌阳肺结核患病率225.59/10万,女性94.57/10万,男、女菌阳肺结核患病率差别有统计学意义(χ2=98.106,P<0.001)。
(2)菌阳肺结核与年龄组的关系 各年龄组患菌阳肺结核情况,见表1。经线性趋势检验,随着年龄的增大菌阳肺结核患病率有升高的趋势(χ2=553.678,P<0.001)。
表1 各年龄组患菌阳肺结核情况
2.空间扫描统计分析:
(1)菌阳肺结核高发区域的空间扫描统计
经过空间扫描统计分析,得到一个有统计学意义的菌阳肺结核高发聚集区域(LLR=16.54,RR=1.62,P=0.001)。结果表明:我国菌阳肺结核空间分布非随机化,存在高发聚集区,聚集区内的发病风险是其他区域的1.62倍,该区域涉及豫、鄂、湘、皖、赣、川、渝、黔、粤、桂等省市。
(2)菌阳肺结核低发区域空间扫描统计
经空间扫描统计,得到一个有统计学意义的菌阳肺结核低发聚集区域(LLR=15.66,RR=0.43,P=0.001)。结果表明:我国菌阳肺结核空间分布非随机化,存在低发聚集区,聚集区内的发病风险是其他区域的0.43倍,该区域涉及京、津、冀、鲁等省市。
3.克里格插值研究
为更好研究我国菌阳肺结核的空间分布特征,将各调查地区的发病风险比导入ArcGIS 9.0,应用克里格插值分析制作我国菌阳肺结核发病风险比地图(图1),颜色条由白到黑发病风险比逐渐增大。菌阳肺结核高发病风险比聚集在豫、鄂、湘、皖、赣、川、渝、黔、藏等地区;菌阳肺结核低发病风险比区域在京、津、冀、鲁等地区,结果与空间扫描统计分析基本相似。
讨 论
男性和高年龄组者是患菌阳肺结核的高危人群。原因可能是男女两性接触感染机会的不同,男性社会活动、社会应酬较多,因此与传染源接触的机会较多。高年龄组者患病率高,原因可能是老年人的免疫状况比较低,易被结核病传染。因此,应该加强男性、高年龄者结核病的防护工作。
图1 中国菌阳肺结核发病风险比的克里格插值地图(台湾省数据缺失)
空间扫描统计是研究疾病空间聚集性的方法之一〔8〕,不但可以判断疾病的分布是否存在空间聚集性,而且可以对疾病聚集位置和范围进行定位〔9〕,其无效假设是病例的空间分布是随机的,备择假设是至少存在一个扫描圆,其区域内发病率显著高于或低于区域外。联合地理信息系统,可以对空间扫描统计结果可视化,为疾病防治和研究提供重要依据。本研究空间扫描统计分析结果表明我国菌阳肺结核空间分布非随机化,存在一个高发聚集区和一个低发聚集区。对菌阳患病率高发聚集区域形成的原因应进一步调查,并加强防控措施和治疗。应用克里格插值空间分析技术可以对全国结核病流行病学抽样调查数据和监测数据进行充分利用,获得更加可靠、准确的疾病空间分布的信息。克里格插值通过有限、离散的流调点生成连续平滑的地图,突破行政区域的限制,绘制出我国菌阳肺结核发病风险比的空间分布地图,研究疾病全区域的分布特征,使我国结核病空间分布可视化,为政府和上级主管部门直观地提供全国结核病流行病学地理信息,为今后强化结核病指导策略,最终控制结核病提供科学依据。
1.Boulos MN,Roudsari AV,Carson ER.Health geomatics:An enabling suite of technology in health and healthcare.J Biomed Inform,2001,34(3):195-219.
2.陈峰.疾病时空聚集性的统计方法研究.南通医学院院报,1999,13(9):237-240.
3.中华人民共和国卫生部编著.2000年全国结核病流行病学抽样调查资料汇编.北京:人民卫生出版社,2003.
4.Kulldorff M.SaTScanTM User Guide for version 8.0,2009.2(www.satscan.org)
5.Adjuik M,Kanyomse E,Kondayire F,et al.Clustering of under-five mortality in the Navrongo HDSSin the Kassena-Nankana District of northern Ghana.Glob Health Action,2010,3(10):15-25.
6.Ortiz BV,Perry C,Goovaerts P,et al.Geostatistical modeling of the spatial variability and risk areas of southern root-knot nematodes in relation to soil properties.Geoderma,2010,156(3-4):243-252.
7.Davis HT,Aelion CM,McDermott S,et al.Identifying natural and anthropo-genic sources of metals in urban and rural soils using GIS-based data,PCA,and spatial interpolation.Environ Pollut,2009,157(8-9):2378-2385.
8.朱琦,于石成,郝元涛.传染病监测数据的统计分析方法.中国卫生统计,2011,28(2):217-220.
9.唐咸艳,仇小强,黄天壬,等.空间扫描统计在广西肝癌空间格局中的应用研究.中国卫生统计,2009,26(2):114-116.