传染病的多尺度时空特征分析
——以杭州市淋病、细菌性痢疾和流行性腮腺炎为例
2018-09-10郑嘉丽张丰杜震洪来丽芳刘仁义刘尧
郑嘉丽,张丰,杜震洪*,来丽芳,刘仁义,刘尧
(1. 浙江大学 浙江省资源与环境信息系统重点实验室, 浙江 杭州 310028; 2. 浙江大学 地理信息科学研究所, 浙江 杭州 310027; 3. 浙江建设职业技术学院 城市建设工程系, 浙江 杭州 311231)
近年来,随着医疗卫生水平的提高,部分传染病已得到有效控制,但城市扩张、人口密度增大、环境恶化等问题也促使某些传染病疫情的发生和蔓延,许多已被控制的传染病有死灰复燃之势,新发传染病也不断涌现[1-2].传染病的流行和传播不仅威胁人类健康,也对经济发展和社会稳定造成了严重影响[3-4].如何有效预防和控制传染病的发生,一直是流行病学、统计学、人口学、地理学及环境学等众多领域学者致力解决的问题.
随着地理信息系统(geographic information system,GIS)技术的迅速发展和广泛使用,结合地理模型方法研究传染病的时空分布特征,已成为公共卫生领域的研究热点之一.例如,查文婷等[5]应用分级统计图法,按年份对湖南省各市2004—2013年细菌性痢疾的发病率进行空间分析,发现大部分地区的疫情呈逐年下降趋势;COULIBALY等[6]采用空间扫描统计量法,以季节为尺度对马里共和国邦贾加拉镇2009年6月至2010年5月的疟疾数据进行聚集性分析,并利用GIS技术对聚类结果进行可视化展示,结果表明,疟疾的空间分布存在明显的季节性差异;陈江平等[7]以月为分析时间单元,以中国大陆各省2009年5月到2010年3月的甲流疫情数据为研究对象,利用空间自相关方法对其进行统计分析,发现疫情传播的聚集性是由弱到强变化的,但聚集重心始终在中东部的福建、浙江、上海等地.这些研究在传染病的时空分析上取得了一定的成果,但缺乏对时间的多尺度考量.而尺度问题是地理学研究中的重要内容之一,尺度过大,大量细节会被忽略;尺度过小,易陷入局部而不能把握整体态势[8-9].因此,探索传染病在不同时间尺度下的时空模式和规律,有助于相关部门从宏观到微观层面更全面地认识传染病的分布特征,从而制定更合理、更有效的防控策略.此外,不同传播途径的传染病在流行病学及时空分布特征上存在一定差异,但现有研究主要集中于采用描述性流行病学法和时间序列法对不同类型传染病的流行规律进行比较分析[10-13],鲜有从时空分析角度开展对比研究的案例.
在传染病时空分析的研究中,目前主要使用的方法有时空重排扫描统计量法[14-16]、贝叶斯时空模型法[2, 17-18]、空间自相关方法[7, 19-20]等.其中,时空重排扫描统计量法的基本假设是研究区域内各空间单元的人口在时间上呈均匀、平稳的增长态势,而当分析的时间跨度较大时,各个空间单元的人口增长速率很可能不一致,易导致分析结果出现偏差[21-22];贝叶斯时空模型需利用数据的先验信息进行统计推断,存在一定的主观性[18];空间自相关方法需人为选择邻接或距离矩阵,产生选择偏倚性问题的可能性较大[23].此外,已有研究大多只选用一种时空方法开展实证分析,而不同方法的分析视角及挖掘的时空特性有所不同,因此,综合应用多种模型方法,能更全面、更深入地揭示传染病的时空规律.
总体而言,目前尚缺乏应用多种GIS分析手段,从多个时间尺度充分挖掘传染病多维度(空间维、时间维以及类型维)特征的实证研究.因此,本文基于自组织神经网络、核密度估计和时空扫描统计量等模型方法,提出一种传染病多尺度时空特征分析框架,分别从年份、季节和月份3个尺度对杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的时空分布规律及其差异展开对比研究,以期为传染病时空模式的探索提供新的分析视角,并为杭州市传染病防控工作的有效开展提供科学指导.
1 多尺度时空分析框架
本文从时空动态分析视角出发,构建一种面向多尺度的传染病时空分析框架(见图1). 在方法的选择上,考虑到基于离散Poisson模型的时空扫描统计量法,通过引入人口数据有效解决了时空重排扫描统计量法探测结果出现偏倚的问题[24];相较于贝叶斯时空模型,核密度估计法无须利用与数据分布有关的任何先验知识,同时对数据的分布也不必附加任何前提假设,而是从数据本身出发分析其分布特征[25];自组织神经网络,由于引入了具有拓扑结构的邻域函数,聚类效果受初值的影响较传统的K-means等聚类算法小,结果较为稳定[26].此外,与其他时空分析方法相比,自组织神经网络法、核密度估计法和时空扫描统计量法能相对简单有效地将空间分析和空间统计功能从二维空间扩展到三维空间,并能将分析结果很好地与GIS环境相结合.因此,本文选用此方法构建多尺度时空分析框架.
图1 面向多尺度的传染病时空分析框架Fig.1 A multi-scale spatial-temporal analytical framework for identifying characteristics of infectious diseases
在年尺度下,结合自组织神经网络、平行坐标系和时空颜色矩阵,挖掘传染病空间分布状况的年际变化特征,从而在宏观层面对传染病整体的时空发展趋势进行理解和把握;在季节尺度下,利用核密度估计法揭示不同季节传染病的热点分布位置及热度的变化情况,旨在从中观角度探索传染病的时空聚集性及其演变特征;在月尺度下,应用时空扫描统计量法,以月和乡镇街道为分析的时间和空间单元,探讨该尺度下传染病的时空分异特征,以期在微观层面更精细地阐释其背后的时空规律.不同尺度下的主要研究方法介绍如下:
1.1 自组织神经网络法
自组织神经网络[27](self-organizing map,SOM)是一种非监督的神经网络学习算法,通过自适应的学习竞争,可实现对数据的聚类划分.网络的拓扑结构由输入层和输出层构成,输入层和输出层分别包含m个和n个神经元,输出层的每个神经元代表1个类别.SOM的网络是全连接的,因此,每个输入神经元均与所有的输出神经元相连,连接的权值为wij(i= 1, 2,…,m;j= 1, 2,…,n).算法的具体步骤如下:
1) 随机初始化网络权值wij(i= 1, 2,…,m;j= 1, 2,…,n),设定一个较大的初始邻域,并令迭代次数t=0;
2) 将输入向量x随机加载进网络;
3) 计算输入向量x=(x1,x2,… ,xm)与输出层神经元j(j= 1,2,…,n)之间的距离dj:
(1)
4) 选择与输入向量x距离最近的输出层神经元c作为获胜神经元;
5) 更新神经元c及其邻域Nc(t)内的其他神经元的连接权值:
wij(t+1)=wij(t)+α(t)(xi-wij(t)),
(2)
α(t) =1/t,
(3)
其中,α(t)为学习速率,随迭代次数t的增加而递减.
6) 令t=t+1,转步骤2),直至t达到最大迭代次数时聚类结束.
1.2 核密度估计法
核密度估计法[28-29](kernel density estimation,KDE)是空间点模式分析中应用广泛的非参数估计技术,能在平面空间中生成一个反映点数据的密度连续变化的光滑表面.对于一个二维的地理空间而言,空间中每个格网的密度估计值可表示为:
(4)
式中,n为点数据数目,(x,y)为格网中心点的空间位置,(xi,yi)为第i个点数据的空间位置,h为搜索半径,K为核函数.
核函数属于距离衰减函数,距数据点越远,计算得到的密度值越小,在搜索半径边缘处时密度为0.鉴于Epanechnikov核函数所产生的均方误差和效率损失均较Normal, Uniform, Gaussian等核函数的小[30-31],本研究选用Epanechnikov内核计算传染病的KDE值,其公式为:
(5)
式中,
在KDE中,搜索半径h对最终的热点可视化效果有重要影响.搜索半径越大,越能突显研究对象的整体分布特征;搜索半径越小,则越能反映研究对象的局部特征差异.为得到更好的热点可视化效果,本研究采用试错法比较不同h值时的KDE结果,以确定最优的搜索半径[32].
1.3 时空扫描统计量法
时空扫描统计量法[33]在疾病监测和卫生决策领域中应用广泛,不仅能探测疾病是否存在时空聚集性,还能对聚集位置和时间进行定位. 该方法基于的概率模型主要有Poisson分布模型和Bernoulli分布模型.本研究利用SaTScan 9.4软件[34]提供的基于离散Poisson模型的时空扫描统计量法对传染病的时空聚集性进行扫描分析,探测过程为: (1) 在所研究的时空区间中随机选取1个点,将其作为圆柱形扫描窗口的底面中心;(2) 不断扩大圆柱体底面半径以改变扫描区域的大小,同时逐渐增加圆柱体的高度,使扫描窗口所覆盖的时间长度逐步延长,直至达到预先设置的空间和时间上限;(3) 不断移动扫描窗口,并在其他时空区域重复相同的扫描过程;(4) 依据窗口内外的真实发病人数与预期发病人数计算每个窗口的对数似然比(log likelihood ratio,LLR),并将其用于检验窗口的扫描统计量[33,35].LLR的计算公式为:
(6)
式中,D代表某个圆柱形扫描窗口,nD是窗口D中的真实发病人数,μD为在无效假设下,结合真实发病人数和人口数计算而得的窗口D内预期的发病人数,nG和μG分别为整个研究区域的总发病数和预期发病数.
应用LLR对窗口内发病情况的异常水平进行评估,LLR值越大,表示该窗口中的发病人数越异常,其时空聚集性越强.同时,为避免虚假检验的产生,通常会利用蒙特卡洛模拟法对各个窗口的统计学意义进行定量评价.
2 实例分析
2.1 研究区域概况及数据来源
杭州市位于浙江省西北部钱塘江下游,是浙江省的政治、经济、文化和金融中心,也是华东地区的中心城市之一.2013年,该市下辖8个区、2个县,代管3个县级市(如图2所示),全市总面积1.66×104km2,属亚热带季风区,四季分明,光照充足,雨量充沛,年平均气温15~17 ℃,一月份最冷,七月份最热.年平均降水量1 100~1 600 mm,以春雨、梅雨和台风雨为主.杭州年鉴[36]的数据显示,2013年全市拥有884.4万常住人口,流动人口数则高达426万,是全省流动人口最多的城市.
图2 研究区位置及2013年人口密度分布Fig.2 Study area and population density distribution in 2013
由图2的人口密度图可知,杭州市人口分布极其不均匀,上城区、下城区、拱墅区、西湖区、江干区、滨江区等主城区人口稠密,而周边的临安市、淳安县、建德市等区县的人口密度较低.杭州作为浙江省的省会,地理位置特殊,人口流动频繁,自然灾害时有发生,其传染病发病率在省内一直处于较高水平.如2013年,该市报告的法定传染病发病数多达7.1万人次,占全省发病总数的19.2%,居全省第一,因此,研究杭州市传染病的时空分布规律,对该市乃至全省疫情的防控具有重要的指导意义.
本文的研究对象为杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的发病数据,这三类疾病分别属于典型的性传播疾病、肠道传染病和呼吸道传染病.数据来源于国家疾病监测信息报告管理系统,每条信息记录了患者的年龄、性别、职业、患病类型、家庭住址和发病时间.去除地址不详的记录,按家庭住址对有效数据进行空间化处理,最终得到的发病例数及男女患者的比例如表1所示.
表1 三类传染病的发病数及男女患者的比例Table1 The total number and the gender proportion of cases of three types of infectious diseases
2.2 框架应用及结果分析
2.2.1 总体特征
图4 箱线图结构Fig.4 The structure of the boxplot
图3利用百分比堆积柱形图和箱线图刻画了各类传染病的人群分布特征,箱线图中各横线的含义如图4所示.从图3(a)的职业分布以及图3(b)的性别、年龄组成来看,淋病患者以农民(34.6%)和工人(32.6%)居多,这与其文化水平和经济基础及性病防治意识相对薄弱有关[37],病例主要集中于性活跃的青壮年,50%的男性患者处于25~42岁的年龄段,50%的女性患者年龄在24~50岁.细菌性痢疾职业构成中以儿童(33.2%)、学生(15.0%)和农民(14.3%)为主,这主要是因为该类疾病的发病与卫生习惯和周围环境有关,而这三类人群的卫生知识水平相对较低,受菌痢病原体感染的概率更高[38].在年龄分布上,36岁以下的男性患者占75%,47岁以下的女性患者占75%,女性患者的平均年龄(29岁)明显高于男性患者(23岁).流行性腮腺炎的高发人群为儿童(37.9%)和学生(52.8%),患者的平均年龄在10岁左右,在不考虑异常点的情况下,女性患者的年龄跨度(0~25岁)略大于男性(0~20岁).由表1可知,各类疾病发病数均为男性多于女性,对于淋病而言,主要由于女性被感染后症状不明显,就诊率低,因此在报告病例中,男性居多[11];其他两类疾病,男性病例数较高可能与其活动范围较广,接触传染源的机会更多有关.
图5为应用平均中心法(mean center,MC)和标准差椭圆法(standard deviational ellipse,SDE)对三类疾病分布的描述.其中,平均中心法确定了病例分布的平均位置,标准差椭圆可度量传染病的扩散方向和聚集程度,椭圆长轴的方向表征数据的总体扩散方向,椭圆越小表明数据越聚集[39]. 直观分析可知,淋病病例的平均中心较其他两类疾病更偏向西南侧,而细菌性痢疾则更偏向东北侧.3个平均中心的直线距离在6 km以内,均分布在西湖区,说明病例在研究区域的东北部分布较多,这可能是因为东北部的人口密度大,疾病在人群中传播与流行的概率比较高.从图5的标准差椭圆可见,三类疾病的总体扩散趋势均为从东北到西南,其中,细菌性痢疾感染者的空间分布最聚集,而淋病和流行性腮腺炎的分布较分散.
图5 三类传染病的平均中心及标准差椭圆Fig.5 Mean centers and standard deviational ellipses for three types of infectious diseases
平均中心和标准差椭圆均很好地反映了疾病的总体分布特点,但不能精确表示病例的聚集程度和时空分布差异性.因此,需进一步探究疾病数据的时空特征.
2.2.2 基于年尺度的时空特征
在三类传染病年际变化规律的时空分析上,本研究使用SOM对传染病的发病率进行聚类分析,并集成了地图矩阵、平行坐标系和时空颜色矩阵等可视化聚类结果[40](见图6).SOM中的每个输入向量由特定年份、特定区县三类传染病的发病率构成.各类传染病数据在时间维度上均包含8个年份,空间维度上涵盖了杭州的13个区、县,因此,整个输入数据集含有8×13=104条样本数据.SOM的输出层采用2×4(8类)的二维网络结构,最大迭代次数设为1 000.图6(a)~(h)为地图矩阵应用分层设色法可视化分类结果,每种颜色代表1种聚类;图6(i)的平行坐标系具有多维图例作用,横轴代表不同类型的传染病,纵轴代表相应传染病的发病率,每条折线为SOM中的一个聚类中心(该聚类内所有样本的平均值);图6(j)的时空颜色矩阵与地图矩阵相对应,表达时间、空间信息,可辅助增强可视化效果.
结合图6(a)~(h)和图6(j)可知,属于红色和橙色聚类的区、县数目逐年增多(2013年的数目和2012年持平),而这2个聚类所对应的三类疾病的发病率均较低,说明2006—2013年杭州市淋病、细菌性痢疾和流行性腮腺炎发病率总体呈下降趋势.随着淋病防治知识的宣传、人民群众卫生意识的提高、饮食卫生环境的改善以及腮腺炎疫苗的大规模推广使用等,这三类传染病得到了有效控制.图6亦显示了传染病年际变化的空间异质性.例如,桐庐县、建德市、临安市等人口密度相对较低的市县,这三类传染病的发病率未表现出显著的年际变化特征,一直处于较低的水平;而江干区、下城区及拱墅区等人口稠密、流动人口多的市区,传染病发病率波动明显,具有较显著的年份差异.如,拱墅区2006—2008年淋病和细菌性痢疾的发病率均相对较高(粉红聚类),至2009年,这两类疾病的发病率有所下降,但流行性腮腺炎的发病率却出现上升现象(靛青聚类),随后,细菌性痢疾和流行性腮腺炎都得到了有效控制,而淋病的发病率却一直处于相对较高的水平(绿色聚类).由此可见,加强宣传、提高人们主动预防淋病的意识,依然是拱墅区传染病防控工作的重点.
图6 杭州市各辖区不同年份三类传染病发病率SOM聚类图Fig.6 SOM clustering maps of the incidences of the three types of infectious diseases for different years in different districts of Hangzhou
图6综合SOM、平行坐标系和时空颜色矩阵等方法,做基于年尺度的传染病时空多维可视化分析,有利于研究人员把握传染病时空分布的整体特征,但为了更全面、更深入地挖掘各类传染病的时空规律,还需要在季节、月份等更微观的时间尺度下探讨时空分异特征及差异.
2.2.3 基于季节尺度的时空特征
本文在研究三类疾病的季节变化特点时,按照3—5月、6—8月、9—11月和12—2月将数据划分为春夏秋冬4个季节,将划分好的数据作为KDE输入,以100 m×100 m的格网大小,1 km的搜索半径为参数,采用Epanechnikov核函数绘制各类传染病的核密度分布图(如图7所示).由图7可知,3种疾病的发病率在空间分布上均具有明显的聚集性,各季节密度值最高的区域主要都集中在人口稠密的主城区,与图5平均中心的分布情况相吻合.这些区域人与人之间频繁的近距离接触增大了传染病的传播风险和人员被感染的概率,在空间上表现出很强的聚集性.虽然这三类疾病的热点分布位置大致相同,但从总体热度值来看,流行性腮腺炎感染者的空间分布热度远低于其他两类疾病.
由图7(a)~(d)可知,淋病在空间分布上无明显的季节性差异,不同季节热点基本都分布于主城区的中心处,且热度值十分接近,可见淋病全年散发,因此,对于该类疾病,全年均要做好相关的防控工作.图7(e)~(h)的结果表明,细菌性痢疾的季节性特征显著,夏、秋季是发病高峰期,进入冬季后,病例的空间分布热度迅速下降,到春季又有所上升.这可能是因为细菌性痢疾属于肠道传染病,病原菌可通过苍蝇、蟑螂等间接传播,通过污染食品、水源或手,最终病从口入,使易感者被感染,而夏、秋季苍蝇、细菌易滋生,增大了疾病传播的概率,故夏、秋细菌性痢疾多发[38].不同季节流行性腮腺炎的核密度分布情况恰好与细菌性痢疾相反,表现为冬、春季发病密度高,夏、秋季发病密度低(如图7(i)~(l)所示),与LI等[41]的研究结果一致.这是由于流行性腮腺炎是以唾液、飞沫为主要传播途径,冬、春季气温较低,通常门窗紧闭,空气流通差,易引发该类疾病.
图7 三类传染病不同季节核密度分布图Fig.7 Kernel density maps for the three types of infectious diseases in different seasons
与基于年尺度的时空特征研究相比,以季节为时间单元的分析,通过采用分时段核密度估计法,直观、具体地展示了杭州市淋病、细菌性痢疾和流行性腮腺炎病例的空间热度分布情况及其季节性差异,不仅可以为疾病病因的探索提供更详细的线索,而且可为疾病防治对策的制定提供科学依据.
2.2.4 基于月尺度的时空特征
为进一步挖掘三类传染病的时空分布特征及其差异,应用基于离散Poisson模型的时空扫描统计量法,以乡镇街道为地理单元,以月为时间尺度,对杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的分月发病数和平均人口数进行回顾性时空扫描分析.在模型参数的设置上,将聚类范围的上限设定为覆盖30%总人口,最大空间扫描半径设为10 km,最大时间扫描半径设为6个月,蒙特卡洛模拟数设为999次,当检验统计量的P值小于0.001时,可认为扫描窗口内外发病数的差异有统计学意义,窗口所在的区域属于传染病的高发时空聚集区.图8和表2展示了P<0.001时的时空聚集信号.
从图8(a)~(c)中可直观地看到,被识别的各类传染病时空聚集信号主要出现在杭州主城区及其附近区域,这与KDE分析中(见图7)的热点分布较一致. 值得注意的是,有些区域虽然在图7中未呈现很高的热度值,却被扫描统计为高发病时空聚集区(如: 图8(a)的聚类6;图8(b)的聚类4和5;图8(c)的聚类4,12,13).这是因为当对KDE的结果进行可视化渲染时,其全局密度阈值易导致小范围内的局部高发热度被减弱甚至被忽略,而时空扫描统计量法的圆柱体扫描窗口的大小和位置是动态变化的,从而实现对数据聚集性的探测和数据的最大挖掘,因此,对局部高发的时空聚集信号有更好的检测能力[22, 42].由表2(a)可知,淋病的时空聚集区域在月份分布上比较分散,1号和3号聚类发生于6—11月,2号聚类出现在4—9月,4~6号聚类则分别产生于3—7月、11月至次年2月和1—5月.而细菌性痢疾和流行性腮腺炎聚类所处的月份均比较集中,前者发病聚集时间主要在每年的6—11月(见表2(b)),后者则为每年的12月至次年5月(见表2(c)),与前述基于季节尺度的分析结果基本吻合.总体而言,相较于以年份和季节为时间单元的研究,基于月份尺度的分析更精细地体现了各类传染病在不同时空区间上的聚集性特征.
图8 三类传染病回顾性时空扫描统计结果分布图(以月和乡镇街道为时间和空间基本单元)Fig.8 Maps of the results of the retrospective space-time scan statistic for three types of infectious diseases at month scale and sub-district level
(a) 淋病
聚类编号聚类中心坐标/°聚类中心所在的乡镇、街道聚类半径/m聚集时间实际发病数/例预期发病数/例LLR值1(120.177 5 E, 30.227 5 N)上城区紫阳街道2 850.30 2006/06—2006/112149.08471.892(120.149 8 E, 30.329 6 N)拱墅区上塘街道7 109.34 2007/04—2007/09680401.7680.713(120.280 8 E, 30.242 2 N)萧山区宁围镇6 544.62 2013/06—2013/1115344.7779.974(120.264 9 E, 30.442 8 N)余杭区临平街道5 027.09 2007/03—2007/079723.3364.645(119.882 2 E, 29.994 7 N)富阳市鹿山街道7 900.57 2008/11—2009/0218072.7755.956(120.031 1 E, 30.075 9 N)富阳市东洲街道7 433.18 2006/01—2006/056921.8932.14
(b) 细菌性痢疾
聚类编号聚类中心坐标/°聚类中心所在的乡镇、街道聚类半径/m聚集时间实际发病数/例预期发病数/例LLR值1(120.160 8 E, 30.271 3 N)下城区天水街道7 530.86 2007/06—2007/102 637482.852 398.922(120.308 1 E, 30.155 4 N)萧山区新塘街道7 813.38 2007/06—2007/10480127.13286.833(120.264 9 E, 30.442 8 N)余杭区临平街道6 880.53 2006/06—2006/1134683.79229.554(120.088 4 E, 30.119 6 N)西湖区双浦镇6 495.70 2008/07—2008/1110524.0873.815(119.983 4 E, 30.219 1 N)余杭区闲林街道6 677.84 2007/06—2007/1113037.4569.366(119.892 5 E, 30.053 6 N)富阳市富春街道6 614.96 2009/12—2010/0415651.9567.657(119.985 5 E, 30.303 8 N)余杭区仓前街道7 147.65 2009/08—2009/1112651.1138.898(119.966 1 E, 30.005 4 N)富阳市春江街道7 127.52 2007/07—2007/114512.8724.20
(c) 流行性腮腺炎
聚类编号聚类中心坐标/°聚类中心所在的乡镇、街道聚类半径/m聚集时间实际发病数/例预期发病数/例LLR值1(120.294 2 E, 30.490 5 N)余杭区运河街道5 985.93 2009/01—2009/0526616.32494.422(119.882 2 E, 29.994 7 N)富阳市鹿山街道7 900.57 2010/02—2010/0530138.68357.103(120.177 5 E, 30.227 5 N)上城区紫阳街道2 850.30 2009/12—2010/051374.91324.504(119.914 3 E, 29.859 7 N)富阳市常安镇7 784.33 2010/12—2011/041527.13320.795(120.189 1 E, 30.335 0 N)下城区石桥街道7 817.08 2008/12—2009/03557214.94191.446(120.512 6 E, 30.189 6 N)萧山区党山镇6 598.51 2012/03—2012/0812818.22140.077(120.343 2 E, 30.208 4 N)萧山区新街镇7 081.382008/01—2008/0511923.7896.658(120.497 9 E, 30.298 6 N)萧山区义蓬街道7 264.462009/10—2010/019114.1992.459(120.031 1 E, 30.075 9 N)富阳市东洲街道7 433.182010/02—2010/05505.9162.7010(120.035 9 E, 30.273 1 N)余杭区五常街道5 597.242012/12—2013/039025.1350.0511(120.242 1 E, 30.160 8 N)萧山区城厢街道4 680.162008/03—2008/056115.6337.7612(120.157 9 E, 29.996 9 N)萧山区戴村镇6 550.062009/12201.9828.2713(119.759 5 E, 30.059 8 N)富阳市永昌镇7 009.30 2006/02—2006/05233.0426.58
3 结 论
传染病在不同尺度下的时空分布特征有所不同,因此在多尺度下对其进行考察和研究才能充分把握其内在规律.目前,对传染病的时空分析尚缺乏对时间的多尺度考量,且研究的疾病类型也较单一.针对以上问题,本文运用多种统计学和地理学方法,选取典型的性传播疾病(淋病)、肠道传染病(细菌性痢疾)和呼吸道传染病(流行性腮腺炎),通过不同时间尺度的分析,将3种传染病的时空分布特征纳入整体框架进行探究.研究结果表明,三类传染病在年份、季节和月份尺度上均表现出特定的时空分布特点.在年尺度上,各类疾病的发病率在人口密度大、人员流动频繁的辖区变化和波动较明显,总体呈逐年下降趋势;而人口稀疏的区、县发病率长期处于较低水平,未表现出明显的年际变化特征.在季节尺度下,各季节不同传染病的高发区主要都集中在人口稠密的主城区;淋病的空间热度分布无明显的季节性差异,细菌性痢疾表现为夏、秋高发,冬、春低发,流行性腮腺炎则相反.在月尺度上,三类传染病的时空聚集信号主要出现在主城区, 周边KDE值较低的区、县,也有部分聚类;淋病的时空聚集区域在月份分布上较分散,而细菌性痢疾的聚集时间多为每年的6—11月,流行性腮腺炎则为12月至次年5月.
在框架构建上,综合SOM、平行坐标系和时空颜色矩阵等方法,做基于年尺度的分析,有利于从宏观角度把握传染病时空分布的整体特征;以季节为时间单元采用KDE开展研究,可直观了解疾病的热度分布及季节性差异;利用时空扫描统计量法进行月尺度探究,可更精细地检测和识别局部高发的时空聚集信号.不同尺度下所应用的模型相辅相成,从宏观到微观层面较深入地剖析了传染病的时空分布规律.
本文的研究成果对杭州市传染病防控措施的制定和防控资源的优化配置具有一定的指导意义,构建的多尺度时空分析框架可为今后类似流行病研究提供新的分析视角.本文仅定性分析了传染病的时空分布特征与人口密度、气象因素的关系,下一步将考虑应用地理加权回归分析等方法对发病率与空间风险因子之间的关联进行定量研究.