APP下载

2011—2015年新疆维吾尔自治区涂阳肺结核时空格局分析

2020-06-09尹哲贺湘焱李奇凤刘亚洁张燕李德洋加依娜拉兹别克古丽娜扎尔艾克拜尔曹明芹

中国防痨杂志 2020年6期
关键词:插值贝叶斯克里

尹哲 贺湘焱 李奇凤 刘亚洁 张燕 李德洋 加依娜·拉兹别克 古丽娜扎尔·艾克拜尔 曹明芹

结核病传播具有空间聚集性分布的特点,在经济“边缘化和脆弱地区”高发,根据全国第五次结核病流行病学抽样调查,西部地区涂阳肺结核患病率是中部地区的1.7倍,是东部地区的2.4倍[1]。新疆维吾尔自治区(简称“新疆”)地处我国西北部,经济发展相对落后,加之卫生资源稀缺等因素造成基础疫情严重,防治困难,年平均涂阳肺结核登记率为39.31/10万[2],是我国结核病发病比较严重的地区之一[3]。

伴随着空间流行病学理论、技术的快速发展,地理信息系统(geographical information system,GIS)和空间分析软件应用日益广泛,利用地理统计学的知识从空间角度揭示结核病的分布与传播规律,已经成为广大科研工作者热衷研究的方向。克里金插值法通过变异函数来研究具有空间相关性和依赖性的地理分布现象,主要应用于采矿业、农业、地质等领域,随着地质统计学理论的不断成熟,应用范围持续扩展[4-5]。

本研究在2011—2015年新疆涂阳肺结核发病风险时空分布探索的基础上,根据克里金插值方法最优无偏的特点,采用普通克里金法和经验贝叶斯克里金法建立模型,探索涂阳肺结核发病风险时空分布的相关性和变异性,评估新疆不同地区肺结核疫情。

资料和方法

一、资料来源

2011—2015年新疆肺结核发病报告数据来自《中国疾病预防控制信息系统》的子系统《传染病报告信息管理系统》。2011—2015年新疆涂阳肺结核报告发病例数分别为11 813、14 059、11 149、10 483、10 196例,5年间共计57 700例。各年份区(县)人口数据来自新疆统计年鉴。省级行政区域电子地图(1∶10万)从国家基础地理信息系统获取,各区(县)的经纬度数据由Google earth获取,以2011年为标准。

二、分析方法

1. 涂阳肺结核标准化发病比(standardized morbidity ratio,SMR)估算:2011—2015年新疆结核病发病数和发病率数据资料经整理、计算,构建各区(县)涂阳肺结核SMR数据库。以各区(县)年度报告的全疆人口构成和涂阳肺结核发病率作为标准,计算各个区(县)涂阳肺结核SMR,公式如下:

公式(1)[6]

其中,yij表示i区(县)(1≤i≤98)在第j年(2011≤j≤2015)的涂阳肺结核报告例数,Eij表示i区(县)在第j年的期望报告例数,由当地人口数乘以全疆第j年的涂阳肺结核报告率得到。

2. 空间自相关分析:采用全局莫兰指数(MoranI)值反映空间自相关关系,公式如下:

公式(2)[7]

其中,zi是第i个区(县)肺结核SMR与其平均值的偏差,wij是i和j之间的空间连接矩阵,n是要素总数,即观测区域数等于98,S0是98个区(县)空间权重的聚合。MoranI取值范围为-1~1,MoranI值越趋近1,代表肺结核SMR呈聚集分布;MoranI值越趋近-1,代表肺结核发病率分布具有负相关性;MoranI值为零,表明整体呈随机分布。假设检验使用Z-score得分,检验水准α=0.05;Z>1.96或<-1.96时,α<0.05。

3. 克里金法:普通克里金法可对周围的测量值进行加权以得出未测量位置的一个线性估计预测系统,适用于区域化变量存在空间相关性的情况,能够给出估计误差,充分考虑空间变量相关性,有效弥补数据集存在的聚类影响,插值精度高。公式如下:

公式(3)[8]

其中,Z(Si) 是第i个位置处的实际涂阳肺结核SMR,λi是第i个位置处的未知权重,S0是预估点,N是测量点数。在普通克里金法中,权重λi取决于涂阳肺结核SMR实际点与待测点位置的距离,以及待测点周围的实际涂阳肺结核SMR之间空间关系的拟合模型。

经验贝叶斯克里金法是地质统计学建模技术之一。它与其他克里金模型不同之处在于其使用内在随机函数进行空间插值。除了考虑半变异函数模型基本参数的不确定性之外,可以快速拟合许多理论半变异函数模型[9],从中选择合适的理论模型进行最优拟合。根据{z(xi);i=1,2,…,N}已知观测点实际涂阳肺结核SMR,进一步求得未知测量点x0(x0∈D)处的贝叶斯克里金估计值,即:

公式(4)[10]

采用均方根误差(root mean squared error,RMSE)来评价两种模型的拟合效果,表示实际值与模型估计值之间的平均距离,RMSE值越小,误差越小,模型效果越好。

三、统计学处理

采用Excel 2010软件对2011—2015年新疆肺结核发病报告数据进行整理。通过SPSS 25.0软件进行统计学分析。使用ArcGIS 10.2软件实现空间分布图、全局相关性分析、克里金插值分析及其结果的可视化。采用均方根误差评价两种模型的拟合效果。检验水准均为α=0.05。

结 果

一、2011—2015年新疆涂阳肺结核报告SMR时空分布格局

2011—2015年新疆涂阳肺结核SMR较高的地区主要分布于南疆的喀什、和田、阿克苏3个地区,具体表现在英吉沙县、泽普县、于田县、民丰县、洛浦县等13个区(县),见表1。从空间上看,涂阳肺结核SMR水平存在从南向北逐渐降低的趋势,南疆SMR水平一直居高不下,北疆、东疆的SMR处于较低水平。5年间,各地区涂阳肺结核SMR均呈现小幅波动、整体下降的趋势。南疆涂阳肺结核SMR水平较为平稳,但远高于北疆和东疆,在高位上下波动。北疆和东疆始终保持在较低水平,以SMR水平降低为主要趋势,2015年呈现较为明显的升高趋势,见图1~5。

二、涂阳肺结核SMR全局自相关分析

利用全局MoranI指数对2011—2015年新疆区(县)涂阳肺结核疫情进行全局空间自相关分析。结果显示,各年度全疆涂阳肺结核SMR分布存在空间正相关关系,且差异有统计学意义(MoranI值均>0,P值均<0.001)。其中,整体表现出的聚集性在2013年最高(MoranI=0.376),在2014年最低(MoranI=0.248),详见表2。

三、克里金插值模型构建涂阳肺结核SMR分布格局

对2011—2015年新疆涂阳肺结核SMR数据库进行空间探索分析,变异云图提示数据存在空间相关性,可以进行插值分析。分别建立普通克里金和经验贝叶斯克里金模型,生成新疆涂阳肺结核发病SMR的克里金估计图。交叉验证比较,2011—2015年普通克里金模型RMSE范围在0.379~0.522,经验贝叶斯克里金模型RMSE范围在0.382~0.484,两种模型拟合度较高。与新疆涂阳肺结核SMR分布图比较,符合实际分布规律,且更为直观地表现出SMR在空间地理维度上的变化趋势,提示涂阳肺结核SMR在新疆南部较高,北部较低,中部介于二者之间,南北疆之间存在一个较为明显的分隔带,走向基本与天山山脉走向一致,见图6~15。

表1 2011—2015年新疆肺结核SMR的分布

表2 2011—2015年新疆涂阳肺结核SMR全局

讨 论

一、新疆涂阳肺结核SMR时空格局的探讨

本研究对2011—2015年新疆98个区(县)涂阳肺结核SMR进行分析,以区(县)级为尺度,为新疆寻找更有针对性的肺结核精准防控地区。全局自相关分析结果提示,涂阳肺结核SMR分布非随机,具有较强的地区变化规律。由北向南、由东向西SMR逐渐增高,呈阶梯式分布。涂阳肺结核发病高SMR地区主要分布在南疆的喀什、和田、阿克苏3个地区,具体表现在英吉沙县、泽普县、于田县等10余个区(县)。5年间,新疆涂阳肺结核SMR平均值在0.9~2.0之间上下波动,2011—2014年在波动中持续下降,2015年有小幅上涨。从宏观上看,新疆SMR整体呈现一个好转的趋势,高SMR地区范围逐渐缩小,符合新疆结核病发展分布趋势。但新疆肺结核防控工作任务仍然十分艰巨,需要进一步强化和完善各项防治政策,落实各项防治措施。

图1~5 2011—2015年新疆涂阳肺结核SMR时空分布

图6~10 2011—2015年新疆涂阳肺结核SMR普通克里金估计值

图11~15 2011—2015年新疆涂阳肺结核SMR经验贝叶斯克里金估计值

二、克里金插值在估计疾病风险中的应用价值

克里金插值法可对所研究的对象提供一种最佳线性无偏估计,利用半方差函数图将统计相关性的强度作为距离函数来测量。本研究用涂阳肺结核SMR数据库分别建立普通克里金和经验贝叶斯克里金模型。建模发现SMR分布与实际分布基本一致,误差服从正态分布,估计图、误差图均提示两个模型拟合度较为理想。进行交叉验证比较,采用均方根误差指标评价两模型拟合度,从估计值和真实值的离散程度上来说,经验贝叶斯克里金法(RMSE范围在0.382~0.484)略优于普通克里金法(RMSE范围在0.379~0.522),拟合度更加符合实际分布。

克里金插值估计图可直观展现新疆涂阳肺结核SMR阶梯式变化,两模型均提示在北疆与南疆之间存在一条与天山山脉走向较为相似的分隔带。天山山脉将新疆分为南北两大部分,南、北疆在海拔、气候、经济、卫生等方面差异明显。南疆地区全年降水量一般不足100 mm,远低于北疆,且沙漠化现象严重[11]。西部大开发以来,随着新亚欧大陆桥的开通,北疆经济迅猛发展,南北疆经济差距不断扩大,“十二五”期间,天山北坡经济带建立,作为我国14个重点开发区之一,一直是新疆的重点开发区,是新疆经济实力最强、城镇最集中分布的区域,这也进一步扩大了地区经济差异[12]。研究表明,环境因素、经济因素对结核病的发生发展有着实质性影响,国内外肺结核疫情报告中多有报道,经济水平低下地区、自然条件恶劣地区的结核病的发病率较高[13]。

克里金插值作为一种局部估计方法,对估计值的整体空间相关性考虑不够,其能保证数据的估计局部最优,却不能保证数据的总体最优,因为克里金估值的方差比原始数据的方差要小。因此,当数据点较少且分布不均时可能会出现较大的估计误差。此外克里金插值法作为内插方法,为减小估计方差而对真实观测数据的离散性进行了平滑处理,虽然可以得到由于平滑而更美观的等值线图,但一些有意义的异常带也可能被平滑作用而平滑掉[14]。在本研究的数据上也有体现,具体表现为经过克里金处理后,新疆涂阳肺结核SMR的估计值跟实际值比较起来有较为明显的下降,波动范围缩小。但克里金法通过有限的离散点数据,研究了整个区域的分布特征,直观地反映了变量的空间结构性;并初步提供了未来新疆地区结核病防范的重点区域,为及时调整或完善防控措施提供线索和依据,对未来新疆结核病的防治有着重要意义。

猜你喜欢

插值贝叶斯克里
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
大银幕上的克里弗
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
你今天真好看
你今天真好看
基于pade逼近的重心有理混合插值新方法
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
混合重叠网格插值方法的改进及应用