APP下载

新疆喀什地区疏附县肺结核与气象因素和大气污染物关联研究

2024-03-02美合日班买买提买吾拉江依马木卢冬梅郑彦玲张学良彭晓旺

临床肺科杂志 2024年3期
关键词:位数肺结核气象

美合日班·买买提 买吾拉江·依马木 卢冬梅 郑彦玲 张学良 彭晓旺

结核病(tuberculosis TB)是一种由结核分枝杆菌引起有传染性的慢性呼吸系统疾病,是危害人群健康的重大传染病之一[1],也是全球范围内的重大公共卫生事件,以肺结核多见。肺结核的发生和发展与多种因素有关,除了饮酒、吸烟、AIDS、免疫力低下等还与气象因素和大气污染物等有关[2],有专家研究发现肺结核发病与气象因素和大气污染物有关[3]。在已有的传染性疾病影响因素研究中,目前使用较多的方法有Logistics回归、多元线性回归、主成分回归和分位数回归等。而本研究中用主成分和分位数回归方法分析研究气象因素和大气污染物对当地肺结核发病的影响并量化其风险。分位数回归模型是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法,最早是由Koenker和Basset于1978年提出的[4],提供了回归变量X和因变量Y的分位数之间线性关系的估计方法,强调条件分位数的变化。与线性回归相比,分位数回归得到的是一簇曲线而不是一条曲线,更能反映变量间的关系[5,6]。

资料与方法

一、数据来源

2019年1月1日至2021年12月31日喀什地区疏附县肺结核发病数据来源于新疆喀什地区疾病预防控制中心,空气污染指标(细颗粒物PM2.5,粗颗粒物PM10,一氧化碳CO,二氧化硫SO2,臭氧O3,二氧化氮NO2,空气质量指数AQI)和气象数据(平均气温 Temp,平均相对湿度RH,平均风速WS)来源于中国气象数据网。

二、分析方法

1. 主成分分析

在影响肺结核发病的几个相关性较高的线性相关因素中提取几个主成分,提取的主成分里包含原始数据的绝大部分信息。具体过程如下:首先将原始变量数据标准化,计算相关系数矩阵;之后求出相关系数矩阵的特征根,特征向量和方差贡献率,取累计贡献率大于90%以上的特征根的主成分并根据分析问题确定主成分个数,本研究提取4个主成分记作C1、C2、C3和C4。

2. 分位数回归

分位数回归是一种基于因变量的条件分布来拟合自变量的线性函数的回归方法,可以选任意一分位数点进行参数估计,能提供更全面的条件分布信息,估计结果更加稳健。一般形式为:

其中yit表示第t时期第i个个体被解释变量的观测值,Xit则是解释变量的观测值。Xit表示不同分位数τ下的模型截距。

3. 主成分分位数回归

主成分分位数回归是将主成分分析与分位数回归结合起来,利用最后用提取的4个主成分代替原始自变量建立分位数回归模型并做分析。

三、统计学方法

用SPSS软件主成分分析方法提取原始自变量的几个不相关的主成分,将提取的主成分作为自变量,肺结核每周发病例数作为因变量进行分位数回归分析。用R软件建立分位数回归模型分析自变量在不同分位点自变量对因变量的回归,并计算各分位点参数估计的系数和检验的P值,P<0.05表示具有统计意义。

结 果

一、描述性统计及相关性分析

2019年1月1日-2021年12月31日期间,喀什地区疏附县肺结核发病总人数2090人,重点研究分析的影响因素包括气象因素(Temp,RH,AQI,WS)和大气污染物(CO,NO2,O3,PM10,PM2.5,SO2)等,为了验证各影响因素之间是否有相关关系进行Spearman相关性分析,结果显示除了变量AQI、PM2.5与RH和CO、WS、NO2与PM10之间没有相关关系外,其余变量之间均有相关关系,且有统计学意义(见表1)。

表1 各变量间的相关性分析

二、主成分分析及表达式

1. 主成分分析

经主成分分析相关矩阵结果显示,变量AQI、PM2.5与RH和CO、WS、NO2与PM10相互之间没有相关关系外,其余自变量之间均有相关关系,考虑到自变量之间的相关性可能导致分位数回归建模时会出现伪回归现象,因此本研究考虑先利用主成分分析对自变量提取主成分,提取的主成分包含大部分原始自变量的信息;由(表2)可知前四个主成分C1=-0.379ZTemp+0.237ZRH-0.344ZWS+0.256ZAQI+0.374ZCO+0.355ZNO2+0.183ZPM10+0.288ZPM2.5+0.292ZSO2+0.385ZO3;C2=0.176ZTemp-0.367ZRH+0.176ZWS+0.483ZAQI-0.179ZCO-0.138ZNO2+0.568ZPM10+0.442ZPM2.5-0.027ZSO2+0.043ZO3;C3=0.028ZTemp-0.535ZRH+0.358ZWS-0.062ZAQI+0.262ZCO+0.242ZNO2-0.147ZPM10-0.130ZPM2.5+0.640ZSO2+0.080ZO3;C4=-0.190ZTemp+0.387ZRH+0.009ZWS+0.156ZAQI-0.004ZCO-0.609ZNO2+0.038ZPM10-0.020ZPM2.5+0.533ZSO2+0.363ZO3对应的特征根的累积贡献率达到92.867%,为此本研究抽取了四个主成分分别记作C1、C2、C3和C4。

表2 提取主成分的特征根分析

2. 主成分表达式

(表2)中特征根累计贡献率可以看出,第一主成分和第二主成分包含了Temp、WS、CO、NO2、O3、RH、AQI、PM2.5和PM10等原始变量79.885%的信息,四个主成分共包含了原始变量92.867%的信息,结合特征根及四个主成分矩阵系数,得出这四个主成分的表达式,其中Z代表标准化,例如:ZTemp表示标准化的温度变量。

三、主成分分位数回归分析

用四个主成分和每周肺结核发病数据分别作为自变量和因变量建立分位数回归模型,结果显示(见表3)截距随着分位点的增大也逐渐变大并且在不同分位点P值均小于0.01,有显著统计学意义;主成分C1包含Temp、WS、CO、NO2和O3等原始自变量的信息,分析发现C1在0.3和0.6分位点以外的其他分位点P值均<0.05,有显著统计学意义;主成分C2包含RH、AQI、PM2.5和PM10等自变量的信息在0.1至0.6分位点P值<0.05,有统计学意义,主成分C3包含风速的信息在0.1至0.6分位点P<0.05,有统计学意义;主成分C4在任何分位点均没有统计学意义。

表3 基于主成分的分位数回归分析结果

(图1)是不同分位点模型拟合曲线的比较,横坐标表示自变量,纵坐标表示肺结核发病例数。可以看出随着分位点增加,模型拟合曲线逐渐呈上升趋势,肺结核发病数也随之增加。0.9分位点处较明显,肺结核发病例数较高。而(图2)是四个主成分参数估计系数随着不同分位点的变化情况及置信区间,图中显示,主成分C1的系数随着分位点的增大呈现下降趋势,而(表3)C1主要体现的Temp、WS、CO、NO2和O3的信息,系数都为负,说明当Temp、WS、CO、NO2和O3含量越低时肺结核发病数增加;主成分C2系数随着分位点的增大而增大,C2主要体现的RH、AQI、PM10和PM2.5的信息,在(表3)中C2系数都为正,说明当RH、AQI、PM10和PM2.5的含量越高肺结核发病数越多;主成分C3的系数随着分位点的增大而增大,C3主要包含SO2的信息,说明当空气中SO2含量越高肺结核发病数呈上升趋势;主成分C4的系数随着分位点的增大呈逐渐下降再上升的趋势,而C4包含NO2的信息,说明当空气中NO2含量变化时肺结核发病数也相应增加。

图1 不同分位点拟合曲线的比较

图2 四个主成分C1,C2,C3及C4的系数随着分位点的变化情况和置信区间

讨 论

喀什地区疏附县位于中亚腹部,因地理环境的约束,属暖温带大陆性干旱气候带。疏附县常年四季分明、光照时日长、温差较大,降水量稀少,蒸发较为旺盛。夏季气候炎热,但持续时期短;冬季无严寒,但低温期长;春夏多见大风、沙尘暴天气。因地形复杂,气候差异较大,而肺结核也是喀什地区疏附县多发病之一[7,8]。2019-2021年期间由于新型冠状病毒的大流行对全球结核病的疫情防控产生重大影响。从短期来看,对新冠肺炎疫情地区患者就诊、良好医疗服务的可及性等方面产生了显著的负面影响,结核病患者发现和治疗管理需要较长时间才能恢复至日常水平[9]。从长期来看,虽然新冠肺炎与结核病之间在临床、流行病学和疾病防控等方面尚需深入研究,且必然会相互关联和影响[10],但同样作为呼吸道传染病,两种疾病在服务体系、政策保障和科学研究等方面可以相互学习借鉴和相互支持。近年来在结核病相关部门大力的防控措施下,肺结核发病有下降的趋势,但要终止结核病的目标,相关防控措施还是需要不断加强。

本研究结合主成分分析与分位数回归模型等方法,分析了Temp、RH和WS三种气象因素和AQI、CO、O3,NO2、PM10、PM2.5、SO2等空气污染物对肺结核发病的影响,相关性分析表明除了变量AQI、MP2.5与RH和CO、WS、NO2与PM10之间不相关以外,其余自变量均有相关关系,且气象因素和大气污染物与肺结核发病也密切相关;分位数回归模型分析发现,温度、风速、CO、NO2和O3对肺结核发病呈负相关关系,表明在温度和风速较低,CO、NO2和O3浓度也较低时肺结核发病数会增加肺结核发病风险,肺结核发病数增加;可能原因是当环境温度较低、CO、NO2和O3浓度较低时,在外环境中不易发现,人群很容易暴露于污染物环境下,从而引起疾病传播。在曹赋[2]等人研究发现当温度、风速和CO、NO2和SO2等因素低于或高于某个阈值时会对肺结核发病产生影响,其中也包括滞后效应;而AQI、PM10和PM2.5等因素则是浓度越高对肺结核发病风险越大,这与大多数研究结果相似。

本研究以气象因素和空气污染物数据建立分位数回归模型分析其对肺结核发病的影响,根据研究结果为新疆相关结核病防控工作提供可参考的依据。根据研究结果,当温度和风速较低,污染物CO、NO2和O3含量较低会增加肺结核发病风险,为有效保护自己免于暴露于污染物,可在外出时戴上防菌口罩,进入室内勤洗手;当空气中PM2.5,PM10,RH和AQI含量较高时,空气质量较差,尽量避免接触外环境中的污染物。还需要了解肺结核发病相关卫生知识,保护自己以及他人的健康尤为重要。

猜你喜欢

位数肺结核气象
气象树
《内蒙古气象》征稿简则
五次完全幂的少位数三进制展开
爱情是一场肺结核,热恋则是一场感冒
大国气象
美丽的气象奇观
蒙西医结合治疗肺结核进展
疣状皮肤结核合并继发型肺结核1例
遥感卫星CCD相机量化位数的选择
82例初治与复治肺结核患者HBsAg携带率调查