APP下载

新冠肺炎对气候因素响应研究中的模型应用比较

2020-02-28叶萃玉王昊宁吕佳宁黄利亚曾祥伟王晓龙

牡丹江医学院学报 2020年6期
关键词:线性气象效应

叶萃玉,王昊宁,吕佳宁,黄利亚,曾祥伟,王晓龙

(1.东北林业大学野生动物与自然保护地学院;2.黑龙江省野生动物疫源疫病与生物安全管控重点实验室,黑龙江 哈尔滨 150040;3.哈尔滨学院地理与旅游学院,黑龙江 哈尔滨 150086;4.长白山科学研究院,吉林 安图 133613)

新型冠状病毒肺炎(COVID-19)是由新型冠状病毒(SARS-CoV-2)引起的一种新发人畜共患传染病,已在全球范围内引起了广泛的传播。该病不仅严重威胁人类的生命健康,也可感染多种动物(狗、猫、老虎、狮子、水貂)。根据世界卫生组织(WHO)7月22日公布的最新疫情报告显示,全球COVID-19确诊病例达14765256例,死亡病例达612054例[1]。目前,国内外专家、学者都在各自领域内积极探索控制疫情的措施、安全有效的救治方法。许多研究表明,气象因素与传染病的发生和传播密切相关[2-3]。例如,气温与严重急性呼吸综合征(SARS)的传播有关[4];在寒冷、干燥的空气中,流感传播会增强[5]。因此,在没有特效药物和商品化疫苗[6]的情况下,加强对SARS-CoV-2生存、传播条件等非生理性影响因素的研究具有重要意义。

1 新冠肺炎对气候因素响应研究中的模型应用

1.1 线性回归模型线性回归模型(Linear Regression Model,LRM)是统计学中最基础、应用最为广泛的数学模型[7],按照研究变量的数量可分为一元线性回归(Unary Linear Regression Model)模型和多元线性回归模型(Multiple Linear Regression Model)。多元线性回归模型一般用于研究多个自变量与因变量之间的线性关系,相较于只研究单一变量的一元线性回归模型而言,多元线性回归模型的优势是:适用范围更广泛和预测结果更可靠。但LRM也有一定的局限性:数据适用范围窄、不能有效描述非线性关系。Yao等[8]采用多元回归方法来探讨气温、相对湿度、紫外线辐射与COVID-19同期发病率和R0(在完全易感人群中由初始感染个体产生的继发病例的预期数量)的关系。Auler等[9]以巴西确诊病例最多的5个城市为研究对象,对每个城市的绝对湿度与传播率进行了线性回归分析,以确定每个城市气候条件的特殊性及该条件如何影响COVID-19的传播。

1.2 广义线性模型广义线性模型(Generalized Linear Model,GLM)是线性模型的推广,引入连接函数,扩展了一般线性模型中因变量的适用范围,进一步克服了线性回归模型的缺点[10]。Liu等[11]在控制人口迁移的同时,利用GLM探讨了中国除武汉外另30个省会城市的气象因素与COVID-19累积病例数之间的关系。Ujiie等[12]采用基于Poisson分布的GLM,将中国入境的游客数量作为额外变量,来分析日本各地累积患病数与气温的关系。其优势体现在扩大了线性模型在实际问题中的应用范围,但也有一定的局限性:模型中只包括固定效应。

1.3 混合模型近年来,计算机技术快速发展,混合模型(Mixed Model)在数据分析领域逐渐得到了更为广泛的应用。当模型中的固定效应不能完全解释区域差异时,需引入随机效应,以增加建模的准确性[13]。即混合模型的优势为:既包括固定效应又包括随机效应,可以灵活有效地将不同来源的信息进行组合、分析。按照模型中响应变量的类型,混合模型可分为线性混合模型和广义线性混合模型。(1)线性混合模型:线性混合模型(Linear Mixed Model,LMM)是在一般线性模型中加入了随机效应,其优势为同时包含固定效应和随机效应,且固定效应及随机效应均与响应变量呈线性关系。许多相关研究使用LMM将气象因素与可能影响COVID-19传播的其他因素,如人口密度、政府卫生支出、医院床位数量等一同纳入研究,并加入随机效应项,如国家/地区层面影响等[14-15]。相较而言,LMM的拟合程度要优于线性回归模型,在处理带有随机效应问题时具有优势。(2)广义线性混合模型:广义线性混合模型(Generalized Linear Mixed Model,GLMM)是GLM和LMM的扩展[16-17],其优势体现在既使因变量不再要求满足正态分布,也可同时包含固定效应和随机效应。Mao等人[18]分别计算月平均气温、最低气温和最高气温的日平均值与累积病例数之间的关系,建立GLMM,该研究首次发现温度对COVID-19传播有显著影响,二者之间可能存在非线性的关系。

1.4 广义加性模型广义加性模型(Generalized Additive Model,GAM)是对GLM的拓展,可拟合因变量与自变量间的非线性关系[19-20]。其优势在于降低了线性设定带来的模型风险,可以灵活研究变量间的复杂关系[21]。近期,GAM被广泛用于相关研究中,使用GAM对COVID-19感染病例数、死亡病例数与地理变量(气候因子、地形、人口密度等)进行研究,在分析气象因素的同时还可考虑与非气象因素间的关系,增加了研究结果的可靠性[22-25]。相对于简单线性GAM而言,对数线性GAM将参数进行对数转换,可显著提高了模型的性能,使预测精度显著提高[26]。

1.5 分布滞后非线性模型分布滞后非线性模型(Distributed Lag Non-linear Model,DLNM)是以GLM和GAM为基础,利用交叉基函数给暴露-效应关系增加滞后效应后建立的暴露-滞后-效应关系函数[27]。其优势在于可以同时评估暴露因素的非线性效应和滞后效应。Shi等人[28]使用DLNM来探究每日平均温度与COVID-19每日确诊病例之间的暴露-滞后-效应关系,将交叉基函数用于温度,结果表明温度与COVID-19日发病率之间存在明显的时滞关系。

2 国内外相关研究差异性分析

目前,在COVID-19的病例数据与同期气象因素的分析研究中,应用最为广泛的是数学建模的方法。用GLM来分析COVID-19病例数与气象因素的关系,可以引入自首次报告病例以来的时间、迁徙规模指数等因素。相较于线性回归模型而言,扩大了适用范围,准确性更高。混合模型既包括固定效应又包括随机效应,可以灵活有效地分析不同来源的信息。使用LMM和GLMM不仅可以将气象因素与可能影响新冠传播的其他因素一同纳入研究,而且可加入随机效应项,在处理带有随机效应问题时具有优势。GAM可灵活地探究数据间的线性和非线性关系,同时考虑气象因素和非气象因素,增加研究结果的可靠性。DLNM虽然考虑了气象因素对COVID-19传播影响的滞后效应,同时评估出暴露因素的非线性效应,但却没有考虑温度以外的其他气象因素和非气象因素。选用模型的不同是造成国内外相关研究差异性的重要原因。有些数学模型的分析过程虽然相对复杂,但可纳入研究的因素更多,模拟、预测的效果也较好。显然,除了气象因素会影响COVID-19流行、传播外,人为干预等非气象因素也不可忽视。

3 讨论

COVID-19疫情还在全球范围内蔓延,对气候因素与COVID-19流行的关系探索也仍在继续。虽然国内外的研究人员已对此进行了大量研究,取得了一些具有参考意义的研究成果,但仍有许多问题需要进行深入研究。现有研究的局限性是多方面原因造成的,其中,模型选取的不同是一个重要原因。一方面,不同的模型具有不同的特点和优势,分析方法和原理也不尽相同。另一方面,有的研究在模型中对人为因素加以控制,而有的研究却未考虑。鉴于COVID-19是一种高度传染性疾病,可通过多种传播途径进行传播,因此,政府控制措施、人员流动等人为干扰因素,会对该病的流行、传播产生较大的影响。要保证研究结果的可靠性、减少研究的局限性,就需在研究过程中选择合适的模型,将重要的气象因素及非气象因素加入模型进行研究,从而增加结果的可靠性、科学性。

猜你喜欢

线性气象效应
渐近线性Klein-Gordon-Maxwell系统正解的存在性
气象树
铀对大型溞的急性毒性效应
《内蒙古气象》征稿简则
线性回归方程的求解与应用
懒马效应
二阶线性微分方程的解法
大国气象
美丽的气象奇观
应变效应及其应用