基于分布滞后非线性模型的归因风险评估方法及应用*
2017-01-10宁波市疾病预防控制中心315010谷少华贺天锋陆蓓蓓徐倩倩梅秋红张思恒
宁波市疾病预防控制中心(315010) 谷少华 贺天锋陆蓓蓓 徐倩倩 梅秋红 张思恒
基于分布滞后非线性模型的归因风险评估方法及应用*
宁波市疾病预防控制中心(315010) 谷少华 贺天锋△陆蓓蓓 徐倩倩 梅秋红 张思恒
目的介绍基于分布滞后非线性模型的归因风险评估方法,并运用该方法评估宁波市气温暴露造成人群死亡的归因风险。方法分布滞后非线性模型通过交叉基函数实现同时描述因变量在自变量维度与滞后维度的分布,使其能够同时评估出暴露因素的滞后效应和非线性效应。收集宁波市2009-2014年人群死亡和气象资料,利用时间序列分析结合分布滞后非线性模型,评估气温造成人群死亡的归因死亡人数和人群归因分值。结果宁波市2009-2014年日均气温与总死亡的累积暴露-反应关系曲线近似呈L型,26℃为最适宜温度。归因于气温暴露造成的死亡人数为29037例(95%CI:19181~38074),占总死亡的13.39%(95%CI:9.19%~17.49%)。低温的归因风险大于高温,归因死亡人数分别为27088例和1977例,归因分值分别为12.49%和0.91%。结论无论高温或低温均与人群死亡增加相关,低温的归因风险更大。
归因风险 分布滞后非线性模型 气温 死亡
随着极端天气和空气污染事件不断增多,研究者越来越关注气温或大气颗粒物等环境暴露因子对人群健康的影响,其中开展环境因素的归因风险评估是流行病学研究中的重要环节。根据暴露因素与健康结局的关联程度,结合暴露人群数量和暴露水平,能够评估出暴露因素造成的人群归因风险,这个指标比以往研究中采用的相对危险度(relative risk,RR)或比值比(odds ratio,OR)更能反映出整体疾病负担[1]。但是,由于气温或大气颗粒物与健康结局的暴露-反应关系往往呈非线性关系,同时效应又存在滞后性和持续性,这些特征对准确评估归因风险提出了挑战[2-3]。Gasparrini等基于分布滞后非线性模型提出了新的归因风险评估方法,能够同时拟合暴露-反应关系的非线性效应和滞后效应,为开展环境因素的归因风险评估提出了新的思路[4-5]。本研究将对此方法的基本理论进行介绍,并运用此方法开展宁波市气温对人群死亡影响的归因风险评估。
原理与方法
1.归因风险计算方法
归因风险的基础指标是人群归因分值(attribute fraction,AF),表示如果人群不再暴露于某风险因子,相应健康结局减少的数量占该健康结局的比例[6]。如果已知健康结局的总数和人群归因分值,则可计算出归因人数(attribute numbers,AN),这些指标同样可理解为对风险因子采取干预措施后可以达到的效果。对于最简单的二分类暴露模式(暴露或非暴露),效应指标可用相对危险度(RR)表示,人群归因分值基本计算公式如下[1,6]:
其中Pe表示人群暴露于待研究因素的比例,对于全人群暴露(如空气污染或气温)的风险评价,可认为Pe为1。公式简化为[1,5]:
βx为暴露因素x的回归系数。
由于人群暴露于某风险因子通常是一个持续的过程,评估时可以将暴露分为不同的水平,分别计算相对于基线暴露水平时人群的风险,然后进行风险累加。则公式修正为[5-6]:
RRi为和基线水平相比,各暴露水平下的相对危险度;βxi为暴露水平为i时的效应参数,当暴露-反应关系为线性时,可表示为回归系数(β)和暴露水平(xi)的乘积。
2.分布滞后非线性模型(distributed lag non-linear model,DLNM)
由于人群健康不仅受到当天环境因素的影响,还可能与几天前的暴露水平有关,为了评估这种滞后效应,Zanobetti[3]和Armstrong[2]等人开始将分布滞后模型运用于空气污染或气温等环境因素短期效应研究中。在以往研究基础上,Gasparrini等[4,7]利用交叉基(cross-basis)函数阐述了分布滞后非线性模型的理论,本文将对此模型进行简要介绍。
模型的基本结构如下:
g为链接函数族;Y为结局变量;xi为自变量;fj为自变量xi的各种基函数,如线性阈值函数或样条函数等;μk为其他混杂因素;βj和γk为方程中相应的参数。
如果自变量和因变量的暴露-反应关系用函数f(x)表示,滞后-反应关系用w(l)表示,将两个函数合并即可得到双维度的暴露-滞后-反应关系函数f·w(x,l),计算过程中f·w(x,l)可以简化表达为βxt,l。因此,自变量不同滞后时间的累积风险s(xt;η)计算公式如下:
η为方程中相应的参数,L为最大滞后时间。
分布滞后非线性模型通过交叉基函数给暴露-反应关系添加滞后维度,实现同时描述因变量在自变量维度与滞后维度的分布,使其能够同时评估出暴露因素的滞后效应和非线性效应。此外,通过累积效应的计算能够发现效应最低时的暴露水平,称最适宜暴露水平,可以作为归因风险评估的基线水平[5]。
3.基于DLNM的归因风险计算方法
Gasparrini等[5]认为可以通过两种方式计算滞后效应,第一种是“从后往前看”,认为第t天的风险是前一段时间(t-l0,…,t-L)暴露效应的累加,可称为“后向视角(backward perspective)”;第二种是“从前往后看”,认为第t天的暴露造成了未来一段时间(t+l0,…,t+L)的风险,称为“前向视角(forward perspective)”。结合分布滞后非线性模型的原理,归因分值和归因人数的计算公式修改如下[5]:
后向视角:
前向视角:
L为暴露因素的最长滞后时间;nt为第t日的人群某健康结局发生总数。
“后向视角”是研究中常用的对滞后效应的解释[2,4],但是其计算过程较为复杂。“前向视角”的原理和计算均较为简单,但是由于在计算归因人数时,nt采用了滞后期间总健康结局人数的平均值,因此可能会低估实际的风险大小[5]。实例分析中将主要报告“后向视角”的计算结果,同时比较两种计算方法的差异。
应 用
宁波市2009年1月1日至2014年12月31日人群逐日死亡数据来源于宁波市疾病预防控制中心,同期的气象资料来源于宁波市气象局。利用Excel 2013软件进行数据整理,变量包括逐日的人群总死亡数(death)、日均气温(temp)、日均相对湿度(rh)、日均气压(press)、日期(date)、时间变量(time)、星期几(dow)等,资料保存名称为“NBdeath2009-2014.csv”,数据整理格式见表1。
表1 宁波市2009-2014年数据整理情况(前10条记录)
利用R软件(3.1.1版本)中的“dlnm”程序包评估气温对总死亡的归因风险,首先通过分布滞后非线性模型计算出气温与死亡的暴露-滞后-反应关系,再根据累积效应最小判断出最适宜气温作为基线评估水平,结合宁波市的总死亡人数和温度分布范围,最终评估出气温造成的人群归因分值和归因总死亡人数[5,8]。基本模型选择广义线性模型,通过时间变量(time=1,2,3,…,2191)控制死亡人数的长期变化趋势和季节趋势,并控制了相对湿度、气压、星期几效应等混杂因素的影响。根据以往文献,选择日均气温作为气温的代表指标,基函数选用自然三次样条函数(nature cubic spline),最长滞后时间为14天,时间变量的自由度7/年,交叉基函数中的自由度利用赤池信息准则(Akaike information criterion,AIC)确定[4-5,8]。主要编程代码如下:
研究发现宁波市2009-2014年日均气温和总死亡的关联有统计学意义(P<0.05),累积暴露-反应关系曲线近似呈L型,26℃为最适宜温度,约在全年气温的第78百分位。高温的效应出现早,持续时间短,滞后时间约为0~2天;低温的效应出现晚,持续时间长,滞后时间约为2~10天。以最适宜温度作为参考,气温第1百分位和第99百分位累积0~14天的相对危险度分别为1.51(95%CI:1.32~1.72)和1.15(95%CI:1.06~1.25),低温的效应大于高温,见图1。
图1 日均气温与总死亡的暴露-反应关系
采用“后向视角”评估方法,日均气温26℃作为基线暴露水平,累积滞后0~14天时,宁波市2009-2014年归因于气温暴露造成的死亡人数为29037例(95%CI:19181~38074),占总死亡的13.39%(95%CI:9.19%~17.49%);高温和低温的归因总死亡人数分别为1977例和27088例,归因分值分别为0.91%和12.49%。如图2所示,当只分析高温与总死亡的关系时,“前向视角”计算的归因死亡人数随气温波动而波动,且均大于或等于零;而“后向视角”的计算结果则比气温的变化较为滞后,数值波动更大,并出现小于零的情况。但是,两种评估方法的最终归因风险结果非常接近,“前向视角”的结果偏小,详情见表2。
讨 论
本研究发现无论高温或低温均与人群死亡增加相关,但是归因于低温效应的比例(12.49%)明显大于高温的作用(0.91%)。两者效应的差异可能是由于影响机制不同,高温能够引起机体心率升高、血液粘度增加、水盐代谢失调等改变,效应出现快且持续时间短;而低温则主要引起血管收缩、血压改变、炎症反应等,效应持续时间较长,造成的影响可能也更大[8-9]。同时部分文献也发现,随着人们采取更多的适应措施,一些地区高温的效应可能正在不断降低,而低温的效应则相对稳定[10-11]。气候条件、经济水平、人群特征、生活习惯等原因均有可能导致不同地区气温归因风险差异,宁波市气温的人群归因分值(13.39%)高于中国的其他城市(11.00%)[8],这提示宁波市人群对气温可能更为敏感,当地政府需要对此投入更多的关注。
图2 宁波市2009年6-9月高温的归因总死亡人数和气温分布趋势
尽管气温的累积效应均为正值,但是“后向视角”评估出高温造成的归因风险出现了负值,这可能是由“收获效应(harvest effect)”导致的。一次极端高温短时间内会造成大量人群死亡,其中多为老年人、慢性病患者等脆弱人群,这些人群的死亡使得一段时间内整个人群中脆弱人群的比例降低,人群对气温变化的敏感程度也随之降低,称为“收获效应”,这种现象也在以前的多次研究中被提到[5,8]。“前向视角”则无法观测到这种现象,由于其可能低估风险大小,因此不适宜用于整体归因风险评估。但是,“前向视角”的原理和计算方法简单,容易评估出不同暴露范围(如高温或低温)对健康影响的差异,因此比较适用于分段风险评估[5]。
表2 不同研究方法中的人群归因分值(AF)和归因总死亡人数(AN)及其95%置信区间
基于分布滞后非线性模型的归因风险评估方法能够同时考虑暴露因素的滞后效应和非线性效应,这种方法同样可以应用于评估空气污染或其他环境因素对健康的影响,还可推广到任何探究预测变量与结局关系的时间序列研究[7]。通过疾病负担评估能够提高人们对暴露因素危害的认识,并为决策者进行健康效益分析,制定相应的防护策略提供理论依据。
[1]Steenland K,Armstrong B.An overview of methods for calculating the burden of disease due to specific risk factors.Epidemiology,2006,17(5):512-519.
[2]Armstrong B.Models for the relationship between ambient temperature and daily mortality.Epidemiology,2006,17(6):624-631.
[3]Zanobetti A,Wand MP,Schwartz J,et al.Generalized additive distributed lag models:quantifying mortality displacement.Biostatistics,2000,1(3):279-292.
[4]Gasparrini A,Armstrong B,Kenward MG.Distributed lag non-linear models.Statistics in medicine,2010,29(21):2224-2234.
[5]GasparriniA,Leone M.Attributable risk from distributed lagmodels.BMC medical research methodology,2014,14(1):55.
[6]Baker D,Nieuwenhuijsen M J.Environmental Epidem iology:Study Methods and Application.Oxford University,2008.
[7]杨军,欧春泉,丁研,等.分布滞后非线性模型.中国卫生统计,2012,29(5):772-773.
[8]Gasparrini A,Guo Y,Hashizume M,et al.Mortality risk attributable to high and low ambient temperature:a multicountry observational study.Lancet,2015,386(9991):369-375.
[9]Basu R.High ambient temperature and mortality:a review of epidem iologic studies from 2001 to 2008.Environmental health:a global access science source,2009,8(1):40.
[10]Barnett AG.Temperature and cardiovascular deaths in the US elderly:changes over time.Epidem iology,2007,18(3):369-372.
[11]Gasparrini A,Guo Y,Hashizume EM,et al.Temporal Variation in Heat-Mortality Associations:A Multicountry Study.Environmental health perspectives,2015,123(11):1200-1207.
(责任编辑:邓 妍)
M easures and App lication for Attributable Risk from Distributed Lag Non-linear M odel
Gu Shaohua,He Tianfeng,Lu Beibei,et al
(Ningbo Municipal Center for Disease Control and Prevention(315010),Ningbo)
ObjectiveTo introducemeasures of attributable risk from distributed lag non-linearmodel(DLNM),and to apply thesemethods for estimating themortality risk attributable to outdoor temperature in Ningbo city.MethodsDLNM is based on a cross-basis function that describes simultaneously the shape of the relationship along both the space of the predictor and the lag dimension of its occurrence,and could assess the potentially non-linear and lag effects.The daily data on mortality and meteorological factorswere collected from 2009 to 2014 in Ningbo city.A time series study using a DLNM was used to estimate the attributable number and fraction to the effectof temperature onmortality.ResultsThe overall cumulative exposure-response curve between temperature and mortality was L-shaped at lag 0~14 days,and the m inimum-mortality temperature was 26℃.In total,13.39%(95%CI:9.19%~17.49%)of totalmortality was attributable to outdoor temperature,while the attributable number was 29037(95%CI:19181-38074).More attributable deaths were due to cold,w ith a fraction of 12.49%corresponding to 27088 deaths,compared w ith 0.91%and 1977 deaths for heat.ConclusionBoth heat and cold were associated w ith an increased risk of daily mortality,and mostmortality burden were caused by cold.
Attributable risk;Distributed lag non-linearmodel;Temperature;Mortality
宁波市科技局创新团队项目(编号:2012B82018);浙江省公益技术应用研究计划(编号:2016C33194);浙江省医药卫生科技计划项目(编号:2014KYA202)
△通信作者:贺天锋,E-mail:469345174@qq.com