双变量响应模型在分析体质指数和年龄对心血管死亡的共同作用中的应用*
2021-07-07彭佳欢张金玲陈林利许慧琳秦国友
彭佳欢 张金玲 陈林利 许慧琳 李 俊 秦国友,4△
【提 要】 目的 应用双变量响应模型分析高血压人群中体质指数(body mass index,BMI)和年龄两个因素对心血管死亡(cardiovascular death,CVD)的共同作用。方法 使用上海市闵行区2007-2015年高血压患者随访数据,建立可加COX比例风险模型,分析BMI、年龄与CVD之间的非线性关联以及两变量的共同作用。结果 BMI、年龄与CVD的关联分别呈“U”型和“J”型。不同年龄,BMI对CVD的影响略有差异。青年和老年群体的死亡风险随BMI的增加而降低,中年群体的死亡风险与BMI的关联略微呈“U”型。结论 双变量响应模型是一种全面了解两变量共同作用的有效的方法。
体质指数与心血管死亡的关联在近些年来得到了广泛讨论。许多研究表明,BMI与CVD之间存在着非线性关联,低重、超重或肥胖都是CVD的危险因素[1-5]。此外,年龄的效应修饰作用也受到了重视,不同年龄阶段BMI对CVD的影响可能不同。有研究发现,BMI与死亡的关联在较年轻的群体中更强,最低死亡风险对应的BMI值在老年群体中更高[1,6-7]。因此,有必要讨论年龄与BMI的共同作用,以充分考虑是否应将年龄这一因素纳入健康体重建议[1,8]。大部分研究采用分层分析的方法综合考虑两个变量对结局的影响[1,6],但是分段处理显然损失了数据信息。要定量分析各因素与结局之间的非线性关联并全面了解两因素的共同作用,需要借助更高级的统计学方法[9]。
本文运用可加COX比例风险模型(additive COX proportional hazard model),首先建立单独暴露响应模型分析高血压人群中BMI、年龄对CVD的单独作用,然后建立双变量响应模型(bivariate response model)分析BMI和年龄对CVD的共同作用,为解决生存数据中两变量共同作用这一问题提供了一种新的思路和实现方法。
对象与方法
1.资料来源
本研究数据来源于上海市闵行高血压标准化管理系统,该系统记录了上海市闵行区自2007年以来高血压病人的健康状况。本研究纳入了2007至2015年共212394名高血压患者。
2.研究方法
为分析各因素与CVD之间的单独暴露-响应关系以及BMI和年龄的共同作用,分别建立暴露-响应模型和双变量响应模型,两种模型的建立皆可在可加COX比例风险模型中实现。可加COX比例风险模型是广义可加模型在生存数据中的应用,由协变量平滑函数的和组成,可同时考虑非线性关联和双变量的共同效应,比一般线性模型或COX回归模型有着更大的灵活性和方便性[10]。
为多角度反映BMI对CVD的影响,将BMI按WHO分类标准分为低体重(<18.5kg/m2)、正常体重(18.5~24.9kg/m2)、超重(25.0~29.9kg/m2)和肥胖(>30.0kg/m2),结合COX回归模型分析不同BMI类型与CVD的关联。本研究的终点指标为发生CVD,研究因素为BMI、年龄,调整的变量包括收缩压、舒张压、性别、高血压家族史、CVD家族史、中风家族史、糖尿病家族史、体育锻炼、吸烟、饮酒以及是否伴发糖尿病。
(1)单独暴露响应模型
为分析各因素对CVD的单独作用,建立如下暴露-响应模型:
β1gender+β2hishp+β3hiscvd+β4hisstro+β5hisdm+β6exercise+β7smoke+β8drink+β9dm
(1)
其中,h(t,X)是在危险因素X的影响下,t时刻的风险函数,h0(t)是所有自变量为0时,t时刻的基准风险函数。针对连续型变量:BMI、age、sbp、dbp建立样条函数,s(BMI)、s(age)、s(sbp)、s(dbp)分别表示BMI、年龄、收缩压和舒张压的薄板平滑函数,平滑函数的自由度皆设为4。分类变量:gender、hishp、hiscvd、hisstro、hisdm、exercise、smoke、drink、dm等直接纳入模型,分别代表性别、高血压家族史、CVD家族史、中风家族史、糖尿病家族史、体育锻炼、吸烟、饮酒和伴发糖尿病。
(2)双变量响应模型
为评估BMI和年龄对CVD的共同作用,加入双变量平滑函数,建立如下双变量曲面模型:
(2)
其中,s(BMI,age)为BMI和年龄的双变量样条平滑函数,自由度设为6,其他项及其自由度同模型(1)。加入双变量平滑函数避免了人为定义变量分类,同时还可评估两变量对结局的共同作用。BMI和年龄的共同作用不仅包括了各自的单独作用,还包括了二者的交互作用等更为复杂的关系。而模型(1)考虑的仅是BMI、年龄各自的单独作用,二者是简单的相加关系。可以看出,模型(1)是模型(2)的特例。为了可视化BMI与年龄的共同作用,可据此模型画出双变量暴露-响应曲面图。
3.软件实现
整个模型的建立可用R中的“mgcv”程序包实现,其中gam函数表明建立广义可加模型,连接函数选择cox.ph指明建立的是可加COX比例风险模型。重要程序如下:
model1<-gam(fol_yr~s(hpage,k=4,fx=T,bs=“tp”)+s(BMI,k=4,fx=T,bs=“tp”)+s(sbp,k=4,fx=T,bs=“tp”)+s(dbp,k=4,fx=T,bs=“tp”)+gender+hishp+hiscvd+hisstro+hisdm+exercise+smoke+drink+dm,family=cox.ph(link=“identity”),na.action=na.exclude,method=“REML”,weights=cvddeath)
plot(model1,pages=1,all.terms=TRUE)
model2<-gam(fol_yr~s(hpage,BMI,fx=T,k=6,bs=“tp”)+s(sbp,fx=T,k=4,bs=“tp”)+s(dbp,fx=T,k=4,bs=“tp”)+gender+hishp+hiscvd+hisstro+hisdm+exercise+smoke+drink+dm,family=cox.ph(link=“identity”),na.action=na.exclude,weights=cvddeath)
vis.gam(model2,theta=30,view=c(“hpage”,“BMI”),color=“heat”,col=NA,
cond=list(z=1),ticktype=“detailed”,xlim=c(20,85),ylim=c(14,40),
xlab=“age”,ylab=“BMI”,zlab=“Linear Predictor”)
结 果
1.基本情况
随访年数、BMI、年龄、收缩压和舒张压等连续型变量的基本描述见表1。在纳入的212394名高血压患者中,有99038名男性,113356名女性,14029名患者死于CVD,平均年龄为63.26岁,BMI为14~40kg/m2。低体重、正常体重、超重和肥胖分别占61.46%、2.41%、32.29%和3.84%。21.1%的人吸烟,21.2%的人饮酒,32.2%的人从不运动。有高血压家族史、CVD家族史、中风家族史、糖尿病家族史、伴发糖尿病的人分别占43.3%、2.7%、2.8%、5.6%、17.6%。
表1 连续型变量的统计描述
2.可加COX比例风险模型分析结果
(1)单独暴露响应模型
年龄、BMI单独作用的暴露-响应曲线如图1所示。可以看出,年龄和BMI均非线性地影响着CVD,平滑项皆有统计学意义(P均<0.001)。年龄与CVD的关联呈“J”型,最低死亡风险出现在40~45岁,45岁后死亡风险随年龄的增加而增加。BMI与CVD的关联呈“U”型,波谷在25kg/m2左右。结合COX回归模型,BMI与CVD的关联呈现出低体重(HR=1.42,P<0.001)和肥胖(HR=1.10,P=0.043)增加CVD风险,而超重(HR=0.96,P=0.048)是CVD保护因素的结果。
图1 年龄,BMI单独作用的暴露-响应曲线
(2)双变量响应模型
BMI与年龄共同作用的暴露-响应曲面图如图2所示。图2的(1)、(2)、(3)分别展现了三个角度的曲面图。由(1)可得,同一BMI下,死亡风险随年龄的增加而增加。由(2)可知,在青年(20~44岁)和老年阶段(60~85岁),同一年龄下死亡风险随BMI的增加而降低,低重比超重或肥胖有着更高的死亡风险。结合(2)、(3)可以发现,在中年阶段(45~59岁),对于同一年龄,BMI与CVD的关联略微呈“U”型。总之,不同年龄BMI带来的死亡风险略有差异,三维曲面图全面反映了随年龄变化,BMI对CVD作用的变化。
图2 BMI与年龄共同作用的暴露-响应曲面图
讨 论
本研究运用可加COX比例风险模型,探索了高血压人群中BMI和年龄与CVD的关联。结果发现,高血压人群中BMI与CVD的关联呈“U”型,最低死亡风险出现在25kg/m2左右,对高血压人群来说,低体重和肥胖都会增加CVD风险,但轻微超重或许不会增加死亡风险,该结果同之前的研究结果一致[12]。
本研究发现,不同年龄,BMI所带来的死亡风险存在差异。在青年(20~44岁)和老年阶段(60~85岁),死亡风险随BMI的增加而降低,低重比超重或肥胖有着更高的死亡风险,青年和老年高血压人群应更加注重防止出现低体重。而中年阶段(45~59岁),BMI与死亡风险的关联略微呈“U”型,中年高血压人群应注重保持在正常体质指数之内。双变量暴露-响应曲面图全面展现了BMI与年龄两因素间的相互影响,综合考虑了两个因素对CVD的作用。目前有关高血压人群中年龄对BMI与CVD关联的效应修饰作用的研究很少。有一研究采用分层分析的方法在这方面进行了讨论,对年龄分层后发现,40~60岁与60岁以上的人群中BMI与CVD的“U”型关联仍保留,故认为年龄没有显著的效应修饰作用[11]。本文应用的双变量响应模型不对数值变量做人为的分段处理,充分利用了数据信息,在同时考虑两变量与结局的非线性关联方面有着独特的优势。
本研究存在一些局限性。首先,我们没有控制反向的因果效应,慢性疾病、吸烟、饮酒等存在影响BMI的可能[12],本研究数据中有21.1%的高血压患者吸烟。研究表明,吸烟与低BMI和高死亡率有关,超重和死亡率之间的联系在包含吸烟者的研究中会减弱[13-14],这或可解释本文结果表现出的“U”型不明显即超重和肥胖风险较弱的现象。其次,值得注意的是,双变量暴露-响应曲面图的Z轴并非直接的死亡风险HR,由于本文重在介绍这一模型在分析共同作用中的应用,故没有进一步计算HR。
综上,本文运用可加COX比例风险模型,分析了各影响因素与CVD之间的非线性关联,并建立双变量响应模型探索了BMI和年龄两因素对CVD的共同效应。青年和老年高血压人群应更加注重防止出现低体重,中年高血压人群应注重保持在正常体质指数之内。