基于LASSO回归和Cox比例风险模型探讨血红蛋白与颈动脉斑块形成的关联
2024-04-12薛晶晶王海涛肖春红
薛晶晶,王海涛,贾 会,肖春红
心血管疾病为首要疾病负担的慢性疾病已经成为全球的“流行病”,造成了越来越多经济和社会负担,颈动脉斑块作为心血管疾病可检测的“病前症状”,其早期诊断、早期治疗的公共卫生学意义十分重要[1 - 5]。颈动脉斑块的形成和加重的危险因素包括诸多方面,与生活方式相关的多有特征及疾病均有关联,这种包含遗传和环境的危险因素组成了心血管疾病共有的危险因素[6 - 9]。而目前的研究多关注某一类或某一方面的危险因素,对于心血管传统危险因素以外的因素关注较少,血红蛋白(Hb)作为人体吸收氧气和排出二氧化碳的新陈代谢标志物,尚缺乏其与心血管疾病的关联和人群队列研究。最小化绝对收缩和选择算子(LASSO)回归算法可以最大程度的保留和筛选变量,常用于解决多因素分析的多维数据的处理[10]。因此,本研究利用海军青岛特勤疗养中心体检中心纵向体检数据资料,探讨颈动脉斑块形成的关键因子Hb并构建预测模型,通过Cox比例风险模型验证Hb与颈动脉斑块形成的关联及关联强度。
1 对象与方法
1.1对象 采用海军青岛特勤疗养中心体检中心体检数据,以2014年体检人群资料为队列随访基线,以2020年为随访时间终点,随访事件结局为该人群新发颈动脉斑块。研究经海军青岛特勤疗养中心医学伦理委员会审批,随访人群知情同意。
纳入标准:(1)某医院体检中医保固定体检人群;(2)2014年体格检查信息齐全者;(3)基线体检的未患有颈动脉斑块的人群。排除标准:(1)缺乏生理检测指标数据的患者;(2)2014年和2020年体检时没有进行超声检查颈动脉的患者;(3)失访人群。
1.2研究资料 收集患者包括年龄、性别、体质量指数(BMI)、吸烟、饮酒等人口社会学指标和血常规、血生化和维生素D等血样本等指标。对体检人群在空腹状态静息状态下采集外周静脉血,利用自动生化分析仪开展血常规、血生化检测。将所有患者的血红蛋白水平由低到高进行排序,并分为3组,分别为T1组(血红蛋白水平相对较低组)、T2组(血红蛋白水平相对适中组)、T1组(血红蛋白水平相对较高组)。
体检者通过过超声检查判定是否患有颈动脉斑块。超声波检查:采用彩色超声诊断仪(荷兰飞利浦EPIQ7/HD7XE;日本日立二郎神AVIusL),探头高频频率设定为5 ~ 12 MHz,由下而上横切扫描,纵切时测量血管后壁最大内中膜厚度及斑块的位置。根据文献[11]报道,将斑块定义为:颈动脉管腔局部中膜隆起厚度≥0.5 mm或血管后壁最大内中膜厚度≥1.6 mm。
1.3统计学处理 采用SPSS 24.0软件和Stats Empower和统计软件包“R”进行数据处理、分析、模型构建和验证。采用LASSO回归算法筛选与颈动脉斑块相关的影响因子及血清Hb水平,利用受试者工作特征曲线(ROC)评估诊断效能;采用Cox比例风险模型进一步评估筛选的影响因子及血清Hb水平是否为独立的危险预后因素。以P<0.05为差异有统计学意义。
2 结果
2.1老年体检人群基本情况 共收集1 132名研究对象,删除基线诊断患有颈动脉斑块101名,剔除随访结果和基线信息缺失15名,剔除失访39名,共有977名研究对象进入最终分析,其中男性523名(53.5%),女性454名(46.5%);年龄35 ~ 59岁,平均年龄(46.87 ± 7.39)岁。6年共新发颈动脉斑块326例,发病率为33.4%。血红蛋白三分类人群中性别、吸烟饮酒、BMI、血压、血脂、空腹血糖、谷丙转氨酶、肌酐和血小板等指标差异有统计学意义(P< 0.05)。见表1。
表1 2014年海军青岛特勤疗养中心体检人群一般特征[例
2.2血红蛋白与颈动脉斑块关联 将年龄、性别、吸烟、饮酒、收缩压、舒张压、总胆固醇、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、空腹血糖、谷丙转氨酶、肌酐、白细胞和血小板纳入进行LASSO回归分析,结果显示当变量数量为9个时,模型均方根误差最小,其对应的λ=0.011 3,筛选的颈动脉斑块影响因子分别为年龄、BMI、收缩压、总胆固醇、空腹血糖、尿酸、白细胞、血红蛋白和吸烟。见图1、2。
图1 LASSO筛选变量动态过程图
图2 纳入变量交叉验证参数λ的不同组合选择过程图
2.3LASSO回归筛选变量组合对颈动脉斑块发病的关联分析 利用LASSO模型筛选变量进行ROC分析,结果显示,该模型颈动脉斑块发病的曲线下面积(AUC)=0.762,提示包括血红蛋白的该组合模型对新发颈动脉斑块具有一定区分能力。见图3。
图3 LASSO回归筛选变量组合对颈动脉斑块发病预测效能的ROC曲线
2.4体检人群基线血红蛋白与颈动脉斑块发病风险的关联 调整年龄、BMI、收缩压、总胆固醇、空腹血糖、尿酸、白细胞和吸烟等因素后,Cox比例风险模型结果显示,以血红蛋白三分类T1组为参照组,T2和T3组体检人群发生颈动脉斑块的风险分别升高了68.6%(HR=1.686,95%CI=1.132 ~ 2.511)和75.8%(HR=1.758,95%CI=1.124 ~ 2.751),见表2。
表2 体检人群基线血红蛋白与颈动脉斑块发病风险的关联分析[HR(95%CI)]
3 讨论
目前,基于社区人群的颈动脉斑块形成的研究较少,而且以往关于颈动脉斑块相关性研究多采用logistic和Cox比例风险模型进行模型构建,如基于杭州健康体检人群开展的颈动脉关联研究,采用logistic回归方法,采用性别、年龄、血脂、肝功能等实验室检查构建诊断模型[12];基于医院患者人群构建的颈动脉斑块关联模型,通过Cox模型发现血脂指标尤其是血清脂蛋白可作为预测颈动脉斑块阳的重要辅助关联指标[13]。本研究基于体检人群纵向随访资料,应用LASSO回归和Cox比例风险模型筛选与颈动脉斑块新发有关的影响因素。
本研究结果发现,Hb与颈动脉斑块的发病密切相关,还能独立影响颈动脉斑块的形成。几乎没有关于Hb与颈动脉斑块的研究,这可能是两者的生理功能分属于不同的系统,临床医生很少关注两者的关联。一项针对社区老年妇女的研究表明,血红蛋白可以对心血管疾病产生影响,而且两者存在着显著的交互作用,这种联合作用对其他临床结局产生显著影响[14]。Hb与颈动脉斑块的可能关联也是并不存在直接关联,而是通过共同的症状或疾病形成统计学关联,这需要大样本的观察性研究进一步验证,但本研究发现的两者关联,可提示进一步研究两者联合作用及联合作用模式的假说。
本研究纳入的受试者来源于每年进行例行体检的自然人群,随访时间共计6年,从颈动脉斑块疾病病程时长,能较好说明Hb与超颈动脉斑块的相关性和独立影响,本研究存在的优势:(1)随访6年的纵向资料,Hb对超颈动脉斑块影响的因果时间顺序明确;(2)应用LASSO回归模型多维度筛选可能的影响因素;(3)通过Cox回归进一步验证LASSO回归筛选因子的稳定性。本研究还有一定局限:一是未能全部获取调查对象的临床资料;研究人群来自于某医院固定体检人群,样本代表性受限,结果无法外推。
综上所述,本研究通过体检人群纵向随访资料,应用LASSO回归筛选出了包含Hb在内的9个与颈动脉斑块新发有关的影响因素,通过Cox比例风险模型,进一步验证了Hb与颈动脉斑块的发病密切相关,提示较高的营养水平的人群是防控颈动脉斑块新发的重点人群。