APP下载

基于LASSO回归的冠心病患者发生心力衰竭的风险预测模型构建

2024-11-04徐以康马晶茹杨洋刘蕾张志峰孙斯琪李曼曼占凯雯

中国现代医生 2024年28期

[摘要]目的分析冠心病患者发生心力衰竭的危险因素,构建并验证冠心病(coronaryheartdisease,CHD)患者发生心力衰竭的列线图预测模型。方法回顾性分析2022年1月至12月于沈阳医学院附属第二医院住院治疗的453例CHD患者的临床资料,其中CHD合并心力衰竭患者278例,未合并心力衰竭患者175例,将患者按7∶3分为训练组(318例)和验证组(135例),应用R软件进行LASSO回归筛选危险因素,Logistic回归建立预测模型并构建列线图,采用校准曲线和受试者操作特征曲线(receiveroperatingcharacteristiccurve,ROC曲线)评价模型的校准度和区分度。结果LASSO回归分析最终从22个变量中筛选出5个危险因素,Logistic回归结果显示年龄、吸烟、有心肌梗死病史、纽约心脏病协会(NewYorkHeartAssociation,NYHA)心功能分级Ⅳ级、左室射血分数(leftventricularejectionfraction,LVEF)均是CHD患者发生心力衰竭的独立危险因素(P<0.05)。模型公式:Z=–2.927+0.045×年龄+0.886×吸烟+0.808×心肌梗死病史–2.829×NYHA心功能分级Ⅳ级+0.037×LVFF。对该模型进行内部验证,曲线下面积为0.727(95%CI:0.588~0.752),敏感度为40.4%,特异性为84.3%,约登指数为0.247。校准曲线预测值与实际值一致性较高,Brier评分0.106。结论基于LASSO回归构建的CHD患者发生心力衰竭的风险预测模型具有较好的区分度和预测效能,可作为医务人员对患者进行风险预测的评估工具。

[关键词]冠心病;心力衰竭;列线图;风险预测;LASSO回归

[中图分类号]R541.4;R541.6[文献标识码]A[DOI]10.3969/j.issn.1673-9701.2024.28.001

ConstructionofriskpredictionmodelofheartfailureinpatientswithcoronaryheartdiseasebasedonLASSOregression

XUYikang1,MAJingru1,YANGYang1,LIULei2,ZHANGZhifeng2,SUNSiqi2,LIManman2,ZHANKaiwen2

1.DepartmentofCardiology,theSecondAffiliatedHospitalofShenyangMedicalCollege,Shenyang110000,Liaoning,China;2.SchoolofNursing,LiaoningUniversityofTraditionalChineseMedicine,Shenyang110000,Liaoning,China

[Abstract]ObjectiveToanalyzetheriskfactorsofheartfailureinpatientswithcoronaryheartdisease(CHD),andtoconstructandverifyanomogrampredictionmodelfortheriskofheartfailureinpatientswithCHD.MethodsTheclinicaldataof453patientswith&nbsp;CHDwhowerehospitalizedintheSecondAffiliatedHospitalofShenyangMedicalCollegefromJanuarytoDecember2022wereretrospectivelyanalyzed,including278patientswithCHDcombinedwithheartfailureand175patientswithoutheartfailure.Thepatientsweredividedintotraininggroup(318cases)andvalidationgroup(135cases)accordingtotheratioof7:3.RsoftwarewasappliedtoperformLASSOregressiontoscreentheriskfactors,andLogisticregressiontoestablishapredictionmodelandconstructanomogram.Thecalibrationcurveandreceiveroperatingcharacteristic(ROC)curvewereusedtoevaluatethecalibrationanddiscriminationofthemodel.ResultsLASSOregressionanalysisultimatelyscreenedfiveriskfactorsfrom22variables,andLogisticregressionresultsshowedthatage,smoking,historyofmyocardialinfarction,NewYorkHeartAssociation(NYHA)cardiacfunctionclassⅣ,andleftventricularejectionfraction(LVEF)wereallindependentriskfactorsforheartfailureinCHDpatients(P<0.05).ThemodelformulawasZ=–2.927+0.045×age+0.886×smoking+0.808×historyofmyocardialinfarction–2.829×NYHAcardiacfunctionclassⅣ+0.037×LVFF.Internalvalidationofthemodelshowedthatareaunderthecurvewas0.727(95%CI:0.588-0.752),thesensitivitywas40.4%,thespecificitywas84.3%,andtheYoudenindexwas0.247.Accordingtothecalibrationcurve,thepredictedvalueofthecalibrationcurvewashighlyconsistentwiththeactualvalue,andtheBrierscorewas0.106.ConclusionTheriskpredictionmodelforheartfailureinpatientswithCHDbasedonLASSOregressionhasgooddiscriminationandpredictionefficiency,whichcanbeusedasanevaluationtoolformedicalstafftopredicttheriskofpatients.

[Keywords]Coronaryheartdisease;Heartfailure;Nomograms;Riskprediction;LASSOregression

全球疾病负担报告显示2019年全球约有冠心病(coronaryheartdisease,CHD)患者1.97亿[1]。《中国心血管健康与疾病报告2021》显示,中国CHD患病率持续升高,CHD患病人数约1139万人[2]。研究显示中国48.3%的心力衰竭由CHD引发[3]。基于国家“防重于治”的理念,将防控关口前移,早期识别发生心力衰竭的高危人群,及时探求危险因素,制定个体化防治策略,可降低心力衰竭发病率、延缓疾病进展及延长患者寿命[4]。LASSO回归以其处理多重共线性数据的优势,近年来在危险因素筛选中应用较为广泛[5]。本研究使用LASSO回归方法筛选CHD患者发生心力衰竭的危险因素,采用Logistic回归构建风险预测模型并以列线图形式展现,为早期识别高危人群、制定心力衰竭精准预防措施、延缓CHD患者发生心力衰竭的进程提供科学依据。

1资料与方法

1.1研究对象

回顾性分析2022年1月至12月于沈阳医学院附属第二医院住院治疗的CHD患者的临床资料。纳入标准:①年龄>18岁;②符合欧洲心脏病学会指南的冠心病临床诊断标准[6]。排除标准:①伴有严重肝肾功能衰竭、肺功能衰竭、心脏瓣膜疾病、重症感染、免疫系统疾病及恶性肿瘤者;②临床资料不完整者。心力衰竭诊断参照《中国心力衰竭诊断和治疗指南2024》[7]。本研究经沈阳医学院附属第二医院医学伦理委员会审核批准(伦理审批号:2023-沈医二院伦理-04Y26Jyede3u9fRSDrRUtNWTYI7SsQTn9qZ+m5LTVzs3E=1)。

1.2资料收集

通过查阅患者的电子病历,收集社会人口学资料、疾病相关资料及各种实验室检查指标。人口学资料包括年龄、性别、体质量指数(bodymassindex,BMI)、吸烟及饮酒史、既往药物应用情况;疾病资料包括高血压、糖尿病、心肌梗死、房颤/房扑、脑卒中、慢性肾功能不全、外周动脉疾病、血脂异常、纽约心脏病协会(NewYorkHeartAssociation,NYHA)心功能分级;实验室资料包括心钠素、尿酸、左室射血分数(leftventricularejectionfraction,LVEF)、左室舒张末期内径、空腹血糖、血肌酐、血红蛋白、血钠、血钾、三酰甘油、总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、超敏C反应蛋白。

1.3统计学方法

数据采用双人双录入至Epidata3.0数据库,运用R语言软件(4.0.5版本)对数据进行统计分析。符合正态分布的计量资料以均数±标准差()表示,比较采用t检验,不符合正态分布的计量资料以中位数(四分位数间距)[M(Q1,Q3)]表示,比较采用Mann-WhitneyU检验。计数资料以例数(百分率)[n(%)]表示,比较采用χ2检验。P<0.05为差异有统计学意义。采用LASSO回归筛选危险因素,Logistic回归建立预测模型,列线图对结果进行可视化呈现。采用受试者操作特征曲线(receiveroperatingcharacteristiccurve,ROC曲线)评价模型的预测效能,绘制校准曲线进行模型一致性检验。曲线下面积(areaunderthecurve,AUC)为0.5~0.7,表示模型预测性能一般;AUC为0.7~0.9,表示模型预测性能良好;AUC>0.9,表示模型预测性能非常好[8]。校准概率以Brier评分表示,Brier评分越接近0,表示模型校准度越好[9]。

2结果

2.1患者的一般情况

本研究共纳入453例CHD患者,合并心力衰竭者278例,占比61.4%,未合并心力衰竭者175例,占比38.6%。年龄25~97岁,平均(68.50±12.75)岁;男303例,女150例。将453份数据资料按照7∶3分为训练组(318例)和验证组(135例)。训练组和验证组患者的一般特征和临床资料比较差异均无统计学意义(P>0.05),见表1。

2.2CHD患者发生心力衰竭的危险因素筛选

对CHD发生心力衰竭和未发生心力衰竭患者的临床资料进行LASSO回归分析,最终从22个变量中筛选出5个危险因素,分别为年龄、吸烟、心肌梗死、NYHA心功能分级、LVEF,均为非零系数。使用10倍交叉的方法,验证拟合不同变量组合下的模型,依据lambda.1se变量筛选准则,log(λ)=0.050模型性能优良且模型精简,见图1、图2。

2.3基于Logistic回归的风险预测模型构建

使用训练组数据进行模型构建,以是否发生心力衰竭为因变量(未发生=0,并发=1),将LASSO回归筛选出的变量作为自变量纳入Logistic回归模型进行分析。自变量赋值情况:年龄(赋值:实测值)、吸烟(赋值:是=1,否=0)、心肌梗死(赋值:是=1,否=0)、NYEF心功能分级(赋值:实测值)、LVEF(赋值:实测值)。结果显示年龄、吸烟、有心肌梗死病史、NYHA心功能分级Ⅳ级、LVEF均是CHD

患者发生心力衰竭的独立危险因素(P<0.05),见表2。模型公式:Z=–2.927+0.045×年龄+0.886×吸烟+0.808×心肌梗死病史–2.829×NYHA心功能分级Ⅳ级+0.037×LVFF。

2.4模型验证

使用验证组数据进行模型验证,结果显示AUC为0.727(95%CI:0.588~0.752),敏感度为40.4%,特异性为84.3%,约登指数为0.247,表示该模型具有中等区分度,见图3。校准曲线接近于理想曲线,Brier评分0.106,提示校准曲线预测值与实际值一致性较高,模型预测能力较好,见图4。

2.5列线图建立

构建可视化列线图,5个危险因素分别对应列线图横轴上的具体分值,将这些因素对应的分值相加,即得到总分。总分越高,CHD患者发生心力衰竭的危险就越大,见图5。

3讨论

本研究结果显示,年龄越高、吸烟、有心肌梗死病史、NYHA心功能分级高、LVEF低均是CHD患者发生心力衰竭的危险因素。分析原因:①年龄:个体的心脏功能随着年龄增长而逐渐衰退,CHD患者虽然经过专业治疗,但其心脏功能恢复缓慢,心力衰竭发生风险也随之增高,因此高龄是CHD患者发生心力衰竭的独立危险因素[10-11];②吸烟:流行病学调查发现,有吸烟史的患者发生心肌梗死的年龄段比无吸烟史者早约10年[12]。究其原因:吸烟产生的炎症反应及氧化应激可引起患者左室舒张功能障碍、心室质量增加等心脏功能和结构变化;且烟雾中的苯并芘、尼古丁、一氧化碳等可导致血管内皮损伤,促进动脉粥样硬化,也会引发心脏收缩功能失常,从而增加心力衰竭的发生风险[13];③心肌梗死:研究发现急性心肌梗死入院患者心力衰竭发病率为14%~36%[14];国外研究发现心肌梗死后30d至5.7年心力衰竭发生率为13.1%~37.5%[15-16]。心肌梗死发生后,心肌细胞坏死、数量减少,从而导致心脏重构,而心脏重构是心肌梗死后心力衰竭发生的病理基础。心肌梗死后的坏死细胞引发机体损伤,从而发生炎症反应,加重组织受损。同时,心肌梗死后心排血量降低可激活交感神经系统,加重心脏负荷和心脏重构,最终引发心力衰竭[17];④NYHA心功能分级:研究发现心功能分级与低氧诱导因子-1α(hypoxia-induciblefactor-1α,HIF-1α)呈正相关,且心功能越差,HIF-1α水平越高,而心力衰竭患者的血清HIF-1α明显升高[18]。NYHA分级越高,冠状动脉病变越发严重和复杂,是心力衰竭的诊断依据;⑤LVEF:LVEF是判断心脏收缩功能的重要指标,LVEF越低说明心脏收缩能力越弱,也是临床判断心力衰竭的常用参数。

本研究结果显示,构建的模型具有较好的区分度和校准度。该模型内部验证所得AUC为0.727,敏感度为40.4%,特异性为84.3%,约登指数为0.247,表示该模型具有中等区分度。校准曲线接近于理想曲线,提示预测值与实际值一致性较高,模型预测能力较好。

列线图已被广泛应用于各类疾病及其并发症的预测研究,其可通过整合预测的危险因素,进行单一患者疾病及并发症发生概率估计,不仅提供个性化的预测模型,还给予可视化呈现。在临床工作中,可应用该模型对CHD患者进行评估,以期早期发现心力衰竭的高危人群,早期进行干预,减少患者的不良结局。

综上,本研究基于LASSO回归构建的CHD患者发生心力衰竭的风险预测模型具有较好的区分度和预测效能,可作为医务人员对CHD患者发生心力衰竭风险预测的评估工具。

利益冲突:所有作者均声明不存在利益冲突。

[参考文献]

  • SAFIRIS,KARAMZADN,SINGHK,etal.Burdenofischemicheartdiseaseanditsattributableriskfactorsin204countriesandterritories,1990-2019[J].EurJPrevCardiol,2022,29(2):420–431.
  • 中国心血管健康与疾病报告编写组.中国心血管健康与疾病报告2021概要[J].中国循环杂志,2022,37(6):553–578.
  • 国家心血管病医疗质量控制中心专家委员会心力衰竭专家工作组.2020中国心力衰竭医疗质量控制报告[J].中国循环杂志,2021,36(3):221–238.
  • 中国心衰中心联盟,苏州工业园区心血管健康研究院,中国心血管健康联盟.中国心衰中心工作报告(2021)——心力衰竭患者的诊疗现况[J].中国介入心脏病学杂志,2022,30(5):328–336.
  • BODINIERB,FILIPPIS,NØSTTH,etal.Automatedcalibrationforstabilityselectioninpenalisedregressionandgraphicalmodels[J].JRStatSocSerCApplStat,2023,72(5):1375–1393.