APP下载

机器学习在心力衰竭病人预后评估中的应用研究进展

2023-06-04吉史伍呷方进博

护理研究 2023年7期
关键词:风险因素机器学习心力衰竭

吉史伍呷 方进博

基金项目 成都市科技局技术研发项目,编号:2022?YF05?01516?SN

摘要  总结了机器学习算法分类,以及机器学习在心力衰竭病人生存(死亡)、心力衰竭再入院、心脏事件预测中的应用现状,筛选出最能准确评估心力衰竭病人预后的机器学习算法,为临床早期评估心力衰竭病人的预后提供新的依据。

关键词  心力衰竭;机器学习;预后;风险因素;综述

doi:10.12102/j.issn.1009-6493.2023.07.013

心力衰竭具有高患病率、高住院率、高死亡率的特点,据统计,全球心力衰竭病人超过3 770万例[1],我国心力衰竭病人约有890万例[2],并且50%的病人将会在5年内死亡[3],已经是严重的社会公共问题之一。评估心力衰竭病人的预后、早期发现病人的潜在风险因素、早期给予干预是目前临床医疗和护理研究的重点和热点。心力衰竭的预后评估内容主要包括确诊后生存预测、再入院风险、死亡风险、心脏不良事件的发生发展预测等。既往评估心力衰竭病人预后的方法有B型钠尿肽(BNP)预测、逻辑回归、受试者工作特征曲线下面积(AUC)、C?Index、心力衰竭风险评分(MAGGIC?HF)、心力衰竭院內死亡风险评分(GWTG)等。机器学习作为一种高效的学习算法,在评估或预测心力衰竭病人的预后中被广泛使用,并且多项研究已表明,在心力衰竭的预后评估中机器学习算法比传统的方法准确度和灵敏度更高,值得推广应用[4?6]。因此,本研究就机器学习算法在心力衰竭病人预后中的应用进行综述,试图筛选出最能准确评估心力衰竭病人预后的机器学习算法,为临床早期评估心力衰竭病人的预后、确定个性化治疗方案和护理方式提供新的依据。

1  机器学习算法

机器学习是一门研究计算机如何从数据中学习的学科,是统计学和计算机科学的交叉学科,统计学试图从数据中学习关系,而计算机科学则强调高效的计算算法[7]。相对于传统的统计学分析方法,机器学习方法对数据分布无线性要求,能够自动发现并利用相关因素之间的交互效应及非线性关系[8]。机器学习算法主要分为监督学习和无监督学习,监督学习主要侧重于分类和回归,常用来评估预测疾病的风险及预后,算法主要包括K?近邻算法(K?nearest neighbor,KNN)、线性回归(linear regression)、逻辑回归(Logistics regression,LR)、决策树(decision tree,DT)、支持向量机(support vector machines,SVM)、梯度提升机(gradient boosting machine,GBM)、随机森林(random forests,RF)和神经网络(neural network)等;而无监督学习侧重于挖掘数据之间的关系,重在聚类和降维,可协助监督学习建立疾病预测风险模型,典型算法包括K均值聚类(K?means clustering)、主成分分析、分层聚类算法、最大期望算法(expectation maximization algorithm)等。在心力衰竭的预后评估方面,大多使用监督学习的算法,常用的算法包括逻辑回归、决策树、支持向量机、随机森林、梯度提升机、人工神经网络、K?近邻算法等。

1.1 决策树 决策树以最大限度分离数据集的原则对数据进行反复分割,形成树形结构。决策树内部的树枝样的连接代表对象属性和对象值之间的关系,主要缺点是其构造过程,在每一步中选择单个最佳变量和最佳分割点的组合,但考虑变量组合的多步前瞻可能会获得不同或者更好的结果;另一个缺点在于连续变量被分裂过程隐式离散化,沿途丢失信息,容易过拟合[9]。与其他算法相比,决策树不是“黑匣子”模型,可以很容易地被表达为规则[9],优势大于其缺点,因此在医学领域被广泛应用,亦有研究将其运用在心力衰竭的预后评估中[5,10]。

1.2 支持向量机 支持向量机是非概率监督学习程序,它创建一个多维超平面,将协变量空间划分为两组,以便进行分类[11]。其优点是可用于线性或非线性分类,也可以用于回归;低泛化误差;结果容易解释;计算复杂度较低。缺点是对参数和核函数的选择比较敏感,原始的支持向量机比较擅长处理二分类问题。支持向量机广泛用于模式识别和疾病预测模型的建立,且可直接使用结构化数据[12]。多项研究应用支持向量机算法预测了心力衰竭病人的预后[3,6]。

1.3 随机森林 随机森林是基于决策树的分类模型算法,旨在减小决策树过拟合现象。它将Bootstrap重抽样方法和决策树算法相结合,对每个Bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果[13?14]。其优点是有很好的预测准确率以及对异常值和噪声具有很好的包容性,并且能同时处理连续型变量和分类变量[14],被认为是较好的分类算法之一[7]。在医学领域常常用来挖掘大数据和预测疾病风险。多项研究将随机森林与其他算法结合建立了心力衰竭病人预后风险预测模型[4,15]。

1.4 梯度提升机 梯度提升机是一种基于多种决策树模型的典型的机器学习算法,它依赖于直觉,即当以阶段顺序与之前的弱模型(如决策树)相结合时,能够最小化性能评估器的总体预测误差,例如精度以及AUC[16]。梯度提升机的优点主要为低泛化误差,容易实现,分类准确率较高,没有太多参数可以调。与随机森林相比,梯度提升机更加关注在已训练的决策树上预测结果不好的数据点,不断提升模型的短板,其效果通常会比随机森林更好[8]。在心血管领域,梯度提升机通常与其他算法结合运用,并且多项研究结果表明,梯度提升机的预测准确度比其他机器学习算法高[17?20]。

1.5 K?近邻算法 K?近邻算法具有较强的一致性结果。随着数据趋于无限,算法可保证错误率不会超过贝叶斯算法错误率的两倍。其优点为思想简单,理论成熟,既可以用来做分类也可以用来做回归;可用于非线性分类;准确度高,对数据没有假设。缺点为计算量大;样本不平衡问题,即有些类别的样本数量很多,而其他样本的数量很少;需要大量的内存。K?近邻算法相对于其他算法的优势在于近邻可以对分类结果提供解释,这种基于案例的解释可以在黑盒模型不充分的领域提供优势[9],在心血管领域被广泛应用[21]。

1.6 逻辑回归 逻辑回归是目前常用來建立心力衰竭病人预后风险预测模型的算法,是最常用的标准传统方法。逻辑回归是用来分类的,是一种线性分类器。其优势在于实现简单;分类时计算量非常小,速度很快,存储资源低。缺点为容易欠拟合,一般准确度不太高;只能处理两分类问题,且必须线性可分。由于计算速度快,逻辑回归通常结合其他算法应用于疾病预测研究中[22?24],在心血管领域中的运用已较成熟。

1.7 人工神经网络 人工神经网络通过模拟生物神经网络 (大脑)的结构和功能,由大量的节点和之间相互连接构成,通常用于解决分类和回归问题,也可以用来对数据之间的复杂关系进行建模。其优点为非线性分类、自我学习能力强。缺点是“黑匣子”模型,即训练有素的人工神经网络是不容易被破译的,容易出现过拟合;计算量大,耗时耗力。尽管如此,人工神经网络由于其强大的分类功能,在心血管研究领域很受欢迎,常用于建立疾病风险预测模型[23,25]。

2  机器学习在心力衰竭预后评估中的应用

与传统工具相比,机器学习算法在预测心力衰竭病人的死亡率、住院以及再次入院等方面具有更好的准确性,因此,运用机器学习算法对心力衰竭病人进行预后评估,能够早期发现病人风险因素,早期给予干预,从而达到降低病人不良预后发生率及提升生活质量的目的,也可为心力衰竭出院后延续性护理提供干预依据。在心力衰竭的预后评估中,常用的机器学习算法主要为监督学习,并且由于各个算法各有优缺点,相互补充,因此多结合运用于病人的预后评估中。近年来机器学习算法在心力衰竭预后评估中的应用研究见表1。

2.1 机器学习在心力衰竭病人生存(死亡)预测中的应用 机器学习算法在心力衰竭病人死亡或生存预测方面有较强的能力,其建立的死亡风险预测模型比传统方式较为精准,可以辅助医护人员确定病人的个性化治疗方式和个性化护理方式。目前,利用机器学习算法建立的病人死亡风险预测模型是较为准确的风险预测模型。Kim等[31]利用Lasso分组算法建立了东亚地区心力衰竭死亡风险预测模型,结果显示,对3 683例心力衰竭病人随访3年后,死亡率为32.8%,并且证明了利用机器学习风险评分预测1年死亡率的AUC高于MAGGIC?HF评分(P<0.01),即前者预测准确度更高。K?nig等[17]利用4种机器学习算法,包括逻辑回归、随机森林、梯度提升机、单层神经网络,分别建立了心力衰竭住院病人的死亡预测模型,且通过计算AUC评价模型的性能,结果显示,病人住院期间死亡率为6.2%,病人死亡风险因素主要有高龄(≥65岁)、肥胖、住院天数≥5 d、入住ICU、心功能分级≥Ⅲ级、合并慢性肾病、瓣膜病、高血压、甲状腺功能减退症及伴有水电解质紊乱、心律失常和体重降低;逻辑回归的AUC为0.829,随机森林的AUC为0.875,梯度提升机的AUC为0.882,单层神经网络的AUC为0.866,表明运用梯度提升机算法建立的死亡预测模型预测准确度最好。此外,K?nig等[18]另一篇关于利用机器学习预测新型冠状病毒感染疫情期间心力衰竭病人住院期间死亡的研究结果显示,机器学习算法建立的模型能够准确预测病人的死亡,并且疫情期间心力衰竭病人的死亡率没有上升。Tohyama等[32]研究也利用机器学习建立了预测精度较高的急性心力衰竭病人死亡风险预测模型,结果显示,急性心力衰竭病人1年后死亡率为17%,并且确定了急性心力衰竭病人死亡相关预测因子,如体质指数(BMI)、合并肾脏疾病等。以上多项研究表明,机器学习算法建立的心力衰竭死亡风险预测模型预测准确度比传统的方式更高,在今后的临床护理研究中,研究者可借助机器学习运用于心力衰竭的其他领域,以促进心力衰竭病人的精准护理,改善病人的长期预后。

2.2 机器学习在心力衰竭病人再入院预测中的应用 在提倡延续性护理、支持疾病全周期照护、改善慢性疾病长期预后和生活质量的号召下,早期识别出院后心力衰竭病人再入院的风险,早期给予干预,对改善心力衰竭病人长期预后和生活质量意义重大。多项研究运用多种机器学习算法挖掘出病人再入院的风险因素,并且建立了预测准确度更高的风险预测模型。Golas等[24]研究利用逻辑回归、梯度提升机等多种机器学习算法建立了心力衰竭病人出院30 d后再入院的风险预测模型,研究结果表明,模型预测准确度为76.4%,30 d再入院率为23.3%,再入院强相关因素主要为受教育程度、就业状况、合并症数量,高中以下学历、失业状态、残疾率高、伴有≥3种合并症的病人是再入院的高风险因素。此外,Pishgar等[33]研究也运用神经网络模型预测了ICU心力衰竭病人30 d非计划再入院率,建立的预测模型准确度为0.841,敏感度为0.805,比其他方式建立的模型准确度和灵敏度均高。因此,在心力衰竭随访时,护理人员可利用机器学习算法建立的病人再入院风险预测模型评估病人的高危因素,重点评估病人的再入院高危因素并进行干预,从而降低病人的再入院率。

2.3 机器学习在心力衰竭病人心脏事件预测中的应用 心脏事件是指在超声心动图检查之日起3年内猝死、心力衰竭死亡或因心力衰竭恶化住院治疗。心力衰竭病人一旦发生心脏事件将严重影响病人的长期预后,严重者可导致死亡。因此,对心力衰竭病人心脏事件风险进行有效预测并采取有效的治疗措施进行早期干预具有重要的临床价值,而运用机器学习建立的预测模型能够准确预测病人心脏事件风险,如Harada等[34]研究结合机器学习建立了心力衰竭病人3年发生心脏事件风险预测模型,结果表明,机器学习建立的预测模型准确度及灵敏度均比用BNP预测病人心脏事件高,并且发现心脏事件风险因素主要包括年龄、心功能分级、BNP、射血分数等13个因素。虽然BNP常用于评估心力衰竭病人的预后,但机器学习建立的预测模型更为准确且灵敏,因此临床护理中评估心力衰竭病人的心脏事件时,除了关注病人的BNP值,更需要综合评估病人,早期发现病人发生心脏事件的风险因素并进行早期干预。

3  小结

研究者在评估和预测心力衰竭病人预后研究中多运用监督学习的机器学习算法,并且常结合多种算法共同建立心力衰竭预后风险预测模型,其中梯度提升机建立的预测准确度比其他常用的算法较好,可能是因为梯度提升机更加关注在已训练的决策树上预测结果不好的数据点,不断提升模型的短板。然而,也有研究表明多层感知机预测心力衰竭病人出院后30 d再入院或死亡风险比其他机器学习算法好[22],但该研究中未应用梯度提升机;此外,有研究表明在心力衰竭病人住院风险的预测中广义线性模型网络(GLMN)的预测准确度比其他的机器学习算法高[6]。因此,研究者在将机器学习算法运用于心力衰竭病人的预后评估时,可根据研究内容选择最适合的算法,但何种机器学习算法在评估预测心力衰竭病人预后中预测准确度和灵敏度更高,目前研究未得到统一结论,需要进一步研究证明。

参考文献:

[1]  ZIAEIAN B,FONAROW G C.Epidemiology and aetiology of heart failure[J].Nature Reviews Cardiology,2016,13(6):368-378.

[2]  中国心血管健康与疾病报告编写组.中国心血管健康与疾病报告2020概要[J].中国循环杂志,2021,36(6):521-545.

[3]  GUO A X,PASQUE M,LOH F,et al.Heart failure diagnosis,readmission,and mortality prediction using machine learning and artificial intelligence models[J].Current Epidemiology Reports,2020,7(4):212-219.

[4]  BAZOUKIS G,STAVRAKIS S,ZHOU J D,et al.Machine learning versus conventional clinical methods in Guiding management of heart failure patients--a systematic review[J].Heart Failure Reviews,2021,26(1):23-34.

[5]  SHIN S,AUSTIN P C,ROSS H J,et al.Machine learning vs.conventional statistical models for predicting heart failure readmission and mortality[J].ESC Heart Failure,2021,8(1):106-115.

[6]  LORENZONI G,SABATO S S,LANERA C,et al.Comparison of machine learning techniques for prediction of hospitalization in heart failure patients[J].Journal of Clinical Medicine,2019,8(9):1298.

[7]  DEO R C.Machine learning in medicine[J].Circulation,2015,132(20):1920-1930.

[8]  韦仁杰,杨明钰,崔斌,等.机器学习算法在肺癌研究中的应用进展[J].中华检验医学杂志,2021,43(5):430-436.

[9]  DREISEITL S,OHNO-MACHADO L.Logistic regression and artificial neural network classification models:a methodology review[J].Journal of Biomedical Informatics,2002,35(5/6):352-359.

[10]  CHICCO D,JURMAN G.Machine learning can predict survival of patients with heart failure from serum creatinine and ejection fraction alone[J].BMC Medical Informatics and Decision Making,2020,20(1):16.

[11]  REYNOLDS E,CALLAGHAN B,BANERJEE M.SVM-CART for disease classification[J].Journal of Applied Statistics,2019,46(16):2987-3007.

[12]  LIN H J,WANG X L,TIAN M Y,et al.Machine learning and its epidemiological applications[J].Chinese Journal of Epidemiology,2021,42(9):1689-1694.

[13]  曹正鳳.随机森林算法优化研究[D].北京:首都经济贸易大学,2014.

[14]  方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.

[15]  PARIS S,INCIARDI R M,SPECCHIA C,et al.Machine learning for prediction of in-hospital mortality in COVID-19 patients:results from an Italian multicentre study[J].European Heart Journal,2021,23(Suppl):suab135.035.

[16]  JU C S,ZHOU J D,LEE S R,et al.Derivation of an electronic frailty index for predicting short-term mortality in heart failure:a machine learning approach[J].ESC Heart Failure,2021,8(4):2837-2845.

[17]  K?NIG S,PELLISSIER V,HOHENSTEIN S,et al.Machine ?learning algorithms for claims data-based prediction of in-hospital mortality in patients with heart failure[J].ESC Heart Failure,2021,8(4):3026-3036.

[18]  K?NIG S,PELLISSIER V,LEINER J,et al.Expected and observed in-hospital mortality in heart failure patients before and during the COVID-19 pandemic:introduction of the machine learning-based standardized mortality ratio at Helios hospitals[J].Clinical Cardiology,2022,45(1):75-82.

[19]  AGIBETOV A,SEIRER B,DACHS T M,et al.Machine learning enables prediction of cardiac amyloidosis by routine laboratory parameters:a proof-of-concept study[J].Journal of Clinical Medicine,2020,9(5):1334.

[20]  BAASHAR Y,ALKAWSI G,ALHUSSIAN H,et al.Effectiveness of artificial intelligence models for cardiovascular disease prediction:network Meta-analysis[J].Computational Intelligence and Neuroscience,2022,2022:5849995.

[21]  CHEN S L,BANERJEE A.Machine learning:a long way from implementation in cardiovascular disease[J].Heart,2020,106(5):318-320.

[22]  AWAN S E,BENNAMOUN M,SOHEL F,et al.Machine learning-based prediction of heart failure readmission or death:implications of choosing the right model and the right metrics[J].ESC Heart Failure,2019,6(2):428-435.

[23]  CHERUKUPALLI R,ACHANTA A,CHERUKUPALLI A,et al.Machine learning based diagnosis of heart failure with preserved ejection fraction among South Asian patients[J].European Heart Journal,2022,43(Suppl 1):ehab849.061.

[24]  GOLAS S B,SHIBAHARA T,AGBOOLA S,et al.A machine learning model to predict the risk of 30-day readmissions in patients with heart failure:a retrospective analysis of electronic medical records data[J].BMC Medical Informatics and Decision Making,2018,18(1):44.

[25]  CHEN R,STEWART W F,SUN J M,et al.Recurrent neural networks for early detection of heart failure from longitudinal electronic health record data:implications for temporal modeling with respect to time before diagnosis,data density,data quantity,and data type[J].Circulation Cardiovascular Quality and Outcomes,2019,12(10):e005114.

[26]  AGASTHI P,BURAS M R,SMITH S D,et al.Machine learning helps predict long-term mortality and graft failure in patients undergoing heart transplant[J].General Thoracic and Cardiovascular Surgery,2020,68(12):1369-1376.

[27]  AWAN S E,BENNAMOUN M,SOHEL F,et al.Feature selection and transformation by machine learning reduce variable numbers and improve prediction for heart failure readmission or death[J].PLoS One,2019,14(6):e0218760.

[28]  KAMPAKTSIS P N,MOUSTAKIDIS S,TZANI A,et al.State-of-the-art machine learning improves predictive accuracy of 1-year survival after heart transplantation[J].ESC Heart Failure,2021,8(4):3433-3436.

[29]  LI F H,XIN H,ZHANG J D,et al.Prediction model of in-hospital mortality in intensive care unit patients with heart failure:machine learning-based,retrospective analysis of the MIMIC-Ⅲ database[J].BMJ Open,2021,11(7):e044779.

[30]  LUO C D,ZHU Y,ZHU Z,et al.A machine learning-based risk stratification tool for in-hospital mortality of intensive care unit patients with heart failure[J].Journal of Translational Medicine,2022,20(1):136.

[31]  KIM W,PARK J J,LEE H Y,et al.Predicting survival in heart failure:a risk score based on machine-learning and change point algorithm[J].Clinical Research in Cardiology,2021,110(8):1321-1333.

[32]  TOHYAMA T,IDE T,IKEDA M,et al.Machine learning-based model for predicting 1 year mortality of hospitalized patients with heart failure[J].ESC Heart Failure,2021,8(5):4077-4085.

[33]  PISHGAR M,THEIS J,DEL RIOS M,et al.Prediction of unplanned 30-day readmission for ICU patients with heart failure[J].BMC Medical Informatics and Decision Making,2022,22(1):117.

[34]  HARADA D,ASANOI H,NOTO T,et al.Naive Bayes prediction of the development of cardiac events in heart failure with preserved ejection fraction in an outpatient clinic--beyond B-type natriuretic peptide[J].Circulation Journal,2021,86(1):37-46.

(收稿日期:2022-05-26;修回日期:2023-03-18)

(本文編辑 苏琳)

猜你喜欢

风险因素机器学习心力衰竭
基于机器学习的图像特征提取技术在图像版权保护中的应用
慢性心衰患者血尿酸和脑钠肽水平检测的临床意义
基于网络搜索数据的平遥旅游客流量预测分析
煤矿企业人力资源管理存在的风险因素及控制方法
感染科护理人员职业风险及对策
前缀字母为特征在维吾尔语文本情感分类中的研究
中药汤剂联合中药足浴及耳穴压豆治疗慢性心力衰竭的临床观察
户外俱乐部活动的风险因素识别与分析
冠心病心力衰竭应用美托洛尔联合曲美他嗪治疗的疗效分析
基于支持向量机的金融数据分析研究