APP下载

基于随机森林模型法的AMI患者并发AKI预测模型的建立

2023-01-04刘真义李浩然药永红

重庆医学 2022年24期
关键词:二聚体肌酐通气

李 龙,刘真义,李浩然,药永红

(中国人民解放军联勤保障部队第九四五医院急诊科,四川雅安 625000)

急性心肌梗死(AMI)是心脏内科最为常见的急危重症疾病类型之一,尽管随着医疗技术和水平的不断提升及治疗手段的更新,但AMI的救治率仍不高[1]。急性肾损伤(AKI)是指人体肾脏功能在短时间内出现进行性下降的一类疾病综合征,诱发AKI的因素较多,在发生AMI后出现肾功能障碍称为心肾综合征[2]。AMI患者最为常见的并发症之一为AKI,其主要原因包括冠状动脉造影剂对肾脏的损伤和AMI所致的肾脏血流灌注不足。一旦AMI患者出现AKI病情将会急剧加重,严重影响患者预后,故而在实际临床工作中对AMI患者是否发生AKI进行一定的预测显得尤为重要[3]。既往诸多研究对AMI患者并发AKI预测模型多采用logistic回归模型进行分析,随着人工智能的不断更新,机器学习得到广泛应用,预测模型的建立方法也逐渐增多[4]。本研究探讨基于随机森林模型法对AMI患者并发AKI进行预测的效果,旨在为临床诊治提供理论依据。

1 资料与方法

1.1 一般资料

选取2014年1月至2021年1月本院急诊科收治的AMI患者1 362例作为研究对象。将合并AKI患者设为观察组(270例),未合并AKI设为对照组(1 092例)。AMI诊断标准[5]:具有典型临床表现、特征性的心电图改变,以及血液学指标变化;AKI诊断标准[6]:48 h内血清肌酐水平升高大于或等于0.3 mg/dL或已超过基础肌酐值的1.5倍以上或6 h尿量持续少于0.5 mL·kg-1·h-1。纳入标准:(1)主要诊断符合AMI诊断标准;(2)发生AMI后24 h内入院。排除标准:(1)血液学检查指标中尿素或肌酐检查缺失;(2)既往已有终末期肾病或透析治疗。本研究符合《世界医学协会赫尔辛基宣言》相关要求。

1.2 方法

1.2.1自变量的选择

根据实际临床情况结合文献[7-13]初步确定140个与AMI和AKI具有相关性的变量,因收集和整理变量数较大,需进行一定的降维处理。(1)剔除缺失程度达15%以上的变量,而后采用R语言中的CARET程序对所收集的数据进行相关预处理。剔除与其他自变量存在较强相关性的变量(程序语句:find correlation),因自变量中还存在一定的多重线性问题,继续采用相关程序(程序语句:find Liner Combos)进行查找及剔除。(2)对数据缺失未达15%的数据进行相关处理和补充,对符合正态分布的数据采用平均数给予补充,对偏态分布的数据采用中位数给予补充。数据经过初步处理后再进行相关筛选,采用rfFuncs建立随机森林模型,而后采用相关命令进行自变量的选择,经过程序的选择后最终获得并确定30个变量,主要包括人口学资料、疾病危险因素、生命体征、实验室检查等。

1.2.2模型的建立

经过自变量的确定后,在1 362例患者中随机选取75%的病例进行训练数据库的建立,25%的病例作为测试数据库。随机森林算法采用相关程序包——随机森林进行,抽样方式选取Bootstrap。随机森林模型当中具有2个重要的数据参数,包括决策树棵树——ntree、分裂节点预估变量数目——mtry。首先进行mtry节点值的选取,此节点值即为二叉数的变量数目,此模型所对应的最小值为24,而后进行测试阶段,进行最佳ntree的匹配,当ntree=900时此模型表现最佳。模型中变量的重要性采用importance函数进行计算,数值越大表示重要性越强。

1.2.3模型的评估及对比

建立模型后进行一定程度评估,看其是否适合对疾病进行预测。采用R语言对测试数据库中的匹配数据进行计算,得出其准确率、灵敏度和特异度,再采用R语言中的程序包——pROC计算受试者工作特征曲线下面积(AUC),评估建立的随机森林模型。同时进行朴素贝叶斯、支持向量机及人工神经网络等其他较为常用的机器学习方法的计算,并将所有结果与随机森林模型进行相关对比。

1.3 统计学处理

2 结 果

2.1 一般资料

1 362例患者中合并AKI 270例(19.82%),119例(8.74%)患者给予机械通气。两组患者血小板、球蛋白、入院时体温、血钠、丙氨酸氨基转移酶、天门冬氨酸氨基转移酶比较,差异无统计学意义(P>0.05);其余各指标比较,差异均有统计学意义(P<0.05),见表1。

表1 两组患者一般资料比较

2.2 模型测试

共341例测试数据库中患者进行预测,其中290例患者预测正确,正确率为85.04%。见表2。

表2 随机森林模型测试结果

2.3 预测效能

随机森林模型AUC为0.894,均高于其余3种模型,灵敏度为0.792,特异度为0.867。见表3。首次肌酐、尿素值、机械通气、年龄、D-二聚体为其前五重要变量。

表3 各模型预测效能比较

3 讨 论

随着大数据时代的到来,更多的人工智能算法也同样用于医学各领域中,随机森林法就是其中之一,其在医学大数据的处理中表现出了极高的效能,特别是在基因、药物、疾病等领域中展现出了其独有的特点,既往对AMI并发AKI患者多采用多因素logistic回归模型进行预测,应用随机森林模型的研究仍较少见[7]。本研究通过建立随机森林模型进行疾病的预测,最终对测试数据库评估的结果显示,该模型预测准确率为85.04%,AUC值为0.894,均高于其余3种模型,灵敏度为0.792,特异度为0.867,提示该预测模型预测能力较好,且高于其余3种常用的机器学习模型。

本研究对所选取的自变量进行了重要性排序,结果显示,首次肌酐、尿素值、机械通气、年龄、D-二聚体为其前五重要变量。肌酐及尿素值代表了患者肾功能情况的基线水平,既往研究表明,AMI合并AKI的预测中肾功能为其重要的影响因素之一[14]。AMI患者全身各器官均会在一定程度上出现灌注不足的情况,对肾功能基线水平较差的患者而言,病情将会进一步加重,故在临床工作中应对AMI患者进行常规肾功能基线水平测定,实时掌握患者病情的进展情况。D-二聚体作为一种血栓标志物,常用于如肺栓塞的诊断中,同时也可用于AMI的早期诊断及预后预测[8]。既往对糖尿病肾病早期肾损伤的研究表明,D-二聚体同样与肾脏功能密切相关[15]。因此推测,D-二聚体在AMI患者合并AKI的预测中具有一定的价值。

本研究模型中年龄因素同样占据一定的重要性,合并AKI患者年龄明显大于未合并AKI者,与既往研究结果相似[9]。另一方面,本研究中是否给予机械通气也为模型中的重要因素之一,分析其原因在于AMI患者一般情况下病情较为危重,发生心、肺功能障碍或衰竭的风险加大,本研究1 362例患者中8.74%使用了机械通气治疗。既往研究表明,机械通气是发生AKI的独立危险因素,对患者血流动力学、炎性反应等多方面造成一定程度的影响,同时,发生AKI后又会反作用于机械通气的治疗及预后,故而对此类患者而言,机械通气模式及参数的设定显得尤为重要,将会直接影响患者预后[10]。

既往研究将随机森林模型用于预测造影剂所致的AKI中,同时还与传统Logistic回归模型进行了相关对比,最终结果显示,机器学习模式明显优于传统模式[11]。本研究将随机森林预测模型与其他3种机器学习模型进行了相关对比,结果显示,随机森林模型预测效能均优于其余3种,分析其中原因在于,本研究1 362例患者并非全部进行了冠状动脉造影,因此,未能对造影剂所致的AKI进行相关区分;另一方面本研究人群与国外研究人群存在一定的差异,纳入的自变量也存在一定的不同。与国外研究对比发现,肾脏功能基线水平、年龄均被纳入模型中,由此可见,此两项对AMI患者是否发生AKI的预测具有非常重要的参考价值[12]。但本研究仍存在一些不足和局限:(1)因自变量选取较多,在实际临床工作中可能实用性方面有所制约;(2)仅为单中心研究,样本来源受限,特别是对一些缺失值较多的变量被迫进行了剔除,导致结果可能存在一定的偏倚。

综上所述,基于随机森林模型对AMI患者是否发生AKI具有较好的预测效能,在实际临床工作中具有一定的参考价值,特别是对变量数据不存在缺失的患者建议积极使用。

猜你喜欢

二聚体肌酐通气
不通气的鼻孔
实用无创机械通气技术进修班招生简介
D-二聚体和BNP与ACS近期不良心血管事件发生的关联性
血肌酐水平对慢性心力衰竭患者预后判断的临床意义
肌酐-胱抑素C公式在糖尿病肾病超滤过检出中的作用
联合检测D-二聚体和CA153在乳腺癌诊治中的临床意义
两种试剂D-二聚体检测值与纤维蛋白降解产物值的相关性研究
判断肾功能的可靠旨标血肌酐
通气汤联合艾灸防治妇产科术后腹胀40例
血肌酐、胱抑素C、简化MDRD和Le Bricon公式在评估肾移植术后肾功能中的作用