APP下载

基于机器学习算法构建重症急性胰腺炎病人肠内营养误吸风险的预测模型

2022-08-12官艳张国娇罗茵

临床外科杂志 2022年7期
关键词:效能变量机器

官艳 张国娇 罗茵

重症急性胰腺炎(severe acute pancreatitis,SAP)是临床上常见的危急重症之一,死亡率达20%~30%[1-3]。早期肠内营养(≤48小时)可以降低病人死亡率[4-6]。误吸是早期肠内营养常见的严重并发症,其发生率达30%[7]。早期预测肠内营养误吸风险,对降低误吸发生率具有重要临床意义。机器学习算法是通过监督、无监督或半监督方法,对存在大量复杂关系的变量进行反复迭代分析,具有直观、预测效能高等优点[8-9]。本研究分析296例SAP病人实施早期肠内营养误吸发生的情况,使用新型机器学习算法构建重症急性胰腺炎病人早期肠内营养误吸风险的预测模型。

对象与方法

一、对象

2012年1月~2019年12月就诊的重症急性胰腺炎病人296例。纳入标准:(1)年龄≥18岁;(2)依据中华医学会急性胰腺炎诊疗指南(2014)明确诊断为SAP;(3)进入ICU后24小时至48小时以内接受肠内营养治疗,且肠内营养时间1周以上;(4)病人及家属对治疗方法知情并签署知情同意书。纳入变量包括年龄、性别、身高、体重、体位、急性生理与慢性健康评分(APACHE-II评分)、意识状态、营养风险、鼻饲管置入长度、白细胞计数、淋巴细胞计数、血小板计数、中性粒细胞计数等。

二、方法

1.观察指标:SAP病人给予肠内营养期间是否发生误吸作为主要观察指标。误吸的诊断标准:(1)在实施肠内营养过程中,病人具有呛咳、呼吸急速、心率加快等典型临床表现;(2)病人的口鼻腔有残留的肠内营养液,或吸痰之后可见痰液中有肠内营养液;(3)对病人进行呼吸道分泌物PH值监测,以PH<7作为误吸诊断标准;(4)对于怀疑误吸的病人,留取呼吸道分泌物并监测胃蛋白酶,阳性提示有误吸现象;(5)采取肺纤维支气管镜检查,发现呼吸道有胃内容物存在。以上任何1项均可作为SAP病人实施肠内营养之后发生误吸的诊断标准。

2.机器学习模型构建的评价:将数据按照随机分组的原则,分为训练集队列(70%)和验证集队列(30%)。按照机器学习的算法,纳入随机森林、神经网络、决策树、支持向量机和广义线性回归算法,观察不同算法的表现[10-12]。根据算法中的β指数迭代权重,评估变量对结局指标的影响。变量的β指数越高,则说明该变量在预测结局指标中发挥的作用越大。随后根据变量的权重值,对可能引起变量预测变化的相关因素进行排名,用于模型构建。构建机器学习模型后,采取重抽样和十倍交叉验证模型的稳健性。评估每个模型的预测效能,采用受试者工作曲线和决策曲线分析。曲线下面积(area under the curve,AUC)用于反映模型的预测效能,决策曲线分析(decision curve analysis,DCA)通过重分类改善指标,评估阈值概率(切点值分类后的构成比)评估预测模型的效能[13]。在不同的阈值概率上,对应曲线的净获益越大,则说明模型的预测效能越高。

三、统计学方法

结果

1.SAP病人误吸情况 :296例病人中未发生误吸268例,发生误吸28例。两组病人年龄、性别、体位、体重指数(BMI)、中性粒细胞-淋巴细胞比值(NLR)、淋巴细胞-单核细胞比值(LMR)比较,差异无统计学意义(P>0.05)。APACHE-II评分、意识状态、营养风险、鼻饲管置入长度、中性粒细胞计数、淋巴细胞计数、血小板计数、血小板-淋巴细胞比值(PLR)等比较,差异有统计学意义意义(P<0.05)。两组病人一般资料比较,见表1。

表1 两组病人一般资料比较

2.SAP病人误吸影响因素分析:为了消除候选变量间数值差异过大,或因过拟合造成的影响,本研究采用Sigmoid函数处理非线性数据,以及根据最大化数据分离的标准反复分割数据集。利用递归特征消除算法,从15个临床资料特征中提取8个特征,其中包含了5个关键特征因子,分别是APACHE-II评分、意识状况、营养风险、鼻饲管置入长度、PLR。无论是采用机器学习反复迭代分析,还是采用广义线性模型进行二分类学习,其关键特征因子均保持高度匹配。具体提取特征因子见表2。

表2 机器学习递归特征消除算法筛选的关键变量

3.机器学习模型的性能比较:将筛选得到的最优候选变量纳入到各类分类器中,并采用十折交叉验证对模型进行训练和评估。见图1A。图1A可以看出,随机森林模型有着最高的预测效能,其AUC值为0.976,其次为神经网络(AUC=0.973)、决策树(AUC=0.961)、支持向量机(AUC=0.932)和广义线性回归算法(AUC=0.921)。与ROC曲线的结果一致,利用DCA评估机器学习模型的临床受益,当随机森林模型预测SAP病人发生误吸概率阈值为0.01时,模型提供了最优的预测效能(图1B)。利用验证集队列对预测模型进行验证,见图2。

讨论

SAP是临床上常见的急危重症,主要是由多种因素导致胰酶在胰腺内被异常激活,而胰酶可以对胰腺细胞造成损伤。SAP约占胰腺炎发病的20%~30%,未能得到及时治疗可导致死亡风险增加[3]。SAP病人存在肠道屏障损害,肠黏膜通透性增加,肠道菌群移位,炎症因子扩散,肠源性感染的风险增加[14]。对SAP病人实施早期肠内营养可以促使肠黏膜生长,维持肠道表皮细胞的完整性,减少并发症的发生率。肠内营养的途径包括经口、经鼻胃管、经鼻空肠管等途径,误吸是肠内营养最常见的并发症。评估SAP病人误吸风险因素具有重要临床意义。本研究基于机器学习算法,将候选变量纳入机器学习模型中,利用反复迭代无监督学习,筛选有意义的预测变量,构建可视化预测评估模型,借助我们构建的机器学习预测模型,可以使SAP病人误吸风险计算实现便捷化、可视化。

A.受试者工作曲线评估每个模型的预测效能;B.决策曲线分析评估每个模型的预测效能图1 机器学习模型在训练队列中的预测效能比较

A.受试者工作曲线评估每个模型的预测效能;B.决策曲线分析评估每个模型的预测效能图2 机器学习模型在验证队列中的预测效能比较

本研究结果表明,无论是采用传统的广义线性模型,还是通过使用不同机器学习算法,结果均显示APACHE-II评分、意识障碍、营养风险、管饲置入长度以及炎性因子比值在候选变量中占有很大的权重。Cardoso 等[15]研究表明,APACHE-II评分越高,病人发生误吸的风险越大,该评分系统能够反映病情的严重程度,临床上可用于动态评估病情变化。本研究纳入APACHE-II评分作为候选变量,可以提升预测模型的准确度,用于临床预见性治疗评估,预防误吸发生。与单独使用APACHE-II评分预测误吸风险比较,联合炎性因子比值和临床相关指标,可以更好地预测误吸风险。有研究表明,炎性因子在SAP的病情发展中发挥着关键作用,白细胞介素-6、肿瘤坏死因子-α可以激活中性粒细胞和氧自由基,造成脏器损伤[16]。此外,大量炎性因子活化导致肠道屏障受损,使SAP病人肠蠕动减少,增加了误吸发生几率。本研究通过机器学习算法,发现NLR、PLR可用于评估误吸风险,这提示在行肠内营养之前,应该重视控制和减少炎性因子的产生,以减少误吸风险发生。另外,中性粒细胞计数、淋巴细胞计数、血小板计数等是血常规中的常见指标,其获取较为便捷,易于评估。

多因素Logistic回归分析以及反复迭代分析,结果均显示置入管饲的深度是影响SAP病人发生误吸的独立危险因素。针对SAP病人实施肠内营养治疗,要兼顾喂养方式与鼻饲管置入长度。本研究还发现,营养风险与意识障碍是预测SAP病人发生误吸的独立危险因素。Marchetti 等[17]研究表明,高营养风险与病人发生院内死亡的风险呈显著正相关。这是因为高营养风险病人需要接受更多的治疗措施,如气管插管、气管切开以及置入鼻饲管等,这些均可以增加病人误吸风险。戴卉等[18]研究表明,意识障碍病人咳嗽反射能力下降,气道防御性保护能力降低,从而导致吞咽障碍,诱发误吸。因此,对SAP病人实施临床干预时,应该预防口咽分泌物进入下呼吸道,预防误吸发生。

本研究基于机器学习算法建立了SAP病人早期肠内营养误吸风险预测模型,其中随机森林模型表现最优,可用于精确预测SAP病人早期肠内营养误吸风险,可以为临床决策提供参考,帮助医患共同实现最优个体化治疗方案。

致谢

本文承华中科技大学同济医学院附属同济医院肝脏外科黄志勇教授亲自指导,特此感谢。

猜你喜欢

效能变量机器
机器狗
立足优化设计提高作业效能
机器狗
红外空空导弹抗干扰效能评估建模
提升水域救援装备应用效能的思考
聚焦双变量“存在性或任意性”问题
地方机构改革“+”与“-”——减的是机构,加的是效能
未来机器城
分离变量法:常见的通性通法
不可忽视变量的离散与连续