APP下载

基于机器学习的创伤性休克患者院内死亡预测模型研究

2023-06-14张爱舷罗嘉琪张晓萌

解放军医学院学报 2023年4期
关键词:机器入院曲线

张 晗,张爱舷,罗嘉琪,张晓萌,陈 力

1 解放军医学院,北京 100853;2 解放军总医院第一医学中心急诊科,北京 100853;3 解放军总医院第一医学中心全科医学科,北京 100853

调查显示,我国创伤的总发病率高达50%,病死率为19/100 000,是引起青少年人群死亡的首要原因[1-3]。而创伤性休克(traumatic shock,TS)是创伤患者的严重并发症,是引发患者死亡的主要因素之一[4]。因此,关注TS 患者的预后具有重要意义。构建预测模型是研究患者预后的常见方法。但针对TS 患者,目前大部分研究为预警模型研究,预后模型研究则较为少见[5-6]。

随着检测技术的发展,获取实验室检查指标越来越方便快捷,尤其以血气分析为代表,借助最新的便携式血气分析仪,在理想条件下可以将检测时间控制在3 min 左右[7],这为利用这些指标建立预测模型来帮助医务人员进行快速早期伤情判断及辅助临床决策创造了条件。另外,近年来包括机器学习在内的人工智能技术逐渐应用于医疗领域。机器学习技术在发掘医疗数据关系和建立临床预测模型方面具有独特的优势[8]。本研究旨在通过构建基于机器学习的TS 患者院内死亡预测模型,探讨患者入院早期指标和机器学习技术对TS 患者院内死亡的预测价值,以期为今后建立和完善TS 患者预后预测模型提供参考和借鉴。

资料与方法

1 数据来源 本研究为回顾性研究,用于模型训练及验证的数据均来源于解放军总医院第一医学中心急诊科收治的TS 患者临床数据。2014 年6 月 - 2021 年5 月收治TS 患者的临床数据用于建模及内部验证,2021 年6 - 12 月收治TS 患者的临床数据用于外部验证。纳入标准:(1)因创伤入院;(2)入院前或入院时已诊断为TS;(3)入院休克指数(shock index,SI)≥1。排除标准:(1)未成年患者,即年龄<16 岁;(2)发生创伤到入院时间>48 h;(3)存在严重影响特征参数的基础疾病和用药史,如房颤、哮喘、二甲双胍用药史等;(4)无法明确临床结局的患者。同时满足纳入标准中的(1)、(2)或(1)、(3)且不存在排除标准中提及的各类情况的病例即纳入本次研究。本研究符合医学伦理学标准,并且已通过解放军总医院第一医学中心医学伦理委员会审查(审批号:S2022-068-02 号)。

2 结局指标 以TS 患者本次出院时是否存活作为结局指标,本研究将基于机器学习算法,利用TS 患者入急诊后10 min 内可获取的早期指标,开发TS 患者院内死亡预测模型,用于预测患者出院时是否存活。

3 数据收集 基于此次研究目的,参考相关临床研究经验,结合患者信息的数据特点,我们收集以下数据。(1)人口统计学信息:性别、年龄、院内生存情况;(2)病程信息:伤因、伤部、受伤到入院的转运时间;(3)入院时的生命体征信息:心率(heart rate,HR)、体温(body temperature,T)、呼吸频率(respiratory rate,RR)、收缩压(systolic blood pressure,SBP)、舒张压(diastolic blood pressure,DBP)、动脉血氧饱和度(arterial oxyhemoglobin saturation,SaO2)、意识状态;(4)入院血气分析结果:酸碱度(potential of hydrogen,pH)、二氧化碳分压(partial pressure of carbon dioxide,PCO2)、氧分压(partial pressure of oxygen,PO2)、血钠(serum natrium,Na)、血钾(serum kalium,K)、血钙(serum calcium,Ca)、血糖(blood glucose,Glu)、血乳酸(blood lactate,Lac)、红细胞比容(hematocrit,HCT)、实际碳酸氢盐(actual bicarbonate,AB)、标准碳酸氢盐(standard bicarbonate,SB)、二氧化碳总量(total carbon dioxide,TCO2)、剩余碱(base excess,BE)。其中,院内生存情况用作本研究的结局指标。患者年龄、性别、伤因、转运时间、入院生命体征(意识、HR、T、RR、SBP、DBP、SaO2)以及入院血气分析结果(pH、 PCO2、PO2、 Na、 K、Ca、Glu、Lac、HCT、AB、SB、TCO2、BE)等24 项指标用作本研究初始备选特征,经特征重要性分析后,保留合适的指标进行建模。

4 数据预处理 删除缺失信息和出现不合逻辑异常值的病例数据。对性别、伤因、意识状态等无等级含义的多分类变量进行独热编码。另外,由于死亡病例显著少于存活病例,导致数据出现严重不平衡,故在建模前采用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)进行不平衡处理。SMOTE 利用插值为少数类合成新的样本,克服了随机过采样技术容易过拟合的问题,是机器学习技术常用的不平衡数据处理方法[9]。

5 模型开发与验证 采用Python(3.6.15) 基于决策树(decision tree,DT)、逻辑回归(logistic regression,LR)、随机森林(random forest,RF)三种分类算法建立模型,模型中训练集∶测试集=8∶2,并迭代50 次。最终以准确率、精确率、召回率、F值、受试者工作特征曲线下面积(area under receiver operator characteristic curve,AUC)等分类器性能指标评估模型预测效能。两模型间预测效能差异主要通过AUC 进行比较。模型的校准度和临床实用性分别通过校准曲线和决策曲线进行评估。

6 统计学分析 使用SPSS 25.0 对纳入患者的基本特征进行分析,根据数据类型及分布特点选择χ2检验、t检验或秩和检验进行比较,P<0.05 为差异有统计学意义。

结 果

1 数据基线特征 在建模及内部验证过程中,共筛选出281 例TS 患者纳入研究,具体纳入过程见图1,患者基线特征见表1。根据本研究的结局指标,即患者是否院内存活,将研究病例分为生存组(218 例)和死亡组(63 例)。总体上看,所有281例TS 患者中,绝大多数为男性(226 例,80.43%),致伤原因主要为车祸伤(165 例,58.72%)。在所有24 项备选特征中,性别、年龄、HR、Na、K、Ca 这6 项特征在生存组与死亡组之间无统计学差异(P>0.05),其余特征在两组间的差异有统计学意义(P<0.05)。死亡组患者PCO2、Glu 和Lac 的中位数较生存组高,而SBP、DBP、SaO2、pH、PO2、AB、SB、BE 和意识清楚患者构成比等特征的平均数或中位数则显著低于生存组。

表1 TS 患者不同临床结局组基线特征比较Tab. 1 Comparison of baseline characteristics between the two groups of TS patients with different clinical outcomes

图1 TS 患者纳入排除过程Fig.1 The inclusion and exclusion process of TS patients

2 特征重要性分析 对24 项备选特征进行重要性分析后,保留对构建模型有贡献的特征参数,包括患者年龄、伤因、转运时间、意识、HR、T、RR、SBP、DBP、SaO2、pH、 PCO2、PO2、Ca、Glu、Lac、HCT、AB、SB、BE 等20 项,结果见图2。如图所示,重要性排序前5 名依次为意识、SB、pH、SBP、SaO2,而PO2、T、PCO2、Ca和伤因等参数则排名靠后。在所有特征参数中,贡献度最高的参数为患者的意识状态,包括意识清楚(格拉斯哥昏迷评分=15 分)和意识不清(格拉斯哥昏迷评分<15 分)。这提示患者入院时的意识状态与患者的预后可能存在较为紧密的联系。

图2 特征重要性排名Fig.2 Ranking of important features

3 预测模型效能比较 基于DT、LR、RF 三种分类算法建立院内死亡预测模型,各模型经过内部验证得到的预测效能见表2,ROC 曲线见图3,校准曲线见图4,决策曲线见图5。从模型区分度的角度看,三种模型的准确率、精确率、召回率、F值、AUC 等指标均值均大于0.75,表明它们对正负样本的区分能力较强。其中,RF 模型的AUC(0.856,95%CI:0.847 ~ 0.865)最高,LR 模型的AUC 次之(0.801,95%CI:0.780 ~ 0.822),DT 模型的AUC(0.756,95%CI:0.740 ~ 0.772)最低。三种模型的AUC 进行两两比较,差异均有统计学意义(P<0.05)。 在模型校准度方面,三种模型的校准曲线主要位于对角线上方,提示对死亡风险有所低估。其中,RF 模型与对角线最贴近,表明RF 模型的校准度最好。利用决策曲线对模型的临床效用进行评估,RF 模型的决策曲线距离参照线最远,说明利用RF 模型评估TS 患者院内死亡风险的临床净获益优于LR 和DT 模型。

表2 三种模型对TS 患者院内死亡预测效能Tab. 2 In-hospital mortality prediction performance of 3 models for TS patients

图3 三种模型预测TS 患者院内死亡的ROC 曲线Fig.3 ROC curve of 3 models for TS patients in-hospital mortality prediction

图4 三种模型预测TS 患者院内死亡的校准曲线Fig.4 Calibration curve of 3 models for TS patients in-hospital mortality prediction

图5 三种模型预测TS 患者院内死亡的决策曲线Fig.5 Decision curve analysis of 3 models for TS patients in-hospital mortality prediction

4 模型外部验证 从解放军总医院第一医学中心急诊科2021 年6 月 - 2021 年12 月收治患者中筛选出符合标准的TS 患者50 例(筛选过程见图1),对内部验证中表现最佳的RF 模型的最终迭代版本进行外部验证,测试模型的泛化能力。外部验证中RF 模型的预测效能见表3。可以看出,RF 模型外部验证集中的AUC(0.741)较内部验证集(0.856)有所下降,但仍大于0.7。其他各项性能指标内外部验证集中保持相似水平,提示本研究建立的RF 模型具有较强的外部泛化能力。

表3 RF 对TS 患者院内死亡预测效能内外部验证比较Tab. 3 Comparison of in-hospital mortality prediction performance of RF models for TS patients in internal and external validation

讨 论

TS 是严重创伤患者致死的重要原因,尽快识别TS 患者死亡风险并及时处置,对防止患者病情进一步恶化和挽救患者生命很有意义[10-13]。同时,TS 作为创伤患者经常合并的一类临床综合征,通过患者生命体征和典型的临床表现对其早期识别和诊断的技术已经比较成熟[14]。但TS 几乎涵盖所有休克类型,受到复杂致伤机制和多种病理过程影响,其早期临床表现与病情严重程度往往并不相符[15],这为早期判断TS 患者的预后造成了困难。

目前临床上尚无特异的TS 预后判断工具,临床工作者往往利用通用的创伤检伤工具来辅助判断TS 患者预后,如利用简易检伤分类法(simple triage and rapid treatment,START)、检伤分类修正创伤评分(triage-revised trauma score,T-RTS)、CRAMS 评分(circulation,respiration,abdomen,motor,and speech)等简易检伤工具来进行早期快速伤情判断[16-17]。这类工具的优点是涉及指标较少,操作较为简易,可较快完成伤情评估,但正由于设计过于简易,其伤情判断的准确性通常较为有限[18]。相较之下,损伤严重度评分(injury severity score,ISS)和急性生理和慢性健康评分系统(acute physiology and chronic health evaluation,APACHE)等工具则因评估项目较全面而准确性更高,甚至作为很多创伤研究的“金标准”[19]。但其评估难度大、完成耗时长等特点显然限制了它们在严重TS 患者中的应用。

传统的评分模型依赖于通过逻辑回归分析对各参数进行赋分,具有模型解释性强的优点,但其难以处理复杂变量之间的交互作用,容易出现欠拟合[20],而机器学习分类算法能够避免这部分缺点。因此,本研究基于机器学习分类算法,利用患者年龄、入院生命体征、入院血气分析等早期指标来建立TS 患者死亡预测模型,期望可以辅助临床工作者对TS 患者预后进行早期判断。在模型的内部验证过程中RF 模型的预测表现最佳,其准确率(0.807)、精确率(0.886,)、召回率(0.866)、F值(0.876)、AUC(0.856,95%CI:0.847 ~ 0.865)等指标平均值均大于0.8,并且RF 模型在外部验证集中预测表现与内部验证相似,提示该模型对TS 患者院内生存病例和院内死亡病例的分类性能较强。

近年来,创伤救治相关领域也出现了许多基于机器学习的临床研究。赵宇卓[21]利用MIMICⅢ数据库中患者的生命体征和实验室检查等多项指标,建立了基于机器学习的创伤失血性休克预警模型,最优模型的AUC 可达0.98。Li 等[22]则通过随机森林算法建立创伤性凝血病的预测模型,其准确度可达到0.94。但针对TS 群体利用机器学习算法进行死亡预测,作者查阅文献后发现目前缺乏这方面相关研究。希望本研究可以为今后的相关研究提供一定的参考。

本研究存在一定的局限性:(1)本研究为单中心研究,可收集的样本量较少,限制了机器学习分类算法的选择,可能对模型效能产生不利影响;(2)基于现存数据库进行回顾性分析,难以确保TS 患者生命体征采集和血气采集的同时性,可能存在一定偏倚;(3)纳入的病例数据时间跨度长,这可能对整体数据质量造成不良影响。之后,我们将尝试克服以上局限,继续进行研究以不断改进模型的预测效能。

总之,通过建立基于机器学习的TS 患者院内死亡预测模型,在确保相当准确性的前提下,帮助医务人员尽快完成TS 患者死亡风险识别与病情判断,可以为后续的救治处理争取时间。另外,基于人工智能算法的预测模型通过直接搭载到电子系统,可以节省人力成本。随着人工智能和大数据技术的不断发展,相关研究在医疗领域的应用前景相信会越来越广阔。

作者贡献张晗:总体构思,方法设计,规范分析,撰写初稿;张爱舷:软件处理,参与方法设计和数据管理;罗嘉琪:有效验证,参与数据管理;张晓萌:数据管理;陈力:资金获取,资源提供,监督指导,审读和修订。

利益冲突所有作者声明无利益冲突。

数据共享声明本篇论文相关数据可依据合理理由从作者处获取,Email:928050098@qq.com。

猜你喜欢

机器入院曲线
利用信息技术再造急诊入院管理流程*
未来访谈:出版的第二增长曲线在哪里?
机器狗
机器狗
住院医师入院教育实践与效果探索
幸福曲线
沿平坦凸曲线Hilbert变换的L2有界性
未来机器城
作文门诊室
梦寐以求的S曲线