重型颅脑损伤合并多发伤患者早期死亡的决策树模型研究
2022-04-15朱飞奇
任 杰,朱飞奇
因外伤造成的损失占国家GDP的1%~3%[1],随着中国的经济发展,近几年意外伤害致死率跃升至第四位。意外创伤因受伤部位不同、性质复杂,常常形成多发伤,导致病情凶险复杂。其中颅脑损伤是多发伤中死亡风险最高,病情最难评估的类型[2]。目前的实验室检查和影像学检查难以全面反映患者的病情,因此临床使用各种评分系统反映患者的病情[3-4]。许多研究对目前评分系统的优异性进行验证,且建立了不同的评分系统[5-6],但研究[7]表明,根据多发伤的损伤机制及生理紊乱指标创造出普遍适用的评分是十分困难的,创伤结局危险因素的研究仍存在争议。决策树模型可用于连续变量和分类变量,并且分类不需要复杂的计算;此外,决策树模型的结果提供了有关主要属性对分类重要性的信息,从决策树模型的图形中,可以轻松地为具有特定属性的样本做出决策。在国外,决策树模型已经广泛应用到医学研究领域,用于各种疾病诊断和病情评估[8-10]。本研究旨在建立重型颅脑损伤合并多发伤患者早期死亡的临床预测模型,为医务工作者对重型颅脑损伤合并多发伤患者病情进展、预后评估提供便捷、有效的方法。
1 资料与方法
1.1数据来源 本研究中使用的数据来自开放数据库DRYAD网站(https://DATADDRYAD.org/),该网站允许用户免费下载原始数据,并基于原始数据进行二次分析(DryaD数据包https://doi.org/10.5061/dryad.bnzs7h45v)[11]。
1.2研究对象 该数据库包括从1996年1月1日~2013年1月1日1级创伤中心治疗的多发伤患者。该研究必须履行以下纳排标准:①成人患者;②在受伤后24小时内入院且ISS评分≥16分;GCS评分≤8分;③患有恶性肿瘤疾病、慢性病和影响肌肉骨骼系统的遗传障碍性疾病的患者被排除在外;④数据涵盖了在住院3天内包括生化、凝血、血气、肝功等所有临床数据;⑤急诊室采集入院时临床数据,包括乳酸(lactic acid, Lac)、碱剩余(buffuer excess, BE)、酸碱度(pH值)、格拉斯哥昏迷指数(The Glasgow Coma Index);⑥基于每个评分系统的标准,根据急诊科治疗结束时提供的系统评分,严格得分。
1.4决策树模型构建 总共1757例患者,排除812例有缺失值患者,共945例患者纳入。使用开放源代码R语言(版本3.2.2),随机选取756例患者(80%)作为训练子数据集,使用二元Logistic回归分析的差异变量(P<0.05)年龄、多发伤评分量表(PTGS)、新损伤严重度评分(NISS)、BE、Lac的数据进行数据挖掘和机器学习,使用分类和回归树(Classification And Regression Tree, CART)节点生成预测重型颅脑损伤合并多发伤的决策树模型并为决策树模型确定了以下参数:①使用基尼系数作为分类依据;②树的最大深度为4;③分裂内部节点所需的最小样本个数为20;④以及在叶节点上所需的最小样本数为个8;选取 189例患者(20%)作为验证子数据集,对决策树模型精确性进行验证,通过ROC曲线下灵敏度、特异度、总体准确性和曲线下面积评估决策树模型性能。其中灵敏度是正确预测不良临床结果的患者百分比,特异度是正确预测良好临床结果的患者百分比,总体准确性是正确预测患者临床结果的比率。
2 结果
2.1一般临床资料比较 一共有1757名受试者纳入分析,一般临床资料情况见表1。年龄、性别、ISS、NISS、GCS、pH、BE、Lac、与不良临床结果有关。
表1 受试者一般临床特征描述
2.2筛选独立危险因素的Logistic回归分析
本研究在建立重型颅脑损伤合并多发伤患者的决策树模型时,由于住院时间、住院ICU时间在入院时无法获取,故在进行独立危险因素的Logistic回归单变量分析前剔除住院时间、ICU时间。使用二元Logistic回归,将年龄、性别、ISS、NISS、PTGS、GCS、pH、BE、Lac等9个显著变量分别纳入单因素分析,结果显示生存组(n=1136)和死亡组(n=619)的年龄、ISS、NISS、PTGS、GCS、Lac、BE检验结果均具有统计学意义(P<0.05)。见表2。
表2 二元Logistic回归分析的结果
2.3建立决策树模型及模型的预测性能
决策树模型使用了年龄、Lac、NISS三个临床变量作为决策树模型的每一个节点。结果显示,Lac<4.7 mmol/L为根节点变量和最重要的预测因子,入院Lac<4.7 mmol/L人群发生早期病死率为22.93 %(158/689例),低于入院≥4.7 mmol/L人群(62.89%,161/256例)。见图1。
决策树模型随机抽取本研究189例(20%)患者,其中148例预测正确,41例预测错误,模型实现了0.78的整体精度,灵敏度为0.82,特异度为0.74。决策树模型的准确性较逻辑回归模型稍差;然而,决策树模型可视化优势明显,更适用于临床工作。
用于测试的逻辑回归模型的AUC为0.80。决策树模型的AUC为0.73。Logistic回归和决策树模型的ROC曲线见图2。
图1 重型颅脑损伤为主的多发伤患者预测早期死亡的决策树模型在决策树中, 椭圆节点表示条件, 矩形节点表示预测结果, 即生存或死亡的结果. 一个人可以从根节点开始(即,“乳酸<4.7 mmol/L”)并且比较患者乳酸的值与根节点中的条件. 如果患者的乳酸水平<4.7 mmol/L, 则可以移动至 “NISS<42”的下一下节点;否则, 跳转到 “NISS<49”的节点。继续将患者的属性值与树的其他内部节点进行比较, 直到达到矩形节点, 此时获得预测结果。乳酸是否<4.7 mmol/L是决策树的根节点;它的严重程度对结果预测至关重要。对于NISS或年龄具有重要意义。
图2 模型验证ROC曲线
3 讨论
2017年中国疾控中心研究指出1990~2017年中国人的十大死亡原因中,道路交通致死率排名第六[12],流行病学调查示多发伤合并颅脑损伤的发生率约为100/(10万)[13]。一项涉及1536名创伤患者的多中心观察性研究确定颅脑损伤是致死和致残的最常见原因[14]。重型颅脑损伤合并多发伤患者病情复杂,患者多伴有颅内出血、颅骨骨折、昏迷等因素,这些同时存在的因素导致患者病情急剧恶化,患者多死于脑疝或随后出现的MODS(多器官障碍综合征)、ARDS(急性呼吸窘迫综合征)等并发症[15],因此,对伤情及预后的准确评估至关重要。目前国内外针对多发伤有许多不同的评估方法,但重型颅脑损伤合并多发伤的病情尚无一种普遍认可的评估方法。本研究通过对数据库数据进行分析及对早期预后构建模型,最后发现年龄、Lac、BE、NISS、PTGS是患者早期死亡的独立危险因素。决策树模型包括Lac、NISS和年龄3个属性,在内部数据集呈现了良好的预测性能。这一发现表明,决策树模型是一个简单而有价值的模型,可以在患者中预测早期预后。
本研究中决策树模型主要在NISS评分和Lac水平基础上构建。Lac是反映组织低灌注、细胞缺氧的指标。目前,大量研究证实血Lac与多发伤、创伤性脑损伤存在联系[16-17],血Lac水平与严重创伤患者发生MODS密切相关,Moon等[18]的一项纳入829例多发伤患者的回顾性分析表明,初始血Lac水平是患者死亡的独立危险因素,并且在原有伤害严重程度评分中增加初始血Lac的测量可能增加创伤患者病死率的预测价值。在Dekker等[16]研究中发现在外伤患者预后预测方面,初始血Lac比Lac清除率更有价值,同时对于是否合并颅脑外伤的患者,初始血乳酸水平预测病死率时没有发现明显差异。NISS是Osler等[19]在ISS的基础上改良而来,该评分目前广泛应用于评估创伤患者病情严重度。NISS的定义是取身体3处最高AIS分值的平方和,而Rebeca等[20]在AIS的应用中发现无论是否存在多部位损伤,其损伤程度和病死率与AIS值的平方和均呈线性关系,但是因为NISS只从解剖角度考虑,忽略了生理因素,无法正确地反映年龄、健康状况等对预后的影响。
鉴于以上,本研究在充分数据基础上利用机器学习将NISS评分与生理数据、年龄等有机整合,构建早期预后生存模型,解决以往评分系统复杂、评估片面、临床难以应用等缺点,为目前重型颅脑损伤合并多发伤的病情评估提供可能的解决方案。本研究存在的主要缺陷:①尚无外部验证评估模型准确性;②模型是从DRYAD数据库中采集数据的回顾性分析,仍然需要前瞻性分析进一步寻找死亡危险因素;③需要临床中应用验证模型优劣性。