APP下载

基于迭代决策树的ICU临床干预预测

2020-12-25张娅峰

计算机技术与发展 2020年12期
关键词:预测临床模型

张娅峰,龚 振

(华南理工大学,广东 广州 510641)

0 引 言

“AI+医疗”目前成为热门领域,将AI技术应用到医疗领域是发展的大趋势,近年来,许多成功的研究成果发表在《Nature》、《Cell》、《JAMA》、《NEJM》等顶级期刊上,受到了学业界、工业界和监管机构的极大关注。人工智能,特别是深度学习,是开始用于解释医学影像和电子健康记录的主要技术工具之一。而在ICU科室,因为收治患者的特殊性,每位患者都包含大量的实时生命体征数据以及其他干预、实验室检查等数据,是人工智能应用的完美场景[1-2]。目前已有大量研究以患者死亡风险作为预测任务进行建模[3-5],因为预测患者的死亡风险,可以合理分配抢救的资源,及早地进行干预以提高患者的生存率,该任务主要根据固定的时间间隔(通常是入ICU后的前24小时)的数据进行预测,不包含患者在整个ICU住院期间不断产生的临床数据。一些学者则以特定的疾病发生为预测任务建立预测模型,通常选定的疾病是会对患者生命造成严重影响的。Savin等人通过树学习模型的机器学习方法对NICU(神经重症监护)医源性脑室炎、脑膜炎的发生进行预测,并试图探究主要影响因素[6]。Jawad I等人则对ICU患者感染性休克发生的概率进行预测,建立的感染性休克预警模型,使得患者的ICU存活率得到明显提升[7]。ICU是临床科室中数字医疗设备最多的地方。ICU的设备必须配有床边监护仪、中心监护仪、多功能呼吸治疗机、麻醉机、心电图机、除颤仪、起搏器、输液泵等。这些数字医疗设备产生的数据、医护人员操作的数据以及患者在其他科室及实验室产生的数据使得ICU成为多种信息交汇的地方。通常可以大致分为以下几大类:(1)人口统计学数据,即患者的姓名、出生日期、出生地等等;(2)生命体征数据包括血压、体温、心率、心电等,由仪器自动实时采集,频率为每五秒钟记录一次;(3)实验室检验检查数据,通常医生根据患者病情做出是否需要做该项检验的判断,从而产生相应的数据,因此数据频率不确定,可能是一天也可能是几天;(4)患者的用药记录也包括患者的出入量的详细记录。这部分数据大部分由护士实际操作后记录下来;(5)干预措施,例如气管插管或者发生抢救行为等;(6)医生写的文本格式的病程记录。而基于这些高维的监测数据,数据源嘈杂,稀疏,异构且结果不平衡,预判患者在何时需要进行干预治疗对ICU临床工作人员来说是一项非常具有挑战性的工作,在不恰当的时机进行干预可能会对患者造成二次伤害。相比于人类专家,AI算法在执行任务的过程中具有更快的速度、更高的一致性和可重复性,使得临床医生和人工智能在共同工作时能产生1+1>2的协同效应。

急性肾损伤(AKI)是重症监护病房中感染性休克的患者的常见并发症,通常伴随较高的死亡率[8-10]。大约70%的AKI患者需要进行肾脏替代治疗(RRT),住院死亡率超过60%[11]。连续肾脏替代治疗(CRRT)是重症监护室中一种常见的临床干预措施。通常使用各种用于代谢,溶质和体液控制的参数来指导治疗的开始和终止[12]。CRRT可以提高ICU的存活率,因为它通过调节乳酸盐的清除,不可测的阴离子以及磷酸盐和氯化物的含量来纠正代谢性酸中毒。但ICU患者的连续肾脏替代疗法(CRRT)的提供情况千差万别,主要还是基于经验主义和当地机构的实践和资源。有经验的医生通过长时间在床旁观察患者实时的生命体征数据可以及时发现患者病情好转或者恶化的信号,但这个过程非常耗时,并且一位医生不能同时兼顾多位患者。机器学习算法可以利用所有可用信息来预测每个患者未来可能发生的事件,并且能够捕获大量随时间变化的变量之间的复杂关系。因此该文使用机器学习算法对CRRT干预启动进行建模预测,从历史干预的数据中学习,从而形成相应的预警模型,使得医生能够在忙于抢救某一患者的同时,也不耽误对其他患者病情的监测和预警;同时,在适当的时候采取适当的干预措施对于改善败血症性休克肾衰竭患者的医院预后非常重要。

1 梯度提升迭代决策树相关理论

算法的迭代步骤如下:

(1)初始化弱学习器:

(1)

(2)对于m=1,2,…,M:

(a)对i=1,2,…M;计算负梯度,即残差。

(2)

(b)对rmi拟合一个回归树,得到第m棵树的叶节点区域Rmy,j=1,2,…,J。

(c)对j=1,2,…,J,计算最佳拟合值。

(3)

(d)更新强学习器。

(4)

(3)得到最终学习器。

(5)

2 数据来源及预测任务

2.1 数据来源

该文数据来自于某三甲医院,该ICU是国家重点专科所在科室,在功能配置、医疗技术和管理方面达到世界先进水平。自重症医疗信息系统2017年底上线以来,对于患者的数据进行了非常详实的记录,主要包括:病人基本信息,生命体征观察项,导管管理,液体管理,护理记录,病程记录等,能够为该文的研究提供精细化的数据和优质的经验。截至2019年7月,系统采集了大约752位患者ICU记录。由于80%患者的住ICU时长少于15天,因此将总时长小于6小时(避免没有充足的信息用来做决策)以及大于360小时(避免一些病情过重的患者)的患者排除,这样就可以专注于那些通过干预有机会康复的患者。正如大多数文献所提到的,该文只考虑每位患者的首次入科的完整记录。根据这些条件过滤后,最终获得了522名患者的队列。

2.2 数据提取与预处理

数据预处理是数据挖掘中的关键步骤,是指在分析建模之前对数据进行人为处理,数据预处理的质量对后续数据的正确分析具有巨大的影响,甚至决定了最终的性能表现。原始数据往往是脏数据,含有大量的噪声,数据预处理主要是对原数据进行清洗,筛选出与研究目的相关的数据,并去除噪声。因此对于符合队列选择标准的N个患者队列中的每个患者n,从重症信息数据库中提取以下三个数组:临床观察的时间序列xn以及相对应的临床干预状态yn,与此同时,还提取了患者静态人口学相关信息。

(1)临床观察数组xn=[xn1,xn2,…,xnt,…,xnT]在每一个时刻有34个变量,其中包含生命体征变量:中心静脉压,收缩压,舒张压,心率,呼吸频率,体温,血氧饱和度,吸氧浓度;实验室检查指标:阴离子间隙,肌酐,尿素氮,酸碱度,血红蛋白浓度,钾离子浓度,乳酸等以及出入量指标(尿量);生命体征数据由监护仪每5秒钟产生一次,但是系统通常在5~60分钟保存一条记录,实验室检查指标通常ICU患者每日至少会抽取动脉血或者静脉血一次进行检测从而报告相应的数值。出入量中的尿量值一定程度上能够反映患者肾功能的状况,因此通常每小时记录一次,数值为此刻与上一记录时刻的时间间隔内患者的尿量累计值。在数据预处理阶段,首先将患者的所有临床观测记录在时间轴上进行对齐,时间索引处理为入科小时数;若同一小时内有多个信号测量值,其中生命体征以及实验室检查变量取这些测量结果的平均值;对于尿量值,则取多条记录的总和。对于记录中的缺失值,采用前向填充法,即用上一时刻的取值替代,直到有新的测量值产生。

(2)患者n的干预状态yn=[yn1,yn2,…,ynt,…,ynT] 是一个二进制时间序列,每一个ynt表示患者n在t时刻是否进行了干预。一位患者进入ICU后可能会发生多次CRRT干预,该文考虑对患者进入ICU后的首次干预进行预测。

(3)静态人口学信息sn包含性别、年龄、身高、体重;以入科时记录为准,并且在患者的该次ICU住院期间不会发生改变。基于患者的身高和体重,计算了一个新的BMI变量。对于其中部分患者身高或者是体重的缺失,采取的方法是分男女分别拟合一个身高与体重的回归方程用于填补缺失值。对于静态变量,则将其在每位患者自身的所有时间序列上不断往后复制。

图1 数据预处理及特征提取

2.3 预测任务及模型构建

图2 采样方式

3 实验及结果分析

3.1 评估指标

该文将临床干预预测问题抽象为机器学习中的二分类问题,因此采用机器学习中常用的准确率(precision)、召回率(recall)以及F1分数作为实验的评估指标。准确率是指:对于给定的测试集数据,被分类器判断为需要干预的样本中正确的比例。

(6)

召回率即所有实际发生干预的患者中被模型预测对的比重。

(7)

与此同时,F1-Score指标可以看作是准确率和召回率的加权平均,综合了二者的产出的结果。F1-Score的取值范围从0到1,1代表模型的输出最好,0代表模型的输出最差。该文分别对6种参考模型计算precision、recall以及F1-Score进行分类性能对比[19]。

3.2 实验及结果分析

按照7∶3的比例将所有样本划分为建模样本和测试样本,为保证模型性能的稳定性,选用5折交叉检验方法进行评估。除迭代决策树模型外,还对比了逻辑回归、随机森林、多层感知机、支持向量机四种参考模型,并使用网格搜索方法,对上述模型分别尝试了72,72,64,72,72种参数组合。实验报告了每个模型在最优参数组合下的预测结果,如表1所示。

表1 五种机器学习模型结果比较

在使用机器学习的分类问题中,准确率和召回率通常是相互影响的。理想的情况是两者都取得比较高的值。因此,从综合结果来看,迭代决策树的准确率和召回率均在0.8以上,F1分数最高,表现最优。其中,逻辑回归的结果最差,其性能远低于迭代决策树模型,这可能是数据线性不可分造成的。

4 结束语

就临床干预预测问题而言,目前利用机器学习方法对ICU临床数据进行干预预测的现有相关文献大多集中于MIMIC Ⅲ医疗信息市场的重症监护(MIMIC)数据集[20-21]。有研究表明,基于本地电子病历数据开发的预测模型的预测性能往往高于基于大队列研究的预测模型。因此,本研究中的结果基于本地数据,尝试多种机器学习模型,已经达到一定的准确率和召回率,能够满足一定的应用需求,高效的分类算法能够大大节省临床医生们的时间和精力,并提供重要的辅助信息。在未来的工作中,可尝试使用深度学习的方法处理这类时间序列数据,以便能够更好地提取和利用时间序列数据中包含的患者信息,提高预测性能。

猜你喜欢

预测临床模型
无可预测
适用于BDS-3 PPP的随机模型
X线与CT引导下骨病变穿刺活检的临床应用
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
舒肝宁心汤治疗心悸的临床观察
选修2—2期中考试预测卷(A卷)
自制空间站模型
复合妊娠32例手术治疗的临床观察
模型小览(二)