应用机器学习建立北京协和医院急性肾损伤预测模型:单中心研究计划
2021-12-02林剑峰国秀芝陈丽萌
郑 华,张 萌,赵 泽,林剑峰,国秀芝,夏 鹏,任 菲,邱 玲,周 炯,陈丽萌
中国医学科学院 北京协和医学院 北京协和医院 1肾内科 2内科 3病案科 5检验科 6疑难重症及罕见病国家重点实验室,北京 100730 4中国科学院计算技术研究所,北京 100190
急性肾损伤(acute kidney injury,AKI)是指多种原因造成的肾功能快速下降,改善全球肾脏病预后组织(Kidney Disease:Improving Global Outcomes,KDIGO)将其定义为48 h内血肌酐(serum creatinine,SCr)升高≥26.5 μmol/L或SCr升高≥1.5倍基线水平(已知或推测发生在7 d内)或尿量<0.5 mL/(kg·h)持续6 h[1]。住院患者发生AKI的原因包括肾前性、肾性(血管、肾小球、肾小管肾间质)及肾后梗阻性因素,其原因分布及发生率在不同科室间有较大差异[2]。既往多项研究结果显示,即使发生轻度AKI,无论重症监护病房或普通病房的患者,均与住院花费增加、住院时间延长、进展为终末期肾病[3-4]以及全因死亡风险增加显著相关[5-7]。文献提示[5],我国住院患者每年发生AKI者估计高达(140~290)万例,疾病负担较高;另一方面,AKI漏诊率高达74.2%,即使具有肾脏替代治疗指征的患者,仅59.3%可得到相应干预,提示我国AKI在识别、诊断及治疗等诸多环节均亟需提高。
基于电子病历系统(electronic medical record,EMR)数据进行AKI报警和相应干预在部分研究中已被证实可改善AKI患者转归、降低AKI相关死亡率[8-11]。因此,建立AKI早期预测模型,将干预端口进一步前移具有重要意义。随着机器学习技术的日趋成熟,基于EMR和人工智能技术构建的疾病风险预测模型不断涌现,已有部分研究尝试建立多学科跨病房的AKI统一预警模型。Cheng等[12]基于 48 995 例住院患者资料建立的随机森林(random forest,RF)模型预测未来24 h内发生AKI的曲线下面积(area under the curve,AUC)为0.765。Koyner等[13]纳入121 158例住院患者,应用梯度提升(gradient boost,GB)算法构建的模型将预测未来72 h内行肾脏替代治疗的AUC提升至0.900。Tomasev等[14]在一项多中心研究中利用循环神经网络(recurrent neural network,RNN)建立的单一模型将预测未来48 h内发生AKI的AUC提高至0.921。然而上述有关EMR与AKI的研究[9,11,15-16]主要集中于回顾性预测模型的建立,尚缺乏将AKI风险预测模型嵌入EMR继而针对高危风险人群进行干预的前瞻性研究。我国相关研究主要为基于传统统计学方法预测单学科病房住院期间内是否曾发生AKI[17-21],尚缺乏基于人工智能技术的大规模多学科病房含时效信息的AKI风险预警模型,尤其将AKI风险预警模型整合至EMR的研究尚属空白。本研究拟通过全病程全病历系统收集患者完整的临床信息,基于大样本数据及机器学习算法,建立多学科病房的AKI风险预警模型,并首次尝试在国内构建综合医院实时AKI风险预警系统,评价AKI高风险患者早期干预的获益。
1 预期目标
(1)以北京协和医院为代表,建立适合中国综合医院多学科病房住院患者的AKI预测模型;(2)评估该预测模型的准确性及前瞻性;(3)建立大型综合医院住院患者AKI转归的预测模型;(4)若回顾性研究建立的风险预测模型准确性良好,后续拟通过前瞻性干预试验,评估依据AKI风险预警模型对AKI高风险患者进行早期干预,对AKI发生率及患者转归的影响。
2 研究方案
本研究方案分为回顾性研究和前瞻性研究两部分,详细的研究流程见图1。
图1 整体研究设计路线图PUMCH:北京协和医院;SCr:血肌酐;EMR:电子病历系统;AKI:急性肾损伤
2.1 回顾性研究
2.1.1 资料与方法
2.1.1.1 AKI定义
本研究AKI的诊断标准参照KDIGO指南[1]相关定义,将48 h内SCr较基线升高≥26.5 μmol/L或SCr升高至基线值的1.5倍及以上,且此种升高已知或推测发生在7 d内定义为AKI。其中基线SCr定义为入院前3个月内与本次入院首次SCr测量值中的最低值。出于数据完整度考虑,AKI定义未纳入尿量相关标准。AKI分级:(1)AKI 1级:SCr升高至基线值的1.5~1.9倍,或较基线升高≥26.5 μmol/L。(2)AKI 2级:SCr升高至基线值的2.0~2.9倍。(3)AKI 3级:SCr升高至基线值的3.0倍以上,或升高至≥353.6 μmol/L,或开始肾脏替代治疗。严重AKI对应KDIGO指南中的AKI 3级。为方便判定同一患者住院期间发生多次AKI,若已诊断为AKI的患者超过4 d未行肾功能测量或SCr回落至基线以下,此后再次出现符合AKI定义的SCr变化被视为新发AKI。根据前期数据,4 d约等于相邻SCr测定的时间间隔分布的95%阈值。
2.1.1.2 研究对象
纳入2016年1月1日至2020年12月31日北京协和医院所有住院患者。排除标准:(1)非成年人(年龄<18岁);(2)住院期间SCr测量次数<2次;(3)入院时已被诊断为AKI;(4)基线SCr>353.5 μmol/L;(5)长期接受透析或入院前后24 h内行肾脏替代治疗的患者(图1)。
本研究通过北京协和医院伦理审查委员会审批(审批号:S-K1605),所有数据在进行分析前均去除个人隐私信息。
2.1.1.3 研究方法
2.1.1.3.1 样本量估算
由于预测模型的准确性受所使用的模型构建方法、数据处理、变量选取、后期参数调试等一系列因素影响,事前难以估算样本量。根据对2016年7月4日至2016年7月10日北京协和医院住院患者的分析,住院期间至少进行2次SCr测量的患者共1152例,其中院内发生AKI 132例(11.5%)。参照既往文献[13-14,22-23],本研究拟纳入120 000例至少曾进行2次SCr测定的住院患者。2016—2020年北京协和医院所有成年住院患者可满足上述数据需求。
2.1.1.3.2 数据收集
根据EMR收集入院患者的临床资料,包括(1)基本资料:性别、年龄、民族、籍贯;(2)住院期间生命体征(部分从住院病程中提取):血压、心率、呼吸频率、体温、外周氧合指数和液体出入量;(3)出院诊断的ICD-10编码;(4)实验室检查数据:包括住院期间全部检验数据和入院前3个月内及出院后1年内门/急诊肾功能检查数据,检查指标的具体时间以标本送检时间为准;(5)住院期间治疗医嘱。
2.1.1.3.3 数据处理
对来源于非检验科的连续变量均去除第百分位数为1~99之外的极端数值,以排除因录入错误导致的极端数值的干扰。数值缺失方面,连续变量取距离该时间段最近的数值作为替代值。若该患者在住院期间无任何1次数值记录,对于此类缺失在总人群的占比大于10%的变量,则采用虚拟变量法,即将缺失值转化为“未知”的特殊哑变量;若该变量为连续变量,则将连续变量转化为“极低”“低”“正常”“高”“极高”“缺失”;若缺失占比小于10%,可考虑多种插补法或取该科室当年全部患者的中位数进行填补替代,具体处理方式根据模型预测效果、敏感性分析、计算成本综合考虑。同时将此时间段内该连续变量实际测量次数纳入模型,以便模型利用“临床未复查/病程未记录”本身的信息价值。此外,患者本次住院的基线SCr、所有连续变量的末次测量值与住院期间该变量的标准差也被纳入相应时间段的预测模型。
2.1.1.4 终点事件和转归指标
主要终点事件包括肾脏相关终点事件(住院期间发生AKI/AKI 3级,后续进行肾脏替代治疗)和生存情况(住院期间死亡)。转归指标为AKI缓解,定义为进行肾脏替代治疗的患者中,出院前72 h内不再肾脏替代治疗;未进行肾脏替代治疗的患者中,出现SCr恢复(较住院期间SCr峰值回落≥30%或恢复至基线以下)。
2.1.1.5 特征选择
在进行预测模型构建前,对研究时间段内的数据和既往数据分别进行特征选择,以减少变量维度。本研究拟采用3种方法:(1)专家意见和参考文献:由1名具有10年以上肾内科工作经验的副主任医师、1名重症医学副主任医师以及外科、内科、急诊科医师各1名组成的委员会,参考既往AKI预测相关研究结论,投票决定重要性前5/10/15/20/30的数据特征,以供建立不同数目变量的模型(参见2.1.1.6)。(2)主成分分析:采用Bartlett球形检验和KMO (Kaiser-Meyer-Olkin)检验进行数据分布评估。通过正交旋转后得到相应特征量,初步设定的因子系数纳入标准为0.4。(3)弹性网络:弹性网络为使用L1和L2先验作为正则化矩阵的线性回归模型,兼具Lasso和岭回归的特点,具体惩罚因子有待研究中惩罚因子和变量系数的互动关系确定。具体应用方法或方法组合有待研究中根据模型预测效果,在调试中进一步确定。
2.1.1.6 预测模型
将全天24 h所有数据划分为4个6 h为1个时间段的数据进行分析。同时在每1天中设置第5个时间段,以纳入日期明确但具体时间不详的数据,便于预测模型进行数据处理(图2A)。待预测时段风险分析除了包含该时间段的数据外,还纳入既往数据。既往数据的选取方案可能包括:(1)此前48 h内门/急诊数据和48 h前至3个月内数据(包括既往史信息,图2A);(2)此前48 h内和48 h前至1年内的门急诊数据;(3)住院期间数据和近5年内既往住院和门急诊数据。最终方案根据预测效果而定。
根据AKI诊断标准,判断每个时间段的状态为“无AKI”“新发AKI”或“AKI病程中”,并对其对应的未来6 h、12 h、18 h、24 h、36 h、48 h、60 h、72 h内AKI风险进行预测(图2B,以预测未来48 h为例),若风险达到预定阈值,则系统发出AKI高风险预警。此外,对患者每个时段的预期SCr进行数值预测,与AKI风险预测提供相互参考(图2C)。
图2 预测模型的时间结构及预测的AKI发生风险与SCr变化A.以1例经门诊就诊并入院治疗的患者为例,该患者电子病历所有数据信息被均分为4个6 h为1个单位的时间段,图中以正方形表示。所有无具体时间的数据信息均归为该天的第5个时间段。现对患者入院后第1天(D1)第3个时段的数据进行分析。除该时间段数据外,同时将其近48 h及更早期的既往数据一起纳入模型。患者在住院第3天(D3)的第3个时间段发生了AKI事件。B.基于D1第3个时间段的数据,预测模型认为未来(以48 h内为例)发生AKI的概率达报警阈值,与第3天(D3)第3时间段内真实AKI事件对应,预测结果准确。C.患者住院期间SCr变化趋势,同时利用机器学习进行SCr预测,结合SCr预测值,辅助AKI判断AKI、SCr:同图1
拟使用6种有监督的机器学习方法对患者发生AKI与AKI 3级的概率、进行肾脏替代治疗的风险及住院期间SCr水平进行预测,包括Logistic回归、朴素贝叶斯(naive bayesian,NB)、RF、支持向量机(support vector machine,SVM)、GB、RNN。对于每种机器学习方法,分别建立包含前5/10/15/20/30/全部变量的模型进行预测。本研究拟将全部数据的70%用于模型建立(训练集),30%用于模型验证(验证集)。在模型调试和最终评价过程中使用10折交叉验证。对预测一致性最佳的机器学习模型,通过计算科室间最大校正均值差异(adjusted maximum mean discrepancy,adjMMD)评估该模型在不同科室间的可迁移性[23]。
2.1.1.7 偏倚控制
(1)为避免临床漏诊AKI造成的报告偏倚,本研究采用检验科提供的SCr而非出院诊断,作为判定AKI的依据;(2)纳入患者门诊检验数据,并对入院记录进行自然语言分析提取入院前(外院)SCr数值,减低因基线SCr不准确对AKI诊断的影响;(3)为控制选择偏倚,剔除入院前已发生AKI及基线SCr>353.5 μmol/L的患者;(4)在数据处理时对极端数值进行预处理,以减小因数值录入错误造成的异常对预测模型的影响;(5)为避免住院期间缺失变量造成的偏倚,本研究对缺失数据占比较高的变量采用虚拟变量处理,并进行敏感性分析评估缺失值影响。
2.1.1.8 统计学处理
采用SPSS 26.0、Python 3.9、WEKA 3.7进行统计分析及预测模型构建。符合正态分布的计量资料以均数±标准差表示,组间比较采用独立样本t检验,必要时进行Welch调整(方差不齐时)。不符合正态分布的计量资料以中位数(四分位数)表示,组间比较采用Mann-WhitneyU检验。计数资料以频数(百分数)表示,组间比较采用卡方检验或Fisher精确概率法。采用Platt scaling和保序回归对预测模型进行调试,并通过Brier评分和可靠性图评估调试前后的差异[14]。采用受试者操作特征(receiver operat-ing characteristic,ROC)曲线评估AKI风险预测模型的性能,评价指标包括AUC、综合Kappa系数、灵敏度、特异度、准确度、阳性预测值、阴性预测值等。以P<0.05为差异具有统计学意义。
2.1.2 预期结果
纳入127 000例住院患者,其中院内发生AKI的患者约14 605例。针对肾脏相关终点事件、生存情况等终点事件,以及AKI缓解率等转归指标进行描述性分析。构建的多学科住院AKI预测模型可提前24~48 h预测住院患者发生AKI的风险,其中提前24 h预测AKI的AUC>0.80,预测患者需进行肾脏替代治疗的灵敏度达95%及以上。
2.2 前瞻性研究
若回顾性研究构建的预测模型可达到回顾性研究预期结果,拟进一步开展前瞻性研究,以评估对AKI高风险人群进行早期干预能否降低AKI风险及疾病严重程度,改善总体生存情况及肾脏转归,减少住院费用及缩短住院时间(图1)。
2.2.1 对象与方法
2.2.1.1 研究对象
鉴于预警模型跨院迁移的技术难度,本研究拟为单中心前瞻性研究,纳入北京协和医院连续12个月内所有成年住院患者,并排除入院时已被诊断为AKI、基线SCr>353.5 μmol/L、长期接受透析或入院前后24 h内进行肾脏替代治疗的患者。
以在EMR中植入AKI预警和报警系统并开始进行相应干预为时间分界点进行前后对比,以该系统上线前6个月所有成年住院患者为对照组(无AKI预警和报警,无相应干预),以系统上线后6个月所有成年住院患者为干预组(提供AKI预警和报警,并予相应干预)。参与EMR维护及研究设计人员均不参与患者的医疗管理。
2.2.1.2 研究方法
2.2.1.2.1 样本量估算
根据住院患者AKI发生率为11.5%的估计值,假设相比对照组,干预组发生AKI的风险下降10%,α=0.05,β=0.90,两组患者的例数为1∶1。经计算两组各需15 636例患者。考虑资料不全等造成10%排除率,两组则各需17 374例患者。预期北京协和医院1年的住院患者数量可满足要求。
2.2.1.2.2 干预措施
干预组:将回顾性研究构建的AKI预警系统嵌入住院EMR,对所有住院24 h以上的患者每6小时进行1次实时未来48 h内AKI风险评估(图3)。若AKI风险大于预警阈值,则启动AKI高风险干预措施,包括(1)持续警示:在护理健康信息系统(health information system,HIS)、医嘱系统、床位图中显示预警标示。(2)提示风险因素评估:医嘱界面显示AKI风险评估表,评估患者是否存在脓毒症、容量不足、休克前期、肾后梗阻等因素;自动提示目前医嘱中存在肾毒性药物。(3)治疗提示:医嘱界面弹出治疗提示框,提醒是否需进行补液、监测出入量、体质量,并建议完善尿常规,必要时行泌尿系统超声。若系统根据SCr检测数值,监测到AKI已发生,则触发预定的AKI干预措施,包括(1)持续警示:在护理HIS界面、医嘱系统、床位图中显示AKI报警标示,并以危急值形式出现弹窗。(2)提示风险因素评估:患者在首次出现AKI时,医嘱界面即刻显示AKI风险因素评估表,除非AKI缓解,否则在24 h、72 h后提示对AKI风险因素进行再评估。(3)治疗提示:在AKI高风险干预的基础上,若患者存在脓毒症,考虑进行抗生素干预、病原学检测;医嘱界面开具肾毒性药物时均给予弹窗警示。若在AKI恢复前,无出入量、体质量监测或尿常规筛查,则在24 h、72 h后重复上述治疗提示。(4)专科介入:若患者出现2级及以上AKI事件,则在医嘱界面提醒是否需进行肾内科会诊。对照组:无上述AKI风险评估及报警提示干预系统,无相应干预措施,由所在病房主管医护团队进行常规诊疗行为。
图3 前瞻性研究中干预组干预措施示意图AKI:同图1
2.2.1.2.3 资料收集
通过EMR(部分从住院病历中提取)收集两组患者的资料,包括(1)基本资料:性别、年龄、民族、籍贯;(2)住院期间生命体征:血压、心率、呼吸频率、体温、外周氧合指数和出入量;(3)住院期间SCr变化;(4)住院期间治疗医嘱;(5)住院期间转归。
2.2.1.2.4 终点事件和观察指标
终点事件同回顾性研究。观察指标:(1)两组AKI发生率、AKI等级分布;(2)两组进行肾脏替代治疗的比例及治疗时间;(3)AKI缓解率;(4)两组AKI患者的住院时间、住院费用;(5)两组AKI患者住院期间终末期肾病进展率、死亡率。
2.2.1.3 偏倚控制
(1)对照组和干预组研究对象采用时序前后对照的形式,以避免AKI预警系统和干预措施对医务人员行为的影响由干预组扩散至对照组;(2)研究对象采用时序前后对照的形式,可能受到季节混杂因素的影响,本研究方案拟根据2016至2020年回顾性数据中月份对其他变量的影响对前瞻性试验的结果进行校正;(3)在满足样本量需求下,尽量缩短研究时间跨度,并拟在数据分析时针对科室分布进行分层分析,以排除研究期间患者的主治医师发生变化对结果造成的影响,控制相应混杂因素。
2.2.1.4 盲法控制
由于研究设计原因,对研究对象、医务人员及数据管理人员无法进行盲法控制。可在对数据去除敏感信息处理后,对统计分析人员遮盲。
2.2.1.5 统计学处理
采用SPSS 26.0软件进行统计学分析。描述性数据结果呈现形式及组间比较方法同回顾性研究。各观察指标进行统计比较时,按科室分布进行分层分析。采用Logistic回归分析法对患者入院月份、AKI风险模型中的预测风险进行校正,评估AKI风险预警对结局事件的影响。对AKI患者的住院时间和住院费用进行多因素线性回归分析,评估AKI预警系统及早期干预在其中的作用。AKI等级分布比较则采用等级资料的秩和检验。纳入Logistic回归分析的候选协变量包括年龄、性别、AKI/AKI 3级及肾脏替代治疗预测风险、ICU住院时间、CHARLESON评分、休克、机械通气、恶性肿瘤等。以P<0.05为差异具有统计学意义。
2.3 预期结果
相较于对照组,干预组:(1)AKI与AKI 3级发生率均更低(P<0.05);(2)肾脏替代治疗的比例更低,且治疗时间更短(P<0.05);(3)AKI缓解率更高(P<0.05);(4)住院时间更短、住院费用更低(P<0.05);(5)住院人群的终末期肾病进展率、死亡率更低(P<0.05)。
3 本研究局限性
本研究数据来源于北京协和医院,为国家疑难罕见病诊疗中心,收治疑难重症患者较多,住院期间AKI发生率能否代表全国综合医院的平均水平需进一步验证。虽然北京协和医院为大型综合医院,但作为单中心研究,可能因医疗行为习惯等原因存在模型过拟合的现象,导致本研究建立的模型不适用其他医疗机构,本研究未进行外部验证,结果外推需谨慎。
4 预期结论
住院期间AKI对患者短期与长期预后以及卫生经济学均存在显著不良影响,早期识别并对AKI进行干预可改善患者预后。但我国AKI漏诊率高,且多发生于非肾内科,建立跨学科病房的AKI早期预警系统具有重要意义。基于EMR的机器学习算法已被证实可有效预测住院患者发生AKI的风险,然而我国尚缺乏相关研究。本研究计划拟通过单中心回顾性大样本量数据分析,建立适合中国综合医院的多学科病房AKI预测模型,预期该模型可提前24~48 h预测住院患者发生AKI的风险,且预测效果良好;前瞻性研究中,预期通过相应干预可降低AKI、严重AKI(AKI 3级)、终末期肾病进展率以及住院期间死亡率,减少行肾脏替代治疗患者的比例、肾脏替代治疗的时间及住院时间、住院费用,提高AKI缓解率,改善患者预后。
作者贡献:郑华负责实验方案具体设计及文章撰写;张萌负责病案信息提取、清理、统计;赵泽、任菲负责机器学习相关方案设计;林剑峰负责统计方法设计及部分文章撰写;国秀芝负责检验科具体数据提取、清理及统计;夏鹏负责相关临床特征变量选取及临床干预方案设计;邱玲负责检验科相关方案设计、工作协调与合作;周炯负责病案科相关方案设计、工作协调与合作;陈丽萌成立该项目,负责整体框架设计并协调合作。
利益冲突:无