ICU 病人谵妄风险预测模型的应用价值比较
2023-03-24左贤芳张爱琴
左贤芳,张爱琴
1.南京大学医学院,江苏 210008;2.南京大学附属金陵医院(东部战区总医院)
谵妄(delirium)是一种以注意力缺损、意识障碍和 认知功能障碍为特征的急性脑功能障碍综合征[1],可能与脑部代谢功能障碍有关[2]。谵妄根据临床症状的不同表现分为活动增多型(激动和不安)、活动减少型(情感平淡、淡漠、嗜睡、反应性下降)和混合型[3]。谵妄是重症监护室(ICU)病人器官功能障碍中最容易被忽视的一种症状[4],其中活动减少型谵妄最难发现,容易被误诊为痴呆或抑郁,造成更危险的后果[5-6]。研究显示,ICU 病人谵妄发生率达20%~80%[7-9],谵妄不仅延长住院时间[10],增加并发症的发生率及院内病死率[11],还会降低病人出院后的自理能力[12]。谵妄病人脑功能障碍时间越长,出现长期不可逆损伤的可能性就越大[13],并发症导致其他器官功能障碍,致使死亡率高达22%~76%[14]。目前,临床上没有一种药物可以预防谵妄及谵妄形式的脑功能障碍,故以非药物策略为主,积极监测、早期识别并改善可能诱发谵妄发生的危险因素尤为重要[15-16]。应用ICU 谵妄风险预测模型可提高谵妄的识别率达64%[17],通过筛查易发生谵妄的高危人群,分层干预,降低谵妄的发病率[18]。目前,国内外有多名学者基于谵妄病因构建了ICU 病人谵妄风险预测模型,但尚不清楚哪种模型更适用于国内ICU 环境,也有研究者基于现有模型进行模型比较,但纳入比较的模型较少[19-20]。本研究比较并分析国内外4 种ICU 病人谵妄风险预测模型预测谵妄发生的能力和应用价值,为临床选择预测模型提供指导。
1 对象与方法
1.1 确定纳入比较的模型 计算机检索知网、维普、万方、PubMed、Web of Science 和the Cochrane Library数据库建库至2020 年10 月8 日关于ICU 谵妄风险预测模型的研究。英文检索词包括intensive care unit、ICU、delirium、delirium syndrome、risk model、prediction model、model;中文检索词包括重症监护、ICU、谵妄、谵妄综合征、预测模型、模型。纳入标准:①关于ICU谵妄的静态风险预测模型;②队列研究;③纳入对象年龄>18 岁;④谵妄诊断工具为ICU 意识模糊评估法(CAM-ICU);⑤进行内部/外部验证,且描述预测因子赋值和风险分层方法。排除标准:①预测因子无法在ICU 广泛收集或精准测量;②重复发表的文献;③非中英文文献。由两名研究者独立检索和筛选文献,提取资料,最终确定纳入的模型有祝晓迎[21]构建的ICU谵妄预测模型(祝晓迎模型)和陈宇等[22-23]构建的兰州模型,Van Den等[24]构建的谵妄预测模型和Wassenaar等[25]构建的早期谵妄预测模型。
1.2 研究对象 本研究采用便利抽样法,选取2020 年12 月—2021 年4 月入住东部战区总医院神经内科ICU、神经外科ICU、普外科ICU、心胸外科ICU 及呼吸内科ICU 资料完整的病人用于模型比较。纳入标准:年龄≥18 岁。排除标准:入ICU 前(时)诊断为谵妄阳性;可以用中文有效交流。剔除标准:入住ICU时间<24 h;入住ICU 后处于持续昏迷和深度镇静状态,格拉斯昏迷评分≤8 分或躁动-镇静评分量表(RASS)评分为-4/-5分;研究期间病人死亡。本研究已获本院伦理委员会批准(伦理编号:2021NZKY-016-01),遵循医学伦理学准则,参与病人均知情同意。本研究中的4 种预测模型共包含23 个预测因子,结合谵妄发病率[7-9],考虑到10%的样本丢失率,根据模型样本量公式[26],计算得出本研究至少需要样本量为320 例,最终入组482 例。
1.3 研究方法
1.3.1 评估工具 采用CAM-ICU 量表评估谵妄发生情况。由接受严格培训的护士应用CAM-ICU 自病人入住ICU 时开始进行谵妄评估,每日各常规评估2 次(08:00 和16:00),病情发生变化时立即进行评估,直至病人诊断谵妄阳性或转出ICU。对发生谵妄的病人根据RASS 确定亚型,评分范围-5 分~4 分,若病人RASS 评分>0 分,则诊断为躁动型谵妄;若RASS 评分在正负分之间波动,则诊断为混合型谵妄;若RASS得分<0 分,则诊断为淡漠型谵妄[27-28]。
1.3.2 资料收集方法 根据4 种模型中的23 个预测因子构建病例资料调查表,查阅病历和电子系统,收集相关数据,祝晓迎模型、兰州模型和谵妄预测模型中包含的变量在入ICU 后24 h 内收集,早期谵妄预测模型中包含的变量在入ICU 时收集,分别代入原模型谵妄风险公式,计算风险值。每周由两名研究者共同核查数据的准确性、完整性和真实性。
1.4 统计学方法 采用SPSS 和MedCalc 软件进行统计分析。定性资料用频数和百分比(%)描述;满足正态分布的定量资料用均数±标准差(±s)描述,不满足正态分布的定量资料用中位数和四分位数[M(P25,P75)]表示。绘制受试者工作特征曲线(receiver operating characteristic curve,ROC),结合ROC曲线下面积AUROC值评价4 种模型的区分能力,模型AUROC 值>0.9 说明区分能力较高,>0.7~<0.9 表示区分能力中等,>0.5~0.7 表示模型的区分能力较低[29],模型间AUROC值的比较采用Delong 法,P<0.05 表示差异有统计学意义。通过Hosmer-Lemeshow 拟合优度检验评价4 种模型的校准能力,所得的χ2值越小,对应的P值越大,提示模型的校准能力越强。
2 结果
2.1 研究对象一般资料 共纳入482 例ICU 病人,其中男277 例(57.47%),女205 例(42.53%);年龄54.67(42.00,66.00)岁;入院方式:急诊入院273 例(56.6%),非急诊入院209 例(43.4%);急性生理与慢性健康状况(APACHE Ⅱ)评分(8.44±0.259)分;ICU 住院时间4.39(2.00,6.00)d。
谵妄发生风险预测值:祝晓迎模型0.26(0.11,0.36),兰州模型0.18(0.16,0.32),谵妄预测模型0.26(0.09,0.40),早期谵妄预测模型0.19(0.08,0.27);482 例ICU 病人中,150 例(31.12%)病人发生谵妄,其中淡漠型谵妄71 例(47.3%),躁动型谵妄48 例(32.0%),混合型谵妄31 例(20.7%)。统计病人谵妄首次发生时间,103 例(68.7%)病人发生谵妄的时间为入住ICU 后的72 h 内。祝晓迎模型谵妄病人(n=150)的谵妄发生风险预测值为0.39(0.23,0.52),非谵妄病人(n=332)的谵妄发生风险预测值为0.20(0.11,0.23),两者比较差异具有统计学意义(Z=13.964,P<0.001);兰州模型谵妄病人(n=150)的谵妄发生风险预测值为0.35(0.27,0.43),非谵妄病人(n=332)的谵妄发生风险预测值为0.21(0.15,0.24),两者比较差异具有统计学意义(Z=18.818,P<0.001);谵妄预测模型,谵妄病人(n=150)的谵妄发生风险预测值为0.50(0.35,0.65),非谵妄病人(n=332)的谵妄发生风险预测值为0.16(0.06,0.21),两者比较差异具有统计学意义(Z=29.194,P<0.001);早期谵妄预测模型谵妄病人(n=150)的谵妄发生风险预测值为0.33(0.21,0.43),非谵妄病人(n=332)的谵妄发生风险预测值为0.13(0.08,0.16),两者比较差异具有统计学意义(Z=24.08,P<0.001)。
2.2 模型分析情况
2.2.1 模型区分度 采用ROC 曲线比较4 种预测模型区分发生谵妄和未发生谵妄的能力,见图1。祝晓迎模型AUROC 值为0.806[95%CI(0.768,0.840)],兰州模型AUROC 值为0.853[95%CI(0.818,0.883)],谵妄 预 测 模 型AUROC 值 为0.918[95%CI(0.890,0.941)],早 期 谵 妄 预 测 模 型AUROC 值 为0.891[95%CI(0.860,0.918)],见表1。采用Delong法比较4种模型AUROC 值,显示两两比较差异有统计学意义,见表2。约登指数最大时确定最佳临界值,分析灵敏度和特异度。祝晓迎模型约登指数最大(0.529)时,最佳临界值为0.248,灵敏度和特异度分别为0.733 和0.795;兰州模型约登指数最大(0.604)时,最佳临界值为0.246,灵敏度和特异度分别为0.827 和0.777;谵妄预测模型约登指数最大(0.710)时,最佳临界值为0.311,灵敏度和特异度分别为0.833 和0.877;早期谵妄预测模型约登指数最大(0.656)时,最佳临界值为0.181,灵敏度和特异度分别为0.833 和0.822,见表3。计算4 种ICU 谵妄预测模型在不同风险人群中灵敏度、特异度、阳性似然比和阴性似然比结果,见表4。
表1 4 种预测模型的ROC 分析结果
表2 4 种预测模型AUROC 比较
表3 4 种预测模型的最佳临界值及相关预测指标比较
表4 4 种预测模型在不同谵妄人群中的灵敏度、特异度、阳性似然比和阴性似然比
图1 预测ICU 病人发生谵妄的ROC 曲线
2.2.2 模型校准度 采用Hosmer-Lemeshow 拟合优度检验评价4 种模型的预测值和实际观测值间的一致程度。祝晓迎模型Hosmer-Lemeshow 拟合优度检验结果χ2=26.469(P<0.001),兰州模型Hosmer-Lemeshow拟合优度检验结果χ2=15.839(P=0.04),提示该两种模型在ICU 病人谵妄风险预测中的准确度一般;谵妄预测模型Hosmer-Lemeshow 拟合优度检验结果χ2=6.899(P=0.548);早期谵妄预测模型Hosmer-Lemeshow拟合优度检验结果显示χ2=7.970(P=0.436),提示该2 种模型在ICU 病人谵妄风险预测中的准确度较高,见图2 和图3。
图2 谵妄预测模型Hosmer-Lemeshow拟合优度检验列联图
图3 早期谵妄预测模型Hosmer-Lemeshow拟合优度检验列联图
3 讨论
3.1 ICU 病人谵妄发生特征 本研究中,ICU 谵妄发生率为31.12%,低于吴传芹等[30]报道的40.9% 以及Ben Saida 等[31]研究中的33.5%,可能与病人的严重程度及评估时间有关。研究表明,APACHE Ⅱ评分与谵妄发生风险呈正相关[32]。本研究中纳入的研究对象APACHE Ⅱ评分平均为8.44 分,远小于其他研究中APACHE Ⅱ得分[26,30]。谵妄具有昼轻夜重的特点[33],本研究的评估时间集中在白天,可能导致谵妄的漏诊。150 例发生谵妄的病人中,103 例(68.7%)病人在入ICU 后的72 h 内发生谵妄,这与Dubois 等[34]的研究结果一致,提示医护人员应积极采用有效评估工具,做到早期筛查,预防谵妄发生,改善病人的不良结局。
3.2 4 种风险预测模型在ICU 病人谵妄风险预测中的应用价值 4 种风险预测模型的AUROC 值均>0.7,表明4 种预测模型识别谵妄病人能力较强,可用于早期评估ICU 病人住院期间谵妄发生风险。Hosmer-Lemeshow拟合优度检验结果提示谵妄风险预测模型和早期谵妄风险预测模型间实际观测值和模型预测值存在的差异较小(均P>0.05),均具有较高的校准能力。4 种风险预测模型AUROC 分别比原始研究的AUROC 更高,这可能因为本研究纳入的样本量与原始研究有区别有关。本研究目的是调查预测模型在初始验证研究之外,在其他ICU 环境中的应用效果。研究结果显示,本研究中包括的模型预测性能比初始研究更好,适合临床推广。当阳性似然比>10 或阴性似然比<0.1时,模型预测结果最佳[35],这也说明这4 种模型依旧有误判的可能,但显然谵妄预测模型的误诊和漏诊谵妄的几率更低,诊断谵妄和排除非谵妄病人的能力更强,同时谵妄预测模型的约登指数、灵敏度和特异度均优于其他3 种模型,医护人员可根据临床实际情况,推广应用谵妄预测模型,筛查易发生谵妄病人。
3.3 4 种风险预测模型的适用性 ICU-CAM 具有良好的信效度,且是目前常用的谵妄评估工具[36],但该评估工具是“时间点”的评估,因此会遗漏一些发生谵妄的病人[37]。研究显示,病人入ICU24 h 内的谵妄发生率达25%[38],除早期谵妄预测模型外,其他模型均从入ICU24 h 后开始评估,故此类模型会导致入ICU24 h 内发生谵妄的病人被遗漏,在临床实践中的适用性还需要改善,需要尽早评估,在入ICU 后立即实施有效的谵妄预防措施。Wassenaar 等[39]采用“两阶段法”,结合谵妄预测模型和早期谵妄预测模型综合评估ICU 病人发生谵妄风险的大小,提升了模型预测灵敏度,吴菲霞等[40]将谵妄预测模型和早期谵妄预测模型整合形成联合预测模型,得到更好的预测价值,后期可开展临床研究,联合应用预测模型,分析其预测谵妄发生的能力及应用价值。病人在ICU 住院过程中,可能会诱发或改善影响因素,动态评估能更准确地预测病人在给定时间的谵妄风险。由于谵妄的发病机制尚未完全明确,因此模型包含的预测因子仍具有局限性,今后的研究中,可实时更新预测因子,调整预测模型,同时可与信息技术人员合作,将预测模型植入重症信息系统中,利用计算机系统收集数据,自动计算病人发生谵妄的风险,基于分层护理流程,改善谵妄病人的临床结局。
4 小结
本研究最终纳入4种ICU谵妄风险预测模型,这4种模型具有中等程度识别谵妄和非谵妄病人的能力,谵妄预测模型和早期谵妄预测模型具有较高的校准能力,但谵妄预测模型的整体预测效果更佳,有助于医护人员早期识别易发生ICU 谵妄的病人,尽早实施预防。今后可开展大样本、多中心研究继续验证,实现病人发生谵妄风险的准确预测。