住院患者跌倒风险预测模型的研究现状

2023-09-04任媛渊徐志会付荣娟

实用临床医药杂志 2023年8期

任媛渊, 丁福, 徐志会, 付荣娟

(重庆医科大学附属第一医院, 1. 全科医学科, 2. 护理部, 重庆, 400016;3. 重庆市合川区人民医院护理部, 重庆, 401533; 4. 重庆市垫江县人民医院护理部, 重庆, 408300)

跌倒是全世界范围内的主要公共卫生问题之一,也是全球意外伤害死亡的第2大原因,更是住院患者最常见的安全事件之一[1], 不仅延长患者住院时间,加重个人、家庭和社会的经济负担[2-3], 而且可导致残疾和功能损害[4-5], 甚至死亡[6-8]。防范跌倒是评价医院护理质量的重要指标[9], 也是全球范围内患者安全领域被持续关注的目标之一[10], 尽早识别跌倒风险并给予护理干预,能将院内跌倒发生率降低20%～30%[11]。跌倒风险预测模型作为重要的预测工具,对早期预测跌倒风险并实施预见性护理,进而降低跌倒发生率具有重要意义。本文对国内外住院患者跌倒风险预测模型的研究现状进行综述,以期为临床选用及构建跌倒风险预测工具提供参考依据。

1 国外住院患者跌倒风险预测模型的研究现状

基于Pubmed数据库,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”为主题词精确搜索2017年12月—2022年12月文献,共获得住院患者跌倒风险预测模型构建相关文献45篇,其中通过传统方法建模的文献17篇,通过机器学习方法建模的文献28篇。文献分析结果显示,国外住院患者跌倒风险预测模型的构建具有以下特点。

1.1 机器学习方法成为构建跌倒风险预测模型的主要方法

美国学者HARRINGTON P[12]认为,机器学习是将无序的数据转换成有用的信息。英国学者FLACH P[13]则将机器学习概括为“使用正确的特征构建正确的模型,以完成既定的任务”。虽然机器学习的定义并不统一,但学习的关键在于利用计算机的运算能力从大量数据中发现“函数”或“模型”,并通过其来模拟现实世界事物间的关系,从而实现预测或判断的功能[14]。机器学习的核心要素为数据、算法和模型[15], 具有从经验中学习,利用系统进行自我改进,并随着学习提高性能的特点[16-17], 主要分为监督学习、无监督学习和强化学习3大类[18]。现有文献显示,国外基于机器学习构建住院患者跌倒风险预测模型多采用监督学习方法。荷兰学者DORMOSH N等[19]借助Bolasso回归分析开发涵盖跌倒史、记忆或注意力问题、骨关节炎等10个危险因素的跌倒风险预测模型; 韩国CHO I等[20]基于贝叶斯网络构建的模型包括人口学特征、认知因素、行为因素等6大类预测因子; 日本NAKANISHI T等[21]基于决策树构建的模型由9个分支构成,第1分支是谵妄,第2分支为跌倒史,其余为使用助行器、步态不稳、携带输液管道等。美国OSHIRO C E S等[22]基于Lasso回归分析构建模型,共纳入年龄、行走问题、多重用药等13个关键预测因子; YE C Y等[23]和LINDBERG D S等[24]分别采用随机森林、极限梯度提升、支持向量机、k-近邻法、分类树、Bagging、自适应提升等集成学习算法构建跌倒风险预测模型,纳入一般信息、入院信息、临床数据等预测因子。

虽然应用机器学习建模已成为研究热点,但机器学习方法是否在任何条件下均优于传统方法尚无定论。VOLOVICI V等[25]认为,现有研究存在滥用和误用机器学习现象。滥用机器学习建模将增大临床对模型的解释难度,误用机器学习可能导致机器学习“黑匣子”原理支撑的临床决策与临床实践相悖[25]。为了比较机器学习与传统方法的建模效果,韩国JUNG H等[26]比较Logistic回归、Cox比例风险回归和决策树3种方法的效果,发现基于Logistic回归分析构建的模型性能最佳。因此,在机器学习成为构建住院患者跌倒风险预测模型主要方法的大趋势下,研究者更应审慎考虑机器学习的必要性和适当性,以实际临床问题和需求为导向,充分考虑数据集的类型、规模和维度,选用恰当的建模方法,并以统计指标为依据、以临床实际为基础从多角度合理解读所得的模型。

1.2 单中心、电子病历数据成为构建模型的主要数据来源

国外研究者无论采用传统方法还是机器学习方法建模,大多数据都来源于某一家医院的电子病历,从Pubmed数据库检索到的45篇构建住院患者跌倒风险预测模型的相关文献中,仅CHOI Y等[27]和WANG Y等[28]基于多中心数据建模,其余均为单中心数据。单中心数据可在一定程度上降低数据采集难度,但数据可能缺乏代表性,数据偏颇还会影响模型的预测性能及临床适用性。此外,即使是采用传统方法建模,数据也主要来自电子病历系统。美国学者LOHSE K R等[29]和韩国学者JUNG H等[26]均基于电子病历数据建模,总体数据量为2 007、15 480人,跌倒数据量为131、310人,采集数据的时间线为1.5、3.0年。另有多项研究[19-24,27-28]采用机器学习方法建模,数据同样来源于电子病历,数据量为814～176 816人,跌倒数据量为238～4 778人,数据采集周期长短不一,为1～10年。随着医疗信息化技术和电子病历系统的不断发展与完善,虽然电子病历数据已成为临床大数据的主要来源,但国外研究者在应用电子病历数据建模的过程中,总体样本量和跌倒数据量差距较大,数据类别不平衡问题突出,基于这类偏数据构建的跌倒风险预测模型可能无法完整描述临床跌倒问题,甚至会放大性别歧视、种族歧视等问题[25]。

1.3 多种方法对模型进行内部验证

对于构建的模型,研究者可采用不同方法在不同测试人群中进行验证。一方面,国外研究者验证模型的方法呈现多样化特点,韩国JUNG H等[26]、美国LOHSE K R等[29]和LINDBERG D S等[24]分别采用5倍交叉验证和10倍交叉验证对模型进行验证,荷兰DORMOSH N等[19]和韩国CHO I等[20]分别将10倍交叉验证和Bootstrap、跨时间站点相结合进行模型验证,日本NAKANISHI T等[21]基于留出法验证模型,美国学者YE C Y等[23]采用保序回归方法进行模型验证。虽然各国学者采用的验证方法有所不同,但这些方法均是机器学习的经典方法,具有较强的科学性。研究者应根据临床数据的性质选用不同的验证方法: 如果研究数据量非常大,可以选用留出法; 如果研究数据量较大,可以选用交叉验证法; 如果研究数据无序性较强,则可以选择保序回归法。另一方面,模型验证可分为内部验证和外部验证,测试人群相同或相似为内部验证,测试人群不同则为外部验证[30]。对检索到的文献进行分析,仅法国学者BEAUCHET O等[31]对模型进行外部验证,其余研究[19-21, 27-28]均采用内部验证评价模型,提示各研究所得模型并未落实于临床实践,且尚未在临床应用及推广。

2 中国住院患者跌倒风险预测模型的研究现状

基于CNKI数据库,以“住院患者/住院病人”“跌倒”“风险/预测/风险预测/预测模型/模型”为主题词精确检索2017年12月—2022年12月文献,共获取住院患者跌倒风险预测模型构建相关文献6篇(均采用传统方法建模); 基于Pubmed数据库,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”为主题词精确搜索2017年12月—2022年12月中国研究者发表的文献,获得相关文献4篇(均采用机器学习方法建模)。文献分析结果显示,中国住院患者跌倒风险预测模型的构建具有以下特点。

2.1 传统方法为主,机器学习方法正在起步

中国大陆地区研究者主要采用传统统计学方法构建住院患者跌倒风险预测模型。林丽娜等[32]、程正楠等[33]均采用单因素分析和Logistic回归分析建模,分别纳入活动受限、跌倒史、用药等7个危险因素和性别、抑郁、疲乏等6个风险因素; 陈森芸等[34]采用多因素Logistic回归分析和列线图构建的模型包含Morse跌倒风险评分、血钾浓度、夜尿/排便增多、跌倒风险认知4个预测因子。近年来,中国香港和中国台湾地区学者更倾向于采用机器学习方法建模。WANG H L等[35]基于张量分解算法探索患者、跌倒时间、地点和科室之间的内在关系,从而预测住院患者不同科室和地点的跌倒事件。HSU Y C等[36]基于极限梯度提升方法构建包括教育水平、体温、脉率等高危因素的跌倒风险预测模型; LIU C H等[37]采用决策树、贝叶斯网络、支持向量机、随机森林、Bagging及自适应提升4种监督学习和2种集成学习方法建模,得出Bagging和随机森林相结合的集成学习方法构建的模型预测性能最佳,该模型共纳入入院诊断、手术记录、用药记录等54个危险因子。分析中国学者的相关文献可发现,台湾、香港地区学者[35-38]已采用机器学习方法建模,大陆地区学者[32-34]仍主要采用传统的Logistic回归分析方法建模。Logistic回归分析实现简单、计算量小,常用于危险因素分析、疾病风险预测及疾病诊断,但其不能解决非线性问题,难以处理不平衡数据,且准确度不高[39]。构建方法的选择是开发预测模型的关键,相较于国外,中国目前的建模方式(以传统方法为主)一定程度上限制了跌倒风险预测模型的整体性能和临床适用性。

2.2 数据源各异,且以单中心、小数据集、偏数据为主

中国的研究者通过不同数据源构建住院患者跌倒风险预测模型,例如现场询问、电话调查[32]、半结构式访谈或问卷调查[33]等方法采集的原始资料。近年来,中国港台地区学者开始尝试应用电子病历[36]、电子健康记录[38]、跌倒安全报告系统[35-36]等电子信息系统数据构建模型。虽然建模的数据源存在差异,但无论是基于传统方法还是机器学习方法建模,数据均为单中心数据,且总体样本量和跌倒样本量均偏小。采用传统方法建模的研究中,总体样本量最小仅226人[34], 最大950人[33]; 跌倒样本量最小仅93人[33], 最大113人[34]; 数据收集周期最短仅4个月[33],最长3.5年[34]。采用机器学习方法建模的研究中,虽然总体样本量最大可达108 940人[37], 但跌倒样本量仍偏小,为256～349人[35-38], 采集数据的时间段为9个月～4.5年[35-38]。相较于国外,中国该领域的数据类别不平衡问题更加突出,偏数据建模将直接影响模型的预测性能。此外,虽然HSU Y C等[36]和CHU W M等[38]采用机器学习方法建模,但其样本量仅639人和1 101人,既不符合临床大数据的建模条件,也不适用于机器学习这种以大数据为基础的建模方法。

2.3 模型验证方法较单一,且缺乏外部验证

在验证方法方面,中国绝大多数研究者仍习惯对模型进行传统统计学验证[32-33, 36-37], 而忽视对机器学习验证方法的探索,仅CHU W M等[38]和陈森芸等[34]对交叉验证和Bootstrap进行了尝试,整体而言模型验证方法较单一。在验证过程方面,中国学者大多仅对模型进行内部验证[32-38], 缺乏将模型应用于不同测试人群的外部验证,且未对模型进行重新校准和动态更新,故构建的风险预测模型并未真正发挥作用。在验证结果方面,中国研究者构建的模型,受试者工作特征曲线的曲线下面积为0.57～0.90[32-38], 区分度显著低于国外研究[19-24, 26-29, 31]的0.70～0.99; 无论采用传统方法还是机器学习方法建模,中国学者构建的跌倒风险预测模型的灵敏度和特异度均低于国外研究[26, 32-33, 38]。

3 小结

良好的风险预测模型是早期识别住院患者跌倒风险的重要保障[40-44], 从电子病历系统直接采集数据,并以机器学习为主要方法建模,正成为这一领域的研究热点[45-47]。但现有研究显示,住院患者跌倒风险预测模型的构建尚存在数据规模与方法不匹配,数据普适性、平衡性较差,经外部验证的模型较少,临床适用性不强等问题。未来,护理研究者应特别注意算法与大数据“4V”特性[48]的匹配性,根据数据特征,科学选择机器学习方法,同时加强医疗机构信息互通与合作,收集实时、多中心、大样本数据,以推动跌倒风险预测模型的真实世界研究,并立足临床,以研究结果反哺临床问题的解决,提升住院患者跌倒风险预测模型的科学性和临床适用性。