APP下载

机器学习在疾病预测的应用研究进展

2021-11-26刘雨安杨小文李乐之

护理学报 2021年7期
关键词:机器预测疾病

刘雨安,杨小文,李乐之

(1.湖南中医药大学 护理学院,湖南 长沙410208;2.中南大学 湘雅护理学院,湖南 长沙410013)

近年来,人工智能(artificial intelligence,AI)技术在医疗卫生领域的发展成为关注的焦点, 应用也越来越广泛。 2017 年国务院印发的《新一代人工智能发展规划》中提出[1],国家重点发展人工智能技术,完善适应人工智能技术的医疗政策体系、重点任务、保障措施等, 并加快创新应用, 以缓解就医诊疗困难、提升公众健康水平。 机器学习(machine learning,ML)是一门研究计算机如何从数据中学习并挖掘信息的科学学科[2],是人工智能的本质,它代表着一套强大的算法,可以对数据进行描述、学习、分析和预测等,具有高效、准确、通用等优点[3]。 在如今大数据的时代背景下, 信息化的飞速发展给临床工作者带来了大量复杂的医疗数据, 而机器学习具有强大的从数据中提取信息的能力, 为智能数据的采集、分析、存储和预测提供了大量有价值的工具[4]。 其中,疾病预测模型的构建是机器学习常见的应用之一,目前已有大量研究使用机器学习算法进行疾病预测模型的构建与验证[4-7],并证明了其对临床疾病的管理与决策具有积极的辅助作用。 本研究对机器学习技术进行简要介绍, 并对其在疾病预测中的应用进行综述, 以期促进护理工作者对机器学习技术的了解,探索未来可发展的方向,推动人工智能在医疗领域的发展。

1 机器学习概述

机器学习是一门多领域交叉的学科, 它是指利用计算机模拟人的思维方式[8],使其像人一样具备学习能力,从而能够在没有任何明确编程的情况下,基于大量的训练数据进行学习, 利用系统本身进行自我改进,逐步提高性能[9],然后根据学习的行为做出复杂的决策,是计算机具有智能的根本途径[4]。 与传统的医疗电子信息系统的不同在于, 传统的医疗电子信息系统是整合患者的各项数据, 基于特定的规则流程与知识库进行数据的采集与相关的计算等,而机器学习通过自行探索,能够挖掘数据间更深层次的隐含规律,捕获与处理变量之间多层次、交互的非线性关系,建立关联因子模型[10],不仅在效率和准确性方面更具有优越性,并且能够契合实际临床工作全面性、复杂性的特点[11],做出更准确的预判与决策。 机器学习的方法主要有监督学习、无监督学习和半监督学习,常见的算法有Logistic 回归分析、决策树、随机森林、人工神经网络和支持向量机等。

2 机器学习在疾病预测中的应用

2.1 预测疾病发生风险 疾病风险预测模型是以疾病的多风险因素为基础, 按影响程度的大小划分分值, 利用数学公式计算某个人未来发生某个事件的概率的一种统计性评估方式[12],构建疾病风险预测模型可以使医护人员对不同风险概率的群体实施有针对性的干预措施, 对改善患者结局具有重要意义。 机器学习由于其强大的挖掘信息与探索数据间联系的能力, 已有大量研究使用机器学习算法构建疾病发生风险的预测模型。

Barton 等[13]开发了一种基于机器学习的脓毒症预测模型, 并将其与全身炎症反应综合征评分(Systemic Inflammatory Response Sydrome,SIRS)、改良早期预警评分(Modified Early Warning Score,MEWS)、序贯器官衰竭评估 (Sequential Organ Failure Assessment,SOFA)等多个传统的脓毒症评分比较。结果发现,在脓毒症发病时、发病前24 h 和48 h,其ROC 曲线下面积分别为0.88、0.83 和0.84,而传统的脓毒症评分仅在0.60~0.72。 Mohamadlou 等[14]构建了住院患者急性肾损伤(Acute Kidney Injury,AKI)的机器学习预测模型,其在AKI 发病时和发病前12 h 的预测能力分别为0.872 和0.8, 并同时与传统评估工具进行比较,证实了基于机器学习构建的模型效果更为出色。Wang 等[15]和Corradi 等[16]构建了评估谵妄发生风险的机器学习模型, 其ROC 曲线下面积分别为0.925~0.994 和0.909,显示出了高度的准确性,其中梯度提升算法的准确率达到96.7%,具有很高的临床使用价值。 除此之外,还有研究将机器学习技术应用于预测尿 路 感 染[17]、心 跳 骤 停[18-19]、ICU 再 入院[20]、压疮,跌倒等各种护理不良事件[10,21-22]、甚至是抑郁自杀等事件的发生风险中[23-24],并获得了令人满意的效果。

由此可见, 使用机器学习算法构建风险预测模型已被广泛应用于不同领域当中。 护士作为患者的主要照顾者, 在患者病情观察以及疾病的预测中处于关键位置,与传统的风险预测模型或评分相比,机器学习建模具有准确、敏感、通用等优势,能够剖析数据间多因素的深层次交互关系[10],探索更复杂的线性或非线性关联, 在各种临床环境中预测疾病发生风险的能力更高, 对促进医护人员早期干预以改善患者结局具有重要意义。

2.2 预测疾病预后及风险分层

2.2.1 在急诊分诊中的应用 医院的急诊室内常常人满为患, 分诊中面临的主要难题是如何根据患者预后的严重程度对患者进行分类, 如何准确区分危重患者和稳定患者,并将其分为优先次序。机器学习作为一种强大的算法框架,具有快速、准确的预测患者结局及风险分层的能力, 在急诊分诊中具有广大的应用潜力。

Fernandes 等[25]以识别急诊中需要入住ICU 的高风险患者为目标, 使用Logistic 回归算法构建机器学习模型, 并分别在美国和葡萄牙的2 家医院进行应用,其ROC 曲线下面积分别为0.91 和0.85,可以有效识别出在急诊中需转入ICU 的高危患者。Levin 等[11]使用随机森林算法构建了E-triage 分诊器, 该模型能够预测急诊患者的结局以及对重症监护、急诊医疗程序或住院的需要程度,并将风险转化为分诊等级,其模型的ROC 曲线下面积为0.73~0.92。同时, 研究者将E-triage 模型与美国常用的急诊严重程度评分进行比较, 表示该模型能够更准确及快速的对患者进行分类与风险管理。 Parker 等[26]开发了一个机器学习模型以预测急诊患者需要住院的概率,以期能够尽早通知相关病房,做好患者的交接,减少急诊室内的拥挤, 促进病床等医疗资源的优化管理与分配。由此可见,基于机器学习技术对患者进行风险预测与分层, 有利于提高急诊医护人员的工作效率与准确性, 以及为患者提供针对性的治疗护理措施,这不仅对改善患者预后产生积极影响,并且可以最大程度的促进医疗资源的优化分配。

2.2.2 在应对重大公共卫生危机中的应用 使用机器学习技术对患者进行更高效的风险分层, 优化医疗资源的管理与分配, 也有效增强了医疗卫生系统应对突发重大公共卫生危急的能力。 自2020 年以来,世界范围内新型冠状病毒肺炎(COVID-19)患者人数剧增,给全球卫生系统造成了巨大冲击。我国学者Gao 等[27]构建了COVID-19 患者死亡风险预测模型,该模型能够提前20 d 对COVID-19 患者进行生理恶化的预测与死亡风险的分层, 有利于促进医务人员对高风险的COVID-19 患者进行及时的干预与治疗;国外学者Cheng 等[28]构建了一个基于机器学习的风险优先排序工具,用于识别24 h 内需要转入ICU 的高风险COVID-19 患者,其ROC 曲线下面积为79.9%, 一定程度上改善了医院资源的管理与分配, 促进了对COVID-19 患者提供更有效的护理;Vaid 等[29]使用机器学习算法构建模型,可以提前10 d预测不同患者群体中的危重患者和死亡率, 并确定了影响预测结果的潜在因素,使医务人员可以通过观察这些指标来改善对患者的治疗决策,从而为患者提供更有针对性的治疗与护理。

由此可见, 充分发挥机器学习的优势应对突发重大卫生事件,不仅可以更高效的优化资源分配,为患者提供其所需的治疗等级与资源, 并且可以促进对未知疾病的探索, 分析其恶化的影响因素及潜在原因,为医护人员实施干预措施提供依据,提高医疗卫生系统应对突发公共卫生危急的能力。

2.3 预测慢性病进展情况 机器学习技术在慢性病管理中也具有极大的发展潜力。近年来,随着社区医院的不断发展,以及移动健康App、传感器、可穿戴监测设备等的流行, 人们在日常生活中产生大量、连续的健康数据为机器学习的使用提供了合适的条件。2.3.1 高血压管理 高血压是指血管压力持续增高的一种状态,根据世界卫生组织的数据[30],全球约有11.3 亿的高血压患者,是最常见的慢性疾病。高血压会增加患者心、脑、肾脏等疾病的发生风险,是世界范围内过早死亡的主要原因, 一直以来是研究的焦点。近年来,机器学习与数据挖掘技术的发展也为高血压疾病的管理提供了新的方法与思路。Chang 等[31]使用支持向量机、 决策树和随机森林等算法构建了血压预测模型,该模型整合患者体检的多项指标进行预测,对高血压患者的病情转归以及并发症的预测与控制具有良好效果;Weng 等[32]使用来自英国378 256例患者的数据进行前瞻性的队列研究,构建了机器学习模型以预测个体在未来10 年发生心血管事件的风险,结果具有较好的敏感性与特异性,显著提高了心血管疾病风险预测的准确性,促进患者从预防治疗中获益;Lee 等[33]基于韩国国家医疗保健数据库,使用机器学习算法构建了高血压患者并发症的预测模型,该研究使用国家医疗数据库,纳入了更广泛的观察变量与数据,使其得到的结果更可靠及有权威性,对该国高血压患者的指导与管理具有重要意义。

2.3.2 糖尿病管理 糖尿病是一种慢性代谢性疾病,全球约有4.22 亿的糖尿病患者[34],并在近几十年增加迅速, 血糖的管理一直以来是国内外学者研究的重点。 随着科技化、信息化的快速发展,糖尿病患者的血糖管理方法也在不断创新, 机器学习和数据挖掘在糖尿病研究中的应用越来越广泛,其中,血糖预测、血糖异常检测、糖尿病并发症的预测等方面成为研究的重点。

血糖预测是指基于患者过去和当前的情况,预测个体的血糖水平, 主要目的是为了指导个性化的血糖管理以及提供必要的警报。 Georga 等[35]构建了糖尿病患者发生低血糖的预测模型, 该模型在提前30 min 和60 min 预测低血糖事件的准确率均在90%以上,能够有效预防不良事件的发生;Zeevi 等[36]设计了一种算法, 该算法集成了血液参数、 饮食习惯、体力活动和肠道微生物群等多方面数据,可以预测现实生活中个性化的餐后血糖反应, 有助于指导患者饮食管理,改善餐后血糖升高现象。糖尿病的视网膜病变是患者视力障碍和失明的重要原因, 有学者使用深度学习方法对糖尿病患者进行视网膜筛查, 其结果证明基于机器学习的方法可以有效筛查并早期发现患者的视网膜病变[37],Dagliati 等[38]使用逻辑回归的方法构建了机器学习模型, 其根据患者在第1 次就诊时的健康状况, 可以预测出该患者在未来3 年、5 年和7 年内微血管病变的发生风险(包括视网膜病变及肾脏病变等),有助于医务人员给予针对性的指导与教育来减缓并发症的发生, 提高患者的生活质量。

2.3.3 其他慢性病管理 除此之外, 还有很多学者将机器学习技术应用于其他慢性病的管理中。 慢性阻塞性肺疾病 (chronic obstructive pulmonary diseases,COPD)是常见的肺部病变,不仅严重影响生活质量,也增加了患者的死亡率。 COPD 急性恶化是患者住院的常见原因,Orchard 等[39]将机器学习应用于COPD 急性恶化的预测建模, 增强了对COPD 患者的远程监控与管理, 有利于病情恶化的早期识别与治疗,减少患者住院率;Wang 等[40]将神经网络算法应用于阿尔兹海默症患者的病情进展, 结果表明该模型可以有效预测患者的疾病进展情况, 具有较高的临床使用价值;Shi 等[41]开发了乳腺癌术后患者2年生存质量的机器学习预测模型, 从而指导护理人员为患者提供针对性的延续护理, 辅助延续护理决策。由此可见,使用机器学习的方法可以准确预测慢性疾病的进展模型, 从而有针对性地为患者实施科学的慢性病管理,制定个性化的管理方案,以延缓病情进展,提高患者生活质量。

2.4 预测患者治疗效果 预测患者治疗效果的主要目的是做出一个是否实施该干预的决定, 从而避免低价值的医疗程序。 随机对照试验(randomized control trials,RCT)是验证干预效果的金标准,但由于其有严格的纳入排除标准, 并未考虑接受治疗人群的个体异质性。 电子健康档案 (electronic health records,EHR)包含大量的患者个性化信息,并且已广泛在临床应用,根据EHR 数据评估个体化的干预效果逐渐受到重视,大数据被认为是RCT 的补充方案[42]。 Choi 等[43]基于循环神经网络建立了AI 医生,可以使用患者的历史病历来预测干预治疗后的结果,显示了机器学习用于临床决策辅助的巨大潜力;Tahmassebi 等[44]开发机器学习模型用以预测新辅助化疗措施用于治疗乳腺癌患者的效果, 该模型能够较准确地预测患者在此治疗措施下的生存结果,并帮助早期识别对此治疗反应欠佳的患者, 为指导治疗决策提供有价值的预测信息。

医务人员将患者资料及历史病例输入机器学习模型,根据这些包含异质性的患者数据,模型可推断出患者在接受治疗和不接受治疗时的不同结果,医护人员可以由此来决定此干预是否有益。 这也可以是不同干预措施之间的选择,通过模型的预测,可以计算出不同干预措施实施后患者的不同结局, 从而辅助选取最佳的治疗措施, 这保障了干预的质量与效果,减少了低价值医疗程序。 然而,目前机器学习用于预测患者治疗效果的研究多集中于化疗方案或用药策略的选择, 较少有研究关于护理措施效果的预测与选择,因此也是未来的研究方向。

3 挑战与展望

随着大数据时代的到来和人工智能技术的发展,机器学习作为人工智能的核心,其与医学领域的结合受到越来越多的关注与发展。 然而,机器学习技术在临床中的使用是机遇也是挑战,作为新兴的医疗电子信息技术,目前仍面临着很多挑战。 首先,训练出一个准确性高且普遍适用的机器学习模型对样本数据及队列的选择提出较高的要求。 虽然信息化的发展带来了大量的医疗数据,但同时难以避免EHR 中数据缺失及低质量的问题[45],这容易导致挖掘信息不良以及模型的过度拟合,减少准确性与权威度。 此外,临床医护人员对信息化发展的接受程度和重视程度都尚为缺乏,同样不利于临床信息化的建设与发展。 因此,在未来的研究中,建议加强EHR 数据高质量的录入与管理,这是任何临床决策支持系统的基础。 同时,还应加强对医护人员进行计算机信息技术的相关理论与技能培训,以及鼓励跨学科合作和加强医学信息技术人才的培养,提高临床工作人员的信息素养与计算机技术的使用能力,将机器学习更多的应用于护理领域,指导护理计划制定,辅助护士的临床决策,推动我国医疗信息化、智能化的发展。

猜你喜欢

机器预测疾病
无可预测
机器狗
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
机器狗
进击的疾病
尿碘与甲状腺疾病的相关性
易与猪大肠杆菌病混淆的腹泻类疾病鉴别诊断
夏季养生之疾病篇
未来机器城