基于WOS的重症医学领域人工智能研究的可视化分析
2023-05-17张开友王思佳
张开友,王思佳
四川大学华西第二医院临床检验科/出生缺陷与相关妇儿疾病教育部重点实验室,四川成都 610041
有研究报道,重症监护室(ICU)患者的病死率为8.6%~79.0%,而影响患者预后的原因复杂多变[1-2]。在众多影响因素与不确定环境下,医生和患者家属在大量复杂的数据信息和病情变化面前,需要做出高风险决策;而临床医护人员在治疗计划、最优资源分配、工作量确定、护理质量评估等方面也面临重大挑战[3-4]。近年来,人工智能(AI)在医疗健康领域中得到广泛应用,其主要目标是从大数据中挖掘隐藏的信息,并帮助医务人员做出有效的临床决策[5]。AI在疾病诊断、癌症患者筛查、治疗选择、减少用药错误和提高医疗技术等方面的研究不断增长[6-9]。在重症临床工作中,AI发挥着不可忽视的作用,因重症患者需24 h实时监测,有大量动态客观的数据供挖掘,而AI可通过信息提取和机器学习等来加强患者临床治疗的决策制订、构建病情预测模型、优化医护工作流程等,也可通过患者实验室检测指标、生命体征变化及影像学检查结果等在关键时刻识别重症患者病情变化,为制订临床方案提供依据。随着AI在重症医学中应用的剧增,迅速了解该领域的研究内容和研究热点非常重要,因此,本研究采用文献计量学分析方法对该领域文献进行可视化分析,以全面概述重症医学领域AI应用的研究趋势和热点,为未来AI在重症患者中的研究提供有意义的方向。
1 材料与方法
1.1数据来源和检索策略 检索Web of Science数据库(WOS)核心合集,检索时限为2000年1月1日至2022年7月31日。由2位研究者独立进行文献检索,检索结果具有一致性。纳入标准:摘要符合AI结合重症医学领域的主题;排除标准:科技成果、报纸、会议的文献报道。
1.2研究方法 采用CiteSpace6.1.3(64-bit)和VOSviewer1.6.18对文献的国家、机构和作者进行合作网络分析,对共被引文献和关键词进行共现分析,从而探寻重症医学领域AI研究的分布、研究热点和趋势。根据研究目的设置CiteSpace的时间跨度为2000-2022年,时间切片为1年。网络节点关联强度选择Cosine算法,选择标准阈值设定为g-index=25。根据可视化结果选择最小生成树算法对可视化网络进行精简优化。
2 结 果
2.1文献检索情况 共检索文献3 362篇,剔除重复文献2篇,非英语文献49篇,非研究类和综述类文献718篇,最终得到有效文献2 593篇。检索策略见表1。
表1 2000-2022年AI在重症医学领域研究文献检索策略
2.2发文量分布特征 重症医学领域AI研究发文量呈逐年增长的趋势,可分为3个阶段,最后一个阶段增长迅速,波动较大。(1)2000-2015年:AI在重症医学领域的研究增长缓慢,年平均论文数28.56篇;(2)2016-2018年:年平均论文数达117.67篇,与前一时期相比,增长明显。(3)2019-2022年:年平均论文数达445.75篇,占整个研究时段发文量的68.76%(1 783/2 593),呈爆发式增长。见图1。
图1 2000-2022年重症医学领域AI研究年发文量图
2.3国家、机构、作者合作强度 所检索到的文献包含91个国家、3 745家机构、13 656位作者参与重症医学领域AI的研究。国家发文量排名前3位的分别是美国(1 027篇)、中国(438篇)、英国(184篇);机构发文量排名前3位的分别是麻省理工学院(78篇)、哈佛医学院(64篇)、匹兹堡大学(53篇),合作密切度排名前3的是麻省理工学院[连线粗细程度(TLS)=53]、哈佛医学院(TLS=44)、贝斯以色列女执事医疗中心(TLS=43)。作者发文量前3位是CELI L A(27篇)、ZHANG Z H(19篇)、LEE J(16篇)。作者之间以麻省理工学院的CELI L A和浙江大学ZHANG Z H等为核心的研究团队。见表2和图2~4。
表2 国家、机构和作者发文量和合作强度
图2 国家/地区合作网络图
图3 机构合作网络图
2.4共被引文献分布和聚类结果 对82 624篇参考文献创建了一个共被引文献的聚类网络,在该可视化网络中,不同的节点类型组成一个聚类,代表共引文献的数量和中心性。具有代表性的引文标签显示了每个聚类的研究主题,文献的共引用频次及中心性分别见表3~4。CiteSpace生成了一个包含755个节点和1 244条线条的聚类图,见图5。其中,Modularity Q=0.842 9,Silhouette=0.866 7,模块化Q>0.3,说明聚类结构合理。被引频率排名前3的文献作者是JOHNSON A E W(2016年,频次为297)、SINGER M(2016年,频次为149)、NEMATI S(2018年,频次为92),中心性排名前3的文献作者是CELI L A(2013年,中心性为0.18)、SINGER M(2016年,中心性为0.12)、SAEED M(2011年,中心性为0.11),CELI L A(2013年)和SINGER M(2016年)的频次分别为15和149,但中心性都>0.1。聚类结果显示,共被引文献生成6个聚类标签,包括#0 sepsis(脓毒症)、#1 COVID-19、#2 physiologic monitoring(生理监测)、#3 asynchronies(异步性)、#4 mortality prediction(病死率预测)、#5 brain injuries(脑损伤),见图5、6。
图4 作者合作网络图
表3 2000-2022年AI在重症医学领域的高频次共被引文献
表4 2000-2022年AI在重症医学领域的共被引文献的中心性
图5 共被引文献聚类视图
图6 共被引文献时间线图
2.5关键词的分布和聚类结果 共计8 712个关键词被纳入研究,machine learning(机器学习)、mortality(病死率)、intensive care unit(ICU)关键词出现频次超500次,其次risk factors(危险因素)、artificial intelligence(人工智能)、sepsis(脓毒血症)、critical care(危重护理)、outcome prediction(结局预测)等关键词出现频次相对较高(>200次),见表5。关键词聚类图显示,VOSviewer关键词最小出现频次阈值为5,符合条件的关键词为784个,包含machine learning(机器学习)、mortality(病死率)、sepsis(脓毒血症)、critical care(危重护理)、management(管理)和mechanical ventilation(机器通气)7个聚类标签。见图7、8。
图7 关键词聚类网络图
表5 2000-2022年AI在重症医学领域频次≥100次的关键词分布情况
续表5 2000-2022年AI在重症医学领域频次≥100次的关键词分布情况
图8 关键词时间线图
3 讨 论
CiteSpace和VOSviewer的可视化功能允许对近22年AI在重症医学领域的原始文章进行文献计量学分析。本研究结果显示,2000-2022年发表的关于该主题的科学文章数量呈增长趋势。由此可见,AI在重症医学领域的应用已逐渐成为一个重要课题。目前多见单一量化的文献分析,少见应用文献计量学研究系统对该领域进行分析和概述的研究;随着AI在重症医学领域的深度应用,需要及时掌握该领域的重点研究内容和热点,并反馈予临床。本研究正是契合这一要点,分析近22年AI应用于重症领域的相关文献,通过绘制知识图谱对该领域发展现况、研究热点及趋势进行可视化分析,为未来临床AI在重症患者中的研究提供有意义的方向。
3.1国家、机构、作者合作强度分析 本研究显示,国家发文量排名前3位的分别是美国(1 027篇)、中国(438篇)、英国(184篇)。TLS反映各国之间合作关系密切程度,以美国为中心开展的研究众多,其次是英国。机构发文量排名前3位的分别是麻省理工学院(78篇)、哈佛医学院(64篇)、匹兹堡大学(53篇),合作密切度排名前3的是麻省理工学院(TLS=53)、哈佛医学院(TLS=44)、贝斯以色列女执事医疗中心(TLS=43)。作者发文量前3位是CELI L A(27篇)、ZHANG Z H(19篇)、LEE,J(16篇)。说明AI在发达国家的应用较发展中国家多,但国家之间、机构间的合作力度不够,还有待加强,这或许与国家综合科技实力相关;作者间合作以麻省理工学院的CELI L A和浙江大学ZHANG Z H最为密切。另外,本研究发现2019-2022年,AI在重症医学领域应用的文献呈现爆发式增长,这说明该领域的研究已经成为各国、各机构的关注热点,其研究价值和应用前景都值得研究人员关注。
3.2共被引文献的分布和聚类分析 本研究显示,被引频率排名前3的文献作者是JOHNSON A E W(2016年,频次为297)、SINGER M(2016年,频次为149)、NEMATI S(2018年,频次为92),中心性排名前3的文献作者是CELI L A(2013年,中心性为0.18)、SINGER M(2016年,中心性为0.12)、SAEED M(2011年,中心性为0.11),CELI L A(2013年)和SINGER M(2016年)的频次分别为15和149,但中心性都>0.1,说明这2篇参考文献的影响力较大。对于聚类分析,共被引文献生成6个聚类标签,包括#0 sepsis(脓毒症)、#1 COVID-19、#2 physiologic monitoring(生理监测)、#3 asynchronies(异步性)、#4 mortality prediction(病死率预测)、#5 brain injuries(脑损伤)。图6时间线图中,节点出现的时间表示该聚类首次引用时间,“#5 brain injuries(脑损伤)”聚类出现最早,(2007年),而“#1 COVID-19”出现时间最晚(2019年)。说明近几年研究人员的关注热点是脓毒症、生理监测、病死率预测、脑损伤和COVID-19,而这些热点中蕴含的危险因素识别尤为重要。
3.2.1危险因素识别的AI研究对临床决策有重要作用 通常,重症患者病情重且变化快,医生和护士期望通过AI技术识别出对患者生命有影响的因素,在病情恶化之前提前采取措施,阻止患者出现生命危险。这类研究包括对病死率和预后的预测、实验室数据和影像学资料中危险信息的识别、住院时长和非计划再入院率的预测。本研究也发现,AI算法对危重患者脓毒血症、病死率、出入院等进行预测的内容是近年的热点。有研究表明使用无创参数来预测ICU患者院内早期病死率,可纳入变量多达151个,建立的患者病死率预测模型优于传统评分方法,这为ICU患者病死率预测的广泛应用提供了可能,为制订准确的临床决策提供了依据[10]。同时,部分研究的主要方向为利用AI开发可识别重症患者病情变化的电子病历系统。因此,着眼于危险因素识别的AI研究对临床决策意义重大。
3.2.2机械通气报警识别是危险因素中AI研究的主要内容 机械通气是重症患者治疗的重要部分,AI在机械通气的应用包含对机械通气患者插管时长和病死率预测、插管定位、拔管后后低血氧饱和度的预测。YANG等[11]开发一个基于基线变量的机器学习模型对快速浅呼吸指数的轨迹识别延长机械通气患者。CHAN等[12]采用机器学习建立机械通气患者病死率预测模型,急性生理与慢性健康评分、血红蛋白和清蛋白是预测年病死率的鉴别点。早期准确预测气管插管位置对危重患者至关重要,基于AI的关键点检测系统发现,气管插管经隆突插入20~55 mm是最佳位置[13]。而机器学习算法可精准预测重症患者拔管后出现低氧血症的风险[14]。由此可见,AI与机械通气的深度融合应用,对重症患者的精准治疗提供了重要参考依据,这一研究内容也值得临床关注。
3.3关键词的分布和聚类分析 本研究显示,关键词聚类分析中,共出现machine learning(机器学习)、mortality(病死率)、sepsis(脓毒血症)、critical care(危重护理)、management(管理)和mechanical ventilation(机器通气)7个聚类标签。时间轴视图显示,几乎每年都会出现新的关键词,machine learning(机器学习)、deep learning(深度学习)、artificial intelligence(工人智能)等是近2年的热点词汇。这说明随着时间的推移,研究热点会不断变化,研究人员需要实时关注。
3.3.1机械学习、深度学习,是AI研究的鲜明特点,并在自动化预测方面有重要作用 DESAUTELS等[15]开发了基于患者生命体征的机器学习预测模型识别脓毒血症,该模型只涉及6项基本生命体征,缺少大量临床数据;有研究表明,基于机器学习模型,结合人口学特征、生命体征、血液检测结果、评分系统等变量可以更准确地识别脓毒血症的发生[16]。SAWHNEY等[17]研究也表明AI在预测脓毒血症患者病死率中,格拉斯哥昏迷量表评分、血尿素氮、呼吸频率、尿量和年龄是重要的因素。这说明AI在脓毒症自动检测系统、病死率预测等方面发挥着重要作用。此外,急性肾损伤(AKI)是危重症患者常见的并发症,其发生率高达60%,病死率为40%~60%[18],传统研究对AKI识别和预测有巨大贡献,但AKI的特异性和病理生理学表现仍是一大挑战。KOYNER等[19]利用电子健康数据开发了一种预测工具,预测在血清肌酐升高的41 h内未进行血液透析时,发生AKI 2期的可能性较大。因此,AI可能在AKI事件后的AKI轨迹和风险评估中发挥进一步的作用。与此同时,有研究表明采用机器学习对脓毒症患者AKI的预测,可用于协助临床医生识别高危患者并实施早期干预以降低病死率[20-21],而基于机器学习模型可以预测脓毒症相关AKI危重患者住院后48、72、120 h及ICU入院后28 d内的住院病死风险[22]。
3.3.2AI在临床领域的广泛应用可以为临床研究提供重要数据 目前,AI也在不同科室的重症患者中得到运用。在神经外科重症患者中被用于智能护理信息管理系统的设计和肠内营养支持评估等[23];在急诊重症患者中用于分诊[24];在儿科重症患者中用于中心静脉导管相关深静脉血栓形成的危险因素识别和患者临床结局预测[25];也被用于利用呼吸机参数预测心脏ICU患者快速脱机程序[26]。这说明AI的应用正在临床领域广泛开展,其重要的应用参考价值日渐凸显。同时,笔者也发现多参数重症监护智能监测Ⅱ已成为机器学习模型构建和验证的重要数据库。越来越多的研究者利用该数据库数据预测重症患者治疗、预后、并发症等,为重症患者的管理、治疗和护理提供了依据。
近二十年AI在重症医学中的应用取得了显著进步,国内外的关注热点具有一致性,美欧国家处于领先位置,主要表现在发文量和机构合作密切度上,国内机构需要加强与领先机构的合作交流,提升在该领域发展速度和质量。本研究通过对AI在重症医学研究中的可视化分析,发现当前重症医学领域AI研究的热点集中在脓毒血症、生理监测、病死率预测、脑损伤和机械深度学习上。而5G的推广使用,使AI在重症医学中应用的研究不仅关注预测重症患者的临床结局,在治疗、并发症等方面的应用也取得重要的成果,这一结果也促进未来的研究将AI的成果用于实践。本研究也存在一些局限性。首先,本研究只包括一个数据库中的原创文章和评论;其次,AI在重症医学领域的伦理研究的文献数量和影响有限,未被软件提取热点和趋势。