APP下载

人工智能技术在新型冠状病毒肺炎中的应用

2021-08-03蔡晓琼郭晶磊黄继汉苏前敏

中国医学物理学杂志 2021年7期
关键词:图像疫情模型

蔡晓琼,郭晶磊,黄继汉,苏前敏

1.上海工程技术大学电子电气工程学院,上海201620;2.上海中医药大学基础医学院,上海201203;3.上海中医药大学药物临床研究中心,上海201203

前言

新型冠状病毒肺炎(Coronavirus Disease 2019,COVID‐19)是由严重急性呼吸综合征冠状病毒2 型(SARS‐CoV‐2)引起的急性呼吸道传染病[1‐2],现已成为前所未有的公共卫生危机,对人类生命安全构成严重威胁。由于COVID‐19 的严重性,世界卫生组织已将风险评估提高到最高水平,并宣布其为全球大流行[3]。截至2021年4月6日,根据约翰斯·霍普金斯大学发布的全球COVID‐19 疫情实时现状报告,全球累计感染COVID‐19 病例已超过1.3 亿,累计死亡人数超过285 万,且呈增长趋势[4]。经临床观察发现,COVID‐19 的典型临床症状包括干咳、呼吸困难、头痛和发烧[5],其他症状包括肌肉酸痛、困惑、胸痛和腹泻,严重者或引起急性呼吸窘迫综合征和败血性休克,最终导致多器官衰竭甚至死亡[6]。因此,早期识别和及时治疗危重病例至关重要。

随着运算能力和内存存储的快速增长、空前丰富的数据以及先进算法的发展,人工智能(Artificial Intelligence,AI)已在应对新型流感、SARS和MERS等流行病中发挥了重要作用,其应用领域包括计算机视觉、语音识别、自然语言理解、数字病理数据分析等[7‐8]。自COVID‐19疫情爆发以来,研究者们进行了多项基于AI的观察性研究,包括探索疾病风险,监测疾病轨迹,以及根据临床数据、患者特征和医学影像数据等各种数据来源开发诊断/预后模型等[9]。刘思远等[10]对AI在COVID‐19放射影像诊断、病例预测、疾病追踪和药物研发方面的应用进行了系统的综述;本文在其基础上对最新研究进展及其他领域研究进行补充概述。基于近期AI在COVID‐19不同场景中应用的研究,本文介绍了最有发展前景的研究领域及相关技术,主要从辅助检测与诊断,网络信息监测,生物医学与药物研发,疫情爆发识别、追踪与预测以及临床研究中的实际应用这5个方面探讨AI在抗击COVID‐19中的应用,旨在为疫情后期防控及今后大流行病的及时防治提供新的解决方案。

1 AI用于COVID‐19辅助检测与诊断

基于深度学习的AI技术由于其出色的特征提取能力在医学图像领域发挥着重要作用。先进的计算机辅助检测与诊断技术依赖于最新的神经网络模型,如全卷积神经网络、ResNet、DenseNet、VGGNet、AlexNet、Inception和Xception等[11‐13]。近年来,AI辅助医学影像检测与诊断技术已在肺癌检测与诊断、早期乳腺癌诊断、结肠息肉病变检测和前列腺癌病变位置/恶性程度诊断等方面作出巨大贡献[14‐17]。在COVID‐19疫情初期,逆转录聚合酶链反应(RT‐PCR)是诊断COVID‐19的金标准,但其缺点在于检测时间较长,且受到检测试剂盒的数量限制。另一方面,检测结果假阴性的情况可能会延迟治疗时间,同时增加病毒传播的风险,故快速检测/诊断COVID‐19很有必要。AI技术已广泛应用于COVID‐19的医学影像检测/诊断研究,邓靓娜等[18]和唐思源等[19]对影像学/AI辅助诊断技术在COVID‐19中的应用进行了初步概述。本文也对最新研究与技术方法进行了系统性总结。

1.1 AI在COVID‐19图像分割中的应用

运用AI技术处理COVID‐19图像时,分割是必不可少的步骤之一。分割主要是提取胸部X射线图像或CT图像中的感兴趣区域,如肺区、肺叶及肺部感染/病变区域,进行进一步评估和量化。对COVID‐19患者的CT扫描图像进行语义分割是一个至关重要的步骤,不仅有助于疾病的诊断,还有助于量化疾病的严重程度,从而实现对感染人群的优先治疗。Wu等[20]提出一种基于混合弱标签的深度学习方法,从CT图像中学习感染与整合信息:源于患者资料的多种信息和人工标记的感染轮廓。该深度学习模型主要包括基于强标签的肺部感染区域语义分割网络(2D U‐Net)训练和基于患者资料弱标签整合后的语义分割网络(2D U‐Net+期望最大化算法)训练这两个部分。通过伊朗、意大利、韩国和美国的多机构CT数据集来验证该模型的性能,结果发现该研究可用于预测感染区域以及与人工注释具有良好相关性的整合区域。Wang等[21]对未经增强的胸部CT扫描图像进行基于U‐Net网络的模型训练以分割肺部浑浊,该模型可以自动分析肺病变体积并预警阳性病例,从而加快患者分类。通过以放射学报告作为参考标准的外部数据集验证分类性能发现该方法用于标记COVID‐19阳性病例的时间中位数为0.55 min;用于鉴别损伤负荷增加时,敏感性为96.2%,特异性为87.5%;用于辅助分类时,曲线下面积(Area Under Curve,AUC)为0.953,敏感性为92.3%,特异性为85.1%,阳性预测值和阴性预测值分别为0.790和0.948。在最新的一项研究中,Saood等[22]比较了SegNet和U‐Net这两种结构不同的深度学习技术,用于对CT肺部图像中感染组织区域进行语义分割,结果显示在应对二分类问题时,SegNet平均精度为0.954,标准差为0.029,而U‐Net平均精度为0.950,标准差为0.043;作为多类分割器时,SegNet平均精度为0.907,标准差为0.060,而U‐Net平均精度为0.908,标准差为0.065。

考虑到COVID‐19 在胸部X 射线中最常见的分布模式为双侧受累、外周分布和磨玻璃混浊[23],Oh等[24]提出一种基于补丁的随机补丁裁剪深度神经网络体系架构,采用扩展的FC‐DenseNet103 网络执行语义分割来提取肺和心脏轮廓,结合以ResNet‐18 作为骨干网络的分类网络,通过绝对多数投票法获得最终的COVID‐19 病例分类结果。在验证集上,该模型的敏感性为92.5%,准确率为88.9%,精确度为83.4%,召回率为85.9%,特异性为96.4%,F1 评分达0.844。另外,Roy等[25]设计的分割模型能够在肺部B超图像中,对包含背景、健康标志物和不同阶段下COVID‐19 生物标志物的区域进行分割与辨别,达到96%的像素精度和0.75 的二分类Dice 评分,该研究方案还可用于解释模型预测的空间不确定性估计。

1.2 AI在COVID‐19图像分类中的应用

先进的AI技术可以辅助COVID‐19病例分类与检测并获得较高的分类效果,减少人工处理时间,从而提高疫情防治效率。Abbas等[26]对基于类分解的卷积神经网络架构进行调整,提出一种DeTraC模型,用以提高预训练模型在从胸部X射线图像中检测COVID‐19病例的性能。研究对比了10 种预训练模型,并证明了DeTraC的类分解方法在使用迁移学习进行知识转化过程中的鲁棒性与贡献,其中VGG19的分类效果最佳:AUC为0.965 49,准确率为97.35%,敏感性为98.23%,特异性为96.34%。Wang等[27]提出一种基于ResNet50和特征金字塔网络的模型,对不同病例的胸部X射线图像进行训练,以区分健康志愿者、社区获得性肺炎及COVID‐19。结果显示,该模型对鉴别COVID‐19患者的效果较好,性能预测值达到99%,且无需任何模拟或预训练。在最新的一项胸部X射线图像研究中,Pathan等[28]采用灰狼优化算法和鲸鱼优化‐蝙蝠算法集成技术对卷积神经网络模型参数进行优化,提高了模型的分类效果:COVID‐19病例的识别准确率达到100%,两种数据集的三分类准确率分别为98.8%和96%。Wang等[29]运用线性分类器、K近邻算法、套索回归和随机森林这4种分类器对肺部CT图像中的感染区域进行分类,以区分COVID‐19阳性和阴性,结果表明套索回归模型的性能效果与专业放射科医生一致(Kappa=0.89)。韩冬等[30]采用计算机辅助分析平台对患者胸部CT图像的肺炎区域进行自动分割,计算得出肺炎密度分布特征并降维至32个特征后,通过将上述特征作为自变量进行支持向量机(Support Vector Machine, SVM)建模,发现多项式SVM模型鉴别诊断效果较好,其AUC为0.897,准确性、敏感性和特异性均为0.906。Chen等[31]探讨了利用迁移学习对胸部CT 图像的识别,结果显示预训练的ResNet50 模型获得的最佳性能是94.87%的敏感性,88.46%的特异性,识别COVID‐19的准确率为91.21%,测试集中的三分类(正常、COVID‐19和其他肺炎)总体准确率为89.01%,而通过预训练的ResNet18获得最佳的总体准确率为94.08%,AUC为0.993。

1.3 AI在COVID‐19其他图像任务中的应用

据世界卫生组织关于疫情防控的相关建议,在公共场所佩戴口罩是最有效的保护措施。在病毒完全消失之前,口罩有助于降低疫情传播风险,同时可预防通过空气传播感染的其他传染性疾病。为了从人群中快速识别未佩戴口罩的目标,Loey 等[32]提出一种基于深度学习和经典机器学习算法的口罩检测模型,该模型由ResNet50 特征提取模块与经典机器学习分类模块构成,对比发现SVM 在训练过程中耗费最少的时间得到了最高的准确性。类似地,Singh等[33]使用两种先进的目标检测方法(YOLOv3 和faster R‐CNN)进行口罩识别,发现使用YOLOv3 算法的模型可能更适用于真实世界的监控摄像头或其他设备中,因为其可以进行单阶段检测,并且相比其他目标检测模型,推理时间更短。在全球范围内爆发COVID‐19 的情况下,大多数人脸识别系统由于面部佩戴口罩而检测失败,Priyadharshini 等[34]提出了一种用于人耳识别的6 层深度卷积神经网络体系结构,对IITD‐II 数据集和AMI 数据集的识别率分别达到97.36%和96.99%,并使用AMI Ear 数据集在非控制环境下验证了该系统的鲁棒性。

2 AI在网络信息监测中的应用

社交媒体已成为危机期间促进风险传播的重要渠道,可用于衡量公众对突发公共卫生事件的关注度,如H7N9、埃博拉病毒、MERS 和登革热等[35‐38]。自COVID‐19 爆发以来,公众主要通过世界卫生组织、各国疾病预防控制中心及专业新闻媒体的官方网站/社交渠道等途径获得可靠的疫情相关信息。其次,由于网络信息的可访问性与及时性,国内外公共社交平台(如新浪微博、Reddit、Twitter、YouTube、Instagram)和在线医学论坛在传播相关信息时也显示了其重要性。作为一种快速处理大批量数据的数据挖掘工具,AI已被应用于实时监测社交网络动态,早期识别COVID‐19 症状及挖掘相关主题的社交情绪以改善疫情传播情况[39]。

为了从舆论中发现与COVID‐19 相关的问题,Jelodar 等[40]采用基于主题建模的自然语言处理方法,从Reddit 社交新闻站点中挖掘与COVID‐19 相关的讨论,并设计基于长短期记忆网络的深度学习模型对相关用户评论进行情感分类,了解大众对COVID‐19问题的正面或负面意见,为相关决策提供参考,以改善健康策略。Cresswell 等[41]开发了一种基于集成的新型AI 模型,通过结合最先进的词库规则技术与深度学习方法,对Facebook 和Twitter 平台内英国地区发布的帖子与推文进行情感分类与情感空间映射,发现平均积极情绪远远超过消极情绪,且情绪类型之间存在6 倍差异。另一部分研究则针对美国用户在Twitter 平台上发布的英语社交媒体数据进行调查与分析,确定医疗环境、情感支持、商业经济、社会变革和心理压力等COVID‐19 相关语义主题,还准确地预测了在研究期间个人构念的流行趋势[42‐44]。这类统计学贡献对于确定在线社区的积极和消极行为及收集用户意见以帮助研究人员和临床医生更好地了解人们在危急情况下的行为具有较高参考价值。Ebadi等[45]利用机器学习方法提取了研究主题、出版物相似度和情感的时间演变,发现PubMed 和ArXiv 平台内现有出版物类型存在显著差异。前者出版的相关文章类型更具多样性,而后者更侧重于监测/诊断COVID‐19 的智能系统/工具。通过对各层面进行综合分析,可以帮助决策者更好地了解COVID‐19 的研究动态,有助于战略制定或调整。

此外,基于AI 的网络信息监测还可以帮助患者在武汉封闭期间及早获得关注,以便政府和卫生部门识别高危患者并采取相应措施。Huang 等[46]通过新浪微博及时获取公众需求信息,收集疑似或实验室确诊患者的特征、患者在武汉市的分布情况以及帮助者与患者之间的关系。研究发现,在新浪微博上寻求帮助的患者均来自武汉,大多数是老年人,伴有发热症状,并且胸部CT发现有毛玻璃样浑浊。

3 AI在生物医学与药物治疗中的应用

由于疫情早期缺乏特异性药物,临床研究者将现有药物作为主要研究对象,进行大量的重复性试验。结果表明瑞德西韦(Remdesivir)、羟氯喹(Hydroxychloroquine)、洛匹那韦/利托那韦(Lopinavir/ritonavir,LPV/r)和免疫调节剂这4种被大量研究的非特异性抗病毒药物对COVID‐19均无显著疗效[47‐50]。因此,在没有经临床验证的药物和疫苗的情况下,部分研究者开始运用AI技术以辅助新药设计、现有药物挖掘及疫苗研发[51‐54]。Gysi等[55]结合AI、网络传播和网络距离算法构建药物再利用网络医学框架,通过比较COVID‐19疾病模块与其他299个疾病模块之间的距离推出两种疾病的相关性,进一步评估现有药物再利用方法的性能。该方法不仅从918种药物中预测出6种潜在的候选药物,还提出一种快速确定治疗方法的算法工具集,旨在为传统新药开发期间填补疾病治疗空白。而Santana等[56]使用深度学习模型对SARS‐CoV‐2主蛋白酶(Main Protease,Mpro)抑制剂进行从头设计和生物活性预测,为快速确定应对的抗病毒药物提供可能。类似地,Ghosh 等[57]分析发现杂环核如二唑、呋喃和吡啶对Mpro抑制具有明显的积极作用,而噻吩、噻唑和嘧啶则可能呈消极作用。在当前针对SARS‐CoV‐2的活性化合物稀缺的情况下,AI提供的解决方案可加快特效药/新药的研发与优化。此外,部署安全有效的疫苗亦是减轻疾病严重程度与控制病毒传播的关键。Saad‐Roy等[58]基于辉瑞/BioNTech、Moderna和牛津/阿斯利康这3种现有疫苗来选择参数(包括流行病学与病毒进化方面的考虑因素等),对疫苗注射机制进行建模假设,模型预测结果表明在部分群体免疫力的某些条件下,一剂政策可能会增加抗原进化的可能性,这一发现为当前COVID‐19及预防未来的流行病部署疫苗的若干考虑奠定了基础。

4 AI在COVID‐19识别、追踪与预测中的应用

Susceptible‐Infected‐Recovered(SIR)模型是传染病模型中最经典的模型之一,该模型的3个变量分别代表易感者(S)、感染者(I)和康复者(R)[59],传统的SIR模型忽略传播率β与恢复率γ的时变性以及二次感染的可能性,无法直接用于COVID‐19传播预测。为提高疫情监测的敏感性与准确性,Katris[60]利用改进的时间序列模型(TES、ARIMA和ANN模型的组合模型)、对数正态分布和tSIR流行病学模型建立了一种基于时间序列的数据驱动统计模型,通过希腊疫情数据对预期发病率和疫情下降趋势进行预测,并使用指数曲线法计算出基本传染数R0。同时,该方案也适用于其他流行病的追踪与预测,为流行病学建模提供了新思路。Singh等[61]在收集印度全国/各州的疫情传播数据(包括确诊病例数、人口统计和环境因素等)的基础上,通过卡尔曼滤波预测算法对未来的COVID‐19病例数增长趋势及发展情况进行预测,发现其结果与7 d内确诊病例数高度相关,更适用于短期传播预测。Al‐qaness等[62]提出一种新型短期时间序列预测模型,通过混沌迭代的海洋捕食者算法增强自适应神经模糊推理系统预测能力,避免传统自适应神经模糊推理系统的缺点,有助于高风险地区决策者制定应对计划。由于检测率不一及统计病例数的时滞等复杂因素使得难以在现有数据中进行准确追踪/识别,Zohner等[63]提出一个基于Python的网络应用(COVID‐TRACK),以便实时追踪与COVID‐19相关的测试、发病率、住院率和死亡人数等多种信息。该动态应用程序以清晰简洁的方式提供了对现有数据的多角度和整体看法,可在未来几个月内跨地区监测疫情趋势,为COVID‐19及未来爆发期间的政策制定提供参考。

5 AI在COVID‐19临床研究中的应用

临床研究是指以人类志愿者(也称为参与者)为主要研究对象,旨在增加与疾病治疗、诊断和预防相关的医学知识的研究,其主要类型为临床试验(或干预性研究)和观察性研究[64]。为进一步探讨AI技术对COVID‐19的影响,收集了中国临床试验注册中心网络平台相关研究的注册信息,通过人工审核注册题目与研究方案进行归类总结,以分析AI在COVID‐19临床研究中的实际应用情况。目前共有32项基于AI技术的COVID‐19临床研究在平台中完成注册(含已撤回研究),应用领域有辅助诊断、预警/预测模型构建、远程监测/管理平台搭建、智能采样机器人、AI辅助治疗、疫苗研发系统及智能化医疗设备开发,具体应用情况如图1所示。值得注意的是,广州医科大学附属第一医院与上海中医药大学附属曙光医院发起了两项(鼻)咽拭子采样机器人研究(注册号分别为ChiCTR2000030861 和ChiCTR2000035985),期望通过遥控与局部自主结合的方式实现远程(鼻)咽拭子采样工作,实现检测的标准化、流程化、便捷化与智能化,同时避免医护人员与患者直接接触以降低医护人员感染风险。综上所述,AI在早期疫情防控中已发挥了重要作用,而临床研究者开始将目光聚焦于“AI+临床需求”,令AI真正应用于COVID‐19临床工作的各个方面,并持续高效地为临床医生提供支持。

图1 AI在COVID-19临床研究中的应用Fig.1 Application of artificial intelligent in clinical study on COVID-19

6 结论与展望

本文总结了AI 技术应对COVID‐19 的研究进展,发现其主要从以下几个重要方面为疫情防治做出贡献:(1)基于医学影像的辅助检测与诊断,与其他临床数据相结合,实现针对特定患者的预测;(2)利用智能物联网收集与整合网络数据,进行大规模筛查与监测,挖掘高价值信息;(3)探索预防措施与治疗方案,具体包括药物再利用、新药研发及疫苗开发等;(4)识别、追踪和预测疫情爆发,快速制定应对方案;(5)与临床研究相结合,探索AI 在医学领域的实际应用前景,以提高防治效率。

在有限的医疗资源面临疫情巨大消耗的情况下,使用AI 技术来辅助诊断、监测、寻找治疗方法和公共卫生决策,有助于提高抗击大流行病的效率,但基于AI 的COVID‐19 应用程序在开发过程中仍面临诸如数据可用性与异质性、临床数据共享不足、模型的安全性和可解释性的挑战。因此在应对未来的大流行病时,首先,应及时提供相关的生物、临床和开放数据(科学出版物和数据库),以便后续的数据转化、挖掘及分析;其次,在提高模型精确度的同时也必须提供足够的可解释性依据,以证明预测结果在医学中的有效性与准确性;最后,物联网、5G、云计算、边缘计算和大数据技术与医疗的结合也是当下研究热点,探索新一代信息技术对应对大流行病传播具有现实意义与实际应用价值。

综上所述,AI积极用于应对COVID‐19是一项革命性、创新性的举措,在此基础上的快速解决方案能够增强预防、及时控制、提高诊断、高效治疗、精准预后,同时也要考虑其在医疗领域中亟待解决的一些问题。目前,实现将“AI+医疗”解决方案调整为新常态的应对机制以应对疫情后期及未来可能发生的流行病,仍需计算机科学家与医学领域专家的共同努力与大量实践。利用“AI+医疗”算法模型准确生成结果、整合各种信息类型和来源、确保内部工作机制可解释,为医疗领域提供信息科学的前沿应用,提升医护人员诊疗效率和医疗服务能力。

猜你喜欢

图像疫情模型
一半模型
改进的LapSRN遥感图像超分辨重建
战疫情
重要模型『一线三等角』
抗疫情 显担当
疫情中的我
有趣的图像诗
重尾非线性自回归模型自加权M-估计的渐近分布
疫情期在家带娃日常……
3D打印中的模型分割与打包