人工智能辅助新型冠状病毒肺炎诊断及预后预测模型相关进展

2021-01-02应池清吴炜

浙江医学 2021年12期

应池清吴炜

新型冠状病毒肺炎（coronavirus disease 2019，COVID-19）是一种传染性极强、传播速度非常快的传染性疾病。目前诊断该病的金标准是对呼吸道标本进行RT-PCR，但存在用时长、过程复杂、阳性率不高等缺点，同时还存在检测试剂盒供应紧缺、检测能力不足、检测结果错误等问题，可能导致新型冠状病毒（severe acute respiratory syndrome coronavirus 2，SARS-CoV-2）进一步扩散[1-2]。因此，迫切需要其他辅助诊断系统来弥补核酸检测的不足。人工智能（artificial intelligence，AI）是计算机领域的一个重要组成部分，主要包括大数据技术、图像识别技术、语音识别技术等[3]。近年来，计算机视觉、深度学习已被广泛应用于医学领域，并展示了其优势。随着计算能力的提高以及海量数据集的增加，在临床实践中，基于AI应用程序的开发与投资逐年增多[4]。在疾病大流行情况下，利用AI开发COVID-19早期诊断与预后预测系统，有助于缓解对专业人员的大量需求，帮助放射科医生和临床医生抗击疫情[5]；利用AI开发COVID-19临床预后评估系统，可以帮助医生快速、准确地进行诊断与预后评估。另有研究表明，利用预先训练的疾病诊断模型，有助于减少建立其他疾病诊断模型所需的计算量、数据库，同时减少开发成本[2，6-7]。因此，开发AI辅助COVID-19诊断及预后预测模型对疾病的预防与控制具有重要意义。本文就国内外利用AI开发COVID-19辅助诊断及预后预测的相关研究作一综述。

1 AI辅助诊断

利用AI辅助诊断COVID-19包括以下3个方面：（1）利用影像学数据库学习特征并得出结论；（2）利用临床变量（如血液检测、呼吸波等）进行特征提取并得出结论；（3）结合影像学数据和临床变量进行分析并得出结论。

1.1 基于影像学的AI诊断模型 X线图像（CXR）、CT检测早期肺部变化的灵敏度较高，是诊断COVID-19肺部感染必不可少的工具。部分COVID-19患者的影像学改变甚至早于临床症状[2，8]。多数COVID-19患者有着相似的影像学表现，多为磨玻璃结节（GGO）、晕轮征、空气支气管征、血管增厚等，可有肺实变，重症患者会出现双肺弥漫性GGO，甚至大面积融合形成白肺等改变[2，9-11]。研究发现，在没有AI辅助的检查中，6位放射科医生根据CT影像识别COVID-19的平均准确度为85%，而借助AI诊断模型后平均准确度达90%[12]。基于CT或CXR诊断COVID-19是一个分类问题，包括以下步骤：（1）对肺部图像进行预处理；（2）使用卷积神经网络或其他方法提取特征；（3）分类器系统利用所提取特征给予执行诊断命令，输出结果[13]。

Xu等[2]利用 AI对618份 CT图像（来自RT-PCR确诊为COVID-19患者219份、甲型流感病毒性肺炎患者224份、正常健康者175份）进行预处理以提取有效的肺区域，再使用三维卷积神经网络（CNN）模型进一步分割为3 957份图像区域，然后利用图像分类模型分为3种类型的图像：COVID-19、甲型流感病毒性肺炎、正常健康者，该图像分类模型工作基于不同感染的不同图像表现、结构、距肺边缘的相对距离（位于胸膜附近的感染灶更有可能被识别为COVID-19）计算出病变类型概率。最后选择90份CT样本图像进行测试，结果显示总体准确率达0.867。Li等[12]收集了3 322例确认合格患者的胸部CT扫描数据用来开发与评估COVID-19深度学习框架模型，以区分COVID-19、社区获得性肺炎和其他肺部疾病（包括肺部结节、慢性炎症和其他疾病）。该研究将训练集用于训练模型：一系列CT图片作为输入数据，生成对应图片的特征，再将所有图片提取的特征进行组合，最终特征图用于反馈与计算每种疾病类型的可能概率。经验证，在独立的测试数据集上，该模型诊断COVID-19的灵敏度为0.90，特异度为0.96。

CXR诊断COVID-19的效能差于CT，但考虑到CT设备污染、医护人员暴露等问题，CXR在当下疫情形势紧张的情况下不可或缺。Khan等[13]在含1 300份CXR图像的数据集上进行训练和测试。所建立的模型经过预处理、提取特征等步骤后，在COVID-19、细菌性肺炎、病毒性肺炎、正常人群等4种分类中进行测试，识别COVID-19的总体准确度为0.896；在COVID-19、其他肺炎、正常人群等3种分类中进行测试，识别COVID-19的总体准确度为0.95。Zhang等[14]为开发一种可用于不同医院不同CXR成像系统的深度学习算法，对5 806份经RT-PCR确诊为COVID-19患者和5 300份非COVID-19（确诊为肺炎）患者的CXR图像进行随机分组并用于训练和测试模型，所建立的AI诊断模型识别COVID-19的AUC为0.92，灵敏度为0.88，特异度为0.79，高于放射科医生的诊断水平。

1.2 基于临床变量的AI诊断模型 CXR的假阴性结果发生率及CT检查成本均较高，而基于血液测试、临床表现等的AI诊断模型可以作为替代方法，帮助诊断COVID-19[1，9]。Cabitza 等[1]将 COVID-19 患者中发生显著改变的血液化学值设为参数，以入院的1 624例患者（COVID-19占52%）血液化学值分为不同训练数据集，用于开发机器学习（ML）模型，即用完整的数据集（全血细胞计数、血生化、凝血、血气分析及血氧饱和度测定值，年龄，性别，分诊时症状）和2个子数据集（特定COVID-19数据集和全血细胞计数数据集）进行数据插补、数据标准化、特征选择和分类；所开发的ML模型在完整的数据集中利用不同AI算法的接收器识别COVID-19的 AUC为0.83～0.90，灵敏度最高为0.89，特异度最高为0.91。

此外，有研究利用咳嗽波、呼吸波等临床变量进行COVID-19诊断模型的开发[15]。因单独临床变量构建的模型表现不如其他模型好，目前只有少数研究集中在基于常规血液检查结果及其他临床变量的AI诊断模型开发上。

1.3 基于影像学和临床变量的AI诊断模型 COVID-19患者的影像学表现和临床表现是多变的，仅基于影像学或临床变量的AI诊断模型会限制临床医生排除疾病的能力[6，16]。现在越来越多的研究基于患者症状、常规检测结果和影像学结果来构建更准确的COVID-19诊断模型。Mei等[6]收集2020年1至3月18个医疗中心收治的905例有疑似COVID-19症状患者的胸部CT图像及临床变量[包括旅行和接触史、血常规检查结果（绝对中性粒细胞数、中性粒细胞比例、绝对淋巴细胞数、淋巴细胞比例等）、症状（发烧、咳嗽和咳痰）、年龄、性别]，其中训练集534例（其中COVID-19确诊患者242例），调整集92例（其中COVID-19确诊患者43例）、测试集279例（其中COVID-19确诊患者134例）。该研究建立了3个模型用于诊断COVID-19，第1个模型仅基于胸部CT图像，用预先训练对识别胸部CT图像中异常肺切片的准确率高达0.994的肺结核CNN模型来评估收集图像片中存在肺实质异常情况的概率，然后进行排序，将每例患者的前10份异常CT图像输入诊断CNN模型以预测COVID-19的可能性；第2个模型仅基于临床变量，将数据输入机器学习模型中进行分类；第3个模型基于胸部CT图像和临床变量，由图片选择、CNN模型和非影像临床信息机器学习模型生成的特征通过多层感知器神经网络结合，分析数据并得出概率。该研究表明，在同一个数据库中，仅基于CT图像的CNN模型诊断COVID-19的灵敏度为0.836，特异度为0.759，AUC为0.86；仅基于临床变量的模型诊断COVID-19的灵敏度为0.806，特异度为0.683；基于胸部CT图像和临床变量的神经网络模型可实现灵敏度0.843，特异度0.828。借助基于胸部CT图像和临床变量的神经网络模型后，放射科医生识别能力明显提高，灵敏度达0.746，特异度达0.938。

Wang等[17]开发了基于影像学和临床变量的AI诊断模型，该研究利用之前收集的4 106例肺癌患者数据（包括基因突变情况）来辅助训练模型，这些数据不仅扩大了训练集，提高模型从CT图像中学习肺部特征的能力，而且让模型学习微观肺功能异常与宏观肺影像结构变化之间的联系。用肺癌数据集训练后，模型在收集的1 226例确诊COVID-19患者数据集中对影像进行分割、诊断训练，该联合模型结合肺部影像、年龄、性别、合并症等数据得到满意的COVID-19诊断结果，在测试集中AUC达0.88。Li等[18]根据相似的临床变量对患者进行分类，对每个临床变量进行标准化处理，并使用AI模型进行分析，选取相对更有意义的患者症状和常规检测结果[血清免疫细胞水平、性别、CT图像、CXR图像和临床症状（腹泻、发烧、咳嗽、喉咙痛、恶心和疲劳）]来构建COVID-19诊断模型。该模型是用于区分COVID-19与流行性感冒的计算分类模型，其诊断COVID-19的灵敏度为0.925，特异度为0.979。此外，该研究利用AI分析发现了临床变量之间的一些新关联，如男性与血清淋巴细胞、中性粒细胞比例等之间的相关性。利用这些研究结果找出相互关联的变量，可以更好地结合数据来辅助COVID-19的临床诊断，并可以作为之后模型分析的研究变量。

综上所述，基于影像学和临床变量的AI诊断模型表现优于仅基于影像学或临床变量的模型，建议今后的研究更多关注在联合模型的开发上。

2 AI辅助预后预测

COVID-19早期症状多样，除可能出现呼吸道症状如干咳、呼吸困难外，还会出现发热、流涕、疲惫、喉咙痛、肌痛、食欲不振、嗅觉减退、味觉改变以及消化道症状等[16]。研究表明，超过60%的COVID-19患者在进入重症疾病阶段会出现病情恶化甚至死亡[5]。因此，早期发现急性呼吸衰竭等风险较高的患者，有助于及早对其进行密切监视并给予相应的干预治疗[19]。在当前COVID-19疫情形势紧张的情况下，利用AI建立预后预测及预警模型，有助于快速筛选COVID-19患者，识别潜在的高风险患者。利用AI辅助COVID-19预后预测的模型主要有以下3种：（1）基于影像学的AI预测模型；（2）基于临床变量的AI预测模型；（3）基于影像学和临床变量的AI预测模型。

2.1 基于影像学的AI预测模型许多研究发现在普通型COVID-19、严重型COVID-19患者中，肺炎病变体积相对于整个肺体积的百分比存在显著差异，因此利用影像学图像预测疾病严重程度、进展与预后得到了密切关注，目前开发的一些基于影像学的AI预测模型也取得了不错的预测效果[8-9，20]。Li等[21]开发了基于影像学区分重症与危重症病例以辅助预后结局判断的模型，该研究应用一种自动分割算法提取肺区域，对174例确诊为重症或危重症患者的肺部特征进行分类，同时利用深度学习进行分析，利用肺部特征及深度学习工具计算出重症及危重症的可能性，经验证，所建立的 AI模型在43例测试集数据中区分重症与危重症COVID-19患者的AUC达0.861，能提醒并发现预后结局不良的患者；但该研究采集的数据较少，该模型的有效性有待扩大测试数据进一步证实。

2.2 基于临床变量的AI预测模型 Abdulaal等[22]为建立提供患者入院时死亡率预警的模型，收集2020年2至4月当地医院收治的COVID-19患者的电子健康记录（EHR），用人工神经网络（ANN）分析一系列患者特征，包括人口学特征（包括年龄、性别）、合并症、吸烟史、症状表现（包括入院前出现症状的天数、发烧、咳嗽、呼吸困难、肌痛、腹痛、腹泻）等；将这些数据纳入一个功能集并输入ANN模型（该模型输入临床数据，输出入院时死亡率预测），若概率＞50%提示患者可能预后不良。该预测模型在测试组中预测患者死亡的特异度为0.863，灵敏度为0.875。虽然该实验未包括其他重要的结果预测指标如血液学、影像学等结果数据，但不需要等待检查结果，可以在入院时就进行风险计算。

Liu等[23]开发了一种适用于资源有限地区的风险评估模型，该模型仅基于血常规指标。该研究对中国湖北省和意大利米兰共13 138例COVID-19住院患者进行回顾性队列研究，将湖北省9 810例患者数据分为训练集、测试集，按疾病严重程度进行分组，信息均纳入变量选择和风险评分制定，根据Cox比例风险回归模型分析结果选取5项差异有统计学意义的预后变量并建立基于PAWNN参数（PLT、年龄、WBC、中性粒细胞计数、中性粒细胞与淋巴细胞比值）的风险评估模型，得分范围0～12分，PAWNN得分高低在住院期间非严重幸存者、严重幸存者和死亡人群之间有明显区别，结果显示PAWNN得分6分是判断死亡风险的临界值。该研究将随访期分为1～7 d、8～14 d、≥15 d，发现PAWNN得分在预测不同随访期间患者的死亡率仍保持较高的准确性，在测试集中，模型在上述3个随访期的预测准确率分别为 0.77、0.91、0.97；此外，PAWNN 得分对疾病风险状态改变也有良好的预测准确性，这说明该评分可用于动态监测COVID-19患者在整个住院过程中的预后。

2.3 基于影像学和临床变量的AI预测模型相关研究提示，肺部病变与多个器官的生化指标之间存在良好的相关性，如研究发现CRP、血清乳酸脱氢酶、最高体温、中性粒细胞与淋巴细胞比值等与病变影像学特征呈高度正相关，而血氧饱和度、淋巴细胞计数、白蛋白、PLT与病变影像学特征呈高度负相关；因此将临床信息、影像学特征与AI相结合，有利于疾病严重程度的评估[5，9]。目前有不少研究支持该结论，如Zhang等[5]建立的预后模型在仅基于肺部病变特征的AI系统中得到AUC为0.848，而与临床数据（血氧饱和度、呼吸频率、年龄、入院时体温、最高体温）结合使用时，该预测模型的性能显著增强。使用来自COVID-19、其他肺炎和正常对照人群的532 506份CT图像，根据AI提取的肺部病变特征，结合临床参数，通过机器学习方法进行预后预测，然后将患者分为两组，即高风险组（＞0.5分）和低风险组（＜0.5分），结果显示高风险组患者生存率明显低于低风险组，差异有统计学意义；该模型预测预后的AUC达0.909，特异度为0.80，灵敏度为0.80。该研究认为影像病变特征（实变或GGO与整个肺野的比例）是预后评估中最重要的因素。Wang等[17]研究也得到了相似结果，不同是他们建立的多元Cox比例风险回归模型使用了肺部影像学图像、年龄、性别、合并症（慢性阻塞性肺疾病、心血管疾病、慢性肝脏疾病）等数据。

另有研究提出，除影像学表现外，影响预后评估的因素还有年龄（≥65岁）、呼吸困难、慢性阻塞性肺疾病、合并症种数、癌症病史、精神改变、中性粒细胞与淋巴细胞比值、血清乳酸脱氢酶、直接胆红素、肌酸激酶、心肌肌钙蛋白 I（≥0.05 μg/L）等[5，22，24-25]，建议今后对这些预后因素作进一步分析与选择，建立更准确的预后预测及预警模型。

3 总结与展望

由于临床情况复杂，仅基于影像学或临床变量的AI模型对于COVID-19早期诊断及预后预测的准确性有限，但是临床变量模型可以在短时间内甚至不需要许多检验工具就能进行评估，而影像学模型能够在无临床表现的患者中判断病情，非常简便、经济，能起到筛选与提示作用，特别是在资源有限的地区能发挥重要作用。现有研究结果表明，基于影像学和临床变量的AI诊断及预测模型对于COVID-19诊断与预后预测具有一定的价值，该模型不仅可以评价入院时疾病严重程度，还可以用于监测患者住院期间的风险趋势。在预先训练的疾病诊断模型中利用迁延学习技术快速建立起模型，在疫情暴发时期能起到重要作用，及时缓解医务人员的压力；在疫情后期则需要更加精准的早期诊断及预后预测模型，这需要扩大样本量来进行更多的模型训练。

然而，现已开发的AI模型也存在一些局限性：（1）样本量小；（2）数据质量不佳，可获取的数据库较少；（3）AI研究人员缺乏对流行病学理论和临床专业知识的理解，极大地限制一些 AI模型的实用性和可靠性[6，15]；（4）目前尚缺乏专门适用于COVID-19患者、经过大规模验证的AI预后模型或评分系统[22]，对具体疾病严重性和预后影响因素的重要性分级等未作明确说明。但这些局限性可以通过更深入的分析来克服。当前利用EHR进行临床数据建模已取得较大进展，越来越多医院在EHR中记录和存储患者数据，并且增加共享数据集，增加在线获取，这为扩大样本量提供了有利的条件[22]。

利用AI开发辅助COVID-19诊断与预后预测的模型具有广阔前景。期待在不久的将来，在数据量扩大的基础上实现AI模型的改良，以投入COVID-19诊断与预后预测的现实使用，同时推广到其他疾病的诊断和预后预测中。