人工智能技术在肺部影像辅助诊断中的应用进展

2022-11-26唐智贤王一淼周靓怡陆心怡梁凯轶

中国医学物理学杂志 2022年5期

唐智贤，王一淼，周靓怡，陆心怡，梁凯轶

1.上海健康医学院医学影像学院，上海 201318；2.上海健康医学院附属嘉定区中心医院放射科，上海 201800

前言

肺部疾病是常见病、多发病，其表现多种多样，包括肺炎、肺部感染、慢性阻塞性肺疾病、肺结核、肺癌等［1］。病变轻者伴有咳嗽、胸痛、气喘等症状，重者呼吸困难、缺氧，甚至呼吸衰竭而致死。由于大气污染、吸烟、人口老龄化及其他因素，全球肺部疾病的发病率、死亡率有增无减。根据世界卫生组织、国际癌症中心最新发布的多项数据表明：2017年全球慢性呼吸系统疾病的患病率约为7.1%，所致的死亡人数占全因死亡总数的7.0%［2］，为全球死亡的第3大原因。2020年全球范围内肺癌占新发癌症病例的11.4%，每年因肺癌而死亡的人数约为180万，占因癌症死亡总数的18.0%，在各类癌症新发率和致死率方面分别排名第2位和第1位［3］。除此之外，2019年起，冠状病毒席卷全球，引起了世界规模的重大生命损失，全球人民的生命安全受到严重威胁，并且确诊人数仍在增长。此外，肺结节、胸腔积液、肺实变、浸润和胸膜增厚等异常也是某些严重疾病的症状。各种肺部疾病高发、并发，严重威胁着人类群体的健康。这些疾病或异常症状的早期诊断和治疗可以有效降低死亡率。因此，准确检测辨别出这些疾病和异常症状对于后期的治疗极其重要。

目前为止，X 线和计算机断层扫描（CT）仍为诊断肺部疾病的首要检查方法。然而，我国医学影像数据的年增长率约为30%，但是放射科医师数量的年增长率仅为4%［4］，我国医学影像专业医师数量的增长率远低于影像数据的增长率。据统计，三甲医院的放射科医生平均每天接待肺结节筛查病人约200名，阅读4 万～6 万张CT，面临如此繁重的任务，医生难免疲劳［5］。为解决这种医疗困境，基于人工智能（Artificial Intelligence,AI）的疾病早期筛查和诊断技术应运而生，为医学影像检查提供了广阔应用前景，助力医学影像发展进入快车道。医学影像AI能够极大地提高医生工作效率及诊断准确率，同时有助于提升基层医院及医疗资源欠缺地区的诊断效率，是当下研究的热点。医学影像AI已经实现了前所未有的飞跃，推动了医疗诊断向自动化、高准确且经济高效的方向发展。目前，很多科研机构和公司都在积极开展智能AI研究，并且还有相应的产品落地。

1 AI在特定疾病影像诊断上的应用

肺部组织发生异常改变均会引起不同严重程度的疾病，如肺炎、肺气肿、肺部结节和肺癌等。放射科医师通常利用胸片、CT 等影像手段对胸部疾病进行诊断。在肺部疾病影像诊断中，计算机辅助诊断技术的引入能够给医生提供重要的参考信息，极大缓解医生的压力。目前，AI在肺结节、肺癌和早期新冠肺炎等特定疾病的诊断和筛查上有较成熟的应用。

1.1 AI辅助诊断肺结节

肺结节是指肺部出现小于3 cm 的点状异常，通常是在患者接受X 线或CT 检查时发现。肺癌均由肺结节发展而来，因此肺结节的精准诊断对于早期肺癌的发现具有重要的临床意义。目前诊断肺部结节最普遍的方法是肺部CT 检查，再由医生对影像进行人工筛查，然而，1 位病患的胸腔CT 图至少含有200 张，专业的胸外科医生或者影像科医生需用5～10 min 时间才能准确筛查出患者是否有肺结节。其次，对于直径较小、对比度低、形状异质化高的肺部小结节，人工判读容易出现漏诊现象。随着肺结节发病率逐渐升高，在大量病例积聚之下，人工阅片耗时耗力，再加上肺结节半径较小，结节模糊不清，灰度与周围组织对比度低等原因，很可能会出现漏诊情况。为此，AI 辅助医生读片具备重要的现实意义。近几年，国内外研究者提出了许多相关算法。范小波等［6］收集了50 例肺结节患者，并比较了4 种CAD 算法，包括大规模训练人工神经网络（MTANN）、基于矩阵模式的模糊最小二乘SVM（matFLSSVM）、三维矩阵模式（MC-SVM）和三维最小类内散度（MC-SVM），通过比较得出MC-SVM 对肺结节识别精度高于其他算法，适用于临床。尤亮［7］探讨了AI与医学影像相结合在肺结节检测中的应用价值，列举了3种诊断方法，分别为常规人工阅片、AI阅片以及常规人工阅片结合AI 阅片，通过比较3 种方法的灵敏度和假阳性率，得出结论：AI联合读片优于其他两种方法，它不仅提高了检测效率，还大幅度提高了诊断灵敏度和准确性。为了在临床工作中提高肺结节良、恶检出率，吕品等［8］提出可以利用影像组学的方法，定量分析病人CT 图像，提高了对肺结节良、恶性诊断的准确率，同时能够进一步鉴别肺内小病灶。Blanc等［9］利用机器学习和深度学习技术创建算法，根据体积大小检测和分类肺结节，建立了基于3D U-NET、3D Retina-UNET 和SVM 算法的分类器阶段的全功能管道，实现了对肺结节的高效分类。Zheng 等［10］提出深度卷积神经网络与尺度传输模块结合多特征融合操作的STM-net，该网络可以放大小目标，适应不同分辨率的图像，大大提高了肺结节分类准确性。此外，不少肺结节AI 诊断算法实现了应用落地，如在2020年推想科技公司研发的InferRead CT Lung 产品获得CE 认证，零氪科技采用Double Check 的方法研发了肺结节智能诊断系统。目前有许多公开肺结节专病数据库，包括LIDC-IDRI［11］、LUNA16［12］、RICORD［13］等，海量的规范标注数据恰是其发展迅速的基础，但是系统的精准度还有望得到更大突破。

1.2 AI辅助诊断肺癌

肺癌是起源于器官、支气管粘膜或腺体最常见的肺部原发性恶性肿瘤。肺癌早期缺乏典型症状，在胸部X 线或胸部CT 检查中发现肺部有肿块阴影时，首先考虑肺癌。近年来，肺癌死亡率仍占据高位，如何降低死亡率始终是医生的关注点。肺癌在早期阶段，发现并及时治疗预后效果好，晚期则预后效果差。早期发现肺癌最主要的检查方法是CT，如LDCT，可发现直径小于1 cm 的肺癌。医生需要在复杂的组织图像中识别细微的病变，诊断过程中存在主客观因素，非常考验医生的专业知识，易遗漏轻微病变。AI 介入有助于提高细微病变的检出，对辅助医生进行诊断具有重要的临床意义。

肺癌死亡率高的主要原因是其预后差，因此为了更好地实现早期对肺癌的筛查，许多研究者为此付诸努力。马景旭等［14］在常规诊断鉴别肺癌的基础上积极改进，利用神经网络分析多模态图像，首先区分肺结节的良恶性，后进一步识别判断小细胞癌、腺癌、鳞癌、大细胞癌，试验结果与病理检查结果一致性较高。Tafti 等［15］使用三维多尺度卷积神经网络，对两个公开数据集（DSB2017, MCLIA）进行肺癌分类，综合的分类精度可以高达83.75%。Punithavathy等［16］比较PET/CT图像中用于肺癌分类的经典ML技术，利用机器学习方法提取出3 个纹理特征和10 个分形特征，实验研究表明以宽度σ=1为核的径向基函数SVM 具有更好的性能，最高准确率可达98.10%，是用于肺癌诊断的更好的分类器。根据组织病理学差异，肺癌可分为小细胞癌、腺癌、鳞癌、大细胞癌。陈疆红等［17］就腺癌的3分类做了深入研究，利用深度学习的AI 肺结节辅助诊断系统协助判定肺腺癌SN侵袭程度，研究发现平扫CT数据有利于辅助预测SN的恶性概率，而增强CT 对其无明显帮助。Pereira等［18］关注于诊断精确、治疗方案、靶向治疗和个性化药物，探索结合了肿瘤和其他肺结构信息的新一代CAD，以产生预测模型，从而提高肿瘤表征的准确性，使用肺癌成像的AI 解决方案，开发新的靶向治疗，避免多余的治疗导致相关副作用。肺癌在某些病例中易与肺结核、肺炎、淋巴瘤等疾病混淆，因此在影像学上很多肺疾病在视觉上与肺癌相似，从而影响疾病诊断的准确性。为此，Ge等［19］在Chest X-ray数据集基础上，提出新的误差函数以处理多个标签和视觉相似数据的属性。

AI 系统对肺癌病理类型进行鉴别诊断，不仅与病理检查结果的一致性高，还能帮助放射科医师更准确、迅速地进行诊断，推动医院智能化和数字化建设。但是AI在辅助诊断过程中由于数据集信息不全面等原因，仍存在漏诊和误诊情况，需要继续扩大信息库数据量并进行调整和校正。

1.3 AI辅助诊断新冠肺炎

新型冠状病毒肺炎是一种急性感染性肺炎，也是一种先前未在人类发现的新型冠状病毒。新冠病毒可在复制过程中不断适应宿主而产生突变，就目前而言，仍然缺乏针对病原体的有效抗病毒药物，以隔离治疗、对症支持治疗为主。疫情爆发初期，核酸检测技术处在不成熟阶段，CT 检查是诊断新冠肺炎最为广泛的手段之一。新冠肺炎早期可呈现多发的小斑片影及间质改变，进而出现双肺多发磨玻璃样、浸润样，其早期症状与其他病毒性肺炎的症状十分相像，因此在早期诊断时常常出现漏诊或误诊情况。AI 技术可以帮助对新冠肺炎的早期图像大规模筛查，并及时对新冠肺炎感染者进行隔离，有效发挥AI技术在新冠肺炎诊治中的价值。从新冠肺炎爆发至今，许多国内外科研人员开始研究并采用AI 技术。针对新冠肺炎早期诊治容易出现漏诊情况，Bai 等［20］创建了一种应用于胸部CT 中区分新冠肺炎和其他肺炎的AI 系统，并评估放射科医生在有无AI 协助下的表现，在评估结果中发现AI 辅助可以提高放射科医生区分新冠肺炎和其他肺炎胸部CT 表现。AI 技术的引入不仅可以降低漏诊率，还可以帮助放射科医师有效诊断鉴别不同严重程度的新冠肺炎感染者。杜丹等［21］利用AI 技术对CT 肺炎病灶体积比进行动态精确测量，将新冠肺炎临床分为轻型、普通型、重型及危重型4 种类型，对不同严重程度的患者制定合理的诊疗方案，有助于评价疾病的严重程度和预判疾病发展趋势。Kelei等［22］不仅通过联合执行严重度评估和肺叶分割来自动评估原始三维CT 图像中的新冠肺炎严重度，同时还开发了一个多任务多实例M2UNET 网络评估新冠肺炎患者的严重程度。另外，Hussein 等［23］提出了一种多分类深度学习模型，用于从胸部X-ray和CT 图像的组合中诊断新冠肺炎，还研究了4 类体系结构的性能，其中VGG19结合CNN 模型性能最好，它可以在新冠肺炎早期阶段做到正确诊断，及时发现新冠肺炎患者并对患者进行有效隔离。Malhotra 等［24］创建了一个新冠肺炎多任务网络（COMiT-Net），即用于新冠肺炎筛查的自动化端到端网络，它不仅可以预测CXR 是否具有新冠肺炎的特征，还可以通过执行感兴趣区域的语义分割使模型可解释，同时在医疗专业人员的帮助下，手动注释了从chesxray-14、CheXpert 和整合的新冠肺炎数据集收集的新冠肺炎症状的肺部区域和语义分段。经实验表明，COMiT-Net 的灵敏度高达96.80%。Marginean 等［25］收集了确诊新冠肺炎和其他肺部疾病患者的公共数据以及正常的胸部X 光图像，然后使用ImageNet 经过预处理的权重在CheXpert 数据集上进行迁移学习，实现包括新冠肺炎诊断的多分类网络。

AI 技术的应用对新冠肺炎的诊治有巨大价值。AI可以帮助医疗专业人员精确诊断早期感染新冠肺炎的患者，实现早发现、早隔离；实现同其他肺炎病例进行比较，避免误诊，提高了诊断率；同时也实现了快速诊断，减轻医务工作人员的工作压力，节约更多时间。但是，AI技术仍然面临许多挑战，许多AI技术产品的成熟度并不高，识别疾病的准确性还需要进一步的临床验证。

2 AI在肺部影像多疾病联合诊断中的应用

肺部疾病种类多，且往往不是单独出现的。目前大多数的研究都是针对肺部图像中单一疾病进行诊断，难以实现多种疾病的智能联合诊断。因此由单一疾病诊断推演至多疾病联合诊断是计算机辅助诊断领域的发展趋势。肺部多疾病的智能联合诊断并不是简单的模型堆叠，肺部疾病中的一些异常可能是密切相关的，如Wang 等［26］揭示浸润往往与肺不张、积液有关。Yao等［27］发现心大常伴有肺水肿。这种现象在临床诊断中不是偶然的，而是这些疾病的病理之间有很强的相关性。在分类过程中，一个标记的信息可能会对学习另一个标记提供有用信息，特别是那些含有少量训练样例的标记，考虑标记相关性能够减小因数据不足造成的误差，通过使用这些相互依赖的信息，缺失或噪声标签可以从共生关系推断出来，这可以为放射科医生提供额外指导。因此，对肺部CT 影像进行精确分析，精准提取CT 影像特征，深入挖掘多疾病之间的关联，将有助于准确诊断、分析和分类医疗数据，具有极为重要的现实意义。在计算机科学领域，多疾病智能联合诊断属于多标签分类的范畴，它意味着每个图像可能同时属于多个类的标签。多标签分类和传统的分类问题相比较，主要难点在于以下两个方面：①类标数量不确定，有些样本可能只有一个类标，有些样本类标可达到几十个；②类标之间可能相互依赖。因此，在肺部图像处理上进行多标签分类与定位技术尚未成熟，研究成果较少，仍是一项非常富有挑战性的任务。目前，关于肺部CT 图像多标签分类算法大致可以分为以下两种技术思路。

2.1 基于问题转化的肺部多疾病联合诊断

基于问题转化的方法其实质是将多分类问题转化成已知问题进行分析。对于肺部不同的疾病，尽管它们影像学表现是多样化的，但其处理流程是高度一致的。最具代表性的算法是二元关联（Binary Relevance, BR）。二元关联把每个标签当作单独的一个类分开训练多个独立的二元分类器，最后将它们结合在一起得到输出。Guan等［28］利用残差注意力机制训练了多组分类器，并最后进行联合判断，从而实现了肺部疾病的多分类。二元关联的主要局限性是它忽略了相关性和标签的显著影响，从而降低了分类性能。随后有科研工作者提出二元分类器链［29］，即二元分类器的构建是在前面分类器预测结果的基础上，继续训练新的分类器。张春芬等［30］提出了利用Cascade 组合方法生成基于贝叶斯、神经网络与决策树的组合分类器，并将其应用到医学图像多分类任务中。另有科研工作者提出标签排序法，将多标签学习问题转为标签排序问题［31］。比较典型的研究是Abdallah 等［32］提出了标签优先方法定义标签之间的相关性。该算法通过“成对比较”实现标签间的排序。Saad 等［33］借鉴了标签优先的思想，训练了15个二元SVM 分类器，并逐对比较，在6个肺区完成了6种疾病标签的分类。但是上述改进算法，均未考虑到标签与标签之间的所有依赖关系，在分类准确性上仍旧存在不足。

2.2 基于算法适应性策略的多疾病联合诊断

算法适应性策略的实质是将一种现有的单标签算法直接拓展到多标签上。这类方法可以较好地考虑到标签与标签之间的依赖关系。随着深度学习的兴起，近几年的成果几乎都聚焦于卷积神经网络（CNN）及其变体。Yan 等［34］使用VGG16 完成了全身CT 图像的145 个标签分类，其中针对肺结节的分类准确度可达到88.85%。在他们之后的研究中，又提出了一种利用3D 信息的检测算法，进一步提高了病灶识别准确率［35］。Kumar 等［36］从损失函数出发，研究最适合胸片疾病分类的损失函数，并提出一种增强的级联网络用于胸部疾病分类。Tang 等［37］在传统的CNN 中加入注意力机制完成分类器的学习，结合弱监督定位实现了肺部8种疾病的分类，最终总分类准确度为80.27%。Rajpurkar［38］提出了CheXNet 模型，该模型通过修改DenseNet-121 的全连接层和损失函数所得，在胸部疾病多分类取得了不错的效果，尤其在肺炎的诊断中准确率高达88.87%。Chen等［39］利用基于ResNet 和DenseNet 的双重不对称结构，自适应地捕捉更多有区别的特征用于肺部图像的病灶分类。Chen等［40］改进了DenseNet-121的训练过程，首先集合了多疾病关联的条件概率进行第一阶段训练，随后用无条件概率对模型进行第二阶段训练，大大提升了肺部多疾病诊断的正确率。类似地，Guendel 等［41］对DenseNet 进行了改进，实现了对肺部多疾病诊断。为了考虑标签之间的差异性，Yao等［27］提出密集记忆和长短时记忆的一种新变体LSTM网络，用于多标签胸片图像分类。Tang等［42］构建了一种基于Mask R-CNN的通用病变检测器，能够检测出全身CT 各部位的各种病变，其灵敏度达到86.21%。Guan 等［43］根据ChestX-Ray 14 病例区域分布特征，提出了一种由全局分支和局部分支组成的AG-CNN 网络，该网络在胸片疾病多分类中取得了不错的效果。基于算法适应的肺部影像多疾病智能诊断是当前的研究热点之一，但是目前的算法依旧存在精度不高、训练时间过长、泛化性不强等问题。

3 总结与展望

AI 技术的引入，可以有效实现阳性病例或病灶区域的检出，再将结果交由放射科医师进一步诊断，从而减轻临床工作者负担。AI 与人工读片结合诊断，将成为医学影像诊断领域新的主导。通过文献综述可以发现：以CNN 为代表的深度学习算法是机器识别医疗影像的当前和未来的研究重点。然而，现有的肺部疾病智能诊断算法依旧面临如下挑战：（1）已精确标记的高质量肺部图像，尤其是多疾病标签图像的数量不足、分辨率较低。海量的规范标注数据是目前影像AI 发展的瓶颈，然而不同于自然图像，医学数据的标注将耗费大量的人力、物力和时间。同时，针对肺部疾病的多标签标记，发病率较低的疾病数据量可能较少，产生数据不平衡现象。针对这些不均衡的数据集，需要在未来的工作中结合多家权威机构建立标准影像数据库，从而有效提升图像的临床代表性、图像多样性、标注权威性与规范性，提高算法的鲁棒性，加速AI医疗器械产品的研发和应用。（2）当前的大部分多疾病诊断算法尚未充分探究标签间的关系，多标签分类问题是高维、稀疏和数据不平衡的，标签之间存在局部性、多样性、依赖性和相似性等特性，这使得多疾病分类问题变得极具挑战性。未来的研究需要着重挖掘多疾病之间的关系，如可以采用图神经网络等方法以进一步提升算法精度。（3）大部分基于深度神经网络的效果有限，且可解释性较差。CNN 通常是端到端的学习，每次卷积计算的时候，网络只关注每个像素点固定、有序的领域空间，并且随着层数的加深，所提取的高阶特征难以被人类理解，无法进行关系推理。因此，将端到端学习和归纳推理相结合是一个非常重要的研究方向。