支气管扩张CT影像计算机辅助诊断研究综述
2021-06-11王六一宋文爱林鑫山杨吉江
王六一,宋文爱,林鑫山,岳 宁,杨吉江,王 青,雷 毅
1.中北大学 软件学院,太原030051 2.中国医学科学院 北京协和医学院 研究生院,北京100730 3.中日友好医院 呼吸中心呼吸与危重症医学科,北京100029 4.山东大学第二医院 影像科,济南250033 5.清华大学 自动化系,北京100089
支气管扩张定义为支气管的永久性扩张,临床上表现为咳嗽、咳痰,常因感染而导致急性加重,并可引起肺通气功能障碍[1]。现有关于支气管扩张的流行病学调查显示,支气管扩张的患病率已经超过5/10 000的罕见病欧盟定义[2],且其患病率及发病率呈现出逐年上升的趋势。2013年,中国第一次进行了针对支气管扩张患病情况的流行病学调查,调查显示中国40岁以上人群经医师诊断支气管扩张的患病率为1.2%[3]。
支气管扩张症的诊断以影像学为基础,CT检查是诊断支气管扩张的重要手段。目前常用的CT严重程度评估系统中,改良Reiff评分因其简便性及有效性在临床广泛应用,是支气管扩张严重度指数(The Bronchiectasis Severity Index,BSI)的重要条目[4],依据改良Reiff总分可进行严重程度分级,其评分标准如表1。2018年推出的BRICS评分系统尽管因推出时间晚,尚未在临床推广,但仍具有较好的临床应用前景[5],其评分标准如表2。
表1 改良Reiff评分标准
表2 BRICS评分标准
支气管扩张评分依据于医生对CT图像中支气管扩张程度的判断,要求医生具有专业性,需要医生对大量CT图像进行支气管扩张程度的判断,且由于地域发展的不平衡,基层医师更为缺乏,所以需要一套简单易行且诊断准确度在一定水平之上的解决方案。随着人工智能的发展,基于深度学习的图像处理方案有了实现的可能。医生根据辅助诊断系统给出的结果得到患者的支气管扩张严重程度的评分,这种诊断方式大大减少了医生的重复工作,提高了医生的工作效率。该方式可有效向基层进行推广,在此基础上可获得大量的数据并进一步提升诊疗识别能力,对缓解医疗资源不足问题有着重要意义。
1 相关领域研究现状
当前,支气管扩张人工智能自动评分系统领域的研究非常少,我国目前仍缺乏支气管扩张的患病数据。尤其是有影像学诊断证据支持的支气管扩张研究基本上是空白的。在支气管扩张检测中,CT影像处理主要包含图像降噪、肺实质提取和肺叶分割三部分。计算机断层扫描(CT)技术的不断发展和在医疗实践中的广泛应用引起了公众对患者相关辐射剂量的关注,但降低辐射剂量可能导致噪声和伪影增加[6]。Yang等[6]提出了一种基于生成对抗网络的CT图像降噪方法。将LDCT去噪问题视为从LDCT到NDCT图像的转换。Skourt等[7]提出了一种基于U-net架构的肺部CT图像分割方法用于肺实质提取,利用很少的图像进行端到端的训练,其结果十分优异。Xie等[8]提出了一种新的用于肺叶分割的方法RTSU-Net,使用了一种新的神经网络模型来利用肺叶的结构化关系分割肺叶,并且在由于感染新冠肺炎而导致严重肺部感染的病例中肺叶分割性能出色。
医学图像分析是深度学习的一个相当活跃的研究领域,近年来深度学习尤其是计算机视觉在医学领域中的发展尤为迅速,但支气管扩张疾病方向尚未有成熟模型。Ali等[9]受AlphaGo的启发设计了基于深度学习的肺结节检测系统,并在LIDC-IDRI数据集中得出了99.1%的总体准确率。储春洁等[10]基于MaskR-CNN[14]框架,使用MSCOCO(Microsoft Commom Objects in Context)数据集来做肺结节目标检测任务,对最小的肺结节检测率也达到了78%。席孝倩等[11]提出了肺结节辅助诊断系统,该系统通过训练好的数据模型检测肺部CT影像,尽可能简化操作,实现人机交互式操作,减轻医生的负担,降低肺结节诊断的误诊和漏诊率。
2 支气管扩张自动评分的步骤
基于深度学习方法对支气管扩张自动评分目前有两种主要思路,关键区别在于对数据的利用。
步骤类型1:
此类型使用监督学习,使用医生标注好的数据进行训练预测模型。诊断流程如图1所示。
图1 辅助诊断流程图类型1
(1)获取原始LDCT(低剂量CT图像),请医生选择一定数量的数据进行标记,将不同严重程度的支气管扩张进行标注,进行必要的图像预处理。
(2)对处理好的数据进行目标检测任务,生成目标检测的预测模型。将肺部CT图像输入识别模型,对检出的支气管扩张进行打分并输出结果。
步骤类型2:
此类型和类型1的区别在于是否可以利用大量的未标注数据。首先通过医生标注的数据训练一个多示例学习的方法得到带有粗糙标签的图像,再利用这些粗糙标签训练一个有监督学习的目标检测模型以进行目标检测任务,诊断流程如图2所示。
图2 辅助诊断流程图类型2
在本文接下来的内容里,第3章详细介绍了支气管扩张检测中的图像预处理部分,主要包含了CT图像降噪、肺实质提取和肺叶分割三部分。第4章依据目前支气管扩张检测的两种思路,分别介绍了监督学习和弱监督学习下的目标检测方法。
3 CT图像预处理
3.1 CT影像降噪
图像去噪的目的是在保留临床细节的情况下抑制图像中的噪声,使图像有助于诊断。随着CT技术的发明,CT图像的降噪研究应运而生。CT图像降噪方法评估中的一个非常重要的要求是必须保留所有临床相关的图像内容,特别是图像边缘和小结构。目前的图像去噪算法可分为两类,空域像素特征去噪算法和变换域去噪算法。
3.1.1 传统方法
近年来,双边[12]和非局部均值(NLM)[13]滤波器在图像去噪中非常流行。双边滤波是一种用于图像去噪的非线性、边缘保护的平滑滤波器。图像中每个像素的亮度值被附近像素的亮度值的加权平均值代替。Giraldo等[14]对CT图像的两种降噪方法进行了比较研究。他们在真实的CT图像和虚拟图像上测试了他们的方法。他们的结论表明这两种方法的去噪效果都非常好。
Ai等[15]提出了一种基于自适应张量主成分分析(AT-PCA)算法的LDCT图像去噪方案。使用邻域像素来表示目标像素,使用自适应搜索窗口来选择补丁并且搜索相似的补丁。此外,基于张量的主成分分析用于获得变换矩阵,其中系数按线性最小均方误差顺序缩小。获得收缩的斑块,并对所有收缩的斑块进行聚集以获得去噪图像。该方法比NLM滤波能更有效地抑制噪声,提高图像质量。
为了更好地保持边缘细节,Al-Ameen等[16]提出了一种保相去噪算法。传统相位保持方法抑制了处理过的图像中的特定细节。因此,他们使用2D高斯点扩散函数的维纳滤波器对保相算法进行了改进。该算法的优点是更好地保留了次要的医学细节,并改善了过度的噪声抑制。同时保相去噪方法可以从较高层次的细节中去除具体细节。
同样的,Duan等[17]提出了一种基于二阶全广义变分模式的医学图像去噪方案。他们结合了基于快速傅里叶变换的分裂布雷格曼算法,以提高计算效率。对合成医学数据来说该方案比现有的最先进的降噪方法更好地抑制了噪声。他们的方法有效地减少了噪声,而不产生阶梯效应。
3.1.2 深度学习方法
随着深度学习算法在图像去噪方面的革命性发展,通过层次化的网络概念提高了图像高级特征的学习。图像去噪已经引入了Auto编码器、堆叠稀疏去噪自编码器(SSDA)及其变体等技术。它们具有利用强空间相关性来提高图像去噪性能的强大能力。
Kang等[18]介绍了使用小波变换的卷积神经网络的更高层次版本。他们通过有限角度断层成像减少了重建误差,其中滤波后的反投影被用于降噪。Chen等[19]提出了一种基于轻量级卷积神经网络的CT图像去噪方法,并取得了很好的结果。在进一步的延伸工作中,Chen等[20]使用反卷积网络与CNN模型的快捷连接来增强CT图像的去噪工作,CNN模型被称为残差编码器解码器卷积神经网络(RED-CNN)。同时,他们进行了有助于改善结果的基于补丁的训练。Gondara[21]首先提出了医学图像去噪,其中去噪自动编码器使用卷积层。结论表示,在大多数其他去噪方法都失效的地方,他的方法可以抑制更高的噪声,边缘也被很好地保留了。一些CT降噪方法的比较如表3所示。
表3 一些CT降噪方法的比较
3.2 肺实质分割
肺实质的准确分割是肺部疾病诊断和治疗的重要前置步骤。由于肺部区域存在不均匀性,动脉、静脉、支气管和细支气管等肺部结构具有相似的强度值,所以肺实质分割是一项困难的任务,它基本上是从肺部CT图像中提取肺实质部分,为后续步骤提供准确的感兴趣区域。在支气管扩张检测中肺实质分割是一个必不可少的步骤,且肺实质分割是肺叶分割的前置操作。
3.2.1 传统肺实质分割方法
虽然传统的肺实质分割算法不具备基于神经网络的算法的准确率,但是对设备要求相对不高,且花费的时间较少。因此,传统算法仍然有很大的价值。
Shariaty等[22]提出了一种新的基于阈值算法的CT图像肺部分割方法,该方法通过重建操作检测出附着的结节并将其添加到肺部掩膜中。Gopalakrishnan等[23]提出了一种方法,利用自适应多级阈值法(Adaptive Multilevel Thresholding)来估计高斯分布的总数以及其初始参数。再对使用高斯混合模型(Gaussian Mixture model)分割的肺实质使用自适应形态滤波(Adaptive Morphological Filtering),以减少边界误差。
Zhang等[24]提出了一种新的改进GrabCut算法用于肺实质分割,该算法可以自动选择与肺实质相关的合适边界,然后使用GrabCut算法来提取肺实质。该算法能够适应不同形态的肺实质,有效提高分割的准确性。Hao等[25]提出了一种基于信息熵和联合向量的LBF主动轮廓模型的自动分割方法。该方法通过pet(正电子发射计算机断层扫描)中的标准摄取值提取肺结节的感兴趣区域,并利用自动阈值迭代粗略构建初始轮廓。该方法对肺实质的分割有很大的参考意义。
曲彦等[26]提出了一种使用阈值方法结合模糊C均值聚类的传统方法。他们的方法可以准确区分左右肺,准确率分别为0.983 2和0.980 7。他们通过聚类、标记和合并相同类型的超像素子区域获得了最终的肺实质分割结果。他们的方法在肺部计算机断层图像分割的mAP(平均准确率)可以达到0.994 6。
Khan[27]提出了一种结合颜色特征和改进的模糊C均值聚类来分割肺实质的新方法。这种方法解决了现有CT肺实质分割技术的问题,因为它结合了整个图像中存在的不同像素的颜色特征。改进的模糊聚类和颜色特征的结合是该方法的主要优点。
Dharmalingham等[28]提出了一种独特的病理肺分割方法,称为基于参考模型的分割,它利用了人肺的形状特性。该分割方法使用一种新的采样线算法(Sampling Lines Algorithm)从输入切片构建参考肺模型,并提取形状特征。
3.2.2 基于深度学习的肺实质分割方法
近年来,卷积神经网络在图像分类、目标检测等领域取得了非常大的成功。许多网络都将CNN作为一种特征提取方法,并且对网络进行了改进,取得了很好的效果。目前,CNN在肺实质提取方面取得了很大的成绩。
袁甜等[29]提出了一种基于U-Net的肺部CT图像自动分割算法。她们对原始的CT图像进行高斯和拉普拉斯滤波。将原始图像和预处理后的图像分别作为输入使用卷积神经网络进行分割。再将分割后的肺区使用线性回归来融合并提取肺实质区域。其中四类图像分割的准确率分别达到0.991、0.978、0.983、0.997。Harrison等[30]提出了用于病理肺分割的网络P-HNNs(Progressive Holistically-Nested Networks),这是一种基于自底向上的深度学习方法。这种方法最大的优点在于不受肺部形状变化的影响。P-HNNs结合了监督学习框架。它通过一种简单的、有效的多路径方法得到增强,他们使用P-HNNs合并来自不同网络级的输出。一些肺实质分割方法的比较如表4所示。
表4 肺实质分割方法比较
3.3 肺叶分割
人体的肺实质可以分为五个功能相对独立的解剖学区域——肺叶,相邻肺叶间的物理边界被称为肺裂。在支气管扩张程度两种评分标准中,改良Reiff评分标准需要对每个肺叶中的支气管扩张单独打分并相加。肺叶的分割基于三个肺裂的检测,需要肺实质等传统解剖学信息。因此首先要进行肺实质提取。目前肺叶分割算法的思路大致相同:检测属于肺裂的像素点,使用检测到的肺裂像素点生成肺裂面,进而得到五个肺叶。
以解剖学知识为先验知识的肺叶分割,需要依赖肺部结构解剖学知识。Kuhnigk等[31]基于肺裂附近通常没有较大的血管的解剖学知识,利用交互式的三维分水岭算法来检测肺叶,接着利用肺叶的边缘检测来分割肺叶。Lassen等[32]在Kuhnigk的基础上,将肺裂分割的信息和肺气道分割的信息引入代价函数,利用三维分水岭算法来检测和分割肺叶。Wei等[33]通过预先估计的裂缝方向搜索没有气管和呼吸道的平坦的感兴趣区域(Region of Interest),然后使用2D小波变换检测可能的肺裂,并给出了九名患者的肺叶分割结果。
图谱引导(atlas-guided)方法是利用标准模板对医学图像进行分割,将图像分割问题转换为图像配准问题,将标准图谱通过线性或非线性映射到待分割的图像上[34]。Zhang等[35]使用图谱来初始化对感兴趣裂隙区域的搜索。该图谱由裂隙和肺边界构建,并初始化对包含倾斜裂隙的区域的模糊推理搜索。然后,使用基于结构张量的裂隙点检测和平滑约束,通过图形搜索找到最佳裂隙曲线,进行肺叶分割。van Rikxoort等[36]使用基于图谱的配准,基于使用监督过滤器检测到的肺边界和裂点,分割肺裂。在两个数据集上分别给出了定量和定性的结果。
George等[37]将深度学习与随机游走(random walk)算法相结合,提出了一种新的肺叶分割方法。先使用P-HNN模型来识别潜在的肺叶边界,再使用随机游走算法生成肺叶分割的结果。他们是最先将深度学习应用到肺叶分割的人。其优点是增强了病变肺的稳健性,且方法简单,不会牺牲准确性,其准确性显著胜过传统方法。Tang等[38]提出了一种新的深度学习方法用于肺叶分割,在LUNA16数据集上随机标记了50个CT扫描数据,使用Dice系数差异函数来处理极端的数据不平衡问题和焦点损失。在LUNA16测试集和天池测试集的平均Dice系数分别达到91.48%和94.17%。Imran等[39]介绍了一种渐进性的深度学习方法Progressive Dense V-Network(PDV-Net)。CT影像只在一个单一的向前的网络中进行处理,不依赖于先验的肺部解剖学知识、不依赖于专业人员的专业知识介入,且在三个公开数据集中得到了很好的结果。一些肺叶分割方法的比较如表5所示。
表5 肺叶分割方法比较
4 目标检测
目标检测是计算机视觉领域中的一项重要课题,主要研究内容是将图像或视频中的目标物体与其他信息进行切分,并获得这一目标的类别信息和位置信息,其应用范围包括人脸检测、自动驾驶、医学图像检测等。在支气管扩张诊断中有两个主要任务:检测和分割,在CT图像中检测支气管扩张后,依据支气管扩张的位置与单独得分,结合肺叶分割位置和两大评分规则,可以得出病人在两大评分标准:改良Reiff[4]和BRICS[5]下的支气管扩张严重程度的最终得分。
4.1 目标检测的传统方法
传统目标检测的流程为:(1)确定滑动窗口后在图像中的不同位置提取候选区域;(2)对候选区域进行特征提取;(3)利用事先训练好的分类器对特征信息进行分类。根据不同的应用背景可以灵活选取不同的目标检测方法,传统目标检测方法可以分为四类:基于像素分析的方法、基于特征匹配的方法、基于频域的方法和基于识别的检测方法[41]。传统的目标检测方法采用人工手动提取特征信息,无法避免在此过程中存在特征信息不完整的问题,从而导致识别效果较差。具体来说,传统的目标检测算法还存在以下问题:
(1)基于滑动窗口的候选区域选择没有明确的目标,时间复杂度高。
(2)手工设计的特征对于多样性的变化没有很好的鲁棒性。
4.2 深度学习方法
深度学习的方法自2012年AlexNet[42]提出以来就引发了研究热潮,目标检测领域也引入了深度学习方法。深度学习方法的优势在于模型抽取特征代替了传统的手工设计特征,且可以实现端到端的训练方式。在医学图像处理的目标检测任务中,由于医学图像的特殊性,后续的实现思路可以区分为监督学习方法和弱监督学习方法。
4.2.1 监督学习的思路
监督学习,是机器学习中的一种思路,可以由标记好的训练集中建立一个模式或函数,并依此模式或函数推测新的实例。在支气管扩张的评估任务中需要对医学图像进行人工标注,且只依赖于标注的数据,送入深度学习模型进行训练,并不断地调参与调优,最终可以得到一个能够对没有任何标记的肺部CT图像自动进行支气管扩张检测与分割的模型。
在当前基于深度学习的目标检测方法中,大体可以分为两类:“two-stage”和“one-stage”。第一类思想的代表方法是Girshick等[43]在2014年提出的R-CNN。R-CNN的实现思路是首先通过选择搜索提取一组候选区域,再将每个候选区域调整为固定的大小,然后进行特征提取。最后,利用线性SVM(Support Vector Machine)分类器识别目标检测。Girshick[44]在2015年对R-CNN进一步改进,提出了Fast R-CNN。Fast R-CNN可以在相同的神经网络下同时训练检测器和边框回归,进一步提升了目标检测的精度。Ren等[45]在Fast R-CNN之后提出了FasterR-CNN算法。Faster R-CNN是第一个端到端的深度学习目标检测方法。He等[46]提出的Mask R-CNN,融合了分割和检测任务,使用插值方法将ROI对齐,进一步提高了目标检测准确度。Han等[47]使用了多条件生成对抗网络(MCGAN)来生成近似真实结节的3D结节,并置于真实肺部CT图像上,再将肺部CT图像输入3D Faster R-CNN以进行结节检测。他们的结果表明,3D卷积神经网络的检测实现了更高的灵敏度,并解决了医学数据匮乏的问题。
Liu等[48]使用Mask R-CNN用于肺结节检测。由于正负样本之间的不平衡,他们训练了基于块的分类网络,并选择了精度最高的分类网络用作Mask R-CNN的骨干网络,该网络在自然图像上表现出色。最后,将在COCO数据集上训练的Mask R-CNN模型进行了微调用以检测肺结节。获得的平均精度为0.733 4 mAP。
第二类方法是one-stage算法。这类思想的代表方法是Redmon等[49]于2016年提出YOLO(You Only Look Once)。YOLO将单个神经网络应用于目标检测任务的整体上。YOLO将图像分割成多个区域,并同时预测每个区域的边界框和概率。接下来,Redmon等进一步提出了YOLOv2[50]和YOLOv3[51]版本,同最初的YOLO相比检测精度进一步提高。Liu等[52]在2016年结合了R-CNN的锚点机制和YOLO的回归思想,提出了SSD算法,引入了多尺度的检测方法,即在每一个尺度提取的特征图上都进行检测,检测速度和准确度同YOLO进一步提升。
George等[53]提出了一种用于肺结节定位的检测系统,该系统利用了基于YOLO的同时兼具鲁棒性和性能的DetectNet网络。不同于带有滑动窗口的CNN分类器中那样存在重叠窗口,因此该方法更快且计算效率更高。通过采用迁移学习来提高结节检测系统的准确性,在每张图像有6个假阳性的情况下具有89%的灵敏度。宋艳艳等[54]为了解决目标检测的多尺度和多姿态的问题,在YOLOV3的基础上进行了改进。添加了104×104尺度检测层,通过K-means聚类分析得到适用于行人目标检测数据集的边界框尺寸,用于目标检测以提高其网络性能,改善了目标遮挡影响以提高检测效果。在行人检测数据集上的准确率分别为78.10%和80.53%,具有较好的检测性能和鲁棒性。
Khosravan等[55]提出了一种新的基于深度学习的肺结节检测方法S4ND,以端到端的方式进行训练。他们分别与SSD网络以及高效的肺结节检测方法3D DCNN在来自LUNA的挑战数据集上进行了肺结节检测准确率的比较。依据实验结果,他们提出的方法在效率和准确性方面均优于其他两种方法。
4.2.2 弱监督学习思路
目标检测模型的性能在很大程度上取决于有标签的训练样本数量,但是,图像中目标边界注释框的收集是一项耗时的任务,而且在一些特殊情况下,有监督的训练样本难以获取。因此,一些学者开展了弱监督目标检测研究。弱监督学习在医学图像中的主要思想是不完全监督,指的是训练数据中部分数据带有人工标注的标签,而其他的大量数据都是原始数据。这不仅仅是因为标注工作的量大,还是因为某些领域的数据对于标注人员的要求极高。例如,在医学领域中需要构建大型的医学图像数据时,这就需要由专业的医生进行标注,然而医生对于数据科学的理解可能不够,有些数据的标注无法达到一定的要求。
目前主流的弱监督目标检测算法是首先通过训练一个多示例学习的方法得到带有粗糙标签的图像,然后利用这些粗糙标签来训练一个监督学习的目标检测模型。这些粗糙的标签也被称为伪标签。这是一个多阶段的过程,容易造成的后果是由于算法具有非凸性因而使模型陷入局部极小值,从而造成不能检测整个物体,Wan等[56]提出了C-MIL模型,将实例划分为多个空间相关和类相关的子集,通过子集中一系列平滑损失函数来近似原始目标损失函数,缓解了非凸性问题。Bilen等[57]提出WSDDN(Weakly Supervised Deep Detection Networks)方法,WSDDN是第一个可以实现端到端训练的弱监督学习模型。
在利用其他弱监督信息方面,Yang等[58]注意到物体的空间位置、外观和运动与图像中物体的动作密切相关,提出了利用仅带有动作标签的样本训练目标检测模型,不仅在训练过程中减少了目标候选框的搜索范围,还减少了目标检测模型所需的监督量,实现了一定程度的性能提升。近年来,新的弱监督多层协作学习思路被提出,即将监督学习和弱监督学习相结合。同时给定两个相关模型,一个是弱监督模型,一个是监督模型,通过协作模型将它们结合起来。Wang等[59]提出了弱监督协作学习(WSCL)方法,将弱监督学习网络和监督学习网络整合为一个端到端的网络。通过一致性损失约束监督网络和弱监督网络,使其具有近似的结果,通过共享特征来保证监督网络和弱监督网络的一致性,来实现弱监督协作学习。Desai等[60]提出了一种基于主动学习的自适应弱监督框架,将Faster R-CNN与PBAL(基于标准池的主动学习)结合。他们与监督学习下的目标检测方法相比较,既保证了目标检测的准确度,又减少了训练目标检测模型的时间成本。他们证明了弱监督学习和监督学习可以进行协作学习,为弱监督技术与监督学习的结合提出了新的思路。马圆等[61]对基于深度信念网络(DBN)的协作学习方法与SVM方法在肺结节良恶性检测中进行对比,发现DBN识别肺结节良恶性的准确性高于SVM方法接近20%,且方便程度与准确程度都优于SVM方法。DBN通过有监督和无监督学习过程的协作,能较好地完成目标检测与分类任务。
当前最新的弱监督学习目标检测框架依然达不到主流监督学习目标检测的准确度。因此,将弱监督学习和监督学习结合进行协作学习是弱监督目标检测的未来发展的趋势。一些目标检测方法的比较如表6所示。
表6 深度学习目标检测模型
5 总结
肺实质提取、肺叶分割、目标检测是做支气管扩张评估的核心任务,由优秀的肺实质提取算法得到准确的肺实质,再依据两种评分标准,判断是否需要分割肺叶,然后再基于数据集的情况进行目标检测,最终得到医疗层面的支气管扩张严重程度的评分,这是目前来看最具可行性的技术路线。监督学习和弱监督学习这两种思路各有优缺点,对于监督学习的思路来说,对数据集的要求较高,需要专业的医生来对数据进行标注,但在对支气管扩张严重程度的检测上准确度更好。对于弱监督学习的思路来说,对标注数据的要求不高,但是对数据量有要求,且可以利用大量未标注的数据。
目前肺实质提取和肺叶分割已经有了准确度足够高的方法。支气管扩张AI诊断系统想要实现落地目标,其未来重点研究方向包含两个层面:第一是尽管医学图像分析是深度学习的一个活跃的研究领域,但目前仍未有支气管扩张诊断的研究应用,支气管扩张疾病方向尚未有成熟模型。第二是对于支气管扩张诊断系统目前数据集缺失问题,目前还没有公开的支气管扩张的数据集。可行的解决手段主要有两种方式,第一类是通过与医院加强合作,这样可以直接获得所需的数据集,但这样得到的数据量可能存在限制,第二类是利用迁移学习,但做迁移学习过程中可能会产生准确度下降的问题。
结合深度学习技术的特点和发展,提出支气管扩张AI诊断系统未来的发展趋势。第一是深度学习方法需要大量带有精确标注的数据,由于医学影像数据的稀缺性和特殊性,数据的标注更是困难,所以基于弱监督或协作学习的深度学习方法或许是解决这些问题的新思路。第二是随着生成对抗网络的蓬勃发展,可以生成逼真且有效的医学影像数据,可以有效降低医学影像数据采集的成本,并结合弱监督学习或协作学习来解决计算机辅助诊断系统存在的问题。
AI诊断系统的开发仍面临着诸多难点,自动化诊断是其主流发展方向之一,通过建立数据采样、数据分析、数据产出等自动化流程,可进一步实现技术落地和推广,该技术的进一步发展可以辅助进行肺部支气管扩张的甄别筛查工作,减轻了医师的工作难度,对缓解医疗资源不足有着重要意义。