乳腺肿块影像学分割技术现状及进展
2021-11-30冯晨雅秦耿耿陈卫国
冯晨雅 秦耿耿 陈卫国
乳腺癌是危害女性健康最常见的恶性肿瘤之一,近年来其发病率逐年增长,且发病年龄趋于年轻化[1]。“早发现、早诊断、早治疗”是降低乳腺癌病人死亡率的关键,尽早对乳腺癌病人进行确诊及治疗,可使死亡率降低40%以上[1-2]。目前,乳腺X 线摄影是筛查乳腺癌首选的检查方法[3],乳腺超声、专用乳腺CT 及乳腺MRI 是重要的补充影像检查手段。为了帮助影像诊断医生更好地区别病灶与乳腺腺体实质,计算机辅助诊断(computer-aided detection/diagnosis,CAD)技术应运而生,而且成为国内外研究的热点。CAD 中最重要的一环是对病灶进行分割。国际上很早已经开始对乳腺病灶的分割技术进行研究,但国内对此研究相对较少[2]。随着人工智能研究的发展,乳腺病灶分割受到更多关注。肿块是乳腺癌最常见、最基本的表现,因此肿块分割尤为重要。本文就不同影像检查手段中乳腺肿块的分割技术研究现状及进展予以综述。
1 乳腺病灶分割概述
病灶分割是根据影像上病灶与背景区域的差异将病灶分离出来,以便更好地观察,从而提高诊断效能,避免不必要的活检。CAD 很重要的一步是对乳腺影像进行病灶分割,后续的诊断都是建立在良好病灶分割效果的基础上。乳腺肿块的形态、密度、灰度等具有多样性,这增加了肿块分割的难度。因此,如何将肿块从腺体组织里分离出来尤为重要。
2 乳腺肿块的传统分割方法
乳腺肿块传统的分割方法多为基于图像的处理方法,可分为基于边缘、区域、阈值和特定理论的分割方法等[4]。
2.1 边缘 由Kass 等[5]提出的基于参数的活动轮廓模型(Snake 模型)是较常使用的边缘分割方法。这种模型使用局部轮廓曲率控制轮廓曲线的连续性和平滑性,并通过结合图像特征来计算得到轮廓的边缘,但此种方法容易产生假边界。凸活动轮廓模型需要预定义阈值以固定进行肿块分割时使用的最佳轮廓的全局最优解,但固定阈值或手动调整阈值都不切实际。为了解决这个问题,Acho 等[6]提出了一种凸活动轮廓模型的阈值优化方法,使用粒子群优化得到的肿块概率矩阵来确定阈值。但是,该方法收敛速度较慢,容易收敛到局部极小值,即使调整了T1值,仍不能成功分割灰度值与周围背景组织相似的肿块。
三维自动乳腺超声系统 (automated breast ultrasound systems,ABUS)和专用乳腺 CT 可以生成乳腺三维影像,并可避免乳腺X 线摄影中组织重叠导致的肿块遮盖,因而得到广泛应用[7-8]。Kuo 等[9]选取了一条径向梯度指数(radial gradient index,RGI)最高的轮廓线用于产生最终的肿块轮廓;Gu 等[10]根据此线提出了一种基于边缘的变形模型。而Kozegar等[7]则在三维ABUS 中,根据前人经验提出了一种新的半自动分割肿块的方法(即结合肿块信息的两阶段分割算法),第一阶段采用新的自适应生长算法对肿块边界进行粗略估计,第二阶段在此基础上提出了一种新的基于边缘的变形模型。此种新的分割算法根据肿块分割相似度系数(Dice)测度获得了精确的肿块分割结果。Kuo 等[11]将水平集方法扩展到动态增强(dynamic contrast enhanced,DCE)乳腺CT 三维影像上,并使用RGI 分割生成初始轮廓,结合主动轮廓模型,增加3 个停止标准来终止肿块边缘处的迭代轮廓演化过程,通过计算与手工勾画病灶轮廓的重叠率来评估自动肿块分割算法,结果显示该算法重叠率>0.65(Dice 系数为 0.7),可以很好地应用于乳腺CT 影像中肿块的分割。
2.2 区域 2001 年Chan 等[12]基于区域性水平集方法和Mumford-Shah 泛函理论提出基于区域的水平集活动轮廓(chan-vese,C-V)模型,并于次年结合一种特殊的多相水平集公式,将该模型扩展到多种图像分割[13]。而Liu 等[14]则在C-V 模型的基础上提出了一种基于指数加权平均比率 (ratio of exponential weighted averages,ROEWA) 算子改进的 C-V 模型,主要适用于含有斑点噪声的超声图像,相较于轮廓初始化+C-V 模型,该算法在肿块分割上具有更优的准确度和更快的分割速度。Hmida 等[15]提出一种新的乳腺肿块分割方法,首先初始化兴趣区(ROI)的轮廓,然后将模糊轮廓与C-V 模型结合,得到描绘肿块轮廓的最终模型。该模型平均真阳性率为91.12%,精确率为88.08%。
2.3 多种方法结合 随着新方法的提出,与一些特定理论相结合的图像分割方法备受关注。近年有研究提出结合2 种方法,将不同算法优缺点互补从而取得较为理想的结果。Chu 等[16]使用形态学增强和简单线性迭代聚类(simple linear iterative cluster,SLIC)方法检测乳腺肿块,并取得良好的效果。SLIC是一种基于K 均值(K-means)聚类算法常用的超像素分割方法。形态学增强可以提高肿块区域与乳腺背景对比度,更好地显示肿块边界,使得SLIC 方法能够基于简单的特征即可获得令人满意的分割性能,表明形态学增强和SLIC 结合对提高现有CAD系统的分割性能有很好的应用前景。而Gu 等[17]提出了一种基于超像素生成和曲线演化的乳腺肿块分割三步法,首先采用SLIC 方法和基于密度的含噪空间聚类(density-based spatial clustering of applications with noise,DBSCAN)方法生成乳腺 X 线影像的超像素,然后构建乳腺肿块的ROI,最后提出了一种基于局部高斯分布(local Gaussian distribution,LGD)拟合、图形块先验和空间约束的隐式水平集方法来驱动曲线并捕捉乳腺肿块的边缘。该方法排除了ROI 假阳性区域,能更精确地捕捉乳腺肿块的边缘,具有较好的分割效果。
乳腺MRI 是检查乳腺疾病的重要补充影像手段,在原位癌及无钙化病灶的诊断中具有重要意义[18]。褚等[19]提出一种基于超像素和改进C-V 模型的三维全自动分割方法,利用MRI 序列帧间的相关性,采用超像素算法提取肿块的大致轮廓,再用改进的C-V 水平集算法对可疑病灶边缘进行优化,可以得到更接近肿块实际边缘的边界,较好地解决了乳腺MRI 序列中肿瘤的三维分割问题,其准确率高且具有较高的分割精度,以手动分割轮廓为基准,该分割方法平均重叠率为87.84%,对比C-V 模型为58.90%,超像素和水平集结合为76.36%,K-means+C-V 为 83.62%。
3 乳腺肿块的人工智能分割方法
由于乳腺影像中噪声和伪影较多,背景复杂多变,病灶与背景的对比度差,因此传统的肿块分割方法结果往往不佳。近年来,随着计算机技术及人工智能研究的发展,许多新兴的与人工智能相关的乳腺肿块分割技术应运而生。人工智能分割方法包括传统机器学习和深度学习。
3.1 传统机器学习 传统机器学习是利用经验学习改善算法的一种人工智能学习方法。传统的机器学习方法包括支持向量机、随机森林、聚类算法等[20]。Panigrahi 等[21]提出了一种新的多尺度高斯核诱导模糊C 均值聚类方法(multi-scale Gaussian kernel induced fuzzy C-means clustering method,MsGKFCM)用于自动提取ROI 中的病灶,以划定肿块的边缘,并在此基础上提出一种基于MsGKFCM 和多尺度矢量场卷积的混合方法来获得精确的肿块边缘。该方法首先利用散斑噪声抑制各向异性扩散技术对图像进行滤波,然后将MsGKFCM 应用于滤波后的图像分割出肿块,利用多尺度向量卷积确定准确的肿块边缘,结果显示该算法的准确度达到97.3%,F 分值为92.3%。
3.2 深度学习 深度学习是近年迅速发展的机器学习中的新方法,通过模拟人类大脑结构建立提高神经网络学习能力的模型。深度学习具有强大的特征提取能力,可以自动学习输入端到输出端的映射关系,被广泛应用于乳腺肿块分割。常用的深度学习包括卷积神经网络(convolution neural networks,CNN)、全卷积神经网络(full convolutional networks,FCN)以及在FCN 基础上衍生的其他学习模型。
3.2.1 CNN 和FCN CNN 是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,在大规模图像处理中具有优势。CNN 最初是为图像的分类任务而设计的,2015 年Arevalo等[22]使用CNN 替代手动提取特征方法,使乳腺X 线影像上病灶的分类准确度显著提高。FCN 将传统CNN 的全连接层换成了卷积层,使卷积层成为网络结构的唯一组成成分,而且FCN 可以对全视野的乳腺数据直接进行特征提取,减少了采用数据采样对小肿块的影响,提高了对肿块的检测精度[23]。Chen等[24]根据深度实验室版本 2(DeepLab-v2)提出了一个相似的模型结构,为了捕捉不同尺度的上下文特征,使用不同膨胀率的空洞卷积做池化层,得到一个多孔空间金字塔池化(atrous spatial pyramid pooling,ASPP)模块,同时将主干网络 VGG16 替换成ResNet50,提高了模型的拟合能力。而徐等[25]设计的基于FCN 迁移学习的乳腺肿块图像分割方法进一步验证了该算法分割效果明显优于传统分割算法。但此类方法大多是在人工勾画或提取病变区域ROI 后再进行分割的,前期准备工作繁琐且具有较强的主观性,增加了整个分割流程的复杂程度,使CAD 系统发展受到一定限制。
Al-Antari 等[26]提出并利用一种新的深度网络模型——全分辨率卷积神经网络对大量乳腺X 线影像进行分割,首先用YOLO(You Look Only Once)检测肿块区域,然后全分辨率卷积神经网络学习原始输入数据每个像素的全分辨率特征,从解码器中移除了最大集合和子采样层并使卷积层提取和学习输入图像的全分辨率特征以实现像素到像素的肿块精确分割,最终通过四次交叉验证、测试得到良好的分割结果 [总体准确度92.97%,Dice(F1 分数)为92.69%],结果表明该新模型在肿块分割方面优于传统的深度学习方法,可用来协助放射科医师诊断乳腺肿块。Badrinarayanan 等[27]使用FCN 实现乳腺肿块分割,并在FCN 后加入条件随机场来精细分割结果。赵[23]提出了一种基于医学先验知识的多目标、多肿瘤分割方法,首先使用背景显著性将医学先验知识融入到模型输出,对肿瘤检测定位进行约束,然后利用不同膨胀率的空洞卷积金字塔层级结构改进区域生成网络(region proposal network,RPN),以提高模型用于不同大小肿瘤检测、分割时的表现,最后将全连接的条件随机场连接在Mask分支后,使分割结果更加精细,有效提升多尺度乳腺肿块分割表现,其中对小肿块检测准确率的改善尤为显著。该模型对肿瘤区域分割的交并比(intersection over union,IOU)达到 86.1%,真阳性率为92.69%。
3.2.2 U 型卷积神经网络(U-Net)及其衍生网络 UNet 由 Ronneberger 等[28]在 2015 年提出,是使用全卷积网络进行语义分割的主流算法之一,使用具有压缩和扩展路径的对称U 形结构。2018 年Kumar 等[29]提出了一种多级U-Net 算法用于分割超声影像上的可疑乳腺肿块,该算法不需要初始种子,可以实时分割可疑乳腺肿块,结果显示该算法最终Dice 为0.82,真阳性率为0.84;其性能与基于距离正则化水平集(distance regularized level set segmentation,DRL)相当(Dice=0.84),并优于单纯U-Net(Dice=0.54)。
Caballo 等[30]训练 U-Net 对平扫专用乳腺 CT 影像中基于2D 的乳腺肿块进行分割,其与实际肿块的符合率为0.85,并比较了与4 名放射科医生勾画肿块的一致性及所勾画的病灶之间在影像组学特征提取的一致性。虽然研究结果显示U-Net 的肿块分割与放射科医生间的一致性为0.78,但仍有超过90%影像组学特征的提取是稳定的。MR 扩散加权成像(DWI)不需要注射对比剂,作为MRI 检查的一种辅助序列,可以提高乳腺MRI 的准确性,减少不必要的活检,但DWI 分辨力较低,进行基于乳腺DWI 的MRI 自动全乳腺分割技术存在一定难度[31]。Zhang 等[32]使用深度学习模型(U-Net 和分割网络SegNet)和迁移学习作为分割方法,在DCE-MRI 预先训练模型上进行迁移学习,并运用于DWI,结果显示 U-Net 模型在 DCE-MRI 及 DWI 上较 SegNet具有更好的性能;而且分割过程中发现,U-Net 及SegNet 模型在DWI-MRI 数据上也得到了良好的分割效果,并提出DWI 在未来有可能代替DCE-MRI成为乳腺MRI 辅助诊断的新工具。
单纯U-Net 在不同检查方式乳腺影像中得到了很好的应用,近些年在单纯U-Net 的基础上又有多方面的改进,例如基于注意力机制、数据处理、卷积模块等方面的改进,以便更好地通过影像分割乳腺肿块。
3.2.2.1 基于注意力机制的改进 有研究者[1,4]进行了基于FCN 的全视野数字乳腺X 线摄影(full field digital mammography,FFDM)肿块分割研究,应用更有效的非对称编码器-解码器网络架构,结合注意力引导密集上采样(attention-guided denseupsampling,AU)模块,通过 AU 网络(AUNet)来提高分割性能,获得最佳分割结果,结果显示不仅能很好地分割不规则和小尺寸的乳腺肿块,而且能通过注意力选择机制有效地减少假阳性,同时不增加假阴性结果。
2020 年,一种新的选择核心(selective kernel,SK)-U-Net 网络被用于超声进行乳腺肿块分割[33]。SK 通过注意力机制调整网络的ROI,并融合扩张卷积和传统卷积网络提取的特征映射,有效解决乳腺肿块大小的问题,结果显示SK-U-Net 的平均Dice为0.826,受试者操作特征曲线下面积(AUC)为0.958, 而 标准 U-Net 的 Dice 为 0.778,AUC 为0.909;研究还显示该算法在良恶性肿块分割中,恶性肿块的 Dice(0.842)高于良性肿块(0.820),可以更好地帮助诊断医师识别乳腺恶性肿瘤,提高乳腺癌的检出率。
3.2.2.2 基于卷积模块的改进 梁[34]在U-Net 的基础上增加其网络深度,并加入残差学习单元,提出了残差学习U 型卷积神经网络(RcsU-Net),解决了网络加深出现的梯度消失问题,使分割效果得到显著提升,并借鉴了移动最小二乘形变的方法,在扩大数据集规模提高网络泛化能力的同时,保证了重要诊断信息的完整性,能够精准高效地分割肿块区域(Dice 为 0.956 8,IOU 为 0.917 3)。
3.2.2.3 基于数据处理方法的改进 Zeiser 等[35]在U-Net 的基础上结合数据增强提出了一种新的模型,该模型去除了乳腺摄影中不相关的信息,增强影像对比度获得ROI,并对影像进行水平翻转和缩放,最终敏感度为92.32%,特异度为80.47%,准确度为 85.95%,Dice 为 79.39%,AUC 为 86.40%。
为了提高数字乳腺体层摄影(digital breast tomography,DBT)影像中乳腺肿块的自动分割精度,Lai 等[36]提出了一种基于U-Net 网络的DBT 乳腺肿块自动分割算法,增强了大量肿块区域的对比度并对DBT 图像进行顶帽(TOP-HAT)变换,构建了高效的U-Net 神经网络对DBT 肿块进行预分割,并使用中值滤波器获取肿块边界以取得最终分割结果,结果显示该网络在DBT 肿块的自动分割方面取得了良好的结果,并且其准确度、特异度、敏感度和AUC 优于其他经典CAD。
3.2.3 其他网络 金字塔型结构是一种由不同分辨率图像组成的形同金字塔样层次式的数据结构,在金字塔结构的上层图像中,滤去了绝大部分的高频成分而保留低频成分。运用到乳腺影像上,肿块属于低频成分,背景属于相对高频成分,滤去高频的背景组织后,就留下了低频肿块[37]。Wang 等[38]提出了一种新的多级嵌套金字塔网络(multi-level nested pyramid network,MNPNet)来处理乳腺图像肿块分割中普遍存在的类内不一致和类间不区分的局限性。MNPNet 包括编码器和解码器,前者在修改后的ResNet34 生成的特征金字塔上,通过多层嵌套ASPP 模块,对上下文特征、低层细节信息和高层语义信息进行多级多尺度编码;后者由一系列简单而有效的双线性上采样和特征融合操作组成,用于细化肿块边界区域的分割结果。所提出的MNPNet 在INBREAM 和DDSM-BCRP 2 个公共乳腺摄影肿块分割数据库上得到了很好的验证,在没有任何前后处理的情况下,Dice 系数分别达到了91.10%和91.69%,表明MNPNet 可以指导今后临床肿块分割。
4 小结
乳腺癌作为威胁女性健康的第一大肿瘤,其防治是全世界的公共健康问题,早预防早诊治能提高病人预后[31]。CAD 技术系统基于乳腺影像,借助计算机图像处理、数据统计以及人工智能等技术,能探测乳腺病灶,尤其是与腺体组织重叠而容易被忽视的病变,并有助于鉴别病变良恶性,降低召回率和活检率,对乳腺癌的诊治提供了很大帮助。尽管现阶段可用的分割算法较多,且不断有新的改良算法出现,但哪种方法能达到最好的分割效果尚无定论,且所训练的模型在不同样本中的分割效果也还有待观察。因此,如何选择合适的方法或算法以更好地分割肿块与乳腺组织,帮助放射科医生更准确地诊断乳腺癌,降低乳腺癌死亡率,提高病人生存率及生存质量仍是今后的研究重点。