APP下载

基于EfficientNetV2和ASPP的脊柱MRI图像分割

2023-09-24仇胥斌

现代计算机 2023年13期
关键词:脊柱卷积精度

蔡 标,杨 成,徐 晴,陆 翼,仇胥斌*,常 珊*

(1. 江苏理工学院生物信息与医药工程研究所,常州 213001;2. 苏州大学附属第三医院,常州 213001)

0 引言

脊柱是由26 块椎骨组成,包括颈椎7 块、胸椎12 块、腰椎5 块、骶骨1 块和尾骨1 块[1]。在目前生活节奏快和工作压力大的情况,人群易发脊椎关节错位、椎间盘突出和骨质增生等疾病[2-4]。在脊柱疾病的预防和治疗中,因为电子计算机断层扫描(computed tomography,CT)和核磁共振成像(magnetic resonance imaging,MRI)技术的便捷性和可靠性,CT 和MRI经常被使用[5]。针对脊柱的检查,在骨骼的临床诊断中,CT成像对骨骼比较敏感,但由于CT相较于MRI 具有很强的辐射性,所以在针对特定人群如孕妇的临床治疗中,MRI 具有零辐射的优势[6]。目前针对脊柱MRI 图像的分割任务较少,所以MRI图像的分割任务具有一定的意义[7]。

随着医疗技术的发展,医学图像分割越来越被需要。利用计算机得到医学图像分割结果,很大程度上减少医学工作者的工作量和提高其工作效率。随着人工智能的发展,很多机器学习和深度学习方法用于脊柱图像分割中,其中U-Net 和FCN 网络模型具有代表性。Kolařík 等[8]在U-Net和3D U-Net的基础上,增加了残差连接和密集连接,提出了Residual-U-Net 和Dense-U-Net 网络用于分割大脑和脊柱图像,实验结果证明,残差连接和密集连接能较好地提高U-Net的分割精度。Han 等[9]结合空洞卷积和自动编码器在语义分割上的优势,提出Spine-GAN 实现对脊柱图像的分割任务,再对253名患者的脊柱MRI图像进行验证,Spine-GAN 实现了准确的分割,比传统的U-Net 和FCN 提高了近10%的像素精度。Rak 等[10]将卷积神经网络和残差连接相结合,在两个公开数据集上通过五折交叉验证,Dice 系数分别为93.8%和96.0%。这个结果比之前工作的Dice提高了5.7%和8.6%,值得一提的是,新的网络在计算时间上也有很大的优势。Xie 等[11]为了解决医学二维图像分割领域中不同组织之间的低对比度、高相似性和不同比例等问题,提出CHI-Net 上下文分层集成网络。CHI-Net 主要由密集扩张卷积(DDC)和堆叠残差池(SRP)两个关键模块组成,在特定的数据集上,该网络优于主流的医学图像分割网络。

2019 年,Tan 等[12]对图像分类模型的网络深度、网络宽度和输入图片分辨率大小三个方向进行了细致的研究,在EfficientNet 的基础上提出EfficientNetV2 网络,和当时比较流行的分类网络相比较,在参数量和模型精度上有很大的提升。网络中主要使用卷积层、BatchNorm层、激活函数、池化层和残差连接等,针对不同的图片分辨率大小设置不同的网络深度和网络宽度。2018 年,Chen 等[13]提出带孔空间金字塔池化模块(ASPP)和编码-解码结构的图像分割网络DeepLabV3+,ASPP通过使用不同比率的空洞卷积和1*1卷积,将网络的感受野扩大的同时又不增加过多的参数量。利用不同的特征提取网络作为编码器,使用双线性插值操作作为解码器,最终完成了医学图像分割任务,在没有任何后处理的情况下完成89%的测试集精度。

1 材料与方法

1.1 数据集

数据集是第二届中国图像与图形学会图像与图形技术挑战赛的公开数据集(https://www.spinesegmentation-challenge.com),共有172张带标签的脊柱MRI 数据。由于数据集中数据的尺寸不一,只使用其中119 例数据,其尺寸均为12×880×880,这样可以避免对原始数据的尺寸调整导致分割精度的下降,如图1 所示。最终,针对数据集中的骶骨S、腰椎L1~L5、胸椎T11~T12 共八个分割对象进行脊柱MRI 图像分割任务。

1.2 数据预处理

为了减少计算量,同时不降低精度,将数据和标签左右两侧的背景删除,并将脊柱原始数据尺寸由12×880×880 统一为12×464×880。具体操作如图1所示,只保留脊柱图像中非零的数据。由于只有部分数据中存在T9~T10 的图像和标签,忽略部分数据中存在的胸椎T9~T10,将标签中的T9~T10进行删除。

1.3 算法流程

为了解决脊柱MRI 图像分割的部分问题,本文提出基于EfficientNetV2 和ASPP 的分割网络,用于脊柱图像的分割任务,如图2所示,原始脊柱图像数据首先经过上文的数据预处理后,经简化的EfficientNetV2 网络后,利用ASPP 和1*1卷积进一步提取特征并拼接起来,最后经过上采样操作得到与预处理后的数据尺寸一致,尺寸为12×448×880。

图2 简化的EfficientNetV2和ASPP网络示意图

由于EfficientNetV2 在图像分类任务中的出色表现,所以本文使用EfficientNetV2 网络完成特征提取任务,在EfficientNetV2 网络家族中,EfficientNetV2(S/M/L)网络较为复杂,本文选择使用简化后的EfficientNetV2_S 网络,保留5 个Stage,将每个Stage 的Layers 设置为1,具体的网络参数见表1。

表1 简化的EfficientNetV2参数概述

ASPP 模块具体结构如图3 所示,主要由1个1*1 卷积、1 个全局池化操作和3 个空洞卷积组成,使用的空洞卷积比率为6、12、18,每个1*1 卷积后都有BatchNorm 层(BN)和ReLU 激活函数。

图3 ASPP网络示意图

在上采样的过程中,上采样选择双线性插值而不是反卷积操作,可以减少学习参数量和计算时间。

1.4 评价指标

本文选用比较常见的评价指标,DSC和IoU。公式如下:

其中:Vgt为真实标签所包含的像素点的集合;Vpre为模型预测的像素点的集合。

2 实验设置

2.1 设备选择和模型参数设置

本文使用Python 语言PyTorch 框架编写,在8 张Tesla K80 的电脑上进行训练模型并测试,模型选择交叉熵损失函数,使用随机梯度下降优化器(SGD),使用ReLU 激活函数,批大小(Batch Size)为4。学习率为0.001,学习率按照公式(3)的策略变化,训练轮次(epoch)为100。

其中:Iri为第i训练批次的学习率;Iri-1为第i-1训练批次的学习率。

2.2 实验结果

为了和其他的分割方法进行比较,在119例MRI 图像中我们随机选择19 例作为测试集,对原始数据进行相同的数据预处理,执行U-Net、DeepLabV3+和nnU-Net 模型后,我们得到了各个方法的DSC和IoU评价指标,见表2。在8 个脊柱图像分割目标中,DSC评价指标中有4个取得最优成绩,IoU评价指标中有3 个取得最优成绩。经过5 倍交叉验证后,得到各方法的平均DSC评价指标和IoU评价指标,如图4 所示,本文方法在DSC评价指标和IoU评价指标均优于U-Net、nnU-Net和DeepLabV3+网络。

表2 各方法脊柱分割的平均DSC(%)和IoU(%)

图4 各方法的平均DSC评分

3 结语

本文提出一种基于简化后的EfficientNetV2和ASPP 模块的脊柱MRI图像分割方法,利用双线性插值操作完成上采样操作,该方法与UNet、nnU-Net 和DeepLabV3+主流分割方法相比,具有较优的分割能力。

猜你喜欢

脊柱卷积精度
长期久坐低头 你的脊柱还好吗
基于3D-Winograd的快速卷积算法设计及FPGA实现
18F-FDG PET/CT在脊柱感染诊治中的应用及与MRI的比较
如何保护宝宝的脊柱
从滤波器理解卷积
基于DSPIC33F微处理器的采集精度的提高
基于傅里叶域卷积表示的目标跟踪算法
GPS/GLONASS/BDS组合PPP精度分析
改进的Goldschmidt双精度浮点除法器
一种基于卷积神经网络的性别识别方法