SE-Res Block U 型卷积神经网络应用于乳腺癌临床靶区与危及器官自动分割的研究
2021-05-12广东省中医院放射治疗区广东广州510006
广东省中医院放射治疗区 (广东 广州 510006)
内容提要:目的:实现引入SE-Res Block的U型卷积神经网络,探讨其应用于放疗中乳腺癌临床靶区与危及器官自动分割的可行性。方法:在传统U型网络的基础上引入SE-Res Block,以482例乳腺癌保乳术后(临床靶区中包含锁骨上颈部预防照射的靶区和需要照射腋窝的靶区不入组)进行调强放射治疗的乳腺癌患者的CT图像及结构信息作为研究对象。自动分割的对象包括:临床靶区、心脏、左右肺以及脊髓。左右乳独立训练、测试、评估。采用戴斯相似系数(DSC)和豪斯多夫距离(HD)来评价分割效果。结果:临床靶区自动分割的DSC与HD平均值为:0.805与9.295mm。四种危及器官自动分割的DSC与HD的平均值为0.92与4.62mm。结论:文中引入SE-Res Block的U型卷积神经网络可以较为准确地自动分割乳腺癌临床靶区与危及器官,但该算法模型对微小体积的图像分割预测表现不佳;在样本量小的情况下,对于强烈依赖主观经验的临床靶区预测结果有待进一步提高。
放射治疗要求精准、个性化的放射治疗计划以确保肿瘤靶区在受到均匀足量照射的同时,靶区周围的危及器官和正常组织可以得到充分的保护。临床靶区(clinical target volume,CTV)与危及器官(organ at risk,OARs)的正确勾画分割是确保治疗成功的前提。通常情况下,CTV与OAR的勾画分割都是临床医生通过CT与MR、手术记录、病理报告等基于个人经验手动实现的。这种人工分割的主要缺点在于:耗时大,对个人经验和主观判断依赖严重。不同的临床医生对于同一病历的分割结果有可能存在较大差异[1,2]。
近年来,基于人工智能深度学习的方法自动分割靶区和OAR是研究的热点[3-5]。Ibragimov[9]等用卷积神经网络在CT图像上分割头颈部的正常组织和关键器官,结果令人满意。最近,一些研究者又开发了深度扩张卷积网络和深度反卷积神经网络用于直肠癌和鼻咽癌的靶区和OAR的自动勾画[10,11]。
本文实现了一种引入残差单元(residual block,Res Block)与SE(Squeeze-and-Excitation)单元的U-net卷积神经网络-SE并探究其用于乳腺癌CTV及OAR自动分割的几何精度,探讨其临床应用的可能性。
1.资料与方法
1.1 临床资料
收集2013年3月~2019年6月,在本院接受乳腺癌调强放射治疗的482例患者数据,其中左乳302例,右乳180例。CTV中包含锁骨上颈部预防照射的靶区和需要照射腋窝的靶区不入组。
患者均采取仰卧位通过乳腺托架固定,使用西门子SOMATOM Sensation Open大孔径CT扫描获得,图像分辨率为512×512,层厚为5mm,单张CT图像大小为224×168×64,482例患者共获得35271张图像。每例患者都由高级临床放疗专家在医科达公司的Oncertra与瓦里安公司的Eclipse医生工作站勾画CTV和OAR,本文将其作为标准真实值(ground truth,GT)。
1.2 网络构建
本文提出了一种引入Res Block与SE-Res Block的U-net全卷积神经网络。此网络是基于传统的U-Net的端到端的卷积神经网络,它由相互对称的两边构成,左半边为编码部分,右半边为解码部分。输入大小为224×128×64的CT图像,使用大小为3×3×3卷积核的卷积层来重复卷积,共包含14个卷积层。每个卷积操作后都包含一个批归一化层(BN)和一个ReLU激活函数。编码部分使用最大池化层来缩小图像尺寸,每次下采样过程中通道数都会相应增加(通道数如图所示)。上采样步长为2,每次上采样后通道数会相应减少,但特征图片的尺寸增加,最后进行一次1×1×1的卷积得到与输入图像尺寸相同的输出图像。编码和解码部分使用concatenate操作,将编码部分信息引入解码部分,以便充分利用编码部分的信息。
图1显示了该网络的模型图。不同于原始的U-net网络,该网络引入了Res Block与SE-Res Block既可以防止随着网络层数增加而产生的网络退化问题,又以更好地拟合通道间复杂的相关性并且减少了参数量和计算量。Res Block和SERes Block的设计进一步优化传统U-Net网络以提升训练的准确率和效率。
图1.引入SE-Res Block的U-net网络
残差网络是深度学习领域中一个里程碑式的突破[8],它既解决了随着网络层数的增加,梯度消失或爆炸的问题[9-11],又解决了网络退化的问题。它可以大幅度提升超深神经网络的训练速度与准确率。
Res Block是残差网络的基本构建单元。Res Block由卷积Conv层、批处理BN层和非线性激活函数ReLU层堆叠而成。本文中Res Block将传统结构中的激活函数ReLU层和BN层转移到Conv层之前,形成一种预激活的方式,该方式可以加强对模型的正则化,减少过拟合的影响。
SE Block[12]是2017年Hu等提出的网络模块,该模块对通道间相关性进行建模,可以自适应的调整各通道的特征响应值,增强有用信息量特征,对无用特征进行抑制。将SE block添加到之前的网络中只会增加很小的计算消耗,但能极大地提升网络性能。
1.3 模型训练
本文将482例病人数据以病灶位置为标注独立训练。其中左乳302例,右乳180例。其中左乳病灶组中,随机选取202例左乳作为训练集,100例作为测试集;右乳病灶组中,120例右乳为测试集,60例为测试集。分割的对象包括瘤床靶区CTV1、乳腺临床靶区CTV2、左肺、右肺、脊髓、心脏6个部分。本次实验使用pytorch框架来进行模型的搭建、训练和评估。使用训练轮次Epoch为2000次,单次放入样本量batch_size设置为1,优化器为Nesterov Adam optimizer,使用L2正则化防止过拟合,学习率参数取0.0001。训练模型使用的GPU型号为NVIDIATesla P100。
1.4 性能评估
本文采用戴斯相似系数(Dice Similarity Coefficient,DSC)和豪斯多夫距离(Hausdorff Distance,HD)来评估SE-Res Block网络分割的结果与GT的差异。
设X代表GT,Y表示文中SE-Res Block的分割结果。
DSC对区域内部填充比较敏感,其值越大表明分割结果越准确。DSC的计算方法如式(1)所示,式中分子表示GT与分割值的区域交集,分母表示GT与分割值的并集。DSC越大,分割结果越好
HD对分割的边界区域比较敏感,计算方法如公式(2)所示:
其中,
2.结果
表1给出了对于样本集,CTV及OAR的自动分割准确度。对于左乳,CTV的DSC及HD的平均值为0.80与9.45mm;所有OAR的DSC及HD的平均值为0.92与5.00mm。对于右乳,CTV的DSC及HD的平均值为0.81与9.14mm;所有OAR的DSC及HD的平均值为0.92与4.24mm。无论左乳还是右乳,靶区层面,CTV2的分割准确度明显高于CTV1;OAR层面,心脏及肺的分割准确度明显高于脊髓。
表1.CTV及OAR自动分割准确度(±s)
表1.CTV及OAR自动分割准确度(±s)
OAR 左乳 右乳DSC HD/mm DSC HD/mm CTV1 0.72±0.08 9.56±5.29 0.73±0.08 9.74±5.55 CTV2 0.88±0.03 9.34±3.58 0.89±0.03 8.54±4.60 Heart 0.93±0.03 8.20±5.67 0.92±0.09 8.11±5.66 Left_Lung 0.97±0.01 2.36±1.43 0.97±0.01 2.24±1.50 Right_Lung 0.97±0.01 2.73±2.78 0.97±0.01 2.76±1.78 Spinal_Cord 0.81±0.05 6.72±9.81 0.82±0.05 3.84±2.03
图2和图3分别给出了左乳及右乳同一CT横断面上GT与Res-SE Block网络分割的对比结果。蓝色部分为GT,红色部分为Res-SE Block网络分割结果。CTV1为瘤床靶区,CTV2体积较CTV1大,为乳腺靶区。从图上不难看出,CTV2的分割结果优于CTV1。
图2.左乳的GT与Res-Se Block的分割结果
图3.右乳的GT与Res-Se Block的分割结果
3.讨论
本文实现了一种引入Res-SE Block的U型网络来实现乳腺癌保乳术后CTV及OAR的自动分割。与OAR相比,自动分割CTV更具有挑战性:①由于低对比对和相对高水平的噪声,CT图像上CTV与正常组织的边界通常更加晦暗不明;②CTV通常包括肿瘤有可能扩散或者微浸润的区域,然而这些在用于治疗计划的CT上很难体现出来;③CTV高度依赖于临床医生的主观经验和判断。精准的自动分割CTV一直是放射治疗的瓶颈。
本文的实验结果显示CTV2自动分割的DSC值大于0.8,CTV1的DSC略小于0.8。表明该分割模型分割结果令人满意。相对于CTV2,瘤床CTV1的个体差异较大,分割过程中,瘤床有铅丝标记的样本分割结果远好于无标记的样本。在没有铅丝标记的情况下,瘤床靶区的勾画更加依赖于临床医生的主观判断:手术记录、切口观察以及左右两侧乳腺在CT图像上的表现差异。对于严重依赖于主观判断的靶区,更需要大容量样本作为研究对象,这也是本文所欠缺的部分,样本容量不够大。随着样本数量的增多,CTV1自动分割的准确度应该会有所提升。
对于OAR组,脊髓分割的准确度明显低于肺和心脏,很大程度上是因为脊髓体积较小,本文提出的算法模型对微小体积的预测表现不佳,在处理样本时,应该对小体积的器官进行剪切、放大、还原等操作来增强其分割的准确度。
U-net网络是基于全卷积神经网络的改进,本文在U-net的基础上引入Res-SE Block,它只会增加很小的计算消耗,但能极大地提升网络性能。使用全局平均池化层来生成各个通道的统计量,两个全链接层限制模型的复杂度并增强泛化能力。
文中提出的引入Res-SE Block的U型网络对乳腺癌靶区的CTV和OAR自动分割可以取得令人满意的效果,但由于样本量小以及对小体积器官的预处理不足,对于强烈依赖主观判断的靶区及小体积器官的自动分割模型精度还有很大的提升空间,这将是日后研究的重点和方向。