基于深度学习的结膜血管分割方法
2021-03-26许子豪曹娟马煜辉陈浜谢林春赵一天
许子豪,曹娟,马煜辉,陈浜,谢林春,赵一天*
(1.重庆交通大学 信息科学与工程学院,重庆 400000;2.中国科学院宁波材料与技术工程研究所 慈溪生物医学工程研究所,浙江 宁波 315201)
0 引言
光学相干断层扫描血管成像(Optical Coherence Tomography Angiography,OCTA)技术通过窥测红细胞的流动[1],以获取视网膜、脉络膜以及结膜部位的血管影像[2]。相较于传统的荧光素眼底血管造影与吲哚菁绿血管造影,OCTA具有非入侵、快速以及三维成像的优势,成为眼科领域极具发展前景的血管成像技术[3]。相关临床研究表明,如年龄相关性黄斑病变(AMD)、糖尿病视网膜病变(DR)、干眼病、青光眼病变在眼部血管中会呈现异常状态[4],而通过对眼部血管成像,辅助医生诊断,实现对疾病的早发现早治疗,以降低失明的风险。
本文围绕位于眼球前节(Anterior Segment,AS)的结膜OCTA血管图像展开研究,其血管量化指标对于干眼症诊断治疗、角膜手术前后诊断治疗都起着十分重要的作用[5]。特定的眼科疾病往往会引起血管密度、形态等血管量化指标的异常。为实现血管的提取与量化,对AS-OCTA血管的自动分割是一关键任务。所以血管的清晰呈现与准确分割,是医生做出准确临床诊断、精确提取量化血管指标的前提。然而AS-OCTA图像因眼球颤动产生了大面积横纹噪声、血管区域与背景区域数据分布不均衡等问题,都为AS-OCTA精确、高效的自动分割带来了巨大挑战。
深度学习的快速发展为解决AS-OCTA血管的精确分割带来了新思路,从而辅助医生实现相关血管指标提取与量化,以便医生的临床诊断。本文基于深度学习的思想提出了AS-OCTA的自动分割方法,它主要包含如下几部分:首先实现了AS-OCTA中横纹噪声去除的数据预处理任务;为了提高血管分割准确率,通过迭代的思想,在“U型”网络结构末端连接多个“微型”网络结构,来提高网络的语义信息获取能力,进而提高分割准确率;并使用Focal损失函数与Dice损失函数相结合的策略来对网络模型进行约束,解决分割数据分布不均衡的问题。
1 相关研究工作
目前国内针对AS-OCTA眼表部位的血管分割研究还处在空白阶段,但已有部分学者开展过关于OCTA的眼底血管分割的研究。如Gao等人[6]结合平均反射投影与去最大化相关投影的原理得到了en-faceOCTA的二值化血管分割图像。Camino等人[7]提出了优化的反射调整阈值方法来对OCTA中的血管进行分割。Wu等人[8]提出了基于血管连续性分析的优化方法,最终实现了OCTA中血管提取。然而,以上基于传统的OCTA分割方法缺乏对整张图像语义信息的获取能力。
深度学习在医学图像分割领域中展现了巨大潜力[9-10]。由Ronneberger等人[11]提出的U-Net采用了短连接的方式,极大地促进了深度学习在医学图像领域发展,许多以U-Net为基本框架改进的图像分割网络也随之提出如ResU-Net[12]、Attention U-Net[13],并在医学图像分割方面取得了突出效果。Gu等人[14]基于上下文信息的编码器提出了CE-Net,其中包含了稠密空洞卷积模块与多核残差池化模块来获取图像中的语义信息,使得CE-Net在眼底血管分割中实现了较好的分割效果。Mou等人[15]提出了CS-Net,针对曲线型结构的医学图像开展分割研究。为了自适应图像中的局部信息与整张图像的关系,在编码器与解码器之间融合了基于空间与通道注意力的模块,并在OCTA数据集中都取得了最好的分割效果。Li等人[16]基于无向池化层的投影原理,提出了投影网络来对3D的OCTA视网膜图像进行分割,并得到2D的血管分割结果。Ma等人[17]提出了一个新的基于分解的粗细血管分割网络OCTA-Net,它首先生成一个血管初始置信图,并基于分解思想来对OCTA视网膜血管进行精细化分割。Stenfan等人[18]基于深度学习的方法提出了针对OCTA数据的图像增强、分割的网络模型工具,并可以提供给研究者血管量化指标结果。但是在血管分割研究中采用简单的卷积神经网络来实现,并未发挥出神经网络潜在的学习能力。
2 基于级联网络的结膜图像分割
2.1 数据预处理
设备在采集图像时,由于患者眼球的不自主颤动,导致图像存在大面积横纹噪声,为医生的疾病诊断与分割网络的训练带来阻碍。首先通过协同一致性方法[19]来去除AS-OCTA中的横纹噪声,最后结果如图1所示,其中(a)为带横纹噪声的原始图像,(b)为横纹噪声去除后的图像。可以在去除横纹噪声的同时保留完整的血管信息,最后将去噪图像作为网络的数据集使用,来提高最终分割网络的可靠性。
图1 数据预处理
2.2 级联网络结构
本文采用经典的“U型”结构U-Net网络作为基础模型,主要包含了编码器、解码器与跳跃连接三个部分。但传统的U-Net网络训练不稳定,本文加入BatchNorm层与ReLU激活函数来防止网络训练时梯度消失与爆炸,同时提高神经网络的特征提取能力,卷积模块的设计如表1所示:
表1 本文网络卷积模块
网络中的编码器部分每一层首先通过表1的卷积模块,接着通过最大池化层进入到下一层编码。解码器部分每一层依次通过表1的卷积模块与上采样层,进入到上一层解码。为保证在特征提取时,获取更多上下文信息,将对应编码层与解码层的特征图进行跳跃连接。本文采用5层的网络结构,如图2中U-Net所示。
图2 本文提出的分割网络
为对血管区域精细化分割,需获取图像中更多语义信息。若加深网络深度,易导致图像细节信息的丢失。故在第一个U-Net结构输出后连接N个“微型U-Net”,提高网络特征提取能力,实现对血管的准确分割。“微型U-Net”采用同表1相似的卷积结构,同时为了在特征提取时进一步优化分割结果,采用3层网络结构对第一次U-Net输出的分割结果进一步微调。为保证血管微调阶段不丢失图像信息,在U-Net的输出端与“微型U-Net”的输入端进行跳跃连接,网络如图2中“微型U-Net”所示。
2.3 损失函数
在结膜图像中,血管区域占整张图像较小比例,导致数据分布不均衡的问题,为神经网络训练带来难度。为了解决这一难题,Focal[20]损失函数基于传统交叉熵基础上,为图像中正负样本分配不同的权值,使网络可以关注样本量少的血管区域。它的表达式如下:
最终本文提出模型的目标约束函数如下,β为控制两者的权重参数:
3 实验评估
3.1 数据集与实验设置
本文所用数据集包含了31张结膜AS-OCTA图像,由Optovue公司的RTVue XR Avanti SD-OCT设备拍摄。采集的AS-OCTA图像覆盖结膜的区域,分辨率。为了验证分割算法的有效性,AS-OCTA图像均由眼科专家借助ImageJ软件人工标注可见的血管像素,最终将标注结果作为实验的金标准。如图3所示,(a)表示AS-OCTA图像,(b)为(a)对应的金标准。
本文提出的分割网络的实验环境是在Ubuntu 16.04的操作系统下基于Pytorch深度学习框架实现的,并使用NVIDIA GeForce GTX 3090显卡进行加速。在网络训练过程中,选取26张图像作为训练集,5张作为测试集。将学习率设置为0.0001,并通过“poly”学习率衰减策略,使网络训练的学习率随着训练次数的增加逐渐衰减至0,从而加快网络训练拟合过程。用Adam优化算法使网络快速达到收敛结果,批处理的大小设置为1,训练的迭代次数(epoch)为300次,“微型U-Net”网络个数N取3,损失函数控制参数为β=10 。
3.2 评估标准
为验证本文算法针对血管分割的性能,需要用有效的指标来衡量分割的有效性。在医学图像的分割领域中,常采用AUC、准确率(Accuracy)、Dice系数这3个指标来评价分割结果的性能。其中,AUC表示的是ROC曲线之下的面积,值越大代表模型性能更佳。准确率与Dice系数的计算方式如下:
其中,TP为正确分割的血管像素,TN为正确分割的背景像素,FP为错误分割的血管像素,FN为错误分割的背景像素。
3.3 方法对比
为了验证本文算法的有效性,将其与现有基于深度学习的图像分割方法进行对比,主要包含了U-Net、ResU-Net、CS-Net。对比实验的参数都与原论文保持一致,最终得到的分割效果如图4。从黄色箭头部分可以看出其他方法缺乏对血管连续分割,而本文提出的方法在血管分割结果中连续性更高。除此之外,相较于U-Net、ResU-Net、CS-Net,本文提出的方法并未分割出图像中存在的噪声背景,而且实现了更精准的血管分割结果,以方便后续医生的疾病筛查与诊断。
图4 本文方法与对比方法结果图
分割指标结果如表2,本文提出的方法在AUC、准确率、Dice中分别达到了95.8%、95.5%、64.6%。相比于现有的主流方法,本文提出的方法达到了最高的分割结果。AUC的值最高,代表本文提出的方法具有更稳定的分割性能。对比于基本框架U-Net,本文提出的方法在AUC、准确率、Dice系数上分别提高了2.1、0.1、3.4个百分点,实现了分割模型的优化与分割精确度的提升。
表2 对比方法实验结果
3.4 消融实验
本文方法基于U-Net为基础框架改进,并连接个N个“微型U-Net”网络。本文讨论N的取值,最终确定网络结构得到最好的分割效果。当N=0 时,网络模型为基础框架U-Net。随着N逐渐增大至4,分割实验结果如表3所示。可以看出随着N逐渐增大至3,AUC、准确率、Dice系数值相比于基础框架U-Net,分割结果随N的增大而提高;而当N=4 时,AUC、准确率、Dice系数已经保持在了一定准确率,没有进一步提升,反而有了小幅度的下降。由于随着网络语义获取层次的推进,最后反而会引起图像细节信息丢失的问题。所以,最终本文采用3个“微型U-Net”的网络结构为最终方法,从而实现结膜图像中血管的自动分割。
表3 不同“微型U-Net”个数实验
4 结语
本文针对结膜图像开展分割方法的研究,首先对获取的图像进行横纹噪声去除的预处理任务,并作为新的数据集。基于U-Net的基础结构上级联3个“微型U-Net”来提高网络对血管的准确分割能力,并联合Focal与Dice损失函数共同约束来训练网络模型,解决血管图像数据分布不均衡的问题。通过对比其他血管分割方法、讨论“微型U-Net”个数,确定分割模型。最终结果表明,本文提出的方法可以有效提高血管分割的准确度,方便后续疾病筛查与诊断研究。