一种用于青光眼视杯盘分割的改进U-Net 算法

2021-09-28柴家星席千千肖泽华王宇光

软件导刊 2021年9期

柴家星，李峰，席千千，肖泽华，严磊，王宇光

（1.上海理工大学光电信息与计算机工程学院，上海 200093；2.上海理工大学机械工程学院，上海 200093）

0 引言

青光眼是一种退行性视神经病变，会导致患者视力和生活质量下降。依据世界卫生组织（WHO）相关报告，青光眼的致盲率仅次于白内障，至2020 年有近7 600 万人被确诊为青光眼，预计2040 年青光眼的患者将达到1.18 亿［1-2］。青光眼患者早期无症状表现，只有到了晚期才会有明显的视力下降，而且视力的损失是不可逆转的。因此，青光眼的早期筛查对于患者的及时治疗至关重要。通常，眼科医生根据患者彩色眼底照片对视神经头（Optic Nerve Hypo⁃plasia，ONH）区域进行评估以检测青光眼。ONH 评估的一个重要指标是杯盘比（Cup-to-Disc Ratio，CDR），大的杯盘比意味着更高的患病风险。然而，CDR 大多数是由医生人工测量和计算，不仅耗时、费力而且不同医生的测量结果也存在一定的主观性。眼底图像中OD/OC 的分割准确度在很大程度上会影响CDR 的计算。为此，基于眼底图像的OD 和OC 自动准确分割在青光眼的筛查和诊断中具有非常重要的意义。

近年来，许多研究人员对基于视网膜眼底图像的OD和OC 自动分割进行了研究，主要分割方法包括：统计形状模型［3-6］、多视图和多模态方法［7-9］及基于超像素的方法［10-13］等。然而，上述研究主要依靠手工提取OD 和OC 的特征，并需要用户的交互才能产生比较良好的分割结果。在实际的临床环境中，很难设计出好的手工特征，这降低了算法的分割性能。最近，深度学习技术已在图像分割上取得了良好性能，并取得了良好的分割效果。Sevastopol⁃sky［9］采用改进的U-Net 网络对OD 进行分割，其分割结果被进一步用于OC 分割；Fukushima 等［14］设计了一种参数相对较少的M-Net 架构以实现OD 和OC 的分割。尽管这些研究工作取得了较好的OD 和OC 分割效果，但是其结构复杂度和时间复杂度都较高。

针对以上问题，本文设计了一种基于改进U-Net 的端到端的青光眼视杯盘分割算法，将U-Net 的编码部分进行改进，采用ResNet50 的映射叠加方式，有效提取图像深层信息，优化网络泛化性。进一步地，采用椭圆拟合策略改善视杯盘区域边缘信息，消除分割预测结果中存在的锯齿现象。最后，在公开的DRIONS-DB、RIM-ONE 和DRISHTIGS 数据集上验证了模型性能。

1 数据集与数据预处理

本文主要采用3 个公开的青光眼数据库对设计的网络进行性能验证，这3 个数据集分别为RIM-ONE［15］、DRI⁃ONS-DB［16］和DRISHTI-GS［17］。RIM-ONE 数据集包括159张眼底图像，其中包括84 张青光眼或者是疑似青光眼图像和75 张正常眼底图像。DRIONS-DB 数据集包含110 张眼底图片和相应视盘分割，其中6 张健康眼底图片，104 张青光眼图片，图片像素大小是600×400。DRISHTI-GS 数据集包含101 张彩色眼底图像，其中50 张训练图像和51 张测试图像，图片像素大小为2 896×1 944。此外，该数据集还提供了基于4 名眼科专家手绘标签的视盘和视杯的平均边界值。

对以上3 个数据集中的眼底图片采用限制对比度自适应直方图均衡（Contrast Limited Adaptive Histogram Equal⁃ization，CLAHE）方法和数据增强技术，所采用的数据增强方法包括眼底图像的镜像翻转、随机裁切等。感兴趣区域提取处理流程如图1 所示，通过数据预处理提高数据集中眼底图像的数量和异构性。

Fig.1 Process flow of extracting featured region of interest图1 感兴趣特征区域提取处理流程

2 基于ResNet50 的分割网络

本文基于端到端思想设计了一种图片像素级分割架构以完成眼底图片中视杯视盘区域分割。该设计网络结构采用了编—解码的特点进行搭建，主要使用卷积、池化层以及相应的ReLU 激活函数和批归一化函数等基本结构，如图2 所示。在网络中，采用ResNet50 作为U-Net 架构的下采样编码器部分，并在模型跳跃连接中加入目标注意力机制来提高模型对盘沿边缘的识别能力及分割精度。网络左侧是基于ResNet50 的下采样部分，即为压缩路径，主要包含一个卷积核大小为64 的7×7 卷积层、最大池化层以及多个重复的残差块。所设计的降采样网络不仅对输入眼底图像的一些小扰动具有很好的鲁棒性，而且可有效减少过拟合的风险，降低运算量并能增大感受野，浅层结构可提取图像简单特征，深层结构可提取更为抽象的特征。网络右侧为扩展路径，其作用是将抽象特征解码到图像的原始尺寸。

分割算法总体设计步骤如图3 所示，其整体流程主要由两主体部分组成。针对第一部分视盘区域分割，在输入层输入数据集中的原始图像；针对第二部分视杯分割，因其在视盘区域表现出对比度分散、边缘模糊不清等特点，所以在输入数据时转为输入经算法处理过后的视盘感兴趣区域。

本文所提出的视杯分割模型的训练过程与视盘类似，因此可基于训练视盘分割模型参数进行微调以获得较为优异的效果，从而节约了实验时间及计算资源。所提分割算法模型的实施过程主要有：①依据视盘区域亮度分布情况及位置形状特征完成感兴趣区域提取工作，并利用数据增强算法对其进行图像处理，同时对眼底图片进行像素归一化操作；②将步骤①中处理过后的图像输入到文中深度学习网络中，以训练对应的视盘分割过程，在此过程中需加载由其他数据库已训练完毕的网络参数并以此为基础做进一步参数调整，利用前向传播与反向传播对网络进行迭代训练，直至损失函数结果达到稳定值或已经达到事先设置好的最大迭代数时将退出训练过程；③用步骤②中已训练视盘分割参数对视杯分割模型进行参数调整，此训练过程具体实施步骤可依据步骤②中视盘分割过程；④测试图像是在已训练好的视杯盘分割网络上进行分割预测，并根据眼底图像中视盘轮廓趋于椭圆对最终预测结果进行椭圆拟合，以防止分割结果存在锯齿边缘信息从而影响实验结果，实验最后根据视杯盘分割预测边界计算CDR 数值，并将其结果作为青光眼辅助判断的依据。

Fig.2 Split network based on ResNet50图2 基于ResNet50 的分割网络

Fig.3 Overall design of segmentation algorithm图3 分割算法总体设计

3 评估指标

本文采用交并比（Intersection over Union，IOU）、Dice 系数和AUC 以评估所提出分割方法的性能。IOU 定义为：

Dice 系数定义为：

其中，A 表示分割结果的真值，B 表示算法分割结果。

4 实验结果

本文将提出的分割方法与当前主流方法进行比较，结果如表1 和表2 所示。从表1 可以看出，基于DRIONS-DB和RIM-ONE 数据集上的算法在分割视盘中获得的IOU 和Dice 值分别为0.93 和0.96，0.94 和0.97，优于Sevastopolsky等［9］、Zilly 等［18］和Al-Bander 等［19］提出的分割方法。在DRISHTI-GS 数据集上所提出的方法与Zilly 等［18］提出的算法所产生的视盘分割性能相匹配。从表2 可以得到，针对视杯分割，在RIM-ONE 数据集上的算法获得的IOU 为0.845，Dice 系数为0.923；在DRISHTI-GS 数据集上的方法所产生的IOU 和Dice 的值分别为0.930 和0.970，性能明显优于其他3 种算法。

Table 1 Comparison results of different algorithms for segmentation of optic disc表1 不同算法分割视盘对比结果

Table 2 Comparison results of different algorithms for segmentation of visual cup表2 不同算法分割视杯对比结果

此外，在以上3 个数据集上算法分割OD 和OC 的ROC曲线如图4 和图5 所示。可以看出，在DRIONS-DB 与DRISHTI-GS 数据集上分割OD 分别获得AUC 值为0.982、0.962；在RIM-ONE 与DRISHTI-GS 数据集上分割OD 与OC 分别获得的AUC 值为0.989 和0.992。由此可知，本文算法在分割视杯和视盘方面具有良好的鲁棒性与泛化性［20-21］。此外，本文算法性能的提高主要是在网络中引入了目标注意力机制，提高了对视杯盘区域轮廓的识别能力。

Fig.4 OD segmentation curves of DRIONS-DB and DRISHTI-GS data sets图4 DRIONS-DB 与DRISHTI-GS 数据集OD 分割曲线

Fig.5 Segmentation curves of OD and OC in RIM-ONE and DRISHTI-GS data sets图5 RIM-ONE 与DRISHTI-GS 数据集中的OD 与OC 分割曲线

最后，将由本文模型分割结果计算出的CDR 值与4 位眼科医生获得的CDR 值进行比较，如表3 所示。从表3 可知，算法结果与眼科医生的结果基本一致，进一步验证了本文算法的优越性能。

Table 3 Mean and standard errors of four ophthalmologists and algorithms in predicting CDR表3 4 位眼科医生与算法预测CDR 的平均与标准误差

5 结语

本文利用彩色眼底图片对传统U-Net 分割架构进行了改进，提出了一种基于改进U-Net 的端到端的青光眼视杯盘分割算法。在网络中，本文改进了U-Net 的编码部分，采用ResNet50 的映射叠加方式，提取图像的深层特征信息。为进一步消除分割结果中的锯齿现象，借助椭圆拟合策略改善视杯盘区域的边缘信息［22-23］。最后，通过在公开的DRIONS-DB、RIM-ONE 和DRISHTI-GS 数据集上与当前主流的OD 和OC 分割网络进行比较，验证了模型优越的分割性能，在青光眼诊断中达到了与人工分割接近的性能。因此，从总体上看，本文分割网络在青光眼的辅助诊断中有一定的优越性，并且对视盘与视杯的重要结构特征有较强的学习能力，并为后续研究视杯视盘联合分割作出了铺垫。