基于深度学习和图谱库方法自动勾画肿瘤放疗中危及器官的比较
2020-01-07张富利崔德琪王秋生韦凌宇朱林林郁艳军李海鹏王雅棣
张富利,崔德琪,王秋生,韦凌宇,朱林林,郁艳军,李海鹏,王雅棣
1.解放军总医院第七医学中心,北京100700;2.北京连心医疗科技有限公司,北京100083;3.北京航空航天大学自动化科学与电气工程学院,北京100083
前言
放射治疗是恶性肿瘤的三大治疗手段之一,超过70%的恶性肿瘤患者需要接受放射治疗[1]。精确勾画肿瘤靶区和危及器官(OARs)的轮廓是实现精确放射治疗的前提和保障[2]。通常情况下,放射肿瘤医师根据患者的定位CT 图像手动勾画靶区和OARs,勾画过程较为耗时费力,不同医师之间受主观性因素影响导致勾画结果存在较大差异,而且大量重复性的工作降低了医师对患者进行诊疗的效率[3-4]。近年来,自动勾画已成为放疗领域的研究热点之一,基于图谱库(Atlas)和深度学习(Deep Learning,DL)的自动勾画方法是目前两种主要的自动勾画技术。前者通过构建对比数据模板影像库,采用刚性和形变配准的方法实现靶区和OARs 自动勾画[5-8];后者基于神经网络DL 算法,运用标准数据集对其进行有效训练,通过算法逻辑实现自动勾画。本研究主要目的是评估基于DL 和Atlas 的自动勾画方法在不同部位肿瘤放疗中OARs 自动勾画的精确度,为临床应用提供参考依据。
1 资料与方法
1.1 临床资料
随机选取解放军总医院放疗科2016年7月~2019年3月40 例肿瘤患者,其中头颈部、胸部、腹部和盆腔肿瘤患者各10 例。定位时均采用仰卧位,采用CT模拟定位系统(Philips Big bore,USA)进行扫描,头颈部肿瘤扫描层厚3 mm,层间距3 mm,其余3 个部位肿瘤均选择扫描层厚5 mm,层间距5 mm。
1.2 手动勾画和基于Atlas自动勾画OARs
将扫描获取的CT图像分别传至ADAC Pinnacle3治疗计划系统(Treatment Planning System,TPS,version 9.10,Philips Radiation Oncology systems,Madison,WI)工作站。首先由专业放疗医师参考ICRU 62号报告手动勾画OARs,包括脑、脑干、眼球、晶体、下颌骨、双肺、心脏、脊髓、双肾、膀胱、直肠、股骨头,共12 类17 个OARs。然后使用Pinnacle3TPS的MBS(Model-based Segmentation)功能模块自动勾画上述病例CT 影像中的OARs,该模块采用基于图谱库的方法实现自动勾画。
1.3 基于U-net 的深度卷积神经网络(Convolutional Neural Network,CNN)
U-net 网络由Ronneberger 等[9]提出,对完全卷积神经网络(Fully Convolutional Networks,FCN)进行改进,不同于FCN 的跳层连接方式,U-net 使用跨层连接方式,通过剪裁和复制(crop and copy)方式建立上下文之间的联系,使得分割结果更为精确、影像细节还原性更好。U-net架构适用于医学影像的语义分割,一方面医学图像边界模糊、梯度复杂,需要提取较多的高分辨率信息(浅层特征),另一方面人体内部结构相对固定,分割目标在图像中的分布更规律,语义简单明确,而低分辨率信息(深层特征)能够提供这一信息,U-net 将低分辨率信息和高分辨率信息完美结合在一起,其架构如图1所示。
图1 U-net CNN架构Fig.1 U-net CNN architecture
1.4 基于DL自动勾画OARs
分别选取89例头颈部肿瘤患者数据、596例胸部肿瘤患者数据、185例腹部肿瘤患者数据和96例盆腔肿瘤患者数据作为训练集,用以调整CNN的参数,本研究选取40 例患者数据作为验证集评估模型的性能。所有训练和测试实验均在显存容量11 GB 的NVIDIA GeForce GTX 1080 Ti GPU上运行。
1.5 评价指标
以医生手动勾画的OARs 轮廓体积作为基准真值,采用形状相似性系数(Dice Coefficient,DC)、Jaccard 系数(Jaccard Coefficient,JC)、Hausdorff 距离(HD)、体积差异(Volume Difference,VD)指标定量评估两种自动勾画方法获得的OARs 轮廓体积的精确性。为了确保手动勾画OARs的精确性,每个病例手动勾画完成后均由副主任医师及以上资格的医师修改、审批。
1.5.1 DC
用于评价R与G两个集合之间的重合性,其计算公式为:
其中,R为自动勾画结果;G为手动勾画结果,即真值(ground truth)。其值的范围从0 到1,越接近于1,表示两种勾画方式的重合性越好。
1.5.2 JC
用于度量R、G两个集合之间的相似性,其计算公式为:
其中,0≤JC(R,G)≤1,JC值越大,样本相似度越高。
1.5.3 HD
用来衡量R、G在三维空间上的表面距离,其计算公式为:
1.5.4 VD
指分割结果体积与真值(ground truth)体积差异占真值体积的百分比,越接近0越好:
其中,G为真值,R是自动分割结果。
1.6 统计学分析
采用SPSS 20.0 统计学软件行Wilcoxon 符号秩检验,显著性水平α=0.05,P<0.05 表示差异有统计学意义。
2 结果
表1列出了评估基于Atlas 和DL 方法自动勾画全脑、脑干、晶体、下颌骨、左右肺、膀胱、直肠等OARs 几何精确性的指标。文献[10-11]指出,DC 值大于0.7 表明两个轮廓重复性尚可,分割效果可以接受。从表1中可以看出,除直肠外,采用DL方法勾画的多数OARs 的DC 指标高于0.7,优于Atlas 方法,差异有统计学意义(P<0.05)。此外,DL 方法的JC、HD、VD 普遍优于Atlas 方法,其JC 值除晶体、直肠、脊髓外也都大于0.7。HD中最大的是脊髓,两种方法均超过20 mm。DL 方法中VD 绝对值较大的是直肠。
从图2中可以看出,DL方法自动勾画的OARs与手动勾画真值一致性较好,基本上能为临床所接受。
3 讨论
精确的靶区和OARs 勾画是放射治疗的重要前提之一。通常情况下,放射肿瘤医师在临床工作中OARs 的勾画工作量较大、重复性工作较多,另受放射肿瘤医师主观性以及各自专业水平的限制,难以保证轮廓勾画的一致性。因此,自动勾画已成为目前的研究热点之一,旨在确保勾画精确度的前提下,提高勾画效率、减少不同勾画者间以及勾画者自身的差异。
截至目前,已有多款自动勾画软件应用于放疗临床工作中,这其中主要包括MIM 软件(MIM Software Inc.,Cleveland,OH)、Eclipse 治疗计划系统中 的SmartAdapt 模 块 和Velocity 模 块(Varian Medical Systems,Palo Alto,CA)、ABAS 软件(Atlasbased autosegmentation,Elekta Medical System,Stockholm,Sweden)、RayStation 治疗计划系统中的RayDeformable 模 块(RaySearch Laboratories,Stockholm,Sweden)。这几款软件能够执行3DCT、4DCT、MRI 或PET/CT 等不同模态影像间的形变配准[12-15]。这些方法的共同点是基于图谱库自动勾画,对待分割的目标影像与包含真值的图谱库影像进行形变配准,将后者中的标记结构自动传播到目标图像上。但是,有研究报道不同配准算法存在较大差异。基于特征的深度学习方法可解决此类问题,通过捕获不同算法间的差异并将其纳入预测模型以解决临床工作中可能遇到的问题,国内外许多学者都对此进行探讨[16-22]。
本文研究结果显示,基于DL 的自动勾画结果总体上优于基于Atlas 的自动勾画结果。前者的DC 值除直肠外均大于0.7,显示出较高的精确度。JC 值除晶体、直肠、脊髓外也都大于0.7,可能原因为晶体、脊髓体积较小,而直肠受个体化差异影响大。HD 中,最大的是脊髓,超过20 mm,原因可能是脊髓体积较小而层面数又较多所致。VD 值绝对值较大的是晶体、直肠,可能原因基本同上。
表1 基于Atlas与DL方法自动勾画结果评价指标(±s)Tab.1 Comparison of evaluation parameters between Atlas-and DL-based auto-segmentation results (Mean±SD)
表1 基于Atlas与DL方法自动勾画结果评价指标(±s)Tab.1 Comparison of evaluation parameters between Atlas-and DL-based auto-segmentation results (Mean±SD)
a表示两种自动勾画方法DC值的Wilcoxon检验P值;b表示两种自动勾画方法JC值的Wilcoxon检验P值;c表示两种自动勾画方法HD值的Wilcoxon检验P值;d表示两种自动勾画方法VD值的Wilcoxon检验P值。
危及器官P值全脑脑干左眼右眼左晶体右晶体下颌骨心脏左肺右肺左肾右肾膀胱直肠左股骨头右股骨头脊髓DC Atlas 0.96±0.04 0.67±0.09 0.64±0.12 0.67±0.11 0.43±0.12 0.46±0.17 0.81±0.04 0.73±0.21 0.95±0.03 0.96±0.02 0.81±0.17 0.82±0.12 0.84±0.10 0.51±0.16 0.68±0.20 0.61±0.18 0.75±0.18 DL 0.98±0.00 0.87±0.03 0.89±0.02 0.88±0.02 0.76±0.06 0.74±0.09 0.88±0.02 0.90±0.04 0.95±0.02 0.97±0.01 0.91±0.02 0.88±0.04 0.89±0.07 0.65±0.23 0.83±0.08 0.85±0.07 0.72±0.17 JC Atlas 0.93±0.07 0.51±0.10 0.48±0.13 0.52±0.11 0.28±0.10 0.31±0.13 0.69±0.06 0.61±0.22 0.90±0.05 0.91±0.03 0.71±0.20 0.71±0.16 0.74±0.13 0.36±0.15 0.55±0.23 0.47±0.20 0.62±0.21 DL 0.96±0.01 0.76±0.05 0.79±0.03 0.78±0.03 0.62±0.07 0.59±0.11 0.78±0.03 0.81±0.06 0.91±0.03 0.93±0.02 0.83±0.03 0.79±0.05 0.81±0.10 0.51±0.21 0.72±0.11 0.75±0.10 0.59±0.19 HD/mm Atlas 5.69±1.98 7.89±1.05 4.11±1.46 3.78±1.19 2.39±0.46 2.55±1.21 17.23±6.34 16.03±10.53 18.93±13.90 14.38±6.01 7.42±6.41 6.65±3.37 11.70±5.46 19.80±7.63 14.19±8.78 14.76±6.74 24.10±17.41 DL 4.26±0.74 4.36±1.08 2.70±0.55 2.81±0.64 1.81±0.39 2.25±0.93 5.10±2.59 10.06±8.62 12.94±14.93 8.64±4.47 3.87±1.17 4.54±1.06 7.79±5.89 14.00±6.87 6.93±7.93 6.23±7.243 21.50±22.78 VD Atlas 0.00±0.10 0.27±0.23-0.54±0.28-0.59±0.25-0.49±0.31-0.37±0.50-0.02±0.15-0.22±0.31 0.03±0.08 0.04±0.05 0.03±0.19 0.15±0.19 0.12±0.24 0.34±0.29 0.26±0.24 0.31±0.35 0.27±0.46 DL-0.01±0.01-0.07±0.09-0.01±0.08-0.03±0.10 0.02±0.25 0.12±0.30-0.17±0.06 0.16±0.08-0.05±0.05-0.04±0.03-0.07±0.06-0.08±0.11 0.01±0.12-0.29±0.40-0.01±0.20-0.05±0.21 0.18±0.48 0.172a,0.173b,0.022c,0.074d 0.005a,0.005b,0.005c,0.007d 0.008a,0.008b,0.008c,0.008d 0.008a,0.008b,0.051c,0.008d 0.028a,0.028b,0.027c,0.028d 0.012a,0.012b,0.484c,0.069d 0.007a,0.007b,0.005c,0.037d 0.001a,0.001b,0.030c,0.001d 0.309a,0.309b,0.001c,0.001d 0.047a,0.049b,0.007c,0.001d 0.015a,0.015b,0.003c,0.049d 0.177a,0.201b,0.039c,0.003d 0.011a,0.011b,0.019c,0.209d 0.034a,0.012b,0.041c,0.005d 0.033a,0.046b,0.009c,0.009d 0.004a,0.004b,0.002c,0.002d 0.029a,0.019b,0.163c,0.000d
图2 基于DL方法自动勾画OARs结果示意图(绿色线条为手动勾画轮廓,红色线条为自动勾画轮廓)Fig.2 DL-based automatic segmentation results(the green lines were manual segmentations,and the red lines were automatic segmentations)
尽管在设计治疗计划之前仍需对基于DL 方法自动勾画的OARs进行修改,但已在很大程度上减少了放射肿瘤医师的工作量。下一步,通过继续增大训练集的数据量从而包括更多的肿瘤患者特征,有望进一步提高基于DL 方法模型的鲁棒性,从而更好地辅助放射肿瘤医师,使肿瘤患者获益。