APP下载

基于深度学习的直肠癌放疗危及器官自动勾画的几何学和剂量学评估

2022-04-29郭红博王佳舟胡伟刚

辐射研究与辐射工艺学报 2022年2期
关键词:剂量学勾画手动

郭红博 王佳舟 杨 翠 夏 祥 胡伟刚

(复旦大学附属肿瘤医院放射治疗中心 复旦大学上海医学院肿瘤学系 上海市放射肿瘤学重点实验室 上海 200032)

在放射治疗中,危及器官(Organs at risk,OARs)勾画是一项至关重要的工作,因为这将直接影响计划优化的结果,进而影响肿瘤的局部控制率和正常组织并发症概率[1‐3],然而,OARs 手动勾画十分耗时且枯燥。近几年,自动勾画方法已在临床获得应用,基于深度学习的自动勾画相较于其他方法具有明显优势,已成为OARs自动勾画的主流方法[4‐6]。当前对于自动勾画的评估,主要基于几何相似性指标。OARs自动勾画将直接影响计划优化,评估其剂量学影响具有重要的临床意义[7‐8]。本研究从几何学和剂量学两个方面评估将自动勾画的OARs 应用于临床计划设计的可行性,以期为临床应用提供参考。

1 材料与方法

1.1 病例选择

选取2018 年1 月至2020 年11 月在复旦大学附属肿瘤医院接受放射治疗的直肠癌患者35 例,入组病例符合我院伦理委员会要求。所有患者采用仰卧位完成CT 扫描,扫描层厚5 mm,定位前1 h排空膀胱。男性23例,女性12例,年龄33~78岁,中位年龄60 岁,病例类型均为中低分化腺癌。由低年资医师完成计划靶区(Planning target volume,PTV)和OARs的初步勾画,高年资医师审核修改。PTV处方剂量为50 Gy,每次2 Gy,每周治疗5 次。OARs 包括左股骨头、右股骨头、膀胱、小肠。

1.2 OARs自动勾画

OARs的自动勾画在复旦大学附属肿瘤医院放射治疗中心自主开发的深度学习系统上进行,该系统采用改进的U‐Net 结构,可以完成直肠癌OARs 的自动勾画。图1 为网络架构示意图,主要包括压缩路径的向下采样和扩展路径的向上采样。上采样阶段与下采样阶段对应的两个卷积层之间连接,下采样层提取的特征可以直接传递到上采样层,这样使图像特征更加丰富,定位精度更高。网络结构和训练测试的细节信息已在前期的研究中做了详尽介绍[9‐12]。

图1 自动勾画系统的网络架构示意图Fig.1 Network architecture schematic diagram of the automatic delineation system

1.3 计划设计

基于美国瓦里安公司Trilogy 直线加速器,该加速器配备60 对多叶光栅,最大射野范围40 cm×40 cm。采用荷兰飞利浦公司Pinnacle39.10 计划系统,6 MV 光子束,7 野静态调强完成计划设计。每个病人有两个计划,第一个计划为实际的临床治疗计划,该计划基于临床医生手动勾画的PTV和OARs 完成,已由临床医生审核并用于病人治疗,记为Plan_Treat;第二个计划为重新设计的计划,基于医生手动勾画的PTV和自动勾画的OARs完成,记为Plan_FD。为尽可能减小物理师操作习惯对结果的影响,Plan_FD 与Plan_Treat 均由同一物理师完成。Plan_FD的初始射野参数和优化目标函数与Plan_Treat保持一致。所有计划采用PTV平均剂量归一法,将PTV 平均剂量的96%归一到处方剂量。

1.4 几何学评估

以医生手动勾画的OARs作为参考,采用以下4个几何学指标评估自动勾画的准确性:戴斯相似系数(Dice similarity coefficient, DSC)、雅卡尔相似系数(Jaccard similarity coefficient, JSC)、豪斯多夫距离(Hausdorff distance, HD)和平均一 致 性 距 离(mean distance to agreement,MDA)[13‐15]。DSC(变量记为DSC)和JSC(变量记为JSC)可以很好地评估自动勾画与手动勾画的整体匹配性,HD(变量记为HD)和MDA(变量记为MDA)则对自动勾画与手动勾画的边缘匹配特性较为敏感。其定义见式(1)~(6)。

式中:A表示自动勾画的区域;B表示医生手动勾画的区域;|A∩B|表示A和B的交集;|A∪B|表示A和B的并集;|A|表示A的绝对体积;|B|表示B的绝对体积。DSC和JSC值的范围是[0,1],数值越大表示自动勾画结果越理想,0 表示没有交集,1表示完全重合。

式中:d(a,b)表示点a与点b的三维豪斯多夫距离;HD值的范围是[0,+∞),数值越接近于0,表示自动勾画结果越理想,0表示完全重合。

式中:h表示平均三维豪斯多夫距离;MDA值的范围是[0,+∞),数值越接近于0,表示自动勾画结果越理想,0表示完全重合。

1.5 剂量学评估

PTV和OARs的剂量学评估参考国际辐射单位与测量委员会(ICRU)第83 号报告的建议[16]。PTV的剂量学评价参数包括D98、D95、D2、V50、HI和CI[17]。OARs的剂量学评价参数包括股骨头V20、V30、Dmean;膀 胱V30、V40、Dmean;小 肠V30、V40、Dmean。考虑到PTV和OARs的剂量体积参数并不能全面反映计划的剂量分布,尤其是在远离靶区的低剂量区域。为全面比较Plan_FD 与Plan_Treat 在三维空间的剂量分布,采用美国Sun Nuclear 公司的SunPatient软件进行了三维γ剂量分析。

1.6 统计学分析

2 结果

2.1 几何学评估

图2为自动勾画的几何学评估结果,DSC为评估自动勾画与手动勾画交叠区域大小的常用指标,一般认为DSC>0.7为较好的勾画结果[18]。本研究中自动勾画的OARs 均满足此标准,包括膀胱(0.84±0.14)、左股骨头(0.88±0.08)、右股骨头(0.87±0.08)、小肠(0.80±0.11)。MDA 主要评估自动勾画与手动勾画的边缘匹配特性,MDA平均值不足2.8 mm,分别为膀胱(2.58±1.50) mm、左股 骨 头(2.34±1.64) mm、 右 股 骨 头(2.50±1.40) mm、小肠(3.70±1.08) mm。此结果表明,自动勾画与手动勾画的OARs不仅在三维空间上体积高度重叠,且在边缘细节上匹配度良好。

图2 自动勾画的几何学评估结果:(a)戴斯相似系数;(b)豪斯多夫距离;(c)雅卡尔相似系数;(d)平均一致性距离Fig.2 Geometric evaluation results for automatic delineation:(a)dice similarity coefficient(DSC);(b)hausdorff distance(HD);(c)jaccard similarity coefficient(JSC);(d)mean distance to agreement(MDA)

2.2 剂量学评估

表1 和表2 分别为PTV 和OARs 的剂量学统计结果。统计分析发现,Plan_FD 与Plan_Treat 的PTV 剂量体积参数、CI 及HI 差异均无统计学意义(p>0.05)。Plan_FD 与Plan_Treat 的左股骨头、右股骨头、小肠的剂量体积参数差异均无统计学意义(p>0.05)。膀胱剂量体积参数V30、V40、Dmean均有显著统计学差异(p<0.05),这可能是因为不同病例PTV 和膀胱有不同程度的交叠,而交叠区域的勾画差异会对剂量分布产生重要影响。为进一步评估交叠区域对剂量的影响,对本研究的35 例入组病例,逐个统计了膀胱与靶区交叠区域所占膀胱总体积的百分比(记为Vt),最大为67%,最小为5%,中位数为34%。据此,我们将病例分为G1、G2 两组,G1 组Vt≤34%,G2 组Vt>34%。按照以上分组,对Plan_Treat 与Plan_FD 的膀胱剂量进行配对t检验,结果列于表3。G2 组Plan_Treat与Plan_FD 的膀胱V30差异具有统计学意义(p<0.05),G1 组膀胱V30差异无统计学意义(p>0.05)。

表1 PTV剂量学统计结果Table 1 PTV dosimetry statistics (± s)

表1 PTV剂量学统计结果Table 1 PTV dosimetry statistics (± s)

项目Item PTV D98/cGy计划类别Plan type数值Value t值t value p值p value 0.26 5 009±41 4 993±52 5 050±34 5 050±33 5 333±54 5 354±48 97.43±1.50 96.69±1.93 0.89±0.02 0.89±0.02 0.05±0.01 0.05±0.01 0.05 0.23 D95/cGy 0.96 D2/cGy 0.25 0.17 V50/%-0.26 0.12 CI 1.93 0.06 HI Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD-1.33 0.09

表2 OARs剂量学统计结果Table 2 OARs dosimetry statistics (± s)

表2 OARs剂量学统计结果Table 2 OARs dosimetry statistics (± s)

项目Item计划类别Plan type剂量/体积Dose/Volume t值t value p值p value膀胱Bladder V30/%-3.03 0.01 V40/%-3.07 0.01 Dmean/cGy Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD 67.76±26.23 70.03±25.86 44.05±23.72 47.07±24.92 3 569±980 3 633±984-3.45 0.01左股骨头Left femoral head V20/%-1.26 0.22 V30/%-2.17 0.14 Dmean/cGy Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD 54.83±19.62 56.65±22.77 15.75±9.75 18.33±11.79 2 160±544 2 212±607-0.85 0.41

表3 膀胱分组剂量学统计检验结果Table 3 Bladder dosimetry statistical test in groups (± s)

表3 膀胱分组剂量学统计检验结果Table 3 Bladder dosimetry statistical test in groups (± s)

组别Groups G1 t值t value 0.30 p值p value 0.77剂量/体积Dose/Volume V30/%V30/%V40/%V40/%Dmean/cGy Dmean/cGy V30/%V30/%V40/%V40/%Dmean/cGy Dmean/cGy计划类别Plan type Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD-2.55 0.02-2.44 0.03 G2-3.76 0-2.85 0.01-3.66 0

续表

2.3 三维γ分析

图3显示了1例患者三维γ剂量分析结果,图3(a)和3(b)清晰直观地显示了Plan_Treat 和Plan_FD的三维剂量分布,直观来看,二者差异不大。图3(c)为采用3 mm/3%标准的三维γ分析结果,图中显示了γ>1.0 的点,在这些点Plan_Treat和Plan_FD 差异较大。图3(d)采用柱状图对Plan_Treat 和Plan_FD 全部有效剂量点的剂量差异进行了统计。所有35 例病例在5 mm/5%、3 mm/3%、3 mm/2%、2 mm/3%、2 mm/2%标准下,γ≤1.0 的点占全部有效剂量点的百分比分别为(97.73±2.09)% 、(91.63±6.27)% 、(87.72±8.49)%、(88.55±8.80)%、(83.13±10.28)%。

图3 1例代表性病例的三维γ剂量分析结果:(a)Plan_Treat的三维剂量分布;(b)Plan_FD的三维剂量分布;(c)在3 mm/3%标准下γ>1.0的点,红色区域为剂量热点,蓝色区域为剂量冷点;(d)剂量偏差统计;彩色见网络版Fig.3 3D γ dose analysis results for a representative case:(a)3D dose distribution of Plan_Treat;(b)3D dose distribution of Plan_FD;(c)points with γ>1.0 at 3 mm/3%standard,red area is dose hot spot,blue area is dose cold spot;(d)dose deviation statistics;color online

3 讨论

本研究从几何学和剂量学两个方面评估了我们中心自主开发的深度学习系统进行直肠癌OARs自动勾画并应用于临床计划设计的可行性。结果显示,自动勾画与手动勾画的OARs具有较高的几何相似度,具有应用于临床计划设计的潜力。

基于几何学指标的定量评估是自动勾画最直接、最常用的评估方法。Song等[19]基于几何学指标评估了两种卷积神经网络DeepLabv3+和ResUNet 对直肠癌CTV 和OARs 的勾画,发现DeepLabv3+的表现更好,DeepLabv3+和ResUNet的CTV 几 何 学 指 标DSC分 别 为(0.88±0.02)和(0.87±0.02),但未对几何学指标的提升对剂量学影响进行探讨。几何学指标是评估自动勾画算法的关键性指标,使用高质量且一致性好的训练和验证数据集,可以对算法性能进行量化和比较。自动勾画的临床评估应基于临床实用目的,相比于几何评估可能要复杂的多。几何指标的小幅改善(例如DSC增加0.05)可能代表了算法的实质性进步,但其实际临床意义可能相当有限。更为合理的评估方法应是尽可能模拟临床流程,该原则也与其他研究提出的基于任务的评估程序一致[20‐21]。

OARs自动勾画的最终目标是可以直接应用于临床计划设计,提升临床工作效率。然而,当前对于自动勾画的OARs对放疗剂量学影响的相关研究还较少,van Dijk等[5]直接采用临床治疗计划评估了自动勾画与手动勾画的OARs剂量差异,发现基于深度学习的自动勾画相较于基于图谱的自动勾画几何相似度更高,剂量差异更小。Kaderka等[22]基于几何学指标和剂量学指标进行心脏亚结构自动勾画的评估,并分析二者的相关性,发现几何指标不能预测剂量参数的准确性,自动勾画的质量不能仅由几何学评估指标确定。上述研究都是采用基于医生手动勾画的PTV和OARs优化得到的治疗计划,评估手动勾画和自动勾画的OARs的剂量学差异。因为不同OARs的勾画会对计划剂量分布产生重要影响,因此上述研究方法尚有可改进之处。本研究基于自动勾画的OARs重新优化放疗计划,并与原始的临床治疗计划进行比较,发现仅有膀胱剂量差异具有统计学意义,这可能是因为不同病例PTV 和膀胱边缘有不同程度的交叠,而交叠区域的勾画差异会对剂量分布产生重要影响。进一步的研究发现,膀胱与靶区交叠越多,重新优化的放疗计划与原始临床治疗计划之间膀胱剂量差异越显著。考虑到PTV和OARs的剂量体积参数并不能完整反映计划的剂量分布,为全面评估自动勾画的OARs对剂量分布的影响,进行了三维γ 剂量分析。在3 mm/3%的标准下,γ≤1.0的点占比已达(91.63±6.27)%,表明在现有的勾画精度下,自动勾画的OARs对剂量分布的影响并不显著,具有直接应用于临床计划设计的潜力。

本研究存在一定的局限性,所有训练测试数据均来自作者单位,而这些数据并非标准数据集,自动勾画的结果也更符合本单位医生的勾画习惯,其可推广性有待评估。

综上所述,基于深度学习方法自动勾画与医生手动勾画的OARs具有较高的几何相似度,自动勾画的OARs对剂量分布的影响并不显著,具有直接应用于临床计划设计的潜力。这对减轻医生临床工作压力和提升临床工作效率意义重大。

作者贡献说明 郭红博负责数据采集和论文撰写;王佳舟负责研究思路设计;杨翠、夏祥协助完成实验及数据分析;胡伟刚指导论文修改。全体作者都阅读并同意最终的文本。

猜你喜欢

剂量学勾画手动
邵焜琨:勾画环保产业新生态
ICRU95号报告:外照射实用量及其对剂量学的影响
小巧手动起来
风行S5001.6L手动尊享型
宝骏5601.8L手动豪华型
C4世嘉 1.6L手动豪华型
找一找
乳腺癌改良根治术后胸壁放疗临床剂量学研究进展
我国反腐败立法路线图如何勾画
鼻咽癌三维适型调强放疗靶区勾画的研究进展