小样本训练模型在宫颈癌放疗中自动勾画可行性研究
2021-11-30陈飞胡静戴春华游涛耿长冉汤晓斌
陈飞,胡静,戴春华,游涛,耿长冉,汤晓斌
1. 南京航空航天大学 核科学与技术系,江苏 南京 210000;2. 江苏大学附属医院 放疗科,江苏 镇江 212000
引言
宫颈癌是全球女性常见的恶性肿瘤,放射治疗是宫颈癌的主要治疗方式之一[1-2]。在目前精准放疗时代,肿瘤靶区及危及器官(Organs at Risk,OARs)勾画的准确性显得尤为重要[3-4]。临床上认为手动勾画靶区及OARs是金标准,但这是一个费时费力的过程。有研究表明宫颈癌患者的OARs勾画时间约2 h,而且不同临床医师勾画结果可能因为经验及理解不同而存在较大差异,这大大影响了患者放疗的准确性[4-6]。近年来,基于深度学习自动勾画的研究备受关注,并在前列腺癌、肺癌等部位取得很大进展,降低了放疗医师工作负荷以及勾画差异性[7-9]。深度学习算法模型已逐渐应用于临床,在实际使用过程中,常会发现通用的深度学习算法模型自动勾画效果不符合医院的具体勾画习惯而影响临床的应用[10]。
AccuLearning是由Manteia公司研发的一款深度学习自主训练平台,对各医院提供自动勾画算法模型定制,从而加大深度学习模型的实用性,推荐训练最小病例数量30例。目前关于小样本算法定制可行性的相关报道较少,本研究基于此,使用我院30例的宫颈癌患者数据在AccuLearning平台中进行算法模型训练,并对生成的算法模型进行测试分析,讨论其对于宫颈癌临床靶区(Clinical Target Volume,CTV)及OARs算法定制的可行性,以期得到AccuLearning软件算法定制应用于临床实践的依据。
1 材料与方法
1.1 AccuLearning和AccuContour软件
AccuLearning是基于深度学习进行医学影像分割的训练平台,能够完成小样本勾画算法模型训练。在深度学习训练的过程中,通过数据驱动来更新模型的参数,从而实现自动提取特征,能够比传统图像处理算法达到更优的效果。AccuLearning提供了从数据输入到模型部署的完整流程,方便用户可以在训练完成后直接在工作流程中使用,整体过程如下:数据集创建,模型训练,模型评估以及模型应用。训练好的自动勾画算法模型能够以加密过的二进制文件导入到AccuContour软件平台上,AccuContour能够结合新算法模型来执行自动勾画功能,并输出相应的勾画结构。
AccuLearning采取的网络模型为自适应的网络结构构建策略,根据训练集中每个病例的体素间距和各个ROI的体积,自动选取合适的采样窗口大小,生成类似于2D-UNet结构的自动分割网络。该网络默认包含5个最大池化层和5个上采样层,基础的卷积核通道数为32,尺寸为3×3,在每个卷积层后面都有批标准化层和线性整流函数,在编码器和解码器之间以级联的方式进行跃层连接,将高分辨率的细节信息和深层次的图像语义信息进行结合,提升勾画模型的效果。
1.2 临床资料
选取2020年1月至10月江苏大学附属医院收治的45例宫颈癌患者为研究对象,年龄37~79岁(中位值55岁),根治性放疗患者18例,术后辅助性放疗患者27例。患者定位均采用仰卧位真空垫固定,使用飞利浦大孔径CT(Brilliance CT big bore)进行扫描,扫描层厚3 mm,层间距3 mm。
1.3 实验方法
将扫描获取的45例CT图像通过DICOM传输至Eclipse 13.6治疗计划系统,由一名有经验的放疗医师手动勾画CTV和OARs,其中OARs包括:骨髓、右侧股骨头、左侧股骨头、肠袋、直肠、膀胱,并定义为参考轮廓勾画(Vreference,Vr)。各结构勾画原则如下:CTV勾画参照RTOG宫颈癌临床靶区勾画标准;骨髓勾画包括髂骨、骶骨、耻骨、坐骨;两侧股骨头包括股骨头及股骨颈;肠袋勾画包括从乙状结肠往上至CTV上1.5 cm的肠管;直肠由肛管口勾画至直肠乙状结肠交界处;膀胱勾画需包括膀胱外壁。所有勾画轮廓均由两位有着20年以上工作经验的主任医师审核并修改确认。
随机抽取30例患者作为训练集,将CT图像及结构文件导出,应用AcceLearning软件深度学习形成勾画算法模型。训练好的算法模型手动导入至AccuContour软件平台,并将余下15例患者CT作为测试集传至AccuContour平台,应用训练好的算法模型对其相应结构进行自动勾画,定义为自动轮廓勾画(Vautomatic,Va),勾画完成后将结构文件传回Eclipse计划系统,获取相关参数分析。
1.4 评价参数
以医师手动勾画的靶区及OARs轮廓作为金标准,通过以下指标评估自动勾画与手动勾画的吻合度,其中Va和Vr分别表示自动勾画和手工勾画的结构体积,Va∩Vr是自动勾画与手动勾画结构重叠的体积。
1.4.1 相似性系数和敏感性指数
相似性系数(Dice Similarity Coefficient,DSC)和敏感性指数(Sensitive Index,SI)是形态学吻合度评价指标,可利用其评价自动勾画结构与手动勾画的重合一致性,DSC和SI值介于0~1之间,当DSC和SI趋近于1时,代表两者具有较好的重合性。DSC和SI的计算公式如式(1)~ (2)。
1.4.2 位置偏差
质心偏差(Deviation of Centroid,DC)可通过记录手动勾画与自动勾画的各结构几何中心在三维坐标轴上的差异(△x,△y,△z)计算得到,其能较直观地反映手动勾画与自动勾画结构的位置关系。DC的计算公式如式(3)所示。
1.4.3 体积差异系数
体积差异系数(Deviation of Volume,DV)表示手动勾画与自动勾画的体积差异占手动勾画的比例,用于评价自动勾画的容积稳定性,结果以其绝对值的百分比表示。DV的计算公式如式(4)所示。
2 结果
采用箱式图显示了15例测试集各个勾画轮廓三维方向的偏差(图1)。CTV位置偏差有一例z方向异常较大的患者,高达1.03 cm(DSC=0.83),其余患者在x、y、z三个方向的误差都分别小于1.3、3.6、3.8 mm;对于骨髓、右侧股骨头以及左侧股骨头,自动勾画和手动勾画的位置偏差均小于3 mm,偏移距离小于3 mm的扫描层厚;图1中肠袋位置偏差在x、y方向偏差小于3 mm,z方向偏差较大,最大偏差达到8.7 mm;直肠位置偏差在x、y方向偏差小于2 mm,z方向偏差小于3.3 mm;膀胱位置偏差发现大多数患者位置偏差都小于5 mm,有一例患者在y、z方向偏差异常较大,△y=-0.9 cm、△z=-0.53 cm,而且此例患者膀胱DSC值仅为0.58。
图1 自动和手动两种勾画方式在x、y、z方向的位置偏差
研究中发现,测试集中有一例CTV以及一例膀胱自动勾画位置偏差数据较为异常,通过患者CT图像(图2)推断:CTV数据异常者为45例患者中唯一1例宫颈癌阴道及外阴侵犯患者,其CTV结构异于训练集中CTV;膀胱勾画异常者是因为此患者行过左侧输尿管吻合术加左侧输尿管支架置入术,CT可见膀胱内高密度显影,干扰了膀胱的自动勾画,所以在其他评价指标分析中,均排除了该异常数据。
图2 CTV及膀胱数据异常患者CT图
表1展示了各结构自动勾画轮廓的评价参数。结果显示:CTV的DSC达到了0.86,OARs中骨髓、双侧股骨头的DSC均≥0.93,肠袋和直肠约0.90左右;CTV的SI值为0.87,其余结构的SI值均≥0.90;CTV和肠袋DC均值在3~6 mm,其余的均小于3 mm;关于DV均值,最小的是骨髓3.86%,最大的是肠袋12.32%。
表1 各结构自动勾画轮廓的评价参数[(±s),(最小值~最大值)]
表1 各结构自动勾画轮廓的评价参数[(±s),(最小值~最大值)]
结构 病例数 DSC SI DC/ mm DV/%CTV 14 0.86±0.01 (0.85~0.88) 0.87±0.03 (0.80~0.90) 3.27±1.01 (1.97~4.53) 6.70±3.74 (2.72~13.75)骨髓 15 0.93±0.01 (0.91~0.94) 0.95±0.01 (0.93~0.97) 1.01±0.41 (0.33~1.79) 3.86±2.63 (0.04~7.50)右侧股骨头 15 0.94±0.02 (0.91~0.97) 0.97±0.01 (0.94~0.98) 1.67±0.98 (0.37~3.14) 6.19±5.01 (1.03~16.11)左侧股骨头 15 0.93±0.01 (0.91~0.94) 0.97±0.01 (0.96~0.98) 2.00±0.81 (0.91~3.37) 8.02±4.21 (4.47~16.59)肠袋 15 0.90±0.02 (0.87~0.93) 0.95±0.03 (0.87~0.97) 5.27±2.46 (1.97~9.12) 12.32±5.92 (3.40~18.54)直肠 15 0.89±0.02 (0.85~0.92) 0.92±0.02 (0.89~0.97) 2.05±1.03 (0.73~3.48) 6.26±6.33 (0.14~19.90)膀胱 14 0.93±0.03 (0.86~0.96) 0.90±0.06 (0.79~0.98) 2.30±2.06 (0.62~5.73) 7.29±4.63 (3.20~17.31)
图3展示了本实验中CTV和OARs勾画断层效果图,由图3可看出自动勾画的结构轮廓与临床医师勾画的相似重合度高。表2总结了近几年具有代表性的盆腔肿瘤深度学习自动勾画的数据,并将其DSC值与本研究进行了比较与分析[4,11-14],发现本实验DSC均值与其他文献十分接近甚至优于个别文献中的结果。
表2 该研究DSC结果与其他文献结果对比(均值)
图3 各勾画结构CT断层示例
3 讨论
已有研究表明,基于深度学习的自动勾画优于基于图谱库的自动勾画[15-16]。随着人工智能深度学习技术的发展,基于不同方式的深度学习自动勾画成为了放疗领域的研究热点[17-20]。尽管基于深度学习的自动勾画模型在放疗领域取得了很大的成果,但由于高质量医疗数据的稀缺性、私密性,以及不同数据源之间的标准不同的原因,导致通用模型无法持续应对放疗领域日益发展的自动勾画需求。Manteia公司提出深度学习和传统算法结合的方法,应用AccuLearning软件进行小样本数据深度学习模型训练,生成的模型可导入AccuContour软件进行自动勾画,其中为了进一步提高模型的输出精度,AccuContour软件在模型应用部署时会结合传统算法对部分勾画轮廓使用后处理技术,以及在部分传统算法能达到高精度的器官上,直接采用传统算法进行勾画,以达到最佳的勾画精度。
研究结果显示,宫颈癌临床靶区及OARs的自动勾画与手动勾画有着较高的相似度。DSC是评价自动勾画精度的重要指标,而且Zou等[21]认为DCS大于0.7表示自动勾画与手动勾画相似性较高。本研究各勾画轮廓DSC均值都大于0.85,表现出较高的相似性。其中骨髓,两侧股骨头以及膀胱的DCS值高达0.93左右,这可能是因为这些OARs边界清晰且其与周围组织对比度高,此外SI值为0.87~0.97,也表明较高的重合性。DC是通过质心的偏差来衡量自动勾画轮廓偏移程度一项参数,骨髓,两侧股骨头,直肠以及膀胱的DC平均值均小于3 mm,不足CT扫描一层的厚度,体现了很好的轮廓重合性,与DSC以及SI结果相同。CTV以及肠袋的DV均值稍微大点,CTV质心偏移主要集中在y和z方向。回顾性分析CT图像可知y方向的偏移可能是因为患者膀胱充盈程度不同以及肠道位置的变化,导致了CTV前界的变化;z方向的偏移主要是因为每例患者结构性的差异,研究自动勾画轮廓发现靶区上界定位较差,这可能跟不同的患者主动脉分叉位置不同有关;而且此次实验定义肠袋上界为CTV上1.5 cm,因为CTV上界的个体差异,从而导致肠袋上界的不确定,这也可能增加了肠袋z方向的质心偏移。所有勾画结构中DV最大均值为12%左右,说明自动勾画体积与手动勾画差别小。这几项评价参数都说明了小样本自主训练算法模型的自动勾画具有很高的稳定性,经临床医师审核修改后可应用于临床。
为了更直观地表现本研究自动勾画的效果,表2将本实验结果与其他文献结果做了对比,由于各个文献所选的OARs不是完全相同,因此只概括了与本研究具有相同轮廓的数据。可能因数据量、CT图像质量、轮廓勾画原则等因素的影响,这样比较不能说明该实验结果优劣于其他实验,但是可以发现小样本数据训练算法模型的自动勾画效果是理想的,宫颈癌患者小样本数据训练模型能被应用于临床,从而提高放疗质量以及效率。
此外在该实验中,测试集中出现了特异性较大的勾画结构,这可能是因为小样本训练模型数据量较小,从而导致模型过拟合,泛化能力减弱,因此在数据收集过程中,应尽量增加训练数据的多样性,来提升深度学习模型的精度以及泛化性能。而且放疗医师在自动勾画完成后,仍需认真检查每个自动勾画轮廓,排除特例的存在,因人而异的去做必要的修改。
4 结论
综上所述,AccuLearning平台的小样本自主训练模型对于绝大部分宫颈癌临床靶区以及OARs勾画取得了满意的效果,能较好地解决医院勾画习惯不同的问题,证明了宫颈癌小样本训练模型定制的可行性,对于临床应用有着较大的价值。但是对于CTV,自动勾画轮廓仍有部分层面效果较差,因此在今后研究中,可考虑适当增加样本数量以及多样性,通过对比模型中自动勾画与手动勾画的差异性,对深度学习网络模型中引入一些标签,比如是否手术,临床分期等,进一步提高AccuLearning平台的小样本训练模型精度。