提高放疗影像自动分割几何与剂量参数关联的便捷方法
2022-12-06李婷婷曹安宁张建英马秀瑞张玉洁
【作 者】 李婷婷,曹安宁,张建英,马秀瑞,张玉洁
复旦大学附属中山医院 放疗科,上海市,200032
0 引言
组织勾画是放射治疗过程中的一个重要环节,其准确性直接影响计划质量和剂量评估[1-2]。传统的组织勾画由人工完成,一般由医师或者剂量师在放疗影像上手动勾画感兴趣区域(region of interest,ROI)。该方法非常耗时,故自动勾画应运而生。自动勾画是由计算机根据放疗影像,自动分割出放疗中所需要的感兴趣区域。近二十年,随着形变配准算法和神经网络算法的快速发展,医学影像的自动分割也飞速发展,越来越多的研究者提出了新的自动分割模型[3-4],评估这些模型的优劣成为重要任务[5]。
放疗影像自动分割的评估一般使用几何学参数,最常见的评估指标为Dice相似性系数(dice similarity coefficient,DSC)、Hausdorff 距离(Hausdorff distance,HD)等,这些指标能够有效评估图像分割的几何形态特征[5]。但是在放射治疗过程中,剂量才是与疗效及毒副反应直接相关的重要因素[2]。诸多研究表明,剂量学参数(特别是剂量最大值)与常用的几何学参数之间没有定量关联,几何参数往往不能体现勾画组织的剂量特征[6-8]。尤其在胃肠自动勾画的研究中,几何学参数与其他结构相比,DSC普遍低于0.8[9];胃肠放疗毒性发生率与最大剂量有关[8],其最大剂量的区域集中在与靶区临近的位置。
针对这个问题,本研究引入危及器官(organs at risk,OAR)和计划靶区(planning target volume,PTV)的位置关系,设计了一组基于DSC的新几何评估参数,并研究了这组几何参数与剂量参数之间的关联性,为临床使用几何参数评估自动勾画提供了新的方法。
1 材料与方法
本研究已通过复旦大学附属中山医院伦理批准,所有影像和计划数据的获取均符合本院伦理要求。
1.1 病例信息和影像采集
选取病例48例,均为2019—2021年在本放疗中心接受放射治疗的上腹部病例,病例信息统计,包括危及器官和肿瘤部位如表1所示。
表1 病例信息统计Tab.1 Information of cases
所有勾画均在定位CT上实施,CT图像由西门子(Siemens Healthcare,Forchheim,Germany)大孔径CT采集,图像分辨率为0.977 mm×0.977 mm×3 mm,单层网格数为512×512。采集所得影像以DICOM格式传输给放疗计划系统和自动勾画软件。
1.2 图像分割方法
为了评估上腹部OAR勾画的几何学与剂量学关系,我们对所有病例的胃和十二指肠进行了手动勾画和自动勾画。部分病例因手术或者肿瘤位置的原因,影像中没有胃或十二指肠,这种情况下只勾画影像中存在的OAR。OAR的手动勾画由一位工作经验五年以上的剂量师完成,以此作为评估自动勾画的金标准。OAR自动勾画在Manteia(中国)公司开发的AccuContour 3.0软件上完成,该软件的分割算法基于深度学习。此外,临床计划中使用的PTV由放疗医师勾画,其他OAR由剂量师勾画。
1.3 引入PTV与OAR位置关系的新几何参数
本研究利用PTV与OAR的位置关系,设计了一组新的几何学评估参数。参数基于DSC,用于评估OAR和PTV外扩的重叠区域。这组参数的具体实现如下(见图1):首先将PTV外扩,得到PTV的3个计划危及体积(planning organs at risk volume,PRV),分别为PRV_5 mm,PRV_10 mm和PRV_20 mm;其次,分别得到手动勾画和自动勾画的OAR与3个PRV外扩的重叠部分,记为Manual/Auto_OAR∩PRV_5 mm/PRV_10 mm/PRV_20 mm;最后,分别计算手动勾画的4个重叠区域和自动勾画的4个重叠区域之间的DSC,公式DSC=(Vmanual_and_auto×2)/(Vmanual+Vauto),其中Vmanual_and_auto是手动和自动勾画重叠的体积,Vmanual是手动勾画体积,Vauto是自动勾画体积。这一组DSC即为本工作中新设计的几何评估参数,在后文中简称重叠DSC。
1.4 计划设计和剂量参数
所有计划均为临床计划,在Monaco(Elekta Sweden,5.11)中完成优化,处方剂量范围为30~60Gy。剂量文件以DICOM 格式导出至Accu Contour3.0中,用于评估OAR剂量。经评估分别得到手动和自动勾画的最大剂量和平均剂量,并计算差值作为剂量参数,计算式为Dose(difference)=Dose(manual)-Dose(auto)。
2 结果
2.1 OAR及其与PTV外扩重叠DSC的统计
图2绘制了OAR重叠DSC分布的箱线图,其中DSC为每个评估对象自动勾画和手动勾画之间的DSC。箱体对应25%~75%,上下限值范围线对应5%~95%,“×”对应最小值和最大值。水平方向标签分别为:OAR为危及器官本身,即胃和十二指肠;PRV5为危及器官与PTV_PRV 5 mm的重叠;PRV10为危及器官与PTV_PRV 10 mm的重叠;PRV20为危及器官与PTV_PRV 20 mm的重叠。
胃和十二指肠的DSC范围分别为0.5 6~0.98和0.22~0.97;胃和十二指肠重叠DSC的范围均近似为0~1。相比于OAR本身,其与PTV外扩重叠结构的DSC分布更广,重叠DSC的25%~75%范围大约为OAR本身DSC的2~3倍。由此可见,重叠DSC对自动与手动勾画一致性的区分能力更强。
2.2 重叠DSC与剂量参数的关系
我们统计了重叠DSC与剂量参数的关系,结果如图3所示。如果自动与手动勾画的OAR与PTV或PTV外扩均没有重叠,则相关数据不显示在图3中。图3(a1)~(a3)对应的是剂量最大值差异,图3(b1)~(b3)对应的是剂量平均值差异。
图3(a1)~(a3)显示,重叠DSC与剂量最大值之间有明显的关联性。具体来说,对于OAR和PTV_PRV 5 mm的重叠,大于0.4的DSC所对应的自动和手动勾画剂量最大值差异均小于3 Gy;对于OAR和PTV_PRV 10 mm的重叠,大于0.6的DSC所对应的自动和手动勾画剂量最大值差异均小于3 Gy;对于OAR和PTV_PRV 20 mm的重叠,大于0.8的DSC所对应的自动和手动勾画剂量最大值差异均小于3 Gy。
与图(a1)~(a3)相反,在表示重叠DSC与剂量平均值之间关联性的图3(b1)~(b3)中,数据几乎没有规律可循。当重叠DSC>0.9时,剂量平均值差异依然可能高达8.4 Gy(黑色箭头指向的点)。
2.3 无重叠的剂量绝对差异
由于PTV位置的多样性,对于一部分病例,自动勾画和手动勾画的OAR,与PTV外扩可能均没有重叠。这种情况将在这部分继续探讨。图4绘制了OAR与PTV外扩没有重叠时,手动勾画与自动勾画的剂量差异与手动勾画剂量值的关系。左图为两者在胃部的关系,右图为两者在十二指肠的关系。黑色、红色和蓝色点均对应PRV 5 mm;红色和蓝色点对应PRV 10 mm,蓝色点对应PRV 20 mm。
由图4可见,在OAR与PTV外扩没有重叠的情况下,对于胃和十二指肠,PTV_PRV 5 mm对应的手动勾画最大值分别为46.1 Gy和52.4 Gy,PTV_PRV 10 mm对应的手动勾画最大值分别为42.6 Gy和52.4 Gy,PTV_PRV 20 mm对应的手动勾画最大值分别为25.3 Gy和19.8 Gy。总体而言,重叠结构使用的PTV外扩越大,手动勾画的剂量最大值越小。使用PTV_PRV 20 mm设计重叠DSC相对最为安全。
3 讨论
自动勾画是一种高效的图像分割方法,它为放疗领域的诸多新技术提供了便利[10-11]。一般来说,自动勾画的优劣可以由几何学参数来评估,但是当自动勾画运用于放疗领域时,人们更关注的是:自动勾画是否会影响剂量评估的可靠性[5]。故近年来越来越多的研究者开始重视自动勾画的剂量学参数[3,12-14]。在一些新的自动勾画模型提出时,除了运用几何参数评估外,也会加上剂量参数评估。比如,ZHU等[14]将自动分割模型应用于食管癌病例,研究了自动勾画与手动勾画的剂量学差异。
除此之外,还有一部分研究者着眼于几何参数与剂量参数的关联性,希望得到两者之间的定量化关系。ROACH等[5]针对前列腺肿瘤,研究了手动和自动勾画轮廓相似性指标和放射生物学指标之间的关联,发现PTV的肿瘤控制概率(tumor control probability,TCP)、直肠的正常组织并发症概率(normal tissue complication probability,NTCP)与体积相似度等几个体积相关的几何指标呈弱相关(斯皮尔曼等级相关系数为0.3~0.5),而感兴趣区域的最大值和平均值与9个常用几何指标(包括DSC和HD)均没有相关性。余行等[13]使用180例宫颈癌数据,研究了几何参数和剂量参数的相关性,发现大部分几何指标与剂量指标之间关联较弱,并指出使用几何参数估算剂量学差异是不可行的。KIESELMANN等[15]针对头颈部肿瘤的磁共振图像,评估了3组自动勾画的几何与剂量参数,认为自动勾画临床可接受,但是几何指标和剂量指标关联性差,几何指标不能用来评估剂量差异。GUO等[16]研究了10例直肠癌和10例鼻咽癌,发现自动勾画的几何参数和剂量参数之间基本没有相关性。POEL等[17]挑选包括各种靶区和危及器官位置关系的病例作为数据集,研究剂量指标和几何指标的关联性,证明了危及器官的最大值和平均值与几何指标的关联性均很弱。
总的来说,这些工作的结论较为统一,即几何参数与剂量参数之间的关联性不高,几何参数不足以用来评估剂量差异。具体而言,对于剂量平均值及与其相关的参数,少量几何参数与剂量参数呈弱相关;对于剂量最大值,几乎没有几何参数能够预测剂量的不确定性。而在临床上,对于串行器官,比如脊髓、十二指肠等,剂量最大值是最重要的剂量评估指标,其与几何指标之间的关联性将直接影响几何指标能否作为自动勾画评估标准。
本研究针对现有几何参数无法正确评估剂量最大值差异这一问题,引入肿瘤与危及器官的相互位置关系,设计了一组基于DSC的新几何参数,用于评估自动勾画可能引起的剂量最大值偏差,弥补了这方面的空缺。这组参数的实现方式也非常便捷,仅需先将PTV进行外扩,再提取其与须评估的OAR之间的重叠结构,再计算DSC即可。本方法物理意义明确,操作方便,为自动勾画的临床评估提供了便利。
本研究也有一定的局限性。首先,现有工作只涉及上腹部肿瘤,研究对象只有胃和十二指肠两种,其结果需要其他部位肿瘤进行验证。其次,本研究使用的病例数为48例,且DSC分布较广,某些情况(比如图4)涉及的病例数较少,结果的普适性需要进一步验证。最后,新提出的重叠DSC只对剂量最大值有效,对剂量平均值无效,需要进一步改进以适应更多的剂量参数。这三点也是下一步研究的方向和目标。
此外,新参数的引入增加了自动勾画评估的工作量。在本研究的完成过程中,重叠区域以及几何和剂量指标的计算均使用Python脚本实现,自动化程序可避免过大的人力消耗。但是基于临床数据极高的安全性需要,外部编写的Python脚本不适合运用于临床评估。后续临床应用中,可使用带有脚本功能的放疗计划系统参与评估(比如Pinnacle),实现参数引入和评估过程的自动化,以最小化引入参数带来的工作量增加。
4 结论
本研究引入OAR和PTV的位置关系,设计了一组基于DSC的新几何评估参数,并研究了这组几何参数与剂量参数之间的关联性,为临床使用几何参数评估自动勾画提供了新的方法。对于上腹部危及器官胃和十二指肠,其与靶区外扩的重叠几何参数和剂量最大值之间有密切关联,但是与剂量平均值之间没有关联。重叠几何参数可以预测自动勾画引起的剂量最大值差异是否临床可接受。