基于U-Net实现CT图像上肝段自动分割和术前评估的初步研究
2023-02-08谢婷婷刘想林子楹张晓东张耀峰张大斗成官迅王霄英
谢婷婷,刘想,林子楹,张晓东,张耀峰,张大斗,成官迅,王霄英
Couinaud’s肝段分类系统是目前最为广泛使用的肝段划分方法[1-2],是肝脏占位病变的定位基础,也用于计算剩余肝脏体积百分比(Future liver remnant,FLR %),进而评估手术可行性。目前,肝段体积测量和FLR %评估主要依赖于外科医生在后处理工作站上“虚拟切除”目标肝段后获得[3-4],临床应用受限、耗时较长。实现肝段的自动分割、体积测量及FLR %评估已成为临床需求。
近年来通过深度学习实现CT图像上肝脏分割已有报道[5-7],但肝段分割、体积测量乃至进一步运用到术前FLR %评估罕见。本研究基于U形全卷积神经网络(U-shaped fully convolutional neural network,U-Net),使用肝脏增强CT薄层图像训练深度学习模型,并验证其准确性,旨在探讨此模型植入临床工作中的可行性。
材料与方法
本研究获得北京大学第一医院、北京大学深圳医院伦理审查委员会的批准[2019(169)、2021(071)]。本研究为回顾性研究,按照北京大学第一医院AI项目研发规范进行。
1.用例定义
根据本单位AI项目管理方法,首先定义研发增强CT薄层图像Couinaud’s肝段分割模型用例(Use Case)。分割模型的目标对象定义为增强CT薄层图像上基于Couinaud’s分类系统的肝段。AI模型的预测结果(即8个独立的Couinaud’s肝段及肝段体积)用于半肝切除术(右半肝切除术、扩大右半肝切除术、左半肝切除术、扩大左半肝切除术)相应FLR %的计算。AI模型提供的数据包括8个独立的Couinaud’s肝段分割结果及体积。
2.研究队列的建立
回顾性收集2017年1月至2019年2月在北京大学第一医院(医学中心A)行腹部CT增强扫描连续病例的资料,为增加模型适用性,纳入多种肝脏背景。病例纳入标准:CT报告诊断为“肝脏未见异常”、“脂肪肝”及“肝硬化”者。病例排除标准:①直径≥2 cm的肝脏占位;②肝脏术后、先天性肝叶缺如等导致的肝脏形态异常;③肝静脉或门静脉三级分支及以上显示不清;④肝脏分割结果不满意。回顾性收集2021年1月至2021年6月在北京大学深圳医院(医学中心B)行腹部CT增强扫描的连续病例资料,纳入CT报告诊断为“肝脏未见异常”、排除标准同上③④的病例。医学中心A、B分别纳入170例、50例(分别定义为数据集A、B,图1)。
图1 本研究纳排标准。
3.CT检查方法
医学中心A、B所使用的扫描仪器、扫描参数见表1。
表1 医学中心A、B所使用的扫描仪器及扫描参数
肝脏增强扫描对比剂为优维显(碘含量370 mg/mL),采用高压注射器经肘前静脉注射,剂量1.5~2.0 mL/kg,注射流率2.5~5.0 mL/s,动脉期为注射对比剂后20~25 s,门脉期及延迟期分别为注射对比剂后85~90 s、300 s。
4.图像标注
先将肝脏增强CT扫描的DICOM图像匿名化,转换为NiFTI格式,使用ITK-SNAP软件标注肝段。先由一位具有5年腹部影像诊断经验的影像科医师标
Couinaud’s肝段的标注根据Couinaud’s肝段划分标准进行。因尾状叶右缘和腹侧缘的界定在学术界仍存在争议[8-9],故本研究统一以静脉韧带裂右缘至下腔静脉右缘连线作为划分Ⅰ段右缘和腹侧缘的分界线。手工标注流程及半肝切除术模拟图见图2。
图2 肝段分割结果及半肝切除术三维模拟图(手术模拟图中白色部分为拟切除的肝段,彩色部分模拟半肝切除术后剩余肝脏)。
5.模型构建
肝脏分割:本单位已训练了肝脏分割模型,用已有肝脏分割模型预测肝脏范围,经医师修改、确认后为肝脏分割结果。
肝段分割:在肝脏分割结果的基础上,根据Couinaud’s肝段划分标准分割肝段。数据集A随机分为训练集(train set,132例)、调优集(validation set,19例)和测试集(test,19例),数据集B作为外部验证,输入数据为增强CT门脉期薄层图像和标注(肝段体积记录为V),输出数据为模型的预测结果,包括各肝段及相应肝段体积(记录为V’)。深度学习的模型为 3D U-Net[10]。将NIFTI格式的NCHCT图像分辨率设置为128×192×256,窗宽300 HU,窗位30 HU。采用随机噪声、平移、仿射变换等图像扩增方法。使用ADAM梯度下降优化算法,初始学习率(learning rate)为1×10-4,每次读取的图像数量(batch size)为 2。训练次数(Epoch)为400,研究所使用的程序语言为Python。模型训练的硬件为GPU NVIDIA Tesla P100 16G,软件包括Python3.6、Pytorch 0.4.1、Opencv、Numpy、SimpleITK等。
半肝切除术FLR %的计算:右半肝切除术定义为切除Ⅴ至Ⅷ段(或在此基础上同时切除Ⅰ段),扩大右半肝切除术为切除Ⅳ至Ⅷ段(或在此基础上同时切除Ⅰ段);左半肝切除术定义为切除Ⅱ至Ⅳ段(或在此基础上同时切除Ⅰ段),扩大左半肝切除术定义为切除Ⅱ至Ⅳ段及Ⅴ、Ⅷ段(或在此基础上同时切除Ⅰ段)[11]。FLR %=半肝切除术后剩余肝脏体积/肝脏总体积×100%[4],模型预测的FLR%为半肝切除术后剩余肝脏的预测体积/预测的肝脏总体积×100%(表2)。
表2 四种半肝切除术及相应FLR %计算方法
6.模型评价
模型分割效果的客观评价指标为Dice相似性系数(dice similarity coefficient,DSC)值,计算公式为DSC=(2|X∩Y|)/(|X|+|Y|),X和Y分别代表放射科医生标注的肝段区域和模型预测区域内包含的像素集。
为测试模型应用到FLR %评估的可行性,主观评价指标为:模型与医师基于FLR %预测半肝切除术是否可行的一致性。因临床常建议正常肝脏、脂肪肝、明显肝纤维化和肝硬化患者的FLR %分别大于20%、30%、40%[12-13]以最大程度降低术后肝功能衰竭的发生,故本研究设定正常肝脏、脂肪肝、肝硬化患者FLR %分别大于20%、30%、40%为半肝切除术可行的标准。
7.统计学分析
采用SPSS 21.0和Prism 7软件进行统计学分析。计量资料以中位数(上、下四分位数)表示,采用Bland-Altman分析比较模型与医师测量结果的差异,使用Pearson相关分析和Bland-Altman分析模型预测与手工标注在FLR %预测结果方面的相关性和一致性,McNemar’s检验分析两者在预测半肝切除术可行性上的一致性。以P<0.05为差异有统计学意义。
结 果
1.研究数据特征
医学中心A、B的一般病例资料见表3。两个医学中心所有患者平均年龄为(52.91±7.1)岁,各肝段体积见图3,肝脏总体积平均值为(1290.98±23.66)mL(95% CI:1244.36~1337.61)。外部验证集手工标注的肝段体积为(37.59±1.26)mL至(241.76±6.07)mL,模型分割的肝段体积为(35.45±1.14)mL至(254.29±5.94)mL,两者具有强相关性(r=0.956,P<0.05),与金标准相比,模型分割方法轻微高估肝段体积(平均偏差1.363 mL),95% 一致范围(limit of agreement,LoA)为-8.53至11.26(图4)。
图3 两个医学中心共220例数据各肝段体积。 图4 外部验证集中模型预测与手工标注在肝段体积测量的相关性(a)和一致性(b)。两者FLR %评估具有强相关性(r=0.956),一致性高,仅6 %数据位于95 %置信区间之外。 图5 外部验证中模型预测与手工标注在半肝切除术FLR %评估的相关性(a)和一致性(b)。两者FLR %评估具有强相关性(r=0.99),一致性高,约7.5 %数据位于95 %置信区间之外。 图6 各肝段DSC值。
表3 入组病例的基线资料
外部验证集手工标注FLR %为12.41%~74.71%,平均38.27%,模型分割的FLR %为12.38%~75.81%,平均38.42%,两者FLR%具有强相关性(r=0.99,P<0.05),与金标准相比,模型分割方法轻微低估FLR%(平均偏差- 0.16%),95% LoA 为0.9872~0.9927(图5)。
2.模型定量评估
外部验证各肝段的DSC值在0.46~0.99之间,平均DSC值为0.92±0.00(95% CI:0.91~0.93,图6),提示模型预测结果与人工标注结果重合度较高。
3.模型定性评估
数据集B共50例数据,模型和医师各200个FLR %预测数据。医师预测手术可行而模型预测手术不可行3例(1.50%,3/200),均出现在扩大右半肝切除术,余两者预测结果相同(两者均预测手术可行172例,占86.0%;两者均预测手术不可行25例,占12.5%;医师预测手术不可行,模型预测手术可行0例)。McNemar’s检验精确显著性P值为0.25,提示模型与医师在预测手术可行性方面差异无统计学意义。
讨 论
实现对正常肝脏、脂肪肝、肝硬化等多种肝脏背景下肝段的自动分割、体积测量及半肝切除术术前FLR %评估,为临床迫切需求。
本研究使用AI技术先分割肝脏,再分割肝段,结果显示U-Net模型用于增强CT薄层图像肝段分割的平均DSC值为0.92,模型与医师在FLR %评估上相关性高,在预测半肝切除术可行性上差异无统计学意义。本研究结果初步证明了U-Net模型用于增强CT薄层图像上肝段分割、FLR %评估是可行的,为后续大样本、细化肝脏背景的模型训练并植入半肝切除术术前FLR %评估提供了依据。
本研究在肝段体积测量上模型预测与手工标注高度重合,是植入FLR %评估的关键和前提。因Couinaud’s肝段的解剖基础为门脉与肝静脉,故模型提供的肝段体积有潜力提示肝脏血管变异、以肝右叶萎缩及尾状叶增大为特征的肝硬化和布加综合征的辅助诊断。
目前罕见基于深度学习的半肝切除术FLR %评估的研究报道。本研究以深度学习方法分割肝段为基础,初步证实了自动获得FLR %值并预测不同肝脏背景患者半肝切除术的可行性。FLR %是半肝切除术后并发肝衰竭的独立危险因子[14],本研究在一定程度上为自动预测半肝切除可行性提供了重要信息。
本研究存在以下局限性:①外部验证中只有正常肝脏背景数据,缺乏脂肪肝、肝硬化数据,模型在此类患者中的分割性能如何将成为下一步研究计划。②本研究排除了既往存在肝段或肝叶切除史、肝脏介入手术史的患者,在未来扩大样本的模型训练中将增加此类肝脏形态异常的数据。③本研究评估FLR %时未剔除肝内大血管、直径小于2 cm的病灶,有可能造成FLR %预测结果与术后FLR %不完全一致,因此下一步将在现有模型基础上行肝内血管及病灶的亚分割。
综上所述,基于深度学习的U-Net分割算法可在增强CT图像上实现Couinaud’s肝段的自动分割、体积测量并初步运用到半肝切除术的FLR %评估中,未来的研究将拓宽模型的纳入标准并在临床应用中检验其预测价值。