基于MR-T2WI影像组学模型预测宫颈鳞癌临床分期
2021-05-31傅爱燕杨彦松葛亚琼龚海鹏
杨 易,冯 峰*,傅爱燕,杨彦松,葛亚琼,龚海鹏
(1.南通大学附属肿瘤医院放射科,江苏 南通 226000;2.GE医疗中国,上海 210000)
宫颈癌是女性最常见的生殖系统恶性肿瘤之一,发病率和死亡率均居女性恶性肿瘤第四位[1]。宫颈癌进行准确分期对于选择治疗方案及评估预后有重要指导意义[2]。根据国际妇产科联盟(International Federation of Gynecology and Obstetrics, FIGO)提出的宫颈癌治疗方法,对早期宫颈癌(Ⅰ~ⅡA期)多采用手术治疗,而对晚期(ⅡB~Ⅳ期)则推荐采用同步放射及化学治疗[3]。MRI是宫颈癌分期和随访的最敏感的影像学检查方法[4-5]。本研究观察MR-T2WI影像组学模型预测宫颈鳞癌临床分期的价值。
1 资料与方法
1.1 一般资料 回顾性分析2017年6月—2019年12月159例于南通大学附属肿瘤医院就诊的宫颈癌患者,均为女性,年龄29~82岁,平均(58.0±10.2)岁。纳入标准:①经术后或活检病理证实宫颈鳞癌;②MR检查前未接受相关治疗。排除标准:①图像质量差;②肿瘤体积较小,可放置ROI的图像层面少于3个,不能建立三维肿瘤体积模型;③合并其他恶性肿瘤。
1.2 仪器与方法 采用Siemens Espree 1.5T MR超导型扫描仪,腹部相控阵线圈,采集盆部MRI。扫描参数:轴位快速自旋回波T2WI,FOV 380 mm×380 mm,矩阵256×256,TR/TE 4 120 ms/103 ms,层厚/层间距5 mm/1.0 mm;矢状位T2WI,FOV 256 mm×256 mm,矩阵256×256,TR/TE 6 900 ms/85 ms,层厚/层间距3 mm/0.6 mm;冠状位T2WI,FOV 380 mm×380 mm,矩阵256×256,TR/TE 6 000 ms/85 ms,层厚/层间距3 mm/0.6 mm。
1.3 图像处理与分析 由1名具有10年以上盆腔MR诊断经验的副主任医师采用免费开源软件ITK-SNAP 3.8.0软件(www.itk-snap.org)于轴位T2WI上逐层手动勾画肿瘤ROI,获得肿瘤感兴趣容积(volume of interest, VOI)。按7∶3比例将患者随机分为训练集(n=113)和验证集(n=46)。训练集包括52例早期、61例晚期宫颈鳞癌,验证集含21例早期及25例晚期宫颈鳞癌。将轴位T2WI及病灶VOI导入GE人工智能工具包(artificial intelligence Kit, version 3.2.0),提取其影像组学特征,见图1。1周后该医师随机选取30例再次勾画肿瘤VOI,与另1名具有5年以上盆腔MR诊断经验的主治医师分别提取病灶的影像组学特征。
图1 于MR T2WI勾画宫颈鳞癌VOI示意图 A.MR T2WI; B.勾画肿瘤ROI(红色区域); C.所获肿瘤VOI
1.4 建立影像组学模型及数据分析 采用R语言(Version 3.5.1,www.R-project.org)和SPSS 20.0统计分析软件。计量资料以±s表示。采用独立样本t检验及χ2检验比较训练集与验证集、早期组与晚期组间年龄、生产次数及流产次数的差异。以组内相关系数(interclass correlation coefficients, ICC)检验评价2名医师之间及同名医师2次提取影像组学特征的一致性,ICC>0.75为一致性较好。P<0.05为差异有统计学意义。
应用最大相关最小冗余(max-relevance and min-redundancy, mRMR)特征选择法初步筛选提取的影像学特征,采用最小绝对收缩选择算子(least absolute shrinkage and selection operator, LASSO)回归分析方法,以10折交叉验证筛选LASSO回归模型,获得最优超参数λ值,并以所获最优影像学特征构建影像组学模型。将系数非零的影像学特征与对应系数进行加权之后行线性加和,得到影像组学评分(Radscore),公式为Radscore=截距+βi×Xi,其中β代表系数,X代表特征,i代表序数。
采用Wilcoxon检验比较训练集和验证集早、晚期宫颈鳞癌Radscore的差异。以校准曲线评估影像组学模型的校准效能,并进行Hosmer-Lemeshow检验,分析模型的拟合优度。采用受试者工作特征(receiver operating characteristic, ROC)曲线评估影像组学模型预测早、晚期宫颈鳞癌的效能,并以决策曲线分析(decision curve analysis, DCA)预测模型的临床应用价值。
2 结果
根据FIGO分期系统及病理结果,159例宫颈鳞癌中,ⅠB期44例,ⅡA期29例,ⅡB期27例,Ⅲ期56例,Ⅳ期3例;将ⅠB~ⅡA期归为早期组(n=73),ⅡB~Ⅳ期纳入和晚期组(n=86)。
2.1 一般临床资料比较 早期组与晚期组患者年龄、生产次数和流产次数差异均无统计学意义(P均>0.05),训练集与验证集患者年龄、生产次数和流产次数差异亦均无统计学意义(P均>0.05),见表1、2。
表1 早、晚期宫颈鳞癌患者临床资料比较
表2 训练集与验证集宫颈鳞癌患者临床资料比较
2.2 构建影像组学模型 观察者内(ICC=0.84~0.95)及观察者间(ICC=0.78~0.91)提取影像组学特征的一致性均较好(P均<0.01)。共提取396个影像组学特征,包括42个直方图特征、20个形态特征及334个纹理特征。经mRMR初步筛选和LASSO回归分析进一步筛选,最优λ值为0.04(图2),共获得11个最优影像组学特征,见表3。根据其对应系数构建Radscore,公式为:
Radscore=0.004×RunLengthNonuniformity_angle0_offset1+0.139×HighGreyLevelRunEmphasis_AllDirection_offset4_SD-0.041×GLCMEnergy_angle135_offset7+0.356×GLCMEntropy_AllDirection_offset1_SD-0.05×GLCMEnergy_AllDirection_offset7+0.073×ShortRunEmphasis_angel45_offset7+0.065×LongRunLowGreyLevelEmphasis_angle90_offset1+0.374×SurfaceArea-0.127×ClusterShade_AllDirection_offset7_SD-0.301×ShortRunEmphasis_AllDirection_offset1_SD+0.162×Compactness2+0.192
图2 采用LASSO回归分析及10折交叉验证筛选最优影像组学特征 A.LASSO回归中选择调节参数,第一个虚线对应位置,即模型偏差最低点对应的横坐标为最优超参数λ值(0.04); B.LASSO回归系数分布图,根据最优超参数λ值绘制垂直线,确定具有非零系数的影像组学特征
表3 LASSO回归分析获得最优影像组学特征
Wilcoxon检验显示,训练集和验证集中,早期与晚期宫颈鳞癌间Radscore差异均有统计学意义(W=688、119,P均<0.05),见图3。
图3 训练集和验证集内早、晚期宫颈鳞癌Radscore的箱式散点图 A.训练集; B.验证集 (Label 0代表早期宫颈鳞癌,Label 1代表晚期宫颈鳞癌)
2.3 影像组学模型的预测效能 校准曲线(图4)显示,影像组学模型在训练集和验证集中均具有较好的校准效能。Hosmer-Lemeshow检验结果显示,训练集和验证集中,影像组学模型的拟合优度均佳(χ2=2.68、8.87,P均>0.05)。ROC曲线结果显示,训练集中,影像组学模型预测早晚期宫颈鳞癌的曲线下面积(area under the curve, AUC)为0.80(0.73,0.88),准确率为75.22%,敏感度为78.95%,特异度为71.43%;验证集中,影像组学模型的AUC为0.80(0.67,0.94),准确率为78.26%,敏感度为82.61%,特异度为73.91%,见图5。DCA显示,阈值取0.10~1.00时,影像组学模型净收益较大(图6)。
图4 训练集(A)和验证集(B)中影像组学模型的校准曲线 纵坐标代表观察时间百分比,横坐标代表预测时间百分比,实线代表理想的预测性能,虚线代表模型的预测性能,虚线越靠近实线表示模型的预测精度越好
图5 影像组学模型预测早、晚期宫颈鳞癌的ROC曲线 A.训练集; B.验证集
图6 影像组学模型预测早、晚期宫颈鳞癌的DCA
3 讨论
宫颈癌FIGO分期在临床实践及癌症数据库报告中均占据主导地位[6]。2018年FIGO对宫颈癌分期进行了修订,在临床资料的基础上增加了影像学和病理学证据[7]。本研究基于T2WI[6,8]建立影像组学模型预测宫颈鳞癌临床分期。
影像组学定量评估宫颈癌的异质性具有一定价值,可应用于预测宫颈癌淋巴结转移、淋巴血管间隙浸润及无病生存率等[9-11]。本研究结果显示,基于T2WI建立的影像组学模型的拟合优度佳,能较好地预测宫颈鳞癌的临床分期,其在训练集及验证集的AUC均为0.80;DCA显示阈值取0.10~1.00时,影像组学模型可获得较大的诊断净收益,提示该模型具有良好临床应用价值[12]。分析原因,可能在于晚期宫颈鳞癌的异质性较早期更明显,其影像组学特征存在一定差异[13]。PET/CT能从分子水平反映肿瘤特征。MU等[14]对42例宫颈鳞癌的18F-FDG PET/CT图像进行纹理分析,结果显示游程百分比(run percentage, RP)是最具有辨别力的指标,其AUC为0.88,略高于本研究结果。
本研究经筛选最终获得11个最优影像组学特征,包括2个形态学特征和9个纹理特征(5个灰度游程矩阵和4个灰度共生矩阵);其中1个形态学特征和2个纹理特征(分别为灰度游程矩阵和灰度共生矩阵)与宫颈鳞癌FIGO分期具有较好的相关性;特征SurfaceArea可提供病变组织大小的信息,特征Compactness2代表相对于球体紧凑程度的度量。根据FIGO 2018年宫颈癌分期标准,癌灶最大径线及间质浸润深度均可影响分期,因此,形态学特征SurfaceArea和Compactness2对宫颈鳞癌分期具有一定意义。灰度共生矩阵是研究灰度的空间相关特性以描述纹理特征的常用方法;灰度游程矩阵用以计算特定方向图像纹理的粗糙程度特征[15]。肿瘤异质性往往体现在图像灰度的变化,故归属于灰度共生矩阵和灰度游程矩阵的纹理特征有利于预测宫颈鳞癌FIGO分期。
综上所述,基于MR-T2WI的影像组学模型对预测早、晚期宫颈鳞癌具有一定价值,有助于制定个体化治疗方案。本研究的主要局限性:①样本量较少;②勾画病灶ROI仅基于轴位T2WI,有待增加样本量、结合其他序列MRI加以完善。