基于影像组学的多参数磁共振定量指标在膀胱癌肌层浸润分析中的价值
2022-12-12王玫李宁张祁石峰吴交交冯琪丁忠祥
王玫,李宁,张祁,石峰,吴交交,冯琪,丁忠祥,4
(1.浙江大学医学院附属杭州市第一人民医院放射科,浙江 杭州 310006;2.浙江中医药大学附属第一医院医学影像科,浙江 杭州 310006;3.上海联影智能医疗科技有限公司,上海 200232;4.浙江省临床肿瘤药理与毒理学研究重点实验室,浙江 杭州 310006)
膀胱癌的发病率在我国的生殖泌尿系统肿瘤中居首位,根据是否存在肌层浸润,其手术方案不同,非肌层浸润性膀胱癌(Non-muscle invasive bladder cancer,NMIBC)一般运用经尿道肿瘤电切术,而肌层浸润性膀胱癌(Muscle invasive bladder cancer,MIBC)因其复发率较高、容易远处转移等特性,多使用根治性膀胱切除术[1]。目前临床上确定膀胱癌肌层浸润的金标准是膀胱镜活检,但这是一项有创检查,依靠操作医师的经验,实施不当可能会导致对膀胱癌分期的低估[2-3],耽误病情,导致不良的临床结果[4]。因此,寻找一种无创且客观的方法判断膀胱癌术前是否存在肌层浸润,对治疗策略的制定尤为重要。
研究证明MRI 在术前膀胱癌肌层浸润的评估中具有重要价值[5]。2018 年欧洲泌尿外科学会、日本腹部放射学会以及欧洲泌尿影像学会一起发表膀胱影像报告和数据系统(Vesical imaging-reporting and data system,VI-RADS)[6],使用多参数MRI 评分系统判断肌层受侵的概率。但是目前VI-RADS评分中多为定性诊断,几乎没有用于预测肌层浸润的定量指标[7],这使最后的结果偏于主观。近些年有研究发现,肿瘤与膀胱壁之间的接触长度(也称肿瘤-壁界面)提示存在肌层浸润的风险,可作为肿瘤分期的定量指标[8]。目前人工智能和影像组学正不断发展,已广泛运用在肿瘤领域[9-10],可以从影像图像中提取大量客观、定量的组学特征,用于疾病的诊断、疗效的评估及预后预测。综上所述,本研究将基于多参数MRI 运用影像组学方法构建相关模型,以实现术前对膀胱癌是否存在肌层浸润进行准确预测。
1 材料与方法
1.1 材料
本研究收集来自杭州市第一人民医院2014 年6 月—2021 年7 月符合入组标准的膀胱癌患者。本研究方案通过医院的伦理委员会批准。
所有病例均行MR T2WI、DWI 及增强扫描,并在MRI 检查后1 月内取得术后病理结果,排除检查前做过临床治疗及图像伪影较重不符合纳入标准的病例。本研究共收集膀胱癌患者225例,其中男176例,女49例,年龄32~96岁,平均(69.38±11.74)岁。根据TNM 分期,以T2a 期(侵犯浅肌层)作肌层浸润的分界, 1.2.1 MRI 扫描 所有病例扫描采用的均是德国西门子Verio 3.0T MR 扫描仪,扫描之前膀胱需适度充盈。MRI参数详见表1。 表1 膀胱MRI 扫描参数 1.2.2 肿瘤-壁界面 定义为患者仰卧位时膀胱壁与肿瘤之间接触最大的曲线长度(图1a),取两次测量结果的平均值,分别在3 组图像中进行测量。 1.2.3 图像分析 本研究使用联影智能科研平台系统(版本V1.4)进行组学分析,将病例的影像和临床数据均导入该平台的膀胱癌数据集中,分析的重要环节包含图像分割、特征筛选及机器建模。 图像分割:分别由1 位主治医师和1 位副主任医师进行勾画,在数据集界面中进入影像标注界面,在T2WI 及DWI、增强图像上分别手动逐层勾画肿瘤区域(MR 增强图像选用动脉期作为勾画对象,因固有层的低信号线早期连续性的中断提示肌层受侵),即感兴趣区(ROI),最后融合为1 个三维的ROI(图1b~1d)。由于一部分病例的膀胱中有多个瘤体,为了减少由于多个病变中提取的潜在偏倚,本次选择体积最大的瘤体进行勾画。两位医师在勾画前对病理分型并不知情,对两者勾画的ROI 结果实施组间的一致性分析。 特征筛选及机器建模:在联影智能科研平台的组学模块界面上对上述勾画的ROI 区域进行组学特征提取。包括一阶特征参数(灰度直方图的统计学特征)和二阶特征参数(纹理特征)两大类,共118 个特征,并联合25 个图像滤波器(如拉普拉斯锐化、小波等)提取特征,由不同的维度反映病灶的形状复杂度,最终从T2WI、DWI 和增强图像中各提取2 600个特征。同时手动加入8 个其他一般特征(肿瘤-壁界面、临床特征)。为了避免分组的样本偏差,按5 倍交叉-验证方法把膀胱癌病例分成训练集以及测试集,把样本随机均分为5组,每组NMIBC 和MIBC病例比例是一致的,每次挑选其中1 组作为测试集,剩余4 组用于训练集作为模型训练,并重复上述步骤5次,由此生成5 个与训练集和测试集不同的折叠,计算它们结果的平均值作为模型平均且稳健的评估。特征预处理应用z 分数归一法,特征筛选应用最小绝对收缩与选择算子(Lasso)的方法。 Nomogram 模型建立和外部验证:基于Lasso 所选特征的初步分类得到的概率值与有意义的其他一般特征联合构建Nomogram 模型,分类器选用Logis-tic 回归算法。 在外部数据集中验证模型的诊断效能,病例来自浙江中医药大学附属第一医院,共收集病例40例,其中男31例,女9例,年龄37~90岁,平均(73.42±11.77)岁。40 例中,MIBC 18例,NMIBC 22 例。 统计学分析应用SPSS 软件。多组比较运用非参数检验——Kruskal-Wallis 检验。组内相关系数(ICC)分析用于验证两位医师勾画结果的一致性,ICC≥0.75 提示具有优良的组间一致性。受试者工作特征(Receiver operating characteristic,ROC)曲线用于评价模型的诊断效果,同时得出曲线下面积(Area under curve,AUC)、准确度、特异度。通过校准曲线评价分类的准确性。 通过联影智能科研平台对特征进行筛选,在其他一般特征中(肿瘤-壁界面、临床特征),发现肿瘤-壁界面对两组的鉴别有明显的诊断价值,而两组间的临床特征(包括性别、年龄、遗传、是否吸烟、有无膀胱刺激症、肉眼或镜下血尿以及癌胚抗原(CEA))无明显鉴别诊断价值。 3 组图像中肿瘤-壁界面测量值比较无统计学差异(P>0.05),最后选用3 组的平均值。 根据两位放射科医生的一致性结果进行分析,在3 组参数图像的2 600 个组学特征中,T2WI 2 490个(95.8%)、DWI 2 349 个(90.3%)、增强扫描2 501个(96.2%)具备优良的组间一致性(ICC≥0.75)。本研究最后选择副主任医师的勾画结果实施进一步组学分析。 对T2WI、DWI 及增强图像中的影像学特征进行降维筛选,分别得到8 个、6 个和13 个有意义的特征,后基于多参数联合筛选出6 个有意义的特征(表2),根据Lasso 所选特征初步分类得到各自的概率值。在各参数的训练集及测试集中,两组间的概率值均存在统计学差异(P<0.05)。 表2 多参数联合筛选的组学特征 基于概率值构建模型,比较3 组单参数模型和多参数联合模型的诊断性能(图2),结果显示除了多参数模型和T2WI 单参数模型没有统计学差异,其余两两组间比较均有差异,并且在AUC 数值上多参数模型具有最好的诊断结果(表3)。 表3 各模型的AUC值 上述结果显示Nomogram 模型和单独的组学模型、其他一般特征模型相比,具有更优越的诊断性能(图3a)。在训练集和测试集中,Nomogram 模型的AUC 分别为0.892、0.875,灵敏度分别为0.765、0.75,特异度分别为0.844、0.824。构建基于Probability 和肿瘤-壁界面多指标联合诊断的Nomogram列线图,将复杂方程可视化(图3b)。模型的校准曲线提示肌层浸润的预测结果(图3c)。 运用外部数据验证Nomogram 模型的诊断性能。模型的ROC 曲线及可视化混淆矩阵证明模型具有较好的分类预测性能(图4),其AUC 值为0.846,灵敏度为0.722,特异度为0.818。 本研究中,我们运用ROC 曲线比较单参数和多参数模型的诊断性能,发现后者具有最好的诊断结果,因此,实验选用多参数联合的概率值,与有意义的其他一般特征(肿瘤-壁界面)联合构建Nomogram模型,该模型较单独的组学模型和其他一般特征模型具有更好的诊断性能,在训练集、内部验证集和外部验证集中均表现优异。从多参数联合中筛选出6个有意义的组学特征,分属于4 大类参数,Firstorder参数中的Skewness 特征表示偏度,描述平均灰度值的不对称性分布,正负均可,Uniformity 描述图像矩阵的均匀性;Glszm 参数表示量化图像中的灰度区域,其中的Zone Entropy 特征代表测量区域大小、灰度级的分布不确定性,值越大意味着纹理的异质性越大;Glrlm 参数表示测量具有一致灰度值的连续像素长度分布;Gldm 参数量化图像中相同灰度值的散布比例[11]。Firstorder 为一阶特征参数,后3 类为二阶或高阶特征参数,描述了肿瘤图像纹理的粗糙、复杂程度,提取人眼无法获取的信息,定量描述病变区域的宏观特性及微观异质性[12],提示肌层的浸润情况。 在特征筛选中除了组学特征外,还发现其他一般特征中的肿瘤-壁界面也是膀胱癌肌层浸润有用的预测因素。欧洲泌尿外科协会建议将肿瘤大小3 cm作为NMIBC 危险进展的阈值[13],而肿瘤大小与其形态相关。但本研究中,并没有筛选出与形态学有关的组学特征,我们认为这与肿瘤-壁界面也代表一种形态学参数有关,其表现出的信息更能代表肿瘤的真实状态,而组学中形态学特征没有表现出与肿瘤-壁界面相当的诊断性能。因此,在共同筛选中被淘汰。同时,肿瘤-壁界面这个定量指标已用于其他肿瘤的分期诊断,如肺癌[14]、前列腺癌[15]等,但膀胱癌和他们的发生机制有所不同,膀胱癌本就生长在膀胱壁上,而上述癌症仅在进展后才接触到胸膜等类似结构。本研究结果支持这种关联也适用于膀胱癌,Ahn等[8]的结果也验证了这一点。 研究结果发现在AUC 值上多参数模型具有最优的预测性能,这与既往的研究结果一致[16],但在统计学上与T2WI 单参数模型没有显著差异,我们认为这与样本量不足有关,更多的训练数据会使模型精度大大提高[17]。根据上述结果,我们选用多参数联合的概率值与肿瘤-壁界面联合构建Nomogram 模型,发现较单独的组学模型和其他特征模型具有更好的诊断性能。Zheng等[16]研究结果显示影像组学与有诊断意义的临床特征结合可以改善膀胱癌肌层浸润预测模型的准确性,进一步支持了我们的研究结果。 本研究仍存在不足之处:①本研究是回顾性的实验,数据集相对较小,并且存在选择的偏倚,后续可以进行前瞻性研究,进一步收集病例来验证结论;②肿瘤-壁界面的测量可能会受肿瘤的位置及重力的影响,后续可以通过多体位扫描获得更多图像,进行进一步分析;③在未来的研究中希望通过不同厂家的MR 设备或者不同磁场强度的MR 扫描,可以进一步验证模型结果。 综上所述,影像组学是预测膀胱癌肌层浸润的有用工具,基于多参数MRI 和肿瘤-壁界面构建的Nomogram 模型具有较好的诊断性能及可重复性,可以协助临床医生做出有效评估。1.2 方法
1.3 统计学方法
2 结果
2.1 一般资料
2.2 肿瘤-壁界面
2.3 一致性分析
2.4 组学特征筛选及模型建立
2.5 外部数据集验证
3 讨论