基于增强CT 影像组学模型预测膀胱尿路上皮癌组织学分级
2022-12-12王梓华吴红珍梁莹莹杨蕊梦莫蕾张家雄
王梓华,吴红珍,梁莹莹,杨蕊梦,莫蕾*,张家雄
1.佛山市中医院放射科,广东 佛山 528000;2.广州市第一人民医院放射科,广东 广州 510180
膀胱癌的发病率居恶性肿瘤第10位,男性较女性多见[1]。尿路上皮癌是膀胱癌最常见的病理类型,占90%以上。根据肿瘤细胞分化程度不同,可将尿路上皮癌分为低级别尿路上皮癌(low-grade urothelial carcinoma,LGUC)和高级别尿路上皮癌(high-grade urothelial carcinoma,HGUC)[2]。与LGUC相比,HGUC的侵袭力更强、临床预后更差[3-4]。因此若能在术前准确地预测膀胱尿路上皮癌(bladder urothelial carcinoma,BUC)的组织学分级,对改善膀胱癌患者的临床管理具有重要意义。常规CT检查可以确定肿瘤的大小、形态和部位等,能够为临床医师对肿瘤进行分期提供参考,然而单凭影像图像资料无法直观地反映肿瘤的异质性,影像组学能够很好地解决这一问题[5]。影像组学通过高通量提取影像特征,客观和定量地对肿瘤信息进行表征,从而评估恶性肿瘤的组织学分级[6-8]。目前国内较少采用影像组学研究BUC,本研究基于增强CT影像组学构建鉴别BUC组织学分级的预测模型,并验证其术前诊断HGUC和LGUC的效能。
1 资料与方法
1.1 研究对象 回顾性收集2016年11月—2020年9月广州市第一人民医院经病理证实的膀胱癌139例。纳入标准:①术后病理结果为尿路上皮癌;②术前CT图像和临床资料齐全。排除标准:①病理包含2种级别或合并其他病理类型;②病灶直径<5 mm或仅表现为膀胱壁局限性增厚而未见明确肿块;③存在影响图像分析伪影。最终纳入66例HGUC和61例LGUC,其中HGUC组年龄52~90岁,LGUC组年龄47~90岁。由深睿科研平台使用随机拆分方法并按7∶3将127例膀胱癌患者分为训练集(n=89)和验证集(n=38)。本研究通过医院伦理委员会审核(K-2020-005-01)。
1.2 仪器与方法 采用东芝320排螺旋CT(Aquilion ONE)行中下腹部和盆腔CT平扫及多期增强扫描。扫描参数:管电压120 kV,探测器准直64×0.6 mm,层厚5 mm,层间距5 mm。先进行CT平扫,经肘静脉注射对比剂碘帕醇(370 mg/ml),用量2.0 ml/kg,流速3.5 ml/s,延迟20~25 s和50~60 s后再次进行扫描,获得动脉期和静脉期图像。由于排泄期造影剂潴留于膀胱腔内,高密度的造影剂对肿瘤病灶的图像分析造成干扰,因此本研究未纳入排泄期CT图像进行分析。
1.3 图像分析和特征提取 将所有BUC患者的术前增强CT图像以DICOM格式从影像储存系统中导出并保存。将CT图像导入ITK-SNAP 3.8软件,由1名具有5年影像诊断经验的影像科医师采用盲法对三期CT图像逐层手动勾画肿瘤边界作为感兴趣区(ROI),避开膀胱病灶的钙化或坏死区域,有多个病灶者,协定仅选取其中体积最大的病灶进行勾画。最后软件生成获得三维容积感兴趣区(VOI)(图1)。从127例BUC中随机抽取1/4的病例,由另一名具有10年以上腹部影像诊断经验的医师采用盲法对肿瘤病灶进行再次勾画,并获得相应的VOI,后续将获得的2批影像组学特征数据进行组间相关系数(ICC)分析。采用深睿医疗科研平台对基于三期CT图像生成的VOI进行数据标注分类并提取影像组学特征,其中图像的间距标准化、图像滤波和特征计算等步骤由科研平台进行,最后提取得到的影像组学特征主要包括一阶统计量特征、形态特征和纹理特征等。
图1 男,60岁,高级别尿路上皮癌(HGUC)。CT平扫图像逐层手动勾画ROI,红色区域为ROI(A);获得VOI(B)
1.4 特征筛选和模型构建 对上述2位医师勾画生成VOI提取到的所有影像组学特征采用ICC进行可重复性分析,根据ICC>0.9筛选出可重复性最佳的特征用于下一步分析。使用Z-score进行影像组学特征数值的归一化,采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归模型分析特征,模型参数设置λ值的取值个数为50,采用5折交叉验证,迭代次数为10万,由模型自行运算得出最优λ值,并从纳入的特征中筛选出最有价值的特征。然后对上述影像组学特征进一步进行特征相关性分析,剔除相关性高的特征后,入组得到的影像组学特征用于构建模型。使用科研平台提供的建模方法对入组的特征进行Logistic回归模型训练,拟合出最优模型并输出模型信息,从而获得各影像组学特征与其对应的加权系数乘积的回归方程,即为预测BUC组织学分级的多变量Logistic回归模型。绘制受试者工作特征(ROC)曲线,采用曲线下面积(AUC)评估构建模型的诊断效能,采用决策曲线评价模型鉴别HGUC和LGUC的净获益。
1.5 统计学方法 使用R 3.5.3软件进行统计学分析。年龄和病灶最大径为连续变量,符合正态分布以表示,组间比较采用t检验;非正态分布的计量资料以M(Q1,Q3)表示,组间比较采用Mann-WhitneyU检验;采用χ2检验比较组间性别分布差异;采用AUC预测模型效能。使用Python 3.8软件进行LASSO回归分析。其余统计分析及统计图形绘制在深睿医疗科研平台上进行。P<0.05为差异有统计学意义。
2 结果
2.1 临床资料 HGUC组与LGUC组患者年龄和性别差异无统计学意义(P>0.05),两组肿瘤最大径差异有统计学意义(P<0.05),见表1。训练集和验证集患者年龄、性别和肿瘤最大径差异均无统计学意义(P>0.05),见表2。
表1 HGUC患者与LGUC患者临床资料比较
表2 训练集与验证集患者临床资料比较
2.2 预测模型构建 每位患者每期CT图像均可提取获得1 734个影像组学特征,3期CT图像共提取5 202个特征,经过ICC检验后剩下4 467个特征,经LASSO回归模型筛选后得到22个特征,剔除相关系数r>0.85的2个高度相关特征后,最终得到20个特征(表3),从而构建得到预测模型。
表3 用于构建影像组学模型的三期影像组学特征
2.3 预测模型效能 使用基于增强CT影像组学预测模型诊断BUC组织学分级,在训练集中预测效能的AUC为0.90(95%CI0.83~0.96),敏感度为80%,特异度为81%;在验证集中的AUC为0.93(95%CI0.85~1.00),敏感度为95%,特异度为63%(图2)。决策曲线(图3)结果显示该预测模型鉴别HGUC和LGUC具有良好的净获益。
图2 基于增强CT影像组学模型预测膀胱尿路上皮癌组织学的ROC曲线。训练集鉴别HGUC与LGUC的ROC曲线,AUC为0.90(A);验证集鉴别HGUC与LGUC的ROC曲线,AUC为0.93(B)
图3 预测模型的决策曲线。黑线(None)代表假设全部患者为LGUC,灰线(All)假设全部患者为HGUC,蓝线(Train)代表训练集,红线(Val)代表验证集
3 讨论
膀胱HGUC和LGUC的生物学行为和预后具有明显差异,这是临床医师制订治疗方案时需要考虑的一个因素[9-11]。膀胱镜活检术是目前用于术前评估BUC组织学分级的最常用方法,这种有创性检查可能会由于取样不足或病理学变异型等问题导致误诊[12]。影像组学的应用和发展为研究者提供了一种无创和客观地诊断泌尿系肿瘤的方法,包括良性与恶性病变的鉴别[13-15]。鉴于影像组学在肿瘤诊断研究中的可行性及实用性,本研究尝试从多期增强CT图像中提取特征建立影像组学预测模型,结果表明其在鉴别BUC组织学分级时具有良好的诊断效能,在训练集中AUC达到0.90,在验证集中AUC达到0.93。在纳入构建模型的影像组学特征中,中位数对模型的影响较为重要,其反映了所勾画ROI中灰度强度的中位数。由本研究提取出的特征数据可知,HGUC的中位数较LGUC大,这一结果可能提示恶性程度相对较高的肿瘤往往具有较大的灰度强度值。
3.1 与CT纹理分析技术比较 既往已有研究[16-17]使用CT纹理分析技术鉴别HGUC和LGUC,研究结果显示CT图像定量分析具有鉴别BUC组织学分级的潜在能力,然而这些研究的缺点是仅基于数十个纹理特征进行分析,而且未进行模型构建及验证。本研究对前述研究方法进行改进,利用影像组学的研究方法,在方法设计上弥补了上述研究的不足。邹金钊等[18]的研究纳入病例数量较少,构建模型后并未用额外的数据对模型的效能进行验证,其研究方法仍有待进一步改善。此外,上述所有研究均在膀胱癌图像最大层面勾画ROI获得二维数据,这种方法显然不能全面地反映病灶的整体特征信息,因此本研究通过逐层勾画病灶得到VOI,并对其进行特征提取。Zhang等[19]基于单期增强CT图像构建影像组学模型预测膀胱癌的病理分级,结果显示一阶特征中的偏度在模型中的作用最大,并且HGUC的偏度值往往较高,然而单期图像提取的信息可能会遗漏病灶部分重要特征。Wang等[20]基于多序列MRI影像组学特征构建的预测模型诊断膀胱癌肌层受侵时具有良好的诊断效能,而当整合影像组学评分及影像学特征后能够进一步提高效能,但是影像学特征的判断带有主观性,并且非常依赖医师的经验,纳入主观指标进行模型构建的适用性及可重复性仍有待进一步研究。本研究对比HGUC与LGUC发现,HGUC的病灶往往较LGUC病灶大,与Zhang等[17]的研究结果类似,然而该研究并未对两者间的肿瘤大小进行对比,因此肿瘤大小辅助诊断BUC组织学分级的作用仍有待更多研究进行探讨。
3.2 本研究的应用价值 本研究在方法中对整个肿瘤病灶进行勾画得到VOI,因此能够反映肿瘤整体的异质性。通过从三期增强CT图像中提取影像组学特征后再进行特征信息挖掘,保留每期图像中能够用于对肿瘤进行分类的特征,其建立的影像组学模型更能体现每期图像有用的信息及特征的权重。在研究过程中通过选择控制观察者的组间变异(ICC>0.9),使获得的特征具有较好的观察者间一致性。模型构建时通过增大训练集的数量,构建模型后使用验证集加以验证,最终结果显示此模型在训练集及验证集中AUC均较高,表明模型的诊断效能良好且性能稳定,在临床应用中具有一定的价值。
3.3 本研究的局限性 ①仅对单中心的病例进行回顾性研究,未来需要进行多中心研究并补充更多的病例数量,以对上述模型的效能进行外部验证;②纳入的临床指标较少,如未对吸烟史、血尿病史及其他相关检查进行研究;③本研究纳入病例中男性患者数量远大于女性患者,有待更大样本量的流行病学调查进行探讨。
综上所述,基于增强CT影像组学模型可用于预测BUC的组织学分级,其诊断效能较高,在辅助临床医师评估膀胱癌患者治疗时具有一定的参考价值。