CT影像组学模型预测膀胱癌术后1年复发的初步研究
2021-10-12张古沐阳许梨梨李秀丽金征宇
张古沐阳,许梨梨,毛 丽,李秀丽,金征宇,孙 昊
1中国医学科学院 北京协和医学院 北京协和医院放射科, 北京 1007302深睿医疗人工智能研究院, 北京 100080
膀胱癌是泌尿系统最常见的恶性肿瘤,发病率位居全球恶性肿瘤的第9位[1]。较高的复发率是膀胱癌诊治过程中面临的严峻问题,尤其非肌层浸润性膀胱癌的5年复发率高达50%~70%[2]。对高复发风险的膀胱癌患者,早期予以更积极的初始治疗,并制订更紧密的随诊方案,有望改善其预后。因此,准确预测膀胱癌复发风险具有重要意义。
CT是评估肿瘤患者病情严重程度最常用的术前检查手段之一,可对肿瘤病灶进行准确定位,并辅助判断病灶数目、大小、与周围组织的关系以及有无淋巴结和远处转移。但常规CT对膀胱癌组织的分辨率不高,提供的肿瘤信息受限。近年来,新兴的影像组学技术通过从医学影像中高通量地提取肉眼不可见的定量特征数据,深度挖掘医学图像的生物学本质,并通过人工智能技术对海量的影像数据进行处理和分析,可构建对肿瘤进行无创定量诊断、疗效评估及预后预测的模型[3- 6]。本研究基于术前CT图像探究通过新兴的影像组学技术构建膀胱癌术后1年复发预测模型的可行性,旨在为该类患者临床诊治方案的选择提供辅助支持。
1 资料与方法
1.1 研究对象
回顾性纳入2014年5月至2018年7月北京协和医院诊治的膀胱癌患者。纳入标准:(1)均行手术治疗,组织病理学证实为原发性膀胱尿路上皮癌;(2)术前在本院行CT泌尿系成像(CT urography,CTU)检查;(3)术后规律随访时间超过1年。排除标准:(1)术前CTU图像不清晰者;(2)合并其他系统肿瘤者;(3)临床资料不完整者。
本研究已通过北京协和医院伦理审查委员会审查(审批号:ZS- 1271)。
1.2 研究方法
1.2.1 临床资料收集
记录患者的年龄、性别、T分期、手术方式等临床资料。
1.2.2 CTU图像采集与病灶分割
CTU检查设备为美国GE公司能谱CT (GE Discovery)和德国Siemens公司双源双能量CT(Siemens Definition Flash)。患者取仰卧位,扫描范围为整个腹盆腔。扫描参数:管电压120 kVp,管电流为实时自动调节,扫描视野350 mm×350 mm,螺距0.9 mm,准直64 mm×0.6 mm,层厚、层间距均为1 mm。增强扫描时,采用双筒高压注射器以4.5 mL/s速度注入100 mL非离子对比剂(碘帕醇 370 mg I/mL,上海博莱科信谊药业有限责任公司产品),之后注射100 mL生理盐水。采用Bolus tracking阈值触发扫描技术行增强扫描,触发扫描感兴趣区(region of interest, ROI)置于降主动脉与腹主动脉交界处。自动触发阈值设定为120 HU,达到阈值后延迟25 s、75 s、300 s分别采集皮髓质期、实质期和排泄期图像。本研究仅选取实质期图像用于后续分析。
由2名放射科医师(分别具有6年和14年泌尿系统疾病影像诊断经验)在未知患者病情的情况下共同完成CTU实质期图像阅片,意见不一致时协商解决。记录病灶数量、最大病灶直径及最大病灶CT值。采用深睿科研平台Deepwise Research Platform(http://label.deepwise.com)半自动勾画3D 肿瘤病灶ROI。病灶区域ROI勾画过程中,首先基于水平集的分割算法进行自动勾画,然后放射科医师手动修正错误的分割。多发病灶,仅勾画最大病灶。
1.2.3 特征提取
采用Pyradiomics 2.1.2软件提取肿瘤病灶ROI内影像组学特征。为抵消CT各向空间分辨率不统一导致的干扰,对所有图像进行重新采样,使得3个解剖方向上的像素均为1.0 mm。然后对图像进行预处理,包括使用小波滤波器对图像进行高通或低通滤波,以及使用不同σ参数的拉普拉斯高斯滤波器对较粗糙的纹理或较细致的纹理进行强化。
1.2.4 特征筛选和模型构建
采用Python3.6和Scikit-learn 0.20.3软件进行影像组学特征筛选和模型构建。在进行特征筛选和模型构建前,所有提取的影像组学特征均经Z-score归一化处理,然后采用JMIM特征选择算法选择最优特征子集,保障筛选后的特征子集与膀胱癌复发的交互信息量最大。共构建3个基本模型,包括随机森林(random forest)模型、自适应增强(AdaBoost)模型和梯度提升树(gradient boosting)模型。根据验证集中受试者工作特征(receiver operating characteristic, ROC)曲线的曲线下面积(area under the curve, AUC)逆向选择模型的最优超参数,包括随机森林模型的决策树棵数、判断划分叶子节点质量的标准、最大决策树深度;自适应增强模型的决策树棵数、学习率和提升算法;梯度提升树模型的损失函数、学习率、决策树棵数、判断划分叶子节点质量的标准、最大决策树深度。3个基本模型构建完成后,对其预测结果进行软投票(soft voting),得到3个基本模型相结合构成的组合模型的预测结果。其中,随机森林模型的预测结果由模型中所有决策树的预测概率均值计算得到,自适应增强模型和梯度提升树模型的预测结果是由模型中所有决策树的预测概率进行加权平均而来。
基于10次10折交叉验证法对预测模型进行验证,评估3个基本模型和组合模型的预测效能,效能指标包括AUC、准确度、灵敏度、特异度。具体做法:将数据随机分为10份,依次将其中9份作为训练集,剩余1份作为验证集,每次试验均可得出相应的模型预测概率,将10次预测结果的均值作为对模型精度的估计;共进行10次10折交叉验证,计算各预测效能指标的均值,作为对模型效能的最终评估结果。为进一步对模型进行解释,对3个基本模型中影像组学特征的基尼重要性进行可视化分析。
1.3 随访与分组
对所有患者进行随访,随访时间间隔根据患者具体情况而定,随访内容包括临床症状、尿常规、腹盆CT、膀胱镜等,总随访时间不少于1年。随访1年时,经膀胱镜及病理检查证实为膀胱癌复发则定义为复发组,其余患者为未复发组。
1.4 样本量估算与偏倚控制
样本量估算:根据公式n=[Z2×P(1/P)]/e2计算样本量。其中Z为1.96;P为预估的膀胱癌复发率,本研究设为0.2;e为研究的精度,设为0.05。经计算样本量为174例。
偏倚控制:在影像特征筛选和模型构建前,对所有提取的影像组学特征进行归一化处理,以减少检查设备不同造成的干扰。
1.5 统计学处理
采用SPSS 22.0和R 3.6.0软件进行统计学分析。年龄为计量资料且符合正态分布,以均数±标准差表示,组间比较采用独立样本t检验;最大病灶直径、最大病灶CT值不符合正态分布,以中位数(四分位数)表示,组间比较采用非参数检验。病灶数量为计数资料,以例数(百分数)表示,组间比较采用χ2检验。采用ROC曲线分析法计算各模型预测膀胱癌术后1年复发的准确度、灵敏度、特异度、AUC及其95%置信区间(confidence interval, CI),并采用Delong检验对各模型的AUC进行比较。双侧检验,检验水准α=0.05。
2 结果
2.1 一般临床资料
共228例符合纳入和排除标准的膀胱癌患者入选本研究。其中男性168例,女性60例;平均年龄(64.4±11.1)岁;行经尿道膀胱肿瘤切除术(transurethral resection of bladder tumor, TURBT)者220例,行全膀胱切除术者5例,行膀胱部分切除术者3例。
术后平均随访(31.5±14.3)个月,随访1年时51例患者复发(复发组),177例患者未复发(未复发组)。复发组患者均行TURBT;非复发组患者中,169例行TURBT,5例行全膀胱切除术,3例行膀胱部分切除术。复发组患者与未复发组患者的最大病灶直径(P=0.017)、病灶数量(P=0.005)有显著性差异。两组患者的年龄、最大病灶CT值及T分期均无显著统计学差异(P>0.05),见表1。
表1 膀胱癌术后1年复发组与未复发组患者临床资料比较
2.2 影像组学特征筛选和预测模型构建
基于原始图像和滤波后的图像,共提取1218个影像组学特征,包括252个描述肿瘤内部CT值统计分布的一阶特征,14个描述肿瘤形态的特征,308个描述肿瘤纹理的灰度共生矩阵(gray level co-occurrence matrix, GLCM)特征、224个灰度游程矩阵(gray level run length matrix, GLRLM)特征、224个灰度区域大小矩阵(gray level size zone matrix, GLSZM)特征和196个灰度依赖矩阵(gray level dependence matrix, GLDM)特征。基于特征之间的相关性分析结果,将1218个影像组学特征过滤掉887个,保留331个。进一步基于JMIM特征选择算法筛选,得到100个P值较小的影像组学特征用于构建3个预测模型。3个基本模型中影像组学特征的基尼重要性见图1(仅显示重要性不为零的特征)。
图1 3个基本模型中影像组学特征的基尼重要性分析
2.3 预测模型构建及其效能评估
影像组学特征筛选完成后,共构建3个基本模型和1个组合模型。根据交叉验证的结果,随机森林模型、自适应增强模型、梯度提升树模型和组合模型预测膀胱癌术后1年复发的AUC分别为0.729、0.710、0.709、0.732(表2,图2),Delong检验提示,各AUC之间均无显著统计学差异(P均>0.05)。
图2 经交叉验证影像组学模型预测膀胱癌术后1年复发的ROC曲线图AUC:同表2;ROC:受试者工作特征
表2 影像组学模型在训练组和经交叉验证对膀胱癌术后1年复发的预测效能
3 讨论
本研究基于CT图像构建膀胱癌术后1年复发的多个影像组学预测模型,包括随机森林模型、自适应增强模型、梯度提升树模型及3个基本模型构成的组合模型。经交叉验证,随机森林模型、自适应增强模型、梯度提升树模型及组合模型预测膀胱癌术后1年复发的AUC分别为0.729、0.710、0.709和0.732,提示CT影像组学模型可准确预测膀胱癌术后1年复发的风险,有助于早期识别高复发风险人群,进而提前进行个体化干预。
高复发率是影响膀胱癌患者预后的关键因素,降低复发风险是该类患者的重要诊治目标[7]。预测膀胱癌复发风险有助于膀胱癌治疗和随诊方案的选择,具有重要临床意义,是国内外泌尿外科领域研究的热点。既往有关膀胱癌复发风险预测的研究主要通过整合膀胱癌术前与术后临床资料、病理信息进行预测[8]。较为认可的2个预测模型分别是欧洲癌症研究和治疗组织(European Organisation for Research and Treatment of Cancer, EORTC)泌尿生殖系统癌症组制定的风险评估表和西班牙泌尿系统肿瘤治疗俱乐部(Spanish Urological Club for Oncological Treatment, CUETO)构建的评分模型[9- 10],但前者预测膀胱癌术后1年复发的准确度仅为61%,后者的准确度亦不足70%;且2个模型的阳性预测值均较低,尤其对于高级别非肌层浸润膀胱癌,阳性预测值均在20%左右,因此临床应用受限。部分研究通过筛选一些分子标志物如Ki- 67指数、纤维细胞生长因子受体3(fibroblast growth factor receptor 3,FGFR3)和p53等构建膀胱癌术后复发的预测模型[11- 13],但其是否具有临床应用价值尚需验证。
影像学在疾病的早期诊断、疗效监测及预后评估中发挥重要作用。CT检查具有价格低、扫描快、设备普及度广,对膀胱癌诊断效能高的优势,但其对软组织的分辨率不高,常规CT难以提供除解剖结构之外的更多信息,因而近年来膀胱癌诊疗的影像学相关研究主要集中于MRI[14]。但MRI检查价格高、扫描慢、设备普及度低,相关研究成果在国内的临床应用前景不如CT。另一方面,影像组学技术的出现为CT影像实现对膀胱癌复发风险的精准预测提供了可能。
影像组学技术通过高通量地提取病灶图像的信息特征,深入挖掘与疾病诊断、预后相关的影像特征,为临床诊疗提供了新的思路。截至目前,已有相关研究报道了基于CT图像的影像组学技术在膀胱癌诊疗中的应用价值[15- 17]。关于膀胱癌淋巴结转移预测方面,Wu等[15]纳入118例膀胱癌患者,分为训练集(80例)和验证集(38例),将影像组学特征与临床传统危险因素相结合以构建预测膀胱癌淋巴结转移风险的诺模图。训练集中,该诺模图预测效能的AUC为0.926,在验证集中AUC亦达0.899。有关膀胱癌病理分级鉴别方面,本研究团队在2020年发表的一项包含145例膀胱癌患者(训练集108例,验证集37例)的研究中,基于增强CT图像构建的影像组学模型鉴别膀胱癌病理高/低级别的AUC达0.860,灵敏度和特异度分别为88.5%和72.7%[16]。有关膀胱癌肌层浸润预测方面,Garapati等[18]研究显示,应用机器学习法构建的肿瘤形态学和纹理特征模型预测膀胱癌肌层浸润情况的AUC约为0.90。但目前基于CT影像组学预测膀胱癌术后复发风险的相关研究鲜有报道。
本研究通过从原始图像和滤波图像中提取海量影像组学特征,经筛选后获得与膀胱癌术后复发相关度最高的特征进行模型构建,并将多个模型进行结合构建组合模型以综合评估膀胱癌术后复发的风险。结果显示,随机森林模型、自适应增强模型、梯度提升树模型和组合模型预测膀胱癌术后1年复发的AUC均为0.7以上,且两两比较均无显著性差异,提示借助CT影像组学技术实现对膀胱癌术后早期复发风险预测具有可行性。但该模型未兼具高灵敏度和高特异度,如梯度提升树模型的灵敏度高达80.4%,其特异度仅为56.5%;随机森林模型的特异度高达83.6%,灵敏度却仅为52.9%,提示仅凭单一模型难以全面准确地预测膀胱癌术后1年的复发风险。虽然本研究未能构建一个“最优”模型,但与EORTC模型和CUETO模型相比,本研究构建的预测模型准确度更高,具有良好的临床应用前景。另一方面,本研究基于术前CT图像进行膀胱癌术后复发风险预测,而EORTC模型和CUETO模型则是根据患者的临床资料进行预测,本研究构建的预测模型可作为EORTC模型和CUETO模型的补充,进一步完善膀胱癌患者的术前评估内容。本研究结果提示,借助影像组学技术,可从常规CT影像中挖掘更多的信息,优化膀胱癌患者的诊治方案;而将基于多方面临床资料的多个模型相结合,可能有助于提高模型的预测效能。
本研究局限性:(1)为单中心回顾性分析,后续仍有必要开展多中心前瞻性研究进一步验证模型的预测效能。(2)由于样本量受限,本研究采用的交叉验证法可能高估预测模型的准确性,今后需考虑纳入更多病例,设定独立的训练集和验证集。(3)随机森林模型、自适应增强模型、梯度提升树模型及组合模型预测膀胱癌术后1年复发的AUC均在0.70~0.75之间,从临床应用的角度考虑,AUC仍偏低,需对模型进一步优化。(4)术后膀胱癌是否复发与多种因素相关,如患者的临床特征、手术方式、术后放化疗等,本研究仅聚焦于CT图像,未进行多方面因素的整合。后续考虑纳入更多的临床资料,以构建更完善、诊断效能更高的预测模型。
综上,基于CT图像构建的多个可预测膀胱癌术后1年复发的影像组学模型,有助于早期识别高复发风险患者,辅助指导个体化诊疗方案的制订。
作者贡献:张古沐阳负责研究设计、数据分析、论文撰写;许梨梨负责临床数据收集及整理;毛丽负责数据分析和论文修改;李秀丽负责数据分析指导;孙昊负责指导研究设计与数据分析及论文修改;金征宇负责研究项目设计。
利益冲突:本研究所使用影像组学平台由深睿医疗人工智能研究院提供,毛丽、李秀丽为深睿医疗人工智能研究院员工,其余作者均无利益冲突