APP下载

基于增强CT影像组学特征建立条件推理树模型对肾癌亚型的鉴别诊断

2020-08-04鲍远照程琦葛亚琼严立张龙龙韦炜

中国医学影像学杂志 2020年7期
关键词:组学亚型病灶

鲍远照,程琦,葛亚琼,严立,张龙龙,韦炜*

1.安徽医科大学附属省立医院影像科,安徽合肥 230001;2.通用电气(中国)有限公司,上海 210000;*通讯作者 韦炜 weiweill@126.com

肾细胞癌(renal cell carcinoma,RCC)是常见的肾脏恶性肿瘤,在成人恶性肿瘤中发病比例为2%~3%[1],其中肾透明细胞癌(clear cell renal cell carcinoma,CCRCC)、肾嫌色细胞癌(chromophobe renal cell carcinoma,CRCC)及乳头状肾细胞癌(papillary renal cell carcinoma,PRCC)是主要的3种亚型,占90%以上[2]。对于RCC预后情况的评估,国际公认的指标为肿瘤组织学分级;但CRCC等绝大多数类型的肿瘤在以往常用的 Fuhrman分级系统及最新的WHO/ISUP分级系统中并未得到理想的预后参数证实[3]。临床上大多数通过手术切除或穿刺活检获取组织病理学信息;但手术切除和穿刺活检常存在诸多风险,后续治疗信息的获取也存在一定的困难[4]。因此,术前使用影像学等非侵入性工具预测肿瘤亚型具有重要意义。影像组学是一种通过提取、分析和解释定量成像参数,反映肿瘤的显微特征,进而为肿瘤分型分级、基因定位、早期治疗及预后评估提供有用信息的新型工具[5]。本研究拟利用增强CT影像组学特征建立和验证一组三分类预测模型——条件推理树模型,以鉴别3种常见病理亚型RCC。

1 资料与方法

1.1 研究对象 回顾性分析2015年3月—2019年7月安徽医科大学附属省立医院行肾脏肿瘤切除术或穿刺活检术的患者资料。纳入标准:①严格按照固定扫描包获得完整的CT三期增强图像;②病理明确诊断为CCRCC、CRCC或PRCC。排除标准:①图像伪影较大经归一化处理后仍影响观察;②此前接受过介入治疗者。最终纳入119例患者共120枚病灶,其中CRCC 60例,CRCC 27例,PRCC 32例(1例患者单侧肾脏含有2枚独立病灶)。

1.2 检查方法 使用GE Discovery CT 750HD CT扫描仪,扫描范围从膈顶至髂棘水平。扫描参数:管电压120 kVp,管电流280~300 mA,层厚5 mm,重建1.25 mm,层间距5 mm,螺距1.375∶1。先行肾脏平扫,再经肘静脉团注非离子型对比剂碘海醇(320 mgI/ml)60~80 ml,速度2.5~3.0 ml/s;延迟后依次进行皮髓期(30 s)、实质期(70 s)和分泌期(180~300 s)扫描。

1.3 图像分割及提取 由2名分别具有5年及10年以上工作经验的放射科主治医师采用盲法协商后共同完成感兴趣区(ROI)的勾画。图像选择皮髓期病灶最大轴位层面。为降低图像窗宽、窗位不同造成视觉上的误差,在ROI勾画前对图像窗宽、窗位进行归一化处理(设置窗宽280 Hu、窗位40 Hu)。然后将病灶最大层面轴位图像以及勾画的相应ROI图像导入A.K.软件进行特征提取。

1.4 特征筛选与模型建立 将病灶按照7∶3纳入训练组与验证组。使用Pearson相关分析对训练集中的数据进行相关性分析,剔除相关性>0.9的特征;使用Caret包中过滤法sbf函数对剩下的特征实施过滤,过滤函数采用随机森林函数,并进行10折交叉验证进一步筛选出最佳特征子集。根据筛选后的训练集特征,使用条件推理树“ctree”方法进行建模。本研究为三分类问题,采用机器学习中经典的“一对其余,One Vs.Res”拆分策略,将3种RCC进行分类。

1.5 统计学方法 采用R 3.4.4软件对影像组学数据进行分析。特征间的相关性使用Pearson相关分析。特征的过滤使用cart包中sbf函数。训练集的训练使用Caret包中train函数。建模方法使用条件推理树“ctree”。特征重要性的评价及相应权重的给出由“ctree”完成。采用验证集数据对模型进行测试,所得受试者工作特征(ROC)曲线用于评价模型的诊断效能。混淆矩阵计算模型整体的准确率以及各组的敏感度、特异度、阴性预测值、阳性预测值。

采用SPSS 24.0软件对一般特征进行统计学分析。CCRCC、CRCC和PRCC组患者年龄及病灶最大径等计量资料以表示,组间比较采用单因素方差分析,计数资料组间比较采用χ2检验,P<0.05表示差异有统计学意义。

2 结果

2.1 一般特征 3组RCC亚型患者性别比差异有统计学意义(P=0.025);各组患者年龄及最大径比较,差异均无统计学意义(P>0.05,表1)。

表1 3组RCC亚型患者一般特征比较

2.2 影像组学特征 每枚病灶最大层面轴位图像提取出396项特征,包括直方图特征、灰度联通区域矩阵特征、灰度共生矩阵特征、Haralick特征、游程矩阵特征、形态学特征6大类。Pearson相关性分析及sbf函数筛选和过滤出32项特征(图1)。结果显示,来自直方图特征中的方差(Variance)、来自Haralick中的熵和(sumEntropy)以及来自灰度共生矩阵中的相关全向偏差(Correlation _AllDirection_offset1)是最有预测意义的3项特征。其中方差在CCRCC组、CRCC组以及PRCC组中均具有良好的预测价值;而熵和在CCRCC组和PRCC组中具有较好的预测意义;相关全向偏差则在CRCC组中具有良好的预测意义(图1)。

图1 经条件推理树模型排序后的特征在3组中的分布。Y轴代表特征名称,X轴代表特征的相对权重,中间带蓝色圆点的线代表各特征在预测该种亚型RCC中的重要性,线越长表示该特征越重要

2.3 诊断效能 条件推理树模型在鉴别3种常见病理亚型RCC时均具有良好的预测能力,且该模型预测PRCC效能最高,ROC曲线下面积在训练组中达0.95,在验证组中达0.89(表2,图2)。

3 讨论

目前,病理检查是肿瘤鉴别诊断的“金标准”[6],但对于肿瘤亚型,仍有大量的非侵入性影像学方法对其进行鉴别,以提供术前及预后信息,减少活检的需要[7]。

传统的CT图像通过对肿瘤形态学(出血、坏死、中心瘢痕、钙化和囊变等)的视觉观察进行定性评估,同时通过测量注射对比剂前后CT值的变化粗略量化肿瘤之间的差异。如CCRCC增强后呈典型“快进快出”表现;而CRCC与PRCC增强后更倾向于持续性或渐进性强化[8-9]。然而,当上述表现存在较多重叠时,常规CT鉴别较困难。影像组学主要从肿瘤中定量提取与病理生理学相关的特征,以显示肿瘤的异质性,从而进行预后评估[10],其对肿瘤的潜在诊疗价值高于临床常规应用的形态学影像征象,且不受主观因素的影响[11]。

表2 条件推理树模型鉴别CCRCC、PRCC、CRCC的诊断效能

图2 条件推理树模型鉴别CCRCC、PRCC、CRCC的ROC曲线。A为训练组,B为验证组。0为透明细胞癌,1为嫌色细胞癌,2为乳头状肾细胞癌,Res表示剩余两组

本研究通过提取并筛选皮髓期图像的组学特征,尝试建立并验证一个三分类预测模型——条件推理 树模型,探讨该模型在鉴别CCRCC、CRCC及PRCC方面的价值。结果显示,该模型预测CCRCC及RCC具有良好的诊断价值(AUC=0.87、0.89);在预测CRCC时也具有较好的诊断价值(AUC=0.70)。在参与模型预测的32项特征中,来自直方图特征中的方差在预测CCRCC、CRCC及PRCC时均具有最好的能力。方差表示ROI内像素及其平均值之间的方差,用于描述图像亮度信息的变化,提示强化程度可能是正确预测3种RCC最有价值的参数[12-13]。这可能与3种RCC的血供有关:CCRCC间质内血窦丰富,血管外间隙较宽,碘剂更容易进入;CRCC间质内多为厚壁血管,碘剂进入较为缓慢;PRCC间质内毛细血管稀疏,碘剂进入过少[14]。

目前,利用影像组学对不同病理亚型RCC进行鉴别诊断的研究较多,但大多数研究局限于CCRCC与非透明细胞癌(non-clear cell renal cell carcinoma,non-CCRCC)纹理参数间的两两比较,尚无法用于预测多种RCC[7-8,13,15-16]。Kocak等[15]基于增强CT纹理参数创建具有外部验证的支持向量机模型用于区分CCRCC与non-CCRCC,该模型在使用皮髓质期图像时准确率为84.6%。Zhang等[16]将熵、峰度等多种纹理特征进行结合,用于区分CCRCC与non-CCRCC,AUC值为0.94。采用相似的方法鉴别PRCC与CRCC,所得准确率为0.78。而利用影像组学同时预测多种亚型RCC的研究鲜有报道。Raman等[8]利用多期相CT纹理参数创建随机森林模型,用于区分嗜酸性细胞腺瘤、CRCC、囊肿和PRCC,所得AUC分别为0.89、0.91、1.00和1.00,但该研究主要局限于肾占位性病变良恶性的鉴别诊断,未能将同属肾恶性肿瘤的CRCC纳入研究。本研究尝试利用条件推理树模型对RCC进行精确分类,可以为治疗和预后提供更为可靠的信息。

本研究的局限性在于:①本研究样本量相对较少,缺乏足够的样本证明该模型的临床实用性;②本研究CRCC的病例较其他两组少,仅27例,数据不均衡,模型存在偏倚,导致假阴性较高,敏感度较低。

本研究初步表明,利用增强CT影像组学特征建立和验证的条件推理树模型对CCRCC、CRCC及PRCC的鉴别诊断具有相对较高的临床应用价值,值得进一步探索改进,以期获得更加成熟的鉴别诊断体系,从而降低RCC的病死率。

猜你喜欢

组学亚型病灶
影像组学在肾上腺肿瘤中的研究进展
尖锐湿疣患者感染HPV亚型的研究及临床分析
东莨菪碱中毒大鼠的代谢组学
数字化断层融合(DBT)与全视野数字X线摄影(FFDM)引导乳腺病灶定位对比
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
Optimal UAV deployment in downlink non-orthogonal multiple access system: a two-user case
能谱CT 成像对非小细胞肺癌患者淋巴结转移的诊断价值分析
H4 亚型和N2 亚型禽流感病毒二重RT-PCR 检测方法的建立
Acknowledgment to reviewers—November 2018 to September 2019