CT纹理分析鉴别诊断肾脏嫌色细胞癌与嗜酸性细胞腺瘤
2020-06-02于子洋庞惠泽黄文镜
于子洋,由 贺,庞惠泽,黄文镜,任 克*
(1.中国医科大学附属第一医院放射科,3.病理科,辽宁 沈阳 110000;2. 中国医科大学肿瘤医院,辽宁省肿瘤医院医学放射科,辽宁 沈阳 110000)
图1 患者女,54岁,RO,结合冠状位图像,在轴位肾脏增强扫描皮质期和实质期图像病灶内1 mm处逐层勾画ROI(A~C),并生成三维图像(D)
肾脏嫌色细胞癌(chromophobe cell renal carcinoma, CCRC)和嗜酸性细胞腺瘤(renal oncocytoma, RO)均起源于肾集合管润细胞,发病比例分别为6%~8%和3%~7%[1],但因性质不同,手术方法及预后均不同,故术前鉴别诊断十分重要。纹理分析是新兴的图像后处理技术,通过计算机软件提取肉眼无法识别的纹理特征数据,结合机器学习能够对肿瘤内在异质性进行定量分析[2],进而有效鉴别肾脏不同类型肿瘤[3]。本研究探讨基于肾脏CT图像的纹理分析鉴别CCRC与RO的价值。
1 资料与方法
1.1 一般资料 收集2013年1月-2018年7月中国医科大学附属第一医院收治的经术后病理证实的64例CCRC和31例RO患者。CCRC组男30例,女34例,年龄31~79岁,平均(53.2±9.5)岁;RO组男11例,女20例,年龄23~79岁,平均(55.0±13.8)岁。纳入标准:①首诊发现病灶,未行穿刺或相关治疗;②经术后病理及免疫组织化学证实诊断;③采用同一台CT机进行肾脏CT增强扫描。排除标准:①混合型肾肿瘤;②病灶<1.0 cm且无法准确勾画ROI。
1.2 CT扫描方法 嘱患者扫描前饮水1 000 ml。采用Philips 256层螺旋CT机行仰卧位屏气扫描,范围自膈肌至髂前上棘连线水平。扫描参数:管电压120 kV,管电流100 mAs,层厚5 mm、 层距0.5 mm;用高压注射器将1.5 ml/kg体质量碘海醇注射液经肘静脉于25 s内注射完毕后行增强扫描,采用阈值触发扫描技术,将检查区置于降主动脉与腹主动脉交界处,自动触发阈值设定为100 HU,达到阈值后延迟25 s行皮质期扫描,随后30 s行实质期扫描,3 min后再行排泄期扫描。
1.3 图像分析
1.3.1 选取 图像及ROI 从图像存储与传输系统(picture archiving and communications system, PACS)中检索图像,并将2组皮质期和实质期图像导出至ITK-SNAP version 4.11.0软件(www.itk-snap.org),由2名高年资放射科医师采用双盲法选取皮质期和实质期图像进行纹理分析,意见不一致时经协商解决。结合冠状位图像,在轴位肾脏增强扫描皮质期和实质期图像上沿肿瘤轮廓内约1 mm逐层进勾画ROI(图1A~1C),得到肿瘤的三维ROI(图1D)。
1.3.2 提取纹理特征参数 将所得ROI传输到软件A.K.Version V3.0.0.R(Analysis Kit,GE Healthcare, China)提取纹理特征参数。采用纹理分析方法在分割出的肿瘤区域深入挖掘CT图像纹理特征,提取其中重复性好、非冗余、可表示肿瘤影像灰度分布和异质性的定量纹理参数。
1.4 统计学分析
1.4.1 筛选纹理特征参数 采用Anaconda2软件(www.anaconda.com)以Python语言从“sklearn”及“scipy”学习包中选择代码语言进行统计处理(图2);以“RandomForestClassifier”分类器对皮质期、实质期及综合两期后的396个纹理参数分别进行学习。设置396个纹理参数权重值总和为1分,使用“accuracy_score”算法来计算各期各纹理参数的权重值,并从高到低进行排序,去除权重值为0的冗余参数。根据样本量与参数的最佳拟合比及各参数所占比重选取纹理参数。
图2 使用随机森林算法及筛选纹理参数代码流程图
1.4.2 随机森林分类器 ①分别选取CCRC和RO的皮质期、实质期及联合两期降维后得到的前20个纹理参数,按照学习组与验证组样本量4∶1比例构建3个机器模型,利用Bootstrap方法将学习组样本集随机分成若干子集;②在CCRC和RO学习样本中随机选取若干个纹理特征,作为决策树每个节点的候选分裂特征,通过计算Giniindex选取评分最高的特征,以之划分每个节点,由此在若干个训练样本集中生成多棵决策树;③将所有训练决策树集成为随机森林分类器模型,以之预测验证样本的良恶性,根据多数投票准则,将票数最多的结果作为最终预测结果。
1.5 评价纹理参数效能及统计学分析 采用Logistic回归计算患者风险评分,评分范围为0~1,分数越高表明诊断CCRC的概率越大,进而评价纳入的纹理参数预测因子对预测此2种肾疾病分类的效能。采用Bootstrapping法进行纹理分析标签的内部验证,避免过拟合偏差,并以逐步向后法准则选择纹理参数变量。应用ROC曲线获得AUC确定纹理分析定量参数对于 CCRC和RO的诊断阈值及效能(敏感度、特异度和准确率)。P<0.05为差异有统计学意义。
2 结果
2.1 纹理特征 共收集到396个纹理参数特征,自每个ROI内提取代表CT图像灰度特征的144个灰度共生矩阵(grey level co-occurrence matrix, GLCM)、180个灰度游程长度矩阵(gray-level size zone matrix, GLSZM)和11个灰阶运行长度矩阵(run-length matrix, RLM),代表图像纹理特征的10个Haralick特征,代表CT体素强度的42个直方图特征(Histogram)和代表ROI的三维大小和形状的9个Formfactor特征。
2.2 纹理参数
2.2.1 纹理分析参数及预测结果 按学习组与验证组4∶1比例分配皮质期、实质期及联合两期病例,得到3个验证集的AUC值(图3);根据Hughes效应及参数权重>0.01选取权重值由高到低的前20个纹理参数(图4)。
2.2.2 评价3个模型的诊断效能 采用Logistics回归法检验随机森林算法筛选所得20个纹理参数的拟合优度,得出皮质期、实质期及两期联合模型的ROC曲线,见图5、表1。
3 讨论
CCRC与RO具有相似的形态学、组织学及超微结构,病理学仅靠光镜观察HE染色片难以鉴别,需要进一步结合免疫组织化学加以区分[4]。术前定性诊断肿瘤具有重要临床意义。临床对RO多采取保守观察,对CCRC则多行肿瘤部分或根治性切除术。 CT或MR主要依据中央星状瘢痕延迟强化诊断RO,但实际上仅25%~30% 的RO存在中央瘢痕,且多为直径>2.5 cm的肿瘤[5];而约23%的CCRC也有此表现[6],使得传统影像学方法鉴别二者具有一定局限性。纹理分析是通过计算图像像素强度得到像素分布规律,定量提取能够反映病变异质性纹理参数的图像后处理技术,其目的是充分挖掘医学图像的特征[7]。纹理分析结合机器模型能够学习图像内部肉眼无法识别的特征,进而实现对疾病鉴别诊断及预测预后[8-9]。目前已证实纹理分析有助于鉴别肿瘤良恶性和肿瘤分期及疗效、预后评估[10-11]。本研究显示基于CT图像的纹理分析鉴别CCRC与RO的准确率高于86%。
在肾脏平扫图像上无法准确勾画病灶的ROI,且有研究[2,12]发现基于CT平扫的纹理分析对于肾肿瘤分型无意义,故本研究未纳入平扫图像,而选择肾脏皮质期和实质期纹理参数进行分析。本研究用于筛选纹理参数的随机森林算法具有较高准确性和较低过拟合性,近年研究[13]证实其适合用于筛选纹理参数。该算法是HO在1995年发明的一种机器学习技术,可根据变量层次结构将样本分类为数个已知的“森林”,每个“森林”由大量随机生成的包含样本不同特征的“树”组成,每“树”可根据变量特征随机对数据集进行分类,最终得到的分类器可用于对给定样本进行分类。本研究发现结合皮质期和实质期的纹理参数准确率为0.945,高于任一单期相,与SHU等[14]研究的结论相符,可能与样本量增加及参数特征多样化有助于提高机器模型对于疾病诊断的准确性有关。
表1 皮质期、实质期及其联合诊断效能
图5 降维后纹理参数鉴别CCRC和RO的ROC曲线 A.皮质期验证集AUC值,结果为0.88; B.实质期验证集AUC值,结果为0.86; C.两期联合验证集AUC值,结果为0.94
本研究对CCRC和RO两种少见肿瘤进行回顾性分析,发现基于CT图像的纹理分析可无创、简便、准确地区分CCRC与RO。本组样本量较少,且手动勾画ROI可导致一定误差。后续将纳入更多标准化图像,采取自动勾画ROI方法进一步验证纹理分析对于CCRC与RO的鉴别诊断价值。