CT放射组学对肾乏脂肪血管平滑肌脂肪瘤的预测价值
2022-09-13韩志巍文娣娣魏梦绮李天云
韩志巍,文娣娣,郭 宁,魏梦绮,李天云
(空军军医大学西京医院放射诊断科,陕西 西安 710032)
大多数肾脏肿瘤无症状,多在影像学检查中被偶尔发现[1],其中肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)最常见,据报道在<4 cm的肾脏肿瘤中ccRCC约占85%[2]。恶性肾脏肿瘤需要积极干预,如手术切除、射频消融等[3],而肾血管平滑肌脂肪瘤(angiomyolipoma,AML)为良性肿瘤,无需过多干预。通常肾AML含有肉眼可见脂肪,常规CT扫描足以将其与其他肿瘤鉴别开来[4],在肾AML中约有5%的病例为乏脂肪血管平滑肌脂肪瘤(angiomyolipoma without visible fat,AMLwvf),其病灶内无肉眼可见脂肪,故极易将其误诊为恶性肿瘤而行手术治疗,这既增加了患者的身体、心理及经济负担,也浪费了国家医保费用[5]。尽管人们之前对于AMLwvf与其他恶性肿瘤间在鉴别诊断方面做了很多研究与尝试[6],但在临床实践中要将其准确鉴别仍然困难。近年来随着人工智能及计算机辅助纹理分析技术的应用,通过对肾脏病灶常规CT图像提取纹理特征并进行分析,可区分肾脏良性与恶性(及其亚型)肿瘤[78]。本研究收集近8年来我院手术且经病理证实的AMLwvf以及各种常见病理类型肾脏肿瘤病例,回顾性使用放射组学分析技术对其进行分析建模、鉴别诊断。
1 对象与方法
1.1 对象
首先对我院2010年1月至2018年10月期间的肾AMLwvf、ccRCC、肾嫌色细胞癌(chromophobe renal cell carcinoma,chRCC)、乳头状肾癌(papillary renal cell carcinoma,pRCC)、肾嗜酸细胞瘤(renal oncocytoma,RO)等病理数据进行检索,所有病例均有细胞学及免疫组化结果,所有组织病理学结果均由我院具有10年以上泌尿生殖系统病理学经验的专家完成。然后在医院图像存档和传输系统(picture archiving and communication systems,PACS)中对所有患者进行图像回溯、筛选。
患者纳入标准:①病例经术后细胞学及免疫组化证实;②患者术前CT检查包括平扫(precontrast phase,PCP)、皮髓质期(corticomedullary phase,CMP)、肾实质期(nephrographic phase,NP)、排泄期(excretory phase,EP)四期图像,层厚<8 mm,螺距≤1;③CT扫描病灶内无肉眼可见脂肪;④ccRCC选择CT平扫无囊变、增强扫描无典型“快进快出”强化者;⑤患者检查前未接受任何手术或治疗。
患者排除标准:①CT扫描期相不全、层厚≥8 mm、螺距>1、运动伪影明显或造影剂注射不合格等一切导致CT图像质量不佳难以满足机器学习的患者;②CT征象典型且与AMLwvf明显不同,容易鉴别的ccRCC患者;③经过治疗后或有出血的患者。
由两位具有10年以上腹部影像诊断经验的放射科副主任医师单独对CT图像进行初步筛选,如有异议共同讨论或请第三位高级职称医师(主任医师)帮助判定。最终本研究纳入198(ccRCC 71、chRCC 41、pRCC 41、RO 16、AMLwvf 29)例患者,其中男性111例;年龄22~84(54.84±12.46)岁。AMLwvf患者年龄显著低于常见肾肿瘤组(P<0.01)。各类患者年龄及性别见表1。
表1 入选患者年龄及性别特点
1.2 方法
1.2.1 CT扫描 所有患者均采用多排螺旋CT装置(SOMATOM,TOSHIBA,GE,UNITED IMAGING)扫描,层厚<8 mm,螺距≤1,管电压120 kV,采用基于自身质量的自动管电流调制(200~400 mAs)方法扫描。使用浓度为370 g/L或350 g/L含碘造影剂,并采用高压注射器于肘前静脉团注,注射器速率为3.5 mL/s,注射总量为65~70 mL。采用四期扫描方案,包括:PCP、CMP(造影剂注射后30 s延迟)、NP(造影剂注射后70 s延迟)和EP(造影剂注射后180 s延迟)。
1.2.2 图像感兴趣区勾画 首先将198例患者全部CT图像从医院PACS中导出,然后匿名传入汇医慧影影像大数据智能分析科研平台(https://mics.radcloud.cn/),再对病灶勾画。本研究病灶感兴趣区勾画是由两名具有10年以上腹部诊断经验的放射科副主任医师共同完成,具体为:对每一位患者各期图像中病灶进行手动勾画,每幅图像感兴趣区均在两名放射科医师同时在场(一名勾画、一名监督)的情况下手动勾画完成,确保每一层病变最外缘与勾画线重合,最大限度将病灶与相邻肾周脂肪、正常肾实质分开,如果PCP病变轮廓显示不清,则参考增强扫描确定病变边界。在整体勾画工作进行前,首先由两名放射科医师分别对随机选择的20例患者进行训练性勾画,然后再对全部患者进行感兴趣区勾画(图1A~B)。随后在平台上选中所有勾画好的感兴趣区,点击特征值计算按键,后台将会自动对每个容积感兴趣区(volume region of interest,VOI)提取1 029个特征值(图1C)。
A:皮髓质期病灶轻度强化,沿病灶边界对其进行手工勾画;B:肾实质期病灶轻度强化,沿病灶边界对其进行手工勾画;C:勾画病灶的容积感兴趣区三维重建图像。AMLwvf:乏脂肪血管平滑肌脂肪瘤。图1 61岁女性,左肾肿瘤无肉眼可见脂肪,术后病理结果为AMLwvf
1.2.3 特征提取和特征筛选 从勾画的VOI中提取特征数据,包含基于特征类和基于过滤器类两类特征。基于特征类包括:①一阶统计量特征19个;②形状特征13个;③纹理特征,包含灰度级共生矩阵(gray level co-occurrence matrix,GLCM)28个、灰度级长度矩阵(gray level run length matrix,GLRLM)16个、灰度级形状矩阵(gray level size zone matrix,GLSZM)16个。基于过滤器类包括:小波分析、拉普拉斯转换、对数特征、指数特征、明可夫斯基函数、分形维数等8种方式处理后再提取强度特征和纹理特征,共1 029个放射组学特征。特征符合成像生物标志物标准化倡议[9]。放射组学特征种类繁多,为降低模型复杂度和避免过拟合风险,通过统计学等方法,对冗余、无效特征进行筛除。本研究采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)用于特征筛选,对高维图像进行降维,最后保留数种有意义的高度相关性的特征用于统计分析计算。在高维数据中,LASSO回归方法被证明是非常高效的[10]。
1.2.4 机器学习 经过特征提取以及特征筛选,将提取到的特征针对研究目标,构建机器学习模型,并进行验证。由于特征值的取值范围可能相差甚大,如特征1取值为1 000~2 000,特征2取值为0.1~0.2,为确保训练模型收敛,特征的取值范围应当相同,因此我们进行了特征值标准化。同时,为避免训练集、测试集随机划分可能带来模型过拟合风险,采用5折交叉验证训练机器学习分类器,将筛选出的特征用于机器学习模型构建,采用多层感知机(multi-layer perception,MLP)、支持向量机(support vector machine,SVM)、K最近邻(k-nearest neighbor,KNN)、逻辑回归(logistic regression,LR)等机器学习模型,并从中选取最佳诊断效能的分类器。使用受试者工作特征(receiver operating characteristic,ROC)曲线、曲线下面积(area under the curve,AUC)以及准确率、敏感度和特异度评估机器模型预测能力。
2 结果
对提取的特征值通过LASSO方法进行降维处理,采用5折交叉验证,模型最大迭代次数为5 000。最终PCP提取出10个有效特征,其中一阶统计量特征1个,形状特征1个,GLCM 4个,GLRLM 1个,GLSZM 3个;CMP提取出10个有效特征,其中一阶统计量特征3个,形状特征1个,GLCM 2个,GLRLM 2个,GLSZM 2个;NP提取出14个有效特征,其中一阶统计量特征6个,形状特征1个,GLCM 6个,GLSZM 1个;EP提取出2个有效特征,其中形状特征1个,GLCM 1个;CMP特征和NP特征混合后提取出7个有效特征,其中一阶统计量特征1个,形状特征1个,GLCM 4个,GLRLM 1个。
绘制各模型在各期的ROC曲线并计算AUC,选出的较优模型是MLP(图2)。CMP+NP的MLP机器学习分类器模型结果最优,AUC为0.86 ± 0.06,准确率为70.20%,敏感度为0.862 1、特异度为0.674 6(表2)。其他机器学习分类器模型结果均较MLP逊色,例如CMP+NP的KNN机器学习分类器模型结果:AUC为0.74 ± 0.07,准确率为80.30%,敏感度为0.758 6、特异度为0.810 6(图3)。
蓝色线为CMP+NP期MLP分类器的ROC曲线;周围的浅色曲线为其5折交叉验证ROC曲线;图右下角显示CMP+NP期MLP分类器及其5折交叉验证的 AUC。ROC:受试者特征;AUC:曲线下面积;CMP:皮髓质期;NP:肾实质期;MCP:多层感知机。图2 CMP+NP期MLP分类器ROC曲线
表2 MLP分类器模型的各期性能
蓝色线为CMP+NP期KNN分类器的ROC曲线;周围的浅色曲线为其5折交叉验证ROC曲线;图右下角显示CMP+NP期KNN分类器及其5折交叉验证的 AUC。ROC:受试者工作特征;AUC:曲线下面积;CMP:皮髓质期;NP肾实质期:KNN:K最近邻。图3 CMP+NP期KNN分类器ROC曲线
3 讨论
由于体检的普及和CT的大量使用,在肾脏肿瘤中肾癌检出的比例较高[11],肾脏穿刺活检术、手术、射频消融等有创诊疗随之相应增加。在所有手术患者中约20%的病灶为良性,且其中12%为AML[12]。AML是由脂肪、平滑肌和血管成分按不同比例组成[13],AMLwvf主要由平滑肌和血管成分组成,缺乏脂肪。目前肾脏肿瘤诊断仍以CT检查为主,而CT诊断AML主要依赖于肿瘤内肉眼可见脂肪,故CT诊断AMLwvf非常困难,目前包括MRI在内的其他影像检查对AMLwvf诊断作用有限,故我们试图通过放射组学特征分析以及机器学习的方法来解决这个难题。
本研究通过对肾脏病灶CT图像进行放射组学特征分析以及机器学习建模,达到AMLwvf与常见肾肿瘤鉴别目的。这基于从患者每一期、每一个感兴趣区内所提取的1 029个特征中筛选出的2~14个放射组学特征,以及我们将CMP与NP的放射组学特征合并后共提取2 058个特征,再通过LASSO降维,从中提取出7个最优放射组学特征。我们发现,在常规四期图像以及CMP+NP相结合图像中,提取出具有诊断效能的影像特征中都包含一阶统计量特征和GLCM特征,提示与病灶体素强度和灰度分布强相关。一阶统计量特征通常使用基本的度量值反映区域内体素强度的分布。GLCM是像素距离和角度的矩阵函数,通过计算图像中一定距离和一定方向的两点灰度之间的相关性来反映图像在方向、间隔、变化幅度及快慢上的综合信息,其中五期的有效GLCM特征中都包含Maximum Probability(发生次数最多的相邻强度值对的数目),说明AMLwvf与其他肾脏常见肿瘤在相邻像素间的灰度值分布差异性明显。
在KNN、LR、MLP、SVM四种分类器中,效果最佳的分类器为MLP,在CT四期数据上AUC在0.70以上、准确率在70.00%以上,在CMP和NP结合时,AUC达 0.86±0.06,较CUI等[14]研究(AUC为0.96,准确率为92.69%)结果差。这是因为他们的患者人数更多(AMLwvfs达40例,RCC 128例)、CT扫描层厚更加薄(1 mm或3 mm)、造影剂用量更大(70~100 mL/人),以及对照病例中肾癌也与我们经过筛选的不典型肾癌不同。另外NP、CMP在AMLwvf鉴别诊断中表现均优异,这与之前的一些研究结果一致[11,1516],并且我们首次将CMP与NP两期结合,这进一步提高了模型对AMLwvf的预测值。虽然临床经验以及文献[15]研究认为PCP对肾脏的乏脂肪肿瘤鉴别有重要意义,CT检查不必进行全部四期扫描,这样不仅可以减少患者的辐射剂量,而且还可以节省检查时间,但是笔者认为多期扫描获益更佳。
目前运用机器学习辅助鉴别肾脏肿瘤的研究不多[8,17],应用于AMLwvf鉴别诊断的研究更少[7,18],其中有研究运用SVM分类器鉴别AMLwvf和ccRCC的准确率分别为72.30%和72.10%,准确率与本研究相差不大。与以往研究方法相比,本研究不同之处在于:①入组病例病种分布接近自然真实比例、CT扫描期相多;②勾画的病灶感兴趣区为VOI,单层面勾画更能反映肿瘤的空间特性;③首次将所提取的两期相特征值合并后再筛选特征值;④至少应用了4种分类器,采用5折交叉验证,并且还对所有数据采取了人工与机器分别处理、互相验证的数据处理方式。
本研究为回顾性研究,时间跨度较大,CT扫描机种类多,在这期间随着检查设备更新换代,扫描方法也有改进,以及图像重建技术的升级,造影剂品牌、含碘量、高压注射器使用等方面的不同,以至于CT图像并非完全一致,但是所有数据均能满足机器学习要求。前期我们一共收集到55例AMLwvf患者,经过图像筛选最终仅29例患者纳入研究,可见即使是在同一所医院数据也很难保证完全一致。虽然本模型并非最优,但我们认为这更加符合临床实际情况——CT机型、造影剂、扫描方法等复杂且不统一,故本研究结果更适合推广。
AMLwvf无症状,多在体检及偶然检查中发现,患病率可能被低估,且缺乏影像特征,也容易误诊。在我院近8年的手术病例中一共找到55例AMLwvf患者,约占同期我院肾脏手术患者的2%,这些病例术前约90%诊断错误,尽管部分病例术前CT强烈提示本病,在一段时间随访后最终选择手术治疗。故应用机器学习进行鉴别诊断具有重要的临床意义与应用价值,但机器学习需要大量数据进行训练,而实际情况中符合条件的AMLwvf数据较少,需要与之相鉴别的肾脏肿瘤数据量巨大。有学者认为这种数据集的不平衡可能造成错误分类,所以一些研究进行了数据扩增[1819],我们认为对于影像组学,数据的扩增意义不大,并且我们比较了处理结果与真实结果,但结果差异不大,所以没有对数据进行扩增。
以往研究[7,11,14,18]将AMLwvf与常见肾肿瘤分别进行比较,本研究是将AMLwvf与常见的医师鉴别困难的肾肿瘤整体进行比较,我们认为这样更有意义。因为AMLwvf不需要手术,而其他肾癌均需手术治疗。最终我们选择了同期在我院手术切除病灶的198例患者,其中ccRCC 71例,pRCC 41例,chRCC 41例,RO 16例整体作为AMLwvf的鉴别对象。虽然RO为良性肿瘤,但RO常有恶变或本身存在恶性成分,影像表现难以与肾癌鉴别,常采用手术治疗方式,故也将其作为整体鉴别对象的一部分。
本研究存在一定局限性。第一,总样本量还不够大,主要因为AMLwvf发病率低,我们只选择了在我院手术的患者,没有多中心合作,这可能会增加过度拟合的风险。第二,我们没有选择同期在我院手术的全部ccRCC,只在这些患者中选取了肉眼观察(大小、形态、边缘、密度、强化等)与AMLwvf相似且难以鉴别的病例,可能存在选择偏倚。第三,本研究所有病例影像数据、扫描方法等还有提高的空间,有进一步提高鉴别诊断效能的可能。第四,提取的纹理特征及分类器仍有待扩展,以进行更加全面和精确的诊断。
综上所述,通过对肾脏CT扫描CMP与NP中提取的放射组学特征相结合后再提取特征,并建立机器学习MLP模型,对AMLwvf与其他常见肾脏肿瘤的鉴别结果最优。这个模型有望辅助人工诊断,提高AMLwvf鉴别诊断工作效率与准确性。