基于CT 影像组学特征预测肾透明细胞癌分化程度的研究
2021-06-17吴文杰裴天龙汪永康王龙胜
吴文杰,裴天龙,汪永康,王龙胜
(安徽医科大学第二附属医院放射科,安徽 合肥 230601)
肾癌(renal carcinoma)约占所有成人恶性肿瘤的3%,是世界上第12 大最常见的癌症[1],2012 年诊断出33.8 万新病例,每年约有10 万人死亡[2]。肾透明细胞癌(clear cell renal cell carcinoma)是其中最常见的亚型,其在男性较女性更为常见,且发病率呈逐年上升趋势[3,4]。肾透明细胞癌的分期和核分级被认为是最有力的生存预测因子,福尔曼分级系统(Fuhrman grading system,FGS)是目前应用最广泛的核分级系统[5]。尽管肾透明细胞癌的检测和诊断手段众多,但大多数肾透明细胞癌是由于各种原因进行腹部超声或计算机断层检查偶然发现的[6]。肾肿瘤活检(renal tumor biopsy,RTB)是提供一种组织取样的方法,以帮助肿瘤组织学和亚型诊断风险分层管理。虽然RTB 对肾透明细胞癌具有较高的诊断准确性,但RTB 是一种侵袭性的手术,其不能在多个部位对肿瘤进行取样,不能区分肿瘤组织学亚型和核分级[7]。因此,肾透明细胞癌的影像组学研究日渐受到关注。随着模式识别工具的增加和数据集规模的增加,医学图像分析领域呈指数级增长,这些进展促进了高通量定量特征提取过程的发展,从而将图像转换为可挖掘数据,并随后对这些数据进行分析以提供决策支持,这种做法被称为影像组学[8]。影像组学涉及到定量成像特征的高通量提取,目的是从放射图像中创建可挖掘的数据库,一般包括采集图像、对所采集的图像进行ROI 区域的勾画、提取并筛选所需要的影像组学特征、建立影像组学模型,并对模型的诊断效能及临床应用价值进行评估[9],这种对图像特征数据的深入分析和挖掘揭示了图像与医疗结果之间的定量预测或预后关联。本研究主要基于CT 影像组学特征对肾透明细胞癌分化程度进行预测,现报道如下。
1 资料与方法
1.1 一般资料 本项研究经我院机构审查委员会批准,患者无需知情同意。收集2018 年12 月~2020 年12 月安徽医科大学第二附属医院收治的102 例肾透明细胞癌患者作为研究对象,纳入标准:①患者临床及影像资料均通过我院图片归档与通信系统(PACS)与病理数据库连接;②均于术前2 周内行腹部CT 平扫+增强检查;③术后病理标本均进行组织病理学评估,必要时进行免疫组化;④经1 位具有多年肾病理学经验的病理科医师重新检查标本。排除标准:①进行手术前曾接受过治疗;②同时患有其他肿瘤;③存在成像伪影,使后续分析出现困难。采用国际公认的Fuhrman 核分级系统进行分组(根据癌细胞核大小、外形、有无异型性及核仁的有无、大小等将肾透明细胞癌分为4 级,其中Ⅰ级细胞核相对一致;Ⅱ级细胞核轻度异型;Ⅲ级细胞核中到重度异型并可见明显核仁;Ⅳ级细胞核重度异型并出现多核、巨核、奇异核改变),分为高分化组(Ⅰ~Ⅱ级)及低分化组(Ⅲ~Ⅳ级),各51 例;另将这些患者随机按照7∶3 的比例分入训练组72 例和验证组30 例。
1.2 仪器与方法 扫描采用西门子64 层螺旋CT 扫描仪。根据常规断层扫描,请患者双手抱头,从膈顶一直扫描至髂前上棘,所有CT 扫描获得的平扫及三期增强图像分别用纵隔窗显示。扫描条件为层厚5 mm,准直64×0.625,管电流160~320 mA,管电压120 kV,窗宽250~450 HU,窗位30~50 HU。检查之前均对患者进行呼吸把控,去除患者身上所有金属物品(包括手机、钥匙等)。
1.3 图像采集与分割 采用ITK-SNAP 软件(Version 3.5.1,来源:http://www.itksnap.org)对所有纳入的肾透明细胞癌患者图像进行手动分割,选择病灶最大层面,由1 名有3 年以上腹部影像诊断经验的主治医师对病灶进行分割,然后再由另1 名有10 年腹部影像诊断经验的放射主任医师确认,以保持肿块勾画的一致性。需要注意的是:应于肿瘤肿物边缘勾画轮廓,包括坏死、囊变和出血区域,但不包括正常肾组织、肾周或窦脂肪,见图1。
图1 肾透明细胞癌的手动分割勾画ROI 示意图
1.4 影像组学特征的提取、降维和建模 勾画好ROI区域后,将原始图像及勾画后的图像一并导入A.K软件(美国通用电器公司开发,Analysis-Kit),对所采集的原始特征,首先去除冗余和不相关特征,使用套索方法(Lasso)选择最优的特征子集构建最终模型,包括选择常规参数lambda,根据最小的lambda选择非零的系数来确定最后保留的特征数,最后保留具有显著预测价值的特征。在确定特征个数后,选择最具预测能力的特征子集,并对相应的系数进行评估,从而建立数据模型。
1.5 统计学方法 使用R 语言软件Version 3.5.1 进行统计分析和作图。不同分类及不同集合之间的纹理特征差异采用Wilcoxon 秩和检验。高分化组及低分化组提取的纹理特征数据分别进行方差分析与LASSO 降维运算,最终获得显著的纹理特征及受试者工作特征曲线(ROC),ROC 曲线及曲线下面积(AUC)用于评价单个特征及模型的预测效能。以P<0.05 为差异有统计学意义。
2 结果
2.1 影像组学特征提取 共提取10 个特征,其中7个来自动脉期,1 个来自门脉期,2 个来自静脉期,没有一个来自延迟期,见图2。
图2 选取出的10 个纹理特征
2.2 影像组学模型的诊断 由预测概率计算rad_score 值,并根据阈值给出分类结果,高分化组及低分化组组间分类结果比较,差异有统计学意义(P<0.05),见图3。同时,在高分化组和低分化组之间建立评估模型,模型的ROC 曲线显示,训练组AUC=0.85(95%CI:0.75~0.92),灵敏度和特异度分别为0.79 和1.00,阳性预测率和阴性预测率分别为1.00 和0.65;验证组AUC=0.90(95%CI:0.73~0.98),灵敏度和特异度分别为0.90 和0.89,阳性预测率和阴性预测率分别为0.95 和0.08,见图4。
图3 高分化组及低分化组分类结果的差异分布图
图4 模型性能的ROC 曲线分析图
2.3 影像组学模型的临床应用价值 建立肾透明细胞癌预测模型决策曲线(图5),曲线显示本研究影像组学模型在0~0.7 的较大阈值范围内具有很好的临床应用价值。
图5 影像组学模型的临床应用决策曲线
3 讨论
由于肾透明细胞癌的转移和预后与其分化程度密切相关,因此目前临床对肾透明细胞癌的术前诊断要求不断提高。而传统的影像诊断受到影像医师经验以及主观因素等的影响,无法准确提供其术前的相关信息,因此亟需更精确的术前诊断方法。
目前,应用影像组学手段进行肾脏疾病的相关研究已经取得了许多进展,如Deng Y 等[11]应用CT纹理分析对肾透明细胞癌和乳头状细胞癌进行了鉴别,并对Furrman 核分级进行了预测;颜蕾等[12]结合患者临床特征和影像特征的组学方法建立了术前预测均质肾透明细胞癌和肾乏脂肪血管平滑肌脂肪瘤的影像组学模型,该研究使用了患者的三期增强图像,所得模型的敏感性和特异性均较高;王平等[13]建立了基于增强CT 的影像组学模型来鉴别肾透明细胞癌和肾非透明细胞癌;Shu J 等[14]利用CT 的影像组学特征来预测高低级别肾透明细胞癌;韩冬等[15]使用WHO/ISUP 分型对基于影像组学的肾透明细胞癌进行了术前预测。本研究选取了102 个研究对象,纳入了所有对象的腹部CT 平扫+三期增强图像,提取了共396 个影像特征,利用mRMR 去除冗余和不相关特征后,再利用套索方法最终选取出10个最具预测意义的特征,其中7 个来自动脉期,1 个来自门脉期,2 个来自静脉期,没有一个来自延迟期。经Wilcoxon 检查后高分化组及低分化组组间分类结果比较,差异有统计学意义(P<0.05);同时,在高分化组和低分化组之间建立评估模型,模型的ROC 曲线显示,训练组AUC=0.85(95%CI:0.75~0.92),灵敏度和特异度分别为0.79 和1.00,阳性预测率和阴性预测率分别为1.00 和0.65;验证组AUC=0.90(95%CI:0.73~0.98),灵敏度和特异度分别为0.90 和0.89,阳性预测率和阴性预测率分别为0.95 和0.08,提示模型的AUC 值、灵敏度、特异度、阳性预测率和阴性预测率均处在较高的水平,取得了较好的成果。此外,建立肾透明细胞癌预测模型决策曲线显示,本研究影像组学模型在0~0.7 的较大阈值范围内具有很好的临床应用价值,提示基于传统CT 影像的影像组学,不但能提高诊断准确率,还能提供肉眼无法观察的疾病内部特征及一系列量化病灶异质性的相关参数[16],得到疾病个体差异,进而为肿瘤分型、临床治疗方案选择和预后提供依据。本研究对于肾透明细胞癌的术前分化程度的预测模型,在无创的前提下,较为准确的提供了患者的术前诊断信息,对于临床有一定的指导价值。
此外,本研究利用mRMR 及LASSO 的筛选技术,获得了10 种高阶纹理特征(灰度共生矩阵及游程矩阵),对于肾透明细胞癌的异质性有了较好的反映。为了减少不同组别间因研究对象数量不同所导致的过拟合,本研究所纳入的高级别肾透明细胞癌和低级别肾透明细胞癌数目保持了一致,在进行分配训练集和验证集时不同组别的数目分别对应,这样训练集和验证集的不同组别间可以分别比较,结果发现应用基于CT 的影像组学预测肾透明细胞癌分化程度的模型具有很好的诊断价值,与传统影像学方法相比,影像组学方法保持了无创性这一优势,同时极大的提升了对患者影像学资料的信息挖掘,对临床治疗的指导意义更大[17-20]。与Shu J 等[14]研究相比,本研究的特征提取稍有不足,但本研究是对于所有对象的平扫及三期增强图像进行综合分析,从而得出涵盖较多影像细节的模型,所得模型的敏感性和特异性也相对较佳。但本研究也存在着一些局限性,首先,本研究采用了严格的纳入及排除标准,这一定程度上保证了实验对象的一致性,但同时也导致了本研究对象相较于同类型的其他影像组学研究稍显不足,因近年来影像组学的研究从单中心的个人研究,逐渐发展趋向于多中心、大数据的联合研究,因此本研究的成果仍待进一步的深入拓展;其次,扫描机器的不同,扫描参数及使用对比剂药量等会直接影响最终图像的一致性,再加上影像组学的图像选取还无法做到全自动化完善,手动勾画的过程存在不可避免的偏倚,其均会对最终模型的诊断效能造成影响;最后,本研究选取的腹部平扫+增强三期图像的二维截面(病灶最大面积),所取得的信息仅限于病灶的某一平面,无法获得病灶的三维特征,这也有待日后进一步的研究。
综上所述,基于CT 的影像组学模型对术前预测肾透明细胞癌分化程度有着较好的效果,可以对临床工作起到一定的指导作用。