MRI影像组学预测结直肠癌患者KRAS基因突变
2022-03-18樊芮娜林礼波解超莲刘杰克刘思耘邓和平陈晓丽
樊芮娜,李 杭,林礼波,解超莲,刘杰克,胥 豪,刘思耘,郭 鹏,王 丹,邓和平,王 闽,任 静,周 鹏,陈晓丽*
(1.四川省肿瘤医院&研究所 四川省癌症防治中心 电子科技大学医学院放射科,4.病理科,四川 成都 610041;2.四川省人民医院放射科,四川 成都 610031;3.GE医疗,北京 100176)
结直肠癌是世界范围内最常见的恶性肿瘤之一,发病率及死亡率逐年增高,且趋于年轻化[1]。Kirsten大鼠肉瘤(Kirsten rat sarcoma,KRAS)病毒癌基因是结直肠癌最重要的突变基因之一,系原癌基因,分为野生型和突变型,约1/3结直肠癌患者KRAS基因属突变型。大鼠肉瘤(rat sarcoma,RAS)病毒癌基因突变会激活膜受体酪氨酸蛋白激酶信号传递通路[2],而抗表皮生长因子受体(epidermal growth factor receptor,EGFR)单抗药物仅对野生型RAS或RAF基因结直肠癌有效[3]。准确评估结直肠癌患者KRAS基因亚型对实施精准治疗具有重要意义。本研究构建MR T2WI影像组学模型,评价其预测结直肠癌患者KRAS基因亚型的价值。
1 资料与方法
1.1 研究对象 回顾性分析2015年4月—2019年7月99例于四川省肿瘤医院经病理证实的结直肠癌患者,男69例,女30例,年龄23~87岁,平均(60.1±12.8)岁。纳入标准:①非黏液性结直肠腺癌;②术前未经任何治疗;③MR图像质量佳;④KRAS基因检测资料完整,与MR检查间隔时间<30天。本研究通过院伦理委员会审核(编号:SCCHEC-03-2017-037)。
1.2 仪器与方法 采用Siemens Magnetom Avanto 1.5T MR扫描仪,18通道体部相控阵线圈。检查前患者禁食、禁水8 h并完善肠道准备。嘱患者仰卧,行轴位、斜轴位(垂直于肿瘤长轴)、斜冠状位(平行于直肠长轴)及矢状位盆腔MR检查,采集快速自旋回波序列T2WI,参数:TR 2 500~8 000 ms,TE 73~110 ms,层厚5.0 mm,层间距1.0 mm,ETL 16~32,矩阵224×224~512×512,FOV 150×150~360×360,扫描时间14 min。
1.3 图像分析 由具有5年及10年影像学诊断经验的医师各1名采用ITK-SNAP 3.8.0软件以盲法阅片,测量肿瘤最大径,于轴位MRI中避开肠道内气体逐层勾画肿瘤ROI,有分歧时经讨论达成一致(图1)。对图像行1 mm×1 mm×1 mm各向同性体素重采样,并以z-score进行归一化处理。以GE Healthcare AK 3.2.0软件提取组学特征,包括直方图特征、形态特征及纹理特征,后者包括灰度共生矩阵(gray level co-occurrence matrix,GLCM)及灰度游程矩阵(gray level run length matrix,GLRLM)等。以Spearman相关性分析去除冗余特征(阈值0.7)。
1.4 实验室检查及KRAS基因检测 记录实验室检查结果,包括糖类抗原19-9(carbohydrate antigen 19-9,CA19-9)、糖类抗原242(carbohydrate antigen 242,CA242)、癌胚抗原(carcinoembryonic antigen,CEA)、铁蛋白、神经元特异性烯醇化酶(neuron specific enolase,NSE)及甲胎蛋白(α-fetoprotein,AFP)。于肿瘤切片中提取DNA,以PCR突变扩增系统方法分析KRAS(外显子2、3和4)突变。按7∶3比例将患者分为训练组(n=68)及验证组(n=31);再根据基因检测结果分为突变亚组及野生亚组,训练组2亚组分别含36、32例,验证组分别含16、15例。详见表1。
1.5 模型构建 基于训练组数据以最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归筛选预测KRAS基因突变的特征;采用后向逐步逻辑回归法(最小赤池信息准则)构建影像组学评分Rad-score模型;以单因素logistic回归及后向逐步logistic回归法构建临床模型及影像组学-临床联合模型。
1.6 统计学分析 采用R 3.5.3软件及SPSS 26.0统计分析软件。以频数表示计数资料,采用χ2检验比较亚组间性别差异;以±s表示符合正态分布的计量资料,采用独立样本t检验比较亚组间年龄差异;以中位数(上下四分位数)表示不符合正态分布的计量资料,采用Mann-WhitneyU检验比较亚组间实验室检查结果及肿瘤最大径差异。绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC),评价各模型预测结直肠癌患者KRAS基因亚型的效能。以DeLong检验比较各模型间效能差异。通过校正曲线评价3种模型的校正性能,以Hosmer-Lemeshow检验评价校准曲线的校准度。采用决策曲线分析(decision curve analysis,DCA)计算3种模型在一定阈值概率范围内的净收益,评价其临床价值。P<0.05为差异有统计学意义。
2 结果
2.1 基本资料 训练组和验证组内不同KRAS基因亚型结直肠癌患者性别、年龄、实验室检查及肿瘤大小差异均无统计学意义(P均>0.05),见表1。
表1 99例结直肠癌患者基本资料比较
2.2 模型构建 共于训练组中提取396个特征,经相关分析获得34个特征,以LASSO回归筛选获得4个特征,最终经后向逐步逻辑回归后获得3个影像组学特征,分别为Correlation_angle45_offset7、GLCMEntropy_AllDirection_offset1_SD及GLCMEntropy_angle45_offset7。影像组学模型Rad-score=0.162-1.154×Correlation_angle45_offset7-0.846×GLCMEntropy_AllDirection_offset1_SD-0.749×GLCMEntropy_angle45_offset7(图2)。经单因素及后向逐步逻辑回归获得2个特征用于构建临床模型及影像组学-临床联合模型,临床模型=-0.754-Ferritin×0.964-enzyme×1.420(图3);影像组学-临床联合模型=0.494+1.118×Rad-score-1.502×Ferritin(图4)。
2.3 模型效能 影像组学模型与临床模型、影像组学-临床联合模型预测2组KRAS基因亚型的AUC差异均无统计学意义(P均>0.05);影像组学-临床联合模型预测训练组KRAS基因亚型的AUC显著高于临床模型(Z=2.31,P=0.02),但验证组中无显著差异(Z=-0.73,P=0.47),见表2。校准曲线(图5)显示3种模型的预测值和观察值的一致性良好;Hosmer-Lemeshow检验显示预测值与观察值一致性良好(χ2=0.02~8.98,P均>0.05)。
表2 3种模型预测结直肠癌患者KRAS基因亚型的效能
2.4 临床应用 2组中3种预测模型的临床获益均优于“假定所有患者均为KRAS野生型(NONE)”及“假定所有患者均为KRAS突变型(ALL)”;影像组学模型和影像组学-临床联合模型的DCA曲线净收益值均高于临床模型,见图6。
3 讨论
目前已有多种影像学方法用于评价结直肠癌患者的基因突变状态。KAWADA等[4-5]采用PET/CT评估直肠癌影像学特征与遗传突变的关系,发现以最大标准摄取值预测KRAS/BRAF基因突变的准确率为71%~75%。YANG等[6]以CT纹理特征预测验证组大肠癌患者RAS基因家族/BRAF基因突变的AUC、敏感度及特异度分别为0.83、0.69及0.86。LUBNER等[7]发现CT纹理特征中的偏斜与KRAS基因突变呈负相关。随着MRI技术的不断发展,结直肠癌MR功能成像及影像组学研究逐渐受到关注[8-11]。XU等[12]报道,部分弥散成像定量参数,包括平均表观弥散系数和D*值,与结直肠癌KRAS基因突变显著相关。
本研究纳入3个与KRAS基因亚型相关的MR T2WI影像组学特征,包括1个形状特征(相关性,主要反映ROI内相邻体素灰度的相关性)和2个GLCM特征(熵,反映图像灰度异质性及不确定性)[13-15],从图像的相关性、同质/异质性等方面反映不同KRAS基因亚型结直肠癌的结构信号及生物学信号差异;共构建了3种预测模型,影像组学模型及影像组学-临床联合模型对训练组及验证组的预测效能均较高且无显著差异,而影像组学-临床联合模型对训练组的预测效能显著高于临床模型,提示影像组学可能具有实现无创预测基因改变的潜力,有助于改善难以获取病理标本时,以及局部活检取材因肿瘤存在异质性而难以满足全面准确诊断的要求的困境。
综上,MRI影像组学纹理特征有助于预测结直肠癌患者KRAS基因突变。本研究所获模型的可重复性及其泛化能力有待验证,且应进一步观察联合多序列图像是否有利于改善模型的预测能力。