基于CT 传统机器学习和深度神经网络预测肺腺癌表皮生长因子受体基因突变
2023-10-11娄琴罗显丽刘欢犹露黄琼赵世杰李邦国
娄琴,罗显丽,刘欢,犹露,黄琼,赵世杰,李邦国*
1.遵义医科大学附属医院放射科,贵州 遵义 563000;2.贵州省第二人民医院医学影像科,贵州 贵阳 550001;3. GE 医疗高级分析团队,上海 200000;4.遵义医科大学附属医院病理科,贵州 遵义 563000;5.西北工业大学自动化学院,陕西西安 710072;*通信作者 李邦国 lbg2015@163.com
肺癌是全球发生率和死亡率最高的癌症[1]。非小细胞肺癌(non-small cell lung cancer,NSCLC)约占肺癌的85%,肺腺癌是其最常见的组织学亚型[2]。不同基因突变是各型肺癌发病和演变的基础,因此肺癌治疗已进入针对特异性基因或蛋白的个体化分子靶向精准治疗阶段。肿瘤分子靶向治疗依据个体的驱动基因进行针对治疗,疗效显著且有良好的安全性,可有效改善患者的生活质量及延长无进展生存期[3-4],已成为最受关注的治疗方法之一[5]。
在肺腺癌的基因突变中,表皮生长因子受体(epidermal growth factor receptor,EGFR)突变是最常见的类型[6],其靶向药物研究也是众多靶向基因中最为成熟的,而获得准确的分子表型是指导分子靶向治疗的前提。基于CT传统机器学习的影像组学模型已显示出对EGFR突变状态的预测价值,还需更先进的影像组学方法提高EGFR突变状态的预测性能[7]。深度学习神经网络是多层前馈神经网络,其接受3D图像作为输入,可以在学习高度判别性图像特征的同时以监督的方法进行端到端训练[8]。因此,本研究对比分析基于CT传统机器学习的影像组学模型和深度学习神经网络模型对肺腺癌EGFR基因突变的预测效能,旨在为肺癌治疗方案的选择提供支持。
1 资料与方法
1.1 研究对象 回顾性收集遵义医科大学附属医院2018年10月—2020年11月经病理证实为肺腺癌且有EGFR基因检测结果和薄层胸部CT扫描(1 mm或1.25 mm)的173例患者。男75例,女98例,年龄31~79岁,平均(58±10)岁,按7∶3随机分层抽样分为训练集122例、验证集51例。纳入标准:①具备EGFR基因突变检测结果;②肿瘤病理标本获取时间与胸部CT检查时间不超过1个月;③CT图像资料完整;④临床资料完整,包括性别、年龄、吸烟史及临床TNM分期等。排除标准:①术前行抗肿瘤治疗(放疗、化疗或放化疗);②CT图像难以辨别肿瘤边界;③CT图像质量差,无法进行图像分割与特征提取。本研究经遵义医科大学附属医院医学伦理委员会审批通过(KLLY-2020-058),豁免患者知情同意。
1.2 CT检查及图像分割 采用Siemens Somatom Sensation AS128或Siemens Somatom Definition Flash双源CT行胸部CT扫描。受检者取仰卧位,双手上举,吸气末屏气后扫描,扫描范围从肺尖至肺底,包括两侧胸壁、腋窝。CT扫描及图像重建参数:管电压120 kV,自动管电流,螺距0.6~1.2,常规图像层厚8~10 mm,薄层图像层厚1.0 mm,肺窗窗宽1 500~1 800 Hu、窗位-600~-500 Hu,纵隔窗窗宽250~350 Hu、窗位40~50 Hu,标准算法重建。
使用GE Lung Intelligence Kit 2.3.0软件,首先对图像进行重采样及去噪等预处理,使图像在3个解剖方向上像素间距均为1.0 mm。然后在肺窗上标注肿瘤病灶的感兴趣区(ROI)(图1),尽量避开其中的血管、支气管、胸膜组织及周围不张的肺组织,以获得肿瘤的三维定量特征。由2名具有7年、10年胸部影像诊断经验的主治、副主任医师采用盲法分别完成图像标注,产生分歧时协商解决;并随机抽取50例数据进行二次标注,评估观察者间的一致性。
图1 女,42岁,肺腺癌。CT示病灶位于右肺上叶(箭),A.肺窗轴位病灶原图;B.病灶区放置ROI;C.ROI三维图
1.3 特征提取 肿瘤CT形态学特征分析:由2位高年资放射科医师分别独立使用CT薄层图像对肿瘤最大直径、分叶征、毛刺征、胸膜凹陷征等进行分析、记录,产生分歧时经讨论达成一致。
使用Lung Intelligence Kit软件,严格参照图像标志物标准倡议[9]进行组学特征提取。每个病变共提取1 037个组学特征,包括基于一阶直方图特征、描述肿瘤形态的形态特征及描述肿瘤内部和表面纹理的灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、邻域灰度差异矩阵、灰度依赖矩阵等纹理特征,以及图像变换特征、小波变换和拉普拉斯变换特征。
1.4 特征筛选及建模 按照7∶3对特征数据进行随机分层抽样分组。特征筛选前首先通过组内相关系数(ICC)评估观察者间的差异,ICC>0.8为重复性较好;然后对异常值特征采用中值替代,并进行Z-score标准化处理。然后分别采用最小冗余最大相关算法(minimum redundancy maximum relevance,mRMR)及最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法筛选得到最具有显著性预测潜力的特征。通过逻辑回归算法及深度神经网络(图2)分别构建模型,并使用受试者工作特征(ROC)曲线及曲线下面积(AUC)比较模型效能,联合临床建立诺模图。模型拟合优度使用Hosmer-Lemeshow检验测试。1.5 统计学分析 采用R 3.6.0(https://www.r-project.org/)软件。计数资料用例数或百分比表示,采用χ2检验;非正态分布的计量资料以M(Q1,Q3)表示,采用Mann-WhitneyU检验。使用单变量及多变量Logistic回归分析肺腺癌患者EGFR突变的独立预测因子。LASSO降维通过glmnet实现,最小冗余最大相关算法通过mRMR完成。深度学习网络构建主要通过mxnet包构建,学习率0.005,批大小5,训练次数250次。P<0.05为差异有统计学意义。
图2 深层神经网络结构
2 结果
2.1 一般资料 训练集及验证集患者性别、吸烟史、分叶征、毛刺征、空气支气管征、肿瘤最大直径等比较,差异无统计学意义(P>0.05),见表1。
表1 肺腺癌患者训练集和验证集的临床特征、CT形态学特征比较
2.2 临床资料和CT形态学特征的Logistic回归分析通过单变量Logistic回归分析后将P<0.1的变量(表2)(性别、吸烟史、空气支气管征及肿瘤最大直径)纳入多变量Logistic回归分析并建立临床模型。结果显示男性发生EGFR突变的概率是女性的0.243倍。性别(女=0,男=1):OR=0.243(95%CI0.103~0.460),P<0.001;空气支气管征(无=0,有=1):OR=3.358(95%CI0.829~22.744),P=0.132。
表2 肺腺癌患者EGFR突变预测因子的单因素分析
2.3 影像组学特征筛选及建模 每个病灶共提取了1 037个组学特征,保留ICC≥0.8的组学特征729个;再经过mRMR筛选后保留30个特征,通过十折交叉算法和LASSO回归对特征进行降维、筛选,最终保留9个显著性特征(图3),按图像预处理方式分类,包括7个小波滤波预处理图像特征和2个拉普拉斯滤波预处理图像特征;按特征类型分类,包括3个一阶特征和6个纹理特征。
图3 LASSO回归筛选进行十折交叉验证示意图(A)与变量系数压缩过程(B)
训练集中EGFR野生型、EGFR突变型组学评分与验证集比较,差异均有统计学意义(P<0.05,图4)。因此,影像组学评分Rad-score为肺腺癌EGFR基因突变的独立预测因子。
图4 训练集(A)与验证集(B)构建的Rad-score对EGFR基因状态的预测比较
基于深度学习网络建模,训练集和验证集的AUC分别为0.738、0.682,逻辑回归模型的训练集、验证集AUC分别为0.730、0.700,两种模型AUC差异无统计学意义(Z=0.564,P=0.573),但均能对肺腺癌患者EGFR突变有良好的预测能力。本研究选择简单的逻辑回归模型和临床显著性指标进行联合,训练集AUC为0.840(95%CI0.76~0.91),验证集AUC为0.710(95%CI0.53~0.88)。联合模型的效能高于临床模型及影像组学模型(图5)。
图5 不同模型预测EGFR突变的ROC曲线。A.基于深度学习网络构建影像组学模型在训练集及验证集中的效能;B、C.基于逻辑回归模型构建的临床、影像组学及联合模型在训练集与验证集中的效能
对联合模型构建预测每例患者肺腺癌EGFR突变的诺模图(图6A)。为进一步对诺模图的预测准确度进行校正,分别在训练集及验证集中绘制校准曲线(图6B、C),拟合优度良好,通过Hosmer-Lemeshow检验进行验证,P=0.4991,诺模图预测的突变概率与实际突变概率的一致性较好。
图6 A.联合模型诺模图;B、C分别表示训练集和验证集中用于预测EGFR突变概率的诺模图的校准曲线,x轴代表诺模图预测的突变概率,y轴代表实际的突变概率
3 讨论
3.1 临床特征与肺腺癌EGFR基因突变的关系 李淑华等[10]研究表明女性及无吸烟史是肺腺癌患者EGFR基因突变的预测因素。轩昂等[11]研究显示突变型组女性、无吸烟史、有血管集束征等多于野生型组。王紫君等[12]也发现EGFR基因突变更易发生于女性患者。本研究结果显示与EGFR野生型相比,EGFR突变型肺腺癌更多地发生于女性、不吸烟的患者,与上述研究一致,关于其发生机制目前尚无明确原因。尽管相关研究提供了EGFR基因突变的临床表征信息,但偏重于定性研究,且目前仍无可靠的临床特征可以准确预测EGFR基因突变状态。Liu等[13]通过对385例手术切除的肺腺癌分析,结果显示EGFR突变与毛刺征、空气支气管征、空泡征、血管集束征、胸膜凹陷征等征象有关。而本研究显示EGFR基因突变仅与空气支气管征有关,表明肺腺癌患者EGFR突变与胸部CT形态学特征关系的研究易受阅片医师的资历水平及主观意识影响。尽管上述研究提供了EGFR基因突变的临床表征信息,但目前尚无可以准确预测EGFR基因突变状态的可靠临床特征。
3.2 影像组学特征与肺腺癌EGFR基因突变的关系本研究表明影像组学特征训练集和验证集肺腺癌EGFR基因突变状态的Rad-score比较有显著差异,影像组学特征在预测肺腺癌EGFR基因突变方面具有良好的效能,与文献报道[14-15]一致,表明影像组学特征对预测肺腺癌EGFR突变有重要意义。
3.3 影像组学模型、临床模型及联合模型对肺腺癌EGFR基因突变的预测效能 Dang等[16]与陈琦等[17]研究显示影像组学特征预测效能优于临床特征或影像学特征,三者联合构建的模型预测效能最高,与本研究一致。本研究建立的组学模型对EGFR基因突变的预测效能高于临床模型,而联合模型的效能高于单独的临床模型和影像组学模型,高于Wu等[18]与Hong等[19]研究的预测效果。Liu等[20]研究预测EGFR的突变状态准确度为75.5%,AUC为0.73;Zhang等[21]研究的准确度为75.6%;本研究得出准确度为78.6%,对于EGFR基因突变预测的准确度还需进一步研究,提升预测效能,为临床决策提供支持。此外,杨蕾等[22]对210例肺腺癌患者胸部增强CT图像的动脉期和静脉期分别进行ROI勾画及特征提取,并建立预测模型,在训练集和验证集中AUC分别为0.89及0.79,得出基于增强CT影像组学特征建立的模型对肺腺癌间变性淋巴瘤激酶基因突变状态有较好的预测价值。而本研究受病例数量的限制,未行间变性淋巴瘤激酶基因突变及增强CT图像研究。
3.4 本研究的局限性 样本量相对较小且为单中心研究;仅对胸部CT平扫图像进行特征提取,缺少增强图像;仅针对EGFR基因突变状态进行分析,后续纳入其他基因突变的研究,如间变性淋巴瘤激酶、KRAS、RET基因等。
总之,基于机器学习和深度学习网络构建组学模型均能较好地预测肺腺癌EGFR基因突变,有较好的应用价值,提供了一种新的定量分析方法。
利益冲突 所有作者均声明不存在利益冲突