基于薄层CT 的影像组学模型对非小细胞肺癌EGFR DEL19 和L858R 敏感性突变的预测价值
2023-05-31惠俊国翁巧优高瑞杰杨伟斌王祖飞纪建松
惠俊国,翁巧优,刘 妍,高瑞杰,杨伟斌,王祖飞,纪建松
1.温州医科大学附属第五医院/浙江省丽水市中心医院/浙江大学丽水医院放射科,浙江 丽水 323000;2.浙江省影像诊断与介入微创研究重点实验室,浙江 丽水 323000;3.浙江省丽水市中医院放射科,浙江 丽水323000
肺癌为全球发病率最高的恶性肿瘤,且绝大多数为非小细胞肺癌(non-small cell lung cancer,NSCLC)[1]。NSCLC 患者除手术治疗外,放、化疗等手段也可显著提高患者预后,但不良反应损伤较大,限制了其在临床中的应用。随着基因学的发展,靶向治疗逐渐显现出对肿瘤治疗的优势,相对于传统放化疗,其可针对性杀灭肿瘤细胞,减少对机体正常细胞的损害,从而减少不良反应。肺癌靶向药物发展迅速,最具代表性的有表皮生长因子受体酪氨酸激酶抑制剂(EGFR-TKIs),其可有效延长EGFR 敏感性突变NSCLC 患者的无进展生存期及总生存期,还可提高患者的生活质量[2]。而EGFR 敏感性突变中,以19 号外显子缺失(DEL19)及21 号外显子替代(L858R)最常见,且DEL19 突变稍多于L858R 突变[3];两者对TKIs 治疗的反应性不同,TKIs 治疗后DEL19 突变患者的无进展生存期及总生存期明显优于L858R 突变患者[3-4]。研究表明,L858R 突变患者的化疗效果更好[5]。因此,准确识别DEL19 突变及L858R 突变对临床决策尤为重要。但目前基因测序成本较高,且为侵入性检查,检测结果也会受取样影响造成偏差。
近年来,各种组学研究发展迅速,利用组学的方法可从影像中挖掘出更多肉眼难以识别的特征,为疾病的诊疗提供依据[6]。影像组学已应用于各个系统,帮助临床进行精准诊断及预后评估[7-12]。Kim 等[11-12]运用影像组学成功预测脑胶质瘤患者的异柠檬酸脱氢酶(IDH)及O6-甲基鸟嘌呤DNA 甲基转移酶(MGMT)突变类型。Weng 等[13-14]将影像组学应用于肺癌患者的诊断及EGFR 突变类型预测。这些研究均表明影像组学不仅能够对疾病的宏观表现进行分析,还可对微观的基因分型进行甄别。本研究基于NSCLC患者的CT 平扫图像构建可预测EGFR DEL19 及L858R 突变的影像组学模型,并评估其预测效能。
1 资料与方法
1.1 一般资料
收集丽水市中心医院2015 年7 月至2019 年1 月经病理证实的NSCLC 患者共590 例,经纳入及排除标准筛选,最终纳入149 例,其中DEL19 突变63 例,L858R 突变86 例。149 例患者按照6∶4 的比例随机分为训练集(104 例)和验证集(45 例)。训练集DEL19 突变44 例,L858R 突变60 例;验证集DEL19 突变19 例,L858R 突变26 例。
纳入标准:①CT 平扫前未接受任何针对肿瘤的治疗;②经组织病理学诊断为NSCLC;③基因检测证实存在EGFR DEL19 或L858R 突变。排除标准:①非原发肿瘤;②获取CT 图像前已行放化疗等姑息性治疗;③图像存在伪影,影响病灶观察;④存在其他类型突变者。
本研究经医院伦理委员会批准[科研伦审(2022)第(122)号]。
1.2 仪器与方法
使用Philips Brilliance 64 排CT 扫描仪行CT平扫。扫描参数:200 mA,120 kV,层厚0.9 mm;运用iDose3 混合迭代重建算法进行重建,层距0.45 mm,层厚2 mm;视野(15 cm×15 cm)~(20 cm×20 cm),螺距1.2,旋转时间350 ms,矩阵1 024×1 024。图像在Philips Extended Brilliance 工作站(EBW)进行处理。
1.3 纹理特征提取
将所有患者的胸部薄层CT 肺窗DICOM 格式图像导入ITK-SNAP 软件(http://www.itksnap.org/)。由2 名具有10 年以上胸部影像诊断经验的医师,分别独立勾画病灶ROI,勾画时沿高密度病灶轮廓边缘手动逐层分割,最后融合生成容积感兴趣区(volume of interest,VOI),如有不同意见,则与第3 位具有20 年胸部影像诊断经验的医师共同讨论决定。将分割好的VOI 文件及原始图DICOM 文件导入GE A.K.软件(版本3.0.1.A)进行影像组学分析,共得到396 个不同的纹理特征。
1.4 降维及特征筛选
基于薄层CT 平扫图像,利用放射组学A.K.软件共提取到396 个纹理特征进行预处理,用中位数替代参数中的异常值。首先行Z-score 标准化处理,以去除不同数据的单位限制。符合正态分布的数据采用方差分析进行筛选,不符合正态分布数据则采用Kruskal-Wallis 检验降维。采用Spearman 秩相关检验去冗余(去除相关性>0.9 的参数)。最后采用最小绝对收缩与选择算子算法(LASSO)回归分析及10 倍交叉验证法对数据降维,筛选出高度相关的纹理特征。对得到的纹理参数行多因素logistic 回归分析。
1.5 统计学分析与模型构建
采用组内相关系数(intraclass correlation coefficient,ICC)对2 名医师提取的特征行一致性评估,ICC≥0.75 表示一致好。使用R 语言行统计分析(版本3.4.4,https://www.r-project.org/)。利用多因素logistic回归分析构建训练集和验证集的预测模型,即基于CT 图像的影像组学模型、基于临床特点的临床模型,以及两者的联合模型,并用ROC 曲线及列线图评价各模型的预测效能。以P<0.05 为差异有统计学意义。
2 结果
2.1 临床资料的单因素、多因素分析(表1)
表1 149 例非小细胞肺癌患者临床资料的单因素、多因素分析
单因素分析显示,性别、吸烟状态、病灶位置、分叶、空气支气管征、坏死与2 个突变亚型均有相关性(均P<0.05)。多因素分析显示,性别、病灶位置、坏死与2 个突变亚型均有相关性(均P<0.05)。
2.2 影像组学特征
2 名医师分割的病灶VOI 所提取的影像组学特征一致性好(ICC=0.834~0.892)。在病灶VOI 中提取396 个影像组学特征。经过降维筛选出4 个显著性最强的纹理特征,分别为标准差(stdDeviation)、集群突出物_ 角度0_ 偏移4(ClusterProminence_angle0_offset4)、相关性_角度0_偏移7(Correlation_angle0_offset7)和相关性_角度90_偏移4(Correlation_angle 90_offset4)。基于以上4 个纹理参数(表2),计算出相应的影像组学评分纳入模型构建。2 种突变亚型患者的小提琴图显示,两者影像组学评分差异有统计学意义(图1)。
图1 表皮生长因子受体基因(EGFR)L858R 突变和DEL19 突变影像组学评分的小提琴图 图2 基于训练集与验证集构建3 种模型的ROC 曲线 注:图2a 为训练集(AUC=0.744,95%CI 0.649~0.824);图2b 为验证集(AUC=0.874,95%CI 0.742~0.954)
表2 筛选出4 个组学特征的模型系数
2.3 模型预测效能
临床特征模型显示,训练集AUC 为0.643(95%CI 0.543~0.735),敏感度和特异度分别为62.2%和64.4%;验证集AUC 为0.778(95%CI 0.630~0.888),敏感度为84.2%,特异度为73.1%。影像组学模型显示,训练集AUC 为0.713(95%CI 0.616~0.798),敏感度和特异度分别为64.4%和76.3%;验证集AUC 为0.698(95%CI 0.543~0.826),敏感度为73.7%,特异度为61.5%。联合模型显示,训练集AUC 为0.744(95%CI 0.649~0.824),敏感度和特异度分别为75.6%和71.2%;验证集AUC为0.874(95%CI 0.742~0.954),敏感度为84.2%,特异度为88.5%(图2)。验证集中联合模型的预测效能优于影像组学模型(P=0.004)。列线图与校正曲线显示,联合模型在训练集和验证集中的预测概率与实际概率相近,与对角线拟合效果优于影像组学模型(图3,4),对EGFR 有较好的诊断能力。
图3 联合模型列线图 图4 影像组学模型及联合模型校正曲线 注:图4a,4b 分别为影像组学模型训练集与验证集校正曲线;图4c,4d 分别为纳入临床因素的联合模型训练集与验证集校正曲线
3 讨论
随着分子生物学的发展,分子靶向药物更多的应用于肿瘤的治疗之中。NSCLC 患者治疗不仅基于临床特点及肿瘤形态学,更多地依赖于个体的基因突变特征[15],尤其是EGFR 突变特点。DEL19 和L858R 突变约占NSCLC 患者EGFR 敏感性突变的90%[16]。也有研究表明,与传统化疗相比,二代TKIs 类药物阿法替尼治疗可有效提高NSCLC EGFR 敏感性突变患者的无进展生存期[17-18]。而随着EGFR 靶向药物研究的深入,部分研究表明,NSCLC EGFR DEL19 突变患者对TKIs 治疗反应性优于L858R 突变患者,且L858R 突变的NSCLC 患者化疗效果更好[3-5]。Yang等[5]的研究表明,对于L858R 突变患者,相比于TKIs,含铂类化疗药物治疗的中位总生存期更长。而Kato等[19]的研究也表明,TKIs 相较于化疗能明显改善DEL19 患者的总生存期,而L858R 患者效果较差。因此,对于NSCLC 患者的TKIs 靶向治疗,临床不仅需明确是否存在EGFR 敏感性突变,也应区分敏感性突变亚型,这更有利于患者的精准及个体化治疗。目前,临床最常用的基因检测方法为活检,但其为侵入性检查,存在由于取样误差造成样本无法代表病灶的整体生物学特征的可能。临床研究表明,由于缺乏足够的肿瘤细胞或可扩增的DNA,导致10%~20%的NSCLC 活检组织不足以进行分子分析[6],对临床工作造成困扰。
CT 扫描2 mm 的薄层图像已普及,且平扫较增强扫描适用范围更广,具有便捷、廉价、无创、可重复等优点。本研究采用影像组学对CT 图像进行数据挖掘,提取人眼难以识别的图像纹理特征,构建影像组学模型,探讨基于影像组学的预测模型对NSCLC患者EGFR 敏感性突变亚型的预测能力。
既往文献报道多是基于临床或宏观影像因素区分EGFR 突变状态。Rizzo 等[20-21]认为,空气支气管征、胸膜凹陷征、肺气肿和吸烟与NSCLC 患者EGFR敏感性突变相关。肖磊等[22]的研究显示,EGFR 敏感突变与非敏感突变组(包括野生和非敏感突变)的空气支气管征、胸膜凹陷征、空泡征、磨玻璃密度影、毛刺征、分叶征及胸腔积液差异均无统计学意义。以上研究表明,空气支气管征、胸膜凹陷征等影像学征象有助于区分EGFR 突变与否,但未发现其对识别敏感性突变有帮助。本研究纳入149 例发生EGFR 敏感性突变(包括DEL19 及L858R)的NSCLC 患者,筛选出3 个临床(包括性别、病灶部位、坏死)及影像特征与上述突变亚型相关,但基于临床特点及影像学所能选取的特征有限。影像组学则可充分挖掘医学影像深部数据,探索其与EGFR 突变的关系,用于疾病诊断、预后评估和指导临床决策[23]。多项研究报道影像组学在预测EGFR 突变中的应用,但鲜有报道运用影像组学预测DEL19 或L858R 突变[24-25]。Liu 等[26]利用影像组学所构建模型预测DEL19、L858R 突变的特异度分别为86.7%(69.3%~96.2%)和70.4%(49.8%~86.3%)。该研究采用CT 增强扫描图像,优点是可提供更多可供挖掘的数据,缺点是检查成本升高,同时部分患者存在对比剂使用禁忌证,使该模型适用范围受限。Li 等[27]利用影像组学识别DEL19 和L858R 突变与野生型及其他突变,预测效能较好,其在验证集中的AUC 达0.775,该研究识别了DEL19 和L858R 突变与其他突变或野生型的基因型,但并未进一步区分DEL19 突变和L858R 突变。本研究选择NSCLC 患者薄层CT 平扫图像,层厚2 mm,检查成本相对较低,可重复性好,无明确禁忌证,优势明确,所构建的模型适用范围更广泛,能达到理想效果;影像组学模型在验证集中预测DEL19和L858R 突变的AUC 达0.698;联合临床因素所构建的联合模型在验证集中AUC 显著提高,达0.874;验证集中联合模型的预测效能优于影像组学模型(P=0.004);列线图也表明联合模型对DEL19 突变和L858R 突变的预测效能更佳。
本研究的局限性:①入组患者有限,因部分患者仅行EGFR 突变的检测,未行DEL19 和L858R 位点的检测,后期将扩大样本量进一步分析。②采用2 mm层厚平扫图像,优点是构建模型适用范围更广,缺点是厚层图像可供挖掘的数据不如增强扫描图像。③纳入的临床因素相对较少,可能是由于样本量小、未筛选出其他相关的临床因素。后续研究应增大样本量,将病灶按大小分层,并纳入纵隔窗可显示的薄层增强扫描图像进行研究,这样可获取多一个维度的纹理特征。
综上所述,以2 mm 薄层平扫图像为基础构建的影组学模型应用范围广,且能够较准确预测NSCLC患者敏感性突变亚型,联合相关临床因素所构建的联合模型对DEL19 和L858R 突变的预测效能最优。