构建CT影像组学模型预测肺鳞状细胞癌肿瘤突变负荷
2022-06-24管超李梦玲蒋礼青李思敏张宇冲张博李智赵明芳
管超,李梦玲,蒋礼青,李思敏,张宇冲,张博,李智,赵明芳
(中国医科大学 1.附属第一医院肿瘤内科,沈阳 110001;2.附属盛京医院肿瘤科,沈阳 110004;3.附属第一医院临床流行病学与循证医学教研室,沈阳 110001)
肺癌是全球范围内发病率和死亡率最高的恶性肿瘤。作为非小细胞肺癌(non-small cell lung cancer,NSCLC)的主要亚型之一,肺鳞状细胞癌(简称鳞癌)约占肺癌的25%~30%[1-2]。因肺鳞癌独特的临床病理和生物学特征,部分患者可获益于免疫治疗。但免疫治疗并非对所有患者有效[3],因此,迫切需要寻找到免疫治疗的生物标志物。目前,最常用的2种生物标志物为程序性死亡配体1(programmed cell death-ligand 1,PD-L1)和肿瘤突变负荷(tumor mutational burden,TMB)[4-5]。有研究[6]表明,TMB在预测免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)治疗方面优于PD-L1。但由于侵入性活检及全外显子组测序(whole exome sequencing,WES)的高成本等因素,阻碍了TMB检测的大规模推广。
放射组学作为一个快速崛起的领域,已在预测肺癌的诊断、预后和最佳治疗方面显示出重要作用[7]。有研究[8-9]显示,以CT为基础的影像组学在体细胞突变[如NSCLC的表皮生长因子受体(epithelial growth factor receptor,EGFR)和间变性大细胞淋巴瘤激酶(anaplastic lymphoma kinase,ALK)突变]中存在潜在的预测价值。此外,有研究[10]显示影像组学可以预测早期肺腺癌患者的TMB状态。
本研究旨在探讨从CT图像中提取的放射组学特征预测肺鳞癌患者TMB状态的价值,并基于放射组学数据开发TMB的预测模型。
1 材料与方法
1.1 研究对象
共纳入35例初治肺鳞癌患者。纳入标准:(1)病理结果为肺鳞癌;(2)在癌症影像数据库(the cancer imaging archive,TCIA)中可下载胸部CT原发病灶全部影像。从TCIA数据库下载TCGA-LUSC数据集中37例患者的全部CT影像,其中1例因病灶边缘过于模糊无法勾画靶病灶,另1例因存在多个原发病灶而被排除。
1.2 图像分割与特征提取
本研究以开源医学图像处理软件(3D Slicer,版本4.11.0,http://www.slicer.org)为分析平台,从而实现图像分割及影像特征提取。将下载的普通CT图像加载到3D Slicer软件,调整肺窗(窗口宽度:1 400,窗位:-500),以实现图像统一化处理。由2名具有9年工作经验的放射科医生沿CT横轴位病灶最大层面轮廓进行三维半自动分割,并手动逐层修改以勾画感兴趣区(region of interest,ROI),尽量避开血管、气管、神经等正常组织。再由1名具有15年以上工作经验的高级放射科医生核实并确认 ROI。
采用 3D-Slicer 软件中的 Pyradiomics 包提取851个ROI 的放射组学特征。所有分割数据都用1 mm×1 mm×1 mm的体素重采样进行标准化,以减少图像采集异质性的影响。
1.3 TMB分组
从TCGA数据库下载肺鳞癌SNV数据集,用R软件计算下载数据中每个样品的TMB值,以数据集的TMB中位数为界,≤中位数的样品为低TMB组,>中位数的样品为高TMB组。
1.4 统计学分析
采用SPSS 25.0 软件和R4.0.2软件对影像组学数据进行处理。采用LASSO回归筛选影像学特征。采用logistic回归对得到的影像学特征建立模型。所得受试者操作特征(receiver operating characteristic,ROC)曲线和曲线下面积(area under the curve,AUC)用于评价所建模型的诊断效能。临床决策曲线(decision curve analysis,DCA)用于评估预测模型的临床实用性。
2 结果
2.1 图像分割与特征提取
本研究采用 3D-Slicer 软件对35例初治肺鳞癌患者CT影像的原发病灶进行三维图像立体分割,主要方法为沿CT横轴位病灶最大层面轮廓边缘进行三维半自动分割,并逐层手动修改,从而获得原发病灶的三维立体图像即放射组学的ROI。
采用 3D-Slicer 软件中的 Pyradiomics 包对获得的35个ROI进行影像组学特征提取,共获得851个ROI 的影像组学特征,其中包括shape、firstorder、glcm、gldm、glrlm、glszm和ngtdm 7种类型。
图1 原发灶的三维立体图像Fig.1 Three-dimensional image of the primary foci
2.2 TMB分组
从TCGA数据库共下载491例肺鳞癌SNV数据集,采用R软件(maftools包)计算每个样品的TMB值,从而得出TMB的中位数为3.64/MB(图2)。然后与从TCIA下载的35例肺鳞癌样本进行匹配,得到35例TCIA肺鳞癌样本的TMB分组情况。
图2 TMB分组情况Fig.2 TMB grouping
2.3 筛选与TMB相关的影像学特征
采用LASSO回归对851个特征进行降维处理,筛选出与TMB相关的影像学特征。根据最优λ值(图3),最终筛选出9个相关的影像学特征,分别为wavelet-HHH_ glcm_Correlation,wavelet-HHL_glcm_Imc1,wavelet-LLH_glcm_MCC,wavelet-HHL_glszm_LowGrayLevelZoneEmphasis,wavelet-HHH_glszm_Zone Variance,wavelet-HHL_gldm_LargeDependenceHigh GrayLevelEmphasis,wavelet-LLH_ngtdm_Busyness,wavelet-HLL_firstorder_MeanAbsoluteDeviation和wavelet-LLL_glcm_MCC。
图3 三折交叉验证图Fig.3 Tri-fold cross-validation diagram
2.4 预测模型的构建及其诊断效能
将筛选的9个影像学特征与TMB同时纳入logistic回归方程,进行逐步回归,最后筛选得到预测模型的3个影像学特征,分别为wavelet-HHH_glcm_Correlation、wavelet-HHL_gldm_Large Dependence High Gray Level Emphasis和wavelet-LLL_glcm_MCC(表1)。绘制3个影像学特征与TMB的nomogram图(图4)。绘制3个影像学特征预测的ROC 曲线(图5),AUC可达0.882,说明此模型预测TMB精度良好。利用logistic回归模型进行建模,绘制DCA对临床预测模型进行评价。DCA显示,当阈值取0.10~1.00时,影像组学模型预测效能良好,见图6。
表1 筛选预测模型的影像学特征Tab.1 Imaging characteristics of the screening prediction model
图4 预测TMB的影像组学nomogram图Fig.4 Imaging nomogram of predicted TMB
图5 影像学组学预测模型的ROC曲线Fig.5 ROC curves for the imaging histological features of prediction models
图6 影像组预测模型的DCAFig.6 DCA of the image group prediction model
3 讨论
NSCLC患者经过ICIs治疗后,仅有一小部分人群临床获益。除了PD-L1、MSI等预测ICIs疗效的生物标志物,近年来,越来越多的数据证实TMB越高的肿瘤抗原负荷越高,更有可能从ICIs 治疗中获益,因此,TMB受到的临床关注度逐渐升高。
TMB是一种广泛用于ICIs治疗独立的疗效预测生物标志物。TMB首次在2014年黑色素瘤的研究[11]中被证实与CTLA-4抗体的疗效存在相关性。2017年发现TMB对27种肿瘤的免疫治疗研究[12-13]有显著的疗效预测作用,奠定了其作为预测泛癌种治疗探索的基础。
尽管TMB具有前景的预测价值,但TMB检测仍面临着一些挑战,包括肺癌患者动态获取活检组织的可行性差,重症患者无法获取活检组织,以及WES检查的高成本等。本研究基于CT影像组学预测TMB,可以弥补传统TMB检测方法的不足。
放射组学研究因其获取全面图像信息方面的优势而在广泛肿瘤研究领域迅速发展[14]。在NSCLC中,影像学组在预测病理和分子分型[15-16]、器官特异性转移[17-18]、复发和总生存[19-20]等方面表现出潜力。因此,假设放射组学特征可用于通过预测高TMB的概率来选择临床上最需要的患者群体进行TMB检测。此外,对于那些无法接受昂贵WES测试的人群来说,放射组学可以作为 TMB 检测的替代或辅助诊断。
本研究中,TMB预测模型通过列线图可视化,可以方便地计算肺鳞癌患者高TMB的可能性。该研究有可能帮助临床医生筛选出TMB检测的最佳候选人,即最有可能具有高TMB的患者。另一方面,本研究的模型也可以作为TMB的替代品,用于无法负担昂贵的TMB检测或没有可获取的组织样本进行检测的患者。与传统的TMB检测方法相比,本研究放射组学TMB预测模型为完全非侵入性。此外,由于大多数肺鳞癌患者在初始诊断之前或初始诊断时已经接受了胸部CT扫描,因此,基于影像组学的TMB预测模型几乎不需要额外的检查。
本研究存在一定的局限性。首先,本研究数据来自TCIA数据库,样本量相对较小,因此不可避免的会存在与回顾性研究相关的缺点;其次,由于目前对肺鳞癌中TMB的最佳临界值没有达成共识,选择了通过R包(maftools包)计算得出的中位TMB来定义TMB的高、低组;第三,影像组学预测肺鳞癌患者TMB能力背后的生物学解释尚不清楚,还需要进一步深入研究。最后,本研究缺乏外部数据对预测模型进行验证。
本研究结果显示,从胸部CT中提取的影像组学特征与TMB之间存在内在联系。因此建立了一个基于放射组学特征的TMB预测模型,通过本研究证明了采用放射组学预测TMB的可行性。并且,基于影像组学特征建立的预测模型对TMB状态有较高的预测价值,有待进一步研究探索。