基于放疗定位CT 的影像组学构建局限期小细胞肺癌预后模型的研究
2023-02-13吴洁菡宋家伟徐畅王伟杨成文刘桂芝刘宁波
吴洁菡 宋家伟 徐畅 王伟 杨成文 刘桂芝 刘宁波
局限期小细胞肺癌(limit-stage small cell lung cancer,LS-SCLC)细胞增殖快、易转移,治疗后易复发[1],患者预后差,5 年生存率低于25%[2]。同步放、化疗是LS-SCLC 的标准治疗手段,但小细胞肺癌(small cell lung cancer,SCLC)肿瘤细胞异质性强,部分患者表现为难治性SCLC,具有先天性或获得性治疗抵抗,目前尚缺乏可靠的疗效预测手段。影像组学是从高通量医学影像中提取某些特征并将其量化,利用机器学习等对特征进行筛选分析的技术[3]。基于影像组学对SCLC 患者的预后预测的研究尚鲜有研究报道。
本研究利用影像组学方法分析放疗定位CT 影像,根据获得的临床随访结果,构建LS-SCLC 总生存期(overall survival,OS)、无进展生存期(progressionfree survival,PFS)的预后模型,为临床中更准确地判断预后、优化治疗方案提供更多依据。
1 材料与方法
1.1 临床资料
回顾性分析天津医科大学肿瘤医院2013 年9 月至2019 年12 月193 例接受胸部放疗LS-SCLC 患者影像资料。纳入标准:1)病理证实为SCLC;2)增强CT 行放疗前定位;3)CT 定位前未接受过放疗;4)经多种影像包括骨扫描、PET-CT、MRI、增强CT 等确认为局限期。排除标准:1)患者相关临床资料不全;2)患者未接受30 次胸部放疗。
1.2 方法
1.2.1 图像采集 采用GE Discovery CT590 RT 型大孔径CT 对患者进行增强扫描,患者经体位固定后,采用碘对比剂80~100 mL,速率2.0~3.0 mL/s,由高压注射器经肘静脉注入,扫描延迟时间50 s[4],扫描过程中要求患者屏气。扫描上界为乳突上1 cm,下界至膈下1 cm。
1.2.2 图像分析 193 例患者影像资料均采用Pinnacle(版本3.2.0.27)进行分析,包括病灶位置、形态、边界、密度等。感兴趣区(region of interest,ROI)分别在纵隔窗(窗宽350 HU,窗位40 HU)、肺窗(窗宽1 000 HU,窗位-650 HU)勾画,以肿瘤靶区(gross tumor volume,GTV)为ROI。借助3D Slicer(版本4.11.20210226)提取影像特征(图1)。具体流程设计及参数见图2。
图1 影像特征提取示意图
图2 特征提取及模型构建流程图
1.2.3 随访 通过电话随访与病历查询相结合的方式,了解患者生存情况。随访时间3.97~75.63 个月,中位随访时间42.73 个月。随访截至2020 年9 月。
1.3 统计学分析
采用Python(版本3.8.8)进行随机分组、特征筛选及模型构建,采用MedCalc(版本19.4.1)软件计算受试者工作特征曲线(receiver operating characteristic curve,ROC)。按照7∶3 对符合条件患者进行随机分组,得到训练组和测试组并构建预测模型。在每一标准中,临床因素符合正态分布采用t检验,非正态分布采用非参数检验,筛选影像特征应用t检验及LASSO 回归,并采用交叉验证法选定最优的λ 值,选择对应的LASSO 回归模型。输出准确率、曲线下面积(area under the receiver operating characteristic curve,AUC)、灵敏度和特异度评估模型效能。以P<0.05 为差异具有统计学意义。
2 结果
2.1 临床资料
共193 例患者纳入研究,中位OS 为29.77 个月,中位PFS 为14.03 个月。男性150 例,年龄23~79岁,中位年龄59 岁;女性43 例,年龄40~81 岁,中位年龄60 岁。吸烟史:有141 例,无52 例;预防性脑照射:有77 例,无116 例;放疗后脑转移:有52 例,无141 例;诱导化疗超2 周期:有119 例,无74 例;同步化疗:有114 例,无79 例;巩固化疗:有111 例,无82 例;治疗技术:固定野调强放疗139 例,容积调强放疗54 例。见表1。
表1 患者基本特征
以是否死亡、是否进展、OS≤1 年或OS≥5 年、OS≤1 年或OS≥3 年、PFS≤6 个月或PFS≥24 个月、PFS≤12 个月或PFS≥18 个月对患者进行筛选,训练组和测试组在患者性别、年龄、OS、PFS、吸烟史、KPS 评分、分期、剂量、调强技术、是否进行预防性脑照射、是否脑转移、是否接受超过2 个周期诱导化疗、是否接受同步化疗、是否接受巩固化疗等方面差异均无统计学意义(均P>0.05)。
2.2 特征提取及筛选
每组影像在原始影像和派生图像的基础上共提取到包括一阶特征、形状特征、纹理特征、灰度共生矩阵(gray level cooccurence matrix,GLCM)、灰度依赖性矩阵(gray level dependence matrix,GLDM)、灰度级运行长度矩阵(gray level run length matrix,GLRLM)、灰度及带矩阵(gray level size zone matrix,GLSZM)、相邻灰度差分矩阵(neighbouring gray tone difference matrix,NGTDM))在内的1 037 个特征。
在不同分类标准下,筛选所得特征有较大差异。以是否死亡为标准共筛选到9 个特征,分布在一阶特征、GLSZM、GLCM、GLRLM 和NGTDM,在模型构建中参数wavelet-LLH_glszm_SmallAreaEmphasis 重复出现,与是否死亡密切相关。按照OS≤1 年或OS≥5 年为标准筛选到7 个特征,分布在一阶特征、GLCM、GLSZM 和NGTDM,参数original_ngtdm_Strength在3 次提取特征重要性前列中重复出现,且与模型构建关系最为紧密。按照OS≤1 年或OS≥3 年为标准筛选到6 个特征,分布在一阶特征、GLCM、GLSZM和NGTDM,其中参数wavelet-HHL_ngtdm_Busyness 在3 次重要性输出中均被提出构建新的模型。
PFS 方面以是否进展为标准,提取到10 个特征,分布在一阶特征、形状特征、GLCM、GLSZM 和NGTDM,此标准下不存在特定特征被纳入构建新的模型。以PFS≤6 个月或PFS≥24 个月为标准筛选出6 个特征,分布在一阶特征、GLCM 和GLSZM,其中参数wavelet-LLH_glcm_ClusterShade 和wavelet-LLH_glcm_Correlation 被用于构建新模型。以PFS≤12 个月或PFS≥18 个月作标准筛选到11 个特征,分布在一阶特征、形状特征、GLCM、GLRLM 和GLDM,其中参数wavelet-HHL_gldm_SmallDependenceHighGrayLevelEmphasis 作为重要特征3 次被纳入新模型构建。
2.3 模型构建与评估
以是否死亡为标准(68 例生存、119 例死亡)对病例分类并在训练组纳入全部筛选特征构建模型,在测试组中输出准确率均值为62.9%且相对稳定,3 次输出特征重要性分别构建新模型,以测试组为基础输出准确率、AUC、灵敏度和特异度。新构建模型以AUC≥0.7 为标准评估,不存在可靠结果。
以OS≤1 年(n=20)或OS≥5 年(n=19)为标准对病例分类并在训练组中纳入全部筛选特征,所得模型准确率均值为0.677 且相对稳定。以original_ngtdm_Strength、wavelet-HLH_glszm_GrayLevelVariance、wavelet-HHL_glcm_MCC 构建模型AUC 均值为0.7(95%CI:0.549~1.031)。以original_ngtdm_Strength、wavelet-HHL_glcm_MCC、wavelet-LLL_glcm_ClusterProminence 构建模型AUC均值为0.84(95%CI:0.624~0.957)。
以OS≤1 年(n=20)或OS≥3 年(n=58)为标准对病例分类并在训练组中纳入全部筛选特征,所得模型准确率均值为79.5% 且相对稳定。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glszm_SizeZoneNonUniformity、wavelet-HHL_ngtdm_Busyness 构建模型的AUC 均值为0.73(95%CI:0.549~0.911)。以original_ngtdm_Strength、wavelet-HHL_glcm_Correlation、wavelet-HHL_ngtdm_Busyness 构建模型的AUC 均值为0.74(95%CI:0.561~0.914)。以wavelet-LLH_glcm_ClusterShade、wavelet-HHL_ngtdm_Busyness、wavelet-HHL_glcm_Correlation 构建模型的AUC 均值为0.78(95%CI:0.611~0.949)。见表2。
表2 患者总生存期模型结果
以是否进展为标准(48 例无进展、138 例进展)对病例分类并在训练组纳入全部筛选特征构建模型,在测试组中输出准确率均值为74.6%且相对稳定,3 次输出特征重要性分别构建新模型,以测试组为基础输出准确率、AUC、灵敏度和特异度。重复输出最重要的3 个特征构建模型,以AUC≥0.7 为标准评估,新模型不存在可靠结果。
以PFS≤6 个月(n=19)或PFS≥24 个月(n=57)为标准对病例分类并在训练组中纳入全部筛选特征,所得模型准确率均值为73.6%。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation、wavelet-HHH_glcm_MCC 构建模型AUC 平均为0.70(95%CI:0.513~0.887)。
以PFS≤12 个月(n=69)或PFS≥18 个月(n=75)为标准对病例分类并在训练组中纳入全部筛选特征,所得模型准确率均值为82.3%。新构建模型AUC 均无法达到要求(表3)。
表3 患者无进展生存期模型结果
随机选取各标准下某一阳性结果绘图(图3)。
图3 预测模型受试者工作特征曲线
3 讨论
近年来,LS-SCLC 的治疗进展较慢,虽然部分早期患者可以行手术切除,但多数仍需术后化疗或放化疗等辅助治疗,同步放、化疗仍是多数LS-SCLC 的标准治疗。但SCLC 细胞恶性度高,异质性强,不同患者间疗效差异较大、预后差异也较大。本研究进一步证实,多数患者在治疗后很快复发,中位PFS 仅为14.03 个月。但仍有少部分LS-SCLC 患者可以达到长期生存,中位OS 为29.77 个月,5 年生存率达到9.8%。提示对于LS-SCLC 患者,可能需要对预后进行分层分析。不同预后的SCLC,可能具有不同基因背景。因此,能否采用影像手段对SCLC 进行分类,研究影响预后的影像组学特点对于指导临床诊疗具有重要意义。
目前,影像组学在SCLC 方面的研究较为局限,主要集中在对疾病分型[5-10],研究预后的模型较少。部分已发表的组学研究均未区分局限期或广泛期,且总病例数过少。Gkika 等[11]纳入LS-SCLC 患者47 例、广泛期患者51 例,基于CT 提取影像特征72 个,分别与OS、PFS 行相关性分析,取相关性最高的特征纳入Cox 风险比例模型。影像特征仅有original_glcm_Imc1、original_glcm_Imc2 和original_shape_Maximum2DDiameterColumn 可认为中度相关,但影像特征建立的模型无法预测生存情况。本研究的193例均为LS-SCLC 患者,病例更多、研究结果更为可靠。
本研究的影像特征提取来自放疗定位CT,较诊断CT 是LS-SCLC 患者最接近治疗前的影像结果,每例患者均提取1 037 个特征用于筛选,其中包括了基于原始图像的一阶特征、形状特征、纹理特征和小波特征。Jiao 等[12]以早期NSCLC 患者为研究对象进行预后预测,同样以GTV 为ROI 所提取的特征数为每组680 个特征,其中包含一阶特征、形状特征及部分纹理特征,模型一致性指数0.734,而Gkika 等[11]仅提取了72 个影像特征,研究结果可信度一般。本研究在机器学习基础上,提取特征数目更多、种类更全,对于预后的预测更为准确。
有研究报道,特征筛选应用LASSO 筛选,并进行Cox 分析[13]。部分研究也未对特征进行前期筛选,而是选择纳入全部特征进行分析,然后再选取最相关的特征纳入Cox 分析判断是否能够预测预后[11]。本研究结合了t检验、LASSO 筛选特征和随机森林分类器构建预测模型,并选择最重要的3 个特征重新构建模型。CT 影像具有较好的空间分辨率,且以灰度来代表不同的组织结构,影像的纹理与肿瘤异质性有关,也可能预测肿瘤的生物学行为[14],本研究筛选获得的特征大多为肿瘤区纹理特征,与上述研究结果相符。OS 部分以OS≤1 年或OS≥5 年和以OS≤1 年或OS≥3 年为标准构建最终模型时,original_ngtdm_Strength和wavelet-HHL_ngtdm_Busyness 3 次被认定为重要特征,两者均属于NGTDM 特征,刻画了一个像素与周围像素值的关系,可用于衡量组织的异质性;PFS 部分以PFS ≤6 个月或PFS ≥24 个月为标准,wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation 被3 次用于构建新模型,两者属于GLCM 特征,用于描述具有某种空间关系的两个像素的联合分布,wavelet-LLH_glcm_ClusterShade 反映影像的均匀度、wavelet-LLH_glcm_Correlation 反映图像纹理的一致性,也可表示组织的同质性。本研究筛选获得的特征参数与临床现状保持一致,具有更高的可信度。
影响LS-SCLC 疗效的因素众多,长期以来,预测LS-SCLC 的OS 十分困难,目前已获得的模型多AUC<0.7。本研究中以OS≤1 年或OS≥5 年和以OS≤1 年或OS≥3 年为标准获得的模型进一步在测试组中进行结果验证所得AUC≥0.7,预测效果良好,具有进一步扩大样本研究的价值。本研究在生存标准下得到具有预测效能的模型,但以是否生存为标准无法获得期待模型,与Gkika 等[11]在OS 部分无法构建具有预测效果的模型结果相似。这可能与OS 与患者整体情况、治疗方案有关,SCLC 通常接受化疗、放疗联合治疗,影响因素众多,单纯以影像特征进行预测较为困难。Jain 等[15]借助影像组学构建了预测接受铂类药物化疗SCLC 患者预后模型,测试组模型一致性指数为0.69,也证实了上述推断。
本研究对PFS 的结果同样进行了多种分组研究,其中仅有以PFS≤6 个月或≥24 个月纳入患者构建模型所得AUC=0.70。以是否进展和PFS≤12 个月或PFS≥18 个月标准纳入患者所构建模型AUC 达不到标准,认为模型预测效果不佳。目前多数借助影像组学对SCLC 进行预后预测的研究[11]中PFS 部分单因素分析所得均差异无统计学意义,无法进行多因素分析并构建方程,与本研究结果类似。提示SCLC 生物学特性复杂,难以用单一影像方法预测局部控制疗效,这也与SCLC 易复发,易转移的临床特点吻合。
综上所述,本研究结果表明影像组学在SCLC 的预后预测方面可构建具有较好预测效果的模型,但SCLC 生物学特性复杂,单一的影像特征难以描述,纳入临床因素、肿瘤标志物或分子指标等构建融合模型,是下一步研究的方向。