CT影像组学特征预测非小细胞肺癌同步脑转移的价值
2022-04-24陈亮亮陈基明丁俊范海云周慧刘晨
陈亮亮,陈基明,丁俊,范海云,周慧,刘晨
肺癌不仅在中国,在全世界也是死亡率最高的恶性肿瘤,非小细胞肺癌(non-small cell lung cancer,NSCLC)约占肺癌的85%[1-2]。脑是肺癌常见的转移部位之一,发生脑转移的肺癌患者预后通常较差,平均自然生存时间仅1~2个月[3]。30%~50%的NSCLC患者最终会发生脑转移[4],约有10%的NSCLC患者在确诊时已经发生脑转移[2],部分发生脑转移的患者因无明显相关症状、未能及时进行检查而错过了最佳治疗时机,因此早期诊断和预测脑转移对肺癌患者治疗方案的选择和预后至关重要[3-4]。影像组学分析通过高通量地提取影像信息并将其转化为深层次的特征信息,而实现对病变的量化研究[5-6]。目前,影像组学已在直肠癌肝转移的评价、NSCLC异质性分析、头颈部淋巴结性质的鉴别和肺腺癌远处转移的预测等方面取得了一些重要进展[7-10]。既往对NSCLC脑转移的研究中,多是从临床表现、实验室检查和病理结果的角度进行分析和探讨[11-14],与NSCLC脑转移有关的潜在危险因素如组织类型、肿瘤分级和淋巴结转移情况等多来源于有创检查或术后组织病理检查,鲜见基于CT特征及CT影像组学分析来预测肺癌脑转移的研究[10],本研究通过纳入临床、影像学及纹理特征等多种参数来建立综合诊断模型,旨在探讨CT影像组学预测NSCLC患者同步脑转移的价值。
材料与方法
1.一般资料
回顾性分析2015年12月-2020年12月本院110例经头颅MRI平扫和增强检查明确是否为NSCLC同步脑转移患者的完整病例资料。纳入标准:①病理明确诊断为NSCLC;②术前行CT平扫及增强扫描,CT检查与穿刺活检或手术间隔时间≤2周;③CT检查前未进行过肿瘤相关治疗。排除标准:①图像资料不全或质量不佳影响诊断;②有其它恶性肿瘤病史或怀疑有脑内其它类型的肿瘤;③不易明确肿瘤边界使得ROI勾画困难或因钙化、空洞等导致无法准确测量肿瘤密度者。根据头颅MRI检查结果,将NSCLC患者分为脑转移组(50例)和非脑转移组(60例)。使用完全随机方法将患者按7:3的比例分为训练集77例(包括转移组35例、非转移组42例)和验证集33例(包括转移组15例、非转移组18例)。
2.检查方法
使用Philips Brilliance 64排CT机行平扫及增强扫描,患者取仰卧位,扫描参数:120 kV,220 mA,层厚5.0 mm,层间距5.0 mm,视野30 cm×30 cm。对比剂使用碘化醇(300 mg I/mL),剂量1.5 mL/kg,注射流率2.5 mL/s,在对比剂注射后25和40~65 s分别行动脉期和静脉期增强扫描。
3.图像分析
由2位放射科医师(分别具有5和10年工作经验)在PACS系统共同阅片,观察NSCLC原发灶的部位、大小、形态、边界、密度及强化特点等,意见不一致时经协商达成一致意见。在CT肺窗图像上测量肿瘤的径线,记录其最大径;在纵隔窗图像上确定肿瘤强化最明显处,分别在平扫、动脉期和静脉期图像上在此处勾画感兴趣区,并尽量避开肿瘤内出血、坏死区及钙化,所有ROI的形状、大小相同,测量肿瘤的CT值每个病灶测量3次,取其平均值,并计算动脉期和静脉期图像上肿瘤的强化率(enhanced ratio,ER)。
4.特征提取、筛选及影像组学模型的建立
将所有患者的的CT平扫、动脉期和静脉期图像从PACS系统以DICOM格式导入ITK-SNP 3.6.0软件,由2位放射科医师分别在各期纵隔窗图像上沿肿瘤边缘手动逐层勾画ROI,并融合成三维容积兴趣区(图1),再导入AK软件(GE Healthcare Analysis Kit,3.2.0版)提取病灶的纹理特征(包括一阶特征、形态特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度游程矩阵特征、邻域灰度差矩阵特征、灰度依赖矩阵特征)并进行变换(拉普拉斯-高斯滤波、小波分析及局部二值模式变换),获得所有患者的平扫、动脉期、静脉期和多序列(平扫+动脉期+静脉期)纹理特征。一周后由高年资医师随机抽取30例患者的图像,重复上述步骤,提取病灶在3期图像上的纹理特征,以进行可重复性检验。删除组内相关系数(intraclass correlation coefficient,ICC)<0.75的特征,然后采用最小冗余最大相关(max-relevance and min-redundancy,mRMR)以及最小绝对值收敛和选择算子(least absolute shrinkage and selection operator method,LASSO)回归分析对训练集各期(包括平扫、动脉期、静脉期及3期联合序列)剩余的纹理特征分别进行降维,筛选出最佳特征子集,构建基于各单期和3期联合的影像组学模型,再按照特征权重分别计算影像组学分值(rad-score),并将最终获得的各期影像组学模型在相应验证集中分别进行验证(图2)。
图1 肺癌病灶容积ROI的获取方法。a)CT动脉期图像,沿肿瘤边缘勾画ROI(红色区域);b)肿瘤所有层面的ROI融合后形成三维图像。 图2 影像组学分析流程图。
5.统计分析
统计分析使用SPSS 24.0、R 4.0.4和MedCalc 19.0.2软件。计量资料采用Kolmogorov-Smirnov检验进行正态性检验,符合正态分布的数据以均数±标准差来表示,并采用独立样本t检验进行组间比较;计数资料以频数表示,并采用χ2检验或Fisher检验进行组间比较。采用ICC评价两位医师间和高年资医师两次提取纹理特征的一致性。利用mRMR法筛选纹理特征,然后采用LASSO回归进一步筛选纹理特征并构建影像组学标签,根据特征权重计算每个患者的得分。所有预测模型的建立均采用单因素和多因素logistic回归分析,并使用方差膨胀因子(variance inflation factor,VIF)进行共线性检查。绘制校准曲线来评价模型的拟合优度,并采用Hosmer-Lemeshow检验评价校准曲线的一致性,计算受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)来评价模型的预测效能。多个模型间AUC的比较采用DeLong检验,通过决策曲线分析(decision curve analysis,DCA)评价各模型的临床收益。以P<0.05为差异有统计学意义。
结 果
1.训练组和验证组的临床和CT特征
训练集和验证集中转移组和非转移组患者临床和CT特征的比较结果见表1。在训练集和验证集中,转移组与非转移组之间性别、年龄、肿瘤长径、生长部位、边界、分叶征、胸膜凹陷征、平扫及增强CT值、肿瘤强化程度及方式、CT-T分期的差异均无统计学意义(P>0.05);转移组与非转移组之间肿瘤密度和毛刺征出现率的差异均有统计学意义(P<0.05)。
表1 训练集和验证集中转移组和非转移组患者临床和CT特征的比较
经共线性检查,将P<0.05的变量纳入多因素logistic回归分析,获得回归方程作为常规预测模型,结果显示毛刺是该模型的独立预测因子[比值比(odds ratio,OR)=2.7,P=0.040]。
2.影像组学特征提取的一致性
2位医师提取的各项纹理特征之间的一致性为0.786~0.978;高年资医师两次提取特征的一致性为0.803~0.986。
3.纹理特征提取及影像组学模型建立
AK软件自平扫、动脉期和静脉期图像上各提取了1316个纹理特征,3个序列共提取3948个纹理特征,经mRMR去除冗余特征和LASSO回归降维后(图3、4),平扫、动脉期、静脉期及三期联合(多序列)获得的对脑转移预测价值较大的纹理特征数分别为9、10、9和9个,分别建立影像组学模型,并根据公式计算出每例患者的rad-score,结果见表2。100次留P交叉验证保证各模型均具有很好的稳定性。
表2 训练集和验证集中转移组和非转移组患者rad-score值
图3 多序列LASSO回归选择鉴别NSCLC同步脑转移及非转移的特征。a)左、右两条虚线分别表示最佳λ取值时log(λ)对应的偏差值和最佳λ对数函数值,顶端坐标为对应特征数;b)调整λ取值时LASSO筛选的非零系数特征图,虚线下方即为最佳λ值,上方为所筛特征数,此时共筛选出9个非零特征。 图4 多序列影像组学模型中纳入的各项纹理特征及其权重。C表示平扫,A表示动脉期,V表示静脉期。 图5 综合诊断模型的诺模图。各变量得分相加为总得分,根据总得分取值可获得患者发生脑转移的风险概率。
4.建立综合诊断模型
将常规预测模型中的变量和多序列影像组学模型的rad-score纳入logistic回归分析建立综合诊断模型并绘制其诺模图(图5),logistic回归分析显示多序列组学模型的rad-score为预测NSCLC患者同步脑转移的独立因子(OR=2.4,P<0.001)。
5.各模型的效能分析
各模型在训练集和验证集中预测脑转移的ROC曲线分析结果见表3~4和图6。综合诊断模型在训练集和验证集中的预测效能最高(AUC分别为0.86、0.88),多序列影像组学模型在训练集和验证集中的预测效能高于各单一序列。
表3 各诊断模型在训练集中的ROC曲线分析结果
表4 各诊断模型在验证集中的ROC曲线分析结果
图6 各预测模型的ROC曲线,在训练集和验证集中均以综合诊断模型的AUC最高,常规模型的AUC最低。a)训练集;b)验证集。 图7 综合诊断模型的校准曲线,显示训练集和验证集的预测曲线均接近标准曲线。a)训练集;b)验证集。 图8 常规模型、多序列组学模型和综合诊断模型预测NSCLC同步脑转移的决策曲线。当风险阈值为18%~82%时,多序列组学模型和综合诊断模型预测NSCLC同步脑转移的净收益均优于常规模型。All表示所有同步脑转移患者,None表示所有非转移患者。
DeLong检验结果显示单一和多序列组学模型之间AUC的差异无统计学意义(平扫 vs. 动脉期:Z=0.528,P=0.597;平扫 vs. 静脉期:Z=0.322,P=0.747;平扫 vs. 多序列:Z=0.332,P=0.740;动脉期 vs. 静脉期:Z=0.211,P=0.833;动脉期 vs. 序列:Z=1.055,P=0.292;静脉期 vs. 多序列:Z=0.924,P=0.355),多序列组学模型与常规模型之间AUC的差异无统计学意义(Z=1.960,P=0.051)。综合诊断模型与多序列影像组学模型之间AUC的差异无统计学意义(Z=0.297,P=0.767),与常规模型AUC的差异有统计学意义(Z=2.843,P=0.004)。
Hosmer-Lemeshow检验结果见图7。综合诊断模型在训练集和验证集中的拟合效果均较好(χ2值分别为11.538和5.611,P值分别为0.173和0.691)。DCA显示综合诊断模型和多序列影像组学模型的净收益均优于常规模型,综合诊断模型略优于多序列影像组学模型(图8)。
讨 论
本研究通过纳入临床、影像学特征及纹理特征等多个变量,尝试从不同层面建立NSCLC同步脑转移预测模型,结果显示训练集和验证集中肿瘤密度、毛刺与NSCLC患者同步脑转移密切相关。毛刺是肺癌细胞浸润邻近正常的肺组织所致,是恶性肿瘤边缘侵袭性的重要表现,作为肺癌常见影像征象,转移组与非转移组之间毛刺征出现率的差异可能与本研究中非脑转移组患者多处于肺癌发病早期有关,需要进一步积累样本量深入分析两者间的相关性。肿瘤密度体现了肿瘤组织内的血氧供应,同步脑转移组中肿瘤密度相对均匀,可能表示肺癌细胞相对活跃,进而促进脑转移的发生。已有研究发现T分期与NSCLC脑转移密切相关,肿瘤大小及T分期反映原发肿瘤的生长范围和大小,肿瘤越大,分期越晚,则越有可能发生远处转移[11-13]。但本研究表明肿瘤长径及T分期在训练组和验证组间差异均无统计学意义。Wang等[14]的研究结果也未显示T分期是NSCLC脑转移的风险因素,这可能与样本量不同有关。同时,本研究结果显示反映肿瘤供血情况的强化程度及方式与NSCLC同步脑转移无显著相关性。本研究中常规模型预测NSCLS患者同步脑转移的效能相对较低(AUC为0.68),虽然影像特征的评判存在主观性和一定的测量误差,但一定程度上可以提示临床进行更全面的检查和干预。
常规模型中的变量难以全面反映发生脑转移的NSCLS的生物学特征,而影像组学特征可揭示ROI内像素灰度值的分布模式及变化规律,能更客观地反映肿瘤的异质性[8,15],获得肿瘤发展及预后信息。Coroller等[10]研究提示影像组学特征与早期肺腺癌患者发生远处转移具有显著相关性。本研究基于三维图像提取肺癌病灶的影像组学特征,并对不同CT扫描序列建立的影像组学模型预测NSCLS患者同步脑转移的效能进行分析,结果显示基于平扫的组学模型预测效能高于动脉期和静脉期。理论上,包括肿瘤病灶微血管生成和血流灌注情况异质性信息的动脉期及静脉期图像较主要反映肿瘤密度非匀质性的平扫序列可以提取更多有价值的影像组学特征,构建更有价值的模型,但本研究结果与上述理论分析的结果存在差异,其原因和好机制尚需进一步研究。
本研究结果显示多序列组学模型的预测效能(AUC为0.84)高于单一序列,多序列共筛选出9个组学特征,其中6个特征属于一阶特征(即直方图特征),能通过统计图像中所有像素不同灰度值出现的频率,获取病变内部的异质性,具有简单、易获取和可重复性高等特点[16-17],是目前应用最广的组学特征之一。本研究结果说明脑转移组中肺癌病灶的内部信息较非转移组发生了明显改变。多序列影像组学模型中的5个纹理特征经过小波变换,包括权重系数最高的特征。小波变换是目前最常用的纹理分析方法之一,经小波变换后的特征优于其它特征[18],它能增强图像的层次感,提供肿瘤内部特征信息和边缘轮廓特征信息,反映肿瘤生长特征和预后信息[19]。由于NSCLS患者同步脑转移生物学机制的复杂性,为更全面准确地预测NSCLS患者发生同步脑转移的风险,我们将临床、影像学特征与多序列组学模型的rad-score联合建立综合诊断模型,结果显示,临床资料和影像学特征的加入并未能明显提高综合诊断模型的预测效能及临床净收益,多序列组学模型的rad-score为预测NSCLC患者同步脑转移的独立因子,影像组学有望成为一种全新的生物学指标帮助临床预测同步脑转移的风险。
本研究存在一定的局限性:①本研究为回顾性研究,可能存在一定的选择偏倚,尚需多中心研究验证预测模型的价值;②病例数相对较少,且由于临床资料有限,未能将更多与NSCLC患者脑转移有关的变量纳入常规模型;③手动勾画ROI和影像特征的评判受个人主观因素的影响,且因呼吸运动的影响,各期图像间很难完全匹配。
总之,影像组学模型及基于临床、影像学特征及纹理特征建立的综合诊断模型均具有很高的预测NSCLC患者同步脑转移的价值,影像组学有望成为一种全新的生物学指标帮助临床预测肺癌患者发生同步脑转移的风险。