APP下载

CT影像组学预测胰腺导管腺癌患者术后无病生存期的价值

2024-04-23魏显飞陈基明吴莉莉何天洪谷士康刘美娜谢伶俐

放射学实践 2024年4期
关键词:组学预测特征

魏显飞,陈基明,吴莉莉,何天洪,谷士康,刘美娜,谢伶俐

胰腺导管腺癌(pancreatic ductal adenocarcinoma,PDAC)在目前还是一种高度致死性疾病,患者的5年生存率仅为9%[1]。根治性切除术是目前PDAC患者获得远期生存的唯一治疗方法。但据文献报道,临床上PDAC患者在明确诊断时仅有20%~30%能够进行手术治疗[2]。而且,由于术后易出现局部肿瘤复发或远处转移,术后患者的5年生存率也仅为20%~25%[3]。目前,对PDAC患者预后的评估主要依赖于TNM分期系统,但是已有不少研究发现即使是相同分期的患者预后也有很大的差异[4]。CT是胰腺癌诊断、分期及疗效评估等的主要技术之一[5],然而传统的CT图像分析主要依赖于视觉评估,获得的信息有限。近年来影像组学成为研究热点,影像组学在胃癌、肝癌和直肠癌等疾病的术后预后预测方面已取得良好的效果[6-8]。虽然目前已有将CT影像组学应用于预测PDAC预后方面的研究[9-10],然而这些研究中影像组学分析多基于增强静脉期图像,很少有研究中基于多期CT图像(平扫、动脉、静脉及延迟期)或多期联合来进行影像组学分析,而多期联合影像组学分析有可能挖掘到更多的预后相关信息。Fukukura等[11]的研究结果显示多期CT图像特征与PDAC患者预后具有显著相关性。因此,本研究中基于多期CT图像的影像组学特征及其与临床资料、CT特征相结合构建临床-组学综合模型,旨在探讨临床-组学综合模型预测PDAC患者术后无病生存期(disease-free survival,DFS)的价值。

材料与方法

1.一般资料

回顾性分析2013年12月-2021年6月在本院经术后病理证实为PDAC的167例患者的病例资料。纳入标准:①接受手术切除治疗,术后病理证实为PDAC;②术前2周内行腹部CT平扫及增强检查;③图像质量满足分析要求,可准确勾画病灶的轮廓。排除标准;①术前已经接受过其它全身或局部抗肿瘤治疗;②合并其它恶性肿瘤;③术后3个月内死亡者。167例中,因术前接受过治疗而被排除者33例,因合并其它恶性肿瘤被排除者2例,因术后3个月内死亡而被排除者8例,最终将124例患者纳入本研究。其中,男74例,女50例,年龄(63±8)岁。使用完全随机方法将患者按7∶3的比例分为训练集(n=87)和验证集(n=37)。

本研究遵守《赫尔辛基宣言》,并获得本院伦理委员会的批准(2023伦审研第17号)。

2.CT扫描方法

使用Philips Brilliance 64排CT机行上腹部或全腹部平扫及增强扫描。扫描参数:120 kV,220 mA,层厚5.0 mm,层间距5.0 mm,矩阵512×512。对比剂采用碘佛醇(350 mg I/mL),剂量1.5 mL/kg,流率2.5 mL/s,经右肘前静脉注射,于注射后25、40~65和180 s分别行动脉期、静脉期和延迟期扫描。

3.临床病理和CT特征分析

由2位分别具有5年和25年以上工作经验的放射科医师在PACS系统搜集患者的临床病理及影像学资料,共同评估每例患者的CT征象,意见不一致时经讨论达成共识。患者的临床和病理资料包括年龄、性别、糖尿病、黄疸、腰背痛、体重减轻、癌胚抗原(CEA)、白蛋白、糖类抗原199(CA199)、糖类抗原125(CA125)、中性粒细胞/淋巴细胞比值(neutrophil to lymphocyte ratio,NLR)、分化程度、切缘状态、胰周器官受侵、血管侵犯和神经侵犯。CT特征包括肿瘤位置、边界、坏死囊变、CT阳性淋巴结(短径≥1 cm)、淋巴结转移和强化方式等。在增强图像上测量并记录肿瘤及淋巴结的最大径,在横轴面平扫及三期增强图像上选取病灶最大层面,在病灶内勾画圆形ROI(面积1 cm2)进行CT值的测量,勾画时注意避开脂肪、钙化及坏死囊变区,测量3次取平均值,计算各期肿瘤的强化率(enhanced ratio,ER):

×100%

(1)

4.影像组学特征提取、筛选及模型的建立

将所有患者的CT图像以DICOM格式导出,然后由两位分别有5和10年工作经验的放射科医师分别独立在开源软件ITK-SNAP中进行病灶的分割和纹理特征的提取,具体步骤:①分别在平扫和3期增强图像上,沿肿瘤边缘逐层手动勾画ROI,平扫图像上ROI的勾画需参考增强图像,软件即可合成肿瘤全域的三维容积ROI(volume ROI, VOI),用于肿瘤影像组学特征的提取。②对图像进行预处理,包括使用μ±3δ对VOI进行归一化,以及使用三维插补技术对容积病灶进行各项同性重采样(体素大小为1 mm×1 mm×1 mm)。③然后使用开源软件FAE0.4.4分别提取各期图像上肿瘤VOI的影像组学特征[12],包括一阶特征,形态特征,灰度共生矩阵特征,灰度区域大小矩阵特征,灰度游程矩阵特征,邻域灰度差矩阵特征,灰度依赖矩阵,以及拉普拉斯-高斯滤波、小波变换和局部二值模式变换特征,获得所有患者的平扫、动脉期、静脉期、延迟期及多期联合(动脉期+静脉期+延迟期)影像组学特征并对其进行Z值标准化。④保留两位医师之间一致性较好(ICC>0.80)的影像组学特征,然后采用单因素Cox回归筛选出具有统计学意义(P<0.05)的特征,然后采用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO-Cox)进一步筛选影像组学特征,最终将每期图像上筛选出的最优组学特征用于构建影像组学模型(图1)。根据各特征的系数可计算出相应的影像组学标签值(radscore),采用100次留组交叉验证(leave-group-out cross validation,LGOCV)判定模型的可靠性。结合临床模型中的变量及诊断效能相对较好的影像组学标签,构建临床-组学综合模型。

图1 利用LASSO-Cox回归对多期联合图像提取的组学特征进行降维。a)为二项式偏差与最优超参数log(λ),顶端坐标为对应的特征数;b)调整λ取值时的LASSO收敛系数图,图中显示17个非零系数的纹理特征。

5.临床随访资料

对所有患者在术后进行长期随访,术后每3个月随访一次,两年后为每6个月随访一次,随访截止日期为2022年12月。采用电话随访或入院复查的方式获得患者的生存信息,并定期进行影像学检查(CT或MRI平扫+增强,或仅行胸部CT平扫)评估肿瘤有无局部复发和远处转移。DFS的定义为自手术日起至出现局部复发、远处转移、任何原因导致的死亡的时间,或至本研究确定的最后一次随访的截止日期[13]。删失定义为在随访时间截止时没有发生上述结果。

6.统计学方法

统计分析使用SPSS 26.0软件或R4.2.2软件。对连续变量先进行Kolmogorov-Smirnov检验,呈正态分布的计量资料以均数±标准差表示,偏态分布的计量资料以M(Q1,Q3)表示,组间比较则分别采用独立样本t检验或Mann-WhineyU检验;计数资料的组间比较采用χ2检验或 Fisher确切概率法。利用Reverse Kaplan-Meier法计算患者的中位随访时间和中位DFS。利用单因素Cox回归筛选临床和CT特征。利用R语言的“suminer”程序包计算得到临床-组学综合模型风险值的最佳截断值,然后将患者分为高风险组和低风险组。采用多因素Cox回归分析基于临床资料、CT特征及影像组学标签构建临床-组学综合模型预测模型并绘制其诺莫图。采用时间依赖(time-dependent)ROC曲线、一致性指数(C-index)、校正曲线和决策曲线(decision curve analysis,DCA)评价模型的预测效能、拟合优度和临床实用价值。采用DeLong检验比较多个模型间AUC的差异。采用Kaplan-Meier(KM)检验分析生存资料并进行log-rank检验。

结 果

1.临床资料、CT特征及预后分析

所有患者中位随访时间为28个月,中位DFS为10个月。随访过程中共有12例出现局部复发,37例出现远处转移,18例合并局部复发及远处转移,17例死亡,40例删失。

训练集和验证集之间临床资料和CT特征的比较结果见表1。两组之间胰周器官受侵和神经侵犯出现率的差异有统计学意义(P<0.05),其它临床及CT特征的差异均无统计学意义(P>0.05)。

表1 临床资料和CT特征在训练集和验证集中的比较及在训练集中的回归分析结果

在训练集中对每项临床资料和CT特征进行单因素Cox回归分析,结果见表1。各项特征中仅肿瘤分化程度和神经侵犯与DFS显著相关(P均<0.05)。将这2个变量纳入多因素Cox回归分析,分别建立预测6、12和24个月DFS的临床模型。

2.影像组学特征提取、筛选及模型的建立

从CT平扫、动脉期、静脉期和延迟期图像上各提取了1781个组学特征,即4期图像上共提取7124个特征。对2位医师提取的纹理特征进行一致性分析,ICC范围为0.873~0.972,说明一致性较好,选取高年资医师提取的特征进行后续的影像组学分析。

通过单因素Cox回归和LASSO-Cox回归进行特征降维(图1),最终平扫、动脉期、静脉期、延迟期及多期联合(动脉期+静脉期+延迟期)分别得到5、16、4、12和17个最优特征,随即分别用于构建相应的影像组学模型,并计算每例患者的标签值。在训练集中,基于平扫、动脉期、静脉期、延迟期及多期联合(动脉期+静脉期+延迟期),标签值的均值分别为5.58±0.52、0.17±0.13、1.90±0.33、2.81±0.12和4.18±0.45。

3.临床-组学综合模型的构建

结合临床模型变量及诊断效能相对较好的多期联合影像组学标签,通过多因素Cox回归分析方法构建临床-组学综合模型,结果显示神经侵犯(优势比=4.7,P=0.003)和多期联合影像组学标签(优势比=49.9,P<0.0001)是临床-组学综合模型的独立预测因子。

4.各模型的效能分析

各模型在训练集和验证集中预测DFS的ROC曲线分析结果和C-index值见表2和图2~4。在训练集和验证集中临床-组学综合模型预测6、12和24个月DFS的效能最高,AUC分别为0.883、0.958、0.890和0.813、0.894、0.832,C-index值分别为0.812和0.796。经DeLong检验,临床-组学综合模型与多期联合模型的AUC之间差异无统计学意义(预测6、12和24个月DFS的P值分别为0.074、0.290和0.591),与临床模型的AUC之间差异有统计学意义(预测6、12和24个月DFS的P值均<0.05),表明临床-组学综合模型的诊断效能明显优于临床模型。

表2 不同模型预测胰腺癌患者术后6、12和24个月DFS的效能

图2 临床模型在训练集和验证集中的时间ROC曲线,AUC均较低(0.522~0.677)。a)训练集;b)验证集。 图3 多期联合组学模型在训练集和验证集中的时间ROC曲线,AUC均较高(0.786~0.928)。a)训练集;b)验证集。 图4 临床-组学综合模型在训练集和验证集中的时间ROC曲线,AUC(0.796~0.958)高于临床和组学模型。a)训练集;b)验证集。

校准曲线显示临床-组学综合模型在训练集和验证集中的预测概率与实际观察概率之间具有良好的一致性(图5)。DCA显示临床-组学综合模型的净收益优于多期联合组学模型和临床模型(图6)。为了便于临床应用,基于临床-组学综合模型绘制了诺莫图(图7)。对于每例患者,模型中每个预测因素的相应得分相加计算总得分,总得分越高,则患者6、12和24个月无病生存概率越低。

图5 临床-组学综合模型在训练集和验证集中的校正曲线,显示对6、12及24个月DFS的预测曲线均接近标准曲线。a)训练集;b)验证集。 图6 临床模型、多期联合组学模型和临床-组学综合模型在训练集和验证集中的决策曲线,显示在训练集风险阈值>10%,验证集风险阈值>35%时,多期联合组学模型和临床-组学综合模型的净收益均优于临床模型。All表示所有无病生存期的患者,None表示所有非无病生存期的患者。a)训练集;b)验证集。 图7 基于临床-组学综合模型预测胰腺癌患者术后6、12和24个月风险概率的诺莫图。 图8 临床-组学综合模型在训练集和验证集中的KM生存曲线,根据最佳截断值将所有患者分为高风险组和低风险组,显示高风险组患者的DFS明显短于低分风险组。a)训练集;b)验证集。

5.Kaplan-Meier生存分析

根据临床-组学综合模型的最佳截断值(2.738),将患者分为高风险组和低风险组,分别绘制训练集和验证集中的生存曲线(图8),并且进行log-rank检验。结果显示在训练集和验证集中高风险组与低风险组之间DFS的差异均具有统计学意义(P<0.00010;P<0.00013)。

讨 论

影响胰腺导管腺癌患者术后预后的机制非常复杂,受多种因素影响,包括临床、病理及其生物学特征等。准确预测PDAC患者术后的无病生存期有利于指导临床决策和早期干预及改善患者的预后。本研究中纳入了与PDAC患者术后预后相关的临床、病理及影像学特征等多种变量,构建多种预测模型,结果表明临床模型的预测效能较低;影像组学模型获得了较好的预测效能,优于临床模型;结合临床资料、CT特征及多期联合影像组学标签构建的临床-组学综合模型能进一步改善对预后的预测效能,并能进行风险分层。

肿瘤分化程度和神经侵犯是临床模型中预测PDAC患者术后DFS的独立预测因子,这与Perini等[14]的研究结果相似。肿瘤分化程度已被应用于各种肿瘤预后的研究[15-16],低分化PDAC患者往往预后较差[13,17,18]。神经侵犯是反映肿瘤预后不良的生物特性,研究表明神经侵犯显著影响PDAC患者的预后[13]。神经侵犯对PDAC患者预后的影响机制尚不明确,可能是由于受神经微环境与癌细胞神经营养分子之间的相互作用的调节[19-20]。既往研究表明CA199是PDAC患者的预后因素[21-23]。然而在本研究中CEA、CA125和NLR等临床指标均无显著预测价值,这可能与各个研究中对各指标并无统一的临界值计算方法或者及样本量大小等因素有关。CT视觉特征一定程度上可以反映肿瘤的组织病理信息,但本研究中纳入的CT特征中,肿瘤位置、最大径、边界、密度、坏死囊变、强化方式和程度及CT发现阳性淋巴结等征象在预测PDAC患者术后DFS方面均无统计学意义,表明CT特征预测术后胰腺导管腺癌DFS存在一定的限度。

CT影像组学能够反映肿瘤内异质性的相关信息[10]。既往已有使用CT影像组学预测PDAC患者预后的研究,结果均显示影像组学特征与PDAC患者的预后密切相关,但是这些研究中多为基于静脉期组学特征进行的分析[9,10,24,25]。本研究中比较了基于各期及多期联合CT图像的影像组学模型的预测效能,结果显示包含动脉期、静脉期及延迟期信息的多期联合组学模型具有更高的预测效能,说明基于多期图像的组学模型包含有更多能反映预后的深层次的肿瘤异质性微观信息,这可能与多期相能够更全面有效地显示肿瘤坏死、出血及囊变等病理变化,可提取更多反映肿瘤微血管生成和血流灌注异质性的组学特征等有关。多期联合组学模型中包含了最终筛选出的17个组学特征,多为二阶纹理特征,其中权重系数最高的特征是经小波变换获得,小波变换基于3个方向将原始图像分解为高、低频,能有效地解耦纹理信息[26]。相较于原始纹理特征,小波特征能提供边缘轮廓信息、反映肿瘤生长特征和预后的异质性信息[27]。由于PDAC患者术后预后受多种临床及病理因素影响,病理生理机制复杂,故我们将临床病理特征与多期联合影像组学标签相结合构建临床-组学综合模型,结果显示其预测效能略优于多期联合组学模型,明显高于临床模型。DCA分析显示,临床-组学综合模型的临床效益最好。为便于临床医师更加直观方便地应用,我们基于临床-组学综合模型绘制了诺莫图。

根据临床-组学综合模型风险值的最佳截断值,将PDAC患者分为高风险组和低风险组,两组患者的DFS在训练集和验证集中均存在显著差异,高风险组的DFS均明显短于低风险组,表明我们构建的模型有助于识别PDAC患者术后DFS短的高危患者,从而可指导临床制订个体化的治疗及随访方案。

本研究存在一定的局限性:①本研究为回顾性研究,可能存在一定的样本选择偏倚;②本研究中ROI的勾画未使用自动分割技术,可能存在一定的误差;③对于影像组学分析而言,样本量较小;④CT图像分析过程中可能存在一定的主观性;⑤为单中心研究,缺乏外部验证。

总之,基于多期CT图像的影像组学模型及临床-组学综合模型在预测PDAC患者术后DFS方面具有良好的效能,临床收益明显优于临床模型,能够指导临床决策。

猜你喜欢

组学预测特征
无可预测
选修2-2期中考试预测卷(B卷)
选修2-2期中考试预测卷(A卷)
如何表达“特征”
不忠诚的四个特征
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
抓住特征巧观察
不必预测未来,只需把握现在
代谢组学在多囊卵巢综合征中的应用