基于增强CT影像组学的列线图模型在预测胸腺上皮性肿瘤WHO简化分型中的应用研究*
2023-11-13徐加利谢宗玉
郑 璇 徐加利 刘 浩 谢宗玉,*
1.蚌埠医学院第一附属医院放射科 (安徽 蚌埠 233099)
2.北京医准智能科技有限公司 (北京 10089)
胸腺上皮性肿瘤(thymic epithelial tumors,TETs)是前纵隔区域最常见的原发肿瘤,WHO(2004版)将TETs分为A、AB、B1、B2、B3和C型6个亚型[1],2015版WHO胸腺肿瘤分类在保留这一框架的基础上提出,除伴有淋巴间质的微结节型胸腺瘤及微小胸腺瘤外的所有胸腺瘤均具有恶行潜能[2]。有研究[3]简化上述WHO分类为低危TETs(A、AB、B1型)和高危TETs(B2、B3、C型),低危TETs完整手术切除即可,而高危TETs常需术前辅助放、化疗以提高术后生存率,这种分类方法对预测患者生存率及临床治疗方案的制订有指导意义。
增强CT对纵隔胸腺瘤的检出率及诊断率较高[4],是目前临床上TETs术前诊断及术后随访中最常用的检查技术,既往研究结果[5-7]显示,病灶轮廓、强化方式、纵隔脂肪浸润、心包种植、胸腔积液及纵隔淋巴结肿大等特点对高、低危TETs有良好的鉴别能力。但上述影像学特征在组间存在重叠,且易受评估者主观性判断影响,因此,临床上需要一种术前能够客观有效预测TETs病理分型的方法[8]。影像组学能够高通量地提取图像特征,挖掘量化图像信息为医学数据,在肿瘤表型鉴别、淋巴结转移预测及新辅助疗效评估等方面已有诸多研究。因此,本研究旨在构建CT征象及影像组学特征的列线图模型,并评估该模型在TETs WHO简化分型中的应用价值。
1 资料与方法
1.1 患者资料收集2018年5月至2022年10月因前纵隔肿瘤入住我院胸外科,经手术切除后病理证实为TETs共165例,训练集(n=132)包括高危TETs 66例及低危TETs 66例,其中男性65例,女性67例,平均年龄(55.73±12.86)。验证集(n=33)包括高危TETs 17例及低危TETs 16例,其中男性19例,女性14例,平均年龄(56.36±15.32)。
入选标准:术前2周内于我院完成增强CT检查;检查前未接受治疗;患者无肝、肾功能不全等增强检查禁忌症及其他恶性肿瘤病史。排除标准:图像质量不能达到研究要求;病灶体积过小影响感兴趣区(ROI)的勾画。本研究经医院伦理委员会批准通过。
1.2 增强CT扫描方法与参数采用美国GE公司64排(LightSpeed VCT)及256排(Revolution)CT扫描,管电压120kVp,管电流150-250mAs,重建层厚及层间距3 mm,FOV 350×350mm,矩阵512×512。嘱患者吸气末屏气采集图像,扫描范围自胸廓入口至肾上腺水平,增强扫描采用造影剂(碘克沙醇320mgI/mL)80mL,速度3.5mL/s,注射对比剂后60 s采集静脉期CT图像。
1.3 CT特征分析增强CT图像判读由两名有10年以上工作经验的放射学诊断医师共同完成,两名医师对所纳入TETs病例的病理资料未知。诊断医师间意见的一致性采用cohen's kappa系数进行评价,认为kappa系数κ=0.00-0.20为极低;κ=0.21-0.40为一般;κ=0.41-0.60为中等;κ=0.61-0.80高度一致;κ=0.81-1完全一致[9]。
纳入评估的CT特征包括:(1)位置:偏左、偏右或居中;(2)径线测量:选取病灶最大截面,测量最长径和与其垂直的最短径;(3)形态:规则或不规则;(4)边缘:光滑或毛糙;(5)钙化:有或无;(6)强化方式:均匀或不均匀;(7)强化程度:根据强化程度低于、等于或高于胸壁肌层划分为轻、中、重度强化;(8)纵隔脂肪浸润:病灶与邻近心包、大血管间脂肪间隙存在或消失;(9)心包或胸腔积液:有或无;(10)区域淋巴结肿大(短径大于10mm):有或无。
1.4 图像分割、特征提取及降维将静脉期图像以DICOM格式传至医准达尔文科研平台(http://www.yizhun-ai.com),沿病灶轮廓逐层勾画ROI(图1),平台自动提取纹理特征并经过指数、对数、平方、平方根转换及小波滤波器间组合变换共得到特征1316个。
图1 在胸部增强CT静脉期图像上勾画肿瘤ROI。图2A-2B 应用5折交叉验证选定最佳调和参数a,在log(a)处做垂线确定系数非零的特征个数。图2C 逻辑回归筛选出的系数非零特征及重要性分布图。图3 预测TETs WHO简化分型的列线图。图4 训练集(4A)与验证集(4B)中各模型的ROC曲线。图5 训练集(5A)与验证集(5B)的校正曲线。图6 各模型的决策曲线。
特征降维在医准达尔文科研平台完成。首先运用最大最小值归一化对数据进行预处理,然后使用样本方差F值及最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法筛选出系数非零的特征,通过每个特征前的权重值线性拟合影像组学公式,最后计算出每位患者的radscore。
1.5 模型建立与评估利用CT特征中的独立预测因素构建CT特征模型,利用radscore构建影像组学模型,联合具有独立预测能力的CT特征和radscore构建列线图模型。使用受试者工作特性曲线(receiver operating characteristic curve,ROC)评价各个模型的预测能力,校正曲线和Hosmer-Lemeshow检验评价模型的校正能力和拟合优度,决策曲线(decision curve analysis,DCA)评价不同风险阈值下各个模型的临床收益情况。
1.6 统计学分析使用SPSS 23.0、MedCalc 19.3.1及R 4.1.0软件进行统计分析。服从正态分布的计量资料的组间比较采用t检验,非参数计量资料采用Mann-Whitney检验,计数资料采用χ2检验。认为P<0.05的差异有统计学意义。
2 结果
2.1 一般资料与CT特征训练集及验证集中,患者的年龄、性别及肿瘤的位置、强化程度及钙化在高危和低危TETs组间没有统计学差异(P>0.05)。训练集及验证集中,病灶的形态、强化方式、纵隔脂肪浸润及区域淋巴结肿大组间比较均有统计学差异(P<0.05)。此外,训练集中病灶的大小、边缘及心包、胸腔积液组间比较亦具有统计学差异(P<0.05),见表1。训练集的多因素Logistic回归分析发现,纵隔脂肪浸润是高危TETs的独立预测因素(OR:8.333,95%CI:3.815-18.202,P<0.001)。
表1 训练集和验证集的临床资料及CT特征比较
各CT特征的观察者间一致性较高,两名观察者对病灶强化程度(κ=0.803)、钙化(κ=0.924)、积液(κ=0.894)及区域淋巴结肿大(κ=0.848)的判断几乎一致,而对病灶的形态(κ=0.697)、边缘κ=0.623)、强化方式(κ=0.788)、纵隔脂肪浸润(κ=0.727)判断具有高度一致性。
2.2 影像组学特征通过样本方差F值10折交叉验证法评估特征与类别标签的线性相关性,首选筛选出10个组学特征,然后使用LASSO回归(L1正则化)确定最佳调和参数α,在log(α)处做垂线确定系数非零的特征7个,根据LASSO回归系数拟合的radscore标签公式(图2,表2)。各特征值高危及低危组间比较有显著统计学差异(P<0.001)(表3)。
表2 影像组学特征及系数
表3 影像组学特征的组间比较
2.3 模型构建及效能评估采用独立预测因素纵隔脂肪浸润构建CT特征模型,采用radscore构建影像组学模型,将纵隔脂肪浸润和radscore两个指标共同纳入构建列线图模型,并绘制列线图(图3)。列线图模型的多因素逻辑回归结果见表4。
表4 列线图模型中各参数的多因素逻辑回归结果
ROC评估结果显示,训练集中列线图模型(AUC=0.902,95%CI:0.838-0.947)的诊断价值高于CT特征模型(AUC=0.742,95%CI:0.659-0.815)和影像组学模型(AUC=0.884,95%CI:0.817-0.933),且在验证集中仍有较高的诊断效能(AUC=0.824,95%CI:0.652-0.934)(表5,图4),Hosmer-Lemeshow检验结果显示列线图模型的拟合度良好(P>0.05)。在训练集与验证集中,列线图模型的校正曲线均与理想拟合曲线(45°)贴近,模型的校正性能良好(图5)。决策曲线分析表明当风险阈值为大于4%时,列线图模型的临床收益高于CT特征模型及影像组学模型(图6)。
表5 各模型的AUC及95%CI
3 讨论
TETs的WHO简化分型决定了临床治疗方法的选择,单纯手术切除还是术前辅以放、化疗,将对患者预后产生重要影响。Masaoka分期与患者预后相关性较强,因此一直作为指导临床治疗计划制定的关键指标,但其分期依赖于手术结果判定,对本可从术前新辅助治疗中获益的高危TETs患者来说没有价值[10]。因此,通过影像学手段术前准确预测TETs病理分型对降低术后复发率、改善患者生存状况有重要意义。本研究基于增强CT图像构建了联合CT特征和影像组学特征的列线图模型,对TETs简化分型的诊断准确性显著提高,为临床上TETs的无创性术前诊断及后续新辅助治疗计划实施提供了优化辅助工具。
多篇文献认为高危TETs及胸腺癌与低危TETs相比,形态多不规则且更易出现分叶[11],而肿瘤的密度、钙化、强化方式及强化程度等特征对于提示肿瘤的恶性程度没有帮助[6]。以上研究均为小样本,具有一定的参考价值。基于120例及178例的多因素研究[12-13]则发现病灶的形态、大小、边界及纵隔脂肪浸润均是TETs组织学分型的影响因素。纵隔脂肪浸润表现为病灶边缘模糊、棘状突起甚至心包、大血管侵犯,因此在高危TETs中发生率更高[5-6,14]。本研究评估的多个CT特征在组间均有鉴别意义,但多因素逻辑回归结果中仅纵隔脂肪浸润体现了独立预测价值,因此纳入CT特征模型,与Chen[8]的研究结果一致。笔者认为纵隔脂肪浸润能够成为最有价值的特征,源于其综合了病灶的形态、边界、周围结构侵犯等表现,提示肿瘤具有恶性生物学行为及较高的病理分型。此外,心包、胸腔积液在高危及低危患者中均有发现[15],推测二者发生的机制存在差异,高危肿瘤侵犯心包膜及胸膜组织并呈浸润性生长产生积液,而低危肿瘤体积较大时的占位效应导致静脉回流受阻产生积液。同样的,区域淋巴结肿大也不是高危TETs的决定因素。然而,CT特征观测的主观性较强、可重复性不佳可能会影响CT特征模型的稳定性。
影像组学能够更加客观、全面且定量地提取图像特征。本研究中,球度及灰度共生矩阵(GLCM)、灰度依赖矩阵(GLDM)、灰度游程步长矩阵(GLRLM)、灰度区域大小矩阵(GLSZM)是独立预测因素。球度用于描述肿瘤形态与球体的贴近程度,公式为(1/36体积2/3)/表面积,取最大值1时肿瘤接近球体。高危TETs具有侵袭性生长的生物学特性,体积增长速度快、倍增时间短[16]。有关肺癌肿块球度的研究[17]表明,肿瘤体积的对数与球度呈反比,即肿瘤体积越大则形态越不规则。而基于PET/CT图像的机器学习分析后得出,球度是鉴别高低危胸腺瘤的重要指标[18]。Yamazaki M[19]进行亚组分析后提出,球度小于0.528可作为胸腺瘤危险度分组的界值。GLCM是反映灰度分布方向和幅度的综合性特征,能够体现体素的空间依赖性和与周围环境的关系,GLDM描绘了图像灰度的空间相互关系,GLRLM表现为灰度值一致的连续像素的长度分布,GLSZM按照灰度值定量图像中的区域大小。上述高阶纹理特征显现出体素相关灰度分布的差异性,与肿瘤内部成分的复杂性、异质性相关[8,20],微观层面上体现在肿瘤病理分型越高,细胞的有丝分裂越活跃、核异质比例增加,具有侵袭性生长倾向[21]。
列线图能够整合并赋值多个危险因素,通过计算得分实现个体化、可视化的结局预测。列线图在近年来的研究中广泛应用于肿瘤良恶性鉴别、危险等级划分及淋巴结转移预测,已经成为临床术前诊断及风险预判的重要手段[22-24]。列线图在诊断胸腺肿瘤方面同样发挥了重要作用,基于增强CT图像构建的列线图模型(训练集AUC值0.923,验证集AUC值0.870)[15]及基于MRI图像构建的列线图模型(训练集AUC值0.946,验证集AUC值0.878)[25]在预测胸腺瘤的危险分型中均有优秀表现。本研究联合了CT特征及影像组学特征构建的列线图模型,在训练集及验证集中均体现了较高的诊断效能(训练集AUC值0.902,验证集AUC值0.824),进一步验证了列线图模型的准确性及稳定性。本研究选择注射对比剂后60s的静脉期图像用于特征评估及ROI勾画,肿瘤于静脉期轮廓显示更加清晰,图像分割更为精准[8],此外,由于肿瘤内部新生血管壁的通透性增加,使得造影剂滞留细胞外间隙,因此静脉期图像能够凸显出肿瘤的异质性,从而提供更多的生物学信息[26-28]。
本研究存在不足:(1)本文为单中心回顾性研究,样本量相对较少。(2)图像由放射科医师手动分割,可能存在主观偏差。(3)MRI对肿瘤的边界显示比CT更加清晰,PET-CT则可判断肿瘤的生物学活性,未来综合多种检查手段的多模态研究更有助于TETs的术前诊断、生存预测及预后评估。
综上所述,基于术前影像CT特征和影像组学特征构建的列线图模型是一种预测TETs简化病理分型的新方法,能够为患者提供无创性风险评估,并指导术前新辅助治疗及术后放化疗,改善高危患者的预后使其收益。