基于增强CT影像组学鉴别胸腺瘤组织学分型
2022-05-25张金华张濬韬娄和南林吉征
张金华,张濬韬,张 亮,娄和南,林吉征*
(1.青岛大学附属医院放射科,山东 青岛 266000;2.通用电气医疗精准医学研究院,上海 210000)
根据上皮细胞形态及上皮细胞与淋巴细胞的比例,胸腺上皮性肿瘤可分为A、AB、B1、B2、B3型胸腺瘤及C型(胸腺癌);除伴有淋巴样间质的微结节型胸腺瘤和微小胸腺瘤外,所有胸腺瘤及胸腺癌均为恶性肿瘤[1-2],而B2、B3型胸腺瘤较A、AB及B1型复发率更高、存活率更低[3],故JEONG等[4]将胸腺瘤组织分型简化为低危组胸腺瘤(A、AB、B1型)和高危组胸腺瘤(B2、B3型)。影像组学可基于传统CT或MRI无创性提取肿瘤纹理特征并分析其潜在恶性[5-6]。本研究探讨基于增强CT影像组学鉴别胸腺瘤组织学分型的价值。
1 资料与方法
1.1 一般资料 回顾性分析2016年10月—2021年9月226例于青岛大学附属医院经手术病理证实的胸腺瘤(单发病灶)患者,男125例,女101例,年龄23~86岁,平均(54.0±12.1)岁;将其中A型17例、不典型A型6例、AB型96例及B1型27例归为低危组(n=146),B2型53例及B3型27例归为高危组(n=80)。纳入标准:①临床及病理资料完整;②术前2周接受胸部CT动态增强检查。排除标准:①图像存在运动及金属等伪影;②术前接受放射及化学治疗。
1.2 仪器与方法 采用GE Bright Speed 16层、Siemens Sensation Cardiac 64层螺旋CT机及Toshiba Aquilion ONE 640 CT仪、自动管电流调节技术行胸部CT扫描,范围自肺尖至肺底,管电压120 kV,层厚5 mm,层间距5 mm。以3 ml/s流率按照1.0 ml/kg体质量注射对比剂碘海醇(300 mgI/ml),于注射对比剂后30 s及65 s进行动、静脉期扫描。扫描结束后重建薄层图像,层厚1 mm,层间隔1 mm。
1.3 图像分析 由具有5~10年胸部影像学诊断经验的主治及副主任医师各1名以盲法阅片,意见分歧时经协商达成一致。参考文献[7]方法评估病灶CT特征:①最大长径;②位置(右侧/中线/左侧);③形态(类圆形/不规则形);④边界(清楚/模糊);⑤有无囊变、坏死;⑥是否钙化;⑦是否侵犯邻近组织(包括肺组织、胸膜、心包及大血管);⑧是否转移(肺内、胸膜或淋巴结);⑨增强动脉期及静脉期CT值(实性成分,每期测量3次,取平均值);⑩强化模式(早期强化、动静脉期强化相仿及延迟强化),以动、静脉期强化CT值差>10 HU为界值;强化均匀性,CT值相差≥10 HU,定义为不均匀;CT值相差<10 HU,定义为均匀。
1.4 分割图像与提取特征 由上述医师观察图像,对窗宽、窗位进行统一化处理(窗宽300 HU,窗位40 HU),以ITK-SNAP软件分别于增强动脉期及静脉期显示病灶最大层面的薄层图像上沿病灶轮廓勾画ROI,见图1;将病灶最大层面图像及ROI导入Pyradiomics软件并提取其特征,根据图像生物标志物标准化倡议进行标准化处理。
图1 勾画胸腺瘤ROI示意图 A.于增强静脉期轴位CT图上沿病灶轮廓勾画ROI(红色区域); B.获得的病灶ROI
1.5 筛选特征与建立模型 按7∶3比例将患者分为训练集(n=159)和测试集(n=67)。训练集含低危亚组103例及高危亚组56例,测试集含低危亚组43例及高危亚组24例。以最大相关最小冗余(maximum relevance minimum redundancy, mRMR)及最小绝对收缩和选择算子(least absolute shrinkage and selection operator, LASSO)算法筛选训练集特征。采用10折交叉验证筛选最小lambda(λ)值,获得最佳影像组学特征,并评估其系数;计算每例患者的影像组学评分(radscore, RS),以logistic回归分析建立影像组学模型。
采用单因素logistic回归分析筛选鉴别胸腺瘤组织学类型的临床特征及CT表现相关预测因素;以步进后退式回归方法针对有意义的变量建立鉴别胸腺瘤组织学分型的临床模型,根据模型的赤池信息准则(Akaike information criterion, AIC)值筛选诊断效能最佳的临床模型;联合RS及临床、CT表现相关预测因素,以步进后退式多因素logistic回归构建影像组学列线图。
1.6 统计学分析 采用SPSS 26.0软件及R软件。以±s表示符合正态分布的计量资料,以中位数(上下四分位数)表示不符合者,分别采用独立样本t检验、Wilcoxon检验进行组间比较。采用χ2检验或Fisher精确概率法比较计数资料。绘制受试者工作特征(receiver operating characteristics, ROC)曲线,计算曲线下面积(area under the curve, AUC),以DeLong检验比较其差异,评估各模型对训练集及测试集胸腺瘤组织学分型的诊断效能;以校正曲线及Hosmer-Lemeshow检验评价影像组学列线图的拟合优度,以决策曲线分析(decision curve analysis, DCA)评估其临床效能。P<0.05为差异有统计学意义。
2 结果
2.1 高危组与低危组临床特征及病灶CT表现比较 2组患者性别、年龄、重症肌无力(myasthenia gravis, MG)及病灶形态、边界、是否钙化、是否侵犯邻近组织、是否转移、动脉期及静脉期CT值差异均有统计学意义(P均<0.05),其余参数差异均无统计学意义(P均>0.05)。见表1。
表1 高危与低危胸腺瘤患者临床特征及病灶CT表现比较
2.2 提取、筛选影像组学特征 分别于动脉期及静脉期图像提取788个影像组学特征,包括一阶直方图特征及纹理特征,经mRMR剔除冗余及无关特征后保留30个影像组学特征,经LASSO最终筛选出19个最佳影像组学特征(动脉期8个,静脉期11个),见图2、3,并计算患者RS。训练集及测试集数据中,高危亚组患者的RS均高于低危亚组(P均<0.05),见图4。
图2 筛选影像组学特征 A.采用LASSO法筛选影像组学特征; B.影像组学特征LASSO系数的剖面图
图3 所选最佳影像组学特征及其系数图
图4 训练集及测试集内低危亚组与高危亚组患者RS比较 A.训练集; B.测试集
2.3 建立临床模型及影像组学列线图 将临床特征及病灶CT表现纳入单因素logistic回归分析,结果显示患者年龄、性别、MG及病灶形态、边界、侵犯邻近组织、动脉期及静脉期CT值是胸腺瘤组织学分型的预测因素(P均<0.05);根据模型的AIC值,多因素回归分析建立的最优临床模型为5.731 165 187 818 19×截距+0.028 228 045 977 483 1×年龄-0.044 823 795 709 692 6×动脉期CT值+0.822 572 673 937 522×MG+0.705 479 125 877 664×形态-0.871 889 844 374 902×侵犯邻近组织,见表2。联合RS及临床、CT表现,构建影像组学列线图(图5)。
表2 单因素及多因素logistic回归分析胸腺瘤组织学分型的预测因素
图5 鉴别胸腺瘤组织学分型的影像组学列线图
2.4 评估各模型的诊断效能 训练集中,影像组学列线图及影像组学模型区分低危亚组与高危亚组胸腺瘤的AUC(0.91、0.89)均高于临床模型(0.79,Z=3.62、2.49,P均<0.05),而影像组学列线图与影像组学模型的AUC差异无统计学意义(Z=1.54,P=0.12);测试集中,影像组学列线图、影像组学模型与临床模型的AUC差异均无统计学意义(P均>0.05),见图6和表3。校正曲线(图7)及Hosmer-Lemeshow检验显示,影像组学列线图在训练集及测试集的拟合优度良好(χ2=9.490、15.235,P=0.303、0.054)。阈值概率为0.1~1.0时,影像组学列线图的临床获益均大于临床模型及影像组学模型。
表3 影像组学模型、临床模型及影像组学列线图鉴别胸腺瘤组织学分型的效能
图6 各模型鉴别训练集和测试集胸腺瘤组织学分型的ROC曲线 A.训练集; B.测试集
图7 影像组学列线图在训练集及测试集的校正曲线 A.训练集; B.测试集
3 讨论
既往术前多根据CT表现鉴别诊断胸腺瘤组织学分型。低危与高危胸腺瘤CT表现存在差异[8],但缺乏特异性。本研究高危组胸腺瘤形态多不规则、边界模糊、出现钙化、侵犯邻近组织、转移的可能性更大;低危组胸腺瘤形态呈类圆形多见,边界清楚,少见钙化、侵犯邻近组织及转移,与既往研究[9-10]相符。基于CT提取纹理特征可反映肿瘤异质性。增强静脉期CT纹理特征中的均值、标准差及平均像素与胸腺瘤组织学分型相关[11]。应用增强动脉期CT纹理特征构建鉴别低危与高危胸腺瘤的影像组学模型,取得了良好效果[12]。增强动脉期结合静脉期CT图能更全面地反映低危与高危胸腺瘤血流灌注差异及组织异型性。本研究选取病灶最大层面进行2D纹理分析,基于增强双期CT筛选出19个最佳影像学特征,包括一阶直方图特征及纹理特征,所建立的鉴别胸腺瘤组织学分型的影像组学模型的诊断效能良好。研究[13]证实,3D纹理分析可较2D纹理分析提高分类准确性。WANG等[12]所建立的3D纹理分析模型预测胸腺瘤组织学类型的AUC值为0.827,稍低于本研究结果,可能与本研究结合双期增强图像进行分析有关;且纹理分析亦受扫描参数、重建参数等影响[5]。
本研究发现影像组学模型及影像组学列线图与临床模型对测试集的诊断效能差异无统计学意义,可能低危与高危胸腺瘤的临床及CT表现本身存在较大差异;但阈值概率为0.1~1.0时,影像组学列线图的临床获益均大于临床模型及影像组学模型,提示基于增强CT影像组学模型和基于临床、CT表现及RS的影像组学列线图均有利于鉴别胸腺瘤组织学分型,后者的临床获益更高。
本研究的局限性:①样本量小,且为单中心研究,缺乏外部验证;②采用手动方法勾画病灶ROI,存在一定偏差;③仅对病灶最大层面及增强图像进行分析,有待扩大样本量进行3D纹理分析,并与平扫CT对比分析,以进一步完善。