APP下载

影像组学模型对肺腺癌谱病变病理侵袭性的诊断价值

2024-01-25孙希子周舒畅夏黎明

放射学实践 2024年1期
关键词:组学分类器腺癌

孙希子,周舒畅,夏黎明

随着低剂量肺部CT筛查的广泛开展,肺结节的检出率越来越高。现有肺结节管理指南都是基于临床信息、影像学随访资料、PET/CT结果、活检结果预测恶性概率而决定进一步管理方式[1]。对于高度怀疑恶性的结节,活检和手术是需要选择的管理方式。通过活检和血清学肿瘤标志物检测,可鉴别小细胞肺癌(small cell lung cancer,SCLC)与非小细胞肺癌(non-small cell lung cancer,NSCLC),并可通过免疫组织化学染色进一步区分肺鳞癌与肺腺癌。然而不管是细针抽吸活检还是切割针活检都无法区分肺腺癌疾病谱。根据世界卫生组织(WHO)2021年第五版肺肿瘤分类[2],病理分型上肺腺癌谱分为腺体前驱病变-非典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)和腺癌-微浸润性腺癌(minimally invasive adenocarcinoma,MIA)、浸润性腺癌(invasive adenocarcinoma,IAC),腺体前驱病变可逐步演变为肺腺癌[3]。AAH常在5 mm以内,很少被切除送检,在此不作讨论。据文献报道,AIS和MIA患者术后的5年无病生存率(disease free survival,DFS)为100%[4,5],而IAC术后5年无病生存率为54.0%~94.9%(P<0.001)[6],取决于占主导的组织学亚型。由于有极佳的预后,AIS和MIA被研究者称为“惰性病变”[7]。尽管尚有争议,大多数研究者认为定期随访或亚肺叶切除(楔形切除或节段性切除)适用于AIS和MIA,而对IAC患者应该施行肺叶切除术[8-10]。因此术前非侵入性地鉴别“惰性病变”与IAC,对于存在肺腺癌谱病变患者的治疗指导和预后预测都有重要意义。

影像组学的概念首先由荷兰学者Lambin于2012年提出[11],是指应用自动化数据特征化算法,将从影像特征中提取的医学影像数据转化为高分辨率可挖掘的特征空间数据[12],即将医学影像转化为可进一步分析的高维数据,探索医学影像特征与疾病诊断或预后之间的关联。本研究旨在探讨肺腺癌谱病变的影像组学模型对其侵袭性的预测价值,以及影像组学模型与一般指标、人工判读能力的比较。

材料与方法

1.研究对象

回顾性分析我院2019年1月至2023年2月肺腺癌切除术后169例患者(172个结节)的临床、病理及影像资料,其中男56例,女113例,年龄21~75岁,平均(51.87±11.06)岁。病例纳入标准:①薄层CT图像上表现为5~30 mm的肺结节;②术前1个月内进行直接增强CT检查;③术中或术后病理证实为AIS、MIA、IAC;④年龄>18岁;⑤不限制有无淋巴结转移;⑥不限制有无毛刺征、分叶征、胸膜牵拉征等恶性征象。

2.CT扫描和图像分割

所有患者入院后均常规行胸部薄层MSCT检查,层厚1 mm,矩阵512×512,标准算法重建。为增加研究的鲁棒性,纳入本研究的图像摄自不同厂家不同扫描参数的设置。将最终获得的数据和图像,通过3D Slicer软件完成结节的手动逐层分割。上述操作均由本院具有多年胸部影像学诊断经验的医师完成(工作年限3年左右),并进行观察者内和观察者间的可重复性研究-6个月后由该医师和具备5年临床经验的医生再次分割,以评估组内和组间的一致性。

3.特征提取

提取的特征可分为肿瘤强度、纹理、形状及小波特征四类。对体素大小重采样至1 mm×1 mm×1 mm,将体素强度值使用64 HU的固定间隔宽度进行离散化,对像素进行归一化处理后,提取包括形状特征、一阶特征、灰度共生矩阵(gray level cooccurrence,GLCM)特征、灰度区域大小矩阵(grey level size zone matrices,GLSZM)特征、灰度游程长度矩阵(gray level run length matrices,GLRLM)特征、邻域灰度差矩阵(neighbourhood gray-tone difference matrix,NGTDM)特征、灰度依赖矩阵(gray level dependence matrix,GLDM)特征和小波特征在内的特征用于进一步统计分析。采用组内相关系数(intra-class correlation coefficient,ICC)评估组间和组内一致性(ICC>0.75说明具有较好的一致性)。

4.影像组学模型构建和人机竞赛

数据预处理:随机选择60%的样本用于训练模型,40%的样本用于测试。划分好数据集后,首先对各数据集分别标准化,然后在训练集上通过带L2惩罚项的逻辑回归进行嵌入式特征筛选。

模型构建与评价:构建模型所使用的3种分类器分别为逻辑回归(logistic regression)、随机森林(random forest)和极致梯度提升(extreme gradient boosting,XGboost)。绘制对应的受试者工作特征(receiver operating characteristic,ROC)曲线并计算曲线下面积(area under curve,AUC)以评价模型的诊断效能。通过Delong检验比较不同分类器之间AUC的差异。

人机竞赛:由另2位事先不知道病理结果的高年资放射科医生对所有图像进行侵袭性概率评分(0~1分)。医生对于侵袭性的评价主要结合患者年龄、实性成分比例、毛刺征、胸膜凹陷等,根据临床经验对侵袭性概率进行主观评分,医生对侵袭性概率的最终评分为两高年资医生的评分均值。通过Delong检验比较医生与最优分类器的诊断效能。

5.统计学分析

采用SPSS 25.0软件进行统计学分析。t检验用于正态分布的两独立样本的均值比较,皮尔逊卡方检验用于样本间构成比的比较,曼-惠特尼U检验用于非正态独立样本中位数的比较。采用组内相关系数(ICC)以及带L2惩罚项的逻辑回归进行特征筛选。通过逻辑回归(LG)、随机森林(RF)、极致梯度提升(XGboost)分别构建鉴别肺腺癌谱分型的影像组学模型。采用ROC曲线及AUC评价单个特征及模型的预测效能,Delong检验比较不同诊断途径的诊断效能。以P<0.05为差异有统计学意义。

结 果

1.一般资料

本研究共纳入169例患者,172个结节,其中AIS37个,MIA47个,IAC88个。惰性病变组(AIS/MIA)与IAC组的患者年龄差异有统计学意义(P<0.05),而两组在性别、有无吸烟史、病灶部位上差异无统计学意义(P>0.05)。其中,惰性病变组无实性结节,而IAC组有16个实性结节 ,纯磨玻璃结节(pure ground glass nodule,pGGN)在惰性病变组中的比例显著高于IAC组,两组的病灶性质差异有统计学意义(P<0.05)。惰性病变组的ROI体积显著小于IAC组,差异有统计学意义(P<0.05,表1)。

表1 惰性病变组与IAC组的一般资料比较 (n,%)

2.分类器预测效能

通过特征提取和ICC筛选共得到863个特征,通过进一步嵌入式特征筛选(对ICC>0.75的特征进行带L2惩罚项的逻辑回归),共筛选得到420个特征。三种分类器的ROC曲线见图1,逻辑回归、随机森林以及XGboost的AUC分别为0.921、0.956和0.958。XGboost模型在测试集上的混淆矩阵见图2。Delong检验结果提示三种分类器的诊断效能差异无统计学意义(P>0.05,表2)。

表2 Delong检验结果

图1 三种分类器的ROC曲线和人机竞赛。图2 XGboost在测试集上的混淆矩阵。图3 年龄、ROI体积、XGboost 诊断的ROC曲线。

3.各种诊断方法比较与人机竞赛

单独用年龄以及ROI体积诊断的ROC曲线见图3,AUC分别为0.620和0.863,两者诊断效能差异有统计学意义(P<0.05)。ROI体积与XGboost的诊断效能差异无统计学意义(P>0.05)。高年资医生诊断的AUC为0.896,Delong检验结果提示高年资医生与三种分类器的诊断效能差异均无统计学意义(P均>0.05,表2)。

讨 论

本研究探讨了CT影像组学对肺腺癌谱病变侵袭性的诊断价值,并将其与一般诊断指标以及人工判读进行客观比较,研究结果表明CT影像组学用于术前判断肺腺癌谱病变侵袭性的准确性较高,与ROI体积及人工判读的诊断效能相当。

CT作为临床上应用最为广泛的诊断技术之一,可为肺腺癌的诊断提供瘤体形态、边缘形态、瘤-肺界面、内部结构、瘤周征象等信息。传统的诊断方法依赖于这些肉眼可分辨的特征,而影像组学则利用大量可重复性强且精确的特征数据进行准确诊断。已有的对肺腺癌谱病变侵袭性诊断的影像组学研究集中于磨玻璃结节[13-15]或部分实性结节[16,17]。将实性结节和亚实性结节综合在一起的研究较少-She等[7]通过最小绝对收缩选择算子(least absolute shrinkage and selection operator,LASSO)-逻辑回归构建了基于402例肺腺癌谱病变的病理分型CT影像组学模型,发现模型评分和性别是预测肺腺癌谱病变侵袭性的独立因素。该研究模型的诊断效能较高,也更适用于临床情境。不过有基于分层分析的研究结果表明影像组学在预测磨玻璃结节/肿块浸润性中的效能高于在预测实性结节良恶性中的效能[18]。因此,影像组学在不同类型肺结节/肿块中的独立及综合诊断效能有待进一步研究。

多项研究表明CT图像中肺腺癌谱结节实性成分含量与肿瘤浸润性显著相关[19,20],这与本研究中纯磨玻璃结节(pGGN)在惰性病变中比例显著高于IAC组的结论相符。根据Fleischner指南[21],临床上常使用肺结节同一平面的长径和短径的均值作为球的直径计算结节体积。影像组学则是将ROI内体素的个数与体素的体积相乘得到结节体积,这种原理得出的体积更接近于结节的实际体积。本研究首次将影像组学中的ROI体积单独用于诊断效能评估,并得到ROI体积AUC与最优机器学习算法AUC差异无统计学意义的结论。

本研究所采用的三种分类器--逻辑回归、随机森林、XGboost均属于常规广泛应用的算法,其中XGboost被最晚提出(2016年),也表现出了最优的性能。Delong检验是用于不同ROC曲线下面积差异显著性检验的算法,该算法不断被优化以适用于更多的科研场景[22]。基于此,笔者在Python 3.7.6中编写了相应的程序以实现不同诊断方法之间AUC客观便捷的比较。

本研究存在以下局限性:①样本量较少且为单中心回顾性研究,而提取分析的特征相对较多;②图像分割均由人工手动实现,耗时耗力;③从XGboost在测试集上的混淆矩阵来看,影像组学的预测准确率还不够理想,但随机森林和XGboost算法在训练集上均无一例误判,说明这两种影像组学模型可能存在一定过拟合的情况;④图像来自多组参数的多台设备,对图像质量有一定影响。在今后的研究中,需要扩大样本量开展多中心前瞻性研究,并开发自动勾画感兴趣区的软件以及更优化的算法,更加深入便捷地探讨影像组学特征在肺腺癌谱病变术前病理诊断中的价值,早日实现影像组学在临床诊断中的应用。

综上所述,影像组学分类器模型进行肺腺癌谱病变的术前病理诊断具有较高的准确性,其诊断效能与ROI体积及高年资医生相当,能为临床诊疗提供一定依据。

猜你喜欢

组学分类器腺癌
口腔代谢组学研究
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
BP-GA光照分类器在车道线识别中的应用
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
HIF-1a和VEGF-A在宫颈腺癌中的表达及临床意义
代谢组学在多囊卵巢综合征中的应用
GSNO对人肺腺癌A549细胞的作用
老年胃腺癌中FOXO3a、PTEN和E-cadherin表达的关系