CT放射组学在鉴别纵隔淋巴结结核与非小细胞肺癌纵隔淋巴结转移瘤中的应用价值

2023-10-09袁小记孙秀彬韩榕倪聪慧王武章于德新

中国防痨杂志 2023年10期

袁小记孙秀彬韩榕倪聪慧王武章于德新

2022年全球结核病报告显示,中国是全球第三大结核病高负担国家[1]。纵隔淋巴结肿大最常见的感染性原因是淋巴结结核,最常见的肿瘤性原因是淋巴结转移瘤,并以非小细胞肺癌最为多见[2-4]。目前,常规鉴别纵隔淋巴结肿大性质的方法主要依靠CT扫描,但临床工作中很多患者的原发病灶及肿大淋巴结在结核病及肿瘤的CT检查中表现极为相似,导致常规CT检查难以鉴别,特别是对于成人原发性肺结核,误诊率极高[5]。即便是对肿瘤诊断有极高价值的正电子发射计算机断层显像(positron emission tomography,PET-CT)也对两者的鉴别能力有限,淋巴结结核的误诊率甚至高达70.6%[6]。尽管基因组二代测序技术(mNGS)、抗酸杆菌染色涂片镜检及分枝杆菌培养等实验室检查手段可以提供一定的鉴别信息,但检测敏感度均较低[7-8],实际临床价值受到限制。而基于人工智能大数据的放射组学分析方法为纵隔淋巴结肿大的良恶性鉴别提供了契机,大量组学特征可以弥补肉眼识别的不足,但由于肺结核原发病灶病程不一、成份复杂,或部分患者无明确原发灶,均可能导致放射组学统计结果发生偏倚。基于此,笔者选择了结核性和转移性纵隔淋巴肿结大患者进行研究,以期探讨CT影像组学在二病鉴别诊断中的价值,为临床诊断提供更多信息。

对象和方法

一、研究对象

采用回顾性研究方法,于2017年9月至2021年11月参照入组标准分别从山东省公共卫生临床中心(原山东省胸科医院)和山东大学齐鲁医院纳入109例纵隔淋巴结结核(结核组)和65例肺癌纵隔淋巴结转移瘤(转移瘤组)患者作为研究对象,分析其CT影像组学特征对两种疾病的鉴别诊断价值。其中,96例结核病患者和47例转移瘤患者来自山东省公共卫生临床中心,13例结核病患者和18例转移瘤患者来自山东大学齐鲁医院;结核组患者中,男性65例(59.6%)、女性44例(40.4%),年龄中位数(四分位数)为32(15,70)岁;转移瘤组患者中,男性46例(70.8%)、女性19例(29.2%),年龄中位数(四分位数)为63(41,84)岁;两组间性别差异无统计学意义(χ2=2.186,P=0.139),年龄差异有统计学意义(Z=9.359,P<0.001)。

纳入标准:(1)结核组:经手术切除或穿刺后病理检查、实验室检查确诊为结核病,或经临床和影像综合诊断,并经抗结核药物治疗有效;(2)转移瘤组:所有入组淋巴结均经淋巴结穿刺活检或手术病理证实为转移癌;(3)纵隔、肺门淋巴结短径>10 mm;(4)图像质量符合放射组学分析要求。

排除标准:(1)虽确诊为纵隔淋巴结转移瘤但淋巴结最短径≤10 mm者;(2)肺结核合并肺癌者;(3)临床资料证实可能存在混合感染者;(4)结核组对应的抗结核治疗无效者;(5)CT图像存在运动伪影,图像质量不清晰者。

二、检查方法

1.CT扫描:本研究患者均行飞利浦64排CT扫描,扫描前质量矫正合格。扫描方法:患者平卧,双手上举,深吸气后在屏气状态下自肺尖扫描至双肋膈角。扫描条件:探测器准直64×0.625;扫描速度为0.5 s/周;螺距:1.375;管电压:120 kV;管电流:250～400 mA;使用自动管电流调制;层厚:5 mm。对比剂用量:1～1.5 ml/kg,注射速率:3～4 ml/s,主动脉期增强扫描后,延迟30 s扫描静脉期。扫描范围自肺尖至肺底,单次屏气完成扫描。

依据欧洲胸外科协会指南(ESTS guideline)[9],淋巴结最短径>1 cm可考虑淋巴结转移。本研究选取最短径>1 cm的纵隔淋巴结作为研究对象。因肿瘤组入组淋巴结部分为穿刺活检结果,穿刺淋巴结部位多集中在4/7/10区等,其他区域淋巴结纳入少,本研究无法进行分区鉴别。

2.图像分割:研究搜集入组患者胸部增强CT静脉期的医学数字成像和通信(digital imaging and communications in medicine,DICOM)图像上传至汇医慧影医疗Radcloud平台,再采用双盲法由2名不了解患者疾病情况的放射科医师对所有患者的CT图像进行观测和勾画。首先,由1名主治医生手动在纵隔窗(WL:40;WW:350)上对感兴趣区域(volume of interests,VOI)淋巴结的面积进行勾画,尽量保证勾画的准确性。VOI涵盖了纵隔、肺门所有短径>1 cm的淋巴结,并在每层有病灶的图像中勾画淋巴结面积。轮廓线贴近淋巴结实性边缘,如果有血管被完全包绕在病灶内,则可视为病灶的一部分进行勾画;如果血管贴于病灶边缘或部分被包绕,则可予以剔除,不勾画血管;如果因两个或多个淋巴结融合而无法分辨界限,则可将其视为1个病灶进行勾画,作为1个VOI;如果淋巴结为多发,则可单独勾画每个淋巴结,也作为1个VOI。最后由1名高级职称放射科医师对所有勾画的目标进行复查,并确定差异≥5%的VOI边界[10]。图1～4为10R区肿大淋巴结的勾画展示。

图1,2 患者,男,56岁,右肺门淋巴结转移瘤。图1为10R区肿大淋巴结无勾画;图2为10R区肿大淋巴结的勾画与强化方式。勾画时轮廓线贴近肿大淋巴结实性部分边缘;增强CT扫描(右肺门层面)可见10R区增大的淋巴结,以环形强化为主,与常规淋巴结结核强化方式相似,普通CT增强难以鉴别图3,4 患者,男,45岁,右肺门淋巴结结核。图3为10R区肿大淋巴结无勾画;图4为10R区肿大淋巴结的勾画与强化方式。勾画时血管贴于病灶边缘或部分被包绕,可予以剔除,不勾画血管;增强CT扫描(右肺门层面)可见10R区肿大淋巴结以分隔样强化为主,内见多发小的低密度灶,仅从强化方式上与淋巴结转移瘤难以鉴别

3.放射组学特征提取:利用Radcloud平台从CT图像中提取定量成像特征,可将特征分为4组:第1组(一阶统计),由常用的、基本的、可定量描述CT图像中体素强度分布的描述符组成;第2组(基于形状和大小的特征),包含反映区域形状和大小的三维特征;第3组(纹理特征),根据灰度运行长度和灰度共生纹理矩阵计算,对能量化区域异质性差异的纹理特征进行分区;第4组(高阶统计特征),包括由原始图像小波变换得到的强度和纹理特征。本研究使用了5种类型的滤波器:指数滤波器、平方滤波器、平方根滤波器、对数滤波器和小波滤波器(小波HHH、小波HLL、小波LHL、小波LHH)。

4.放射组学特征选择:首先采用特征标准化方法将上述影像组学特征的特征值缩放到(0,1)之间,再采用单因素logistic回归分析选择对鉴别诊断有价值的特征。选择回归分析中概率值P<0.05且模型评价C指数>0.65的特征,然后对筛选出来的特征进行共线性诊断。剔除存在共线性的特征后,采用SPSS 22.0软件基于最大自然估计的向前逐步回归法(forward:LR)进行多因素logistic回归的特征筛选,保留相互独立的放射组学特征构建机器学习模型。

5.建立模型评价诊断效果:利用上述选择出的放射组学特征,采用5折交叉验证方法分别建立k-近邻判别法(k-nearest neighbor,KNN)、支持向量机(support vector machine, SVM)、极限梯度提升算法(eXtreme gradient boosting,XGBoost)、随机森林(random forest, RF)、logistic回归(logistic regression, LR)和决策树(decision trees, DT)等6种机器学习模型,评价各模型的诊断效能,并选择最终模型。本研究曾在放射组学特征模型的基础上增加了患者性别和年龄的两个个体特征,但这并未使模型的诊断性能得到明显改善,因此,基于本研究主要评价CT影像放射组学特征对两种疾病的鉴别诊断价值,在构建所有诊断模型时均未纳入患者年龄和性别两个特征。

6.建立最终模型:选择上述确定的机器学习方法,以山东省公共卫生临床中心的患者作为训练集,利用其数据评价该机器学习模型的诊断效果;进一步以山东大学齐鲁医院的患者作为测试集,利用其测试的效果指标评价所建模型的诊断效果。本研究所有机器学习建模及模型评价时均将转移瘤组定义为患者、结核组定义为非患者。其中,效果评价指标包括接受者操作特征(ROC)曲线及ROC曲线下面积(AUC)、敏感度、特异度、阳性预测值、阴性预测值和F分数(F-score)。其中,AUC值越大,正确率越高。

三、统计学处理

使用Excel 2016软件进行部分数据的整理工作,采用IBM SPSS Statistics 22.0软件进行单因素logistic回归分析和放射组学特征的共线性诊断以选择建模特征,利用weka 3.6.4平台实现机器学习建模。非正态分布计量资料以“中位数(四分位数)[M(Q1,Q3)]”描述,两组间差异的比较采用Mann-WhitneyU检验;计数资料以“例(构成比/百分率,%)”描述,组间差异的比较采用χ2检验,所有数据均为双侧检验,检验水准为0.05。

结果

一、CT扫描和图像分割

174例研究对象经胸部CT扫描共获得最短径>1 cm的纵隔淋巴结281个,利用双盲法共勾画出281个VOI用于受试者放射组学特征分析,其中109例结核组患者分割出196个,每例患者分割出VOI中位数(四分位数)为1(1,8)个;转移瘤组分割出85个,每例患者分割出VOI中位数(四分位数)为1(1,3)个;两组患者VOI差异有统计学意义(Z=2.827,P=0.005)。

二、放射组学特征提取及筛选

利用Radcloud平台从上述281个VOI中提取出1409个定量成像特征,其中,第1组由126个描述符组成,用于定量描述CT图像中体素强度分布;第2组包含14个反映ROI形状和大小的三维特征;第3组获得525个有能量化区域异质性差异的纹理特征;第4组包括744个利用小波变换得到的高阶统计特征。采用特征标准化方法将1409个放射组学特征的特征值缩放到(0,1)之间,进行单因素logistic回归分析。选择单因素分析中概率值P<0.05且模型评价的C指数>0.65的特征共计29个;对29个特征进行共线性诊断,剔除7个与其他特征存在共线性的特征,进一步采用多因素logistic 回归分析筛选有统计学意义的特征,共筛选出相互独立的8个放射组学特征作为建立机器学习鉴别诊断模型的变量,8个特征均为小波滤波器变换后的CT图像特征。多因素logistic回归分析及筛选出的8个放射组学特征结果见表1、2。

表1 多因素logistic回归分析筛选出的8个用于建模的影像组学特征及其类别和滤波器

三、机器学习模型的选择

基于上述8个放射组学特征,使用5折交叉验证方法分别建立KNN、SVM、XGBoost、RF、LR和DT共6种机器学习模型。经ROC曲线和评价指标(图5,表2)评价各模型的诊断效能。结果显示,LR和SVM两种模型的诊断效果较好,可作为建立结核组和转移瘤组鉴别诊断的机器学习模型。

表2 筛选出的8个用于建模的放射组学特征的多因素logistic回归分析结果

表3 采用5折交叉验证方法建立的6种机器学习模型的诊断效能

注 KNN:k-近邻判别法;SVM:支持向量机;XGBoost:极限梯度提升算法;RF:随机森林;LR:logistic回归;DT:决策树图5 采用5折交叉验证方法建立的6种机器学习模型的ROC曲线

四、机器学习模型的诊断效果

利用训练集数据建立LR和SVM两种机器学习模型以鉴别诊断结核组和转移瘤组,再利用验证集数据评价两种模型的诊断效能。结果显示:LR和SVM模型在验证集中的AUC值和F分数基本与训练集相同,且AUC均超过0.8,敏感度和特异度也表现良好,说明模型在外推应用时仍具有稳定的诊断效能,且SVM模型的诊断效果优于LR模型。具体见图6、7和表4。

表4 LR和SVM模型对训练集和测试集患者的诊断效能

图6 logistic模型训练集和测试集的ROC曲线

图7 支持向量图模型训练集和测试集的ROC曲线

讨论

纵隔淋巴结结核是原发性肺结核的一种,可以没有肺实质浸润而单独存在[11],可从病理上分为4期[12-13]:第1期,淋巴结组织增生,形成结节或肉芽肿;第2期,淋巴结内干酪样坏死液化;第3期,淋巴结包膜破坏,互相融合并淋巴结周围炎;第4期,干酪样物质穿破至周围软组织形成冷脓肿或窦道。同一患者由于病程较长,其病灶内常有多个病理时期病变共存,形成了淋巴结结核复杂的影像学特征;且在纵隔内破溃时易引起邻近的肺内浸润、播散,周围脂肪浸润等,与肿瘤难以鉴别,常被误诊[14]。而纵隔淋巴结转移瘤大多表现为不对称性,内可见液化坏死,增强可呈不均匀强化[15],这导致纵隔淋巴结结核与纵隔淋巴结转移瘤的均匀或不均匀强化表现存在很多交叉。因此,当肺内病变不典型难以判断其性质,如成人原发性肺结核[5],或肺结核合并肺癌,但肺内癌性病变比较隐蔽[16],或仅有纵隔淋巴结肿大但肺内无明显病变时,仅靠常规的CT检查均难以判断。而对于淋巴结转移瘤有较好判断能力的18F-氟脱氧葡萄糖正电子发射计算机断层显像(18F-FDG PET-CT)检查,对胸内淋巴结结核的鉴别作用也相对有限,如一项对18F-FDG PET-CT肺外结核影像表现的研究表明,淋巴结结核的误诊率高达70.6%[6],这可能是恶性病灶与结核病灶的SUV值有极大的重叠,无法单纯从摄取值的高低来区分两病[15]。因此,病理及细菌学检查依旧是鉴别纵隔淋巴结结核、非小细胞肺癌和纵隔淋巴结转移瘤的金标准[16],但病理及细菌学诊断需要穿刺活检或术后病理获得。在某些情况下,若穿刺活检及手术无法进行而不能及时获得病理结果,则会影响疾病的及时诊断。

近年来,放射组学发展迅速,它将医学图像转换成高维图像,通过定量的高通量提取来挖掘数据特征并分析以供决策支持。目前,放射组学在判断肺小结节良恶性、指导治疗肺癌及预后判断等方面都显示出良好的敏感度和预测价值[17-19]。本研究采用放射组学来提取纵隔淋巴结结核与非小细胞肺癌纵隔淋巴结转移瘤的放射组学特征,在原始图像上提取了1409 个特征。在特征选择过程中,为了避免“维度灾难”,我们依据单因素logistic回归分析结果选择了那些有意义的放射组学特征,并通过考虑共线性的影响进一步进行特征筛选,筛选出7个纹理分析特征组和1个一阶统计特征组,利用这些放射组学特征首先采用5折交叉验证策略的建模策略对分类器进行筛选,选择了诊断效果较好的LR和SVM分类器,再将所有数据随机分为建模组(训练组)和验证组(测试组)建立LR和SVM分类器模型,并验证其鉴别效果,结果表明两个分类器模型的AUC均超过0.8,且具有良好的的敏感度和特异度;另外,依据放射组学数据建立的LR模型和SVM模型在训练集上的诊断效果与测试集差别均不大,说明模型诊断效果在测试集中仍然稳定,外推时结果可靠,这些均提示定量分析放射组学特征有助于纵隔淋巴结结核和非小细胞肺癌纵隔淋巴结转移瘤的鉴别诊断。

研究结果显示,非小细胞肺癌纵隔淋巴结转移瘤组VOI数量明显少于胸内淋巴结结核组,可能与未把所有转移的淋巴结计入纵隔淋巴结转移组有关,因为有部分淋巴结是活检病理结果,但并没有包括所有已经转移且大于1 cm的淋巴结;只有手术组将所有转移且大于1 cm的淋巴结计入结果。

CT影像放射组学研究可以评估肿瘤与淋巴结的组织密度、形状和纹理[20-22],早期的研究之一是将纹理测量的相关性和差异熵作为区分肺部良恶性结节的主要特征[23-25]。但有研究表明,放射组学研究中很多基于纹理或统计特征的放射组学特征存在强烈的特征-肿瘤体积混杂效应,但灰度值相关特征与体积不存在交互作用,这可以保证其稳定的预测和鉴别能力[26]。本研究选出的8个特征中有7个为灰度值相关放射组学特征,这避免了因病灶体积与放射组学特征间的扰动而导致的非鲁棒性[27]对鉴别诊断效果的影响。

本研究曾在放射组学特征模型的基础上增加了患者性别和年龄的两个个体特征,但这并未使模型的诊断性能得到明显改善,原因可能在于研究采取的特征筛选策略只是针对放射组学特征的筛选,这样可以保证所筛选出的放射组学特征间有意义且不存在共线性,而两种疾病患者间的年龄存在明显差异,且与所筛选出的放射组学特征间存在相关性,因此,将这两个特征加入模型后并未提升模型的诊断性能。因此,只包含放射组学特征的分类器模型的鉴别诊断效果更进一步验证了放射组学对两种疾病的鉴别诊断能力。

本研究还有一些不足:(1)转移瘤组患者样本量偏少,可能会影响模型的稳定性,需继续扩大样本量进一步研究;(2)转移瘤组部分患者为穿刺活检病理结果,未纳入已经转移且大于1 cm的淋巴结进行统计分析,影响本组统计样本的全面性;(3)本文主要讨论放射组学的鉴别诊断价值,机器学习模型中未纳入患者临床特征;(4)本研究所采用的分类器为基础机器学习分类器,随着深度学习方法的发展及其在疾病预测和诊断中的应用,后续我们会采用深度学习模型进一步探讨放射组学在这两种疾病中的诊断价值。

总之,本文通过图像分隔、放射组学特征提取及定量分析,建立了机器学习方法的交叉验证模型,该模型在纵隔淋巴结结核与非小细胞肺癌纵隔淋巴结转移瘤的鉴别中具有较好的诊断效能,为这两种疾病的鉴别诊断提供了新的有效的方法。

利益冲突所有作者均声明不存在利益冲突

作者贡献袁小记:实施研究、论文撰写和修改;孙秀彬:数据统计学复核及论文修改;韩榕和倪聪慧:数据收集;王武章和于德新:实施研究、论文修改