APP下载

基于CT影像组学结合临床特征鉴别肺结核与非结核分枝杆菌肺病的研究

2024-03-04姚阳阳梁长华韩东明崔俊伟潘犇王慧慧魏正琦甄思雨危涵羽

中国防痨杂志 2024年3期
关键词:空洞组学结核

姚阳阳 梁长华 韩东明 崔俊伟 潘犇 王慧慧 魏正琦 甄思雨 危涵羽

结核病是仅次于新型冠状病毒感染的第二大致死性传染病,位列全球死因第13位,中国结核病负担仅低于印度和印度尼西亚,位居第三[1]。非结核分枝杆菌(nontuberculous mycobacteria,NTM)系指除结核分枝杆菌复合群和麻风分枝杆菌以外的一大类分枝杆菌的总称[2],NTM感染肺部而引起的肺病称为(nontuberculous mycobacteria pulmonary disease,NTM-PD)。NTM-PD与肺结核(pulmonary tuberculosis,PTB)依靠痰涂片难以准确区分[3],分枝杆菌培养是诊断NTM-PD的金标准,而分枝杆菌培养需要2~6周,NTM-PD患者很容易错过最佳治疗时机,因此,亟需一种快速、有效的方法鉴别这两种疾病。空洞是PTB与NTM-PD的常见影像征象,并且这两种疾病空洞的病理差异已经得到证实[4]。近年来,影像组学通过高通量提取挖掘数据特征,在肺部疾病的诊断和鉴别诊断中显示出巨大的潜力[5-6],可能为鉴别NTM-PD与PTB提供一种可行的方法。本研究旨在联合临床特征与影像组学开发出一种能方便、快速、准确鉴别NTM-PD与PTB的方法,为NTM-PD与PTB的诊疗提供帮助。

资料和方法

一、研究对象

选择2019年1月1日至2023年3月31日河南省新乡医学院第一附属医院收治的经分枝杆菌培养确诊为NTM-PD和PTB的患者,共133例。根据分枝杆菌培养结果分为NTM-PD组(58例)与PTB组(75例)。收集所有患者治疗前的临床数据及胸部CT扫描图像。以空洞性病灶作为研究对象进行提取影像组学特征并建立影像组学模型,共200个病灶被纳入研究(NTM-PD:97个,PTB:103个),然后将所有病灶按照7∶3比例随机分为训练集和测试集。

纳入标准:(1)经痰标本或支气管肺泡灌洗液培养确诊为PTB/NTM-PD的患者;(2)年龄≥18岁;(3)CT图像中存在空洞病灶;(4)临床资料及影像资料完整。排除标准:(1)存在其他肺部疾病的患者;(2)PTB并发NTM-PD的患者;(3)合并HIV感染或糖尿病的患者;(4)存在其他恶性肿瘤的患者。

二、研究方法

1.一般资料:收集患者性别、年龄、体质量指数(body mass index,BMI)、临床症状(发热、盗汗、咳嗽、咳痰、乏力、胸痛、咯血、体质量减轻)、分枝杆菌培养结果。

2.实验室检查:γ-干扰素释放试验(interferon-γ release assays,IGRA)采用结核感染T细胞酶联免疫斑点试验进行检测,使用英国Oxford Immunotec公司的T-SPOT.TB试剂盒于4 h内完成检测,过程严格遵照说明书进行,后使用 ELISPOT 读板仪(美国 CTL公司) 经酶联免疫斑点系统读取并记录斑点数。结核抗体使用胶体金法进行检测,试剂盒由北京健乃喜生物科技有限公司提供,检测步骤严格遵循试剂配套说明书进行。

3.胸部CT检查:采用東芝 Aquilion ONE 320 排 CT 或東芝 Aquilion 64 排 CT 设备行常规胸部检查。扫描范围:从肺尖扫描至横膈水平;扫描条件:管电压为100~120 kV,管电流采用自动毫安技术,扫描层厚5~8 mm,重建层厚0.625~1.25 mm,螺距为1,矩阵为512×512。

4.感兴趣区(ROI)勾画及影像组学特征提取:影像组学流程如图1所示。首先由两名不同经验(分别具有3年和7年影像诊断经验)的放射科医师使用3D slicer 4.11 软件在1 mm薄层CT肺窗图像上沿空洞病灶的边缘(避开大血管和支气管)进行逐层勾画ROI,最后自动生成感兴趣体积(VOI),如图2所示。使用3D slicer软件对所有VOI进行1 mm×1 mm×1 mm 重采样,以减少不同CT扫描设备之间的差异对结果造成的影响。然后使用3D slicer软件在VOI中提取影像组学特征,包括一阶特征、形态特征、纹理特征,以及小波变换、拉普拉斯变换,共计1037个特征。

图1 影像组学流程图

注 图a~c:患者,女,34岁,肺结核。图b可见左肺下叶空洞,图b可见空洞病灶感兴趣区,图c可见分割后的空洞病灶体积;图d~f:患者,男,34岁,非结核分枝杆菌肺病。图d可见右肺上叶空洞,图e可见空洞病灶感兴趣区,图f可见分割后的空洞病灶体积

5.特征筛选及模型构建:(1)首先,对纳入患者的一般资料进行单因素逻辑回归分析,然后将两组间差异有统计学意义的临床特征进行多因素逻辑回归分析,筛选出鉴别NTM-PD与PTB的独立预测因素,然后使用逻辑回归分类器建立临床模型;(2)使用R语言软件(4.3.0版本)对影像组学特征数据进行Z-score标准化,然后随机挑选出30例患者进行组间一致性(intraclass correlation coefficient,ICC)分析;(3)分两步对影像组学特征进行降维。第一步使用最小冗余最大相关性(minimum redundancy maximum relevance,MRMR)算法,第二步使用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)通过10次交叉验证对上一步降维结果进行进一步筛选(图3,4);然后使用逻辑回归分类器将筛选出的影像组学特征建立影像组学模型;(4)将差异有统计学意义的临床特征与影像组学特征进行结合,使用逻辑回归分类器建立联合模型。

图3 影像组学特征LASSO回归系数

图4 非零系数的最佳影像组学特征图

6.模型诊断效能评估:绘制受试者工作特征曲线(ROC)及校准曲线,分析不同模型的曲线下面积(AUC)、敏感度、特异度、准确率,评估临床模型、影像组学模型及联合模型的诊断性能。

三、统计学处理

结 果

一、临床特征分析

在NTM-PD患者中,胞内分枝杆菌感染38例(66.52%),堪萨斯分枝杆菌感染13例(22.41%),鸟分枝杆菌感染4例(6.70%),偶然分枝杆菌感染2例(3.45%),浅黄分枝杆菌感染1例(1.72%)。PTB患者与NTM-PD患者的临床特征单因素分析结果见表1。PTB组的年龄明显小于NTM-PD组(P<0.001),而PTB组的BMI明显大于NTM-PD组(P=0.015),PTB组IGRA阳性率(73.33%)明显高于NTM-PD组(27.59%),差异均有统计学意义(P值均<0.05)。而性别、吸烟史、饮酒史、结核抗体检测结果、临床症状(发热、盗汗、咳嗽、咳痰、咯血、胸痛、乏力、体质量减轻)在两组间差异均无统计学意义。然后将年龄、BMI及IGRA进行多因素逻辑回归分析(表2),结果表明,年龄和IGRA在两组间的差异均有统计学意义,均是鉴别PTB与NTM-PD的独立预测因素。

表1 肺结核与非结核分枝杆菌肺病患者临床特征单因素分析

表2 肺结核与非结核分枝杆菌肺病患者临床特征多因素logistic回归分析

二、模型结果评估

将年龄及IGRA结果纳入临床模型,模型在训练集中的AUC值、敏感度、特异度及准确率分别为0.832、89.04%、72.46%、80.99%,在测试集中的AUC值、敏感度、特异度及准确率分别为0.800、85.29%、67.86%、77.42%。2名放射科医生提取的影像组学特征具有良好的一致性。1037个影像组学特征通过第一步MRMR筛选后,选取20个特征,第二步通过LASSO算法对MRMR筛选出的20个特征进行进一步筛选,最终筛选出10个影像组学特征(图5)用于构建影像组学模型。该模型在训练集中的AUC值、敏感度、特异度及准确率分别为0.974、91.78%、95.65%、93.66%,在测试集中AUC值、敏感度、特异度及准确率分别为0.939、97.06%、82.14%、90.32%。将年龄、IGRA结果及10个影像组学特征结合构建联合模型,该模型在训练集中的AUC值、敏感度、特异度及准确率分别为0.993、100.00%、91.30%、95.77%,在测试集中AUC值、敏感度、特异度及准确率分别为0.995、94.12%、100.00%、96.77%。影像组学模型诊断性能优于临床模型,而联合模型优于影像组学模型和临床模型,获得了最高的诊断性能。具体见表3。各个模型在训练集和测试集中的ROC曲线如图6、7所示。校准曲线(图8,9)显示,联合模型在训练集和测试集中的预测概率与实际概率相近,对PTB与NTM-PD具有良好的鉴别诊断能力。

表3 临床模型、影像组学模型、联合模型诊断性能分析

图5 影像组学模型中影像组学特征重要度

图6 训练集受试者工作特征曲线

图7 测试集受试者工作特征曲线

图8 训练集校准曲线比较

图9 测试集校准曲线比较

三、模型比较

DeLong检验结果显示,临床模型与影像组学模型在训练集中的AUC值差异有统计学意义(Z=3.797,P<0.001),临床模型与联合模型在训练集中的AUC值差异有统计学意义(Z=-4.832,P<0.001),而影像组学模型与联合模型在训练集的AUC值差异无统计学意义(Z=-1.956,P=0.050)。

讨 论

PTB与NTM-PD临床表现相似,包括低热、咳嗽、体质量减轻等症状,且二者影像学表现具有很大重叠,因此很难将二者区分[7],细菌培养是鉴别结核分枝杆菌与NTM感染诊断的金标准,但细菌培养需要2~6周才能得出结果,而在此期间大多数NTM-PD患者会接受经验性抗结核治疗,由于二者治疗方案不同,使得NTM-PD患者错过最佳治疗时机,导致疾病进一步发展[8-9]。IGRA通过检测T细胞对2种结核分枝杆菌特异性抗原ESAT-6和CFP-10产生的γ-干扰素发挥作用,这2种抗原的基因位于结核分枝杆菌与NTM的基因差异区域(Rd1),大多数NTM无此区域[10]。尽管有一些NTM存在与结核分枝杆菌相同的Rd1区域,如堪萨斯分枝杆菌和苏尔加分枝杆菌,可能会导致IGRA阳性结果,但这些菌株并不是NTM感染的优势菌种[11],因此,这种方法仍然可以区分大多数NTM-PD和PTB。并且IGRA可以在1~2 d内得到结果,因此IGRA可以在疾病早期对NTM-PD和PTB进行快速诊断。在本研究中,PTB组IGRA阳性率明显高于NTM-PD组,这与既往研究结果一致[12]。

此外,NTM-PD组的年龄明显高于PTB组,这可能是因为NTM是一类机会致病菌,感染NTM的患者发病往往是由于患者年龄增大,机体免疫力降低所致。中国是结核病高负担国家,约40%的人口IGRA结果呈阳性[13],不明原因的并发结核分枝杆菌潜伏感染会影响患者的IGRA结果。在IGRA的自身局限性和中国人群发病特征的共同影响下,使得临床模型在鉴别NTM-PD和PTB中的表现稍弱于影像组学模型。即便如此,临床模型在训练集和测试集中的AUC值仍然达到了0.832和0.800,表明该模型具有较高的诊断性能,可以在疑似NTM-PD或PTB的人群中进行快速的筛查。

影像组学是近年发展起来的无创、客观的图像分析工具,其通过计算机算法挖掘出CT、MRI、PET等图像中的深层信息,从而反映出病灶间的异质性。Yan等[14]对提取CT图像中空洞病灶的影像组学特征,使用6种机器学习分类器(K近邻、支持向量机、极度梯度提升算法、随机森林、逻辑回归和决策树)分别建立6个影像组学模型,结果表明,在训练集中,6个模型的AUC值均>0.98,在验证集中,6个模型的AUC值均>0.85,在外部验证集中,6个模型的AUC值均>0.84。其中,逻辑回归分类器建立的影像组学模型相较于其他影像组学模型诊断性能最好,在训练集、验证集和外部验证集中AUC值分别为0.99、0.98和0.95。本研究参考Yan等[14]的研究结果,使用逻辑回归分类器构建影像组学模型,该模型的诊断性能与既往研究结果基本一致。此外,在本研究中加入临床因素构建了联合模型,使得模型诊断性能得到了进一步的提升,能够更加准确地鉴别NTM-PD和PTB。而既往相关的研究中均是单纯研究影像组学模型在鉴别NTM-PD 和PTB的表现,本研究第一次进行了影像组学特征与临床特征相结合的尝试,试验结果也证明了联合模型优秀的诊断性能。尽管NTM-PD和PTB仅依靠胸部CT检查难以鉴别,但是二者之间的影像学表现仍存在差异。既往研究表明,NTM-PD组薄壁空洞、支气管扩张及小叶中心性结节较PTB组增多,而厚壁空洞、肺实变、肺不张、肺毁损、肺体积缩小、肺内钙化、肺门纵隔淋巴结钙化、腺泡结节、胸膜增厚、胸腔积液均较PTB组少[15],这表明CT征象对于鉴别具有重要作用。在既往的研究中,大多是对临床特征和CT表现单独进行研究,而将二者结合进行分析却少有报道,将临床特征、CT征象及CT影像组学特征进行结合构建的联合模型可能具有更高的诊断性能,具有更好的临床适用性,这需要在后续的研究中进行验证。

Ying等[16]将T-SPOT.TB与深度学习模型结合后产生了更好的结果,当两种方法的预测一致时,大大提高了鉴别诊断的准确性。本研究中将临床特征与影像组学特征结合构建了联合模型,该模型的诊断性能在训练集和验证集中的AUC值均高于临床模型与影像组学模型,这与Ying等[16]的研究结果是一致的,但是,DeLong检验结果显示影像组学模型与联合模型在训练集的AUC值差异无统计学意义,这可能是因为影像组学模型的性能已经很好,影像组学模型的提升空间十分有限,使得加入临床特征后对于诊断性能的提升不明显。与既往研究不同的是,Ying等[16]将T-SPOT.TB与深度学习进行综合分析,但并没有构建联合模型,而本研究不仅加入了IGRA结果,还对年龄、性别、结核抗体检测结果及结核病典型临床症状进行分析。联合模型的诊断性能优于任意一种单独模型,这表明临床特征与影像组学特征结合构建模型能够提升诊断性能,对于鉴别NTM-PD和PTB具有重要意义。

本研究还有一定的局限性:首先,这是一项单中心研究,样本量较小,未来还需要在多中心、大样本的研究中进一步验证模型的性能;其次,本研究只针对空洞病灶进行研究,而对于结节、树芽征等其他CT征象并未进行研究,未来需要对各种病灶进行全面研究来验证该模型的临床适用性;最后,本研究中使用手动勾画ROI的方法,不可避免地产生一些微小偏差,而自动分割的方法可能会提高勾画ROI的准确性,这需要在未来的研究中进一步探索。

综上所述,临床特征与影像组学特征对鉴别NTM-PD和PTB方面具有重要作用,结合临床特征和影像组学特征的联合模型是一种无创、方便、快捷的诊断方法,在鉴别NTM-PD与PTB方面展示出了优秀的诊断性能,为NTM-PD与PTB的临床诊疗提供了帮助。

利益冲突所有作者均声明不存在利益冲突

作者贡献姚阳阳:设计实验、实施研究、采集数据、分析/解释数据、文章撰写、统计分析;梁长华:设计实验、实施研究、分析/解释数据、论文审阅修订、统计分析、指导、行政/材料/技术支持;韩东明:设计实验、实施研究、论文审阅修订、行政/材料/技术支持、指导;崔俊伟:设计实验、论文审阅修订、指导、行政/材料/技术支持;潘犇:设计实验、实施研究、采集数据、分析/解释数据、统计分析;王慧慧、魏正琦、甄思雨和危涵羽:实施研究、采集数据、分析/解释数据、统计分析

猜你喜欢

空洞组学结核
口腔代谢组学研究
一度浪漫的结核
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
空洞的眼神
层次分析模型在结核疾病预防控制系统中的应用
用事实说话胜过空洞的说教——以教育类报道为例
代谢组学在多囊卵巢综合征中的应用
中枢神经系统结核感染的中医辨治思路
疣状皮肤结核1例
蛋白质组学在结核杆菌研究中的应用