APP下载

CT影像组学结合临床特征预测活动性耐药肺结核的模型构建与验证

2024-03-04潘犇梁长华韩东明崔俊伟姚阳阳魏正琦甄思雨危涵羽杨鑫淼

中国防痨杂志 2024年3期
关键词:组学灰度肺结核

潘犇 梁长华 韩东明 崔俊伟 姚阳阳 魏正琦 甄思雨 危涵羽 杨鑫淼

耐药结核病是许多国家的一个主要公共卫生问题[1]。耐药结核病指患者感染的结核分枝杆菌经体外药物敏感性试验(简称“药敏试验”)证实对利福平或异烟肼等任意一种或多种抗结核药物耐药[2]。对耐药结核病的不正确诊断可能导致治疗效果降低、不良反应增加,以及患者依从性降低[3]。耐药肺结核的准确诊断需要进行分枝杆菌培养和药敏试验[4],而痰菌阴性肺结核患者很难诊断,并且可能有漏诊的风险[5]。因此,早期、无创地识别耐药肺结核患者能够有效阻止结核病的人际传播,增加治疗成功的概率。

影像组学是一种从标准医学影像中高通量挖掘定量图像特征的方法,可以在临床决策支持系统中提取和应用数据,以提高诊断、预后和预测准确性,在癌症研究中日益重要[6]。本研究旨在通过构建影像组学模型预测肺结核患者耐药性,进一步帮助临床医生早期识别耐药肺结核患者。

资料和方法

一、研究对象

1.患者选择:采用回顾性研究方法,参照入组标准纳入2020年1月1日至2022年12月31日河南省新乡医学院第一附属医院收治的88例耐药肺结核(耐药组)和146例药物敏感肺结核(药物敏感组)患者。影像组学工作流程如图1所示。将所有患者按7∶3的比例随机分为训练集和测试集。

注 GLCM:grey-level co-occurrence matrix features,灰度共生矩阵; GLDM:grey-level dependence matrix,灰度相关矩阵; GLRLM:grey-level run-length matrix,灰度游程矩阵; GLSZM:grey-level size-zone matrix,灰度区域大小矩阵; NGTDM:neighboring gray tone difference matrix,邻域灰度差矩阵

2.纳入标准:(1)所有患者治疗前均行胸部CT扫描;(2)患者符合《肺结核活动性判断规范及临床应用专家共识》[7]中的诊断标准;(3)通过药敏试验或GeneXpert MTB/RIF检测以区分药物敏感肺结核和耐药肺结核患者。

3.排除标准:(1)合并艾滋病、糖尿病的患者;(2)合并其他肺部疾病,如肺癌、矽肺等;(3)CT扫描图像质量较差;(4)影像资料或临床资料不完整。

二、研究方法

1.一般数据收集:收集患者的一般临床资料,包括年龄、性别、体质量指数(body mass index,BMI)、吸烟史、饮酒史、治疗史。

2.扫描方法:分别采用联影uCT 550 (80层螺旋CT)、GE revolution、东软NeuViz 128三台仪器进行CT扫描。扫描范围:从肺尖扫描至横膈水平。扫描条件:管电压为100~120 kV,管电流采用自动毫安技术,扫描层厚5~8 mm,重建层厚0.625~1.25 mm,螺距为1,矩阵为512×512。从图片存档及通信系统(picture archiving and communication system,PACS)中以DICOM格式导出重建图像,并应用3D Slicer 5.3.0软件进行影像组学分析。

3.CT扫描图像分析:2名胸部放射诊断医师(分别具有3年、7年工作经验)独立分析患者的CT征象,并且对患者药敏试验结果不知情。CT图像主要征象包括:(1)结节及卫星灶;(2)钙化结节;(3)实变;(4)纤维条索;(5)支气管扩张;(6)树芽征。共同讨论不同意见并且达成一致。

4.病灶分割与特征提取:使用3D Slicer软件在薄层肺窗图像上进行处理,由1名经验丰富的胸部放射诊断医师沿最大病灶边缘(包括大片实变及空洞、病灶内支气管)逐层获得感兴趣区(region of interest,ROI),并避开大血管及主支气管。最后所勾画的病灶所有层面通过软件自动融合为感兴趣体积(volume of interest,VOI),并由另1名高年资放射诊断医师进行最终确认。首先对图像进行1 mm×1 mm×1 mm重采样,以减小不同设备之间的图像差异。随后对每例患者的VOI进行影像组学特征提取,包括形态特征、一阶特征及纹理特征,后者包括灰度共生矩阵(gray level co-occurrence matrix,GLCM)及灰度游程矩阵(gray level run length matrix,GLRLM)等,并应用2个基本的内置滤波器,包括小波变换和高斯拉普拉斯滤波器(LoG),共提取1037个特征。1个月后随机选择30例患者病灶再次进行勾画,进行组内相关性分析(intraclass correlation coefficient,ICC)以评估观察者内一致性,>0.75表明相关性较好[8]。

5.特征选择:对所有数据进行Z-score标准化处理后,采用最小冗余最大相关(minimum redundancy maximum relevance,MRMR)算法对训练集特征进行筛选。然后采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)算法从剩余候选特征中选择最优特征(图2,3),采用10折交叉验证避免过拟合。

注 最小均方误差处的最佳λ值为0.0262。左边垂直虚线表示最佳λ值及所对应的特征数量,右边虚线表示1倍标准差所对应最佳λ值

注 垂直线对应最佳λ值,保留此处系数不为0的14项影像组学特征

6.模型构建:为了评估不同模型在预测肺结核患者耐药性的性能,采用logistic回归方法分别建立临床模型、影像组学模型和联合模型。将所选择的临床特征及CT征象纳入临床模型;将经过MRMR和LASSO筛选的最优特征纳入影像组学模型;最后将经过筛选的有统计学意义的临床变量及CT征象与最优影像组学特征结合,构建联合模型。

三、统计学处理

结 果

一、两组患者一般资料及CT扫描结果比较

234例患者的临床特征和CT特征见表1,耐药肺结核患者和药物敏感肺结核患者的治疗史(P<0.001)和树芽征(P=0.032)的差异均有统计学意义。其余选择特征在两组间的差异均无统计学意义。在CT征象分析中,2名医师对结节及卫星灶(Kappa=0.757,P<0.001)、钙化结节(Kappa=0.784,P<0.001)、实变(Kappa=0.818,P<0.001)、纤维条索(Kappa=0.777,P<0.001)、支气管扩张(Kappa=0.863,P<0.001)、树芽征(Kappa=0.781,P<0.001)的观察一致性均较好。

表1 两组患者一般资料及CT扫描结果的比较

二、特征选择

最初从CT扫描图像中提取1037个定量影像组学特征。使用MRMR方法选择前20个相关性最高的特征。使用LASSO筛选了14个影像组学特征,筛选的最佳影像组学特征相关性见图4。

注 wavelet-HLH_firstorder_Mean:小波-HLH_阶灰度特征_均值;wavelet-HHL_glcm_ClusterProminence:小波-HHL_灰度共生矩阵_集群突出;log-sigma-2.0 mm-3D_glcm_ClusterShade:log-σ-2.0 mm-3D_灰度共生矩阵_集群阴影;wavelet-HLH_firstorder_Median:小波-HLH_一阶灰度特征_中值;original_shape_Elongation:原始_形状_伸长率;wavelet-LHL_gldm_LargeDependenceLowGrayLevelEmphasis:小波-LHL_灰度相关矩阵_大依赖低灰度强调;log-sigma-3.0 mm-3D_glszm_HighGrayLevelZoneEmphasis:log-σ-3.0 mm-3D_灰度区域大小矩阵_高灰度区域强调;log-sigma-2.0 mm-3D_glszm_LargeAreaHighGrayLevelEmphasis:log-σ-2.0 mm-3D_灰度区域大小矩阵_大区域高灰度强调;wavelet-LHH_glcm_Correlation:小波-LHH_灰度共生矩阵_相关性;wavelet-LLL_glcm_Imc2:小波-LLL_灰度共生矩阵_相关信息测度2;wavelet-HHL_firstorder_Median:小波-HHL_一阶灰度特征_中值;log-sigma-3.0 mm-3D_glszm_SmallAreaEmphasis:log-σ-3.0 mm-3D_灰度区域大小矩阵_小面积强调;log-sigma-3.0 mm-3D_glszm_SmallAreaLowGrayLevelEmphasis:log-σ-3.0 mm-3D_灰度区域大小矩阵_小区域低灰度强调;wavelet-HLL_glcm_ClusterShade:小波-HLL_灰度共生矩阵_集群阴影

三、模型性能和验证

临床模型、影像组学模型及联合模型在训练集和测试集中的ROC曲线见图5、6。通过logistic回归构建3种模型的预测性能见表2。在训练集中临床模型、影像组学模型、联合模型的AUC值分别为0.760(95%CI:0.687~0.834)、0.822(95%CI:0.758~0.885)、0.878(95%CI:0.823~0.932),在测试集中临床模型、影像组学模型、联合模型的AUC值分别为0.820(95%CI:0.704~0.937)、0.845(95%CI:0.744~0.947)、0.888(95%CI:0.788~0.987),联合模型在训练集及测试集中均表现最好。Delong检验结果显示,联合模型与影像组学模型(Z=-2.625,P=0.009)、联合模型与临床模型的预测效能差异(Z=-3.073,P=0.002)均有统计学意义。

表2 3种模型在训练集和测试集中的预测性能

图5 训练集ROC曲线

图6 测试集ROC曲线

训练集及测试集的校准曲线图(图7,8)显示,校准预测曲线与标准曲线贴合尚可,提示联合模型对耐药肺结核与药物敏感肺结核患者的预测概率与实际概率均具有良好的一致性。决策曲线(图9,10)表明,在大多数概率阈值范围内,联合模型对患者进行耐药性预测指导治疗的临床净收益最高。

图7 训练集校准曲线

图8 测试集校准曲线

图9 训练集决策曲线

图10 测试集决策曲线

讨 论

耐药肺结核的治疗是我国结核病防治的一项重要工作,耐药肺结核如果得不到及时确诊,不仅严重影响患者的治疗效果,而且加重患者的家庭经济负担。确诊耐药肺结核需要进行痰涂片镜检和细菌培养,而这个过程非常耗时。近年新兴的检查技术GeneXpert MTB/RIF和GeneXpert MTB/RIF Ultra能够对结核分枝杆菌耐药基因进行检测,具有较高的敏感度和特异度;但在痰涂片阴性、合并艾滋病及儿童和肺外结核患者中诊断的敏感度有所降低[9]。本研究基于CT影像组学方法,旨在通过对耐药肺结核进行预测,为临床决策提供一种便捷、快速且非侵入性的工具。相比传统方法,本研究的CT影像组学方法具有更高的可行性和应用潜力,在提高诊断效率和减少患者负担方面具有显著优势。本研究应用logistic回归方法建立多个预测模型,以预测耐药肺结核和药物敏感肺结核患者,并在训练集和测试集中成功地验证其性能;其中,结合临床特征与影像组学特征构建的联合模型具有最高的鉴别诊断价值(训练集AUC=0.878,测试集AUC=0.888)。

近年来,影像组学发展迅速,它可以将医学图像转化为高维图像,通过对高通量数据进行定量分析,为临床提供额外的诊断信息,并能够通过影像组学对患者进行疾病诊断、生存预测及疗效评估,越来越广泛地应用于临床研究[6,10-11]。影像组学在肺部疾病的诊断和鉴别诊断中也起着非常重要的作用,如肺癌与肺结核、隐球菌肺炎等疾病的鉴别诊断[12-13],均表现出较好的结果。然而,影像组学关于肺结核耐药性的相关性研究较少,可能与肺结核病灶的CT表现复杂多样有关。本研究通过影像组学方法,对肺结核患者的耐药性进行预测,所构建的模型取得较好的结果。Li等[14]基于CT影像组学构建机器学习模型预测空洞性肺结核耐药性,其中联合模型在训练集和测试集的AUC值分别为0.881与0.834,与本研究中联合模型在训练集和测试集的AUC值分别为0.878和0.888的结果大致相仿。本研究纳入的实变病灶中,部分病灶内可见不规则空洞及支气管扩张,考虑到肺结核患者肺部CT征象的复杂性和病灶范围广泛。本研究勾画感兴趣区体积及提取的影像组学特征更具有普遍适用性,对临床应用具有更重要的应用价值。

根据临床特征分析显示,发现既往有结核病治疗史的患者更有可能对抗结核药物耐药,这与Pradipta 等[15]的研究结果一致。初诊肺结核患者未经过利福平和异烟肼等药物抗结核治疗,患者体内结核分枝杆菌生物活性比较敏感;而复治肺结核患者经过长期抗结核治疗,如果不能规律全程用药,体内结核分枝杆菌对药物产生耐药的概率会增加,更容易导致耐药的发生[16]。本研究在性别、年龄、BMI、吸烟史和饮酒史方面,两组间差异均无统计学意义,表明这些临床特征可能不是耐药肺结核发展的危险因素。本研究中耐药肺结核和药物敏感肺结核患者的CT表现有很多相似点,两组间结节及卫星灶、钙化结节、实变、纤维条索及支气管扩张之间的差异均无统计学意义。这与梁瑞云等[17]报道耐药肺结核伴空洞与药物敏感肺结核伴空洞患者的实变影、结节/团块影、支气管扩张之间的差异均无统计学意义的结果一致。进一步的研究可能需要考虑其他潜在的因素来解释耐药肺结核的发生和发展。树芽征的病理依据是结核分枝杆菌的支气管内播散[18],是活动性肺结核的重要CT征象;在非活动性肺结核CT图像上也可长期存在,但病变轮廓更为清楚。患者CT征象分析显示树芽征在两组间差异有统计学意义,尽管药物敏感组的树芽征患者比例高于耐药组,但根据这一征象并不能区分两者。笔者认为有必要利用定量分析来探索耐药肺结核和药物敏感肺结核之间的具体差异,而影像组学在这方面很有前景。

综上所述,基于CT影像组学结合临床特征构建的影像组学模型可以有效地识别耐药肺结核和药物敏感肺结核患者,这对耐药肺结核患者的早期无创诊断和鉴别具有重要意义。

利益冲突所有作者均声明不存在利益冲突

作者贡献潘犇:酝酿和设计实验、实施研究、采集数据、分析/解释数据、起草文章、统计分析;梁长华、韩东明和崔俊伟:酝酿和设计实验、对文章的知识性内容作批评性审阅、行政/技术/材料支持、指导;姚阳阳:酝酿和设计实验、实施研究、采集数据、分析/解释数据、统计分析;魏正琦、甄思雨、危涵羽和杨鑫淼:实施研究、采集数据、分析/解释数据、统计分析

猜你喜欢

组学灰度肺结核
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
口腔代谢组学研究
爱情是一场肺结核,热恋则是一场感冒
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
蒙西医结合治疗肺结核进展
疣状皮肤结核合并继发型肺结核1例
代谢组学在多囊卵巢综合征中的应用