影像组学联合CT 特征鉴别儿童支原体与非支原体肺炎
2024-03-27黄国强邱晓晖刘艺超
王 超,徐 鹏,黄国强,邱晓晖,刘艺超
(1.亳州市人民医院影像中心,2.儿科,安徽 亳州 236800)
支原体肺炎(mycoplasma pneumonia,MP)常见于儿童[1],近年来5 岁以下儿童MP 患病率逐年增加[2]。各种病原体所致肺炎早期或急性期症状无明显差异[3],导致鉴别诊断儿童MP 与非MP 存在困难[4-5]。本研究观察影像组学联合CT 特征鉴别MP 与非MP 的价值。
1 资料与方法
1.1 研究对象 回顾性分析2021 年10 月—2022 年12 月亳州市人民医院153 例肺炎患儿,男89 例、女64例,年龄1~14 岁、平均(6.1±2.8)岁;均于入院前或后2 天内经胸部CT 诊断为肺炎,且于入院后2 天内接受支原体RNA 检测,其中MP 101 例(MP 组)、非MP 52 例(非MP 组)。排除CT 图像质量差或疑诊病毒性肺炎者。本研究经院伦理委员会批准(亳医伦审2023第255 号);检查前监护人均签署知情同意书。
1.2 仪器与方法 采用Siemens Somatom Definition Flash 双源CT 机于患儿深吸气后屏气状态下行胸部扫描,参数:管电压100 kV,管电流为有效mAs,层厚3 mm,层间距3 mm。采用滤波反投影重建算法重建图像,卷积核Kernal值为70%。
1.3 分析图像 由具有7 及10 年工作经验的影像科主治医师各1 名(医师1、2)阅片,观察病变CT 表现,主要包括病灶在各肺叶的分布,以及有无空气支气管征、支气管壁增厚、树芽征(沿支气管分布的小叶中心结节)、树雾征(支气管束周围雾状磨玻璃改变)、边缘回缩征(肺内实变区边缘局部向内回缩、凹陷)或胸腔积液;意见有分歧时请1 名副主任医师审核。
1.4 提取影像组学特征 将肺窗原始CT 图像(窗宽1 500 HU、窗位-500 HU)上传至深睿医疗多模态科研平台2.2 版本(https://keyan.deepwise.com)。对图像行灰度归一化预处理后,分别沿病灶边缘逐一勾画ROI,见图1;基于ROI 提取CT 影像组学特征,经滤波器处理后经原始、小波变换、LoG、LBP2D、LBP3D、Square、SquareRoot、Logarithm、Exponentail、Gradient共10 个过滤器进行纹理分析共提取2 153 个特征,含414 个一阶特征、14 个形态特征及1 725 个灰度矩阵特征[ 包括灰度共生矩阵(gray level co-occurrence matrix,GLCM)、灰度区域尺寸矩阵(gray-level size zone matrix,GLSZM)、灰度游程矩阵(gray-level run length matrix,GLRLM)、相邻域灰度差分矩阵(neighboring gray tone difference matrix,NGTDM)及灰度相关矩阵(gray-level dependence matrix,GLDM)特征]。
图1 于肺窗胸部轴位CT 图中逐一勾画病灶ROI(蓝线和黄线区域)示意图
1.5 构建模型及统计学分析 采用深睿医疗多模态科研平台。以中位数(上下四分位数)表示非正态分布计量资料,行Mann-WhitneyU检验。采用χ2检验比较计数资料。按7∶3 比例将153 例数据分为训练集(n=107,含71 例MP、36 例非MP)和验证集(n=46,含30例MP、16 例非MP)。采用F test 算法基于训练集CT征象选出6 个最佳CT 征象,以逻辑回归(logistic regression,LR)分类器构建CTLR模型。应用组内相关系数(intra-class correlation coefficient,ICC)分析同一观察者提取不同患者病灶ROI、不同观察者间提取相同患者病灶ROI 影像组学特征的一致性,保留ICC≥0.9 的特征。基于训练集数据采用F test 算法筛选出10 个最佳影像组学特征,分别以LR、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、线性判别分析(linear discriminant analysis,LDA)及随机梯度下降法(stochastic gradient descent,SGD)分类器构建机器学习(machine learning,ML)模型,包括MLLR、MLSVM、MLRF、MLLDA及MLSGD;再以上述分类器分别基于最佳CT 征象及影像组学特征构建CT-ML 模型,获得CT-MLLR、CTMLSVM、CT-MLRF、CT-MLLDA及CT-MLSGD。绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC)评估各模型鉴别MP 与非MP 的效能;以DeLong 检验比较CTLR、最佳影像组学及CT-ML 模型AUC 差异。P<0.05 为差异有统计学意义。
2 结果
MP 组男58 例、女43 例,年龄6.0(5.0,8.0)岁;非MP 组男31 例、女21 例,年龄5.0(3.0,7.0)岁。组间年龄(U=2 200.00,P=0.099)及性别(χ2=0.068,P=0.795)差异均无统计学意义。
2.1 CT 表现 组间支气管壁增厚、树芽征差异均有统计学意义(P均<0.05),其余CT 表现差异均无统计学意义(P均>0.05)。见图2、3 表1。
表1 101 例MP 与52 例非MP 患儿CT 表现比较(例)
图2 胸部轴位CT 肺窗图示MP 病变 A.女性患儿,4 岁,右肺上叶MP,右肺上叶支气管壁增厚(长箭),周围见多发树芽征(短箭);B.男性患儿,7 岁,左肺上叶MP,左肺上叶支气管壁增厚(短箭),支气管周围见树雾征(长箭),并见散在树芽征 图3 胸部轴位CT 肺窗图示非MP 病变 女性患儿,5 岁,左肺下叶大叶性肺炎并见边缘回缩征(箭)
2.2 CT 模型 病变累及右肺上、中、下叶,支气管壁增厚、树芽征及边缘回缩征为最优CT 征象,以之构建的CTLR模型鉴别训练集MP与非MP 的AUC 为0.713,在验证集的AUC 为0.710。
2.3 影像组学模型 基于训练集提取2 153 个影像组学特征,经ICC检验后保留347 个特征,最终以F test算法选出10 个最优特征,包括1 个GLCM、2 个GLRLM、4 个NGTDM 及3 个GLDM 特 征(图4)。MLLR、MLSVM、MRF、MLLDA及MLSGD模型在验证集 的AUC 分别为0.715、0.663、0.623、0.706 及0.494,MLLR模型为最优影像组学模型。
图4 基于训练集数据采用F test 算法选出的10 个最优影像组学特征及其系数图
2.4 CT-ML 模型训练集中,CT-MLLR、CTMLSVM、CT-MLRF、CT-MLLDA及CT-MLSGD模型的AUC 分别为0.749、0.840、0.998、0.747 及0.664,在验证集为0.813、0.823、0.649、0.796 及0.665;CTMLSVM为最优CT-ML 模型。
2.5 比较各模型效能 训练集中,CT-MLSVMAUC(0.840)高于CTLR及MLLR模型(AUC=0.713、0.740,Z=1.962、2.943,P=0.049、0.003),CTLR与MLLRAUC 差异无统计学意义(Z=0.378,P=0.705);验证集中,CTLR、MLLR及CT-MLSVMAUC 差异均无统计学意义(AUC=0.710、0.715 及0.823,P均>0.05)。见图5 及表2。
表2 CT 模型、最优ML 模型及CT-ML 模型鉴别MP 与非MP 的效能
图5 CTLR、MLLR及CT-MLSVM模型鉴别MP 与非MP 的ROC 曲线 A.训练集;B.验证集
3 讨论
支原体分离培养是诊断MP 的“金标准”,但耗时长且操作条件苛刻[6]。实时荧光定量聚合酶链反应检测咽拭子中支原体RNA 适用于早期诊断MP[7],但普及性有限,且无法反映肺部情况。CT 为诊断肺炎最常用的检查方法之一,但MP CT 表现与非MP 相似,传统CT 鉴别效果不理想[8]。
MP 一般先累及支气管黏膜上皮导致支气管壁水肿,CT 表现为支气管壁增厚[9];随着疾病进展,进一步累及远端细支气管、肺泡腔及周围间质,于支气管腔、肺泡腔内形成黏液栓,CT 可见树芽征及树雾征;渗出增加可致肺大片实变并出现空气支气管征[10]。细菌性肺炎则为细菌激活肺上皮细胞并产生炎症介质致肺组织结构和上皮细胞损伤,引起上皮细胞变性和线粒体肿胀,细胞内细胞质扭曲和细胞损伤,进而肺内皮细胞凋亡和肺泡渗出,CT 表现为肺泡实变[11]。相对而言,MP 较非MP 更易出现支气管壁增厚、树芽征等CT 表现,但二者最终均可累及肺组织并发生实变,少数患儿可出现胸腔积液。
影像组学逐渐用于临床诊断疾病[12],可定量分析医学图像中的高通量特征,有利于诊断和治疗疾病[13-14],且结果更为客观[15]。本研究发现,病变累及右肺上、中及下叶、支气管壁增厚、树芽征、边缘回缩征为最优MP CT 征象,以LR 分类器构建的CT-ML 模型鉴别验证集MP 与非MP 的AUC 为0.710;分别以临床5 种常用分类器(LR、SVM、RF、LDA 和SGD)构建ML 模型和CT-ML 模型,结果显示CT-MLRF存在过拟合,CT-MLSGD在训练集和验证集的AUC 均低于0.70。以上模型中,以MLLR及CT-MLSVMAUC 最高,为最佳影像组学模型及CT-ML 模型,MLLR诊断效能与CTLR相当;CT-MLSVM模型在训练集的诊断效能(AUC=0.840)高 于CTLR及MLLR(AUC=0.713、0.740),在验证集虽较高(0.823),但与CTLR及MLLR模型差异均无统计学意义,与吴雯丽等[15]研究结果相似。
综上,影像组学联合CT 特征能有效鉴别儿童MP与非MP。但本研究为单中心回顾性分析,样本量有限,部分MP 患儿可能合并其他病原体感染,且缺少外部验证,有待后续加以完善。
利益冲突:全体作者声明无利益冲突。
作者贡献:王超查阅文献、指导、统计分析、撰写文章;徐鹏和黄国强统计分析、修改文章;邱晓晖和刘艺超审阅文章。