APP下载

基于平扫CT三维影像组学特征的机器学习模型检测主动脉夹层的价值

2023-10-13唐依琳张渌恺金倞王坤杨玉玲马庄宣李骋李铭

复旦学报(医学版) 2023年5期
关键词:放射科组学A型

唐依琳 张渌恺 金倞 王坤 杨玉玲 马庄宣 李骋 李铭,3△

(1复旦大学附属华东医院放射科 上海 200040; 2复旦大学附属华山医院放射科 上海 200040;3复旦大学医学功能与分子影像研究所 上海 200040)

主动脉夹层(aortic dissection,AD)是一种危及生命健康的心血管危重疾病,是心血管疾病中死亡率最高的疾病之一。近年来中国AD的发病率呈上升趋势[1],针对AD流行病学的现有研究大多以就诊患者为基础,缺少未就诊病例,这使得该疾病的真实发病率可能高于目前报道的发病率[2-4]。AD根据Stanford分型可分为A、B型,A型AD相较于B型AD发病更凶险,应立即进行手术,而B型AD可以使用药物治疗或血管内治疗,因此提高A型AD的早期检出率至关重要[5-6]。目前应用碘对比剂增强CT是发现和诊断AD最常用的成像检查方式,敏感性为100%,特异性为98%~99%[7-8]。然而,有碘对比剂禁忌的患者不能接受该检查,还会使受检者发生对比剂肾病的风险增加[9-10]。此外,在夜间、节假日或一些医疗落后的地区,增强CT检查的可及性受限[11]。另外,许多早期缺乏典型症状或无症状的AD患者只采取了平扫CT检查,导致这部分患者无法通过增强CT及时诊断[12-13]。平扫CT诊断AD的灵敏度低、假阴性率高,因此提高放射科医师通过平扫CT诊断AD的信心,提高该检查对AD的检出率具有重要的临床意义[14]。

近年来,人工智能已被广泛应用于医学领域[15]。影像组学作为人工智能与影像大数据的交叉产物,具有无害、普适、快捷、经济等优势[16]。影像组学能捕捉医学图像中不能为肉眼识别的组织和病变的微观异质性,弥补传统影像学诊断依靠肉眼识别病变和经验依赖性较强的缺陷[17],从而帮助放射科医师提高对疾病诊断的信心。基于影像组学特征构建的机器学习模型在平扫CT上检测AD以及Stanford A型AD,目前国内外尚未有相关研究。本研究旨在探讨基于平扫CT影像组学的机器学习方法检测AD和Stanford A型AD的可行性,以期提高平扫CT对非典型或无症状AD患者的检出率,以及在增强CT检查不可取或者获得受限的情况下识别AD。

资料和方法

研究对象回顾性收集2011年7月至2022年7月期间在复旦大学附属华东医院同时接受了胸腹平扫CT和增强CT检查的患者。AD阳性患者的纳入标准:(1)放射科医师根据增强CT图像表现确诊的AD,CT检查时尚未置入主动脉装置;(2)患者在同一天进行了平扫CT和增强CT检查;(3)对照增强CT图像,确保平扫CT图像范围包括夹层部分;(4)如果同一患者有多个CT检查结果,则将最近一次检查数据纳入本研究。AD阴性患者的纳入标准:(1)增强CT图像排除AD、且没有与AD鉴别困难的壁间血肿、血栓和穿透性溃疡;(2)患者在同一天有平扫CT和增强CT检查。

按上述标准,本研究共纳入128例患者,其中男性86例(67.2%)。所有患者平均年龄(66±13)岁。128例患者中有AD患者61例,非AD患者67例。61例AD患者中男性53例(86.9%),平均年龄(67±14)岁。67例非AD患者中男性33例(49.3%),平均年龄(64±11)岁。按7∶3的比例将128例患者随机划分为训练集(n=89)和验证集(n=39)。患者的临床资料包括年龄、性别、AD Stanford分型等。

CT影像采集采用Somatom Drive、Somatom Flash(德国西门子公司)和Revolution 256(美国GE公司) 3台CT仪进行平扫和CT增强扫描,采集体位为仰卧位,管电压80~140 kVp,自动调节管电流技术,矩阵为512×512,重建层厚0.625 mm/1 mm/1.25 mm/1.5 mm。

VOI勾画将薄层(0.625 mm/1 mm/1.25 mm/1.5 mm)平扫CT图像导入3D-slicer软件(version4.11.0,http://www.slicer.org),由1名技术员在横断面图像上隔层勾画主动脉轮廓,并自动填充全部主动脉得到体积感兴趣区(volumetric region of interest,VOI),再手动调整VOI范围,尽量排除心肌、胸膜、脊柱、腹膜和胃肠道等无关结构,使VOI准确覆盖主动脉。最后,所有病例的主动脉VOI和平扫CT数据以NII(脱敏格式)导出,用于影像组学特征提取。

影像组学特征提取、筛选和机器学习模型的构建和评价本研究采用Pyradiomics软件(Python,Version 3.7)进行影像组学特征的提取,在128例患者的主动脉VOI上共提取1 905个特征,其中包括一阶特征、2D形态特征、3D形态特征、灰度共生矩阵特征、灰度大小区域矩阵特征、灰度游程矩阵特征、相邻灰阶差矩阵特征、灰度依赖矩阵特征和小波变换特征。为了便于分析,对提取的特征数据进行正则化处理,转换到均值为0、方差为1范围内。用Spearman相关性分析(特征之间Spearman系数>0.8时取其一),最小绝对收缩选择算子(least absolute shrinkage and selection operator,LASSO)进行特征筛选,降维后得到最优特征集,在训练集中分别用支持向量机(support vector machine,SVM)、决策树(decision tree,DT)、随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)、轻量梯度提升(light gradient boosting,LightGBM)和极端随机树(extra trees,ET)模型构建6种机器学习模型。评价指标包括:受试者操作特性(receiver operating characteristic curve,ROC)曲线下面积(area under the ROC curve,AUC)、准确度、F1分数和召回率。

统计学分析采用SPSS统计软件(Version 26版)和R(Version 4.1.0)进行统计分析和模型构建。计量资料用表示,计数资料用频数和百分数表示。使用AUC、准确度、F1值和召回率评估各模型的检测效能。

结 果

检测AD的机器学习模型1 905个特征经过Spearman相关性分析和LASSO回归降维后得到35个影像组学特征的最优特征集合,特征筛选过程、最终的35个特征参数及相应权重见图1。SVM、DT、RF、XGBoost、LightGBM和ET模型在训练集和验证集中检测AD的效能见表1、图2和图3。结果显示,XGBoost模型在训练集和验证集中均具有最高的检测性能,且在训练集和验证集中的表现差异最小。该模型在验证集中的AUC、召回率、F1分数和准确度分别为0.982、100.0%、0.960、96.2%。

表1 基于三维平扫CT影像组学特征不同机器学习模型检测AD效能Tab 1 Efficacy of different machine learning models for detecting AD based on non-contrast CT 3D-radiomics features

图2 各模型在验证集上检测AD的ROC曲线Fig 2 ROC curve for each model to detect aortic dissection in the validation set

图3 6种机器学习模型的混淆矩阵Fig 3 Confusion matrix for 6 machine learning models

检测Stanford A型AD的机器学习模型进一步探究影像组学机器学习模型对Stanford A型AD的检测效能。128个研究对象中有23例Stanford A型AD患者。1 905个特征经过Spearman相关性分析和LASSO回归降维后得到包括13个影像组学特征的最优特征集合。特征筛选过程、最终的13个特征参数及相应权重见图4。

图4 LASSO回归筛选特征和确定最优特征集Fig 4 LASSO regression for feature selection and optimal feature set determination

SVM、DT、RF、XGBoost、LghtGBM和ET在训练集和验证集中检测AD的效能见表2和图5。结果显示RF模型对Stanford A型AD的检测能力最好。RF在训练集中的AUC、F1分数、准确度和召回率分别为0.999、0.976、99.0%、100.0%;在验证集中分别为0.852、0.625、76.9%、100.0%。

图5 各模型在验证集上检测Stanford A型AD的ROC曲线Fig 5 ROC curve for each model to detect Stanford type A AD in the validation set

讨 论

本研究以增强CT扫描确诊的AD为金标准,基于平扫CT影像组学方法分别构建了检测AD的6个机器学习模型,结果显示XGBoost模型在识别AD上表现最佳,RF模型在检测Standford A型AD上表现最佳,召回率均为100%。这表明通过影像组学机器学习模型,有望提高平扫CT对AD的诊断效能,从而提高平扫CT对非典型或无症状AD患者的检出率,为有碘对比剂使用禁忌的患者、增强CT检查受限或可及性不足地区的患者、以及担忧碘对比剂肾病而不愿接受增强CT检查的患者提供可行的替代检查方式。

关于机器学习模型在CT图像上检测AD的价值,Harris等[18]开发了一种基于2维增强CT图像的卷积神经网络模型,在检测AD和主动脉破裂上表现出良好的性能,并通过外部验证集证实。随后,Cheng等[19]将U-Net深度学习模型应用于增强后的CT横断面图像,以实现主动脉的自动分割和诊断AD。研究结果显示,该方法的准确度高达85.0%。Tan等[20]在88例CT病例(43例AD患者和45例健康人)中比较了基于增强CT横断面图像的3种CNN模型对AD的诊断性能,结果显示DenseNet121性能最好,在验证集中F1值和召回率均为0.968。上述研究仅利用二维影像数据构建机器学习模型,没有利用三维影像数据,且均基于增强CT图像诊断AD,没有尝试基于平扫CT来检测AD。因此在增强CT不可及或无法获得的情况下,上述方法可能无法使患者受益。目前,国内外已有学者研究深度学习模型在平扫CT上对AD的诊断价值。Hata等[21]构建的卷积神经网络模型可在平扫CT的横断面图像上诊断AD,在准确性、敏感性和特异性方面,与放射科医师对AD的诊断无统计学差异。Yi等[22]联合形态学特征和深度学习特征构建深度集成模型来诊断AD,结果显示该模型的诊断准确性与放射科医师无统计学差异。然而,上述两个研究均将深度学习模型与放射科医师在平扫CT上识别AD的表现进行比较,但他们并未将基于平扫CT的深度学习模型与放射科医师基于增强CT识别AD的效能进行比较。鉴于增强CT目前仍然是检测AD的一线成像方式,加上放射科医师基于平扫CT识别AD敏感度低、假阴性率高[14,23],因此在增强CT使用受限的情况下,上述研究所构建的模型是否可以作为增强CT的替代检查方式来帮助识别AD有待进一步验证。

本研究基于影像组学特征分别应用SVM、DT、RF、ET、LightGBM、XGBoost 6种机器学习算法进行模型构建,并计算AUC、准确度、召回率、F1分数及混淆矩阵指标评价模型的效能。召回率是真实阳性样本中的正确检测比例,计算公式为:正确检测为阳性的样本数/真阳性样本数。F1分数同时兼顾了精确度和召回率,是对它们的调和平均。由于AD是心血管疾病中死亡率最高的疾病之一,所以提高该疾病的检出率具有重要的临床意义。根据专家共识[8],增强CT识别AD的召回率为100%。本研究结果显示,XGBoost模型在平扫CT上识别AD的召回率为100%。在检测AD的能力上,该模型的表现可以被很好的接受。因此,在增强CT不可用或不可得的情况下,用该模型帮助放射科医师识别AD具有可行性。另外,鉴于Stanford A型AD比Stanford B型AD发病更凶险,死亡率更高,更迫切需要紧急手术治疗[24],因此我们探究了影像组学机器学习模型识别累及升主动脉的Stanford A 型AD的效能。结果显示,RF模型检测出了所有A型AD患者,表明该模型有望对此类患者有所帮助。

在这6个机器学习模型中,DT的效能不佳,在检测AD和A型AD的验证集中AUC和F1分数均低于其他模型,且在训练集和验证集表现差异大,提示该模型存在过拟合。SVM是一种广义的线性分类器模型[25],在检测AD以及Stanford A型AD上,SVM模型在验证集的检测性能均为第二,在训练集和验证集的表现差异也较小,具有较好的准确性。RF和ET是以决策树为基分类器的集成模型。在检测AD上,RF模型在验证集实现了良好的检测准确性,AUC达0.896,但稍逊色于XGBoos和LightGBM模型。但在检测Stanford A型AD上,RF模型的表现最好。ET的原理与RF类似,但具有更强的随机性。在检测AD上,ET模型在训练集与验证集中表现出良好的检测性能,在验证集中AUC、F1分数、准确度分别为0.886、0.783、80.8%。然而,在检测Stanford A型AD上,ET模型在训练集和验证集表现差异较大。XGBoost模型和LightGBM模型都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树,因此均为基于决策树的分布式梯度提升框架[26]。在检测AD上,这2个模型均表现出优于另外4个模型的性能,而XGBoost模型相较于LightGBM模型,对阳性AD样本的检出率更高。无论是检测AD还是检测Stanford A型AD,这2个模型性能差别较小。

本研究存在一些局限性。首先,这是一项单中心回顾性研究,不可避免地存在偏倚;其次,本研究的结论缺少外部数据的验证;再次,本研究仅分析影像组学特征的诊断效能,未结合临床特征建模;最后,本研究纳入的样本量较少,可能影响结果的准确性。

综上所述,本研究基于平扫CT的三维影像组学构建了检测AD及Stanford A型AD的机器学习模型。在检测AD上XGBoost模型效能最佳,在检测Stanford A型AD上RF模型效能最佳。通过机器学习,有望通过平扫CT提高非典型或无症状AD患者的检出率,降低发生对比剂肾病的风险,为有对比剂禁忌或增强CT不可及的患者提供可行的替代检查方式。

作者贡献声明唐依琳 文献调研和整理,数据收集、整理和统计,模型构建,论文撰写和修订。张渌恺 论文构思,数据收集和分析,技术指导。金倞 研究选题和设计,论文指导。王坤,杨玉玲数据收集和整理。李骋,马庄宣 可行性分析,论文修订。李铭 数据分析,项目统筹,论文修订。

利益冲突声明所有作者均声明不存在利益冲突。

猜你喜欢

放射科组学A型
放射科住院医师职业倦怠研究进展
我国放射科住院医师规范化培训现状的调查与思考
放射科专业基地入科教育的实践探讨
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
DF100A型发射机马达电源板改进
代谢组学在多囊卵巢综合征中的应用
A型肉毒素在注射面部皱纹中的应用及体会
A型肉毒毒素联合减张压迫法在面部整形切口的应用
AZA型号磨齿机工件主轴的改造