MRI 影像组学对脑胶质瘤分级诊断的Meta 分析
2021-07-19包婉秋王汝良
彭 霞,包婉秋,董 萍,向 橙,王汝良
(牡丹江医学院医学影像学院,黑龙江 牡丹江 157000)
脑胶质瘤是最常见的原发性恶性脑肿瘤,WHO将其分为Ⅰ~Ⅳ级,其中Ⅰ、Ⅱ级为低级别胶质瘤(low grade glioma,LGG),Ⅲ、Ⅳ级为高级别胶质瘤(high grade glioma,HGG)[1]。LGG 生存期较长,而HGG 具有高度侵袭性、预后差[2]。大多数胶质瘤首选手术治疗,术后HGG 常需辅助放疗或化疗,以防止短期内复发,而LGG 则需密切观察[3]。因此,术前对肿瘤准确分级非常重要。目前,胶质瘤分级的金标准是病理学,但其具有侵袭性,通常在术后进行。越来越多的研究关注对肿瘤准确分级的非侵入性方法。
MRI 是诊断胶质瘤的 重要方法,MRS、DWI 和PWI 等多种MRI 技术被应用于胶质瘤的分级中[4-5]。影像诊断在很大程度上依赖于放射科医师对影像数据的主观经验。而放射组学能够将医学图像转换为定量、可提取的高维数据,包括直方图、纹理特征和形状特征[6]。近年来,放射组学多用于肿瘤研究,逐渐成为一种从常规图像中提取诊断、预后信息的工具[7]。关于CT 和MRI 影像组学与多种恶性肿瘤的病变特征、存活率和围手术期结局相关性的研究越来越多,但尚未在临床实践中应用。本文旨在对神经胶质瘤分级的MRI 影像组学研究进行Meta 分析,明确MRI 影像组学对鉴别HGG 和LGG 的诊断价值。
1 材料与方法
1.1 文献检索 计算机检索PubMed、Embase、CNKI、万方、维普及中国生物医学文献数据库(CBM)2005 年1 月1 日至2020 年12 月18 日 所有MRI影像组学对脑胶质瘤分级研究的文献。检索采用主题词和自由词结合,检索词:“脑胶质瘤”“胶质瘤”并且“影像组学”“纹理特征”“纹理分析”“直方图”并且“核磁共振”“核磁”“磁共振”,及相应的英文检索词。
1.2 纳入与排除标准 纳入标准:①评价影像组学鉴别LGG 和HGG 诊断效能的回顾性或前瞻性研究;②金标准为组织病理学;③计算真阳性、假阳性、真阴性和假阴性结果。排除标准:①动物研究、病例报告、会议文献;②可计算数据不足;③重复报告或基于同一数据的研究。
1.3 文献筛选、数据提取及质量评价 文献检索筛选、数据提取及质量评价均由2 位工作2 年的住院医师分别独立完成,有争议时则由工作10 年以上的主任医师判定。资料提取包括第一作者、发表年份、国家、研究设计、样本量、MRI 场强、影像组学工具、图像序列、ROI、研究对象来源、真阳性、假阳性、真阴性和假阴性,定义HGG 为阳性、LGG 为阴性;如果未报告真阳性、假阳性、真阴性和假阴性结果,则用敏感度、特异度、阳性预测值和阴性预测值等数据反推。用诊断准确性研究质量评估表(QUADAS-2)评价纳入研究的偏倚风险[8]。
1.4 统计学分析 使用Stata 12.0 和Meta-Disc 1.4软件进行Meta 分析。利用提取的真阳性、假阳性、真阴性和假阴性,用随机效应合并敏感度、特异度、阳性似然比、阴性似然比和诊断比。采用Cochran-Q 检验和I2值考察研究间的异质性,P<0.05,I2>50%,为有明显的异质性,选择随机效应模型。AUC 值为0.5~<0.6 时认为诊断工具无效,0.6~<0.7 时为差,0.7~<0.8 时为一般,0.8~<0.9 时为好,0.9~<1.0 时为优。用Stata 12.0 软件绘制Deeks 漏斗图及Fagan 诺模图,分别评估发表偏倚和临床实用性。
1.5 亚组分析 计算亚组的合并敏感度和特异度,以观察纳入研究的异质性所造成的影响。研究按不同场强(3.0 T vs.非3.0 T)、所用影像组学方式(影像组学vs.纹理分析vs.直方图)及ROI(全域vs.非全域)进行分组。
2 结果
2.1 文献筛选流程 共获得1 478 篇文献,然后按标题和摘要筛选,排除369 篇重复文献、48 篇综述或会议文献、1 018 篇与研究内容不符文献。对余下的43 篇文献进一步全文评价,排除14 篇数据不足、1 篇中英文重复文献及1 篇研究对象重复后,最终27 篇[9-35]纳入文献。
2.2 纳入文献的基本特征及质量评价结果 27 篇文献中包括3 篇前瞻性研究、24 篇回顾性研究,共报道2 146 例脑胶质瘤患者。18.5%(5/27)文献的研究对象来源于多中心,81.5%(22/27)来源于单中心。5篇使用1.5 T MRI,2 篇的研究对象来源于BRATS 数据库的研究、未说明设备场强,2 篇文献使用了1.5 T和3.0 T MRI,18 篇文献使用了3.0 T MRI。仅1 篇文献使用了自动分割,其余均为手动勾画ROI,14 篇文献分割了整个瘤体体积进行分析。
使用QUADAS-2 对纳入研究进行质量评估,40.7%(11/27)文献的“待评价试验”显示出缺陷,原因为这11 篇文献使用了阈值,是根据敏感度和特异度而选择的最优结果。所有文献对金标准均无详细描述,仅3.7%(1/27)的文献说明了在金标准分级时采用盲法,18.5%(5/27)的文献说明了MRI 检查与手术病理的具体间隔时间,考虑到实际临床工作情况及胶质瘤分级在短时间内并不会有很大变化,仍考虑为低风险。总体而言,研究质量令人满意。
2.3 Meta 分析结果
2.3.1 敏感度、特异度汇总 研究间的异质性行Q检验,I2=54.15%,P<0.01,存在显著的异质性,采用随机效应模型,Meta 分析结果显示,影像组学鉴别LGG 和HGG 的合并敏感度和特异度分别为0.93[95%置信区间(95%CI)(0.91,0.94)]和0.83[95%CI(0.80,0.86)](图1)。合并后的阳性似然比和阴性似然比分别为5.26[95%CI(3.74,7.39)]和0.11[95%CI(0.09,0.15)],诊断比为63.02[95%CI(38.09,104.28)]。SROC 曲线的AUC 为0.96[95%CI(0.94,0.97)](图2),结果表明,影像组学在鉴别LGG 和HGG 方面具有很高的诊断性能。
图1 影像组学鉴别低、高级别胶质瘤的敏感度和特异度汇总图2 影像组学鉴别低、高级别胶质瘤的总受试者工作特征(SROC)曲线图3 纳入研究的敏感度分析
2.3.2 亚组分析 本研究异质性较大,为探索异质性来源,按不同场强(3.0 T vs.非3.0 T)、所用影像组学方式(影像组学vs.纹理分析vs.直方图)、样本量(<50 vs.≥50)及ROI(全域vs.非全域)进行亚组分析。结果显示,各亚组分析结果与总体结果基本一致,各亚组异质性与总体异质性差异无统计学意义(均P>0.05)(表1)。
2.3.3 敏感度分析 敏感度分析依次剔除每项研究后重新合并统计量,结果均未发现方向性改变(图3)。
2.3.4 临床实用性评价 使用Stata 12.0 软件Fagan诺模图评估影像组学的临床应用。在LGG 的前测概率为25%的情况下,LGG 的后测概率和给定的正影像组学分析结果和负影像组学分析结果的后测概率分别为67%和3%。Fagan 诺模图显示,预试阳性患者的后测概率增加了42%,而预试阴性的患者后测概率降低了22%,这表明影像组学在临床中有一定的实用性。
2.4 发表偏倚 发表偏倚采用Deek 漏斗图不对称检验,P>0.05,未显示显著的发表偏倚。
3 讨论
组织病理学是胶质瘤诊断的金标准,但具有侵入性。MRI 检查可提供准确的信息,避免不必要的手术。随着技术的发展,越来越多的代谢和生理MRI,如DTI、MRS、DWI、MRI 动态磁敏感对比增强扫描和MRI 动态增强扫描等被用于胶质瘤的分级[4-5]。这些检查都是通过识别图像中像素灰度亮度和对比度的差异来评估肿瘤的恶性程度。影像组学是使用诸如MaZda、MATLAB、TexRAD、MISSTA、CAD 和FireVoxel等工具对特征进行的综合分析,可提供新的定量成像标志物,且无需额外使用新的采集设备或示踪剂,比普通检查方法具有更强的诊断能力。自1920 年以来,已有有关利用MRI 影像组学对胶质瘤进行分级的报道。为了系统评价影像组学在区分LGG 和HGG方面的准确性,笔者进行了这项Meta 分析,结果显示影像组学的合并敏感度和特异度分别为0.93 和0.83,阳性似然比和阴性似然比分别为5.26 和0.11,AUC 为0.96,表明影像组学在胶质瘤分级中具有较高的诊断价值。
多项研究显示,影像组学在解决常规放射诊断无法解决的临床问题方面前景较好,比普通检查方法具有更强的诊断能力[4,5,9-11],应进一步思考如何在临床中得以规范化应用。研究结果的复制和独立验证依赖于成像数据、分割和代码的共享,本研究纳入的文献中仅1 篇提供对用于成像数据、特征提取和模型构建的代码的开放访问。在样本量有限但可以量化无数特征参数的情况下,关键在于减少特征参数的数量以降低过度拟合的风险[36],如通过移除重复性差的特征参数。纳入文献中仅44.4%(12/27)的研究采取了措施避免过度拟合。此外,对研究进行适当的验证可减少假阳性和结果过于乐观的风险,纳入文献中仅18.5%(5/27)进行了验证,但均未采用外部数据。且大部分文献仅纳入了外科患者,多为恶性病变或较大的肿瘤,可能存在选择偏倚。
纳入的文献使用了多种MRI 序列,功能成像序列可提供更多生理、血流动力学等其他常规序列无法提供的信息,但非常规序列在临床中并不像常规MRI 序列那样被广泛应用,使用从常规MRI 提取的影像组学数据似乎是更实用和直接的解决方案,影像组学如何在常规序列中标准化或许有助于其在临床中的应用。
纳入的27 篇文献中,超过50%的文献在研究时仅分割了肿瘤的一部分,单一2D 层面分析有低估瘤内异质性的风险。比较2D 和3D 纹理分析,认为两者测量肿瘤异质性的能力不同[37]。本研究亚组分析显示,分割肿瘤的单个2D 层面的研究与3D 分割无显著的异质性。因此,单个层面的分割是否与整个瘤体的分割具有同样的诊断价值还需进一步验证。此外,放射组学数据与临床、遗传和代谢数据还有进一步整合的空间,2016 年WHO 对胶质瘤的新分级标准中除了包括组织学外观外,还包括分子标志物,但纳入的文献均未报道胶质瘤分级与详细的分子标志物或临床结果相关联[1]。
本次Meta 分析纳入文献较多,样本量较大,文献的质量也较高。按不同亚组进行分析,同时逐一剔除各个研究后进行敏感性分析,结果均未发生明显变化,也未存在明显的发表偏倚,说明本研究结果较可靠,代表性高。但本研究存在一定的局限性:①纳入的多为回顾性文献;②纳入的文献存在一定的异质性,不同的放射组学研究方法不同,使用设备不同,图像重建、过滤、特征提取和放射组学模型计算的选择提供了无数的组合;③纳入文献多为单中心研究且研究来源均为外科手术患者,可能存在入院偏倚、选择偏倚。Meta 分析结果显示异质性较大,亚组分析未能找到异质性来源,都将影响Meta 分析的准确性。
因此,影像组学可能是鉴别胶质瘤分级的一种准确的工具,但还需更多的研究来验证其中最合适的技术。影像组学的标准化应用将提高今后胶质瘤分级的诊断水平和临床决策的准确性。