18F-FDG PET/CT评价胃肠间质瘤恶变潜能:Meta分析
2018-11-06王德安胡顺成杜建梅
王德安,胡顺成,杜建梅
(1.青海省康复医院放射科,2.消化内科,3.检验科,青海 西宁 810007)
胃肠道间质瘤(gastrointestinal stromal tumors, GIST)起源于胃肠道间叶组织,较少见,约占胃肠道肿瘤的0.19%~3.00%[1],高发年龄为50~70岁,无明显性别差异,最常见发生于胃(60%~70%)和小肠(20%~30%)[2]。GIST的危险度分级取决于肿瘤原发部位、肿瘤大小和核分裂数[3]。核分裂数通常由手术或活检后取得,而术前评估GIST恶变程度存在困难[4]。18F-FDG PET/CT可无创地将功能与解剖显像融合为一体,广泛应用于肿瘤分期、疗效及预后评估等方面[5-7]。目前国际上已有多项关于PET-CT评估GIST恶变潜能的诊断试验研究[8-12],而国内类似研究[4]较少。本研究收集国内外发表的相关诊断性试验,采用系统评价方法观察PET/CT评估GIST恶变潜能的价值。
1 资料与方法
1.1文献检索 检索PubMed、EMBASE、Cochrane图书馆、中国知网和中国生物医学文献数据库,检索时间为建库至2017年12月。检索采用自由词与主题词相结合的方式,检索词包括 “computed tomography”“gastrointestinal stromal tumors”“GIST”“胃肠间质瘤”“正电子发射计算机体层摄影”和“CT和PET”。
1.2纳入和排除标准 ①发表语言为中文或英文;②内容为PET/CT评估GIST恶变潜能的诊断试验研究,以术后病理为金标准;③能够直接或间接提取真阳性值(true positive, TP)、假阳性值(false positive, FP)、真阴性值(true negative, TN)和假阴性值(false negative, FN)的四格表数据。排除标准:①研究对象为GIST并发其他肿瘤;②重复发表的文献;③病例报告、综述或会议摘要。
1.3文献筛选和资料提取 检索获得的文献导入EndNote X6文献管理软件,使用“Duplication”自动去重功能剔除重复文献后,由2名研究者按照以上纳入和排除标准独立对纳入文献的标题和摘要进行筛选,不确定能否纳入时调阅全文,并最终确定是否纳入,遇有分歧时通过讨论达成一致意见。
根据研究目的,预先设定数据提取条目,并对参与数据提取的研究员进行统一培训后,由2名研究者独立提取数据。提取内容主要包括:第一作者、发表年、发表国家、设备型号、18F-FDG剂量、样本量、性别、年龄、诊断方法、最大标准摄取值(maximum standardized uptake value, SUVmax)、TP、TN、FP和FN。数据提取过程中如产生分歧,则与第3名研究者讨论决定。
1.4质量评价 采用诊断准确性试验质量评价工具-2(quality assessment of diagnostic accuracy studies tool-2, QUADAS-2)评价纳入文献的方法学质量[13]。QUADAS-2包括4个组成部分:病例选择、待评价试验、金标准以及病例流程和进展情况。评估所有组成部分的偏倚风险和前3个部分的临床适用性。评估结果分为“低”“高”或“不确定”,由2名研究者独立对文献质量进行评价,通过讨论解决分歧。
1.5亚组分析和Meta回归分析 基于诊断试验设备型号与SUVmax临界值分为不同的亚组,对诊断灵敏度和特异度进行亚组分析。以诊断试验的设备型号和SUVmax临界值为协变量,采用Meta回归探讨异质性来源。
1.6统计学分析 采用Meta-Disc统计分析软件。计算Spearman相关系数以评价纳入文献间是否存在阈值效应,绘制汇总受试者工作特征曲线(summary receiver operating characteristic, SROC)曲线,获得AUC,并采用随机效应模型计算纳入文献的合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比、合并诊断比值比及相应的95%CI。采用I2统计评价纳入文献间的统计学异质性,I2<25%为异质性较小,25%~50%为异质性中等,I2>50%为异质性较大。采用STATA 12.0软件绘制Deek's漏斗图,以检测纳入文献是否存在发表偏倚,P<0.05提示可能存在发表偏倚[14]。亚组分析时,各亚组间合并灵敏度和特异度的比较采用χ2检验,P<0.05为差异有统计学意义。
2 结果
2.1文献筛选结果 检索后获得528篇文献,以EndNote软件去除重复文献202篇,初筛后排除明显不符合纳入标准的314篇(不相关研究232篇,病例报告20篇,会议摘要或综述62篇),调阅全文后排除6篇,最终纳入6篇文献[4,8-12]进行Meta分析。
2.2纳入研究的基本特征 所有纳入文献的PET/CT图像采集方式均为三维模式采集,得到轴位、矢状位及冠状位的PET/CT融合图像。6项研究共157例患者,1项[8]为前瞻性队列设计研究,其他均为回顾性研究;2项研究[8-9]来自韩国,3项[10-12]来自日本,1项[4]来自中国。2项研究[8-9]所使用的设备型号为DSTe PET/CT,3项研究[10-12]为Aquiduo PET/CT,1项研究[4]为Gemini TF 64 PET/CT。4项研究[4,8,11-12]报道了GIST恶性组和良性组的平均SUVmax,诊断良恶性GIST的SUVmax临界值范围为2.2~5.0;另2项研究[9-10]未对此进行报道。纳入研究的基本特征见表1,诊断参数见表2。
图1 质量评价结果 A.汇总偏倚风险; B.单个研究的偏倚风险
2.3质量评价 QUADAS-2质量评价结果显示,在病例选择方面,2项研究[8,10]偏倚风险低,1项[11]偏倚风险高,3项[4,9,12]偏倚风险不确定;在待评价试验方面,2项研究[8,10]偏倚风险低,1项[9]偏倚风险高,3项[4,11-12]偏倚风险不确定;在金标准方面,5项研究[4,8,10-12]偏倚风险低,1项[9]偏倚风险高;在病例流程和进展情况方面,4项研究[4,8,10,12]偏倚风险低,2项[9,11]偏倚风险不确定。关于适用性,1项研究[8]显示病例选择的风险程度低,5项[4,9-12]显示病例选择的风险程度不确定;1项研究[12]显示待评价试验的风险程度低,5项[4,8-11]显示待评价试验的风险程度不确定;3项研究[4,9,11显示金标准的风险程度低,3项[8,10,12]显示金标准的风险程度不确定。见图1。
2.4Meta分析结果 采用Spearman相关系数对阈值效应进行评价,结果显示纳入研究之间不存在阈值效应(P=0.618),且纳入研究间异质性较小(I2=21.2%,P=0.27)。
对纳入的6项研究进行定量合并,结果显示合并灵敏度、合并特异度、合并阳性似然比、合并阴性似然比及合并诊断比值比分别为0.85[95%CI(0.76,0.92)]、0.79[95%CI(0.68,0.87)3]、3.35[95%CI(1.81,6.20)]、0.22[95%CI(0.13,0.37)]及18.28[95%CI(6.31,52.95)];SROC曲线的AUC为0.905 7(P<0.05)。见图2~5。
表1 纳入研究的基本特征
注:—:研究未提及
图2 合并灵敏度结果 图3 合并特异度结果 图4 合并诊断比值比结果
图5 SROC曲线 图6 Deek's漏斗图
2.5亚组分析 基于诊断试验设备型号与SUVmax截点值的亚组分析结果见表3。仅有1项研究采用Gemini TF 64 PET/CT,未纳入亚组分析。各亚组间合并灵敏度和合并特异度差异均无统计学意义(P均>0.05)。
2.6Meta回归分析 以诊断试验的设备型号和SUVmax临界值为协变量,Meta回归结果提示诊断试验的准确性不受设备型号和SUVmax临界值的影响,见表4。
2.7发表偏倚检测 采用Deek's漏斗图评估发表偏倚,结果显示研究间对称性较好,存在发表偏倚的可能性较小(P=0.51),见图6。
3 讨论
随着对GIST认识的深入以及精准医学在肿瘤领域中的推广应用,治疗前评估GIST恶变潜能的重要性逐渐凸显。目前主要基于肿瘤的原发部位、肿瘤大小和核分裂数评估GIST的恶变潜能。对于肿瘤原发部位和大小可通过超声内镜、增强CT等常规影像学方法加以评价[4],而核分裂数仅可通过手术或活检获取,因而无法在术前准确评估GIST的危险度。18F-FDG PET/CT融合功能显像与解剖显像于一体,是一种无创、便捷的影像学技术,通过一次扫描即可获得肿瘤局部的情况,在肿瘤分期、评估疗效及预后方面极具优势,还可用于评估GIST靶向药物的治疗敏感度[4]。本研究采用Meta分析评价PET/CT评估GIST恶变潜能的价值。
本研究共纳入国内外6项关于18F-FDG PET-CT评估GIST恶变潜能的诊断性试验,其间的异质性较小,定量合并后结果提示18F-FDG PET/CT评估GIST恶变潜能的合并敏感度为0.85[95%CI(0.76,0.92)],特异度为0.79[95%CI(0.68,0.87)],提示存在15%左右的漏诊率和21%的误诊率;18F-FDG PET-CT在评估GIST恶变潜能的合并诊断比值比为18.28,Q值为0.837 4,表明其诊断准确率较好;18F-FDG PET/CT评估GIST恶变潜能的SROC曲线的AUC为0.905 7,提示其诊断效能较高。此外,基于诊断试验设备型号和SUVmax临界值进行的亚组分析和Meta回归分析结果显示,18F-FDG PET/CT评估GIST恶变潜能的诊断效能受设备型号与SUVmax临界值的影响较小。然而本研究纳入样本量较小,有待大样本研究的进一步确认。
表2 纳入研究的诊断参数
表3 不同亚组合并灵敏度和合并特异度比较[%(95%CI)]
表4 Meta回归分析结果
GIST的发病率较低,此类研究的样本量均较小,采用Meta分析可达到扩大样本量、增加统计学效能的目的。尽管目前国内相关的研究较少,但本组纳入研究间的同质性较好,且研究对象均为亚洲人群,可为该技术在国内的使用提供可靠依据。然而本研究纳入文献多为回顾性研究,未来应该开展大样本前瞻性研究对18F-FDG PET/CT的评估价值加以进一步观察。