MR扩散加权成像对甲状腺良恶性结节鉴别诊断价值的Meta分析
2015-03-20谭慧陈军何骏驹陆婧
谭慧,陈军,何骏驹,陆婧
甲状腺结节是最常见的一种甲状腺疾病,大多无临床症状,其中恶性结节约占所有结节的5%~10%[1],甲状腺结节的良恶性鉴别至关重要。目前B超是临床上最常用的检查方法,但诊断准确性易受操作者的手法和经验影响,且目前还无单独可靠标准能对甲状腺良恶性结节进行鉴别诊断[2];CT对病灶中钙化敏感,但是辐射剂量大,且增强扫描使用的含碘对比剂对伴有甲状腺功能亢进的患者不适用;甲状腺核素扫描对甲状腺自主高功能腺癌(热结节)有诊断价值,大多数良性结节和甲状腺癌一样吸收核素较少,成为“冷结节”,并且核素扫描费用高昂,不适宜推广;甲状腺细针抽吸细胞学检查是诊断甲状腺结节最准确、经济的方法,但有创且仍有15%~20%无法诊断。各种诊断方法的局限性促使人们寻找新型无创性、高准确性和实用性的辅助检查。2009年Schueller首次将DWI应用于甲状腺结节,认为DWI是一种有效的诊断工具。近年来已有许多国内外学者运用DWI进行甲状腺结节良恶性鉴别诊断的研究,结论各异,对DWI的优缺点缺乏综合的评价,因此笔者采用Meta分析方法对国内外运用DWI鉴别甲状腺结节良恶性的原始研究进行客观评价,旨在为临床应用提供参考。
材料与方法
1.资料来源
检索Cochrane library、Pubmed、Embase、Ovid、Medline数据库、中国生物医学文献数据库(CBM)、中国学术期刊全文数据库(CNKI)、维普中文科技期刊数据库(VIP)、万方数据知识服务平台自建库以来至2014年11月的中、英文献,获取研究DWI评价甲状腺结节良恶性的文献。本研究不包括尚未公开发表的文章,并将发表类型为“综述”、“信件”、“评论”、“社论”和“病例报告”的文章排除。英文检索策略为:“thyroid nodules”或“thyroid neoplasms”和“diffusionweighted imaging”或“DWI”;中文检索策略为:“甲状腺结节”或“甲状腺肿瘤”和“弥散加权”或“扩散加权”和“磁共振”或“MRI”或“MR”;研究对象限定为“人类”。为尽量避免漏查文献,采用网上检索及手工检索相结合的方法,对所检索的文献中提供的参考文献进行二次检索。由2名评价员独立进行检索,如遇不一致经讨论确定。
2.文献纳入标准
具体纳入标准如下:①国内外公开发表的中文或英文文献;②DWI用于鉴别诊断甲状腺结节良恶性的试验研究;③全部被研究的甲状腺结节均有组织病理学检查结果;④前瞻性或回顾性研究;⑤能直接或间接提取四格表数据,其中包括真阳性数(TP)、假阳性数(FP)、假阴性数(FN)、真阴性数(TN);⑥补充数据后重新发表的同一题材文献,纳入最新发表的文献研究结果;⑦以期刊全文和学位论文2种方式发表的同一题材研究,根据病例数、研究方法及发表时间,纳入研究方法阐述详细、数据准确的较新材料。
3.文献资料提取和质量评价
由2名具有循证医学教育背景的医学研究生独立阅读文献并提取资料,意见分歧时,增加1名研究人员,讨论协商达成一致性意见。每项研究提取的信息包括第一作者、发表时间、作者所在国家、研究对象的平均年龄、样本量、连续性、研究类型(前瞻性或回顾性)、是否为盲法;MR设备生产厂家、磁场强度、扩散敏感因子(b值),甲状腺良、恶性结节的平均表观扩散系数(apparent diffusion coefficient,ADC)值,区别良恶性结节的ADC阈值。文献质量评价采用诊断性试验准确性质量评价工具(quality assessment of diagnostic accuracy studies,QUADAS)评价文献质量和发生偏倚的可能,每个项目按照“是”、“否”和“不清楚”3个标准进行评断。
4.统计学分析
采用Meta-Disc 1.4软件和Stata 12.0软件进行统计学处理,提取各独立研究的TP,FP,FN,TN进行异质性检验,根据异质性检验的结果使用固定效应模型(P>0.1,且I2<50%),使用随机效应模型(P<0.1,且I2>50%)[3],计算研究的合并后敏感度(SEN)、特异度(SPE)、阳性似然比(PLR)、阴性似然比(NLR)。如存在异质性采用敏感度对数和(1-特异度)对数的spearman系数分析阈值效应,回归分析和亚组分析寻找异质性的来源。绘制受试者操作特征曲线(ROC),并计算曲线下面积(area under curve,AUC)和Q*指数[4-6],曲线越接近坐标轴左上角,说明检查的诊断价值越高。绘制Deek漏斗图,检测是否存在发表偏倚[7]。建立似然比点状图,评价临床应用的价值。最后进行敏感度分析将纳入文献研究逐一排除后,对剩余的文献进行稳定性分析,如结果变化不大说明纳入文献稳定性好;反之,纳入文献的稳定性差。
结 果
1.文献检索和筛查结果
共检索到文献57篇,其中英文文献30篇,中文文献27篇。通过阅读文献题目和摘要排除不相关英文文献21篇,中文文献16篇,按照纳入标准最终选定英文文献6篇[8-13],中文文献7篇[14-20],共纳入13篇文献,其中前瞻性研究11篇,回顾性研究2篇。纳入甲状腺结节患者700例,病灶数732个,良性病灶数530个,恶性病灶数202个,良、恶性结节及诊断阈值ADC值的各项研究基本特征见表1~2。
2.纳入文献的质量评估
参照QUADAS质量评价表14个条目对纳入文献进行质量评价,其中9篇文献因检查时间与最终病理检查间隔时间不明确,12篇文献病理检测与待检验试验是否实行双盲法未明确,1篇文献对金标准的操作描述不清。全部13篇文章均满足10个以上评价标准,可认为纳入文章的质量较高。
3.数据处理
异质性分析:敏感度和特异度作为效应量进行异质性分析,异质性分析采用Q检验和I2检验。若Q值大于自由度为K-1的χ2的分布界值,I2>50%,则拒绝同质性假设,纳入的资料存在异质性。本组资料中DWI鉴别结节良、恶性的敏感度异质性检验的Q=13.86,P=0.31(P>0.05),I2=13.42%(I2<50%),说明不存在异质性,使用固定效应模型进行合并;特异度异质性检验Q=26.02,P=0.01(P<0.05),I2=53.88%(I2>50%)结果表明存在异质性,使用随机效应模型进行合并。诊断性试验的异质性主要来源于阈值效应和非阈值效应。
表1 纳入研究的基本情况
表2 纳入研究的ADC值测量结果 (×10-3 mm2/ss)
表2 纳入研究的ADC值测量结果 (×10-3 mm2/ss)
注:ND:文中未提及。
作者 b值(s/mm2)良性结节平均ADC值恶性结节平均ADC 150 2.56±0.56 1.75±0.43 1.99值 诊断阈值Ilica[8] ND 0.15±0.35 0.81±0.18 0.90 Mutlu[9] ND 1.60±0.10 0.80±0.20 1.00 Schueller[10] 800 2.73±0.65 1.93±0.25 2.25 Nakahira[11] 1000 1.93±0.37 1.20±0.25 1.60 Yingwei Wu[12] 300 2.37±0.47 1.49±0.60 2.17 Hai Feng Shi[13] 500 1.93±0.51 1.36±0.28 1.70刘洁[14] 300 2.99±0.31 1.79±0.47 2.61岳秀慧[15] 300 2.39±0.38 1.60±0.56 1.98靳勇[16] 500 1.93±0.51 1.36±0.28 1.70汪欣[17] 400 1.94±0.26 1.15±0.26 1.39闫斌[18] 300 2.51±0.49 1.58±0.28 1.90任崧[19] 400 2.00±0.30 1.00±0.40 1.48李若坤[20]
表3 排除结果差异较大的研究后异质性分析和汇总敏感度特异度和曲线下面积
阈值效应由采用不同的临界值导致敏感度、特异度和诊断优势比产生,因此首先检验是否存在阈值效应。通过计算敏感度对数和(1-特异度)对数的spearman相关系数检验阈值效应,得到spearman系数为0.21,P=0.303,结果显示不存在阈值效应。
非阈值效应的异质性可能由方法学异质性或者研究人群的特征不同造成,进行Meta回归分析发现试验设计类型、试验人数(n>50)、试验质量、盲法、设备生产厂家、磁场强度、b值和ADC阈值对异质性无显著影响。对以上影响因素进行亚组分析未发现异质性来源。
Meta分析:分析结果合并敏感度为0.90(95% CI:0.85~0.94),特异度为0.89(95%CI:0.84~ 0.93),根据敏感度和特异度绘制森林图(图1)。将阳性、阴性似然比绘制似然比点状图(图2),其中阳性似然比为8.19(95%CI:5.50~12.20),阴性似然比为0.11(95%CI:0.07~0.17),诊断试验比值比(DOR)为76.34(95%CI:42.98~135.58)。计算AUC为0.9365,Q*指数为0.8730(图3)。
发表偏倚分析:绘制Deek漏斗图,采用线性回归法检验漏斗图不对称性,斜率P=0.70,提示漏斗图对称,表明纳入文献发表偏倚的可能性很小(图4)。
敏感度分析:对文献进行敏感度分析,剔除评价质量最差的文献[14]后,异质性检验Q值为21.44(P=0.03),I2为48.70,合并敏感度为0.89(95%CI:0.84~0.93),合并特异度为0.90(95%CI:0.85~0.93);剔除敏感度和特异度结果差异较大的文献[12],异质性检验分析Q值为22.47(P=0.02),I2为51.05,合并敏感度为0.89(95%CI:0.84~0.93),合并特异度为0.90(95%CI:0.85~0.93)(表3)。结果显示合并结果稳定性好,表明分析结论可靠。
图1 敏感度和特异度森林图。
讨 论
DWI是目前唯一能观察活体水分子微观扩散运动的成像方法,最初在中枢神经系统得到广泛应用。近年来,DWI在体部应用方面也显示出较好的前景,ADC值通常被用来鉴别病灶的良恶性。
恶性结节由于细胞核体积增大、细胞数目增多、细胞外间隙变小等原因使得水分子扩散受限,因此其ADC值通常低于良性结节[21],但是采用不同的b值所测得ADC值也会不同,对纳入研究进行回顾发现,国外学者倾向于采用较高b值,普遍为800s/mm2以上,而国内学者选择的b值范围集中在300~500s/mm2,Wu等[12]认为b值取300s/mm2时,良恶性结节ADC值的差异有统计学意义(P<0.05),其研究与Bozgeyik等[22]研究结果一致,因此推测甲状腺结节对低b值较为敏感,并建议以b值为300s/mm2为轴,细分b值进行研究。
本研究纳入文献的ADC值最低为0.9× 10-3mm2/s[8], 最 高 为2.61× 10-3mm2/s[14]。Mutlu等[9]将恶性结节95%CI上界作为诊断阈值;刘洁等[14]研究敏感度高达100%,而特异度仅为71%,其阈值选择未作说明;汪欣等[17]研究敏感度仅为67%,而特异度高达93%。笔者建议可细分b值对大样本甲状腺结节患者进行研究,横向对比其差异,最终确定最佳b值范围及最佳诊断阈值。
本研究汇总分析结果表明:DWI鉴别状腺结节良恶性的敏感度为90%,特异度为89%,提示DWI对甲状腺结节良恶性的诊断效能好。似然比是诊断性试验综合评价的理想指标,综合了敏感度和特异度的临床意义,研究结果显示阳性似然比为8.19(95%CI:5.50~12.20),阴性似然比为0.11(95%CI:0.07~0.17),其综合效能接近纵轴红线,说明DWI可主要用于排除甲状腺恶性结节。对于一项诊断试验而言,AUC在0.50以下、0.5~0.7、0.7~0.9及0.9以上时,分别表示为无诊断价值、较低准确性、较高准确性及很高准确性[23],本研究AUC为0.9365,表明DWI在鉴别甲状腺结节良恶性上有很高的准确性。
图2 似然比图。
图3 SROC曲线。
图4 Deek漏斗图。
本研究存在一定的局限性,首先本研究仅纳入已发表的中英文文献,排除了读者来信,评论性综述,会议文献、未发表的文献和其他语言的文献等,可能存在潜在的选择偏倚;其次纳入研究的样本量较少,尚无法对不同机型及扫描参数进行分层研究;同时为了测量结果的精确性,排除了短径<1cm结节,对于较小结节尚未进行统计。
综上所述,DWI成为鉴别甲状腺结节的一种有效、无创性技术,相信随着MRI软硬件不断发展及今后的定量化研究,将在甲状腺结节诊断和鉴别诊断中发挥越来越重要作用。
[1] Ezzat S,Sarti DA,Cain DR,et al.Thyroid incidentalomas:prevalence by palpation and ultrasonography[J].Archives of Internal Medicine,1994,154(16):1838-1840.
[2] Papini E,Guglielmi R,Bianchini A,et al.Risk of malignancy innonpalpable thyroid nodules:predictive value of ultrasound and color-Doppler features[J].J Clin Endocrinol Metab,2002,87(5):1941-1946.
[3] DerSimonian R,Laird N.Meta-analysis in clinical trials[J].Controlled Clinical Trials,1986,7(3):177-188.
[4] Rutter CM,Gatsonis CA.A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations[J].Statistics in Medicine,2001,20(19):2865-2884.
[5] Harbord RM,Deeks JJ,Egger M,et al.A unification of models for meta-analysis of diagnostic accuracy studies[J].Biostatistics, 2007,8(2):239-251.
[6] Swets JA.Measuring the accuracy of diagnostic systems[J].Science,1988,240(4857):1285-1293.
[7] Egger M,Smith GD,Schneider M,et al.Bias in meta-analysis detected by a simple,graphical test[J].BMJ,1997,315(7109):629-634.
[8] Ilica AT,Artas H,Ayan A,et al.Initial experience of 3tesla apparent diffusion coefficient values in differentiating benign and malignant thyroid nodules[J].J Magn Reson Imaging,2013,37(5):1077-1082.
[9] Mutlu H,Sivrioglu AK,Sonmez G,et al.Role of apparent diffusion coefficient values and diffusion-weighted magnetic resonance imaging in differentiation between benign and malignant thyroid nodules[J].Clin Imaging,2012,36(1):1-7.
[10] Schueller-Weidekamm C,Schueller G,Kaserer K,et al.Diagnostic value of sonography,ultrasound-guided fine-needle aspiration cytology,and diffusion-weighted MRI in the characterization of cold thyroid nodules[J].Eur J Radiol,2010,73(3):538-544.
[11] Nakahira M,Saito N,Murata S,et al.Quantitative diffusionweighted magnetic resonance imaging as a powerful adjunct to fine needle aspiration cytology for assessment of thyroid nodules[J].Am J Otolaryngol,2012,33(4):408-416.
[12] Wu Y,Yue X,Shen W,et al.Diagnostic value of diffusion-weighted MR imaging in thyroid disease:application in differentiating benign from malignant disease[J].BMC Medical Imaging,2013(1):13-23.
[13] Shi HF,Feng Q,Qiang JW,et al.Utility of diffusion-weighted imaging in differentiating malignant from benign thyroid nodules with magnetic resonance imaging and pathologic correlation[J].J Computer Assisted Tomography,2013,37(4):505-510.
[14] 刘洁.常规磁共振成像联合弥散加权成像对甲状腺良恶性结节的鉴别诊断价值研究[D].华中科技大学,2013:40-66.
[15] 岳秀慧,陶晓峰,高欣,等.MR扩散加权成像在甲状腺疾病诊断中的应用[J].中华放射学杂志,2012,46(6):500-504.
[16] 靳勇,强金伟,冯琴,等.甲状腺结节的MR扩散加权成像与病理对照[J].中国医学影像技术,2012,28(2):256-260.
[17] 汪欣.磁共振弥散加权成像在鉴别甲状腺良恶性结节中的价值[D].南昌大学,2011:2-26.
[18] 闫斌,赵婷婷,刘红娟,等.b值的选择对DWI定量测量鉴别甲状腺结节良恶性的影响[J].临床放射学杂志,2011,30(6):796-800.
[19] 任崧,刘长宏,白人驹,等.甲状腺结节性病变MR弥散加权成像诊断价值初探[J].中华医学杂志,2010,90(47):3351-3354.
[20] 李若坤,强金伟,刘伟,等.磁共振磁共振扩散加权成像在甲状腺良恶性病变鉴别诊断中的价值[J].放射学实践,2009,24(7):719-722.
[21] 杜牧,徐坚民,龚静山,等.头颈部病变MR扩散成像的初步研究[J].中华放射学杂志,2007,41(9):912-917.
[22] Bozgeyik Z,Coskun S,Dagli AF,et al.Diffusion-weighted MR imaging of thyroid nodules[J].Neuroradiology,2009,51(3):193-198.
[23] Swets JA.Measuring the accuracy of diagnostic systems[J].Science,1988,240(4857):1285-1293.