APP下载

血清IgG4对IgG4相关性疾病诊断价值的Meta分析

2021-08-03张连峰

临床荟萃 2021年7期
关键词:样本量异质性曲线

丁 航,刘 源,张连峰,周 琳

(郑州大学第一附属医院 消化内科,河南 郑州 450052)

IgG4相关性疾病(IgG4-related disease, IgG4-RD)是一种可累及胰腺、胆管、唾液腺、泪腺等全身多个器官的自身免疫性疾病,临床特征为受累器官或组织弥漫性或局灶性肿大及硬化,导致阻塞或压迫症状,常伴有血清IgG4水平增高,病理特征为受累组织中代表性IgG4阳性浆细胞浸润[1]。由于人们对IgG4-RD开始认识的时间较晚,并且其临床表现易与其他疾病如恶性肿瘤相混淆,从而导致误诊进一步选择不恰当的治疗方案。目前,国际上已推出了IgG4-RD综合诊断标准以及病理诊断共识,一些器官特异性诊断标准如胰腺、胆管、肾脏也得到了广泛应用,其中病理组织学仍是IgG4-RD诊断的金标准[2]。但病理检查为有创性操作,临床不易开展。2001年,Hamano 等[3]开创性地发现血清 IgG4水平对自身免疫性胰腺炎(AIP)有较高的诊断优势,之后有越来越多研究聚焦于血清 IgG4水平对IgG4-RD的诊断价值。然而,不同的研究间结果存在较大的差异,有研究表明半数以上病理证实的IgG4-RD患者不会出现血清IgG4升高[4]。因此,本研究进行此诊断性Meta分析,旨在阐明血清IgG4水平对IgG4-RD的诊断价值。

1 资料与方法

1.1文献与检索 在美国国立医学图书馆 PubMed 数据库、荷兰医学文摘 Embase 数据库、万方数据库、维普数据库(VIP)和中国知网数据库(CNKI)全面检索,收集自2011年1月1日至2020年1月1日所有以探讨血清IgG4对IgG4相关性疾病诊断价值为目的的英文文献,以IgG4, Serum IgG4, serum immunoglobulin g4, IgG4-Related Disease, Autoimmune Pancreatitis, Mikulicz's disease, IgG4-RD为检索词进行检索,并手工检索综述文献或已纳入文献的参考文献作为补充,全面收集相关资料。

1.2纳入及排除标准 纳入标准:纳入文献以评估血清IgG4对IgG4-RD诊断价值为目的;IgG4相关性疾病诊断采取IgG4-RD综合诊断标准、IgG4-RD病理共识或器官特异性诊断标准;原始文献中应给出或可以计算出构成四格表的数值,即真阳性(true positive, TP)、假阳性(false negative, FN)、假阴性(false positive, FP)及真阴性(true negative, TN)例数。

排除标准:重复报道的文献(当怀疑两个研究有重合的病例时,选取纳入病例数更大的研究);文献类型为述评、书信、会议摘要、讲座等非原始研究,动物实验研究以及会议论文等;IgG4-RD组或对照组样本量小于10例;资料不全或无法从原始文献中获取四格表数据的研究。

1.3文献筛选及资料提取 由2名研究者遵循盲法原则独立进行文献筛选以及对纳入文献进行数据提取,提取内容包括第一作者、发表年份、国家、样本量、诊断标准、血清IgG4检测方法、截断值、以及TP、FP、TN 和 FN 等。筛选及提取过程中如研究者意见不一致,则通过协商或与第3名研究者讨论解决。

1.4文献质量评价 采用诊断准确性研究的质量评价工具QUADAS-2[5]评价纳入文献的质量及发生偏倚的可能性。该标准包含有4个域的评价:病例选择、待评价试验、金标准、病例流程和进展情况,从偏倚风险和适用性两个方面进行。一共有11个条目,偏倚风险最终以“低”、“高”、“不明确”来评定。“不明确”仅指研究报道的信息不充分。

1.5统计学方法 采用Meta-Disc 1.4软件及STATA15.0软件中“midas”命令进行统计学分析。通过双变量模型计算合并敏感度、合并特异度、合并诊断优势比(DOR)、合并阳性似然比(PLR)、合并阴性似然比(NLR),绘制相关森林图并拟合受试者工作特征曲线(summary receiver operating characteristic,SROC)并计算SROC曲线下面积(area under the curve, AUC)描述诊断准确性,AUC越接近1表示诊断性能越高,同时描绘出其95%的置信区间(confidence interval,CI)和 95%预测区间。若研究间存在异质性(I2>50%),则进一步分析异质性来源,观察SROC曲线是否存在“肩臂”状,并结合Spearman相关系数判断有无阈值效应,若无阈值效应,进行亚组分析进一步探讨异质性来源。采用漏斗图及Deeks检验评价纳入文献的发表偏倚情况,P<0.05认为差异有统计学意义。

2 结 果

2.1文献检索结果 共有17篇文献, 17 095例纳入本次Meta分析[6-22]。其中IgG4-RD患者1 545例,对照组15 550例。文献筛选的流程见图1,纳入文献的基本特征见表1。

图1 文献筛选流程及结果

表1 纳入文献的基本特征

2.2文献质量评价 应用QUADAS-2评分,由2名研究者分别对各研究的质量独立进行评估,存在不一致的意见时协商统一,由于一些研究未说明仅限纳入1型AIP,使得病例选择适用性领域出现未知风险。见图2。

图2 应用QUADAS-2评分对纳入文献进行质量评估的情况

2.3主要指标结果及异质性检验 纳入文献中血清IgG4的临界值为1.3~1.44 g/L之间,各研究合并的灵敏度0.88(95%CI:0.81-0.93),特异度为0.89(95%CI:0.83-0.93),阳性似然比为8.3( 95%CI:5.1-13.7),阴性似然比为0.13(95%CI:0.08-0.22),诊断优势比为62(95%CI:25-153)。绘制SROC曲线,计算曲线下面积AUC为0.95(95%CI:0.92-0.96),对灵敏度和特异度进行异质性检验(Q检验),灵敏度I2=91.4%,特异度I2=97.8%,P<0.05,提示各文献间存在显著的异质性。

在所有纳入文献中,11篇文献道了血清IgG4>2×正常值上限(ULN)时的诊断价值,临界值波动在2.7~2.8 g/L之间,包含了1 326例IgG4-RD患者及13750例对照。各研究合并的灵敏度0.59(95%CI:0.47-0.7),特异度为0.96(95%CI:0.94-0.97),阳性似然比为14.3(95%CI:9.1-22.7),阴性似然比为0.42(95%CI:0.32-0.57),诊断优势比为34(95%CI:17-69)。SROC曲线的曲线下面积AUC=0.95(95%CI:0.92-0.96),进行异质性检验发现灵敏度I2=93.2%,特异度I2=92.2%,P<0.05,提示文献间异质性显著。见图3~4。

图3A IgG4诊断IgG4-RD的合并敏感度及特异度

图3B IgG4>2×ULN诊断IgG4-RD的合并敏感度及特异度

图4A IgG4诊断IgG4-RD的SROC曲线 图4B IgG4>2×ULN诊断IgG4-RD的SROC曲线

2.4亚组分析 各研究间异质性较显著,观察两条SROC曲线发现均不存在“肩臂状”分布,且Spearman相关系数在临界值为1.3~1.44 g/L时为-0.368,P=0.295,当临界值>2×ULN时Spearman相关系数=-0.582,P=0.06,提示两组研究均不存在阈值效应。故考虑异质性由于非阈值效应引起,进行亚组分析寻找异质性来源,将纳入文献按地区、疾病类型以及样本量大小进行亚组分析,发现不同地区、是否仅纳入AIP患者以及IgG4-RD患者样本量是否>100都可能是异质性的来源,见表2~3。

表2 IgG4临界值为1.3~1.44 g/L时亚组分析结果

2.4发表偏倚检测 分别对临界值为1.3~1.44 g/L时纳入的17篇文献及临界值为2.7~2.8 g/L时纳入的11篇文献检验是否存在发表偏倚,采用Deeks法进行漏斗图不对称检验,发现漏斗图对称,P值分别为0.532和0.38,故不存在发表偏倚,见图5。

2.5敏感性分析 采用逐一剔除所纳入的研究并重新进行合并的方法,观察各综合诊断效能的波动来评估结论的稳定性,结果无实质性改变,说明本研究结果稳定性好,见图6。

3 讨 论

IgG4相关性疾病为近年来新认识的一种自身免疫性疾病,可累及胰腺、胆管、涎腺、泪腺、肾脏、腹膜后组织等全身多个器官,临床表现缺乏特异性,易与其他疾病相混淆。尽管IgG4-RD的诊断金标准为组织病理检查,但由于病理检查的有创性以及部分器官如胰腺、腹膜后活检难度较大,从而限制了其临床大规模应用[23]。因此,血清IgG4检测在IgG4-RD的诊断过程中备受重视。然而,一些其他的疾病如自身免疫性疾病、恶性肿瘤、血管炎、淋巴瘤、多中心型Castleman病中也可出现IgG4升高,且部分IgG4-RD患者可能表现IgG4正常[24]。之前的研究多聚焦于IgG4对AIP与胰腺癌鉴别诊断的价值[25-26],鉴于此,本研究对血清IgG4对IgG4-RD的诊断价值进行Meta分析。

本研究共计纳入了17篇相关文献,计算得到IgG4对诊断IgG4-RD的汇总灵敏度为0.88,汇总特异度为0.89,DOR为62,SROC曲线的AUC也达到了0.95,表明血清IgG4检测有较高的准确性及较好的鉴别诊断价值。研究表明,血清IgG4的诊断特异度随临界值升高而升高,由美国风湿病学会(ACR) 及欧洲风湿病联盟(EULAR)提出的IgG4 相关性疾病分类标准建议,血清IgG4升高至2~5×ULN范围内得6分,而升高> 5×ULN得11分,结合其他标准评分后,当总分达20且可排除其他疾病,即可诊断IgG4-RD[27]。另外,AIP的国际诊断共识(ICDC)也将IgG4临界值>2×ULN列为1级证据[28]。我们也对临界值为2×ULN进行了分析,结果显示,尽管汇总特异度达到了0.96,但灵敏度同时降至0.59,AUC未出现明显变化,而DOR降至34,这说明将临界值提高并没有明显的诊断优势。

尽管我们尽可能纳入更多同质性研究,并同时避免选择偏倚,但各个研究之间仍表现出显著的异质性。本研究发现纳入文献之间并不存在阈值效应,因此,非阈值效应为此次分析中异质性的来源。本研究中亚组分析显示,不同地区、是否仅纳入AIP患者以及样本量大小都可能是异质性的来源。血清IgG4对亚洲患者诊断的整体敏感度及特异度高于欧美患者,由于一些研究并未准确区分AIP的亚型,这可能是由于欧美国家在对AIP患者研究中纳入较多2型AIP患者所致。与1型AIP不同,2型AIP少有血清IgG4升高,且更常见于西方国家[28],从而降低了IgG4的诊断性能。我们的结果也显示血清IgG4对IgG4-RD患者诊断性能优于仅包含AIP的患者组,这也验证了这一推断。另外,不同种族之间也会出现血清IgG4水平的差异,亚洲地区IgG4-RD患者IgG4阳性率明显高于欧美地区[29],另外有研究表明亚洲人及黑人血清基础IgG4水平高于白人,且差异有统计学意义[30]。IgG4-RD为系统性全身疾病,诊断标准众多,不同的诊断标准以及血清IgG4检测手段差异也可能是异质性来源。除此之外,各个研究的对照组依据不同的研究目的而招募不同的人群,这也可能是文献之间出现异质性的原因。

我们的研究也存在一些不足:①检索文献仅限于英语,会遗漏其他语种的高质量研究,在时间上我们选择检索2011年之后的文献,这是由于IgG4-RD仅在10年前才被正式提出,但这可能遗漏高质量的文献,造成选择偏倚;②尽管使用亚组分析寻找异质性来源,但一些亚组内仍存在较高异质性,由于纳入研究数目较少,未进一步寻找异质性来源。然而,由于不同诊断标准、IgG4检测手段、对照组设置等因素,异质性难以完全避免;③一些高质量的研究中血清IgG4水平以平均值的形式报道,无法提取四格表从而被排除,这可能影响最终的结果。

总之,我们的研究证明血清IgG4在IgG4-RD的诊断中具有较高的参考价值,相对于病理检查效率更高且更简便。然而由于地区、样本量以及疾病类型的影响,文献之间存在较大的异质性,仍需更多前瞻性高质量诊断试验进行验证,进一步证明IgG4的应用价值。

猜你喜欢

样本量异质性曲线
卡方检验的应用条件
Meta分析中的异质性检验
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
未来访谈:出版的第二增长曲线在哪里?
城市规模与主观幸福感——基于认知主体异质性的视角
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
家系抽样大小对云南松遗传力估算的影响
临床常见革兰阴性菌异质性耐药研究进展
基于可持续发展的异质性债务治理与制度完善
幸福曲线