APP下载

应用血肌酸激酶或肌酸激酶MM同工酶筛查新生儿杜氏肌营养不良症的系统评价/Meta分析

2022-11-29陈晓晴谭伟强程浣彤綦向军

中国循证儿科杂志 2022年5期
关键词:截断值样本量异质性

唐 亮 陈晓晴 谭伟强 程浣彤 綦向军

杜氏肌营养不良(DMD)是一种X连锁隐性遗传的进行性、致死性神经肌肉疾病,发病率为1/(3 500~5 000)活产男婴[1]。该病由编码抗肌萎缩蛋白的DMD基因突变所致,女性多为携带者,男性患儿通常在2~3岁隐匿起病, 15岁左右丧失行走能力,30岁前因呼吸或心力衰竭而死亡[2]。

由于DMD起病隐匿,其临床诊断通常延迟。既往由于对DMD缺乏有效的治疗方法,使得新生儿DMD筛查的意义难以体现。近年来,分子生物学技术的发展使基因治疗成为DMD最有希望的疗法,目前已有多种基因治疗药物获批临床应用或进入临床试验[3-5]。在新生儿期进行DMD筛查,有利于早期诊断及个体化精准治疗,延缓疾病进展,改善预后。同时,随着我国生育政策的调整,早期筛查有利于遗传咨询和优生优育,减少DMD患儿的出生。DMD患儿血液中CK显著升高是早期重要的生化改变[6]。1975年至2011年,全球10个DMD筛查项目共筛查了180多万名新生儿,以滤纸干血片样本CK值为筛查指标,以基因检测或肌肉活检为诊断金标准,确诊344例DMD患儿,患病率约为1/5 000[7,8]。近年研究发现CK-MM 在新生儿DMD筛查中具有更高的特异度[6]。2019年12月美国FDA批准了 Perkin Elmer公司的GSP血清CK-MM 试剂盒用于新生儿DMD筛查,目前国内外已逐渐开展相关的研究工作[6,9-11]。

目前仅见1篇采用CK筛查新生儿DMD的系统评价/Meta分析[12],尚无采用CK-MM筛查新生儿DMD的系统评价。本文检索国内外数据库,系统评价以CK或CK-MM筛查新生儿DMD的准确性,为完善筛查方法、提高筛查准确性提供证据。

1 方法

1.1 PIROS的构建 P:新生儿,I:血CK或CK-MM,R:基因检测或肌肉病理,O:诊断参数,S:诊断准确性研究。

1.2 检索策略

1.2.1 检索数据库 Medline(PubMed)、Embase、Cochrane Library、Web of Science、Scopus、中国知网数据库、中国生物医学文献数据库、万方数据库和维普中文期刊全文数据库。

1.2.2 检索起止时间 检索起始时间均为1975年1月1日,Medline(PubMed)检索截止时间为2022 年 11 月5日,其他中英文数据库检索截止时间为2022年10月5日。

1.2.3 中英文不同数据库检索式及截屏 见本文附件1(http://www.cjebp.net/CN/10.3969/j.issn.1673-5501.2022.05.004)。

1.3 文献筛选 NoteExpress软件去除不同数据库重复文献。①初筛:由唐亮、谭伟强分别阅读文题和摘要筛选,排除无摘要的论文、学位论文、会议摘要、传统综述(不包括系统评价/Meta分析)、病例报告、流行病学调查以及与选题明显不相关的文献。②复筛:由唐亮、谭伟强对经过初筛后可能符合纳入标准的、已公开发表的文献阅读全文筛选,排除无法获取全文、全文非中文和英文、与主题不相关的文献和不能提取诊断准确性研究四格表数据的文献,重复发表的文献选择数据最全、最近更新的文献。③人工筛选:追溯相关系统评价/Meta分析及纳入研究的参考文献。

1.4 资料提取 由唐亮、谭伟强提取文献数据,提取内容包括文题、发表年份、研究起止时间、国家、筛查方法(CK或CK-MM)及其截断值、筛查人群、筛查年龄、样本量、诊断金标准、真阳性(TP)例数、假阳性(FP)例数、真阴性(TN)例数、假阴性(FN)例数。

1.5 文献偏倚风险和临床适用性评价 采用 QUADAS-2评价工具[13],从4个领域的11个条目对纳入文献按“是”、“否”和“不确定”进行评价。4个领域中≥3个低风险(LR)和高风险(HR)分别为高质量和低质量,2个LR+1个HR即为低质量,2个LR+2个不确定(UR)即为中等质量,1个LR+3个UR或 4个UR即为低质量。

1.6 统计学分析 应用Stata 15.0和Meta-Disc 1.4软件进行统计分析。异质性检验采用I2检验,I2>50%认为异质性较大,行阈值效应及非阈值效应检测,若为阈值效应引起异质性,则绘制综合受试者工作特征曲线(SROC)并计算AUC;若为非阈值效应引起异质性,则通过Meta回归分析及亚组分析探寻潜在的异质性来源,并采用随机效应模型合并敏感度、特异度、阳性似然比(PLR)、阴性似然比(NLR)、诊断比值比(DOR)、AUC和Q指数值。≥10篇文献则通过Deeks漏斗图进行发表偏倚检验,当P<0.05 时,认为存在显著的发表偏倚。

2 结果

2.1 文献筛选流程及结果 图1显示,共检索到229篇相关文献,人工筛选到2篇文献,共计231篇。剔除重复文献115篇,并经过阅读文题和摘要排除89篇,27篇进入全文阅读,其中11篇被排除,最终纳入16篇文献。其中CK-MM筛查文献5篇[14-18],CK筛查文献11篇[19-29]。

图1 文献筛查流程及结果

2.2 纳入文献一般特征

2.2.1 CK-MM 表1显示,5篇文献[14-18]发表于2020至2022年,中文和英文分别为2篇[17,18]和3篇[14-16];中国4篇(大陆3篇[14,17,18],台湾1篇[15]),美国1篇[16]。3篇[14-16]筛查人群为新生儿,2篇[17,18]为新生男婴;共筛查156 547例;CK-MM初筛截断值均≥500 ng·mL-1,1篇[16]设置了不同年龄区间动态值,1篇[15]考虑了胎龄因素;诊断金标准均为基因检测,真阳性15例,假阳性45例,假阴性0例,真阴性156 487例。

表1 DMD筛查纳入文献一般特征

2.2.2 CK 表1显示,11篇[19-29]文献发表于1979至2015年,中文和英文分别为1篇[19]和10篇[20-29];英国[20,28]、美国[21,25]各2篇(其中1篇为与巴西合作的多中心研究),加拿大[24]、法国[26]、德国[27]、比利时[22]、新西兰[29]、塞浦路斯[23]、中国[19]各1篇。共筛查1 351 953例,以新生男婴为主;CK截断值168 ~750 U·L-1;9篇文献筛查年龄在生后1~8 d,1篇[19]在生后即刻采集脐血,1篇在生后4~6周[27];诊断金标准为基因检测或肌肉活检;真阳性238例(单纯基因检测[19,21]6例、单纯肌肉活检[28,29]2例、基因检测或肌肉活检[20,22-27]230例),假阳性1 257例,假阴性18例,真阴性1 350 440例。

2.3 文献偏倚风险及临床适用性评价 病例选择(领域1)中12.5%的文献UR,87.5%的文献LR,临床适用性高。待评价试验(领域2)中37.5%的文献UR,62.5%的文献LR,临床适用性高。金标准(领域3)中,38%的文献LR,62%的文献UR,临床适用性较高。病例流程和进展(领域4)中,100%的文献LR。评价表见本文附件2(http://www.cjebp.net/CN/10.3969/j.issn.1673-5501.2022.05.004)。

2.4 CK-MM筛查新生儿DMD的Meta分析 基于5项CK-MM筛查新生儿DMD研究[14-18]的敏感度对数与(1-特异度)对数的Spearman相关系数为-0.158,P=0.800,提示不存在阈值效应;Cochran’s Q=3.21,P=0.523 9,提示不存在非阈值效应引起的异质性。采用固定效应模型进行Meta分析,图2A和B显示,敏感度100%(95%CI:100%~100%),I2=0,P=1.00;特异度100%(95%CI:100%~100%),I2=93.92%,P=0.00;PLR 3 925(95%CI: 3 925~3 925),I2=85.40%,P=0.00;NLR 0.00(95%CI:0.00~0.00),I2=99.84%,P=0.00;DOR 23 094(95%CI:5 773~92 384);图2C显示,AUC为0.925 2, Q指数为0.859 4。

图2 CK-MM筛查DMD的诊断参数

2.5 CK筛查DMD的Meta分析 基于11项CK筛查DMD的研究[19-29]敏感度对数与(1-特异度)对数的Spearman相关系数为 -0.187,P=0.581,提示不存在阈值效应;Cochran’s Q=49.14,P=0.00,提示存在非阈值效应引起的异质性。采用随机效应模型进行Meta分析,图3A和B显示,敏感度97%(95%CI:88%~99%),I2=45.7%,P=0.05;特异度100%(95%CI:100%~100%),I2=99.88%,P=0.00;PLR 1 131(95%CI:370~3 456),I2=98.9%,P=0.00;NLR 0.01(95%CI:0.00~0.19),I2=44.8%,P=0.05;DOR 16 476 (95%CI:4 115~65 963)。图3C显示,AUC为0.995 4,Q指数为0.974 0。

图3 CK筛查DMD的诊断参数

采用单变量Meta回归方式从可能影响异质性的因素(样本量、确诊的金标准、筛查人群、研究对象所处的地区、筛查时间、截断值)中寻找潜在的异质性来源,为避免漏掉重要影响因素,将检验水准α放宽至0.1,表2显示,样本量为异质性的因素(P=0.027 4),确诊的金标准(P=0.058 5)及筛查人群(P=0.086 2)为可能的异质性因素。

表2 CK筛查新生儿DMD研究Meta回归分析结果

行亚组分析,表3显示,在11项研究中,样本量亚组的界点分别设为5万和10万时,其中的大样本(>5万和>10万)的异质性均高过小样本(≤5万和≤10万),且有明显的异质性;金标准为基因检测异质性为0,肌肉活检可能存在异质性,基因检测或肌肉活检混合存在异质性;筛查人群为男婴有明显的异质性。

表3 CK筛查新生儿DMD研究亚组分析结果

图6显示,采用Deeks漏斗图对所纳入研究的发表偏倚进行检验,结果提示发表偏倚可能性小(P=0.12)。

图6 Deeks漏斗图检验

3 讨论

DMD基因突变可引起肌肉发生炎症和萎缩,导致CK从破坏的肌肉组织中渗漏入血液,使血清CK水平显著升高,所以CK检测一直被视为新生儿DMD筛查的重要指标[30]。本文针对CK筛查新生儿DMD的诊断试验研究进行系统评价及Meta分析,共纳入 11篇文献,发表偏倚小。Meta分析结果显示,敏感度97%(95%CI:88%~99%),特异度100%(95%CI:100%~100%),具有良好的检测效能。似然比能全面反映诊断试验的诊断价值,比敏感度和特异度更稳定,且不受患病率的影响[31]。PLR>10或NLR<0.1表示准确性高,本文Meta分析结果显示,每个研究的PLR均>10,合并PLR为1 131(95%CI:370~3 456),表明筛查结果阳性时为真阳性的概率大;合并NLR为0.01(95%CI:0.00~0.19),表明试验结果阴性时为真阴性的概率大;逐篇分析11篇文献发现,9篇[20-27, 29]NLR<0.2,准确性较高,样本量最小的2篇[19, 28]NLR为0.25,准确性一般。AUC越接近1.0,其诊断价值越高,本研究的AUC为0.995 4,Q指数为0.974 0,说明以CK为检测指标筛查新生儿DMD具有很高的准确性。

尽管CK筛查新生儿DMD的诊断参数优秀,但特异度和PLR均具有高异质性,Meta回归分析提示异质性来源为样本量,可能的异质性还包括金标准及筛查人群。

亚组分析结果显示,样本量亚组的界点分别设为5万和10万,大样本组的异质性均高于小样本组。有研究发现以I2为代表的“异质性检验”在方法学上可能存在缺陷,当纳入Meta分析的文献数量和样本量大幅增加时,I2值也稳步增加,提示I2可能仅适用于小样本量试验的异质性检验,当样本量和文献数量大幅增加时不适用[32]。

亚组分析结果也显示,金标准为可能的异质性因素,金标准为基因检测或肌肉活检混合有明显的异质性,单纯基因检测没有异质性,提示同一研究应采用同一金标准,并且诊断金标准并非固定不变,随着对疾病认识和诊断技术的进步,基因检测已逐渐替代有创的肌肉活检,成为DMD诊治指南中最新的金标准[33]。亚组分析结果还显示,筛查人群为可能的异质性因素,单纯筛查男婴组具有较高的异质性,提示今后的筛查工作应考虑开展普筛,既要确诊男性患儿,还要筛查出女性携带者[34]。

CK截断值的划分将直接影响敏感度和特异度,截断值的设置要考虑患病率因素,对于DMD截断值偏低可导致假阳性率较高,而选择较高的截断值则可能导致假阴性率高,出现漏检。Mendell等[21]研究采用600 U·L-1、750 U·L-1的高截断值,也出现较高的假阳性率;而Moat等[20]研究设置较低的截断值(250 U·L-1),结果也出现了较高的假阴性率,提示CK检测值与DMD之间的关系尚无明确标准。本文纳入的11项研究中CK筛查新生儿DMD的截断值范围168~750 U·L-1,非常宽泛。应通过权衡假阳性和假阴性造成的后果,选择合适的截断值,并优化、完善筛查模型,提高筛查准确度,以达到筛查新生儿DMD的临床需要。

CK-MM是CK在骨骼肌中存在的主要同工酶形式,其作为骨骼肌损伤的指标更具有特异性[6]。本文纳入的5篇[14-18]CK-MM筛查新生儿DMD的文献中,金标准均为基因检测,其中4篇[14-17]采用的是Perkin Elmer公司的GSP血清CK-MM 试剂盒,结果显示没有阈值效应和非阈值效应,合并敏感度和特异度均为100%,PLR为3 926>10,NLR为0.00<0.1,AUC为0.925 2, Q指数为0.859 4,提示CK-MM用于新生儿DMD筛查具有很高的准确性。

5篇文献均未报告假阴性,考虑研究起始时间为2019至2021年,而DMD通常2~3岁隐匿起病,可能随访时间尚不足。

本文的局限性: ①只纳入中英文文献;②各研究间样本量差别大;③阴性检测样本缺乏足够随访,导致研究的假阴性率可能被低估;④各研究间截断值不统一,部分未报告截断点的选择方法并说明其合理性;⑤未对筛查试验在临床应用后是否会改善临床结局进行评价;⑥未评估医生和父母对“新生儿DMD筛查”的态度以及假阳性对家庭心理因素的影响。

猜你喜欢

截断值样本量异质性
医学研究中样本量的选择
基于可持续发展的异质性债务治理与制度完善
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure
异常糖链糖蛋白不同截断值排查肺癌的作用分析
海南省新生儿先天性甲状腺功能减低症流行病学特征及促甲状腺激素筛查截断值的设定
航空装备测试性试验样本量确定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
现代社区异质性的变迁与启示
论连分数的应用
1949年前译本的民族性和异质性追考