AFP和DCP单项与联合检测对原发性肝癌诊断价值的Meta分析*
2021-11-26李玉霞田中华唐运祥
李玉霞,田中华,应 红,李 倩,唐运祥,李 维
重庆市急救医疗中心:1.核医学科;2.临床实验诊断中心,重庆 400014;3.重庆市中医院药剂科,重庆 400021
肝癌是我国常见的恶性肿瘤之一,其发病率位居恶性肿瘤第三位,5年生存率仅为14.1%[1-2],严重威胁国民的生命和健康。在原发性肝癌(PHC)中,肝细胞癌(HCC)是最主要的组织学分型,占PHC的70%~85%[3]。
早期筛查能明显降低肝癌的病死率[4]。我国《原发性肝癌诊疗规范(2017年版)》建议对肝癌高危人群至少每隔6个月进行一次筛查[3]。目前临床常用的血清学筛查指标主要为甲胎蛋白(AFP),但其单独应用的灵敏度和特异度并不十分理想,因此AFP被推荐与其他指标联合检测,以提高对PHC的诊断效能[5]。脱γ-羧基凝血酶原,又被称为维生素K缺乏或拮抗产生的异常蛋白,是由LIEBMAN等[6]首次发现的一种异常凝血酶原(DCP),其在HCC患者血清中异常升高,与HCC的发生、发展密切相关,是灵敏且特异的HCC血清学肿瘤标志物。目前,已有许多文献报道DCP单项检测或联合AFP检测可用于诊断HCC[7-15],但这些报道或多或少存在一定差异。因此,本研究通过Meta分析综合评价AFP和DCP单项与联合检测用于诊断PHC的价值,以期为临床应用提供参考。
1 材料与方法
1.1纳入标准 (1)研究对象为中国人群;(2)病理诊断(金标准)确诊的PHC患者为病例组,非PHC患者为对照组;(3)研究类型:国内外公开发表的关于DCP单项或联合AFP检测诊断PHC的诊断试验;(4)DCP检测方法为化学发光或电化学发光法;(5)能从文献中完整提取四格表数据[真阳性例数(TP)、假阳性例数(FP)、假阴性例数(FN)和真阴性例数(TN)]。
1.2排除标准 (1)研究对象同时合并其他恶性肿瘤,无法获取单独的肝癌数据;(2)研究对象为继发性肝癌患者,或仅为小肝癌,或经外科治疗后的肝癌,或AFP为低值或阴性的肝癌;(3)无法完整提取四格表数据;(4)动物、体外试验;(5)综述、病例报告、信件、会议论文、学位论文等。
1.3文献检索 检索数据库包括中国知网、万方医学数据库、维普中文数据库、PubMed、PML、Cochrane Library、Embase。检索年限为建库至2020年5月25日。语种限定为中文和英文。中文检索关键词(或缩写)包括:甲胎蛋白、异常凝血酶原、脱γ-羧基凝血酶原、AFP、DCP、PIVKA-Ⅱ、原发性肝癌、肝细胞癌。英文检索词包括:AFP、DCP、PIVKA-Ⅱ、alpha-fetoprotein、des-γ-carboxy-pmthrombin、des-gamma-carboxy-pmthrombin、protein induced by vitamin K absence or antagonist-Ⅱ、primary hepatocellular carcinoma、hepatic cell carcinoma。
1.4资料提取 由两位研究人员独立按照纳入和排除标准筛选文献并进行数据提取,若遇分歧,通过讨论或由第三位研究者决定。各研究信息包括文献的第一作者、发表时间、研究对象的种族、病例组及对照组的数量、临界值(cut-off值)、DCP的检测方法、诊断试验参数信息(包括TP、FP、TN、FN、灵敏度和特异度)。
1.5文献质量评价 利用诊断性研究质量评价量表(QUADAS)进行文献质量评价[16],分别对14个条目按“是”“否”或“不清楚”3个判断标准逐一进行评价。由两位研究人员独立进行文献质量评价,若有异议,通过讨论或由第三位研究者决定。
1.6统计学处理 利用Meta-DiSc1.4软件和Stata15.0软件进行统计学处理,内容包括:异质性检验、Spearman相关分析、发表偏倚、汇总灵敏度、汇总特异度以及汇总受试者工作特征(SROC)曲线等。若存在异质性,则采用随机效应模型对效应指标进行加权定量合并,反之则采用固定效应模型。通过Z检验分析AFP、DCP单项检测以及两者联合检测的曲线下面积(AUC)的差异。以P<0.05为差异有统计学意义。
2 结 果
2.1文献检索和资料提取 根据关键词初步检索出652篇中英文文献。根据纳入与排除标准最终确定纳入45篇文献,包括中文文献40篇,英文文献5篇。文献筛选及纳入过程见图1。所纳入的文献中共有34篇将AFP与DCP联合检测作为诊断指标。纳入文献中病例组共5 762例,对照组共8 426例。纳入文献的基本特征见表1。
表1 纳入文献的基本特征
图1 文献筛选及纳入过程
2.2纳入文献的质量评价 所有纳入文献均经过QUADAS标准评估,汇总质量评价结果如下,(1)文献变异来源:在关于变异的两个条目(条目1、2)的评价中,对于条目1“病例谱是否包含了各种病例及易混淆的疾病病例 ”持“是”回答的符合率为48.9%(22/45),表明纳入的文献存在疾病谱偏倚;对于条目2“是否清晰明确地描述了研究对象的纳入标准”持“是”回答的符合率为95.6%(43/45),表明纳入文献的纳入与排除标准的描述符合标准。(2)文献偏倚来源:有关偏倚的9个条目(条目3~7、10~12、14)中,对于条目4“ 金标准和待评价试验检测的间隔时间是否足够短,以避免出现疾病病情的变化”持“是”回答的符合率为33.3%(15/45);对于条目10“待评价试验的结果判读是否在不知晓金标准试验结果的情况下进行”和条目14“ 对退出研究的病例是否进行解释”均未持肯定回答。表明纳入的文献存在文献偏倚。其他条目持“是”回答的符合率均>95%。(3)报告质量评估:在报告质量的3个条目(条目8、9、13)中,对条目8“待评价试验的操作是否描述得足够清楚且可进行重复”和条目9“金标准试验的操作是否描述得足够清楚且可以进行重复”持“是”回答的符合率为97.8%(44/45);而对于条目13“是否报告了难以解释的中间试验结果”持“否”的符合率为100%,表明纳入文献均未报道难以解释的中间试验结果。
续表1 纳入文献的基本特征
2.3异质性检验
2.3.1阈值效应 通过计算Spearman相关系数r来判断有无阈值效应。通过Meta-DiSc1.4软件计算可得,AFP单项检测时,r=0.363,P=0.012;DCP单项检测时,r=0.004,P=0.978;AFP和DCP联合检测时,r=0.306,P=0.078。由此可知,AFP单项检测时,存在阈值效应(P<0.05),而DCP单项检测与AFP和DCP联合检测均不存在阈值效应(P>0.05)。
2.3.2非阈值效应异质性 利用Q统计量检验和I2对纳入研究因非阈值效应引起的异质性进行检验。通过Meta-DiSc1.4软件计算可得,AFP单项检测时,I2=86.8%,P<0.001,DCP单项检测时,I2=87.5%,P<0.001,AFP、DCP联合检测时,I2=79.6%,P<0.001。由此可见,AFP、DCP无论是单项检测,还是二者联合检测,Q统计量检验的I2均>50%,P均<0.05,由此可认为纳入的研究存在异质性。进一步通过Meta回归分析法分析非阈值效应可能的异质性来源。以病例组人数差异为例,分别以病例组人数80、100、150和200为截点进行Meta回归分析,结果显示每个人数截点的P均>0.05,提示病例组人数差异不是非阈值效应异质性的来源。
2.4发表偏倚 采用Stata15.0软件对纳入文献进行Egger检验并绘制漏斗图,结果显示纳入研究呈不对称性分布,且PDCP<0.01,PAFP<0.01,PDCP+AFP<0.01,表明差异有统计学意义,提示存在发表偏倚。
2.5合并效应量 由前文可知,AFP、DCP单项检测,AFP和DCP联合检测均存在异质性,故采用随机效应模型合并效应量进行统计分析。分析结果显示,AFP单项检测汇总的灵敏度、特异度、诊断比值比(DOR)分别为0.67(95%CI:0.66~0.69)、0.82(95%CI:0.81~0.83)、11.58(95%CI:9.02~14.86);DCP单项检测汇总的灵敏度、特异度、DOR为0.76(95%CI:0.75~0.77)、0.87(95%CI:0.86~0.88)、29.07(95%CI:21.86~38.64);AFP和DCP联合检测汇总的灵敏度、特异度、DOR为0.85(95%CI:0.84~0.86)、0.79(95%CI:0.78~0.80)、30.03(95%CI:22.09~40.82)。见表2。
表2 AFP、DCP单项和AFP联合DCP诊断PHC的合并效应量
2.63种诊断方法诊断准确性的比较 由表2可知,AFP单项检测的AUC和SE分别为0.82、0.01;DCP单项检测的AUC和SE分别为0.89、0.01;AFP和DCP联合检测的AUC和SE分别为0.92、0.01。Z检验显示AFP和DCP单项检测的AUC间差异有统计学意义(Z=3.96,P<0.05);AFP和AFP与DCP联合检测的AUC间差异有统计学意义(Z=6.15,P<0.05);DCP和AFP与DCP联合检测的AUC间差异无统计学意义(Z=1.88,P>0.05)。
3 讨 论
AFP长久以来是临床应用最广泛的诊断PHC的血清学肿瘤标志物,但其单独应用的灵敏度和特异度并不十分理想,尤其是在某些AFP阴性的PHC患者中存在一定的漏诊率[55]。DCP在PHC患者的血清中阳性率较高,有研究显示DCP对PHC的诊断具有较高的特异度[56],很多研究显示DCP作为单一的诊断PHC的标志物要优于AFP[8,11,44,54]。
目前认为对于存在明显异质性的诊断性试验,与汇总灵敏度和特异度相比,SROC和AUC是比较合理的Meta分析指标,SROC和AUC均不是单纯强调灵敏度或特异度[57]。有研究表明即使是在异质性比较明显的情况下,因异质性引起的AUC的偏差也小于6%,这说明在异质性试验中,AUC具有较高的检验效能[58]。对于诊断性试验而言,AUC越大,诊断准确性越高。当AUC<0.5时无诊断价值,AUC>0.9时诊断准确性最高[59]。本研究结果显示,AFP、DCP单项检测的AUC分别为0.82、0.89,表明其具有较高的诊断准确性,且Z检验显示两者间的差异有统计学意义(P<0.05),说明对于PHC的诊断,DCP单项检测较AFP有更好的诊断准确性;而AFP和DCP联合检测的AUC为0.92,且Z检验显示AFP和DCP联合检测与AFP单项检测的AUC间差异有统计学意义(P<0.05),提示联合检测血清AFP和DCP能显著提高对PHC的诊断准确性。AFP和DCP联合检测与DCP单项检测的AUC经Z检验显示差异无统计学意义(P>0.05),尚不足以说明AFP和DCP联合检测对PHC诊断的准确性优于DCP单项检测。
当然,本研究仍然存在一定的局限性。首先,纳入的所有研究均为回顾性研究,这可能增加典型病例的曝光率。其次,纳入研究的对照组构成不一,有的仅为体检健康者,有的还包括了良性肝病和/或非肝癌的其他恶性肿瘤,这也可能是引起异质性的原因之一。因此,还需进一步纳入更高质量、更大样本量的文献来验证本研究的结论。