AFP和DCP单项与联合检测对原发性肝癌诊断价值的Meta分析*

2021-11-26李玉霞田中华唐运祥

国际检验医学杂志 2021年22期

李玉霞，田中华，应红，李倩，唐运祥，李维

重庆市急救医疗中心：1.核医学科；2.临床实验诊断中心，重庆 400014；3.重庆市中医院药剂科，重庆 400021

肝癌是我国常见的恶性肿瘤之一，其发病率位居恶性肿瘤第三位，5年生存率仅为14.1%[1-2]，严重威胁国民的生命和健康。在原发性肝癌(PHC)中，肝细胞癌(HCC)是最主要的组织学分型，占PHC的70%～85%[3]。

早期筛查能明显降低肝癌的病死率[4]。我国《原发性肝癌诊疗规范(2017年版)》建议对肝癌高危人群至少每隔6个月进行一次筛查[3]。目前临床常用的血清学筛查指标主要为甲胎蛋白(AFP)，但其单独应用的灵敏度和特异度并不十分理想，因此AFP被推荐与其他指标联合检测，以提高对PHC的诊断效能[5]。脱γ-羧基凝血酶原，又被称为维生素K缺乏或拮抗产生的异常蛋白，是由LIEBMAN等[6]首次发现的一种异常凝血酶原(DCP)，其在HCC患者血清中异常升高，与HCC的发生、发展密切相关，是灵敏且特异的HCC血清学肿瘤标志物。目前，已有许多文献报道DCP单项检测或联合AFP检测可用于诊断HCC[7-15]，但这些报道或多或少存在一定差异。因此，本研究通过Meta分析综合评价AFP和DCP单项与联合检测用于诊断PHC的价值，以期为临床应用提供参考。

1 材料与方法

1.1纳入标准 (1)研究对象为中国人群；(2)病理诊断(金标准)确诊的PHC患者为病例组，非PHC患者为对照组；(3)研究类型：国内外公开发表的关于DCP单项或联合AFP检测诊断PHC的诊断试验；(4)DCP检测方法为化学发光或电化学发光法；(5)能从文献中完整提取四格表数据[真阳性例数(TP)、假阳性例数(FP)、假阴性例数(FN)和真阴性例数(TN)]。

1.2排除标准 (1)研究对象同时合并其他恶性肿瘤，无法获取单独的肝癌数据；(2)研究对象为继发性肝癌患者，或仅为小肝癌，或经外科治疗后的肝癌，或AFP为低值或阴性的肝癌；(3)无法完整提取四格表数据；(4)动物、体外试验；(5)综述、病例报告、信件、会议论文、学位论文等。

1.3文献检索检索数据库包括中国知网、万方医学数据库、维普中文数据库、PubMed、PML、Cochrane Library、Embase。检索年限为建库至2020年5月25日。语种限定为中文和英文。中文检索关键词(或缩写)包括：甲胎蛋白、异常凝血酶原、脱γ-羧基凝血酶原、AFP、DCP、PIVKA-Ⅱ、原发性肝癌、肝细胞癌。英文检索词包括：AFP、DCP、PIVKA-Ⅱ、alpha-fetoprotein、des-γ-carboxy-pmthrombin、des-gamma-carboxy-pmthrombin、protein induced by vitamin K absence or antagonist-Ⅱ、primary hepatocellular carcinoma、hepatic cell carcinoma。

1.4资料提取由两位研究人员独立按照纳入和排除标准筛选文献并进行数据提取，若遇分歧，通过讨论或由第三位研究者决定。各研究信息包括文献的第一作者、发表时间、研究对象的种族、病例组及对照组的数量、临界值(cut-off值)、DCP的检测方法、诊断试验参数信息(包括TP、FP、TN、FN、灵敏度和特异度)。

1.5文献质量评价利用诊断性研究质量评价量表(QUADAS)进行文献质量评价[16]，分别对14个条目按“是”“否”或“不清楚”3个判断标准逐一进行评价。由两位研究人员独立进行文献质量评价，若有异议，通过讨论或由第三位研究者决定。

1.6统计学处理利用Meta-DiSc1.4软件和Stata15.0软件进行统计学处理，内容包括：异质性检验、Spearman相关分析、发表偏倚、汇总灵敏度、汇总特异度以及汇总受试者工作特征(SROC)曲线等。若存在异质性，则采用随机效应模型对效应指标进行加权定量合并，反之则采用固定效应模型。通过Z检验分析AFP、DCP单项检测以及两者联合检测的曲线下面积(AUC)的差异。以P<0.05为差异有统计学意义。

2 结果

2.1文献检索和资料提取根据关键词初步检索出652篇中英文文献。根据纳入与排除标准最终确定纳入45篇文献，包括中文文献40篇，英文文献5篇。文献筛选及纳入过程见图1。所纳入的文献中共有34篇将AFP与DCP联合检测作为诊断指标。纳入文献中病例组共5 762例，对照组共8 426例。纳入文献的基本特征见表1。

表1 纳入文献的基本特征

图1 文献筛选及纳入过程

2.2纳入文献的质量评价所有纳入文献均经过QUADAS标准评估，汇总质量评价结果如下，(1)文献变异来源：在关于变异的两个条目(条目1、2)的评价中，对于条目1“病例谱是否包含了各种病例及易混淆的疾病病例 ”持“是”回答的符合率为48.9%(22/45)，表明纳入的文献存在疾病谱偏倚；对于条目2“是否清晰明确地描述了研究对象的纳入标准”持“是”回答的符合率为95.6%(43/45)，表明纳入文献的纳入与排除标准的描述符合标准。(2)文献偏倚来源：有关偏倚的9个条目(条目3～7、10～12、14)中，对于条目4“ 金标准和待评价试验检测的间隔时间是否足够短，以避免出现疾病病情的变化”持“是”回答的符合率为33.3%(15/45)；对于条目10“待评价试验的结果判读是否在不知晓金标准试验结果的情况下进行”和条目14“ 对退出研究的病例是否进行解释”均未持肯定回答。表明纳入的文献存在文献偏倚。其他条目持“是”回答的符合率均>95%。(3)报告质量评估：在报告质量的3个条目(条目8、9、13)中，对条目8“待评价试验的操作是否描述得足够清楚且可进行重复”和条目9“金标准试验的操作是否描述得足够清楚且可以进行重复”持“是”回答的符合率为97.8%(44/45)；而对于条目13“是否报告了难以解释的中间试验结果”持“否”的符合率为100%，表明纳入文献均未报道难以解释的中间试验结果。

续表1 纳入文献的基本特征

2.3异质性检验

2.3.1阈值效应通过计算Spearman相关系数r来判断有无阈值效应。通过Meta-DiSc1.4软件计算可得，AFP单项检测时，r=0.363，P=0.012；DCP单项检测时，r=0.004，P=0.978；AFP和DCP联合检测时，r=0.306，P=0.078。由此可知，AFP单项检测时，存在阈值效应(P<0.05)，而DCP单项检测与AFP和DCP联合检测均不存在阈值效应(P>0.05)。

2.3.2非阈值效应异质性利用Q统计量检验和I2对纳入研究因非阈值效应引起的异质性进行检验。通过Meta-DiSc1.4软件计算可得，AFP单项检测时，I2=86.8%，P<0.001，DCP单项检测时，I2=87.5%，P<0.001，AFP、DCP联合检测时，I2=79.6%，P<0.001。由此可见，AFP、DCP无论是单项检测，还是二者联合检测，Q统计量检验的I2均>50%，P均<0.05，由此可认为纳入的研究存在异质性。进一步通过Meta回归分析法分析非阈值效应可能的异质性来源。以病例组人数差异为例，分别以病例组人数80、100、150和200为截点进行Meta回归分析，结果显示每个人数截点的P均>0.05，提示病例组人数差异不是非阈值效应异质性的来源。

2.4发表偏倚采用Stata15.0软件对纳入文献进行Egger检验并绘制漏斗图，结果显示纳入研究呈不对称性分布，且PDCP<0.01，PAFP<0.01，PDCP+AFP<0.01，表明差异有统计学意义，提示存在发表偏倚。

2.5合并效应量由前文可知，AFP、DCP单项检测，AFP和DCP联合检测均存在异质性，故采用随机效应模型合并效应量进行统计分析。分析结果显示，AFP单项检测汇总的灵敏度、特异度、诊断比值比(DOR)分别为0.67(95%CI：0.66～0.69)、0.82(95%CI：0.81～0.83)、11.58(95%CI：9.02～14.86)；DCP单项检测汇总的灵敏度、特异度、DOR为0.76(95%CI：0.75～0.77)、0.87(95%CI：0.86～0.88)、29.07(95%CI：21.86～38.64)；AFP和DCP联合检测汇总的灵敏度、特异度、DOR为0.85(95%CI：0.84～0.86)、0.79(95%CI：0.78～0.80)、30.03(95%CI：22.09～40.82)。见表2。

表2 AFP、DCP单项和AFP联合DCP诊断PHC的合并效应量

2.63种诊断方法诊断准确性的比较由表2可知，AFP单项检测的AUC和SE分别为0.82、0.01；DCP单项检测的AUC和SE分别为0.89、0.01；AFP和DCP联合检测的AUC和SE分别为0.92、0.01。Z检验显示AFP和DCP单项检测的AUC间差异有统计学意义(Z=3.96，P<0.05)；AFP和AFP与DCP联合检测的AUC间差异有统计学意义(Z=6.15，P<0.05)；DCP和AFP与DCP联合检测的AUC间差异无统计学意义(Z=1.88，P>0.05)。

3 讨论

AFP长久以来是临床应用最广泛的诊断PHC的血清学肿瘤标志物，但其单独应用的灵敏度和特异度并不十分理想，尤其是在某些AFP阴性的PHC患者中存在一定的漏诊率[55]。DCP在PHC患者的血清中阳性率较高，有研究显示DCP对PHC的诊断具有较高的特异度[56]，很多研究显示DCP作为单一的诊断PHC的标志物要优于AFP[8,11,44,54]。

目前认为对于存在明显异质性的诊断性试验，与汇总灵敏度和特异度相比，SROC和AUC是比较合理的Meta分析指标，SROC和AUC均不是单纯强调灵敏度或特异度[57]。有研究表明即使是在异质性比较明显的情况下，因异质性引起的AUC的偏差也小于6%，这说明在异质性试验中，AUC具有较高的检验效能[58]。对于诊断性试验而言，AUC越大，诊断准确性越高。当AUC<0.5时无诊断价值，AUC>0.9时诊断准确性最高[59]。本研究结果显示，AFP、DCP单项检测的AUC分别为0.82、0.89，表明其具有较高的诊断准确性，且Z检验显示两者间的差异有统计学意义(P<0.05)，说明对于PHC的诊断，DCP单项检测较AFP有更好的诊断准确性；而AFP和DCP联合检测的AUC为0.92，且Z检验显示AFP和DCP联合检测与AFP单项检测的AUC间差异有统计学意义(P<0.05)，提示联合检测血清AFP和DCP能显著提高对PHC的诊断准确性。AFP和DCP联合检测与DCP单项检测的AUC经Z检验显示差异无统计学意义(P>0.05)，尚不足以说明AFP和DCP联合检测对PHC诊断的准确性优于DCP单项检测。

当然，本研究仍然存在一定的局限性。首先，纳入的所有研究均为回顾性研究，这可能增加典型病例的曝光率。其次，纳入研究的对照组构成不一，有的仅为体检健康者，有的还包括了良性肝病和/或非肝癌的其他恶性肿瘤，这也可能是引起异质性的原因之一。因此，还需进一步纳入更高质量、更大样本量的文献来验证本研究的结论。