可溶性fms样酪氨酸激酶-1与急性胰腺炎早期严重程度预测价值的系统评价和meta分析
2020-08-11吕永才姚燕华雷静静徐菁霞
吕永才,姚燕华,雷静静,徐菁霞
吕永才,贵州医科大学 贵州省贵阳市 550004
姚燕华,雷静静,徐菁霞,贵州医科大学附属白云医院消化内科 贵州省贵阳市 550014
0 引言
急性胰腺炎(acute pancreatitis,AP)是胰腺一种炎症性疾病,是胃肠科住院病人主要疾病之一[1,2].在我国,胆石症、高甘油三脂血症是AP最主要的原因[3].在全球,每年AP的发病率约为(13-45/100000)人,死亡率约5%-10%[3-5].然而约70%-80%的AP为轻症急性胰腺炎(mild acute pancreatitis,MAP),临床上只需适宜液体复苏、疼痛控制和早期经口肠内营养等对症治疗后症状会迅速改善,且其病情常为自限性.但约20%-30%的AP会经历临床风险,死亡率会更高,约30%-50%,是胃肠科住院病人死亡较常见病因之一[5].故AP的严重程度变化范围很大,可从低死亡MAP转变为高死亡的中重症急性胰腺炎(moderately severe acute pancreatitis,MSAP)、重症急性胰腺炎(severe acute pancreatitis,SAP).为了早期识别AP的严重程度,临床上已出现多种临床预测方法,包括1992年、2012年亚特兰大分类及基于决定因素分类,而多国根据本国病例特点在此基础上制定了AP早期严重程度的预测方法,以协助临床早期识别AP的严重程性,但以上各种方法都有一定的缺陷性,比如2012年亚特兰大分类、基于决定因素分类需明确AP的严重程度可能需要48 h,甚至72 h,或是需行高额的影像学检查协助早期分类,这对于如高脂血症、酒精性等MAP可能导致医疗花费的增加和浪费[6-9];而Ranson评分、急性生理慢性健康评分及C-反应蛋白等均存在检测滞后性或复杂性等,导致其在识别AP早期严重程度应用受限[10,11],故临床上一个新的预测指标成为了迫切的需要.
Fms样酪氨酸激酶受体由七个胞外免疫球蛋白同源结构域、一个跨膜区和一个被激酶插入结构域中断的细胞内酪氨酸激酶序列组成,该受体对血管内皮生长因子-A、血管内皮生长因子-B和胎盘生长因子具有高的结合力,其前信使核糖核酸选择性剪接导致可溶性fms样酪氨酸激酶受体(soluble fms-like tyrosine 1,sFlt-1)产生,sFlt-1作为血管内皮生长因子和胎盘生长因子的诱饵受体,参与很多疾病的发生发展,包括AP.自从学者们报道报道血管渗漏综合征参与AP重症化机制以来,相关的血管内皮生长因子及其受体成为学者们研究热点,其中血管生成素2、sFlt-1研究最广,许多研究表明sFlt-1可预测AP早期的严重性[12-18].但临床上sFlt-1对AP早期严重程度的预测价值缺乏统一的检测临界值、大样本和多中心的临床研究,故结果仍存在很大的争议性.现为进一步评估sFlt-1对AP早期严重程度的预测价值,本研究首次国内外运用meta分析评价sFlt-1对AP早期严重程度的诊断价值.
1 材料和方法
1.1 材料
1.1.1 文献纳入标准:(1)国内外已发表的关于sFlt-1对AP早期严重程度诊断的前瞻性和回顾性的队列研究;(2)AP诊断及严重程度满足两次亚特兰大诊断标准[19,20]或近年来不同学科制定的《中国急性胰腺炎指南》;(3)AP严重程度包括MSAP和/或SAP;(4)诊断AP早期严重程度文献能列出四格表数据;(5)研究的人群为成人AP;(6)文献语种为中文和英文.
1.1.2 文献排除标准:排除重复数据、动物研究、综述、病例报道、会议摘要、无法从文章中提取出有效结局指标、样本量过小(n<20例)及无法获取全文的文献.
1.2 方法
1.2.1 文献检索:计算机检索中国知网、万方、维普网、中国生物医学数据库、PubMed、Cochrane Library及EMBASE数据库.将检索时间设定为从建库开始至2020-02-15.英文检索以:“pancreatitis”和“Vascular Endothelial Growth Factor Receptor-1”OR“soluble Fmslike tyrosine 1”OR“tyrosine -kinase receptor 1”为检索词;中文检索以“胰腺炎”和“血管内皮生长因子受体1”为主题词和自由词(包括可溶性fms样酪氨酸激酶-1、可溶性血管内皮生长因子受体1、sFlt-1及VEGFR1)相结合进行检索.
1.2.2 文献筛选:本研究中纳入文献质量评价以及资料的提取均由雷静静和吕永才两位评价者独立完成,出现意见不同时协商解决.
1.2.3 文献质量评价:应用QUADAS量表14个条目评估文献的质量[21].按“yes”、“no”和“unclear”进行质量评估,“yes”表示符合本标准,“no”表示不符合或未提及,“unclear”表示部分满意或无法从文献中获得足够的信息.
1.2.4 资料提取:包括:第一作者、发表年份、sFlt-1的检测方法、sFlt-1的取样时间、本文观察终点、sFlt-1的检测临界值、曲线下面积(area under the curve,AUC)、样本量、年龄、真阳性、假阳性、假阴性及真阴性等.
统计学处理本次资料使用Stata 15.0软件进行Meta分析.运算敏感性对数值与(1-特异性)对数值的Spearman相关系数评估阈值效应,当r>0.6,P<0.05时,被认为具有阈值效应.运用I2值评估异质性,当I2>50%,说明研究间的异质性较大.运用双变量混合效应模型计算合并的敏感性、特异性、阳性似然比、阴性似然比及诊断比值比,并绘制合并受试者工作特征(summary receiver operating characteristic,SROC)曲线,使用Fagan图进一步评价sFlt-1对预测AP早期严重程度的临床适用性.亚组分析用于探讨异质性的来源,敏感性分析用于确保研究结果不受任何单个研究的影响.用Deek漏斗图评估发表偏倚.
2 结果
2.1 一般情况 本次研究总共检索到166篇文献.其中48篇文献与本研究相关,阅读摘要、全文再次发现不相关全文分别为14篇、22篇,结局指标不一致1篇[22],重复数据报道4篇[13,14,23,24],保留数据最完整的2篇[13,14],最后纳入7篇文献,其中l篇文献报导了第1天、2天相同人群的结果,因此在结果分析部分将其作为2篇文献[13].本次meta分析纳入AP患者共572例(图1).纳入研究基本情况见表1-3.
2.2 文献质量汇报 使用QUADAS量表14个条目对纳入研究进行质量评价,研究者有意见不统一时进行协商.结果显示:条目1、2、3、5、6、7、8、9、13、14评价均为“yes”,仅有条目4、10、11、12、有“no、unclear”,结果见表4,结果为纳入的文献满足QUADAS量表的评价要求.
表1 纳入研究的基本情况
表2 纳入研究的sFlt-1检测
表3 纳入研究的本文观察终点
2.3 Meta分析结果
2.3.1 异质性检验:检测异质性来源是诊断荟萃分析中的关键步骤,异质性探讨包括阈值效应和非阈值效应,如果研究之间存在阈值效应,则将它们的敏感性、特异性进行合并是不合适的,若存在非阈值效应则需行Meta回归及亚组分析寻找异质性来源.而本研究sFlt-1检测AP早期严重程度的敏感性对数值与(1-特异性)对数值的Spearman相关系数r=-0.381,P=0.352,这表明所纳入研究之间的异质性并不是阈值效应产生,进一步的SROC曲线位于理想的左上角附近,结果显示不呈“肩臂”状分布,也表明不存在阈值效应;同时结合合并敏感性、特异性的I2(P)值分别为:43.03% (P=0.09)、61.21% (P=0.01),表明各研究间存在显著异质性(图2),需进一步行Meta回归及亚组分析探索异质性来源.
表4 QUADAS量表对纳入的文献评价条目
图1 纳入研究的流程图.
2.3.2 合并效应量:采用双变量效应模型计算sFlt-1预测AP发生早期严重程度合并的敏感性、特异性、阳性似然比、阴性似然比、诊断比值比分别为:0.65 (95%CI:0.57-0.72)、0.88 (95%CI:0.81-0.92)、5.36 (95%CI:3.30-8.69)、0.40 (95%CI:0.32-0.51)和13.35 (95%CI:6.88-25.88).
2.3.3 Meta回归及亚组分析:对地理环境(亚洲或欧美)、发病入院时间(≥24 h或<24 h)、sFlt-1取样时间(≥24 h或<24 h)、严重程度判断方法(亚特兰大分类或其他)、sFlt-1检测方法(酶联免疫吸附法或电化学免疫法)、样本量(n≥50人或<50人)进行Meta回归和亚组分析.结果表明地理环境、严重程度判断方法两个因素可能是总体异质性的来源(P<0.05) (图3,表5).
2.3.4 敏感性分析:为了确定合并的效应量是否稳定,笔者进行了敏感性分析,以确保该结果不受任何个体研究的影响.结果表明所有研究均未对总体结果产生重大影响,说明该Meta分析的结果可信(图4).
2.3.5 诊断价值分析:图5描述了sFlt-1与AP早期严重程度的SROC,其曲线位于理想的左上角附近,AUC为0.81(95%CI:0.78-0.84),总体准确性较高.
2.3.6 sFlt-1适用性评价:Fagan图分析显示,预设验前概率为20%,sFlt-1诊断阳性时,受试者被诊断早期发生严重程度的概率上升至57%,sFlt-1诊断阴性时,受试者被诊断为严重程度的概率下降至9%,该结果说明sFlt-1的适用性较好(图6).
表5 亚组分析各研究中潜在的异质性
图2 合并的敏感性(左)和合并的特异性(右).
2.3.7 发表偏倚:绘制Deek漏斗图评估发表性偏倚,结果显示各点在回归线两侧基本对称分布,故纳入的文献不存在发表偏倚(P=0.77,>0.05;图7).
3 讨论
近年来,越来越多的研究表明sFlt-1是诊断AP早期严重性的前景生化指标[12-18,24,25].但因各研究间严重性观测终点指标、sFlt-1取样时间、sFlt-1检测方法及统计学等差异性,其研究结果仍然存很大争议.故为了研究sFlt-1对AP早期严重程度的预测价值,笔者首次对相关文献进行了meta分析.本文共纳入了7篇文献,包括8个病例对照组,总共572例病例.纳入研究的患者相关基本特征较为一致,能够满足QUADAS量表对文献评价的要求.
在临床上,敏感性和特异性为疾病提供了漏诊率和误诊率,帮助临床医生筛选和诊断某种疾病的可能性[26].本文纳入研究表明sFlt-1对AP早期严重程度诊断的敏感性为0.65 (95%CI:0.57-0.72),特异性为0.88 (95%CI:0.81-0.92),意味着较高的漏诊率(35%)和相对较低的误诊率(12%),表明sFlt-1早期检测只能作为一种AP发生严重性的筛选工具,不能作为AP发生早期严重性的诊断标准.
图3 Meta回归和亚组分析森林图.sFlt-1:可溶性fms样酪氨酸激酶-1.
图4 敏感性分析图.
在meta分析中,SROC曲线的AUC、诊断比值比决定了总体准确性[27],故sFlt-1对AP早期严重性的潜在诊断价值可以通过计算两者来评估.在本meta分析中,其合并诊断比值比为13.35 (95%CI:6.88-25.88),合并SROC的AUC为0.81 (95%CI:0.78-0.84),呈现中等程度的诊断价值,故sFlt-1能早期协助临床医生识别AP发生严重程度的可能.
似然比和预前概率是临床医生的重要参考指标,提供了关于测试结果为阴性或阳性的AP患者早期发生严重程度的可能性.根据此次荟萃分析的结果,本文阳性似然比为5.36 (95%CI:3.30-8.69),意味着早期sFlt-1水平的升高,AP发生严重程度的概率是未升高的8.64倍.根据Fagan图的结果,当预测试概率为20%,当sFlt-1诊断为阳性时,在AP中被诊断发生严重程度的概率增加到57%,而当sFlt-1为阴性时,AP发生严重程度被诊断的概率下降到9%,表明血sFlt-1具有良好的临床适用性好.
异质性的探讨是meta分析的重要组成部分,只有同质性研究才能被合并[27].为了检验异质性,对合并特异性、敏感性、阳性似然比、阴性似然比、诊断比值比进行I2检验,结果表明8项队列研究的异质性很明显,同时笔者也观察到了不同研究之间临界值的差异,而这差异笔者推断可能是由于试剂生产公司、仪器、取样时间、试剂检测方法、地理环境、入院时间等原因造成的.然而Spearman相关系数r=-0.381,P=0.352,这意味着阈值效应不是异质性的来源,进一步SROC曲线不呈“单臂”状分布也支持阈值效应不是异质性的来源.因此,进一步的亚组分析被用来找出其他潜在的异质性来源,这些潜在异质性包括地理环境(亚洲或欧美)、发病入院时间(≥24 h或<24 h)、sFlt-1取样时间(≥24 h或<24 h)、严重程度判断方法(亚特兰大分类或其他)、sFlt-1测试方法(联免疫吸附法或电化学免疫法)、样本量(n≥50人或<50人).亚组分析的结果表明地理环境、严重程度判断方法是异质性的来源(P<0.05),而发病入院时间、sFlt-1取样时间、sFlt-1检测方法、样本量的大小不是异质性的来源,但由于纳入研究的样本量少、缺乏大样本的多中心研究等许多其他原因,因此以上结果仍存在争议,尤其以发病入院时间、sFlt-1取样时间、sFlt-1检测方法的不同争议最大,以上结果可能在未来的研究起到一定指导意义,故笔者建议将来的研究在实验设计上应注意这些方面.同时笔者进行敏感性分析表明研究结果是不受单个研究的影响,进一步证明结果可靠性.
图5 SROC曲线图.
图6 Fagan图.
图7 Deek漏斗图.
许多研究已经表明组合生化标志物可能会提高早期AP严重程度诊断,其中多变量预测指标就是很好的体现[11].然而是否sFlt-1与其他生化指标结合进一步可提高早期AP的严重程度,Paulina等[13]对此进行研究,它们认为炎症、凝血、血管内皮受损三者之间存在相互关系,然而sFml-1与血管生成素2、D-二聚体、C-反应蛋白分别进行联合诊断[24,25],结果显示联合指标在诊断AP的严重程度无统计学意义[13].但王等[14]通过联合血清sFlt-1、血淀粉酶和脂肪酶检测提高AP早期严重性的灵敏度和特异度,张等[15]和付等[17]分别通过联合监测血清sFlt-1、血淀粉酶、超敏反应蛋白和联合sFlt-1、乳酸脱氢酶、超敏反应蛋白证实了该结果.但因研究少、样本量少等因素,该结果仍存在很大质疑,故以后仍可增加该方面研究来证实组合效果.
Paulina等研究发现sFml-1的表达与时间有很大的关联性,该结果表明24 h内sFml-1预测MSAP+SAP的受试者工作特征(receiver operating characteristic,ROC)为0.808,但随后在24 h内在进行亚组分析,在研究的66例患者中,其中20例患者为MSAP+SAP,46例患者为MAP,他们发现MAP中19例和MSAP+SAP的9例患者发病时间到入院时间约在18-21 h,而剩余患者入院时间为22-24 h,并对18-21 h患者进行绘制ROC曲线,在sFml-1预测AP发生MSAP+SAP的ROC为0.836,而在第2天,其预测AP的严重性的ROC值降低到了0.791.当然该结果与Espinosa等[12]相比,Espinosa等抽血时间为患者入院12 h内,但入选研究的患者为发病72 h内,其预测AP的严重程度的ROC为0.57.但两篇文献除了取样时间外,还有不同的差异性如检测方法不同,也可能是造成结果不同的原因,如Paulina等检测sFml-1的方法为电化学免疫法,而Espinosa等检测sFml-1的方法为酶联免疫吸附法,学者们认为这可能是导致结果差异性的主要原因.Espinosa等和Paulina等之间的差异似乎在Kolber等[22]的研究中得到了证实,该研究入选95例24 h入院的AP患者(sFml-1检测的方法为电化学免疫法,检测时间分别为入院第1天,第2天),在入院的第1天、第2天sFml-1浓度在AP发生严重程度时有升高的趋势,相比第1天,第2天有下降趋势,但sFml-1浓度在MAP、MSAP、SAP各组间均无统计学意义,但结合国内结合多为学者的结果,不考虑两个检测方法在临床上检测优劣性,似乎提示早期运用酶联免疫吸附法,其结果更可靠.但笔者发现国内学者多数研究内容较国外研究就论文的阐述方面是欠详细,如对sFlt-1测试方法及研究设计类型,且AP严重程度分类方法也不尽统一,造成了该结论存在争议性的原因.
笔者注意到本次meta分析也有很多局限性.首先,它只包括中文、英文和已发表的研究,而会议摘要、评论、未发表的研究和其他语言的研究被排除在外,这可能会影响最终的结论.其次,纳入文章的原文观察终点基线不尽统一,可能导致该结果的运用受限.最后,多篇文献的研究设计均未提及研究设计类型,不排除回顾性研究可能,故存在盲法偏倚而影响该结果.鉴于以上不足,建议今后的研究报告应遵循STARD声明以提高诊断实验报告质量,这有利于临床的决策.
本次meta表明sFml-1诊断AP早期严重程度的敏感性、特异性及AUC值分别为:0.65 (95%CI:0.57-0.72)、0.88 (95%CI:0.81-0.92)、0.81 (95%CI:0.78-0.84),说明sFml-1在诊断AP早期发生严重程度仅有中等程度的价值,且敏感性较低,只能作为AP早期发生严重程度的辅助指标,不能作为诊断标准.同时注意不同人群的检测浓度、sFml-1检测方法、sFml-1取样时间、观测终点的一致性及与其他标记物的结合可能会提高其准确性,这可能是未来进一步的研究的方向.
文章亮点
实验背景
可溶性fms样络氨酸激酶-1 (soluble fms-like tyrosine 1,sFlt-1)作为血管内皮生长因子的诱饵受体,自从报道血管渗漏综合症参与急性胰腺炎(acute pancreatitis,AP)的重症化机制以来,近年越来越多来的研究表明其早期参与了AP的病情发展.
实验动机
sFlt-1升高虽与AP的严重程度息息相关,包括器官功能衰竭、胰腺坏死 胰腺感染.但目前缺乏多中心、大样本研究,故尚未在临床上得到推广.因此本研究首次国内外进行meta分析和系统综述评估其对AP早期严重程度的预测价值.
实验目标
通过本次meta分析及系统综述,得到sFlt-1对AP早期严重程度的预测价值.
实验方法
通过在国内外常见的文献数据库搜索相关研究,依据文献纳入及排除标准,对符合纳入的研究进行诊断性meta分析和系统综述.
实验结果
对纳入的文献进行诊断性meta分析及系统综述,结果表明:sFlt-1升高对AP早期严重程度的曲线下面积、敏感性、特异性分别为:0.81 (95%CI:0.78-0.84)、0.65(95%CI:0.57-0.72)、0.88 (95%CI:0.81-0.92),亚组分析表明地理环境(亚洲或欧美)、严重程度判断方法(亚特兰大分类或其他)可能是总体异质性来源.系统综述表明其表达与时间紧密相关.
实验结论
sFlt-1升高对AP早期严重程度仅有中等程度的预测价值,且敏感性低.
展望前景
在未来,进行sFlt-1与AP严重程度相关研究时,应该注意sFlt-1在不同人群的检测浓度、检测方法、取样时间,同时注意AP观测终点的一致性可能会提高其准确性.