不同筛查工具对脑卒中后误吸筛查准确性的网状Meta分析
2021-02-07刘彦麟丁亚萍刘世晴陈申赵青余洁熊峰
刘彦麟,丁亚萍,刘世晴,陈申,赵青,余洁,熊峰
吞咽障碍是脑卒中的常见并发症,国内外研究显示,22%~80%脑卒中患者会出现不同程度的吞咽障碍[1-3]。误吸是脑卒中后吞咽障碍最严重的不良后果,发生率为15%~54%[4-5],其中约68%的误吸为隐性误吸[6],且由于隐性误吸难以被发现,实际误吸发生率可能更高[4]。误吸可增加患者吸入性肺炎、营养不良、脱水甚至窒息等并发症的风险,延长住院时间,增加治疗费用[7]。有研究发现,误吸患者吸入性肺炎发生率为其他患者的11倍[1]。早期进行误吸筛查、加强误吸预防能够有效降低并发症的发生,提高患者生活质量[8]。目前,常用的吞咽障碍床边筛查工具均可用作脑卒中患者误吸筛查,但临床工作中医务人员常仅将其用于吞咽障碍的早期评估,忽略了误吸筛查的作用。由于筛查工具种类繁多,诊断准确性不一,难以确定误吸的最佳筛查工具。本研究借助于网状Meta分析的方法,探讨不同误吸筛查工具的诊断价值,以帮助护理人员正确选择误吸筛查工具,为脑卒中患者误吸的预防和管理提供依据。
1 资料与方法
1.1文献纳入与排除标准
1.1.1纳入标准 ①研究类型:以中英文发表的诊断性研究。②研究对象:脑卒中患者。③诊断方法:待评价的诊断方法为4种常用误吸筛查工具,即洼田饮水试验(Water Swallow Test, WST)[9]、进食评估问卷调查工具-10(Eating Assessment Tool-10, EAT-10)[10]、Gugging吞咽功能评估量表(Gugging Swallowing Screen, GUSS)[11]、容积黏度吞咽测试(Volume-Viscosity Swallow Test, VVST)[12]。诊断金标准为吞咽造影检查(Video Fluoroscopic Swallow Study,VFSS)或纤维内镜吞咽功能检查(Flexible Endoscopic Examination of Swallowing,FEES)。④结局指标:灵敏度及特异度。
1.1.2排除标准 重复发表的文献;未能获取全文或无法提取原始数据的文献;仅有摘要的文献。
1.2文献检索策略 计算机检索PubMed、The Cochrane Library、Embase、CINAHL、Web of Science以及中国知网、万方数据库、维普数据库、中国生物医学文献数据库(CBM),搜索关于常用床边筛查工具诊断脑卒中后误吸的临床研究,检索时限均为建库至2020年3月。检索时采用主题词和自由词相结合的方式。中文检索词包括“脑卒中、中风、脑梗塞、脑栓塞、脑梗死、脑血管意外”“洼田饮水试验、WST、Gugging吞咽功能评估量表、GUSS、进食评估问卷调查-10、EAT-10、容积粘度试验、容积黏度试验、VVST、床旁筛查试验”“吞咽障碍、吞咽困难、误吸”;英文检索词包括“stroke/cerebrovascular accident*/CVA/brain vascular accident*/cerebrovascular apoplexy/cerebral infarction”“water swallow test/WST/eating assessment tool-10/EAT-10/gugging swallowing screen/GUSS/volume viscosity screening test/VVST/bedside swallowing screening”“deglutition disorders*/dysphagia/acataposis/swallowing disorder*/swallowing difficult*/aspiration”等。此外,手工检索已纳入文献的参考文献,以补充检索中未发现的信息。
1.3文献筛选与资料提取 由2名研究者独立筛选文献、提取资料并进行交叉核对,如有分歧,通过讨论或与第3名研究者协商处理。研究者阅读文章题目进行初筛后,阅读摘要和全文复筛,最终确定纳入的文献。如有需要,通过邮件、电话等方式联系原始研究作者获取未能提取的信息。资料提取内容主要包括:①纳入研究的一般资料,包括研究题目、作者、国家、发表时间等。②研究对象的基线特征和诊断信息,包括样本量、年龄、筛查工具、参考标准等。③结局指标,包括真阳性、假阳性、假阴性、真阴性、灵敏度及特异度。
1.4文献质量评价 采用诊断准确性研究的质量评价工具 (Quality Assessment of Diagnostic Accuracy Studies 2,QUADAS-2)[13]对纳入研究进行质量评价,评价内容包括偏倚风险程度和临床适用性,前者包括病例选择、待评价的诊断试验、金标准、病例流程和进展情况4个部分;后者包括病例选择、待评价的诊断试验、金标准3个部分。由2名研究者独立评价并进行交叉核对,如遇分歧则通过讨论或与第3名研究者协商处理。
1.5统计学方法 利用Stata15.0软件进行统计分析。采用midas命令进行传统Meta分析,合并灵敏度、特异度、诊断比值比(Diagnostic Odds Ratio,DOR)以及曲线下面积(Area Under Curve,AUC)为效应分析统计量,各效应量均提供其95%CI。由于本研究是基于金标准比较各种筛查工具准确性,因此采用一致性模型进行网状Meta分析及结果排序。采用Network安装包及相关命令对数据进行处理,绘制网状关系图、漏斗图、预测区间图和有效性秩序图等。通过漏斗图识别发表偏倚,通过预测区间图(95%CI和95%PrI)判断合并结果的异质性,通过累积排序概率曲线下面积(Surface Under the Cumulative Ranking Area,SUCRA)呈现每个筛查工具成为最佳工具的可能性。
2 结果
2.1文献检索结果 共检出文献2 803篇,其中英文667篇,中文2 136篇。利用NoteExpress软件去重后获得1 729篇;阅读标题及摘要,初筛出96篇;阅读全文复筛出27篇文献[9-11,14-37]。
2.2纳入文献的基本特征及质量评价 纳入的27项研究共包含2 797例患者。各项研究均与金标准进行直接比较,其中1项研究[33]同时包含EAT-10、VVST与金标准比较,但2种工具间并未直接比较,因此本研究将2份数据分别进行提取。QUADAS-2质量评价结果表明:纳入研究的偏倚风险程度较低,20项研究[10-11,16-22,25-28,30-36]采用了盲法,15项研究[9,11,16-17,19, 21,23-25,27-29,33-34,37]纳入了连续病例,26项研究[9-11,14-32,34-37]避免了病例对照设计,23项研究[9-11,14-29,33-37]预先设定了阈值,所有研究均描述了失访情况;临床适用性整体较高,其中3项研究[30,32-33]的病例不全为脑卒中患者而对研究的临床适用性产生一定影响,其余24项研究[9-11,14-29,31,34-37]的临床适用性均较高。各项研究均对人群、年龄、样本量等基线资料进行了详细描述。纳入研究的基本特征见表1。
2.3传统Meta分析结果 见表2。
2.4网状Meta分析结果
2.4.1网状关系图 纳入的筛查工具间无直接比较的证据,网状关系图以金标准VFSS或FEES为中心,4种误吸筛查工具为节点,呈放射样结构。WST与金标准比较的研究最多,VVST与金标准比较的研究最少,见图1。
2.4.2异质性检验 灵敏度结局显示无异质性。特异度结局中WST与EAT-10、WST与VVST、EAT-10与GUSS、GUSS与VVST对比有轻微异质性,95%CI和95%PrI分别为(0.25,0.74)和(0.15,1.29)、(0.15,0.81)和(0.10,1.26)、(1.03,4.73)和(0.64,7.54)、 (0.13,0.99)和(0.09,1.49)。
2.4.3灵敏度和特异度 4种误吸筛查工具灵敏度、特异度的网状Meta分析结果见表3。灵敏度结果显示,与金标准比较,WST[0.60,95%CI(0.51,0.70)]、EAT-10[0.69,95%CI(0.54,0.88)]的灵敏度准确性较差,差异有统计学意义;WST[0.63,95%CI(0.42,0.96)]的灵敏度与GUSS相比准确性较差,差异有统计学意义。特异度结果显示,与金标准比较,WST[0.48,95%CI(0.37,0.62)]、EAT-10[0.21,95%CI(0.13,0.33 )]、GUSS[0.46,95%CI(0.25,0.84)]、VVST[0.17,95%CI(0.08,0.37)]的特异度准确性较差,差异有统计学意义;EAT-10与GUSS比较,特异度准确性较差,差异有统计学意义;WST与EAT-10、VVST比较,GUSS与VVST比较,特异度准确性较好,差异有统计学意义。
表1 纳入研究的基本特征
表2 传统Meta分析结果
图1 不同筛查工具比较的网状关系图
2.4.4结果排序 4种误吸筛查工具灵敏度和特异度的累积概率显示,灵敏度SUCRA值由高到低为:GUSS(72.0%)>VVST(60.6%)>EAT-10(28.2%)>WST(4.8%);特异度SUCRA值由高到低为:WST(63.6%)>GUSS(60.2%)>EAT-10(17.6%)>VVST(8.8%)。此外,GUSS的灵敏度及特异度均处于较高水平,与金标准为同一聚类。
2.4.5敏感性分析 本研究针对研究人群的不同进行了敏感性分析,在排除3篇研究人群不全是脑卒中患者的研究[30,32-33]后,结果表明灵敏度和特异度SUCRA值的排序结果与排除之前未发生重要改变。
2.4.6发表偏倚检验 对纳入研究进行发表偏倚分析,有少数研究落在漏斗图外侧,提示纳入研究存在发表偏倚或小样本效应的可能。
3 讨论
3.1GUSS与VVST的灵敏度较高 脑卒中后误吸筛查的主要目的是快速、安全地识别卒中后误吸高风险人群,因此需要灵敏度高的工具。无论是传统Meta分析还是网状Meta分析,结果都表明灵敏度最高的筛查工具是GUSS。GUSS分为间接和直接吞咽测试两部分,间接测试通过观察患者能否保持清醒至少15 min、咳嗽或清嗓能力、吞咽唾液能力来初步评估患者的基本吞咽功能,对无异常者进行直接测试,即观察患者依次吞咽半固体、液体、固体食物时的吞咽表现[11]。SUCRA值排序结果表明,灵敏度较高的第2种筛查工具为VVST。VVST简便安全,易操作,耗时较短(5~10 min),被中国吞咽障碍评估与治疗专家共识推荐使用[38]。VVST是通过指导患者吞咽不同体积(5 mL、10 mL和20 mL)和不同黏度(蜂蜜状、液体和布丁状)的食物来观察患者是否存在误吸风险以及评估吞咽的安全性和有效性[39]。此外,VVST结合患者血氧饱和度下降还可发现隐性误吸[12],但仍需进一步的研究以验证VVST在我国的信效度。GUSS和VVST是通过测试患者吞咽不同质地食物的能力来评估吞咽功能,与传统饮水试验相比能够减少吞咽水时发生的误吸,保障筛查的安全性。此外,相较于仅由10个问题组成的量表EAT-10,GUSS和VVST可根据筛查结果为患者提供相应的饮食指导,增加了筛查工具的应用价值。
表3 常见误吸筛查工具灵敏度(左下角)和特异度(右上角)的网状Meta分析结果 OR(95%CI)
3.2WST与GUSS的特异度较强 排序结果表明,特异度较高的前2种筛查工具为WST和GUSS。WST为观察患者在端坐状态下饮温开水后吞咽所需时间和呛咳情况,因其简便、易操作,成为目前临床使用最广泛、接受度最高的吞咽障碍及误吸筛查方式之一[15]。但国内外学者对WST筛查时的饮水量和是否应单独使用该工具存在争议,朱亚芳等[40]的Meta分析认为WST筛查时饮水量≥50 mL对脑卒中患者误吸判断的准确性优于饮水量<50 mL。另有研究发现,WST筛查误吸的准确性随患者饮水量而变化,连续大量饮水可以提高灵敏度,而单次少量饮水可以提高特异度,其变化范围分别为64%~79%和61%~81%[41-42]。由于WST无法识别隐性误吸,因此不建议将其作为误吸的单独筛查方式。GUSS可有效避免部分患者不必要的进食限制[43],但目前对食物性状的标准尚未完全统一,因此其在临床的应用仍有一定局限。
3.3合理选择筛查工具进行个体化筛查 误吸是多种因素相互作用的结果,对待误吸应预防优先于治疗,而预防的前提是准确、有效的筛查和评估。WST、GUSS和VVST目前多应用于急性脑卒中患者,EAT-10多用于口咽期吞咽障碍患者或脑卒中后已饮水或进食的患者[38]。WST和EAT-10操作较为简单,更易被患者接受,而GUSS和VVST因要准备不同质地的食物略微繁琐和耗时,但安全性更高。医护人员应根据脑卒中患者病情、误吸类型、配合情况等综合考虑,选择合适的筛查工具进行个性化筛查,减少误诊及漏诊。结合本研究得出的GUSS高灵敏度,WST高特异度结论,在实际临床实践中,可考虑综合运用筛查工具,提高诊断性能,为防治脑卒中吞咽障碍患者的误吸提供依据。
3.4研究局限性 本研究存在以下不足:①由于研究间缺乏直接比较结果,无法形成闭环,对研究间的不一致性不能做出系统评估;②在分析VVST时,因研究文献较少,结果可能会产生一定偏倚;③部分研究纳入的研究人群并非全部脑卒中患者,虽已使用QUADAS-2进行偏倚风险评价,但仍可能导致研究结果存在一定偏倚。因此,还需要更多设计严谨、大样本量的研究对本研究的发现进一步证实。
4 小结
本研究基于网状Meta分析,比较4种常用误吸筛查工具在脑卒中患者中的诊断价值,结果发现GUSS的灵敏度较高,WST的特异度较高。其中GUSS的灵敏度和特异度均较高,可能成为脑卒中后误吸筛查的首选工具。受纳入研究数量和质量的限制,所得结论仍需更多大样本、高质量的研究加以验证。