病例系列研究方法学质量评价工具解读
2015-05-04王小琴陈耀龙渠清源亮1当1琪13陈根杨克虎1
王小琴 陈耀龙 渠清源 姚 亮1,,3 韦 当1,,3 王 琪1,,3陈 根杨克虎1,,3
·循证医学方法学·
病例系列研究方法学质量评价工具解读
王小琴1,2,3,4,5陈耀龙1,2,3,5渠清源2姚 亮1,2,3韦 当1,2,3王 琪1,2,3陈 根1,4杨克虎1,2,3
病例系列是无对照的观察性研究,涉及对多个患者同一种干预、疾病或结局的描述[1],主要用于以下3方面:①报告药物治疗的潜在危害和不良反应;②描述一种新出现的疾病或罕见病的临床表现、诊治措施,新的手术方法、护理方法或其他保健措施;③观察某药物或疗法的效果。相比于其他研究类型,病例系列由于未随机分组和设置对照,可能受到多种潜在偏倚的影响。按照牛津证据分级系统或GRADE分级系统等,病例系列在证据等级中处于低级别[2]。但在某些情况下(如涉及伦理学问题),对照试验(RCT、病例对照或队列研究)可能不适用或尚未开展,病例系列可能是唯一可得的研究证据[2,3]。例如目前尚无关注高压氧对减压病患者重要结局影响的RCT,但有大量病例系列显示高压氧治疗减压病的效应量大,故在指南制定过程中,GRADE专家将其证据级别从低升为高[4]。根据英国国家卫生与临床优化研究所(NICE)报告,截至2002年12月,其发表的卫生技术评估中有30%纳入了病例系列[4]。
尽管病例系列的意义和作用逐渐受到重视,但其方法学质量仍有待改进。如2006年Moga等[5]对胃部电刺激治疗胃轻瘫的病例系列行方法学评价,结果显示75%病例系列纳入的患者来自单中心,均未说明是否连续招募患者,37%的病例系列纳入的患者基线不一致,25%病例系列未清楚描述干预措施,62%病例系列未提供概率估计值,37%的病例系列未清晰描述主要结果且研究结果无法推导结论。
1 病例系列质量评价的发展历程
近10余年国内外学者对病例系列的质量评价标准开展了相关研究。1999年Young等[6]针对肺减容术治疗严重肺气肿的慢性阻塞性肺疾病患者的病例系列,提出了选择性偏倚、失访偏倚和测量偏倚3方面的评价条目;2006年Moga等[5]基于多个质量评价工具,提练出30个条目以评价病例系列质量;2009年Yang等[7]发表了一份包含13个条目的针对中草药领域的病例系列质量评价清单;2012年Helm等[8]采用NOS量表评价病例系列的方法学质量。然而当前仍无公认的病例系列质量评价标准。2012年加拿大卫生经济研究所(IHE)制定了病例系列较为系统全面的质量评价工具[9]。该工具的制定共分为4步。第一步对现有病例系列质量评价工具进行文献综述,搜集条目并按研究问题、研究人群、干预措施、结局指标测量、统计学分析和结果6个领域进行分析。第二步确定初始条目及遴选参与确定条目的专家。第三步应用德尔菲法形成最终条目清单。终版清单完成后,由2名评价员在一项关于1型糖尿病患者胰岛移植的安全性和效果的病例系列进行预评价,专家组根据预评价结果完善解释说明文件。
IHE病例系列方法学质量评价工具的清单见表1[9],考虑到对条目的符合情况进行打分可能具有一定的误导性[10],IHE病例系列方法学质量评价清单不建议使用打分法,而是将每个条目都给出相应选项。虽然专家组尚没有制定相应的质量水平评价系统,但基于终版清单评价了13个病例系列,提出满足14条(70%)以上即算可接受的质量的建议。但具体判定病例系列的总体方法学质量的等级的界值,即满足多少条目算作高质量,仍有待更多这方面的研究结果。
2 IHE病例系列方法学质量评价条目的实例解读
本文以《中国循证儿科杂志》2014年第1期发表的《内镜下组织粘合剂注射和套扎术治疗儿童食管胃静脉曲张出血24例临床观察》[11]的病例系列为例,对该评价工具的条目进行解读。
2.1 领域1:研究目的
条目1 是否清晰地说明了研究的假设、目的、目标?
解读:假设或目的、目标,旨在帮助读者快速理解研究主题。
实例:该例在其摘要和背景部分均明确了研究目的,即:“评价内镜下组织粘合剂注射和套扎术(EVL)治疗儿童食管胃静脉曲张(GOV)的临床疗效”,判定为“是”。
2.2 领域2:研究人群
条目2 是否描述了患者特点?
表1 IHE病例系列方法学质量评价工具及其说明
续表1
注 1)评价员在应用前应确定哪些方面是重要的,如有必要则咨询专家;2)预评价后新提出的条目
解读:患者特点主要指人口学特征(年龄、性别和种族等)和与病因相关的基线特征。
实例:该例在其结果中清晰明确地阐述了患儿特点,即:“24例GOV患儿进入分析,男15例,女9例,年龄2.4~14.1岁,平均年龄(8.0±3.2)岁。判定为“是”。
条目3 是否在多个中心收集病例?
解读:多中心研究纳入人群更具代表性[12],更好的实现该研究后期的实用性。
实例:该例中的患儿来源于单中心,判定为“否”。
条目4 研究的纳入和排除标准是否明确且合理?
解读:详尽的纳入和排除标准,有助于清楚地理解研究结果适用的对象和具备可重复性。
实例:该例只在方法学中描述了纳入标准,即:“因消化道出血住院或住院期间出现消化道出血症状、年龄<18岁、经行内镜检查证实有GOV并行内镜下治疗的患儿进入本文分析”,本文虽然没有明确的排除标准,但此标准已经较为完善,具备可重复性,判定为“是”。
条目5 患者的招募是否连续?
解读:以合理、明确的方法连续纳入符合纳入和排除标准的患者,避免选择偏倚[13]。
实例:虽然该例在方法学中描述纳入2009年10月至2013年11月在复旦大学附属儿科医院就诊的患儿,但未明确是否连续病例或该时间段内符合标准的患儿全部纳入,故判定为“不清楚”。
条目6 患者的病情是否一致?
解读:患者疾病的相似程度对于准确判断干预的效果具有重要影响。研究应明确描述患者在临床状态、疾病史(暴露时间)、伴随疾病、严重程度和并发症方面的一致性。
实例:该例纳入的24例患儿虽然疾病严重程度不同,但按GOV 1型、2型分析,且对治疗后3个月内出血、3个月以上出血和未出血的病例进行分析,故判定为“是”。
2.3 领域3:干预与联合干预
条目7 是否清楚描述了主要的干预措施?
解读:清楚描述主要的干预措施,包括剂量、实施频率、疗程、持续或临时干预、技术参数或设备特点等,有助于指导临床实践。
实例:该例全面描述了治疗方法及其细节,具有可重复性,即:“所有患儿均在生命体征平稳时行内镜下治疗,伴有胃静脉曲张者先行组织粘合剂注射治疗,再在食管曲张静脉处行EVL治疗,对只表现为食管静脉曲张者仅接受EVL治疗”,故判定为“是”。
条目8 是否明确描述了其他或联合干预措施?
解读:应详尽地描述每一种干预措施,便于临床医生或研究者明确所有干预措施的方法,有助于理解真实疗效。
实例:该例描述了联合干预,即:“术后观察曲张静脉处有无出血情况,术后禁食、禁饮,给予质子泵抑制剂抑酸治疗2周以上”, 故判定为“是”。
2.4 领域4:结局测量
条目9 是否事先确定研究要测量的结局指标?
解读:没有在方法学中给出需要测定的结局指标,将降低研究的透明度和严谨性,读者也无法明确研究描述的结果与干预措施间的关系。
实例:GOV出血的常用结局指标有即时止血率、再出血率、术后并发症等[14,15]。该例在方法学中明确了要测量的结局,并定义了疗效评价标准,即:“组织粘合剂注射和EVL治疗的即时止血成功标准:术后72 h内无活动性出血,无呕血及黑便,生命体征平稳;3个月内和3个月以上的预后:内镜下随访观察是否有GOV再出血”,故判定为“是”。
条目10 是否应用合理的客观和(或)主观的方法测量了相关结局指标?
解读:研究确定的结局指标,不论是客观(如实验室指标等),还是主观(如自我管理的问卷、标准化表格或患者症状访谈表),都应在方法学中明确描述。
实例:该例在方法学部分描述了结局指标,也在结果部分体现了测量相关结局指标的方法,即内镜下止血率,故判定为“是”。
条目11 干预前后是否均测量了结局指标?
解读:在干预实施前后均测量结局指标,可确定干预措施对患者结局产生的影响。
实例:尽管该例未描述明确的相关信息,但通过详细记录的疗效数据,可以判断研究人员在干预措施前后均测量了结局指标。该例在方法学中给出了疗效评价标准,在结果部分描述了手术前的食管静脉曲张分级情况,即:“食管静脉曲张分级:3例为中度,21例为重度,其中20例可见红色征”;接受治疗后,给出了静脉曲张缓解情况和即时止血率、再出血率等结局指标的结果,即:“行内镜下治疗后,曲张静脉均有不同程度的消退,即时止血率为100%,3个月内再出血率16.7%”,故判定为“是”。
2.5 领域5:统计分析
条目12 是否应用了合理的统计学检验评价相关结局指标?
解读:通常情况下,研究需要通过统计学检验评价研究结果是否存在统计学意义,进而讨论其临床意义,如果统计学检验使用不合理,则可能得到错误的结果,甚至导致错误的结论[16]。
实例:该例中没有描述采用相关统计学检验方法,也没有说明为何不使用,故判定为“否”。
2.6 领域6:结果与结论
条目13 是否报告了随访时间?
条目14 是否报告了失访情况?
解读:通常情况下研究会将随访和失访的结果一起描述,所以此处将这2条合并解读。研究结果是基于实施干预后测量结局指标得到的数据及相应的分析结果。多数结局指标会随时间变化,合理的随访是测量结局指标的关键。失访情况也应详细描述,通常失访被认为是最差结局。
实例:该例描述了随访时间和结果,即:“24例患儿平均随访10.5(1~32)个月,8例(33.3%)出现再出血率16.7%(4/24),3个月以上再出血率为16.7%(4/24)。本文16例未再出血组中A级占81.2%,3个月内和3个月以上再出血组A级各占50%。3个月内和3个月以上再出血率均为16.7%。2例患儿于治疗后3个月内死亡”。通过以上信息可判断该研究没有失访,故条目13和14均为“是”。
条目15 是否在相关结局的数据分析中提供了随机变量的估计?
解读:研究应提供所有相关重要或次要结局指标的随机变量的估计,如标准误、标准差、可信区间。
实例:该例未描述对任何结局指标进行随机变量估计,故判定为“否”。
条目16 是否报告了干预相关的不良事件?
解读:在结果和结论部分应描述研究期间或预先设定的时间段内实施干预后出现的不良事件,或者说明无任何不良事件发生,可帮助医生更加合理地应用这些干预。
实例:该例在讨论部分给出了相关信息,明确无明显的不良事件发生,即:“虽然组织粘合剂注射治疗GOV疗效安全,但也存在一定的风险,主要包括出血、败血症和异位栓塞等。本组病例中未发生明显并发症”,故判定为“是”。
条目17 研究的结果是否支持其结论?
解读:研究得出的结论应基于研究的结果。
实例:本例结果为:“研究报道内镜下组织粘合剂注射治疗GOV急诊止血率为93%~100%,再出血率为8.2%~42%。本组患儿中75%为GOV 2型静脉曲张,19例经组织粘合剂注射治疗,即时止血率达100%,与文献报道的较为一致”,其结论为:“内镜下组织粘合剂注射和EVL是治疗儿童GOV的有效措施,可迅速止血且并发症少,对于长期出血的患儿应密切随访,控制原发疾病以期达到根治目的。另外现阶段针对儿童的诊断和治疗大多依赖成人标准,还需给予儿童GOV更多的关注”。本例的研究结论紧密围绕结果得出,同时也表明对儿童GOV的诊断与治疗标准需要更多的关注,较为客观,故判定为“是”。
2.7 领域7:利益冲突和资金来源
条目18 是否说明了研究的利益冲突和支持来源?
解读:利益冲突是一系列可能影响专家成员决策或其客观性或公平性的个人、职业或经济因素。研究的资助可能会影响到研究设计、实施、分析和试验结果的报告[17]。病例系列应该说明是否有资金来源和利益冲突,如果有,还应该分析这些支持和利益冲突是否会对研究产生任何影响。
实例:该例未提供任何利益冲突和资金来源的相关信息,故判定为“否”。
2.8 新增条目
条目19 该研究是否为前瞻性研究?
解读:研究按照观察起点可分为回顾性和前瞻性,前瞻性研究是从现在追踪到未来,暴露因素可能已经发生或还未发生,而结局还未发生。回顾性研究,资料来源是现存的记录,暴露因素和结局均已发生[18]。
实例:该例是直接分析的临床病例资料,不属于前瞻性研究,故判定为“否”。
条目20 是否对结局评价人员施盲?
解读:盲法是一种避免实施偏倚和测量偏倚的措施,对结局评价人员施盲,可避免因其人为或主观认知而影响测量结果,特别是对主观性测量指标,对结局评价人员施盲比对临床医生施盲能更有效地避免实施偏倚[19,20]。
实例:该例诊断并行相关治疗人员、结局评价和测量人员为同一科室医生,故判定为“否”。
3 小结
IHE病例系列质量评价工具为客观评价和恰当使用病例系列的研究结果提供了重要依据。但该条目还存在以下局限:①德尔菲法专家组成员仅有5人,且全部来自高收入国家。一般质量评价工具的专家组由10~20人组成,应来自高收入和中低收入国家,并合理考虑地域分布。②该工具针对病例系列的方法学质量,也可用于病例报告的质量评价,然而开发人员并未说明是否或应该如何用这些条目来评价病例报告。③该工具虽然从原始的30个条目最终确定为20个条目,但对于病例系列而言,条目数仍然过多,针对RCT的方法学质量评价工具仅6个条目[21],而且部分条目(条目3、5、12、15、18和新增条目1)并不完全适合病例系列或对病例系列研究并不是很重要,例如:原文提到一些条目需要评价员考虑(或咨询专家确定)其是否重要,进而更合理的给出评价结果;又如大多数病例系列是对曾经暴露于某种相同干预(预防)措施的一批患者进行临床结果描述和评价,这样对于前瞻性的要求并不恰当。④虽然每个条目都有对应的判断选项,但是对于总体质量还缺乏一个可参考的标准。
[1]Clarke M, Oxman A. Cochrane Reviewers' Handbook 4.1.5. Cochrane Library, 2002
[2]Chen YL(陈耀龙), Li YP, Du L, et al. Evolution of levels of evidence and strength of recommendations in medical research. Chin J Evid-based Med(中国循证医学杂志), 2008, 8(2): 127-133
[3]Mallen C, Peat G, Croft P. Quality assessment of observational studies is not commonplace in systematic reviews. J Clin Epidemiol, 2006, 59(8): 765-769
[4]Murad MH, Altayar O, Bennett M, et al. Using GRADE for evaluating the quality of evidence in hyperbaric oxygen therapy clarifies evidence limitations. J Clin Epidemiol, 2014, 67(1): 65-72
[5]Moga C, Harstall C. Gastric electrical stimulation (Enterra Therapy system) for the treatment of gastroparesis. Report 2006, 73. Available: www.ihe.ca/documents/hta/HTA_Report_37.pdf
[6]Young J, Fry-Smith A, Hyde C. Lung volume reduction surgery (LVRS) for chronic obstructive pulmonary disease (COPD) with underlying severe emphysema. Thorax, 1999, 54(9): 779-789
[7]Yang AW, Li CG, Da Costa C, et al. Assessing quality of case series studies: development and validation of an instrument by herbal medicine CAM researchers. J Altern Complement Med, 2009, 15(5): 513-522
[8]Helm Ii S, Deer TR, Manchikanti L, et al. Effectiveness of thermal annular procedures in treating discogenic low back pain. Pain Physician, 2012, 15(3): E279-304
[9]Moga C, Guo B, Schopflocher D, et al. Development of a Quality Appraisal Tool for Case Series Studies Using a Modified Delphi Technique. Edmonton AB: Institute of Health Economics, 2012
[10]Greenland, S. (1994). Quality scores are useless and potentially misleading [Reply to Re: Acritical look at some popular analytic methods]. Am J Epidemiol, 1994, 140(3): 300-301
[11]Wang L(王琳), Lu JP, Huang Y, et al. Comparison of histoacryl injection and endoscopic variceal ligation for the treatment of gastroesophageal varices in 24 children. Chin J Evid Based Pediatr(中国循证儿科杂志), 2014, 9(1):33-36
[12]Multicenter_trial. http://en.wikipedia.org/wiki/Multicenter_trial. Accessed at July 14, 2014
[13]Wu L(邬兰), Zhang Y, Zeng XT. QUADAS-2 在诊断准确性研究的质量评价工具中的应用. Journal of Hubei University of Medicine(湖北医药学院学报), 2013, 32(3): 201-208
[14]Lu XD(卢向东), Zhang ZG, Xin Y. Endoscopic injection with tissue adhesive for treatment of gastric variceal hemorrhage. Chinese Journal of Practical Medicine(中国实用医刊), 2011, 38(2): 47-49
[15]Xiong XQ(熊小强), Hu XM, Ling XT, et al. Cyanoacrylate versus ligation in the treatment of gastroesophageal varices: One Meta-analysis. Chin Arch Gen Surg (Electronic Edition)[中华普通外科学文献(电子版)], 2012, 6(2):49-54
[16]Geller NL, Pocock SJ. Interim analyses in randomized clinical trials: ramifications and guidelines for practitioners. Biometrics, 1987, 43(1): 213-223
[17]Moher D, Hopewell S, Schulz KF, et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. J Clin Epidemiol, 2010, 63(8): e1-37
[18]Liu JP(刘建平). Design, implementation and methodological issues in cohort study. Journal of Chinese Integrative Medicine(中西医结合学报), 2008, 6(4): 331-336
[19]Wu TX(吴泰相), Liu GJ. The concepts, design, practice and reports of allocation concealment and blinding. Chin J Evid-based Med(中国循证医学杂志), 2007, 7(3):222-225
[20]Wu TT(吴婷婷), Liu DL, Huang J, et al. Application of risk of bias tool in Cochrane systematic reviews on acupuncture. Chin J Evid-based Med(中国循证医学杂志), 2014, 14(3): 361-364
[21]Xiong J(熊俊), Chen RX. An introduction to a measurement tool to access the methodological quality of systematic reviews/Meta-analysis: AMSTAR. Chin J Evid-based Med(中国循证医学杂志), 2011, 11(9):1084-1089
(本文编辑:张萍)
10.3969/j.issn.1673-5501.2015.05.012
1 甘肃省循证医学与临床转化重点实验室;2 兰州大学循证医学中心,兰州大学基础医学院;3 中国GRADE中心,兰州大学;4 基础医学院病原生物学教研室,兰州大学 兰州,730000;5 共同第一作者
陈 根,E-mail:chengen@lzu.edu.cn;杨克虎,E-mail:yangkh@lzu.edu.cn
2015-01-30
2015-07-16)