临床疗效评价结局指标的理论框架概述
2021-07-29孙亚男于长禾
张 英 陈 红 孙亚男 于长禾
1.北京中医药大学第一临床医学院,北京 100700;2.北京中医药大学东直门医院推拿科,北京 100700;3.北京首都医科大学宣武医院中医科,北京 100053
临床试验基于报告的结局指标评估干预措施的有效性和安全性。然而临床研究中的结局指标存在异质性及选择性报告偏倚的风险[1],可能导致使用无效甚至有害的干预措施,并浪费已经有限的卫生保健资源[2]。有效性试验核心结局测量倡议(COMET)[3]提出建立在特定临床领域的所有试验中进行测量和报告[4]的一套公认的标准化核心结局指标集合(COS)解决上述问题。
随着COS 相关研究所涉及疾病类型的增多,Comet 数据库可根据疾病检索已构建的和正在进行的COS 研究[5-6],然而不同研究选择的结局指标概念框架不一致,如新型冠状病毒肺炎(COVID-19)COS 构建的3 个研究中,世界卫生组织(WHO)[7]团队、天津[8]团队、北京[9]团队COVID-19 的COS 研究中结局类别都不一样,同一疾病COS 结局框架尚未达成共识。结局指标与人群特点和干预相关,不同试验中对结局概念框架选择的不一致阻碍了研究之间的比较与合并,不能突显人群疾病的特点,失去了洞察干预起效机制的机会,而且研究人员缺少对特定结局的所有干预措施的比较,导致其重复工作、研究浪费。此外,现有结局概念框架能否涵盖所有疾病COS 内容还有待考量。COMET 网站可以通过人群、干预措施进行检索COS 的研究信息,但还不能根据结局分类进行检索[10]。因此,本文参考Idzerda 等[11]对结局概念框架系统综合的结果及后续研究提出的与健康、疾病及其结局相关的框架,对现有结局概念框架进行叙述性综合比较,分析各框架特点,以期推荐对所有疾病COS 适用性最好的概念框架。
1 现有结局指标概念框架
1.1 WHO 织对健康的定义
WHO 将健康定义为“一种完全的身体、精神和社会美好的状态,而不仅仅是没有疾病和虚弱”[12],此定义可视为健康的框架,包含身体、心理、社会3 个核心域,将健康扩展到心理、社会层面。然而,框架涵盖范围过于宽泛,对于健康域的制订方法及如何测量没有进一步的论述,并且,有学者认为完全的身体、心理、社会健康的状态接近于幸福而非健康,对健康和幸福概念的混淆可能会导致幸福感稍有减弱便被视为不健康的状态[12]。因此,它可能并不适用于所有疾病的结局概念框架。
1.2 5Ds
5Ds 是一个评估临床结局的实用性概念框架,该框架通过5 个独立的维度来表示结局:死亡(death)、不 适(discomfort)、残 疾(disability)、药 物 毒 性(drug toxicity)、成本(dollar cost),每个维度代表一个与患者病情直接相关的结局,这些结局维度的量化可通过访谈或患者问卷进行[13]。5Ds 框架指导了与结局测量相关的工作,尤其在类风湿性关节炎领域被测量和验证。目前,5Ds 框架已用于风湿学中的结局测量(OMERACT)内COS 的开发。
1.3 国际功能、残疾和健康分类(international classification of functioning,disability and health,ICF)
ICF 基于生物-心理-社会模式,侧重于疾病的负担和损害[14]。ICF 框架包含个人和社会因素影响下的身体功能、身体结构、活动和参与、环境因素,将人的功能划分为3 个层次:在身体部位层面的功能(如胰腺结构功能、心血管结构功能)、整个人的功能(如代谢功能、感觉功能、情绪功能)以及在社会背景下的整个人的功能(如家庭关系、心理需求、社交、休闲体育等)。ICF 框架的优势是它适用于不同卫生专业人员的工作领域,不局限于诊断范畴[15]。ICF 框架已用于特定健康状况相关核心集研究,例如糖尿病[16]、类风湿性关节炎[17]、职业康复[18]等。
1.4 患者报告结局测量信息系统(patient-reported outcomes measurement information system,PROMIS)
PROMIS[19]框架保留WHO 健康框架,将自我报告的健康状况分为身体健康、心理健康和社会健康,身体健康包括症状和功能,心理健康包括情感、行为和认知,社会健康包括关系和功能。PROMIS 项目始于2004 年,旨在改变临床研究和实践中患者报告结局的方式,PROMIS 框架还没有明确用于COS 构建。目前,该系统包括超过300 项用于一般人群和患有慢性疾病的个人的生理、心理和社会健康的测量。
1.5 Porter’s 结局层次(Porter’s outcome hierarchy)
Porter’s 结局层次[20]指的 是由Porter 提出的一个3 层层次结构的概念框架,每一层次都包含两个级别,代表患者健康的特定方面,每一级别涉及一个或多个结局维度,其中最高层通常是最重要的。第一层称为“达到或保持健康状态”,测量的两个级别是生存率和健康/恢复程度:第一级生存率,对大多数患者来说是压倒一切的重要指标;第二级是在高峰或稳定状态时达到或保持健康或恢复程度,通常包括免于疾病和功能状态相关层面等维度。第二层与恢复过程相关,包含恢复时间和治疗过程两级,恢复时间指的是实现康复和恢复正常或最佳功能所需的时间,可分为完成护理的各个阶段所需的时间,治疗过程指的是护理或治疗过程中的不适、重新治疗、短期并发症等。第三层是健康可持续性,包含保持健康状态和治疗产生新的问题两级:第一级指原发疾病的复发或较长期的并发症;第二级指由于治疗而产生的新的健康问题,当复发或出现新的疾病时,必须重新评估所有结局。
1.6 健康相关生活质量(HRQL)概念模型
Wilson 等[21]开发了HRQL 概念模型,该模型提出了不同干预措施的健康结局分类方案,包含5 个层次:生物和生理因素、症状、功能、总体健康认知和整体生活质量。除了对结局指标进行分类外,该模型还提出了层次之间特定的因果关系,将传统的临床变量与HRQL 指标联系起来,在这个模型中,从生物和生理因素类别向整体生活质量类别移动的过程即是从细胞到个体再到社会成员之间的相互作用过程。每一层的概念都越来越一体化,逐渐不易定义和度量,也不再简单由医生进行评估。
1.7 OMERACT Filter 2.0 核心集框架
自1992 年以来,OMERACT 共识倡议已经成功地为许多风湿病开发了核心集,随着其涉病范围的扩大,需要制订其基本概念框架,通过文献检索和风湿病学利益相关者的迭代共识过程,2012 年OMERACT 会议讨论了核心集合的概念框架草案和开发过程,形成了OMERACT Filter 2.0[22]框架,该框架包括3 个核心域,即死亡、生活影响、病理生理表现,资源利用被强烈推荐。该框架以风湿病为基础,构建过程包含其他医学专科专业人员的投入使其尽可能通用,但该框架还不够详细,不能提供核心域以外的结局的标准化分类。
1.8 Cochrane 结局框架
Davey 等[23]在Cochrane 系统综述数据库根据医学专业、干预措施类型和结局类型,对每个meta 分析进行分类,得到了11 类结局:反映病情持续/结束的体征/症状、不良事件、新的急性/慢性病的感染/发病、生物标志物、一般身体健康、产科结局、全因死亡率、资源使用/住院/流程、特定原因死亡率/重大发病事件/复合(死亡率或发病率)、其他结局(半客观:外部结构、内部结构、与手术/设备相关的成功/失败、退出/脱落)、其他结局(主观:疼痛、心理健康结果、生活质量/功能、消费、护理满意度、复合(至少1 个非死亡率/发病率)。Smith 等[24]汇总在Cochrane 综述中使用的结局作为临床试验的核心结局测量内容,确定了15 个结局类别,分别是死亡率/生存率、生理/临床、感染、疼痛、日常生活活动、社会心理、生活质量、依从性、退出治疗/研究、满意度(患者、护理人员、医疗保健提供者)、药物治疗、经济、住院、手术、不良事件。此外,Cochrane 与COMET 合作开发了结局类别集,共14 类,分别为生理或临床、死亡率、感染、疼痛、心理健康、功能、生活质量、社会心理、治疗依从性、不良事件、护理的满意度、资源利用、退出研究、干预失败,用于Cochrane 系统评价的初始注释。3 种分类均未能建立具有层次化的结局框架。
1.9 Williamson/Clarke 结局框架
为了系统全面的对所有临床试验结局进行分类,Williamson/Clarke 等[11]基于Smith 等开发的结局指标15 类别表改良形成12 类别版本,分别为死亡率/生存率、生理/临床、感染、疼痛、功能(身体、心理、社会)、社会心理、心理健康、HRQL、依从性(包括停止治疗)、满意度、资源利用(经济、住院、手术、药物)、不良事件。12 个类别的版本随后进一步发展,形成了死亡、生理或临床、生活影响、资源利用、不良事件5 个核心域,以及死亡率/生存率、血液和淋巴系统结局、心脏结局、先天性、家族性和遗传性结局、内分泌结局、耳与迷路结局、眼睛结局、胃肠道结局、一般结局、肝胆结局、免疫系统结局、传染和感染结局、伤害和中毒结局、新陈代谢和营养结局、肌肉骨骼和结缔组织结局。与肿瘤相关的结果:良性、恶性和未指明(包括囊肿和息肉)、神经系统结局、妊娠、产褥期和围产期结局、肾和尿液结局、生殖系统和乳房结局、精神病结局、呼吸胸部和纵隔结局、皮肤和皮下组织结局、血管结局、身体功能、社会功能、角色功能、情感功能、认知功能、整体生活质量、感知健康状态、护理提供、个人情况、经济、住院、需要进一步干预、社会/照顾者负担、不良事件等38 个结局类别的概念框架。将这一新的分类方法应用于COMET 数据库中的COS,发现92%COS 至少包括一种生理结果,59%COS 包括至少一种生活影响领域的测量,35%的COS 提到不良事件,数据表明该结局框架适用性好,在COMET 网站可详询该框架内容。
2 Williamson/Clarke 结局框架优势分析
将8 个结局指标框架与Williamson/Clarke 框架比较(见表1)。WHO 对健康的定义中身体、心理、社会属于核心域,没有下属结局类别标准化分类,并且其身体、社会等含义宽泛。如WHO 对健康的定义中的身体层面包含Williamson/Clarke 结局框架生理或临床、身体功能等,社会层面包含社会功能、角色功能、个人情况、资源利用等。因此,不能简单地将WHO健康定义中身体、心理、社会理解为Williamson/Clarke结局框架中的身体功能、情绪功能、社会功能。5Ds 框架中死亡对应Williamson/Clarke 框架的死亡/生存,药物毒性对应不良事件,成本对应资源利用中的经济,不适属于生理/临床中的一般结局,一般结局包括不能归因于身体某系统的影响全身的疾病,例如疲劳、寒战、不适、厌食症、症状(与特定身体系统无关)等。残疾属于生活影响中身体功能的一部分,身体功能指疾病对日常生活、体育活动的影响,例如,自理能力、残疾指数、性功能等,5Ds 框架缺乏生理或临床核心域下详细的类别。ICF 框架中的身体功能指的是身体的整体生理功能,如排尿功能、意识功能,涵盖范围广泛,从生理层面对身体功能进行描述,而Williamson/Clarke 框架的身体功能从生活影响方面进行表达。ICF 框架身体结构是身体系统或部位层面的功能,可对应Williamson/Clarke 框架生理或临床域中各系统功能。因此,ICF 框架身体功能、身体结构归为生理或临床核心域。Williamson/Clarke 框架社会功能指疾病对社会功能的影响,例如社交能力、沟通、心理社会发展、参与等,角色功能是疾病对角色的影响,例如照顾儿童的能力、工作状况等,个人情况指与患者的财务、家庭和环境有关的结局,ICF 框架中活动和参与可归为社会、角色功能,环境因素如家人、社会态度,法律,政策等可归为个人情况。ICF 框架更关注功能,并不能涵盖所有核心域及类别。PROMIS 框架中身体症状归为Williamson/Clarke 框架生理或临床核心域,生理或临床核心域包含身体各系统的疾病症状、体征、理化检查等系列结局,对于不能归为某一身体系统的疾病情况则归为一般结局,两个框架中身体功能是相互对应的。Williamson/Clarke 框架精神病结局包括所有与心理健康状况和相关行为有关的结局(例如成瘾和行为问题),情绪功能指疾病对情绪及整体幸福感的影响,心理健康情感归为情绪功能,心理健康行为可归为精神病结局,认知归为认知功能,社会健康归为社会功能。Porter’s 层次框架生存率归为死亡/生存,Williamson/Clarke 框架中死亡/生存包括全因生存/死亡率和特定原因的生存/死亡率,以及无疾病生存,无进展生存等。保持健康或恢复程度、恢复时间、治疗过程、保持健康状态归为生理或临床核心域,与干预相关的治疗和非治疗反应如无效、治疗失败等及一般症状改善、恶化、并发症、复发、出院等可归为一般结局,由于治疗而产生的新的健康问题归为不良事件。Porter 的层次结构框架注重时间,更适合急性和可逆性疾病。HRQL 概念模型中生物和生理因素、症状可对应生理或临床,功能对应生活影响,两框架中整体生活质量是相互对应的,感知健康状态指受影响个体对其相对健康水平的主观评分,总体健康认知可对应感知健康状态。OMERACT Filter 2.0 核心集框架和Williamson/Clarke 框架在死亡、生活影响、生理或临床3 个核心域是对应的,OMERACT Filter 2.0 核心集框架中资源利用只是强推荐,未提到不良事件核心域。Cochrane 框架推荐的结局类别可分别归属于Williamson/Clarke 框架结局类别,虽包含了5 个核心域的内容,但未建立有条理的层次结构,结局类别不够详细。
表1 结局指标框架比较
3 小结
现有结局框架多为核心域,没有结构化的分级,缺乏标准化的结局类别,并且,有的仅适用于特定疾病,有的仅包含患者结局,不适用于所有疾病的分类,不能提供核心域外的详细结局类别。相较而言,Williamson/Clarke 结局框架层次结构较为清晰,包含结局核心域和类别,内容全面,提供了适用于所有疾病潜在结局详细的分类,保证研究之间结局表达的一致性,有助于了解改善特定结局的相关干预,方便临床数据搜索、报告和分类,而且该框架未来可以将其他框架的内容进行统一归类,方便横向比较,减少研究浪费,可用于所有试验、COS、系统评价及临床试验注册。Williamson/Clarke 结局框架该框架适用于个人层面的结局分类,不适用于家庭或社区干预试验的健康结局分类,针对特定的干预措施的相关结局也需要进一步详细分类[25],未来将进一步细化研究。