APP下载

临床结局测评工具修订的现状及流程思考:以慢性阻塞性肺疾病患者报告结局量表修订为例

2020-08-17王佳佳谢洋李建生

中国全科医学 2020年29期
关键词:修订版信度条目

王佳佳 ,谢洋 ,李建生 *

临床研究通常涉及疾病的病因、诊断、治疗和预后等环节。疗效指标的选择、测量和比较是评价治疗效果的关键因素,根据来源不同,疗效指标可分为生物标志物和临床结局评估[1]。临床结局指各种干预治疗对患者产生受益或伤害的临床结果,是临床试验设计的一个要素,其本身的临床价值是衡量某项试验是否具有临床意义和能够推广应用的首要条件[2]。临床结局评估包括患者报告结局、医生报告结局、观察者报告结局和表现结局4个方面[1,3]。其中患者报告结局、医生报告结局和观察者报告结局分别从患者自身、医生和观察者角度报告患者的健康状态和治疗结果,是应用较广泛的结局评估方法[1]。三者可从不同角度为干预措施的疗效评价提供证据支持,是疗效评价指标体系的重要组成部分。

临床结局的测评需借助有效的测评工具。目前患者报告结局测评工具的研制与评价方法已相对成熟,医生、观察者报告结局测评工具的研制与评价可结合报告主体并借鉴患者报告结局测评工具研究方法[4-5]。患者报告结局测评工具的研制主要包括建立测评工具概念框架,调整概念框架并形成初步测评工具,明确概念框架并评价测评工具的心理测量学特性,搜集、分析和解释数据以及修订测评工具等5个步骤,是一个循环反复的过程[4,6]。可见,修订测评工具是优化测评工具的必要途径。近年来,随着不同报告主体的临床结局测评工具逐渐增多,暴露出一些问题,如从国外翻译的测评工具欠缺跨文化调试和适用性评价、国内自行研制的测评工具方法学和报告质量有待提高等,限制了临床结局测评工具的推广应用。因此,有针对性地开展临床结局测评工具修订工作显得尤为必要。当前临床结局测评工具的修订流程尚缺乏统一规范,为此本文系统梳理了测评工具修订的现状及方法,进一步参照国际量表研制规范,借鉴国内研究重要成果,以慢性阻塞性肺疾病患者报告结局量表(COPD-PRO)的修订工作为示范,初步提出临床结局测评工具修订流程,以期为相关研究提供指导。

1 测评工具修订的现状

1.1 国外测评工具的引进 目前应用较广泛的临床结局测评工具多开发并应用于欧美国家,由于文化背景、价值观、生活习俗和语言等不同,需进行适当调适,使之成为适合本国文化背景的新测评工具,并进行心理测量学特性及适用性评价[7-8]。翻译改造国外的测评工具具有规范的程序,包括测评工具的翻译及回译、测评工具的文化调适和测评工具的考核等[7-8]。目前国内外大量测评工具采用这种途径开发。国际上,生存质量普适性测评工具——世界卫生组织生存质量测定量表(WHOQOL-100)已被开发成至少15个版本,广泛用于测评气道阻塞性疾病患者生存质量的圣·乔治呼吸疾病问卷(SGRQ)已被翻译成至少77个版本。在国内,李鲁等[9]研制并验证了健康调查简表(SF-36)中文版,郝元涛等[10]制定了WHOQOL-100及其简表(WHOQOL-BREF)中文版。

1.2 现有测评工具的优化 测评工具优化的内容涉及条目形式、反应尺度、回忆周期、条目数量及顺序、计分规则和管理方式等方面,其中简化测评工具,形成简版较为常见。适度增加条目数量,可提高测量信度;但条目冗长可能引起被调查者的疲劳和反感,直接影响依从性,降低测量信度[6-8,11]。因此,选择可行而有效的测评工具施测尤为必要。当前一个重要途径就是对现有测评工具进行修订并进行心理测量学特性评价。国际上,世界卫生组织(WHO)制订了WHOQOL-100,并在此基础上简化形成 WHOQOL-BREF[7]。在国内,侯政昆等[12]基于条目反应理论、计算机自适应测试及数据模拟研制了胃痞患者报告结局量表简短版,陈新林等[13]研制了鼻咽癌患者生存质量简短版量表,朱燕波等[14-16]采用不同方法编制简短版中医体质量表。

2 测评工具修订的方法

2.1 经典测量理论 经典测量理论具有数学模型简单等优点,是应用最广泛的测量理论,主要用于条目筛选和测评工具评价。基于经典测量理论的条目筛选方法,包括主观评价法、离散趋势法、相关系数法、因子分析法、聚类分析法、逐步回归分析法、逐步判别分析法和克朗巴赫α系数法等,各种方法从不同角度筛选条目,各有优缺点,在实际运用中根据研究内容、目的和资料收集情况等进行适当选择,可以选择其中一种,也可以把几种方法结合起来进行分析[6-8]。测评工具评价内容包括信度(重测信度、复本信度、分半信度、内部一致性信度和评分者信度等)、效度(内容效度、结构效度和标准效度等)、反应度、可行性以及天花板与地板效应等[5]。

2.2 现代测量理论与技术 经典测量理论框架存在先天缺陷,随着测量实践不断深入,局限性日益显现,表现在信度估计精度不高,误差指标笼统单一、不精细,各种参数的估计对样本的依赖性太大,各参数指标之间的配套性较差等[11]。因此,引入现代测量理论与技术进行测评工具修订与评价逐渐受到重视。

2.2.1 项目反应理论 项目反应理论是针对经典测量理论局限性提出来的一种现代测量理论,具有项目参数的跨群体不变性、潜在特质量表的可选择性、参数设计的科学性、信息函数概念的引进与信息函数的可加性等特点[11]。项目反应理论是应用最广泛的现代测量理论,主要用于条目分析与评价。国际上,MEGURO等[17]应用项目反应理论的Rasch模型对SGRQ进行修订,形成慢性阻塞性肺疾病专版。在国内,李佳玲等[18]基于项目反应理论修订WHOQOLBREF。

2.2.2 概化理论 概化理论是在经典测量理论的基础上创建的从宏观上研究测验性质的一套全新的概念体系,从深入分析测量误差的来源和结构出发,应用方差分量分析辅助测验研究,为测量理论的发展开辟了一个新方向[11,19]。概化理论主要用于信度估计,目前已应用于鼻咽癌[20]、白血病[21]、肠易激综合征[22]和冠心病[23]等多种疾病生存质量研究中。

2.2.3 计算机自适应测试技术 计算机自适应测试是以计算机为媒介的量体裁衣式测验,是项目反应理论最具特色的应用,也是当今测验形式发展的一个重要方向,能够在确保测量精度的同时提高测试效率[24]。近年来计算机自适应测试已应用于多种疾病生存质量研究中,如背痛[25]、慢性阻塞性肺疾病[26]、哮喘[27]和肺癌[28]等。

3 测评工具修订流程的初步提出

参照国际量表研制规范[4],借鉴国内研究重要成果[6-8,29-31],并结合 COPD-PRO 修订工作[32-35],本文初步提出临床结局测评工具修订流程(见图1),主要包括14个环节,可循环进行。①测评工具修订的必要性分析,即分析当前临床结局测评工具的局限性以及开展修订工作的必要性与迫切性。②成立测评工具修订小组,即成立人员结构合理的研究小组,必要时可成立专家委员会和学术委员会等,为修订工作提供技术指导。③预设修订版测评工具基本特征,即预设测评工具类型、适用对象、测评工具目的、条目形式、反应尺度、回忆周期、条目数量及顺序、计分规则和管理方式等。④规范基本概念和术语,即规范修订工作可能涉及的基本概念和术语,包括量表、问卷、领域、条目、患者报告结局、医生报告结局、观察者报告结局、经典测量理论、现代测量理论、项目反应理论、概化理论、计算机自适应测试和认知采访等。⑤修订概念框架,即采用多种方法对当前测评工具的概念框架进行修订,修订部分要有充分的依据。⑥建立条目池,即在修订后的概念框架基础上,通过尽可能全面的方式收集相关条目,建立条目池。⑦评阅条目,即通过专家咨询等方式逐条评阅条目池中的条目,内容包括语言表达、条目形式和选项设置等。⑧形成修订版测评工具草表,即在条目评阅基础上,通过增减、合并和修改条目等形成修订版测评工具草表。⑨预调查,即采用修订版测评工具草表进行预调查。⑩条目分析与筛选,即基于预调查数据,采用经典测量理论和现代测量理论(项目反应理论、概化理论)方法等从不同角度分析与筛选优质条目。⑨~⑩可重复进行,直至形成理想的修订版测评工具。形成修订版测评工具,即删除性能不理想的条目后形成修订版测评工具。现场调查,即采用修订版测评工具进行现场调查。修订版测评工具评价,即基于现场调查数据,从量表测量学特性(信度、效度、反应度和可行性等)、条目属性(基于项目反应理论条目分析、条目功能差异分析等)、回答选项分布特征(天花板与地板效应等)多层次进行评价,并与原版测评工具进行比较。形成修订版测评工具网络版,即在传统纸笔版基础上,实现测评工具网络化,包括普通网络版(PC端、手机APP、微信等平台)和计算机自适应测试版等。

图1 临床结局测评工具修订流程Figure 1 The revision process of clinical outcome assessment tools

需要指出的是,根据研究需要,修订工作可能仅涉及其中部分环节,如在前4个环节基础上,通过“⑨预调查”“⑩条目分析与筛选”“形成修订版测评工具”等环节形成测评工具简短版。由于报告主体(患者、医生和观察者)不同,不同类型的测评工具在修订过程的某个环节可能存在差异,如“⑦评阅条目”环节,患者报告结局测评工具一般需患者参与,医生报告结局测评工具则需医生参与。专家咨询可贯穿测评工具修订全过程,也可针对部分环节,如“⑤修订概念框架”“⑦评阅条目”等。各环节并非相互独立,如通过“⑨预调查”进行“⑩条目分析与筛选”而“形成修订版测评工具”,基于“现场调查”进行“修订版测评工具评价”。此外,“形成修订版测评工具网络版”非必备环节,可结合网络、计算机硬件及软件等进行取舍。

4 小结

修订测评工具是完善测评工具的必要途径,也是生存质量研究的重要内容。当前测评工具的修订,可通过引进国外测评工具或优化现有测评工具。经典测量理论、现代测量理论与技术为测评工具的修订奠定了方法学基础,但修订流程尚缺乏统一规范。本文初步提出了临床结局测评工具修订流程,可能为相关研究提供依据或借鉴。然而鉴于现代测量理论/技术发展不完全成熟等因素,该流程不可避免地存在局限性,仍需在后续临床应用与科研实践中不断优化与完善,从而更好地为临床结局测评工具的修订提供指导。

本文文献检索策略:

检索数据库:PubMed、中国知网、万方数据知识服务平台、维普网和中国生物医学文献数据库。关键词:中文数据库:(“生存质量”OR“生命质量”OR“生活质量”)AND(“工具”OR“量表”OR“问卷”)AND“修订”;PubMed:″quality of life″ AND(″scale″OR ″ questionnaire″)AND( ″ revise″ OR″revised″ OR ″revision″ OR ″amend″ OR″ amended″ OR ″ amendment″ OR ″ modify″OR ″modified″ OR″modification″)。检索时间:数据库建库至2019年3月。纳入标准:公开发表的与生存质量量表修订相关的文献。排除标准:无法获取全文的文献。

作者贡献:谢洋、李建生进行文章的构思与设计,论文的修订;王佳佳进行研究的实施与可行性分析,资料收集、整理,撰写论文;李建生负责文章的质量控制及审校,对文章整体负责,监督管理。

本文无利益冲突。

猜你喜欢

修订版信度条目
《广东地区儿童中医体质辨识量表》的信度和效度研究
《词诠》互见条目述略
当代诗学研究的可喜收获——评李元洛《诗美学》修订版
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
长征(修订版)
《核材料实物保护公约》修订版正式生效
科技成果评价的信度分析及模型优化
体育社会调查问卷信度检验的方法学探索——基于中文核心体育期刊163篇文章分析
中文版脑性瘫痪儿童生活质量问卷的信度
续写故事(2)