脊柱疾病患者报告结局测量工具及其应用的研究进展
2022-11-18吕小伟陈林路磊方斌
吕小伟 陈林路 磊方斌
脊柱疾病可发生于不同年龄段的患者,且常常严重影响其生活质量。医生对于此类疾病治疗后的评估多数依据并发症发生率和影像学表现,如出血量、感染率、力线是否纠正、植骨是否融合、内固定有无松动等临床报告结局,但实际工作中这些内容无法真实反映治疗对于患者生理、心理、社会状态的影响。随着“以患者为中心”的医学服务理念不断深入,从患者角度出发提供疾病及手术相关的各类体验显得愈发重要。患者报告结局测量(patient-reported outcome measures,PROMs)是患者基于自身感受完成的评价,是临床报告结局的重要补充。医患关系中,患者会向护理人员倾诉治疗后的主观感受,这种来自患者的反馈对临床判断、护理策略制定和落实具有重要意义。脊柱疾病PROMs量表分为普适性和特异性两类,普适性量表如简明健康调查量表(short form,SF)36、SF-12、五维欧洲生活质量评价(European quality of life-5 dimensions,EQ-5D)等,侧重于患者身心健康状况的整体评价,和脊柱疾病联系不紧密,特异度及灵敏度较低。特异性量表则着重于评价如颈椎病、腰椎间盘突出、腰椎管狭窄等各类脊柱疾病诊疗前后所表现的症状,如疼痛(含躯干疼痛和肢体放射痛)、肢体运动功能障碍、大小便功能障碍等,但对于患者生活质量的整体评价可能存在不足。在实际应用中,这些量表并没有被合理利用,为此,本文对主要特异性量表的起源、内容、应用现状及目前存在的问题作一综述,为临床和护理工作决策提供参考。
1 脊柱主要特异性PROMs量表的起源、内容及应用现状
1.1 腰椎评价指标
1.1.1 Oswestry功能障碍指数(Oswestry disability index,ODI)ODI于1976年由Fairbank等[1]制定,经国际腰椎研究学会(International Society for the Study of the Lumbar Spine,ISSLS)广泛传播。ODI采用问卷调查方式对患者疼痛、生活自理、提物、步行、坐位、站立、睡眠、性生活、社会活动、旅游等10个方面进行评价,每个方面根据严重程度计0~5分,计算受试者分数占所回答项目总分的百分比,即为ODI分值[2]。由于简便易懂,ODI指数已成为最广泛的腰痛评价指标[3-7]。郑光新等[8]将ODI翻译成中文版,保留了除性生活外的其余9项指标(最高分为45分),同时调整部分项目使其更符合国人习惯。但由于ODI没有直接评估患者情绪或心理的题目,对轻中度腰痛患者没有对应选项,灵敏度不强,患者容易给出模棱两可的答案。
1.1.2 Roland-Morris功能障碍问卷表(Roland-Morris disability questionnaire,RMDQ)1976年Roland和Morris首次提出RMDQ,该问卷由24个问题组成,均用“由于腰背痛”加以限制,以区分其他原因所致的功能障碍,用于评价测试前24 h内的患者状况。这些问题涵盖行走、站立、弯腰、卧床、穿衣、睡眠、生活自理、日常活动等8个方面,回答“是”计1分,“否”计0分,实际得分为0~24分。原版RMDQ还包含1个疼痛量表,但目前已被SF-36量表代替[9]。RMDQ被多数学者认为具有中等到优良的效度[6,10],结构效度优于ODI,更适合评价腰背痛治疗前后的短期变化,但由于缺乏精神和社会健康方面的评估,该量表对重度功能障碍的患者不太敏感。
1.1.3 核心结果测量指数(core outcome measures index,COMI)COMI包含6个核心指标,分别是腰痛/下肢反射痛、腰痛所致的日常工作影响程度、腰痛所致的一般健康状况或幸福感、腰痛所致的日常活动中止天数(近4周内)、腰痛所致的社会活动中止天数(近4周内)以及对腰腿痛治疗的评价等[11]。除了日常活动和社会活动的中止以天衡量外,其他评价以0~5分量化。该量表被国际注册机构Spine Tango用于记录所有患者的临床数据,以评估脊柱手术的有效性和安全性[12]。Ferrer等[13]的研究认为,COMI量表可重复性和内部一致性良好,有效性与SF-36及ODI相近,灵敏度同ODI。
1.1.4 Quebec腰痛障碍评分量表(Quebec back pain disability scale,QBPDS)QBPDS由20个问题组成,涵盖生活自理、睡眠、上楼、坐下、站立、搬物、弯腰、运动和家务等日常活动,社会生活及性生活状况不在评价范围内[14]。每个问题的答案分为6档,分值为0~5分,0分表示“完成毫不费力”,5分表示“不能完成”,总分100分,分值越高表示功能越差。由于对功能变化较为敏感,QBPDS更适合用于临床疗效评价和患者康复过程的监测,但同时由于缺乏相关项目,有时候需与疼痛评价量表结合。目前该量表翻译版本较少,使用不及RMDQ和ODI广泛。
1.1.5 日本骨科协会评分表(Japanese orthopaedic association,JOA)-29 JOA-29是一套用于评价腰椎疾病疗效的工具,包括症状、体征、日常活动和膀胱功能等4项评分,每项有1个或多个问题,总分29分,分值越低则功能障碍越明显[15]。此后JOA推出的下腰痛问卷调查表(Japanese orthopaedic association back pain evaluation questionnaire,JOABPEQ)[15]被认为是前者的升级版本。该问卷包含5个分量表25个项目:腰痛(4项)、腰椎功能(6项)、行走能力(5项)、社会生活功能(4项)和心理健康(7项),相较于前者,JOABPEQ减少了膀胱功能的比重,减轻了老年人其他原因所致膀胱功能障碍的影响。该表于2018年被引入国内,证实具有较高的内部一致性和可重复性[16],可为国人评估下腰痛提供参考。
1.1.6 Zurich跛行问卷(Zurich claudication questionnaire,ZCQ)ZCQ跛行问卷专门用于评价腰椎管狭窄结局[17],内容包括特定症状的严重程度、身体功能和整体满意度。其中“症状严重程度”主要关注患者背部和腿部的平衡障碍、疼痛和神经缺血症状,“身体功能”主要关注患者步行活动的能力,“患者满意度”则用来反映患者对手术的总体满意度、疼痛缓解情况、行走能力以及术后做家务或工作的能力。评分标准为症状严重程度7项,每项1~5分,功能障碍5项,每项1~4分,治疗满意度6项,每项1~4分,得分越高表明椎管狭窄越严重。该问卷目前已被翻译成多种语言,成为评估椎管狭窄患者治疗效果的主要指标之一[18-20],在两组评价脊柱动态稳定装置(X-STOP,瑞士美敦力)有效性的临床研究中指标明确,结论可靠[21-22]。ZCQ针对性较好,但目前并未广泛应用。
1.1.7 坐骨神经疼痛指数(sciatica bothersome index,SBI)SBI用于评价坐骨神经症状[23],该指数包括4个维度:即腿部疼痛,腿部/足部或腹股沟区的麻木或刺痛症状,腿部或足部无力,坐位背痛或腿痛。每个维度根据症状严重程度计0~6分,综合得分用于最终评价损伤程度。SBI已被证实对腰椎管狭窄具有特异性,可较准确评价患者现况和其后的干预措施,已被权威的腰椎手术干预试验所采用[24-26],其中3项被纳入COMI中[27],但并未收到广泛关注。
其他评价指标如北美脊柱协会(North American Spine Society,NASS)腰椎问卷和Macnab腰背痛手术评定标准,前者由NASS提出,可用于评估神经症状和肢体功能,但目前使用率较低;后者主要根据症状的缓解程度及日常工作影响情况将效果分为优、良、可、差4个等级,由于评定标准较为粗略,现已逐渐被ODI等其他更精确的评价方法替代。
1.2 颈椎评价指标
1.2.1 JOA-17 JOA-17最早于1975年提出,用于评价颈椎外伤后的结局,主要包括运动、感觉和泌尿自主功能等3个维度[28],根据症状的严重程度赋分,其中运动功能分成上肢运动(0~4分)、下肢运动(0~4分),感觉功能分成上下肢和躯干感觉(分别计分0~2分,总分0~6分),膀胱功能0~3分,总评分为0~17分。经过修订形成2个版本,其一是在原版基础上增加了肩部和肘部功能评价,并对其他评分进一步细化[28]。相较原版,该版本目前已成为亚洲国家评价颈部脊髓损伤最广泛的系统。其二则是在JOA-17的版本上修订部分内容[29],使之更适合于西方人群,现已成为欧美国家的评价颈椎外伤的主要指标。其他的修订版本[30-31]由于研究人群较少,因而也未有较大的使用率。
1.2.2 颈部功能障碍指数(neck disability index,NDI)NDI是在ODI基础上进行修改的适用于颈部损伤的评价量表[32],由头痛、颈痛、注意力、阅读、个人护理、提物、睡眠、驾驶、工作、性生活等10个问题组成,每个问题根据严重程度从轻到重分别计0~5分,总分为0~50分。该量表目前已广泛用于评价急性或慢性颈椎损伤,澳大利亚和国际指南都推荐它作为评估急性会变样损伤和其他颈部疼痛患者的合适工具[33-35],为仅次于JOA-17的评价系统[36]。
1.3 脊柱长节段矫正术的评价指标
1.3.1 腰椎僵硬功能障碍指数(lumbar stiffness disability index,LSDI)LSDI用于评价退行性脊柱侧凸患者长节段融合术后的功能[37],该指标由10个日常动作组成,如弯腰穿内衣裤、弯腰穿鞋、驾驶机动车、如厕、弯腰拾物、上下床、坐椅、沐浴下身、进出汽车及性生活等,每个项目根据有无影响计0~4分,4分表示无法做到。Choi等[38]根据韩国人的生活方式修改了部分条目,使其适用于韩国国民脊柱侧凸术后的评估。Zhang等[39]在前两者基础上,根据中国国情再次修订,如将失访率较高的驾驶机动车、性生活等条目删除,增加了部分适合中国人的评价标准,LSDI的中国版本(C-LSDI)共分11个条目,每条目计0~5分,由于更符合国人生活方式,C-LSDI具有优异的内部一致性、有效性和可重复性。
1.3.2 脊柱侧凸协会问卷调查表(scoliosis research society out-comes questionnaire,SRS)-22 SRS-22是 评价脊柱侧弯患者生活质量的量表[40-41],包含功能、疼痛、心理健康、自我形象和治疗满意度等5个维度,分别评估当前的运动水平和脊柱活动度,过去几个月的疼痛、使用的药物以及因背痛而生病的天数,评估焦虑、抑郁等心理感受,审美和自信程度,患者对治疗结果的满意度等。除治疗满意度总分为2~10分外,其余维度均包含5个问题,每个问题由轻到重计1~5分,总分为110分,用每个维度的平均值(该维度总分除以回答的问题数)表示最终结果。SRS-22可全面评估该疾病,并获得受试者对临床医生治疗结果的反馈。Bridwell等[42]研究表明,在退变性脊柱侧凸患者围手术期评价中,SRS-22比SF-12和ODI更能反应患者真实情况。
2 脊柱特异性PROMs量表存在的问题及展望
随着循证医学和价值驱动医疗的日益发展,来自患者报告的功能评价在骨科领域中越发显得重要,然而目前的评价量表大多基于某一特定疾病状态或解剖位置制定,其本身即存在缺陷,如等[43]认为大部分脊柱特异性PROMs量表忽略了对肢体功能的评价,一些学者则指出,传统的评价方法,由于受访者答题时间过长、内容过多或填写不完整,可能会明显影响评价结局,同时目前的各种量表在数据记录方面均显得比较繁琐[44-46]。为解决这一困境,美国国立卫生研究院于2004年开发了患者报告结局测量信息系统(patient-reported outcomes measurement information system,PROMIS)[47]。该系统最初的量表包括三大领域,即身体健康(physical health,PH)、心理健康(mental health,MH)和社会健康(social health,SH)。其中身体健康包含躯体功能、症状、睡眠功能、性功能等4部分,心理健康包含睡眠功能、性功能、情绪障碍、认知功能、积极心理功能等5部分,两者存在部分交叉,而社会健康由社会功能和社会关系两部分组成。以上每部分又细分为各分条目,如躯体功能含上下肢、躯干和日常总活动度等组成,情绪障碍由焦虑、抑郁、愤怒、药物滥用等组成。随着时间推移这些量表不断被修订和增补,截至2020年4月9日,成人版PROMIS已涵盖102个领域,1 903个条目[48]。在实际应用过程中,PROMIS可根据评价需要,选择某一领域的部分条目或根据应答者前面的答案,在条目池中随机选择4~12个测量精确度比较高的条目进行评价,这一策略被称为计算机自适应测验(computer adaptive tests,CATs)[49]。CATs不仅减少了评价工作量,缩短了评价时间,且避免了较长问卷导致的患者疲劳、注意力不集中和对答案的考虑不够彻底的缺陷[44],因而测量结果更准确,在不同专业中被证实具有高效应和可重复性[50],成为国际上评估患者生理、心理和社会健康结局最精确可信的信息化测量工具系统。此外该评估系统在脊柱外科领域也有部分研究报道,并可用于预测脊柱手术后的结局[43,49,51-54]。
中国的PROMIS起步较晚,仅少数团队率先引进儿童PROMIS系统[48],用于我国慢性病患儿的结果评价,并对其电子化进行了探索,但仍需要进一步推广,同时做好本土化工作和进行临床研究。首先,PROMIS国际官方组织推出的APP可以在iPad上实现电子化,针对国人现状,仍需要进一步评估相关指标对于国人评价的可行性,并开发相应的APP、微型小程序等前端应用,以便更高效便捷地服务于临床和护理工作;其次,国外的PROMIS多融入到医院的电子信息系统,国内对此项工作,基本处于空白阶段,相关的工作需积极推进,以便于进行相关数据的采集和共享;最后,建议将含PROMIS的医疗系统覆盖各级医院,便于对患者的全程健康状况进行监管,打破三级医院、社区医院、家庭和个人的壁垒,这将极大提高高危人群筛查和识别、疾病的预防和早期干预、术后并发症的快速识别和控制等各项工作效率,为全民健康助力。