肌肉衰减症专用生活质量量表SarQoL®研究进展
2020-10-26李海鹏卢健
李海鹏 卢健
1 浙江工业大学体育科学研究所(杭州310014)
2 华东师范大学体育与健康学院(上海200241)
生活质量(quality of life,QoL),又称生存质量或生命质量,既是社会学领域评价生活优劣的一个重要概念,也是医疗卫生与健康科学研究中一项典型的生存预测指标[1]。随着慢性病在人类疾病谱中的占比增加,传统的临床治疗结果指标(如治愈率)已难以反映慢性病的治疗效果,于是健康相关的生活质量(healthrelated QoL,HRQoL)逐渐成为衡量人类健康状况、医药疗效和疾病转归的有效评价指标。目前可用于HRQoL评定的工具包括普适性通用量表和疾病特异性专用量表两大类。
肌肉衰减症(sarcopenia)作为一种新知的老年人群多发的肌肉骨骼系统疾病(ICD-10-CM代码M62.84),不仅会造成老年人跌倒失能,而且还常作为诸多老年病或慢性病的并发症影响老年人的生活质量[2,3]。虽然已有报道将SF-36量表或EQ-5D量表等通用量表应用于肌肉衰减症患者的生活质量研究,但限于通用量表的特异性不足,研究结果并不一致,阻滞了人们对该病症防治工作的深入探索。多年来,肌肉衰减症专用生活质量量表的缺失使得当前对其后果的研究焦点仍集中在死亡率、机能减退、跌倒、骨折、住院与否和住院时间等6 个方面[4,5],难以全面多领域地揭示肌肉衰减症对患者的综合影响。2015年,有研究者研制推出了第一份肌肉衰减症专用生活质量量表(SarQoL®),并被欧洲老年人肌肉衰减症工作组(European Working Group on Sarcopenia in Older People,EWGSOP)纳入了2019年新版共识[6]。以该量表为突破点,可望使肌肉衰减症的研究焦点由“流行病学”这一外在表征向“生活质量”这一内在含义推进,并以此开展相关临床医学与非医疗干预研究,为积极老龄化和健康老龄化探寻路径。
1 通用生活质量量表的应用现状
目前有关肌肉衰减症患者生活质量的研究数量并不多。Beaudart等[7]综述研究显示,截至2016年共有11项研究单独或联合使用不同通用量表比较了肌肉衰减症患者与普通人群间的生活质量差异,但研究结果并不一致。在使用SF-36量表的7项研究中,仅有4项研究显示肌肉衰减症患者生活质量中部分领域有所下降[8-11];使用EQ-5D量表的3项研究中,仅有1项支持肌肉衰减症会造成生活质量下降[12]。究其原因,可能在于通用量表中仅部分条目与肌肉衰减症存在关联,因而无法全面详尽地反映肌肉衰减症对患者生活质量的影响,导致对肌肉衰减症患者与普通人群之间生活质量差异的区分度不高[13]。即使有研究支持肌肉衰减症患者HRQoL 水平会显著降低,但往往变化细节知之甚少,无法清楚辨别是因肌肉衰减症本身还是合并的其他疾病引起的生活质量改变,因此,肌肉衰减症患者的生活质量研究迫切需要一份疾病特异性专用量表[14,15]。
2 SarQoL®量表的研制过程及其组成结构
基于以上原因,Beaudart等[16]认为普适性通用量表无法针对性地反映出肌肉衰减症对生活质量的特定影响,因此于2015年组织多领域专家研发了第一份自填式肌肉衰减症生活质量(sarcopenia quality of life,简称SarQoL®)专用量表,并严格按照“条目生成-条目删减-量表生成-量表前测”等步骤,结合文献综述、患者访谈、专家咨询、集中讨论、规范语言等环节,最终将7 个领域(domain,简称D,见表1)中的55 项条目以22个问题的形式组成完整的法语版SarQoL®量表(详见www.sarqol.org)。
表1 SarQoL®量表和SF-36量表、EQ-5D量表的组成结构
与SF-36量表和EQ-5D量表这两种普适性通用量表相比,SarQoL®量表在与肌肉功能联系程度紧密的领域中共设置了46 个条目。其中涉及频率和强度的问题均以4~5级Likert评分法来进行评定,各领域还可单独计分,总分0~100 分,分数越低生活质量越差,整份量表做完大约需要10分钟。
3 SarQoL®量表的心理测量特征
为了规范生活质量测评,Hays 等[17]曾提出各类HRQoL量表形成后均应进行可行性、信度、效度以及反应度等心理测量学质量评价,其质量高低对量表调查结果的真实性、可靠性、有效性和适用性等具有决定性的作用,因此,SarQoL®量表的心理测量特征研究成为其推广应用的首要环节。
3.1 SarQoL®量表的信度检验
通常量表信度可由Cronbach’s α信度系数法、重测信度法、复本信度法、折半信度法等方法进行衡量,其中反映内在信度的Cronbach’s α系数和反映外在信度的重测信度系数最为常用。若Cronbach’s α值越大则量表条目间相关性越高,内部一致性越好,Cronbach’s α值达到0.8 以上则表示内部一致性非常好。对于重测信度而言,组内相关系数(intraclass correlation co⁃efficient,ICC)>0.90 即为高信度,0.75~0.90 为较高信度,0.40~0.75 为中等信度。基于此,Beaudart 等[18]依托比利时(Sarcopenia and Physical impairment with ad⁃vancing Age,SarcopPhAge)项目,征集了296 名平均年龄73.3 岁的老年志愿者进行研究,参照EWGSOP 共识标准确诊43 人为肌肉衰减症患者,并对其进行Sar⁃QoL®量表调查,结果显示,肌肉衰减症患者SarQoL®量表总分(54.7 分)显著低于普通人群总分(67.8 分),经年龄和身体质量指数(body mass index,BMI)校正后的得分比值比(odds ratio,OR)为0.93。肌肉衰减症患者在SarQoL®量表的7 个领域中均呈现出得分显著降低,提示该量表能够在细节上呈现出较好的区分度,一定程度上弥补了通用量表的不足。此外,反映量表总分内部一致性的Cronbach’s α系数为0.87,反映量表总分重测信度的组内相关系数ICC 为0.91(见表2)。因此,SarQoL®量表已初步显示出良好的信度效应。
表2 SarQoL®量表总分及各领域的区分度、相关性和重测信度
3.2 SarQoL®量表的效度检验
效度即准确度,指量表能够准确测出所测条目的程度,主要分为内容效度、准则效度和结构效度三种类型。其中准则效度(又称效标效度)由于分析时选择一个合适的准则往往十分困难,其应用受到一定限制,因此,内容效度和结构效度较为常用。内容效度主要通过单项与总和相关效度分析法测量,即计算每个领域得分与量表总分的相关系数,根据相关是否显著判断是否有效。SarQoL®量表7个领域中有4 个领域(D1、D2、D4 和D5)与量表总分呈现出显著的高相关性(r>0.70),其余3 个领域(D3、D6 和D7)与量表总分呈显著的较高相关性(r>0.40)(见表2)。由此可见,SarQoL®量表具有较好的内容效度。
结构效度不仅可由因子分析法求得,而且还可以将SarQoL®量表与普适性通用量表中相似或不同的领域进行相关分析,以聚合效度(同质效度)和分歧效度(异质效度)来体现。Beaudart 等[19]研究显示,SarQoL®量表总分与SF-36量表中5个相似领域和EQ-5D量表中2个相似维度的聚合效度均呈现出中等以上程度的显著相关关系(r>0.4);而且与SF-36 量表中2 个不同领域和EQ-5D量表中2个不同维度的分歧效度呈现出显著弱相关关系(r<0.4),其中由于EQ-5D 量表得分越高代表着生活质量越差,因此呈现出负相关。总体而言,SarQoL®量表与SF-36量表和EQ-5D量表相应领域或维度的聚合效度与分歧效度基本符合“聚强歧弱”的相关性特征(见表3),由此认为SarQoL®量表具有较好的结构效度。
表3 SarQoL®量表与SF-36量表、EQ-5D量表各领域/维度的聚合效度与分歧效度
3.3 SarQoL®量表的反应度检验
在临床生活质量评价中反应度检验主要是检测量表辨别患者治疗前后生活质量得分变化的能力。Kirsh⁃er等[20]曾指出,如果生活质量量表用于判别、描述或预测等目的,证实量表的信度和效度即可;但若用于临床疗效评价还需证实反应度。目前,SarQoL®量表的研究大多为肌肉衰减症患者健康状况处于相对“静态”状态下的横向研究,其在一段时间间隔前后健康状况“动态”改变的纵向研究中的应用效果是否依然良好需检验反应度。
然而,由于反应度检验耗时费力,迄今为止,仅有一项研究对SarQoL®量表的反应度进行了检验。Geerinck 等[21]选取SarcoPhAge 研究中的42 位肌肉衰减症患者为受试人群,基于不同量表间各领域相似程度,以2年间隔期前后SarQoL®量表得分变化(△SarQoL)与SF-36和EQ-5D量表中EQ-VAS得分变化(△SF-36或△EQ-VAS)之间相关性提出了9条假设(见表4),以期通过验证假设结果来评估SarQoL®量表的反应度,并通过计算标准化反应均数(即治疗或干预前后差值均数与差值的标准差的比值,standardized response mean,SRM)对不同量表测量的变化量进行比较。结果显示,9 条假设中有8 条通过验证确认,被拒绝的假设比例仅为11%,符合De Boer等[22]提出的量表质性评估时被拒绝的假设比例低于25%,反应度即为优的标准。此外,标准化反应均数计算结果表明,SarQoL®量表有3 项(总分、D4 和D5)呈现出中等变化(0.50≤SRM<0.80),而SF-36 量表仅1 项呈现出中等变化,EQ-5D量表则没有呈现出中等变化的领域。参照SRM值越大则量表的反应度越好的准则,SarQoL®量表总分的SRM值均分别显著高于SF-36量表(躯体健康维度)和EQ-5D量表的SRM值。基于以上结果,可以进一步确认该量表反应度较好,且优于普适性通用量表。
为了对SarQoL®量表有更深入的了解,Geerinck 等[23]依托前人开展的多项研究中278 位肌肉衰减症患者的SarQoL®量表得分数据,对该量表的测量标准误差(standard error of measurement,SEM)以及最小可测变化值(smallest detectable change,SDC)进行了计算,结果表明,现有各项研究中量表总分SEM为2.65分,SDC为7.35 分。只要个体SarQoL®量表得分变化≥7.35 分,即可确认生活质量已发生变化。
表4 SarQoL®量表的反应度评估假设及验证结果
3.4 SarQoL®量表的天花板/地板效应检验
天花板/地板效应,又称高限或低限效应,虽与具体条目无关,但也是量表的一项重要心理测量特征指标。如果15%以上的受试个体的量表评分最终落在最高或最低分值范围内,则该量表存在天花板/地板效应,其信度、效度和反应度等大打折扣。Beaudart 等[19]研究显示,肌肉衰减症患者在使用SarQoL®量表进行生活质量评估时未出现天花板/地板效应。
4 SarQoL®量表的跨文化调适与检验
由于SarQoL®量表最初以法语为母语创建,语言差异限制了其在不同国家和地区的应用与推广,因此,非常有必要将其译为多种语言版本。按照国际惯例Sar⁃QoL®量表的其他译版也必须经过“2 次正向翻译-汇总综合-回译-专家委员会商讨论-等价性考察-预实验”等严格流程才能够确认成型。与此同时,为了保证跨文化适应良好,增强该量表的公信力与认可度,不同语言版本的跨文化调适以及新译量表的心理测量特征检验都必不可少。
4.1 英语版
Beaudart 等[19]首先将该量表译为英文版加以推广普及,并以英国赫特福德郡队列研究中297 位平均年龄为79.5 岁的老年人为研究对象,在“法语-英语”双译的基础上,就SarQoL®量表的心理测量特征进行了探讨。结果显示,肌肉衰减症患者的英文版SarQoL®量表得分(61.9分)显著低于普通人群(71.3分),Cronbach’s α系数为0.88(与法语版α系数0.87 相当接近),组内相关系数ICC 为0.95(略高于法语版ICC 值0.91),与SF-36量表、EQ-5D量表中相似领域的聚合效度也呈现显著高相关性,与不同领域的分歧效度呈现显著低相关,且同样不存在天花板/地板效应(见表5)。由此可见,英文版SarQoL®量表不仅区分度较好,而且内部一致性、重测信度、内容效度、结构效度均较高。总体来看,由于SarQoL®量表问题设计的针对性较强,保障了英文版SarQoL®量表同样行之有效,不仅可以更好地评估肌肉衰减症相关的疾病负担,而且还可作为肌肉衰减症干预研究中的一个治疗效果指标。英语作为当今世界多数国家的官方语言,英文版量表心理测量特征的研究结果为该量表在世界范围内的广泛传播与应用提供了有效的保障。
表5 不同语言译版SarQoL®量表的心理测量特征汇总
4.2 其他语言译版
迄今为止,仅有4 项研究在翻译原版量表的基础上,开展相关译版的心理测量特征验证(见表5)。Gas⁃parick等[24]将其译为罗马尼亚语,并就该量表的跨文化适用性进行了探讨。结果表明,100 位受试者中有13位满足EWGSOP 阳性判定标准,SarQoL®量表总得分(57.3分)显著低于普通人群得分(68.4分)。Cronbach’s α系数为0.95,该量表的内容效度和结构效度均较高。方差分析结果显示,低生活质量得分往往与“低肌力、低步速”显著相关。虽然该研究并未进行重测信度检验,但Gasparick 仍认为罗马尼亚语版SarQoL®量表与法语版和英语版效力基本相同。此后,Konstantyno⁃wicz 等[25]将SarQoL®量表译为波兰语,同样参照EWG⁃SOP 共识以106 位年龄73.3 岁的受试者进行了量表信效度检验,其中60 人被诊断为肌肉衰减症阳性,Cron⁃bach’s α系数为0.92,组内相关系数ICC为0.99。该研究结果提示,肌肉衰减症患者往往呈现出高龄、低体重、腰围和大腿围小、肌力弱、收缩压降低等特点。因此,SarQoL®量表也可以有效评估肌肉衰减症患者的生活质量,而且利于更好地追踪和监控肌肉衰减症病程变化。
此外,Geerinck等[26]将SarQoL®量表译为荷兰语,从92位受试中筛查出30位肌肉衰减症患者(其中重度患者8 人),肌肉衰减症患者的SarQoL®量表得分(67.15分)显著低于普通人群(79.72 分)。Cronbach’s α系数为0.88,组内相关系数ICC为0.97。遗憾的是该研究未对荷兰语版量表的内容效度进行检测。与此同时,Tsekoura等[27]将SarQoL®量表译为希腊语,以176位71.2岁的老年人为受试对象检验希腊语版SarQoL®量表的各项心理测量特征。结果显示,经诊断有50人患肌肉衰减症(其中轻度9人,中度25人,重度16人),病患人群的SarQoL®量表得分(52.12分)同样显著低于普通人群(68.23分),且肌肉衰减程度越重得分越低,Cronbach’s α系数为0.96,组内相关系数ICC为0.96,由此提出,希腊语版量表同样具有较好的区分度、信度与效度,能够将不同程度肌肉衰减症患者的生活质量加以区分,可以满足肌肉衰减症特异性生活质量评估的需要。
总体而言,虽然上述各项研究中SarQoL®量表呈现出了较好的区分度、信度和效度,但现有跨文化调适与检验的应用范围主要集中在欧洲,虽然语言不同,但地域和文化差异并不大,更多跨度较大的译版量表的心理测量特征仍有待深入研究。
5 不同判定标准下SarQoL®量表的应用效果
如今肌肉衰减症研究已进入“共识时代”,除了权威的EWGSOP 共识外,还有IWGS、SSCWD、FNIH 等多种共识存在[28-32],基于不同共识或诊断标准得出的发生率存有一定的差异,如果仅基于EWGSOP 共识即断定SarQoL®量表效果良好,那么SarQoL®量表的说服力易受质疑。鉴于此,Beaudart 等[33]在对387 位平均年龄74.0岁的老年人进行的SarQoL®量表生活质量评估中,选取了6种不同时期具有代表性的肌肉衰减症判定标准分别对肌肉衰减症患者和普通人群的SarQoL®量表得分进行了比较。结果显示,6 种判定标准下,肌肉衰减症的发生率在4.39%~32.80%之间,波动幅度较大。在强调肌肉质量和肌肉功能(肌肉力量和身体功能)双重维度的EWGSOP、IWGS、SSCWD、FNIH 等四种共识的判定标准下,肌肉衰减症患者的SarQoL®量表得分均显著低于普通人群,而当采用早期Baumgartner[34]和Delmonico[35]推荐的肌肉质量单一维度进行判定时,Sar⁃QoL®量表得分却未见显著差异(见表6)。由此可见,SarQoL®量表基于肌肉质量和肌肉功能双重维度评估时具有典型效力,即与肌肉质量维度相比,肌肉功能维度与SarQoL®量表得分间相关性更高。这一点呼应并印证了EWGSOP新版共识中突显肌肉功能在肌肉衰减症诊断中的核心地位,并体现了SarQoL®量表在肌肉衰减症患者生活质量评估时对肌肉功能领域的评估具有较强的特异性。
表6 六种不同判定标准下SarQoL®量表的应用结果
6 SarQoL®量表研究的不足
尽管SarQoL®量表已显示出较好的心理测量特征,但仍存有不足之处需要完善。首先,从量表研制到心理测量特征的检验,受试对象多为社区居住的女性人群且肌肉衰减症阳性样本量不高,因而可能会导致性别偏倚和人群偏倚,使得量表适用范围受限;其次,各种语言译版量表的心理测量特征检验过程中,对于肌肉质量的检测方法及肌肉衰减判定指标不一,双能X射线法、生物电阻抗法以及人体测量法等均有应用,使得研究结果的前提具有一定的不确定性;再次,相比SF-36量表和EQ-5D量表而言,SarQoL®量表问题条目数略多,短表有待开发,以便提升临床医生应用效率,且由于采用4~5级Likert评分法,部分问题的答案可能存在重叠区间进而影响评分;最后,由于EWGSOP共识中将肌肉衰减症分为轻(pre-sarcopenia)、中(sarcope⁃nia)、重(severe sarcopenia)三个阶段,随时间迁移患者肌肉衰减程度可能会发生动态改变,因此,该量表后续研究需在分阶段“动态”检测效果及纵向有效性上进一步加以验证。
7 小结
截至目前,SarQoL®量表作为第一份肌肉衰减症专用生活质量量表,不仅能够凭借其较好的区分度、信度、效度和反应度有效评估肌肉衰减症患者的生活质量,而且符合当前国际学术界对肌肉衰减症深度认知的发展趋势。我国应当尽快规范开展SarQoL®量表中文版心理测量特征研究,加快推进其在我国老年医学领域临床及科研实践中的应用进程,使其成为评价肌肉衰减症治疗或干预效果的一项重要指标,以便早日明确治疗或缓解肌肉衰减症的有效手段,提高肌肉衰减症老年人的生活质量,助力健康中国建设。