中文版KOOS和OKS在评估膝骨关节炎患者多模式非手术治疗中的对比研究*
2018-09-08陈墅曹嘉蔡筑韵李章吉杜杰顾召华周琦钱齐荣
陈墅曹嘉蔡筑韵李章吉杜杰顾召华周琦**钱齐荣**
(1.第二军医大学长征医院关节外科,上海210003;2.上海青浦区徐泾镇社区卫生服务中心,上海201702;3.上海市徐汇区枫林街道社区卫生服务中心,上海200032;4.上海市浦东新区三林社区卫生服务中心,上海200124)
膝骨关节炎(osteoarthritis,OA)是一种以关节软骨损伤、软骨下骨硬化、骨赘形成和关节间隙变窄为主要特点的慢性、渐进的退行性骨关节病,女性多于男性,是严重影响中老年人独立生活能力、生活质量以及致残的主要疾病之一[1]。主要临床表现为膝关节疼痛、肿胀、僵硬和功能障碍。对诊断为轻中度膝OA患者可采取股四头肌功能训练、物理治疗和药物治疗。但是单纯从症状体征、影像学检查或并发症情况等客观评价方法来评估患者病情往往无法真实或完全反映患者膝关节功能、生活质量及治疗效果,常需要结合基于患者主观评估的指标进行综合分析。主观量表评分对膝关节疾病患者诊断、治疗和康复方式的临床效益和成本效益评估是必需的[2]。目前膝关节评分量表很多,但是大多对于膝关节置换手术治疗效果进行评价(如占膝关节置换疗效评价62.11%的AKS评分或占23.08%的HSS)或关节镜治疗膝关节软骨损伤、软化或退变效果进行评价(如分别占关节镜疗效评价34.50%和22.60%的Lysholm和IKDC评分)[3]。对于膝关节保守治疗效果评价方式目前常用的是简明健康调查量表(the short-form 36 health survey scale,SF-36)和西安大略和麦克马斯特大学(Western Ontario and McMaster Universities,WOMAC)骨关节炎指数。SF-36包括8个分量表:生理机能(physical functioning,PF)、生理职能(role-physical,RP),躯体疼痛(bodily pain,BP)、一般健康状况(general health,GH)、精力(vitality,VT)、社会功能(social functioning,SF)、情感职能(role-emotional,RE)和心理健康(mental health,MH)。其中PF、RP和BP评分与PCS高度相关,对PCS评分贡献最大,MH、RE和SF评分与MCS相关性最高,对MCS评分贡献最大,而VT、GH和SF量表与PCS和MCS评分均有关联。SF-36评分的有效性体现在全面概括了患者生理、心理、功能以及主观感受等方面的内容,具有较好的信度和效度,可用以对膝OA患者健康状况及生存质量的综合评价[4]。
膝关节损伤和骨关节炎评分(knee injury and osteoarthritis outcome score,KOOS)与牛津膝关节评分(Oxford Knee Score,OKS)是膝关节特异性问卷,是评估膝关节一般情况和生活质量的有效工具,其涉及疼痛、功能、生活质量等许多问题,可用于对膝关节软骨损伤、OA患者的非手术治疗和手术治疗前后效果评估[5],已被广泛使用并翻译成多种语言。其中KOOS是由5大类共42个条目组成,包括症状共7项、疼痛共9项、日常生活活动共17项、娱乐及运动功能共5项、与膝关节相关的生活质量共4项,其可靠性、有效性以及敏感性高,在与膝关节相关的临床实践和研究中被誉为最适用的健康评价系统。OKS具有内容精简(仅12个条目)、操作简单(由患者自我报告,无需临床检查及采集客观数据)、对重要临床变化敏感等特点[6]。然而,中文版OKS和KOOS之间的信度、效度、灵敏性的心理学测量特性差异尚不清楚,应用于OA非手术治疗的评估效果不得而知。此外,随着时间的推移,检测感兴趣结构变化能力的敏感性被认为是必不可少的。这些量表在反映短期内(<3个月)患者病情改善方面的临床应用尚不清楚。
本研究设计为前瞻性横断面研究,采用翻译、回译和文化适应性检验,形成中文版KOOS和OKS,并通过严格、全面的信效度检验证实该量表在膝OA患者中的应用价值。本研究的目的:①根据文化适应规则将KOOS和OKS翻译成中文版(Chinese version,CV);②在轻中度膝OA患者中评价比较KOOS-CV和OKS-CV两个量表的信度和效度;③研究KOOS-CV和OKS-CV在轻中度膝OA患者行非手术治疗后3个时间点(2、4、12周)反应临床变化的敏感性。
1 资料与方法
1.1 临床资料
本研究经医学伦理委员会审核批准,患者及家属知情同意并签署相关协议,前瞻性选取2016年5月至2018年1月在第二军医大学上海长征医院及上海市3个社区(三林、徐泾镇、枫林街道)卫生服务中心接受非手术治疗的膝OA患者为研究对象,入选标准:①年龄40~80岁,性别不限;②初诊参照《骨关节炎诊断及治疗指南》[7]确诊为膝OA患者,影像学支持;③OA分期为Kellgren-Lawrence分级1~2级(膝OA早中期),符合膝关节外科学会的鉴定标准[8],且拟行保守治疗;④术前均未行关节镜或其他外科手术。排除标准:①合并其他影响行走和产生疼痛症状的疾病者,如偏瘫、骨折、韧带损伤、膝关节感染等;②理解、沟通有障碍者;③不配合试验者。共纳入患者149例,男58例,女91例;年龄48~72岁,平均(59.3±5.2)岁。患者平均病程为(7.2±4.3)年,平均体重指数为25.24±2.52,属于超重类别(表1)。
表 1 纳入研究149例膝OA患者的一般资料
1.2 研究方法
1.2.1 多模式非手术治疗:在研究期间,所有患者均接受多模式非手术治疗:①健康宣教(自我管理、调整生活方式,减少负重和爬楼梯、爬山,控制体重);②股四头肌功能锻炼(每次5~10 min,每日3次);③口服非甾体消炎镇痛药(塞来昔布200 mg,每日1次或双氯芬酸钠片75 mg,每日2次)。
1.2.2 文化适应性检验:根据Beaton等[9]制定的文化适应性检验指南,对英文原版KOOS和OKS进行文化适应性检验,过程包括:前翻译、翻译合成、回译、回译审查、专家委员会审查、预测试,最后由量表开发者评估回译版本与原版本的差异。本研究中英文原版KOOS和OKS的前翻译过程由2名双语翻译(母语为中文)分别独立完成(包括1名拥有20年临床经验的骨科医师、1名专业英语翻译),然后进行会议讨论产生第一份合成的前翻译版本。再由2名双语翻译(母语为英语)且不熟悉英语原版KOOS和OKS的留学生分别对合成的前翻译版本进行回译,经讨论将两份回译版本合成一份最佳的、中英文版本间没有歧义的回译版本。专家委员会(由2名前译员、2名后译员、1位方法学家、1名临床医师和1位语言专家组成)组织对翻译和回译材料进行审查,并就翻译过程中存在的差异进行讨论,从而形成预试版KOOS-CV和OKS-CV。纳入10例不同类型膝关节疾病患者对两个表格进行效度预测试,形成两种量表的最终版,最后由量表开发者评估回译版本与原版本的差异。
1.2.3 信效度检验:①重测信度:用同类相关系数(intraclass correlation coefficient,ICC)进行评价,40例患者在完成KOOS-CV和OKS-CV的填写5~7 d后分别再次填写这两种量表。这个时间间隔能够使受试者刚好忘记初次填写结果但又不至于病情发生变化。为了尽量减少临床改变,患者在复测间期内未接受相关治疗。②内部一致性:采用Cronbach α系数评估KOOS-CV和OKS-CV的内部一致性,指数达到0.7~0.9则认为内部一致性较好[10]。③内容效度:计算各个条目与其总分间的Spearman相关系数。④结构效度:通过计算KOOS-CV和OKS-CV与SF-36的Spearman相关系数。⑤聚合效度:先验假设,KOOS-CV和OKSCV与SF-36的生理健康量表(生理机能、生理职能、躯体疼痛、精神成分总分)之间的相关性应该是强的。⑥区分效度:KOOS-CV和OKS-CV与SF-36心理健康量表的相关性(一般健康状况、精力、社会功能、精神健康、物理成分总分)应该是弱的。Spearman相关系数>0.50、0.35~0.50、<0.35分别为强、中、弱[11]。
1.2.4 敏感性检验:为了分析KOOS-CV和OKS-CV的敏感性,在治疗后2、4、12周进行随访复查,用受试者工作特征曲线(receiver operating characteristic curve,ROC)进行评价。
1.2.5 天花板效应和地板效应:通过计算KOOS-CV/OKS-CV最低和最高得分的人数比例来判断,若研究对象中15%的个体的分数达到极限(最高分或最低分),则分别为具有天花板效应或地板效应。15%的地板或天花板效应被认为是可以接受的,这意味着少于15%的受访者达到最低或最大可能的分数[12]。
1.3 统计学方法
采用SPSS 19.0软件进行统计学分析。年龄、病程、BMI、KOOS、OKS、SF-36评分等连续性变量采用均数±标准差表示,正态分布则采用t检验;性别、患侧、住房条件、是否合并慢性疾病等分类变量采用百分率(%)表示,计数资料行χ2检验。各量表间的相关性采用Spearman相关分析(系数>0.5、0.35~0.5、<0.35分别代表强、中、弱相关)[13],P<0.05为有统计学意义。
2 结果
2.1 文化适应性过程
在翻译和文化适应阶段,预试版中文版KOOS和OKS在预测试中被受试者接受形成最终版。所有受试者均完整填写了两份调查问卷,并无漏项,同时对每个条目的选项有清晰的理解。在说汉语和说英语的人群之间并未发现重大的概念或文化差异。因此,预试版KOOS和OKS未被进一步修改,而形成最终版。
2.2 信效度
在5~7 d间隔内,40例受试者中有34例被认为测量结果稳定,而6例受试者则被排除在重测的可靠性分析。OKS-CV的同类相关系数为0.90(P<0.001)。而在KOOS-CV的ICCs为0.87~0.92均表现了较好的重测信度。OKS-CV的测量的标准误(Standrd Error of Measurement,SEM)和最小可检测变化(Minimum Detectable Change,MDC)值分别为4.0和11.0,均小于KOOS-CV的SEM和MDC(SEM范围:4.6~7.0;MDC范围:14.2~24.2)。OKS-CV的内部一致性较高,Cronbach α值为0.89。KOOS-CV内部一致性中等至较高,其值在0.76~0.95之间(表2)。
表3显示了KOOS-CV的5个分量表、OKS-CV和SF-36量表之间的相关关系。
2.3 敏感性
表4显示了ROC曲线下面积,最小临床意义变化值,以及最小临床意义变化值的灵敏度和特异度。干预后12周,KOOS-CV各分量的ROC曲线下面积和OKS-CV比较均有显着性差异(P<0.05)。KOOS的所有分量表(0.69~0.77),大于OKS-CV的AUC(0.65)。
表5显示了OKS-CV和KOOS-CV在治疗前后的平均值和效应量(effect size,ES)。在随访的3个时间点,KOOS-CV中的疼痛、日常活动、运动/功能分量表较OKS-CV表现出更大的反应能力。OKS和KOOSCV量表在随访到12周时均表现为中等大小ES值(0.48~0.67)。而随访至 2周、4周时,OKS-CV 和KOOS-CV 均表现为较小 ES值(0.14~0.38),但是KOOS-CV中的疼痛、日常活动、运动/娱乐3个分量表ES值(0.19~0.38)高于OKS的ES值(0.18)。组内比较结果显示,在12周随访时,OKS-CV和所有KOOSCV分量表的差异均有统计学意义。在2周和4周时间点,即使在小ES值(019~0.36)下,KOOS-CV中常活动、运动/功能分量表在基线上仍有显着性差异,而OKS-CV的差异大多不显著。
2.4 天花板效应和地板效应
天花板和地板效应是指大部分得分集中在极高或极低的一端,这两个指标反映了得分分布的重要特征。本研究中未出现天花板和地板效应,说明OKS-CV和KOOS-CV量表各条目应答选项的层次和范围合理,能够有效地区分患者状态,保证了条目的有效性。其中OKS-CV评估结果中2例患者获得最低分1分(1.3%)、1例患者获得最高分48分(0.7%),KOOS评估结果中3例患者有单项分量表最低分0分(2.0%),2例患者活动最高分100分(1.3%)均未达到总体的15%,表明OKS-CV和KOOS-CV均不存在天花板效应和地板效应。
表 2 KOOS-CV和OKS-CV的重测信度、效度
表 3 KOOS-CV和OKS-CV的Spearman相关系数
表 4 ROC曲线分析结果
3 讨论
目前用于膝关节功能评估的有效工具包括WOMAC评分、KOOS、OKS量表等,这3种测量工具均具有良好的心理测量学特性,是从患者角度出发而建立的最适用于膝关节功能及膝关节相关生活质量的评估工具[14,15]。目前国内膝关节评分量表大多是国外量表直接翻译而来,由于各国生活水平、习俗的不同,评定项目区别很大,研究制定符合中国人膝关节解剖及运动学特点的膝关节退行性病变评估方法,有助于实现膝关节退行性病变评估的本土化和个体化,为进一步治疗及后期疗效评估提供依据。KOOS由WOMAC发展而来,在长期或短期的原发或由关节损伤继发的OA评价中具有显著的优势[16]。因为其可靠性、有效性及高应答性,该评分在与膝关节相关的临床实践和研究设定被誉为最适用的健康评价系统[8,17]。该评分用于评估患有膝关节损伤、软骨损伤或处于各个阶段OA的年轻及活跃患者短期或长期的症状及功能,也可用于矫形手术如前交叉韧带重构、半月板切除术及全膝关节置换的术后评估[18]。OKS问卷于1998年于牛津大学创办,从两种基本的健康评价系统SF-36和健康评价问卷(health assessment questionnaire,HAQ)发展而来。其简短、实用、可靠、对于临床重要变化高度敏感,因此比其他的患者自评问卷如SF-36或关节炎影响指数(arthritis impact measurement scale,AIMS)更具精确性[18]。5项关于疼痛(40%),包括疼痛的自我描述及在既定情景(如步行、坐位、睡眠中及家务工作时)中的关节疼痛状况。7项关于功能(60%),包括日常情景下(如洗澡、乘车、步行、跪坐及攀爬楼梯)的关节功能状况。每个项目评分1~5分:1分为最低限度反应(如没有疼痛感);5分为最剧烈反应(如剧烈疼痛)。最终得分是将12项得分相加,总分为12~60不等。当然,该评分有许多不足之处:①对于患者情况过于简单者,很难让患者准确而正确的完成评分;②在该评分系统中未涉及并存病的容量值,OA患者多为老年人,多患有其他共病或关节炎而影响其他关节功能;③没有一个公布的人群得分标准,所以对得分的评价完全取决于临床经验,OKS评分不仅与患者全膝关节置换术后满意度密切相关,甚至可以预测全膝关节置换术后膝关节活动度[19]。因此,OKS越来越多地被应用于膝关节功能和生活质量的临床评估和随访研究。本研究通过前瞻性研究调查问卷的方式得出KOOS-CV和OKS-CV均具有良好的内部一致性和重测信度。与SF-36量表相比,在对轻中度膝OA的非手术治疗评估中,KOOS和OKS均能够准确反映患者治疗前后的机体变化,KOOS-CV中疼痛、日常生活、运动/娱乐分量表对治疗早期(1个月内)的变化比OKS-CV更敏感,这两份问卷的内容效度良好,无地板或天花板效果。
表 5 不同时间点KOOS和OKS量表结果分析
综上,中文版KOOS和OKS在膝OA患者非手术治疗方面均表现出较高的可靠性和有效性,二者均可用于膝OA患者非手术治疗效果的评估与研究,但该结论有待多中心、大样本研究进一步验证。