APP下载

简易平衡评定系统测试应用于社区老年人平衡和跌倒风险评估的信效度分析

2020-03-03徐瑞泽杨天祎唐易非

中国老年保健医学 2020年1期
关键词:效度信度受试者

郑 爽 徐瑞泽 杨天祎 唐易非 王 鑫

作者单位:中日友好医院 康复医学科 100029

跌倒现象在老年人群中极其普遍[1]。跌倒风险会随着年龄的增长而增加,年龄在65岁以上的社区老年人,每年有30%~40%出现跌倒[2~4]。跌倒可降低老年人生活质量并且严重威胁其独立生活能力,增加了家庭、医院、长期护理机构的负担。维持姿势的稳定性下降、视力障碍、跌倒史、认知障碍、药物影响、全身慢性疾病、环境等都是造成老年人跌倒的危险因素[5]。对老年人进行跌到风险的筛查和评估并进行干预可降低跌倒风险。

临床上常使用平衡量表来模拟各种生活任务和场景,以评估老年人平衡功能,最终帮助医务人员制定针对性的治疗计划。相对于大多数平衡量表,开发于2010年的简易平衡评定系统测试(mini balance evaluation system test,Mini-BESTest)是较新的量表[6]。Mini-BESTest在国外应用相当广泛,近年来已有大量研究证明其在测量帕金森病以及脑卒中患者平衡功能的过程中信度、效度俱佳[7,8]。作为平衡评定系统测试(balance evaluation system test,BESTest)的简略版,可测量受试者在转移、行走、支撑面变化、跨越障碍物、外力作用或双任务时的动态稳定性,整个测试时间约15分钟,评估全面且消耗时间短,对于操作者来说是较理想的评估量表。目前尚无该量表在测量社区老年人平衡功能及跌倒风险的回顾。因此,本综述的目的在于汇总现有证据,总结Mini-BESTest在社区老年人平衡测量中的信度、效度,为临床工作者以及实验人员提供参考。

1. Mini-BESTest简介

平衡的维持涉及感觉输入、运动输出、中枢整合、环境交互以及认知等因素。为预测跌倒风险,检测平衡功能的改变,以及区分平衡受损的因素,Dr.Horak[9]于2009年开发了包含6大模块27项的BESTest。虽然BESTest的项目覆盖面广,但是存在项目冗余且测试时间过长等问题,影响其临床应用。随后,Franchignoni等[6]利用心理计量学的方式,将BESTest进行优化,开发出Mini-BESTest测试。Mini-BESTest保留四大模块:前反馈姿势调整(从坐到站立、踮脚尖、单脚站立);反应性姿势控制(向前迈步反应、向后迈步反应、侧方迈步反应);感觉统合(睁眼双足站立、闭眼海绵垫站立、闭眼倾斜站立);动态步行(改变步速、行走时转头、行走时直角转身、跨越障碍、计时双任务起立步行)。整个量表含14个项目,每个项目满分为2分,总分28分。

测量过程中需准备60×60×10cm的记忆海绵垫,10°的斜面,无扶手的标准座椅,23cm高的箱子,秒表以及标记地面的胶带。

2. Mini-BESTest应用于社区老年人的信度和效度研究汇总

2.1 Mini-BESTest的信度 信度指测验结果的一致性、稳定性及可靠性。经典测试理论中常用的信度分析指标有重测信度、测量者信度、内部一致性等。评价信度时,组内相关系数(intraclass correlation coefficient,ICC)大于0.81为优,0.61~0.80为好,0.41~0.60为中,0.21~0.40为一般,小于0.20为差[10]。相较于经典测试理论,现代测试理论中的Rasch分析使用个人信度(personreliability)和项目信度(itemreliability)衡量信度。信度系数r大于0.80为好,大于0.90为优[11]。

2.1.1 重测信度:共有两篇研究评估了重测信度。Marques等[12]对28名老年人进行测量,发现ICC=0.73(0.49~0.86),重测信度好。Anson等[13]进行了两次测量,间隔4周,发现ICC=0.84(0.73~0.90),重测信度优。

2.1.3 内部一致性:Franchignoni等[6]利用因子分析和Rasch分析,从受试者能力水平与项目难度关系的角度探讨量表的内部一致性,发现项目分离信度(item separation reliability)r=0.98,个人分离信度(person separation reliability)r=0.86,说明该量表一致性好且无项目冗余。

2.2 Mini-BESTtest的效度 效度指量表的准确性和有效性,即测定值与目标真实值偏差的大小,经典测试理论常用指标有标准效度、结构效度、内容效度、已知组别效度等。评价效度时,Pearson或Spearman相关系数r大于0.70为高,0.50~0.69为中,0.26~0.49为低;对于接收者操作特征曲线(receiveroperatingcharacteristiccurve,ROC)来说,曲线下面积(adequate area under the curve,AUC)大于0.80表示区分度为优,分数介于0.71~0.80表示区分度为中。AUC越接近1.0,表明量表检测的真实性越高;AUC等于0.5,检测方法的真实性最低,无应用价值。Rasch分析研究量表项目与受试者特质之间的关系,检测各项目所测试内容是否为同一特质,以确定量表的内部结构效度。

2.2.1 标准效度:Marques等[12]发现Mini-BESTest与Berg平衡量表(berg balance scale,BBS)、BESTest等测量平衡的标准指标之间存在显著相关性(r=0.83~0.96)。

2.2.2 结构效度:Franchignoni等[14]选取115名受试者,利用Rasch分析发现项目难度从-4到+2.5,该项目难度等级可验证结构效度。综合Marques等[12]以及Ohoski等[15]的研究,发现Mini-BESTest与特定活动平衡信心量表(activities specific balance confidence,ABC)、计时起立行走(timed up and go,TUG)以及单腿站立(single leg stance,SLS)存在相关性(r=0.57~0.68,P<0.001)。

2.2.3 内容效度:量表中的项目从公认的平衡判定标准BBS、临床感觉统合平衡测试(clinical test of sensory interaction in balance,CTSIB)、动态步态指数(dynamic gait index,DGI)以及TUG中选取,可保证其测试内容;Franchignoni等[6]利用因子分析选取了BESTest中与动态平衡相关的24个项目,然后利用Rasch分析删除了10项影响效度、信度的项目,得到现有的14个项目。

2.2.4 已知组别效度:6项研究[12,13,16~19]探讨该量表区分社区老年人跌倒者与非跌倒者的能力。其中4项研究[12,16~18]发现跌倒组与非跌倒组分数存在显著差别,支持该量表对跌倒者的区分度,得出的AUC范围为0.68~0.84。决断分数(cutoff score)的范围为16~25,分数低于决断分数提示跌倒风险较高。测试敏感度(sensitivity)的范围为0.53~0.85,表明Mini-BESTest在正确筛查出53%~85%的跌倒者。Magnani等[16]按照年龄将受试者分为4组,分别计算AUC和决断分数,发现决断分数随年龄增高而下降(25,23,22,17)。

2.3 地板或天花板效应(floor or ceiling effect) 在所有提到地板或天花板效应的两篇文献[12,18]里,未发现该效应。

3.讨论

Mini-BESTest自开发之后,由于其评估涉及平衡方面广,测试时间较短,备受临床工作者和研究人员关注。Pardasaney等[20]系统考察了26种平衡量表的项目设计,发现大多数项目为静止环境中的单任务,与老年人实际生活中的动态环境、人与环境交互以及多任务之间存在巨大差别。该回顾发现,Mini-BESTest是其中最全面的测试。

在几种常用平衡量表的比较中,BBS在测量65~75岁健康老年人时可能存在天花板效应。而且,BBS缺乏对步态、步速、双任务等评估。TUG仅仅记录受试者往返3米的时间,而不记录步态、稳定性等表现,其决断分数在不同测试者中的差别较大(10~30秒),提示不应在筛查跌倒风险时单独使用。

由于大多数测试皆存在其局限性,作为一种全面的测试,总结Mini-BESTest在测量社区老年人的信度、效度具有重要意义。Ohoski等[19]根据受试者自我报道,将患者分为跌倒组(25.2±5.2)和非跌倒组(26.3±4.5),未发现显著差别。同时,BESTest、TUG和SLS亦不能区分跌倒组和非跌倒组。回顾文章可以发现,试验选取的受试者的功能水平较高(Mini-BESTest=25.9,TUG=8.7,SLS=22.8),入组人员的跌倒率低于之前的文献,患者自评的功能水平较高。50~60岁的受试者有20名(25.3%),小于65岁的人群可能影响整体分数。本试验定义过往12个月内1次跌倒的人为跌倒者。Anson等[13]试图确认58名65以上老年人的跌倒者,跌倒组(19.0±3.8)与非跌倒组(19.3±3.1)无显著差别,AUC=0.54,即只能正确判断54%的跌倒者,与50%的随机判断几无差异,故未计算决断分数。上述两项研究提示,跌倒者的定义应更佳严谨,其严谨性可直接影响量表的区分能力。单纯依据过往12个月中的一次跌倒经历并不能说明受试者的平衡功能低于常人。之后Ohaski等[19]对数据进行二次分析,利用老年跌倒筛查测试(elderly falls screening test,EFST)将受试者分为跌倒低风险组(26.8±4.0)和高风险组(22.2±6.1),两组之间有显著差异(P=0.009),证明Mini-BESTest可衡量受试者的跌倒风险。未来的研究应明确跌倒者的时间范围(3个月、6个月、12个月)和跌倒次数(1次、2次、多次)以便于实际应用和成果比较。

Ohaski等[19]发现Mini-BESTest与ABC、TUG和SLS等测试效果有高度相关性(分别为0.62,-0.66,0.68)。Marques等[12]验证了Mini-BESTest与ABC存在中等相关性(Rho=0.61),证明该量表的结构效度较高。

Yingyongyudha等[18]认为Mini-BESTest确认老年人跌倒风险的能力相较于BBS、BESTest以及TUG更高。实验纳入200例健康老年人(平均年龄70岁),根据过往12个月的跌倒历史,分为跌倒组和非跌倒组,利用Mini-BESTest测试其平衡功能,发现该工具的AUC=0.84,为所有量表中最高。决断分数16,敏感度0.85(0.77~0.90),特异性0.75(0.66~0.83),若受试者分数低于决断分数,则跌倒风险提高。测试后正确率达到85%,也为4种量表中最高值。

不同年龄组的老年人平衡表现可能存在差异,Mannani等[15]按照年龄将受试者分为4组(60~69岁,70~79岁,80~89岁,≥90岁),分别计算AUC和决断分数以及比值比(Odds Ratio),发现决断分数确实随年龄增高而下降(25,23,22,17)。敏感性的范围为0.53~0.85。比值比(0.86,0.67,0.66,0.77)表示若Mini-BESTest得分减少1分,60~69岁组在未来6个月的跌倒风险增加14%,70~79岁组增加33%,80~89岁组增加44%,90岁以上组增加23%。

4.总结与展望

综上,Mini-BESTest作为一种全面的平衡评估方式,在测量社区老年人平衡功能的过程中信度、效度俱佳,应推广其应用。在筛查跌倒风险方面,决断分数的设定尚存争议,未来的研究应更加严谨地定义“跌倒者”,以提高量表预测跌倒风险的能力。此外,由于跌倒决断分数随受试者年龄的增长而下降,新的研究者应考虑受试者的年龄差异可影响测试结果。虽然Mini-BESTest在国外以及中国香港地区广泛应用,但是在国内尚无原作者认可的汉化版,使其应用受阻。未来的研究可将此量表汉化,并研究其应用于我国人群的信度、效度。

猜你喜欢

效度信度受试者
涉及人的生物医学研究应遵循的伦理原则
涉及人的生物医学研究应遵循的伦理原则
效度验证模式系统整合与效度研究发展策略
《广东地区儿童中医体质辨识量表》的信度和效度研究
作为数学教育研究质量分析的信度
涉及人的生物医学研究应遵循的伦理原则
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
涉及人的生物医学研究应遵循的伦理原则
谈高效课堂下效度的提升策略
语言测试效度研究的另一视角:考试的因子结构研究