布尼氏动作熟练度测试(BOT-2)在智力障碍儿童动作发展评估中的应用及对我国的启示
2019-07-18原雅青丁佳宁
原雅青,刘 洋,丁佳宁
健康中国建设背景下,全民健康上升为国家战略目标。习近平总书记提出:“没有全民健康,就没有全面小康”“全面建成小康社会,残疾人一个也不能少”。可见,让人人享有健康,是实现全面建成小康社会的必由之路,提供全人群和全生命周期的健康服务是实现全民健康的重要着力点。在倡导全民健康的今天,教育部2012年颁布的《3~6岁儿童学习与发展指南》首次将动作发展列为儿童健康领域目标之一。动作发展是贯穿整个生命周期的复杂过程,是人类适应社会环境的必备条件(郭晨 等,2018;Greg et al.,2008)。已有研究证实,儿童早期良好的动作发展会对其认知、语言、情绪情感和社会性发展等多个方面产生积极影响,并为个体未来的全面发展提供有利条件。反之,如果动作发展出现障碍,则个体发展也会受到阻碍(郭晨 等,2018;李静 等,2007;吴升扣 等,2015;Greg et al.,2008;Lubans et al.,2010)。智力障碍(以下简称“智障”)儿童通常会伴有动作发展问题,这会导致其身体活动受限、超重肥胖、注意力缺陷、低自尊和社交障碍等(Venetsanou et al.,2007)。如果智障儿童的动作发展问题得不到识别与补救,将会影响其运动能力,进而影响个体的健康发展。因此,科学、系统地评估智障儿童的动作发展水平,筛查动作障碍儿童,判断其所属障碍类型以及进行动作技能干预显得尤为重要。目前,国内对于智障儿童的动作发展研究尚处于起步阶段,现有研究仅对评估工具进行了简单介绍,难以满足深入研究的需要。鉴于此,本研究从评估工具的产生及发展、测试体系、信效度及应用现状等4个方面对当前国际上广泛应用于智障儿童动作评估的布尼氏动作熟练度测试(第二版)(Bruininks-Oseretsky Test of Motor Pro ficiency-Second Edition,BOT-2)进行了阐释,以期为我国智障儿童的动作发展研究提供经验借鉴与启示。
1 布尼氏动作熟练度测试的产生及发展
1975年,美国国会颁布了《所有残障儿童教育法》(Education for All Handicapped Children Act),规定了免费及适当的公立教育、零拒绝、个别化教育计划、非歧视性评估等基本原则,保障了残障儿童享有接受免费公立教育的权利,将特殊教育纳入法治轨道(Doris,1979)。该法案强制公立学校为各类残障儿童提供教育计划,计划中涉及运动领域的部分,引起了适应体育教师、巡回指导教师、物理治疗师和职业治疗师等相关专业人员的关注,但其普遍困惑于如何评估动作障碍及制订教育计划(Doris,1979)。在这一历史背景下,美国明尼苏达大学Bruininks R H教授与美国康科迪亚学院Bruininks B D教授于1978年联合研发的布尼氏动作熟练度测试(Bruininks-Oseretsky Test of Motor Pro ficiency,BOTMP)问世。BOTMP用于评估4岁半~14岁半儿童的动作技能、运动功能障碍及发育障碍。该测试涉及粗大动作和精细动作2个测试领域,包含8项分测试,共有46个测试项目。作为常模参照的标准化测试,它是教育工作者、临床医生和研究人员识别儿童动作发展问题、制订运动干预计划的重要工具(Bruininks,1978)。
2005年,Bruininks R H与Bruininks B D对BOTMP进行了修订,形成了BOT-2。本次修订建立在对BOTMP的前期应用情况进行深入剖析的基础上,以美国38个州的1 520名儿童青少年为调查对象,主要变化有:1)围绕运动中肌肉群和四肢的参与情况对测试工具的结构进行了调整,剔除了部分测试项目,提高了测试的功能性;2)扩大了精细和粗大动作技能测试的范围,将BOTMP中视觉动作控制分测试分为精细动作精确性和精细动作统合性2个分测试,前者仅用于评估儿童的视知觉,而后者则更多地强调视动统合能力;粗大动作测试方面,增加了力量分测试和速度与敏捷性分测试的测试项目;3)对4~5岁儿童测试项目进行了改良,通过增加新的测试项目(如填充图形)和修改原始测试项目(如增大木块体积、加宽平衡梁等)降低了测试项目难度,提高了该工具对低龄段儿童的适用性;4)依据美国《残疾人教育促进法》(Individuals with Disabilities Education Improvement Act,IDEIA)中对学龄段人群年龄的界定,将适用对象的年龄范围扩展至21岁;5)改进了测试指导语的表述方式,允许测试人员根据被试的接受能力采用个性化的方式(如口头解释、动作示范或图片提示等)对测试项目进行说明,使受试者更容易理解测试要求;6)改进了测试工具(如使用橡胶材质的平衡梁),使测试更加安全、便捷,提高了测试的有效性。
2 布尼氏动作熟练度测试体系
BOT-2由4个测试领域的8项分测试组成。4个测试领域分别是:精细手部控制(包括手掌、手指肌肉的控制与协调)、手部协调(包括手臂、手掌的控制与协调,尤其是对物体的操控)、身体协调(包括保持身体姿态和平衡下的大肌肉群的控制与协调)、力量与敏捷性(包括日常游戏、竞技运动和其他身体活动中的速度、力量和灵敏)(Bruininks et al.,2005)。该测试有2个版本:完整版和简易版。完整版包括53个测试项目,施测时间约为45~60 min;简易版包括14个测试项目,施测时间约为15~20 min(South et al.,2013)。两个版本均涉及4大测试领域的8个分测试,具体测试项目如表1所示。
BOT-2采用点式计分法,测试者根据受试者的动作表现,对照评分表记录受试者各测试项目的点分数(point score),通过求和、转换获得各分测试得分、动作领域得分和总分(吴升扣 等,2014)。计分流程如图1所示,将某一分测试下所有测试项目的点分数相加,求和后将该分测试得分转换为等级分数(scale score),再将某一动作领域下所有分测试的等级分数相加,求和后将等级分数转换成标准分数(standard score)和百分位排名(percentile rank),最后将4个动作领域的标准分数相加、转换,得到总体动作领域的标准分数和百分位排名(South et al.,2013)。
表1 BOT-2测试项目Table 1 The Composites,Subtests and Items among BOT-2
图1 BOT-2计分流程图Figure 1. The Process of Scoring in BOT-2
BOT-2提供了不同年龄、性别及测试项目所对照的常模,该测试使用的等级分数、标准分数、百分位排名、年龄当量和描述性类别可以帮助家长和相关专业人员了解受试者的整体动作发展水平、4个动作领域的优劣势、各分测试的动作表现。下面以1名12岁8个月的智障男生为例进行简要说明。如表2所示,该生总体动作领域的标准分数为36分,处于“低于平均”水平,其百分位排名为8,表明该生的动作表现优于常模样本中8%的同龄人。该生4个分领域的标准分数分别为61分(精细手部控制)、27分(手部协调)、40分(身体协调)和31分(力量与敏捷性),领域间得分差异较大。就某一动作领域而言,以精细手部控制为例,该生该领域的标准分数为61分,其百分位排名为86,表明其动作表现高于同龄人的平均水平。具体而言,该生的精细动作精确性分测试等级分数为17分,处于“平均”水平,动作发展水平相当于12岁~12岁半的同龄人;精细动作统合性分测试等级分数为22分,处于“高于平均”水平,动作发展水平相当于15岁~15岁半的同龄人。
3 布尼氏动作熟练度测试的信度和效度
3.1 信度
信度(reliability)即可靠性,是指在相同测试条件下,对同一批受试者使用相同的测试手段,重复测试结果的一致程度(李静 等,2007)。信度越高,表明测试结果越稳定。已有研究对BOT-2的评分者信度、内部一致性信度和重测信度进行了检验。评分者信度方面,BOT-2的评分结果来自于测试者对受试者动作表现的主观评价,为降低测试者主观判断差异导致的测试结果偏倚,测试手册中对每个测试项目的施测程序及评分细则进行了详细阐述,以规范测试者的施测行为,使该测试具有良好的评分者信度。Dietz等(2007)通过比较2名经验丰富的测试者使用BOT-2对47名4~21岁智障儿童青少年进行测试的结果发现,除精细动作精确性分测试的评分者信度为0.86外,其余所有测试项目及分测试得分的评分者信度均>0.90。另一项研究也得到类似结果,该研究以30名7~9岁的澳大利亚胎儿酒精谱系障碍(fetal alcohol spectrum disorder,FASD)儿童为测试对象,检验了BOT-2简易版的信度水平,结果显示,其评分者信度系数在0.88~0.92之间(Barbara et al.,2013)。内部一致性信度方面,BOT-2各测试项目之间的相关性较高。Dietz等(2007)的研究显示,BOT-2完整版的内部一致性信度≥0.93,BOT-2简易版的内部一致性信度也达到了可接受水平(≥0.80)。此后,Wuang等(2009a)以100名4~12岁的智障儿童为调查对象,也对BOT-2的信度进行了检验,结果表明其内部一致性信度为0.92,4个测试领域的相关系数在0.87~0.88之间,8个分测试的相关系数在0.81~0.88之间。重测信度方面,BOT-2整体重测信度较好,但各测试领域及其分测试的重测信度存在差异。Dietz等(2007)的研究表明,BOT-2完整版与简易版的重测信度均≥0.80。在4个测试领域中,除力量与敏捷性领域外,精细手部控制、手部协调和身体协调领域及其分测试的重测信度均有低于0.80的情况出现。分析其原因,手部协调和身体协调领域的测试项目具有一定的练习效应。此外,Wuang等(2009a)的研究显示,BOT-2的组内相关系数(ICC)为0.99,4个测试领域的ICC在0.98~0.99之间,8个分测试的ICC在0.88~0.99之间。
表2 个案BOT-2得分情况统计Table 2 The Sample of Scoring of BOT-2
3.2 效度
效度(validity)即准确度,是指测量工具或测量手段能够准确测出所要测量的变量的程度(风笑天,2013)。效度越高,表示测量结果越能显示出所要测量对象的真实特征。已有研究对BOT-2的内容效度和结构效度进行了检验。内容效度方面,通过收集焦点小组和专家小组的反馈意见,剔除BOTMP中不合适的测试项目,增加新的测试项目,利用Rasch模型分析BOT-2每个测试项目与其分类的拟合程度。结果表明,BOT-2的测试项目具有代表性,测试项目能够包含动作熟练度测试范围的主要方面(Dietz et al.,2007)。结构效度方面,BOT-2的结构效度取决于能否区分正常儿童与动作障碍儿童。Dietz等(2007)的研究表明,动作障碍儿童组的测试得分显著低于正常儿童组(P≤0.001)。此外,Bruininks等(2005)利用验证性因素分析确定BOT-2的测试领域及其分测试结构,结果显示,BOT-2 的四因素模型较之BOTMP双因素模型的拟合度有明显改善,即BOT-2的4个测试领域在评估动作表现方面更胜一筹。由于目前国际上动作发展测试的金标准还未产生,因此,BOT-2尚未进行效标效度检验。比较研究显示,BOT-2与BOTMP的相关系数为0.80(Venetsanou et al.,2007),BOT-2与PDMS-2的相关系数为0.73(Brahler et al.,2012),BOT-2中精细动作统合性分测试与TVMS-R(test of visual-motor skills-revised)中视觉动作技能领域的相关系数为0.74(Brahler et al.,2012;Dietz et al.,2007)。
研究表明,BOT-2具有良好的效度,但也存在一定争议,争议主要集中于BOT-2简易版的效度方面。Danielle等(2019)分别使用MABC-2和BOT-2简易版评估了加拿大43名6~17岁 FASD儿童的动作发展水平。结果表明,较之MABC-2,BOT-2简易版在识别FASD儿童动作障碍上的敏感度不高。最新的研究以澳大利亚的123名8~12儿童为测试对象,对BOT-2简易版的结构效度进行了检验,结果显示,BOT-2简易版的Rasch模型拟合未得到假设的检验结果,其中肢体双侧协调、上肢协调、平衡、力量、手部灵活性等分测试下的9个测试项目的均方误差(mean square error,MNSQ)均未满足取值范围,拟合结果低于预期,且单脚睁眼平衡梁站立测试项目在性别因素上存在项目功能差异(differential item functioning ,DIF)效应(Brown,2019)。
总体而言, BOT-2完整版是一种具有较高信度和效度的评估工具,可以有效识别动作障碍,在临床上可靠地支持发育协调障碍(developmental coordination disorder,DCD)、阿斯伯格综合征(asperger syndrome,AS)、高功能自闭症及轻中度智障等病症的诊断与评估(李博 等,2018),但BOT-2简易版的效度存在一定争议,可能与样本量、年龄、障碍类型和跨文化差异等因素有一定关系。因此,今后的研究应扩大样本量,提高样本的代表性,对BOT-2简易版的信效度进行更加全面的评价,进一步了解该工具应用中的心理计量学特性,对其价值进行深入挖掘。
4 布尼氏动作熟练度测试在智力障碍儿童动作发展评估中的应用
最早将布尼氏动作熟练度测试应用于智障儿童动作发展评估的学者是Roswal,他于1983年使用BOTMP检验了发展性游戏对轻度智障儿童动作熟练度的干预效果(Roswal et al.,1983)。随后,国内外诸多学者相继使用该工具评估了智障儿童的动作发展水平。通过对文献进行系统梳理、分析发现,2010年之前的研究中使用的是BOTMP,自BOT-2问世后,由于其测试指令简单,具有游戏性,易于施测,诸多学者对其进行了应用效度检验并将其应用于智障儿童的动作发展研究中,主要用于评估智障儿童的动作发展水平、检验干预效果。
国际上,使用BOT-2评估智障儿童动作发展水平的横断面研究显示,多数分测试得分主要与儿童的智力年龄(心理年龄)而非生理年龄相关,智障儿童与普通儿童的动作发育熟练度存在显著差异,其动作发展显著延迟。此外,在上肢协调、肢体双侧协调、平衡、力量等分测试得分上有明显的性别差异,男生得分显著高于女生(Pitetti et al.,2017)。也有学者从障碍类型、障碍程度等方面对智障儿童的动作表现进行了探讨,结果显示,学龄期中度智障儿童的动作发展水平低于边缘和轻度智障儿童,除上肢协调、肢体双侧协调、力量与敏捷性外,中度智障儿童所有动作领域的得分均低于自闭症儿童;除精细动作精确性和上肢协调外,发育障碍儿童所有运动领域的表现均比边缘智障儿童差(Jeoung et al.,2018)。BOT-2也常用于检验干预效果。相关纵向研究表明,动物辅助疗法(Nair et al,2010;Satiansukpong et al,2016)、早期生长激素注入(Myrelid et al.,2010)等干预手段可以促进智障儿童的动作发展,提高其上肢协调、肢体双侧协调、平衡、肌肉力量与敏捷性。此外,有学者使用BOT-2研究环境因素对智障儿童动作发展的影响。Morteza等(2019)的研究显示,环境影响可以补充和替代药物治疗对智障儿童动作发展的干预效果,而不会产生副作用。
BOT-2在我国的应用始于2012年,台湾学者Lin等(2012)首次使用该工具完整版中力量与敏捷性领域的所有测试项目对92名13~18岁唐氏综合征(Down's syndrome,DS)儿童进行了测试,检验了基于VR技术的体感游戏和跑台训练对DS儿童力量与敏捷性的干预效果。此后,我国大陆学者刘伦宏(2014)、孙金凤(2016)相继使用BOT-2完整版中上肢协调、肢体双侧协调和平衡分测试的部分测试项目对我国36所特殊教育学校(以下简称特教学校)的6~18岁智障儿童进行了测试。研究发现,年龄和智障程度对智障儿童的协调和平衡能力有显著影响。同期,我国台湾学者Wuang等(2017)使用BOT-2完整版评估了38名6~12岁威廉综合征(Williams syndrome,WS)儿童的动作发展水平。结果显示,WS儿童的粗大动作能力优于精细动作能力,此外,其认知水平(智商)与精细动作领域及其分测试得分相关性较高,与粗大动作领域及其分测试得分呈中等相关。
目前,我国应用于智障儿童的动作发展评估工具较少,除BOT-2外,还有皮博迪动作发育量表(peabody development motor scales-second edition,PDMS-2)和粗大动作发展测试(test of gross motor development-second edition,TGMD-2)。PDMS-2在评估儿童粗大动作和精细动作的发展水平、制定康复训练计划以及检验运动干预效果等方面有良好的应用价值。它所包含的精细动作评估部分,可以单独应用于脑瘫(cerebral palsy,CP)儿童的康复评定与功能训练,这在国际上已经得到公认(王素娟 等,2004)。但PDMS-2在我国智障儿童动作发展评估中应用并不广泛。我国仅有王素娟等(2003)、Wuang等(2009b)和王桂贤(2013)等学者使用该工具评估了智障儿童的动作发展水平。分析其原因,可能与PDMS-2的适用年龄跨度较小、适用对象范围受限存在一定关系,且该工具对轻度运动障碍检测的敏感度较低(Van et al,2007)。TGMD-2是儿童粗大动作能力评估的常用工具之一,但在我国智障儿童动作发展评估中使用较少,仅有学者Frey等(2006)和孟雪(2012)的研究中使用了该工具。究其原因,可能与TGMD-2的适用年龄局限,加之评估范围未涉及精细动作有关。与PDMS-2和TGMD-2相比(表3),BOT-2在适用年龄、评估范围及测试项目数量等方面具有独特的优势。
表3 我国智障儿童动作发展评估工具Table 3 The Tools of Assessing Motor Development for Children With Intellectual Disability in China
纵观BOT-2在我国智障儿童动作发展评估中的应用 现状,多数研究针对的是智障儿童的粗大动作发展,对其精细动作发展的描述和干预研究相对匮乏,且评估工具使用欠规范。部分研究者仅根据自己的研究需要选择测试指标,但并未汇报测试指标的信度和效度,这就可能导致研究结果出现较大偏差。鉴于此,今后应重视评估工具的信度和效度检验,规范研究步骤,提高研究的科学性。
5 布尼氏动作熟练度测试对我国的启示
国际上,智障儿童动作发展研究已有30余年的历史,而我国该领域的研究尚处于起步阶段,科学的评价体系有待建立。通过对BOT-2的解读,获得如下启示:
5.1 以时代需求为导向,走与国际化接轨之路
BOT-2在国际教育一体化与回归主流运动的历史背景下应运而生,其产生和发展既有深刻的社会背景,又充分体现了时代需求。在健康中国战略背景下,系列文件的相继出台,体现了国家对残疾人健康的高度重视。2016年8月召开的全国卫生与健康大会上,习近平总书记强调,把人民健康放在优先发展战略地位,努力全方位全周期保障人民健康,重视重点人群健康,努力实现残疾人“人人享有康复服务”的目标。同年10月,国务院颁布的《“健康中国2030”规划纲要》中指出,制定实施残疾人等特殊人群的体质健康干预计划,突出解决好残疾人健康问题,加强残疾人健康服务。2017年,国务院出台的《残疾预防和残疾人康复条例》中强调,提供残疾人康复服务,应当针对残疾人的健康、日常活动、社会参与等需求进行评估,依据评估结果制定个性化康复方案,并根据实施情况对康复方案进行调整优化。因此,我们应当以时代需求为导向,开拓国际化视野,借鉴BOT-2的先进理念与方法,积极构建我国智障儿童动作发展评价体系,科学评价我国智障儿童的动作发展水平。
5.2 以精准康复为导向,构建动作发展评价体系
目前,我国智障儿童动作发展的实证研究较少,BOT-2给我们提供了良好的借鉴。我们应当以精准康复为导向,以改善功能、提高生活自理能力和社会参与度为目标,聚焦动作发展,在构建我国智障儿童动作发展评价体系时应注意:1)评价指标的选取。可采用“综合指标—分类指标—单项指标”的分层分类逻辑架构构建智障儿童动作发展评价指标体系。综合指标属于目标层,可分为粗大动作和精细动作两大测试领域;分类指标属于因素层,可根据测试领域设置分测试;单项指标属于操作层,为具体测试项目。由于BOT-2是由美国学者基于美国儿童青少年动作技能数据所研发的,可能存在因跨文化测评而效度减弱的问题。所以在选取我国智障儿童动作发展评价指标时,应立足于我国国情,筛选出BOT-2中有效性已经被广泛验证的测试项目,如双手抛接球、单手拍球、双手拍球、闭眼指鼻、同侧交换跳、直线行走、单脚站立等,评价其在我国智障儿童动作发展评估中的应用效度,增加适用性更强的测试项目,以优化指标体系。此外,设置测试项目时,应遵循儿童动作发展规律,建立分层评价机制,设置适合于不同年龄段儿童的测试项目,以提高测试工具的敏感度,避免“地板效应”和“天花板效应”的出现。2)评价标准的制定。由于我国教育资源不均衡,不同地区智障儿童的动作发展可能存在较大差异,加之国内智障儿童的动作发展、体质健康与患病风险的相关性研究不足,难以设立一个具有信度和效度的标准。因此,在评价我国智障儿童动作发展水平时,可借鉴BOT-2常模参照标准的建立方法,使用百分位法、离差法等统计方法,建立起基于一定参照样本动作发展水平的比较体系。通过常模参照,可以使智障儿童的动作发展水平得以最大程度的区分。3)评价方法的选择。将定量与定性评价相结合,用量化的指标评估儿童动作发展的情况,如拍球的数量、单脚站立的时间等。同时,根据儿童动作发展序列预先设定多级评分标准,对儿童的动作完成情况进行定性分析,以提高智障儿童动作发展评价效能,帮助家长、教师等相关人员全面了解智障儿童的动作发展水平,从而提高特殊体育教育的针对性和有效性,促进精准康复的有效实施。此外,为确保评估过程的科学性,应积极开拓测评思路,促进动作发展评估与人工智能的深度融合,积极研发计算机辅助的动作熟练度测试系统,以减小由于测试人员主观判断差异导致的测试结果偏倚。
5.3 以健康促进为导向,发挥大数据信息整合作用
人的动作发展水平既是判断和检测人的身体形态、机能、素质、运动能力等体质健康状况的外在表现,又是检测人的体质状况的基础因素(Greg et al.,2008)。因此,应将动作发展测试纳入智障儿童健康评价体系,作为体质健康测试只对动作结果进行评价的有益补充。具体而言,应以健康促进为导向,建立我国智障儿童动作发展数据库,与体质健康数据库相关联,为准确把握我国智障儿童动作发展的整体水平、区域间差异、个体间和个体内部差异,跟踪分析儿童动作发展水平的变化趋势和规律,为厘清动作发展与体质健康的关联机制提供量化的数据支撑,力求实现“评估—监控—预测—改进”功能。建立数据库时,可与残联、疾控中心、特教学校等部门通力合作,提高各参与主体之间的信息整合力度,借助大数据手段,打破部门间的信息孤岛阻碍,力求实现跨部门数据共享,为相关部门的科学决策、健身指导提供依据。
6 结论
在倡导全民健康的新时代,研究智障儿童的动作发展,对于促进、改善和保持其健康状态,提高国民整体健康素质,具有基础性和实用性意义。BOT-2具有评估范围广、评估指标细和评估标准严三大特点,是目前国际上广泛应用于智障儿童动作发展的评估工具。我国智障儿童动作发展研究尚处于起步阶段,我们应学习、借鉴BOT-2的先进理念与方法,立足于我国国情,以“三个导向”为抓手,科学选取评价指标,制定评价标准,选择评价方法,建构我国智障儿童动作发展评价体系,精准评估智障儿童的动作发展问题,提高特殊体育教育的针对性和有效性,切实促进智障儿童的健康发展。