幼儿运动感知能力图形量表(PSPC)解析 及信效度检验
2022-04-22陆颖之陈思同
李 博,陆颖之,陈思同,刘 阳
(1.上海体育学院 体育教育训练学院,上海 200438;2.南通大学 体育科学学院,江苏 南通 226019; 3.上海体育学院 心理学院,上海 200438;4.深圳大学 体育部,深圳 518060; 5.上海市学生体质健康研究中心,上海 200438)
运动感知能力(Perceived Physical Competence,PPC)是连接外界环境刺激和个体动作表现的重要桥梁[1,2]。对于灵长类尤其是人类而言,识别并理解其他个体的运动很重要,是实现社会活动的前提。运动感知包含了对运动刺激物本身、动作表现、意图甚至情绪的识别,可以帮助个体洞悉运动所要表达的真正意图,继而增加个体的社会能力[3]。在教育研究领域,具有较高感知能力的孩子往往表现出更高的自尊,愿意付出更大的努力并选择挑战他们能力的任务[4]。同时PPC也会影响参与体育教育的动机[5],表现在PPC较高的儿童通常较为“活泼”,表现出持续参与体育运动的意愿等。Stodden等建立了影响儿童身体活动变化轨迹的动态机制模型(Developmental Mechanisms Influencing Physical Activity Trajectories of Children)表明,PPC介于运动能力和身体活动中间,具有中介效应[1]。实证研究同样也表明 PPC以及基本运动技能(FMS)在儿童的学习动机和他们参与当前和未来的运动行为中起着至关重要的作用[6]。鉴于 PPC发展的重要性,对 PPC测量与评价的探讨有其理论和实践的可行性。
运动感知能力图形量表(The Pictorial Scale of Perceived Competence-physical Competence,PSPC)是由 Harter和 Pike在 1984年研制[2],PSPC是学术界目前常用的基于 “自我报告”形式的 PPC测评工具。PSPC与儿童运动技能行成的心理属性相关,幼儿时期是个体感知能力发展的敏感时期,因此幼儿也成为了学者们对感知能力研究的重点人群。PSPC具有简洁高效、普适性强、易于比较等优点,近年来在心理学、儿科学和运动学等研究领域被学者们广泛应用。既往研究中,PSPS 已经在美国、英国和德国儿童样本上进行了信效度测试[7-9],但现有的研究缺乏中国样本。根据经典测量理论的知识,测试工具在应用之前,需要进行特定样本的可行性检验,包括信度和效度鞥。本研究的目的:(1)系统介绍 PSPC 的产生发展、测评体系和应用情况,为学者们初步建立 PSPC 的世界观。(2)将 PSPC 进行汉化翻译,在此基础上利用上海市幼儿数据进行 PSPC 的信效度实证检测,初步完成 PSPC 的本土化工作。研究者们寄希望于可以进一步拓宽儿童 PPC 的测量路径,增加学者们在进行运动能力测量时的选择,促进我国幼儿运动能力研究,以此进一步提升我国运动促进儿童健康研究的国际话语权。
1 PSPC解析
1.1 产生发展
上世纪 80 年代,随着脑科学技术的发展,特别是影像技术的发展,人们逐渐认识到感知能力在行为执行和动作发展中的重要性。脑功能成像研究发现,颞上沟及额下回、中央前回及额中回的等是生物运动感知的关键脑区[3]。而一系列的疾病都与感知能力有着密切关系,如注意缺陷多动障碍[3]等。为此,对感知能力的研究逐渐成体系,涉及到神经学、 运动学、儿科医学和公共卫生学等诸多学科[2]。根据 stodden 的儿童体力活动变化轨迹动态机制模型,PPC 在运动技能与身体活动水平的关系中起中介作用,它与运动技能的关系会从儿童早期到儿童中后期逐渐增强,在幼儿时期提升 PPC 是可以正向促进身体活动和运动技能的发展[10]。鉴于 PPC 的重要性,部分发达国家(如:美国)在学前教育中通常会对儿童的 PPC 进行专门性的培养[11]。就是在上述的背景之下,PPC 的测评逐渐进入到学者们的视线,简洁高效准确地测评 PPC 的工具 PSPC 逐渐被学者们所认可。
1984 年,美国丹佛大学的 Harter 和 Pike 联合研发了儿童青少年感知能力和社会接受量表(The Pictorial Scale of Perceived Competence and Social Acceptance for Young Children)[2]。该量表共包括认知能力(Cognitive competence)、运动能力(Physical competence)、同行接受(Peer acceptance)和母亲的接受(Maternal acceptance)四个分维度量表。各个分维度即可与总量表进行合并使用,也可以单独应用。研发者为了更加有效地测量儿童早期的感知能力,特别地将学龄前儿童(4 岁、5 岁)和初级学龄儿童(6 岁、7 岁)的量表做成了图形量表,以标准的测试程序由被试进行“自我报告”。主要是因为 8 岁之前的儿童限制于认知能力的发展,基于文本和语言的报告会严重制约问卷的效度,因此基于图片的量表可以有效地提升问卷的效度。PSPC 是感知能力量表(幼儿)的主要组成部分,主要是用来评估 4~5 岁幼儿的 PPC,该量表是由美国丹佛大学(University of Denver)的 Harter 在 1984 年研制的,PSPC 与儿童运动技能行成的心理属性相关,Harter 按照人群的年龄层设置了不同的测试方案,其中有专门的幼儿测试方案,本研究即是解析的该方案。
1.2 测评体系
PSPC 由 12 张不同的图片构成,每个动作表现形式由 2 张图片并排呈现在图板上,依据测试性别的差异,图片分为男性儿童测试图和女性儿童测试图(图 1 为男性儿童荡秋千图),其中一张图片描绘了一位儿童有能力执行某项运动技能的场景,另一张图片则描绘了无法执行的失败场景。在具体的测试当中,PSPC 提供了固定的测试员问话语,充分保证 PSPC 测试的稳定性。测试流程是:首先要求受试儿童选择一张尽可能符合自己动作表现形式的图片,即让受试儿童自我尝试相同动作技能练习时更像图片中的哪一幅;随后要求受试儿童全神贯注观察自己所选择的图片,同时表述自己与图片上儿童练习动作的相似程度。测试内容包括摇摆(Swinging)、攀爬(Climbing)、系鞋带(Shoes)、跨步跳(Skipping)、 跑(Running)和单脚跳(Hopping)在内的共 6 项测试内容[2]。
图1 运动感知能力图形量表(PSPC)图例(男性儿童 荡秋千)
评分标准中量表的每项动作表现条目的得分范围是 1~4 分。1 分代表图片上那位动作技能表现很差的儿童“与我非常像”;2 分代表图片上那位动作技能很差的儿童“与我有一点像”;3 分代表图片上那位动作技能表现很出色的儿童“与我有一点像”;4 分代表图片上那位动作技能表现很出色的儿童“与我非常像”。根据 6 项动作表现形式进行分数的相加, 总分即是儿童 PPC 的得分,分值区间置于6~24 分,得分越高说明儿童的 PPC 越强。
1.3 应用拓展
PSPC 除了应用于 PPC 的测评之外,近年来还被用于儿童运动能力的测试。已有的研究表明,幼儿的实际运动能力与PPC 存在高度密切的关系[12-15],换言之幼儿的 PPC 一定程度上可以代表实际的运动能力。因此PSPC 就成为了基于“自我报告”形式的儿童运动能力评价法的一种测评工具。2019 年在运动能力评价方法专家共识中将幼儿 PPC 的测量作为 “自我报告”形式的儿童运动能力发展评价方法[16]。共识中将评价儿童运动能力发展的方法分为主观法和客观法两大类,其中主观法下分为“自我报告”和“代理报告”两种。自我报告法下共识中提及了目前常用的工具,PSPC 便是其中之一。共识中还提出,相较于主观法和代理报告的方法,类似于 PSPC 这样自我报告的工具具有简洁高效、花费低等优点。
目前,已有较多的研究将幼儿 PPC 测评结果作为儿童实际运动能力发展的评价,相应的研究也表明应用 PSPC 等自我报告量表确实可以反映学前儿童的运动能力发展情况[16-20]。现有的评价工具包括 PSPC、儿童基本运动技能自我知觉图片量表(The pictorial scale of Perceived Movement Skill Competence,PMSC)等。这其中 PSPC 因操作简便、花费低、实用性较强等因素被学者们所认可。现有的研究中 PSPC 常应用到评估儿童的基本动作技能(Fundamental Motor Skills,FMS),包括:粗大和精细动作、移动、物体控制和稳定性等主要动作表现形式[13][16]。除了上述应用之外,现有的研究中 PSPC 在临床中也应用在筛查和诊断具有感知能力发育障碍的儿童中[21]。
2 PSPS 的中国地区信效度
鉴于目前 PSPC 的信效度验证缺乏中国样本的现象,本研究基于实证的视角选取了上海市 7 所幼儿园的 821 名幼儿,应用 PSPC 进行测量。通过数据展现 PSPC 在中国幼儿群体中应用的稳定性和有效性。
2.1 测试对象
测试的目标人群是幼儿园招收的幼儿。符合条件的参与者年龄为 4 至 5 岁,需要满足以下所有条件:(1)身体健康。(2)经过所属幼儿园园长(或法人代表)知情同意参与本研究,并取得书面知情同意。(3)经其父母或监护人同意参加本研究,并取得书面知情同意。排除条件:(1)严重认知障碍。(2)影响其参与体育锻炼的重大医疗或身体状况。(3) 运动发育迟缓的个人。本研究中任何参与者的性别、种族或社会经济地位将不受限制。研究方案已获得上海体育学院伦理委员会的批准(编号:102772019RT034)。采用整群随机抽样的方法,共招募上海市 7 所幼儿园的 821 名儿童,其中 70 名儿童因缺勤等原因未能参与测试,共有751 名儿童完成测试。其中,女生374 名,占比 49.8%。
2.2 测试项目
2.2.1 运动感知能力图形量表(PSPC)测试
首先,邀请 3 名语言学专业人士对 PSPC 的操作流程进行汉化翻译。完成 PSPC 的中文版标准测试流程。在正式测试前对测试人员(考官)按照 PSPC 的标准化测量程序进行培训,并进行预测试,整个测试由 12 名体育学研究生完成。受试幼儿在安静地、光照温度适宜的空间内完成,一般选取空置的教室。单个受试幼儿完成整个测试需要 3min~6min,整个测试在 2019.9.14~9.29 期间完成。
2.2.2 美国粗大动作发展测试(TGMD)测试
选取美国粗大动作发展测试(Test of Gross Motor Development,TGMD)作为 PSPC 的同时效度测量工具。选取 TGMD 一方面是因此该测评适用于中国儿童的运动能力测试[22]; 另一方面,既往的研究中也有通过该测评验证儿童运动能力自我报告测评工具的信效度[12], 这为本研究提供了理论基础。TGMD 是由美国密西根大学的 Ulrich 教授制定,适用于 3~10 岁儿童,是世界上应用最广泛的儿童运动能力发展测评工 具[22,23]。该测试主要包括跑、 马步跳和双手持棒击固定球等 13 个分测试。目前 TGMD 的最新版本即 TGMD-3 已经在我国进行了操作流程翻译[22]和信效度测试工作[13,24,25],表明 TGMD-3 适用于中国儿童。本研究中对某幼儿园同一批被试进行 TGMD-3 测试,共测试 40 名儿童(其中女性儿童 17 名, 占比 42.50%),以验证 PSPC 的同时效度,严格遵循 TGMD-3 的标准测试流程,整个测试由幼儿教师和 1 名体育学博士生完成。
2.3 数据分析
根据既往研究的成果[20,26,27],选取重测信度和内部一致性信度验证 PSPC 的信度,选取结构效度和同时效度验证 PSPC 的效度。本研究严格遵循统计学有关数据处理和汇总计算的要求。主要应用 SPSS25.0、AMOS26.0 和 Excel 等软件进行数据处理分析和图表制作。首先应用 Excel 软件进行数据的转录处理。其次应用 SPSS 软件进行相关分析(斯皮尔曼相关分析)计算重测信度;内部一致性信度采用 SPSS 软件计算克朗巴哈系数(Cronbach's α); 采用 SPSS 和 AMOS 进行验证性因子分析计算结构效度;应用 SPSS 软件进行相关分析(斯皮尔曼相关分析)计算同时效度。
2.4 结果分析
本研究共有7 所幼儿园的751名儿童参与了 PSPC 测试。表1 是幼儿 PSPC 的得分一览表,可以看出幼儿的PSPC 的总得分是 17.95,这其中“系鞋带”动作的得分最低为1.97, “跑”动作的得分最高为 3.57。相比较而言,女生(18.10)得分高于男生(17.80)。在年龄分组中,5 岁(18.59)得分高于 4 岁(17.50)学生。
表 1 PSPC 得分一览表(N=751)
2.4.1 重测信度(Test-retest reliability)
重测信度又称稳定性系数,是使用测量工具对被试进行同样的测量时,测量结果的一致程度,主要反映了量具在时间纵向维度下的稳定性质[28]。本研究按照 PSPC 施测程序对同一批被试中的 140 名儿童(其中女生 66 名,占比 47.14%)进行两次 PSPC 测试,两次测试间隔不超过 14 天[29]。从表 2 的结果可以看出,PSPC 的总体重测信度 r=0.51(P<0.01), 根据信效度统计分析证据强弱阈值[30-32],当系数置于 0.41 和 0.60 之间表明工具信度“可接受”,置于 0.61 和 0.80 之间时“较好”,大于 0.8 表示“极好”。据此认为 PSPC 的重测信度 “可接受”。当进行区分年龄组进行比较时发现,4 岁组的重测信度“可接受”;5 岁组的重测信度“极好”。
2.4.2 内部一致性信度(Internal consistency reliability)
内部一致性信度主要是代表测量工具内部所有分测量项之间的一致性程度[28]。表 3 是不同性别和年龄组的克朗巴哈系数,其中分测试系数是分测试成绩与 PSPC 总成绩的一致性,总体一致性代表了六项分测试间的一致性。根据信效度统计分析证据强弱阈值[32,33], 当克朗巴哈系数大于 0.6 时,内部一致性信度表现可以被接受,置于 0.66 和 0.70 之间时表示“中等”,置于 0.71 和 0.80 之间时表示“较好”,大于 0.8 时 3 表示信度“极好”。PSPC 的总体克朗巴哈系数为 0.72,表示内部一致性信度“较好”。当进行区分年龄组进行比较时发现,4 岁组和 5 岁组的内部一致性信度表现均是“较好”。
2.4.3 结构效度(Construct Validity)
结构效度是指测试能够测量到理论上的构想或特质的程度[28]。AMOS 进行验证性因子分析结果如表 4。模型满足以下三个必要条件时可认为模型具有良好的拟合度:(1)卡方自由度(x2/df)小于 3;(2)近似均方根误差(Root-mean-square Error of ApproximationRMSEA)值小于 0.05;(3)比较拟合指数(Comparative Fit Index,CFI)值均大于 0.9, 接近 0.95[34-36]。结果可以看出,不同样本集均表现出较好的拟合度,这表示 PSPC 的结构效度较好。
表 2 重测信度相关分析检验系数一览表(N=140)
表 3 内部一致性信度分析中克朗巴哈系数一览表(N=751)
2.4.4 同时效度(Concurrent Validity)
同时效度是指所选择的测试手段与已知测试之间的一致性程度,是效标(criterion)关联效度的一种类型[28]。如果两者的相关系数接近 1,说明该测量手段有效程度高[30]。实际测试中对同一批被试(40 名学生)进行 PSPC 和 TGMD-3 测试,采用相关分析验证两种测试的相关性,根据信效度统计分析证据强弱阈值[30-32],当系数置于 0.41 和 0.60 之间表明工具信度“可接受”,置于 0.61 和 0.80 之间时“较好”,大于 0.8 表示“极好”。结果表示PSPC 总分和 TGMD-3 总分之间具有中等程度相关(r=0.70,P<0.01),这表明 PSPC 的同时效度“较好”。
3 讨论
PPC 是连接外界环境刺激和个体动作表现的重要桥梁[1,2]。近年来,学者们对于 PPC 的研究持续深入,这其中 PPC 的测评是无法绕过的议题。PSPC 的产生和发展迎合了学术界有关 PPC 测评的需求,自 1984 年诞生一直被沿用至今,特别是由于 PPC 和儿童实际运动能力的相关性,近年来 PSPC 还被应用到儿童基本运动技能的测评当中,显示了其高度的实用性。前期的文献回溯发现 PSPC 拥有成熟的测评流程,但较为遗憾的是目前研发者还没有对 PPC 的评价标准(标准参照评价的标准或者常模参照评价的常模)进行报告,这也一定程度上制约了 PSPC 的拓展应用。
PSPC 只针对 4岁~5 岁幼儿,对于 3 岁幼儿没有辨识能力。主要是因为认知的发展变化(如注意力、批判性思维和解决问题的能力)影响儿童自我认知的准确性,因此对 PPC “自我报告”方法的评价会因年龄而异[37]。既往的研究中认为 3 岁以下儿童由于认知发展的限制不适用采用自我报告的形式进行 PPC 的测评。例如在2015 年,Barnett 等人在 TGMD-3 的基础上研发了4岁~8岁儿童基本运动技能自我知觉图片量表(PMSC)[20,26],根据个体认知发展的经历,Barnett 等人认为 4 岁以下儿童还不具有自我报告 PPC 的能力,因此在 PMPC 的设置中并没有添加 3 岁儿童,上述观点也在较多的实证研究中得到了印证[38-40]。PSPC 的研发者们也认识到了这一点,因此在图形量表的设置方面,幼儿部分仅适用于4岁和 5 岁的儿童。 本研究的测试结果还发现“系鞋带”得分最低(1.97)远低于“跑”(3.57)等动作形式得分,这种现象与既往研究的结果相同。在个体早期,儿童的动作发育以 FMS 发展为主。FMS 是人体非自然发生的基础运动学习模式(Basic Learnt Movement Patterns),包括移动(Locomotion)技能、物体控制(Object Control)技能和稳定性(Stability)技能三个下位范畴[41]。在 PSPC 中,跑属于移动技能的动作表现形式,系鞋带属于物体控制技能的动作表现形式。换言之,本研究的结果表明幼儿时期儿童的物体控制技能的发展逊色于移动技能。李静等应用 TGMD-2 对我国山东济南市的1046名3岁~10岁儿童进行测试,相应的测试结果与美国的常模进行比较,发现我国儿童的移动和物体控制技能随着年龄的增长逐步提高,且移动技能的发展要优于物体控制技能的发展[42]。这也与本研究的结果相同。这种现象出现的原因可能是当前的幼儿园体育教育体系当中对物体控制技能的教学不及移动技能教学,目前我国的幼儿园教育体系中并没有设置专门的“体育课”,对于儿童运动技能教学缺乏专门的课程体系;还可能是由于幼儿的生活方式的智能化、自动化等原因造成。这也提示未来需要进一步关注幼儿的物体控制技能的发展。
表 4 不同样本集验证性因子分析结果一览表(N=751)
表 5 PSPC 和 TGMD-3 测试相关系数一览表(N=40)
实证方面,本研究利用上海市的 751 名幼儿的数据验证了 PSPC 的信效度。相应的结果表明,PSPC 在 4 岁~5 岁幼儿应用时具有较好的信效度,据此认为 PSPC 可以在中国 4岁~5 岁儿童中应用。但相应的数据也发现,部分测试项的信度数值较低,如跑的重测信度和内部一致性信度较低。分析认为这可能与被试所处的环境有较大的关系,测试中发现幼儿对“跑”的评价通常选取近期的运动经历作为参照,因此孩子们对于跑的评价会因为近期的经历不同而产生变化,为此信度方面表现较差。但总体而言,PSPC 在 4 岁~5 岁儿童测试中表现出较好的信效度。
充分量化儿童的动作发展对于了解个体动作的发展和掌握是至关重要的[43]。本研究中应用 TGMD-3 进行同时效度的分析,结果表明 PSPC 可以作为 4 岁(r=0.76,P<0.01)、5 岁(r=0.55,P<0.05)幼 儿运动能力的自我报告评测工具。自我报告运动能力评价的方法论在于通过个体的 PPC 进行运动能力的量表报告[16],其原理在于 PPC 与实际运动能力之间的关联强度会随着年龄的增加而增加[10,44],并且幼儿具有根据量表进行自我报告的能力[2]。 Robinson 的研究应用粗大动作发展测试 TGMD-2 测量了 119 名幼儿(4±0.55 岁)的基本运动技能,并应用 PSPC 测量了同一批被试的 PPC,结果表明幼儿的 PPC 和 FMS 高度相关[14]。这种统计学上的高度相关决定了诸如 PSPC 这样的 PPC 测量量表可以作为评价儿童实际能力的工具。相比较于运动能力的客观法而言,PSPC 具有花费少、操作简洁等优点,但也存在精度低等缺点,研究者可以根据研究的目的和需求进行 选择。
本研究的优势一方面在于通过较大的样本量验证了 PSPC 在幼儿样本的信效度,根据经典测量理论的知识,一项量表在进行应用之前需要进行相应的信效度检验,对于非本土文化情景下研发的工具,在应用之前还需要进行相应的本土化工作(如语言的汉化等)。查阅我国应用 PSPC 相关的研究,尽管有研究利用 PSPC 进行相关的研究,但并没有研究专门对 PSPC 的信效度进行验证,这不符合工具应用的方法学流程,以上也是本研究的内在动力。另一个优势在于通过 TGMD-3 验证了 PSPC 的同时效度,TGMD-3 是当前世界上应用最广泛的儿童运动能力测评工具[22],相应的研究结果可以为后续学者们进行运动能力测评工具的选择提供理论支撑。本研究的局限性在于样本仅限于上海地区,主要是因为受制于新型冠状病毒大流行病的影响,招募的非上海市幼儿无法完成相应的测试。
4 结论与建议
对PSPC 的解析是对国外先进 PPC 测评技术和方法的学习。PSPC 的是在特定的学术背景下产生的,应用图形量表的方式可以比较准确地测评儿童的 PPC。PSPC 还可以用在儿童 FMS 的测评当中,这也拓宽了儿童运动能力的测评路径。实证结果也表明 PSPC 在 4 岁和 5 岁儿童具有较好的信效度。因此,本研究认为运动感知能力图形量表(PSPC)操作标准化程度较高且信效度较好,可以作为我国 4岁~ 5 岁儿童运动感知能力的测评工具。限于样本的限制,本研究只对上海地区的儿童进行工具信效度检测,未来应继续扩大样本量,验证 PSPC 在我国不同特征样本儿童(地区、民族、城市/农村、残障儿童等)群体中的适用性。
从本研究的结果分析未来可以从以下两方面的工作着手开展相应的工作。第一,继续扩大样本量,进一步验证 PSPC 的信效度。我国地域辽阔,民族众多,特别是各民族都有自己的传统体育文化,这也就造就了不同民族之间的体育文化间的差异。从前期相关的研究来看,文化差异是影响工具信效度的主要因素[28],因此未来应进一步扩大样本量,特别要注重补充少数民族、农村儿童的数据。第二,通过幼儿教育体系提升幼儿本身的 PPC, 从而提升儿童的健康水平。一项研究通过对 260 名幼儿的 PSPC 和实际运动能力(利用 TGMD-2)的测量,发现尽管幼儿的运动技能水平很低,但他们普遍对自己的运动能力持积极态度。这些积极的看法为培养熟练的实际运动能力提供了“机会之窗”(A window of opportunity)[45]。能力观念和运动能力之间的适度关系表明,幼儿时期就开始做出 PPC 自我判断,并积极影响着实际运动能力。鉴于上述情况,儿童在学龄前生活早期就需要有目的、有机会地培养提升运动感知能力,进而提升儿童的实际运动能力。