APP下载

美国PEM体育学习评价体系研究

2018-11-30何毅董国永

首都体育学院学报 2018年6期
关键词:量规工具标准

何毅 董国永

摘 要:采用文献资料法对美国中小学体育学习评价体系PEM的发展历史、内容及特征进行了分析,其主要特征包括:评价内容源于国家标准;评价体系相对完善;评价结果可进行转换;为教师制定评价工具提供指导等。在此基础上得出启示:1)构建基于课程标准的体育学习评价体系;2)开发更具实践性和操作性的体育学习评价工具;3)建立同一尺度的評价量规;4)注重培养教师的评价素养;5)以“互联网+”为驱动,推进体育学习评价的发展。

关键词:美国;PEM;体育学习评价;体系;特征;中小学体育学习评价;课程标准;评价工具

中图分类号:G 807.04 学科代码:040303 文献标识码:A

Abstract:The development history, content and characteristics of PEM in primary and secondary school sports learning evaluation system in the United States were analyzed by means of literature review method. Its main features include: evaluation content originates from national standards; the evaluation system is relatively perfect; evaluation results can be converted; it can provide guidance for teachers to develop evaluation tools. On this basis, we get the enlightenment: 1) to build a sports learning evaluation system based on curriculum standards;2) develop more practical and operational sports learning evaluation tools;3) establish the evaluation gauge of the same scale;4) pay attention to cultivating teachersevaluation literacy; and 5) promote the development of sports learning evaluation driven by “Internet +”.

Keywords:united states;PEM;sports learning evaluation; system; characteristics; primary and secondary school sports learning evaluation; curriculum standards; evaluation tools

体育学习评价是体育教学过程中的重要环节,准确有效的评价可以对学生的学习进度和结果进行诊断和判定。早在20世纪80年代,美国体育教育学家纷纷尝试研制有效可靠的评价工具,其中以美国国家运动和体育教育协会(National Association for Sport and Physical Education,简称NASPE)经过10余年研制和试验推出的K-12体育学习评价体系PE Metrics(以下简称PEM)最具代表性,同时也是美国现阶段用途最广、实践效果最为突出的体育学习评价工具,主要表现为:教师将其用于对学生学习进行评价;学校管理人员将其用于课程的规划和问责;学生和家长从中获得反馈;研究人员进行基于资料的实践研究;政策制定者从中了解课程的效果等。本研究通过解读PEM的相关内容,分析其特征,并得到启发,以期为我国基础教育阶段体育学习评价的研究与实践提供有益参考。

1 PEM研制背景及发展历史

美国教育标准化和评价运动起源于1985年国家教育卓越委员会(National Commission on Excellence in Education)出版的“风险国家”[1]。随后,美国教育领域相关学者对基于标准的教育改革和评价做了大量的研究工作,体育教育领域同样如此。这一时期涌现出了丰富的体育学习评价研究成果,主要表现为以下2个方面:1)新的测量理论、概念、方法和技术逐渐被引入到体育测评领域,如项目反应理论、测验等值和项目库等[2-3]。2)构建了多样的学生体育学习评价工具/体系[4-6],其中不乏有一些学界广泛认可和接受的评价工具,例如Fitnessgram和TGMD-2,其中Fitnessgram仍是目前美国全国范围内运用较广的学生体质健康评价体系[7]。

“过去对于学生运动技能和体能的评估大多没有使用标准化测试和体现学生的学习成就,缺乏有效和可靠的评价材料和工具”[8]。直到1995年,NASPE颁布了第1套《国家体育课程标准》(分别于2004年、2013年进行了2次修订),规定了学生通过参与体育活动所应获得的技能、知识和品质,进一步明确了学校体育教育内容的框架和目标,成为这一时期体育教育领域发展和改革的指导性文件。相关学者开始提出构建基于课程标准的体育学习评价体系,并尝试研制相应的评价方法和工具[9],但这些研究成果并没有被广泛地运用。主要原因包括2个方面:1)评价的适用范围有限,无法克服地区差异;2)很多评估是“一次性的”,并没有后续的补充和改进,无法适应不断发展的体育教学内容的丰富[10]。

因此,在PEM评价体系出台之前,美国体育教育领域并没有统一的、权威的体育学习评价工具,体育教师也无法评价学生基于标准的“学术”成就,这就使得体育学习评价的功用流于表像,并未取得实质性的突破。

基于以上背景,2000年1月NASPE正式成立了评价工作组(assessment task force,简称ATF),工作组由研究人员、测量与评价专家、教师教育者、K-12体育教师和教育管理人员组成,旨在建立评价国家标准的绩效指标[11]。随后的几年,ATF基于NASPE颁布的《国家体育标准(2004年版)》,进行了大量的数据收集、評价撰写、预实验、标准修订等工作,于2008年正式发布《PE Metrics:评价国家标准,标准1:小学》。除此之外,随着NASPE于2008年对《国家课程标准》进行了修订,ATF补充和完善了PEM评价体系,主要表现为2010年发布了《PE Metrics:评价国家标准,标准1-6:小学》[12];2011年发布《PE Metrics:评价国家标准,标准1-6:中学》[13]。至此,ATF完成了针对美国K-12教育阶段的PEM评价体系内容框架的构建工作,加速了PEM进一步的推广和实施。2013年,NASPE再次对国家课程标准进行了修订,评估工作组已经开始了PEM系列文本的修订工作,预计将于2016年正式发布[14],但在本研究开始之前,尚未发布相关成果,因此,本文主要基于发展较为成熟的2010版和2011版文本对PEM进行解读和研究。

2 PEM评价体系内容阐释

PEM评价体系由基于标准1的评价和基于标准2-6的评价2个维度构成,2个维度的评价内容相差较大,其中前者用于评价学生的运动技能和身体活动能力,后者用于评价学生体育学习的认知和理解能力。针对不同的维度,ATF制定了相应的评价工具或方法。值得注意的是,在NASPE发布的评价文本中并没有包含所有年级的体育学习评价内容,而是选取了部分具有代表性的年级,其中包括幼儿园、2年级、5年级、8年级和高中。此外,为了完善和补充评价文本的不足,ATF还开发了PEM在线,旨在为教师提供动态的体育学习评价工具和技术支持。详细内容见表1。

2.1 基于标准1的评价

在NASPE发布的PEM体育学习评价文本中,基于标准1的评价包含了多个具体运动项目的评价量表。分别为:幼儿园(8项)、2年级(11项)、5年级(12项)、8年级(12项)和高中(11项),见表2。

针对基于标准1评价文本中的每一个运动项目,ATF均制定了详细的评价量表,量表主要由3个部分内容组成。第1部分为评价内容,包括标准、绩效指标、评价任务、评价量规、胜任标准;第2部分为评价方案,包括对学生和教师的指导、空间/距离图、摄像机位置和操作方法;第3部分为评价计分表,包括1)体育教师、年级、日期、学校、班级。2)学生姓名、背心号码、性别。3)每条量规的分数及总分(为每个部分分数的总和)。

2.1.1 评价内容

在评价文本给出的所有运动项目评价量表中,第1项均为对国家课程标准(2004年版)标准1的陈述,充分体现了评价基于标准的原则。在标准1的指导下,评价工作组经过长时间的数据收集和测试,确定了不同运动项目的具体绩效指标,其反映了在不同运动项目的评价过程中教师所应观察的重点内容。例如,在八年级团队手球运动项目的评价中,其绩效指标为在游戏化的情景中执行团队运动的技能和战术[13]。评价任务是指教师在进行评价时,学生所进行的每项运动的具体活动内容,同样以八年级团队手球运动项目为例,其评价任务为:一个改进了的3对2团队手球游戏[13]。除此之外,ATF还制定了具体的评价量规(本文以高中排球运动项目评价为例,见表3[13]),每条量规列出水平1~4共4个等级(分数)的描述性语言,教师观察学生在每条量规上的具体表现对学生进行打分,并通过每条量规分数的总和,评定学生在这一运动项目中的总体技能水平。此外,在评价量表中特别列出了评价量规的水平3作为运动项目的胜任标准,其目的是强调学生的运动技能水平应达到或超过水平3。2.1.2 评价方案

评价方案中对学生的指导内容需要教师在评价活动开始之前告知学生,确保学生了解评价任务、评价任务的规则、评价的量规等内容,特别是改进了的评价任务,不仅要求学生遵循原始的运动规则,而且要服从根据评价需要制定的约束条件。对于教师的指导主要包含评价前的准备、安全的保障、评价所需的设备或材料等内容,进一步细化了教师进行体育学习评价时的工作内容。在评价方案中,以图片的形式对被评价者和教师(观察者)的站位、彼此之间的距离及摄像机的位置等进行了说明,其目的是使教师更加明确评价过程中的课堂组织形式。同时,评价方案还包含了对摄像机操作方法的说明,确保教师能够合理地安放和操作录像设备。

2.1.3 计分表

计分表主要用于记录学生的信息和成绩,为教师提供永久性的评价记录。

2.2 基于标准2~6的评价

PEM基于标准2~6的评价是以笔试的形式进行测验,测试题目类型根据年级的不同有所区别,其中二年级及以下采用正误判断形式的题目,五年级、八年级及高中则为多项选择形式的题目,且每个多选题有4个选项。为此,ATF设置了相应的试题库,并按照标准2、标准3、标准4、标准5和标准6进行分组。其中标准2内容主要用于评价学生的运动知识和应用能力,标准3~4内容用于评价学生的身体活动和健康体适能,标准5~6内容用于评价学生的个人和社会责任及对身体活动价值的认知[15]。同时,专家组制定了详细的基于标准2~6评价的绩效描述(以基于标准2的中学评价为例,见表4[13]),其中包括各年级水平的绩效描述、跨越年级的持续进步的绩效描述和基于标准1的评价中涉及的相关运动项目的绩效描述。

教师在基于标准2~6的内容对学生进行评价时,既可选取试题库中的试题进行测试,也可以根据教学单元内容自行设计问题对学生进行测试。同时,测试分为线上和线下2种形式,线下测试由教师进行组织,线上测试则在PEM在线网站上进行。教师也可以决定单独评估一个标准内容(例如,标准3),或者考察学生的所有标准内容。教师根据测试的结果并参照ATF确定的绩效指标对学生进行评价。值得注意的是,PEM并没有对基于标准2~6的评价结果进行明确的分级或打分,其测试结果作为教师评价学生时的重要参考,最终的评价成绩仍取决于教师的分析和判断。

2.3 PEM在线

PEM在线是ATF开发的用于补充和丰富PEM文本的应用网站,其内容包含Dartfish视频分析软件、可下载的评价和胜任表现的视觉示例、学生经常犯的错误示例、教师评估材料及指导等。PEM在线的作用主要体现在以下几个方面:1)PEM在线是一个动态的可更新的系统,教师可以获取PEM文本中没有的评价材料和工具。例如:基于标准1的评价量表、基于标准2~6的评价试题等。2)教师可以上传并跟踪学生的评价结果,比较学生、学校甚至地区间的年度评价数据。此外,教师还可以通过数据分析生成评价报告,获取能够指导教学的有效信息。3)学生、家长、研究人员等可以通过PEM在线获取相应的信息,提高了评价结果的利用效率。例如,家长可以通过了解学生的成绩数据在家庭环境中更好地督促学生的体育学习。

3 PEM学生评价体系特征

3.1 评价内容源于国家标准

标准化运动引领着21世纪美国教育的发展,教育者和学生被要求对与标准内容相关的学术成就负责,评价给予教学目的和意义,并告知教师、学生、家长和管理员关于国家标准的学生成绩[16]。在PEM不同的评价维度上,包含了相应的评价内容,这些评价内容都是根据国家标准展开的。例如,基于标准1的评价侧重于学生的运动技能,基于标准2~6的评价侧重于学生的认知理解及应用能力,这与国家标准的内容是相吻合的。其次,对于不同年级水平的评价,虽然测试项目的种类、难度和要求各不相同,但在评价开始之前都对标准1进行陈述,充分说明了不同年级水平、不同项目的评价均是围绕着共同标准构建的。总之,PEM评价体系中的评价维度、评价内容、评价量规、绩效指标等与国家标准(2004版)中的6项标准保持高度一致,紧密围绕着国家标准中规定的学生技能表现和认知要求开展设计与评价工作,国家标准的核心内容是PEM评价体系构建的关键因素。其中,基于标准的评价量规的制定进一步明确了教师在进行评价时观察的具体内容,减轻了教师的工作量,使评价操作起来更加简便。同时,量规也使得学生更加明确所要达到的具体学习目标,在一定程度上可以理解为对国家标准的细化和具体化。

3.2 评价体系相对完善

PEM作为全美适用范围最广、花费精力最多、研制时间最长的体育学习评价工具,经过多年的试验和修订,形成了较为完善的体系,主要表现在以下几个方面:1)评价指标的真实性。在PEM的研制过程中,ATF进行了全国范围的数据收集和实验,并进行了多次的修改,其目的并非是为了适用所有的評价任务,而是为了确保评价的有效性和可靠性,并可用于不同难度之间的比较[17]。2)发展性评价与总结性评价相结合。PEM不仅可以用于评价学生基于标准的总结性成绩,也同样适用于在教学开始时或在单元期间实施的发展性评价。3)评价主体的多元化。ATF认为评价量表和试题库不仅适用于教师评价,同样可以让学生进行自我评价和同伴评价 [18]。4)即时评价和课后评价相结合。对评价过程进行录像使得教师不仅可以在评价过程中直接对受试者进行打分,也可以在评价过程结束后根据录像对学生进行评价,允许教师在评价过程中有更多的精力观察和指导学生。录像的益处包括提供评价的永久性记录、供教师定期检查评分的可靠性、确保评价结果的更高精度等。5)评价材料的可更新性。PEM在线保持着不断更新、不断完善的状态,为教师提供了动态的评价工具,教师可根据教学内容的需要获取相应的评价工具或材料。

3.3 评价结果可进行转换

在PEM标准1内容评价的量表中,评分标准是由不同的量规共同组成,其定义了绩效的组成部分。在对每条量规进行评级之后,一些教师可能会将每个量规的分数简单相加作为学生表现的最终成绩。然而,这里存在不合理之处,因为量规仅使用的是顺序排列的形式,即水平3优于水平2,但是水平3和水平2之间的差距可能不等于水平3和水平4之间的差距。因此,为了解决评分问题,ATF使用项目反应理论和统计测试等式(理论)将评估分数转换为同一尺度(same scale)[19]。一旦来自每个维度的评估得分处于相同的尺度,那么那些测量的分数就可以转换成“能力得分”。

能力分数范围是200~800,平均值为500,标准偏差为100。然而,由于所有任务的难度不同,任何一个评价任务的评分范围并不都是200~800,例如,简单的评价任务的分值范围可以是200~450,非常困难的评价任务的分值范围可以是500~800。除此之外,教师必须知道500是国家数据库中所有评价分数的平均值,并且其平均值接近于C等级。同时,教师还需要确定每一个特定年级尺度的临界值[20]。能力分数的计算可借助于NASPE提供的“计算器”进行换算。

3.4 为教师制定评价工具提供指导

在PEM文本中,运动项目评价并没有涵盖所有的运动项目或适合所有教师的授课内容。这就要求教师针对所授课程内容设计适用的评价工具。ATF针对这一问题提供了具体的解决办法。ATF认为PEM是教师进行评价工作的模板,教师可以根据基于标准1的评价量表设计适合于所授课程内容的评价量表,例如通过修改足球或团队手球量表以评价其他集体性游戏;使用“匹克球”作为开发网球评价的指南等。同时,ATF鼓励教师在基于标准2~6的评价中参照相应的绩效描述设计适合于所授教学内容的测试问题,以评价学生的认知水平。除此之外,当教师想要评价其他年级(除幼儿园、二年级、五年级、八年级和高中)的学生时,可以有以下几种方法:1)教师可以自己设计评价工具;2)可以分解PEM标准1内容评价运动项目中不同等级的部分(例如,匹克球正手评价七年级,反手评价八年级);3)为特殊人群修改或使用基本水平的评价标准[21]。

由上可见,PEM评价工具的研制并不是为了统一所有体育教学活动的评价标准,而是更倾向于通过设计不同技术类别运动项目的评价案例对教师进行指导,培养教师的评价设计和实施能力。PEM并非是一个终结性的评价工具,而是发展性的具有启迪作用的开发性工具。

4 启示

1)构建基于课程标准的体育学习评价体系。为了有效地进行体育学习评价,必须建立操作性强的体育学习评价标准,系统全面地对学生学习内容框架的各个方面进行评价。在构建体育学习评价体系的过程中:一要基于课程标准建立评价体系的内容;二要有明确的学生技能表现的指标或量规,教师在观察过程中可根据相应指标的描述对学生进行评定,进一步加强评价标准的实践性和可操作性;三要针对不同的评定内容采取不同的评价方式,例如对于学生的技能、合作精神等内容的评定可以采取教师观察的评定方式,对于学生的知识、情意表现等认知方面的内容可考虑采用笔试的形式进行测试。

2)开发更具实践性和操作性的体育学习评价工具。体育学习评价工具使得教师评价工作得以简化和具体化,具有更强的实践性和可操作性。从PEM评价工具可以看出,良好的评价工具不仅不会限制教学内容的丰富,反而会给予教师更多的选择权利;因此,在开发适用于体育学习的评价工具时要注意:一是评价工具的研制过程要与实践紧密结合,工具的研制要进行预实验与测试。二是研制工具的成员应包含教育、体育教育、教师教育和测量与评价等多个领域的专家,尤其要有一线体育教师的参与。三是体育学习评价包含了教师评价、学生自评和师生互评,在研制评价工具时要充分考虑学生作为主体进行评价时的适用性,即评价工具不仅要适用于教师,也要适用于学生。四是评价工具应包含对学生各方面成绩的记录,在实际条件允许的情况下,可采用录像记录学生的运动表现,以此为学生提供自我反思的视觉凭证,激励学生的运动表现。

3)建立同一尺度的评价量規。PEM评价体系经过全国性调查和测试,制定了同一尺度的评价量规,并运用新的测试理论,将成绩水平转化为能力分数,这就使得评价的结果可以在不同项目、不同地区、不同年级之间进行比较,教师可以根据不同地区之间的成绩获取指导教学的有效信息,学生也可以从自身不断增长的评价成绩中找到参与体育课程的乐趣与动力,因此,建立基于同一尺度的运动项目评价量规对体育学习评价的规范化具有重要意义。

4)注重培养教师的评价素养。PEM文本中包含了不同类别运动项目的评价量表和材料,除了具有指导教师进行体育学习评价的功用外,其更本质的目的是为教师开发适合于所授教学内容的评价工具提供模板,培养教师设计和实施评价的能力。此外,PEM在线为教师提供的视频分析和评估报告在一定程度上促进了教师对学习评价工作的思考与反思,并且进一步强化了体育教师的评价素养。在教师评价素养的培养方面要根据具体情况进行,在开发评价工具时,要引导教师设计适合于自身的评价工具,为教师提供设计评价的材料和模板,同时,评价素养应纳入体育教师的职前、在职教育体系范畴,并有针对性地开展培训 。

5)以“互联网+”为驱动,推进体育学习评价的发展。随着现代信息技术的迅猛发展,互联网已经成为人们生活、工作中的“必需品”。“互联网+”技术在教育领域的运用影响着各国教育改革与发展,“互联网+教育”逐渐成为教育研究领域的热点问题。体育学习评价也要结合“互联网+”技术,开发出内容丰富、结构合理、资源共享的多元体育学习评价系统。

5 结束语

体育学习评价对于学生学习、教师教学和课程设计的重要作用毋庸置疑。如何准确有效地评定学生成绩,是教师实施体育教学评价面临的现实问题。美国PEM评价体系以标准为参照,制定了具体的绩效指标和量规,并运用新的测试理论将评价结果进行整合,实现了评价结果的可转换性,为教师提供了制定评价工具的模板,开发在线网站辅助教师的评价工作,构建了体育学习评价体系,这对我国体育教学评价体系的建立具有一定的参考价值。

参考文献:

[1] GARDNER D P, LARSEN Y W, BAKER W, et al. A nation at risk: the imperative for educational reform[M]. America:United States Department of Education, 1983:113.

[2] ZHU W. An empirical investigation of rasch equating of motor function tasks[J]. Adapted Physical Activity Quarterly,2001, 18(1): 72.

[3] MORROW J R, ZHU W, FRANKS D B, et al. 1958-2008: 50 years of youth fitness tests in the united states[J]. Research Quarterly for Exercise and Sport,2009, 80(1): 1-11.

[4] SAFRIT M J. Complete guide to youth fitness testing[M]. Human Kinetics, 1995:23.

[5] STRAND B N, WILSON R. Assessing sport skills[M].[S.I.]. [s.n.]1993:12.

[6] BURTON A W, MILLER D E. Movement skill assessment[M]. Human Kinetics, 1998:2.

[7] PLOWMAN S A, STERLING C L, CORBIN C B, et al. The history of fitnessgram[J].Journal of Physical Activity & Health,2006, 3(2): 5.

[8] ZHU W, RINK J, PLACEK J H, et al. PE Metrics: background, testing theory, and methods[J]. Measurement in Physical Education and Exercise Science,2011, 15(2): 87.

[9] LAMBERT L T,LUND J L.Standards-based assessment of student learning:a comprehensive approach[M]. Amer Alliance for Health Physical, 2007:24.

[10] AYERS S F, SAGER J. Ask-PE: Physical education concepts test[A]. National Association for Sport and Physical Education, Reston, 2006.

[11] DYSON B, PLACEK J H, GRABER K C, et al. Development of PE metrics elementary assessments for national physical education standard 1[J].Measurement in Physical Education and Exercise Science,2011, 15(2): 100.

[12] National Association for Sport and Physical Education.PE Metrics: Assessing national standards Standard 1-6 in elementary school[A]. 2nd ed. Reston, VA: National Association for Sport and Physical Education, 2010.

[13] National Association for Sport and Physical Education.PE metrics:assessing national standards 1-6 in secondary school[A]. Reston, VA: National Association for Sport and Physical Education ,2011.

[14] PE Metrics[EB/OL]. [2017-01-13].http://www.shapeamerica.org/publications/products/pemetrics.cfm.

[15] FISETTE J L, PLACEK J H, AVERY M, et al. PE metrics: assessing the national standards article #4 in a 4-part series: NASPE developed informational products and applications[J]. Strategies,2009, 22(6): 35.

[16] FISETTE J L, FRANCK M D. How teachers can use PE metrics for formative assessment[J]. Journal of Physical Education, 2012, 83(5): 23.

[17] FISETTE J L, PLACEK J H, AVERY M, et al. PE metrics: assessing the national standards: article #1 in a 4-part series: developing quality physical education through student assessments[J]. Strategies, 2009, 22(3): 33.

[18] FISETTE J L, GRABER K, PLACEK J H, et al. PE metrics: assessing the national standards article #3 in a 4-part series: the benefits and advantages of nationally tested assessments[J]. Strategies,2009, 22(5): 34.

[19] ZHU W. Test equating: What, why, how[J]. Research Quarterly for Exercise and Sport,1998,69(1): 11.

[20] FOX C. How teachers can use PE metrics for grading[J].Journal of Physical Education,2012, 83(5): 16.

[21] FISETTE J L, PLACEK J H, AVERY M, et al. PE metrics: assessing the national standards: article #2 in a 4-part series: instructional considerations for implementing student assessments[J]. Strategies,2009, 22(4):33.

[22] 曹淑忠,賴华荣,王红妹.体育新课程实施中存在的问题及应对策略[J].体育教学,2006(6): 10-11.

猜你喜欢

量规工具标准
最新出版团体标准
基于“量规”的设计专业实践类课程教学评价体系的应用研究
波比的工具
波比的工具
准备工具:步骤:
永远幸福
试论小学信息技术教学评价量规的设置
石油专用管螺纹量规的使用与维护保养
“巧用”工具
党员标准是什么?