美国NAEP教育评价框架简介及其对我国物理教育评价的启示*
2014-10-21陈红君费金有
陈红君 曹 雷 费金有
(1.长春师范大学物理学院,吉林 长春 130031;2.长春师范大学纪检科,吉林 长春 130031)
教育评价是教育的重要组成部分,通过评估可以使我们发现教育中的不足处,为教育的决策提供高质量的信息资源.教育评价进行得如何在一定程度上直接影响着教育的质量,影响着国家对人才的培养,值得我们予以重视.美国国家进步评价(NAEP)以其高质量的测试工具、管理形式和评分方式形成了一套较为高效的评价体系,被认为是教育成绩调查的黄金标准.
教育测试框架是对评价的目的、测量的具体内容和方法的表述和界定.类似于我国的命题双向细目表.双向细目表更关注的是学生对知识的掌握程度,而NAEP的科学测试框架更关注学生的认知程度和科学探究水平.[1]
1 NAEP科学考试的发展历程概述
在20世纪70年代,人们对于教育的改革已经失去了兴趣.1981年,时任美国总统的里根希望解散美国教育部,并且希望联邦政府不要把NAEP用于各州和地方学区进行改革.另一方面,一系列的报告揭示了美国教育状况的衰退.人们又开始关注教育的改革,把注意力再一次集中到了学生的学业成绩方面.
1984年,在NAEP评估委员会的帮助下,各州和各地区把他们自己的学生评估和全国性评估进行了比较,一致认为跨州比较的计划更合理.1986年位于南部的3个州开始对他们的学生进行为期3年的测试,主要针对学生的阅读和写作成绩评估,1988年,修改后的NAEP实行方案出台,并且批准NAEP进行试行性的州评估,此举措得到了各州和地区的广泛支持.最终,也促成了NAEP的政策制定机构——美国国家评估管理委员会(National Assessment Governing Board,简称NAGB)产生.
直到20世纪90年代末,美国社会对于NAEP的评估效用还存在怀疑的态度.1990年,NAEP对4年级学生的数学和阅读及8年级学生的数学进行了以州为单位的评估,接着在1993年和1994年决定把对数学和阅读的州评估扩展到4年级、8年级和12年级.1996年8月,NAGB发表声明指出了NAEP评估政策的不足,如评估的科目太少,评估时间间隔太长等等.还提出了进一步的改革方案,并要求各州和地区把他们的评估和NAEP紧密联系起来.该声明的发表对NAEP的最终确立起到了奠定的作用.2001年出台的“美国中小学教育法案”(《不让一个孩子落伍》)使得NAEP完全确立.
2 NAEP科学考试的体系设计与考试内容
NAEP科学评价是按照《美国国家科学课程标准》中的理念以及当前的课程目标和重点进行构建,抽取其中核心和关键的能力来考察,以此来了解不同年级学生对不同学科的深入理解情况,为新课程的修订提供有意义的指导.NAEP全国评价和州评价至少每隔两年对4、8年级的阅读和数学进行测试,并且于同一年进行,NAEP全国评价必须(州评价也可以)定期对12年级的阅读和数学进行评估.在条件允许的情况下还可以定期的对4、8、12年级的写作、科学、历史、地理、公民学、经济学、外语、艺术进行长期趋势评价.
NAEP成立的目标是在宏观层面上对学业成就进行监测,而不是单纯的指导教师如何进行教学.NAEP向公众、政策制定者和教育者提供学生在各个学科方面能力的描述性信息,向美国公众报告学生的教育状况,反映出美国公民教育中存在的问题,并对问题进行分析和解决.
NAEP主要评估的是学校课程和思考的技能.其评估领域涵盖阅读、数学、科学、写作、美国历史、公民以及地理,最主要评估的是阅读、数学和科学.测评对象是来自全美的4、8、12年级的学生.
3 NAEP科学考试的评估类型
NAEP全国评估:该评估主要由两部分组成,第1部分是特定的学科的测试问题,其主要题型有问答、多项选择和自由回答.每次评估只要求学生回答一个科目的问题.其结果以两种方式进行报告,一种是等级分数,阅读、数学、历史、地理为0-500,科学、写作、公民学为0-300.另一种是成绩水平,分基本、熟练和高级3类.第2部分是背景问题,涉及学生的性别、年龄、种族、社会经济状况、父母受教育状况等,不涉及学生的家庭信仰和价值取向问题.此外,对教师和学校管理者的问卷调查、学校记录卡以及其他一些可靠的资料也是背景资料的重要来源.评估完成后,最终的结果以学生的性别、种族、学校类型、所在地区、背景信息变量等类别进行报告.
NAEP州评估:NAEP州评估提供所在州的学生的学业成绩状况信息.根据人口统计学和地理组成,从参加评估的州内选取100所学校的4年级、8年级和12年级的学生作为评估样本,再从这些样本中选出25-30名学生参加每个科目的评估.在最终测试结果报告方面,NAEP州评估与NAEP全国评估相同,不报告参与评估的个别学生或个别学校的信息,而是以人口群体(如4年级、8年级学生)和子群体(如男生、女生、亚裔学生、非裔学生等)来报告学生的学业成绩、教育体验、学校环境等方面的信息.
NAEP试验性地区评估:2001年美国颁布了《不让一个孩子落伍》的法案,美国联邦政府也开始对城市地区教育进行验收性的评估.其中使用的测试手段、测试方法、测试时间等方面与NAEP全国评估、州评估相同.2002年,亚特兰大市、芝加哥299学区、休斯敦独立学区、洛杉矾、纽约市公立学校以及哥伦比亚特区对阅读和写作进行了第1次评估.2003年,亚特兰大、休斯敦、波士顿、夏洛特、芝加哥、克利夫兰、洛杉矾、纽约市、圣地亚哥和哥伦比亚特区等10个地区将开展阅读和数学方面的试验性NAEP评估.
4 NAEP科学考试的特点和影响
科学考试的特点:首先低利害性,监测的基本性质是改变考试的高利害性,又称为高风险性.认为NAEP具有低利害性主要的依据是其评价的结果是以整体为单位的形式向全民报告国家的教育状况,这样能够使学校和学生的信息受到保护,也会消除学校、教师和学生对评价结果的暗示,避免不必要的恶性事件发生.其次开放性,NAEP公开的报告制度可以让不同利益的相关者从不同的侧面获取数据.NAEP还会将历年考试的试题和评价框架中的1/4-1/3公开,其余一些未公开的试题主要是用于今后的NAEP测试.用这样的方式来判断学生的学业成就是否进步.NAEP力求在保密性与公开性之间取得平衡.最后公平性,公平性问题一直是评价最敏感的领域.NAEP报告制度在区分学生和学校间不同社会情景(如社区的规模,家庭社会的地位,公私立学校等)的前提下,通过同年各州或地区的横向比较,反映不同地区学生学业成绩的水平.通过跨年度的纵向比较,可以分析出教育质量是否发生变化.
NAEP不仅是公布成绩,更是考察学生在不同领域中的学业成就.通过公平性的比较,不仅能够证明各个群体学生成绩得到了提高,而且处境不利的学生与其他学生之间的成绩差距也缩小了.
NAEP科学考试的影响:NAEP是一项长期对中小学生学业成绩测量的体系.NAEP针对4年级和8年级学生的成绩进行测量,填补了对此发展阶段的儿童的学习状况在测量上的空白.NAEP因其完善、准确的测量数据及评估结果,还经常被用于相关的研究,如有关家庭的变化、社区和学校对学生成绩影响的研究,有关资源的差异、系统化的改革措施、不同的学习机会及教育政策对学生成绩的影响研究等,对美国的教育产生了深刻的影响.
5 NAEP与我国中考在物理测试方面的比较
中考是我国对于学生学业教育评价最主要的依据之一,也是我国教育中的一种比较典型的评价模式.现在就NAEP和我国中考在物理测试方面做出如下比较,希望为我国今后的教育评价的改革提供线索.
测试目标:中考的物理测试题是以《义务教育物理课程标准》为基础指导.中考物理一方面是对初中所学知识的一个检验,对义务教育阶段新课程的改革起到了引领和导向的作用,尤其是在课堂教学方面.另一方面是高中阶段学校的录取选拔的主要依据.NAEP中物理测试是科学课程测试中的一个分支,其测试目标则是考察学生们在识别科学原理、应用科学原理、实施科学实验和进行科学实验4个方面能力.并且向广大的美国公民汇报学生的最近学习情况.针对测评的结果中出现的问题提出合理的解决方案.
测试大纲:(本文以NAEP2009年测试为例)一方面NAEP2009年课程的评价内容是基于两个重要文献《国家科学教育标准》和《科学素养标准》,由开发该评估体系的筹划指导委员会跟踪监督.文献中的内容得到优先选择权.另一方面NAEP试题的编制基于对学生的“表现期望”并且以此为中心进行的.根据开发出的学生表现编制测评试题,由测试题引发学生相应的反应,根据学生的反应判断学生知道什么和能做什么,具体流程如图1所示.
中考物理试题编写是以《义务教育物理课程标准》为编写的主要依据,落实基础,贴近生活,注重探究,考查全面是基本准则.不同的省份再根据各省中考物理考试大纲编写试卷.
测试结构和测试内容:由于国内中考在严格遵循义务教育课程标准要求的前提下,各个省市可以自主命题,因此不同省市每年的中考物理考试大纲和中考物理试卷都是不相同的.通过近几年的中考试卷与NAEP试题的对比分析可以看出,NAEP测试卷的题型和我国中考的题型差距还是比较大的.NAEP和中考由于测试目标的不同,所以NAEP测试中书面评估的主要题型是多项选择题、简答题、问答题及其他非文字回答,中考的题型主要是单项选择、简答、填空、开放性的题目和计算题.NAEP开放性试题的比重大,而我国中考能体现学生基础题型的比重大.
图1
选择题型主要根据是要求学生掌握的知识及评估实施时的设计情况,多项选择题相对于单项选择难度较大,需要较高层次的推理.我国采用单项选择的题型也正是为了考察学生的基础,采取填空和计算的出题方式则是为了适当的增加考题难度,为高中的选拔提供依据,而NAEP的测试中主要开放性试题则是为了考查学生的思考问题的方式和技能.总之,合理设计题型是保障评估质量的重要因素之一.
从试卷所涉及的内容中可以看出,我国和NAEP对于物理测试题的分类是不同的.我国中考所考的物理知识是力、热、声、光、电5个方面,试题编写完全遵循了我国的物理考试大纲和学生所学的内容,其中力学部分和电学部分所占的比例最多,这样的试题编制为学生学习高中物理奠定了基础.NAEP2009的考试内容则是从物质及其转化、能量及其转化、运动3个方面来测试,测试更多关注的是学生对于知识的应用和思维方式.
6 结论
总体来说NAEP科学考试相对来说已经是比较全面和明确的,既能更全面地评价学生的科学素养,又能适应现代社会的发展趋势.通过以上的比较,NAEP科学考试评价框架对于我国教育体制的改革提供了很多借鉴之处,但是由于两国文化背景的不同,所以在进行改革时,不应该照搬照抄,应注意以下几个方面.
(1)重视学生对于学习的认知发展,构建清晰的评价内容体系.
NAEP评价框架在构建的过程中,特别注重学生的认知发展水平.它清楚地了解了某一个年级的学生所学的是什么,根据所学的内容,制定合理的评价体系,从评价体系中检测出学生的思维方式和思维过程.虽然我国中考也有类似的体系,比如《义务教育物理课程标准》,但是所出的测试卷灵活性差,学生已经形成了定式思维,不能很好地反映出学生思维的灵活度.
(2)重视学生的学业能力,构建学业成就评价的原理与模式.
目前,我国教育评价的弊端主要反映在强调甄别和选拔的功能上,忽视了改进和激励的功能,过分注重学生的学习成绩,忽视了学生的全面发展.只关注了结果,往往忽视了学生努力的过程.为了转变因考试造成的恶性循环,应该充分研究和开发学生的能力,促进学生的学业提高.
(3)重视学生的不同价值,构建衡量学生不同价值的标准体系.
在我国人口众多、分布又广,导致了学生的学习环境、水平及能力差异明显,教育条件差距大,所以我们不能用“同一把尺子”去衡量所有的学生.我们应该用不同的方法去评价,减少“一把尺子”带来的负面影响,多一种价值的判断就会多一批有用的人才.
总之,NAEP科学教育评价的发展趋势,不仅对我国的教育评价有所启示,更启示我们要缩减教育中“理想课程”和“实际课程”的差距.
1 梁润婵.TIMSS、PISA、NAEP科学测试框架与测试题目的比较研究[D].桂林:广西师范大学,2009.
2 WestEd.Council of Chief State School Officers.&National Assessment Governing Board.Science Framework for the 2009 National Assessment of Educational Progress(Prepublication Edition).9,11,12.
3 陈晨.美国全国教育进展评价体系(NAEP)的运行机制研究[D].徐州:徐州师范大学,2011.
4 雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006:13-16.
5 Linn R L.教学中的测验与评价[M].北京:中国轻工业出版社,2003:25.
6 周红.美国国家教育进展评估NAEP体系的产生和与展望[J].外国教育研究,2005(2).
7 李景梅.TIMSS、PISA、NAEP测评中物理试题设计的研究[D].重庆:重庆师范大学,2012.
8 黄慧娟,王晞,许明.关于3项著名国际学生评价项目的比较[J].福建师范大学学报,2004(4).