美国教育质量评价体系的构成及启示
2017-04-07罗文蔚
罗文蔚
摘要 NAEP(National Assessment of Educational Progress)即教育质量评价体系,是美国目前最具引导性的教育评价体系,这一体系为学生受到科学教育提供了可靠保证。通过对该评价体系进行梳理、剖析,对我国建立科学、有效的教育评价体系具有良好的启示作用。
关键词 NAEP 教育质量评价体系 启示
美国教育质量评价体系(NAEP)被喻为“皇家成绩通知单”,是美国极具代表性、权威性和影响力的教育评价体系,在美国教育界拥有不可替代的地位,在各国建立教育质量体系时具有标杆式作用,是各国争相借鉴和模仿的榜样,在全球范围内拥有极高的影响力。
一、美国教育质量评价体系概述
1.NAEP简介
美国是一个教育高度自治的国家,联邦政府对教育的干预也是建立在民主的基础上,NAEP是美国民主教育的典型代表,已形成国内、州内联动的有机体系。NAEP是一个多维度的、立体全方位的评价体系,能够对教育质量给予最客观、中肯、有效的评价。
NAEP由主要评价、长期趋势评价和专项评估三个层次构成。主要评价重在评估学生当前的学习成果,目的是对国内、州内的学生在核心领域的学习情况进行评估。在国内进行的主要评估频率为一年一次,评估的对象为4年级、8年级和12年级的学生,随机抽取reading、maths、science、writing、history、econoIIHCS、civics、geography和an 9个科目中的三个科目,抽取两个年级的学生参加;在州内进行的主要评估频率为两年一次,样本群来自4年级和8年级的学生,评估科目分为必选科目和自选科目。长期趋势评价侧重评估学生的未来发展趋势,目的是搜集学生在学科成绩方面的未来发展信息,其评估频率是四年一次,样本群来自9岁、13岁和17岁的学生群体,评估科目涉及maths、science、reading和writing。专项评估则具有补充性作用,进行辅助性的专题研究,涉及实验性评价、成绩单评价、口语研究等等,主要针对特定的学生群体,如私立学校、特许实验学校、印第安人、中学生等。
2.NAEP评价系统
第一阶段为框架设计。主要负责机构是美国国家评价管理委员会(NAGB),统领整个评价体系的设计与实施。框架设计经过各界专家以及公众的反复论证,充分考虑学生的心理测试标准、教育的公平测试标准和国家颁布的统计标准。
第二阶段为工具设计。主要负责机构是美国教育考试服务中心(ETS)。按照标准化流程在评估体系的框架下进行试题开发,试题需要经过编写设计、审核、修改、试测、复测、再修改等过程,形成评价试题册的最终版本。
第三阶段为学生样本选取。主要由美国国家教育统计中心(NCES)负责。学生样本选取的依据有区域划分、城乡区别、种族、贫富群体、学校性质等等,按照事先约定的比例从指定的年级中随机抽取学生。
第四阶段为评价测试。由西斯特(Westat)公司负责NAEP数据采集和实施评价。由于NAEP国内评价和州评价的工作量大,为了保证样本数据来源的真实性和数据处理的准确性,主要评价耗时近2个月,而长期趋势评价会在春季、秋季、冬季举行。
第五阶段为评分。主要负责机构是美国国家计算机系统(NcS)。客观题采取“机评”的方式,即使用光电阅读器评分;主观题则邀请有经验的专家依据评分指南和量表进行评分。为尽量避免评分者的主观意向,NCS针对NAEP创新性地开发了电子图像识别评分系统,不仅将主观题以图像的形式客观化,评分系统还会给予一个评分区间。
第六阶段为成绩输出。scale score和achievement levels是NAEP中每一个学科教学成果评估的主要表现方式。scale score依據项目反映汇总,而achievement levels则以基础、熟练和高级三个等级体现。
3.NAEP发展历程
自美国成立以来,州政府和地区学区拥有很高的教育实权,二战后美国开始重新审视自身的教育地位,美国联邦政府开始逐步集中对教育的主导权,开始正式干预教育,NAEP应运而生。NAEP主要经历了以下四个发展阶段。
第一,起步阶段(1963-1969)。1963年NAEP的雏形开始呈现,但遭到诸多教育组织的质疑和反对,历时6年冲破重重阻碍后,NAEP最终被确定由教育委员会(ECS)负责管理。1969年,第一次全国性评估得以实施,但此时评估只涉及国内评估而非州内评估。
第二,探索阶段(1969-1983)。在相对平稳的探索阶段,投资比例决定话语权。美国联邦政府通过逐年增加对NAEP的直接投资,于1972年正式成为NAEP的唯一注资者,成功从ECS手中接过NAEP的管理权,监控权也由国家教育研究发展中心平稳过渡给了NCES。
第三,突破阶段(1983-2001)。一是管理权从ECS到ETS的进一步转移;二是扩大评估层级,增加州内评估;三是NAGB的建立,标志着NAEP有了专门而独立的管理机构,为NAEP在教育领域的主导地位奠定基础。
第四,发展阶段(2001至今)。2001年《一个都不能少》(NCLB)的法案要求所有州必须将NAEP纳人州内评估管理。至此,NAEP从一个自愿参与的评估体系演变为必须参与执行的评估体系,开启了美国教育质量评估的新篇章。
二、美国教育质量评价体系的特征
1.基于学业标准建立
基于学业标准建立是NAEP框架中的亮点之一,通过样本群体的划分以及科目的选择,有效规避了学校和学生个人信息的公布,整个测试过程到评估结果发布都有效遵循了低利害性的特征,避免评估主体——学校、学生受到评估结果的暗示,规避引导教育资源的趋利流动,从而导致教育资源的分配不均。这一特征是NAEP教育质量评估体系得以被大众接受的重要特性。
2.为国家教育决策和改革服务
在NAEP的设立过程中,其开放性也在逐渐升级,主要体现在形式的公开,即历年的评估框架和试题均公开,这一方式既增加了NAEP的公信力,又不会降低NAEP的保密性,使得NAEP的开放性和保密性达到完美平衡。在提高用户满意度的同时,更加客观的反映需要特别关注的领域和需要重视的问题,使教育决策者更直观地看到问题所在,更好地为国家教育决策和改革服务。
3.以提升个体发展为目标
美国NAEP教育质量评价体系的初衷是为学生建立公平、公开、透明的教育体系。提升个体发展是NAEP的价值回归,NAEP评估制度选择不同的样本群体,建立州际之间的横向对比和历年的纵向比较体系,多维度、全方位的反映教育质量的变化。NAEP不仅仅关心学生的成绩,更关心在不同环境下不同受教育群体的成就分布,以及获得这些成就的公平程度。NAEP提升个体发展的特征充分体现了美国“卓越始于平等”的战略目标。
三、美国教育质量评价体系的启示
1.保障教育质量评估的公平性
教育的公平性一直是我们关注的问题,其中涉及教育质量的公平性、教育资源的公平性和教育监测的公平性。一方面,NAEP的样本群体涵盖全面。不仅涉及普通学生,也涉及特殊学生,而特殊学生在样本群体大约占据10%的比例,这样的体系建立为教育监测公平性提供了支持;另一方面,NAEP体系的构成和实践建立在科学的标准和目标之上,能够在政府、中介机构的保障下实现检测的公平性。NAEP为我国建立教育质量评价体系提供重要参考,我国也应坚持长期进行、广泛取样,充分考虑国家统一性标准与不同地区的特殊性标准,城市与农村地区、不同学科、不同时期之间存在的差异性,协调完善新课程标准改革,切实保障教育质量评估的公平性。
2.国家层面对于教育质量监测的重要性
追溯NAEP的发展历程,美国联邦政府通过逐年增加对NAEP的直接投资,正式成为NAEP的唯一注资者,成功从ECS手中接过NAEP的管理权。与此同时,其监控权也发生了转移,由国家教育研究发展中心平稳过渡给了NCES。充分体现了国家层面对教育质量监测的重要性,一个体系的建立需要诸多专家的参与,一个体系的维护更需要国家机构的支持,因此,美国联邦政府不仅是唯一注资者,更是NAEP最直接的监管者。人才的培养是教育的基本内容,而促进教育事业的进一步发展,提高教育质量,需要国家层面作为强有力的推手。比如通过广泛取样、全面评估,制定系统完善的全国性教育评估与评价方案,为国家层面的课程决策提供具有操作性的指导,并不断加大科技研发,提升教育质量监测和教育评估体系的技术手段。
3.教育质量监测充分体现实用性
美国国内、州内之所以能够持续改善教学品质,是得益于实证数据采集,NAEP持续数年收集学生样本数据,已经建立一個强大的随时更新的数据库。这样NAEP不仅可以为评估者提供实时监控的可能,还可以提高数据的横纵向比较,实现普适性与地方性相结合,使学生评估监测标准高度贴合国内实际情况,使监测内容具有广泛性和针对性。如果我国能够借鉴NAEP建立起一个大型的教育数据库,通过数年的积累、收集、整理和应用,必然能够通过丰富的教育研究信息数据,为教育质量的实时监测提供强大的即时学生数据资料,为教育理念创新、教学方式改革发展以及改进学生学业成就提供系统的数据支撑,形成较为科学可行的高效机制,将有助于提升我国教育质量评价的技术性和实用性。
4.评估标准提高目标性
研制评估标准是实现教育成效目标的关键。NAEP为不同年龄段、不同学科设计了非常具体的评估标准,制定了非常清晰明确的目标要求,这样在进行具体的评估之后,老师、学生、评估者以及决策者可以通过不同学生的评估结果来充分了解学生在学业及学习上的优势和不足,也进一步明确了其加强改进的方向及目标。结合我国的实际教育教学情况,新课改的实施促使中小学各科的课程标准陆续颁布,课程标准不仅包含了教材编写的具体要求和原则,还体现了教师教学成果及学生学习成果的具体标准。因此,我国可以参考美国NAEP的评估标准,在课程标准和学生学业水平测试上体现更为具体深入的差异性目标,着重建立一套成熟的学生水平评价主体多元、评价内容全面、评价方式多样的与科学课程相配套的评价体系,进一步完善课程标准,强调学业评价以标准为依据,并对评价标准的目标性作出科学界定,便于掌握真实的学生学业水平。
5.评估结果提高科学性
NAEP基于项目反应理论,通过科学真实有效的参数估计软件针对不同的科学学业项目进行客观的参数估计,并以“基础、熟练和高级”三个等级来划分学生的科学学业成就,同时根据学生不同的预测变量(如性别、年龄、种族等)来综合客观全面地对学生的能力值进行评估。这样的评估结果方式对我国仅仅以学期成绩、学年成绩、中考成绩、高考成绩对学生的水平等级一概而论产生极大的影响,因此,我们可以科学地细化当前的学业水平评价标准,对学生的知识技能、学习方式、学习态度等进行全方位地考察,强化对学生学习结果的可观察性。我国教育部门应创新学生学业水平评价标准,通过科学的测量手段、测量设备使各项水平测试客观可量,尽量减少主观人为性。
当前我国的学业水平评价主要以同年级对比为主,而NAEP通过垂直链接来对比各年级学生的最终成绩,有助于形成纵向对比,形成更为全面立体的评价。我们也可以参考这样的纵向年级比较方式,承前启后,互相补充、激励,提高科学性。
NAEP教育质量评价体系可谓全球范围内教育质量评价体系的典范。项目反应理论(IRT)量表在NAEP中的应用更加提高了NAEP评估的精度,评估报告的焦点会继续停留在“等距分数”的设定(用以分析不同成就水平学生的百分比)。NAEP的框架设计、体系构造、样本取样方式为我国搭建符合我国国情的教育质量评价体系提供了很好的借鉴,NAEP在评估过程中体现出的公平性、开放性也为我国教育评估起到了很好的启示作用。
[责任编辑 郭振玲]