标准化测试和国家教育进展评估在美国的发展、影响及全球化趋势
2010-08-15戚利萍
戚利萍
标准化测试和国家教育评估体系是学校管理的重要形式,是政府部门与社会公众监督学校管理的一项重要手段,它们关系到教育体制改革的进展,并且通常本身就是改革前进的推动力。[1]在全球化的形势下,各类国家教育评估呈迅速发展的趋势,尤其是对小学和初中阶段的数学和语言等学科的评估。资料显示,从1995年到2005年,开展国家教育评估的发达国家总数从28个增加到67个,翻了一倍以上。尽管发达国家仍然保持领先地位,开展国家教育评估的发展中国家的总数也从28个增长到51个,几乎翻了一倍,[2]然而,国家教育评估的开展仍存在地区性差异,美国高质量的教育水平和先进的评估体系无疑有着重要的借鉴意义。事实上,随着全球化的发展,“国际参照物已被认为是取得进步的基础……只有通过国际参照,各国才能清楚了解各自教育体制的强势和相对弱势,并辨明前进的方向”。[3]本文以美国教育为例,探讨美国国家教育进展评估的主要模式,以及标准化测试在美国的发展历程和深远影响。
一、美国国家教育进展评估的主要模式
美国国家教育进展评估(NAEP)是由美国教育部下属的国家教育统计中心(NCES)进行的一项针对学生学习进展的阶段性评估。[4]评估结果的发布又称国家读书报告卡,被政策制定者,各州和各地区的教育者及校长、教师和家长们用于指导教育管理。从1969年起,该评估已经在阅读、数学、科学、写作、历史、地理和其它学科定期进行。对世界史和外语的评估预计在2012年开始。NAEP通过向国家、州和地区领导人提供学生学习的客观信息而成为国家评估和教育发展不可或缺的一部分。只有与学术成绩有关的信息才被收集到此项目中去,它确保为涉及的学生和家庭信息保密。[5]NAEP是美国唯一针对学生在各科领域学习的国家性、持续的评估。[6]
美国最初的教育潮流是对儿童和奴隶进行家庭教育,后逐渐发展为对儿童进行学校教育。美国独立战争后,人们对教育的重视普遍增加,认为年轻一代需要在新的合众国内接受教育。然而,全国各地区的教育却存在极大的差异。随着学校在美国国内发展的失衡,建立某种类型的州级教育体制的重要性日益凸显。为了能够了解各地区的教育质量,学校主管在自己管辖区内进行测试,但目的只是获取学生的信息,不与其他地区作比较。
美国使用评估概念的传统是在基础教育实践领域中产生的。在基础教育领域中,评估这个概念是对大规模考试项目的一种事实描述。[7]NAEP这一类大规模评估的主要目标与重心并非个体的表现,而是集体的绩效。评估的主要工具是标准化和客观化考试,目的在于迅速而有效地获得概要性的与学校绩效有关的统计数据。
1.国家级评估(National NAEP)
NAEP的国家级评估主要有两大类,即主要评估(the main assessments)和长期趋势评估 (long-term trend assessments)。前者从4年级、8年级和12年级的学生中抽样评估,后者的评估对象从9岁、13岁和17岁的学生中抽样。选择上述年级和年龄,是因为它们代表了学术发展过程中的关键期(critical juncture)。
2.州级评估(State NAEP)
州级评估允许各州自己监测在阅读、数学、写作和科学等学科方面的进展。和所有其它类型的NAEP评估一样,州级评估并不提供个体学生或学校的分数。各州可以将自己学生的知识和技能与其它州或和国家标准进行比较。[8]州级评估的程序与国家级评估的程序相同,主要针对4年级和8年级的学生,而不针对12年级的学生。1988年,NAEP只报告全国层面的学术进步。同年国会通过立法授权了一项自愿进行的试验性州级评估,允许各州筛选代表性的学生样本参加州级评估。试验性州级评估在1990年、1992年和1994年进行。从1996年评估开始,各州不再将评估定性为“试验性的”。
州级评估的一次巨大变革发生在2001年,当年通过了美国《中小学教育法案》,即《不让一个孩子掉队法案》。法案要求所有接受政府I号资金的州必须参加每两年一次的4年级和8年级的州级阅读和数学评估。而其它科目(如科学和写作)的州级评估仍为自愿参加。
3.城市地区的试验性评估(NAEP Trial Urban District Assessment,TUDA)
TUDA的目的主要是探析通过NAEP报告各地区公立学校学生成绩的可行性。根据联邦法律的授权,一些选定城市地区对抽样学生的数学、阅读、科学和写作进行了评估。TUDA最先于2002年在5座城市地区进行,即亚特兰大、芝加哥、休斯敦、洛杉矶和纽约。后又增加了波斯顿和圣地亚哥等5座城市地区。[9]到2009年,测试地区已达到15个。哥伦比亚区既进行州级评估又进行城市地区的试验性评估。TUDA的测试过程与国家级评估和州级评估相同。
4.特殊教育研究(Special Educational Studies)
高 中成绩 单 研 究 (High School Transcript Study,HSTS)。此项研究于1982年由国家教育统计中心开展,针对当时正在实施的主要课程改革提供高中生有关课程选修模式的信息,以及课程选修模式和成果之间的关系。高中成绩报告单也提供学生在12年级的模式,为NAEP提供衡量的资料。随着最近公布的2005年研究,HSTS提供给教育界超过10年的宝贵结论。
朗读能力研究(Oral Reading Study)。此项评估的目的在于提供学生朗读流利程度的信息,以及审查朗读精确度、速度、流畅性和整体阅读理解能力之间的关系。阅读理解能力的检验历来只通过学生书面或口头回答关于阅读理解问题的选择,检验这些回答有助于了解学生的阅读能力和思考文本的能力。然而,学生的朗读表现可以使研究人员有机会审查如准确性和措辞方面的信息,而这些是无法从问题回答中直接获悉的。
美国特许学校(America’s Charter School)。 美国特许学校是公立学校的另一个选择,可以接受被分配到普通公立学校的学生。虽然特许学校与其他公立学校之间有许多相似之处,但它们在一些重要方面有所不同,如学生人数的构成和它们的位置。举例来说,相对于其他公立学校,特许学校四年级的学生中比例较高的是黑人。
技术为基础的评估项目(The Technology-Based Assessment,TBA)。TBA是由国家教育统计中心于2000—2003年为NAEP而开展的项目。该项目旨在探讨如何利用科技(特别是计算机)来提高教育评估的质量和效率。目前几乎全国所有学校都配备了电脑,学生们使用电脑的次数也越来越多,该研究旨在考查学生在基于电脑和纸面的数学、写作评估方面的表现。TBA有五个组成部分,包括3项实证研究(数学在线研究、写作在线研究和利用高科技解决问题研究)、一个概念文件(电脑适性测验),以及网上学校和教师问卷部分——此项研究已经投入使用。
国家印第安教育研究(The National Indian Education Study,NIES)。这项研究的目的是为了描述在美国的印第安人和阿拉斯加学生的学习状况,以帮助这些地区的学生达到《不让一个孩子落后法案》所规定的要求。研究由印第安教育办公室(OIE)赞助,由美国教育部下属的国家教育资料中心开展。负责制订研究计划的是一个由来自全国各地的美洲印第安和阿拉斯加本地教育家和研究人员组成的技术小组。
二、标准化测试在美国的发展、影响及全球化趋势
标准化测试在美国的发展可追溯到二战时期,为了对新征士兵的知识和技能进行有效评估,心理学家和人力资源专家设计了不同类型可以准确有效评估知识和技能的测试。测试随后被不断完善以增强其有效性和程序的可靠性。战后,这些设计测试的专业人员成为设计美国学校各类测试的专家。标准化测试设计仔细,对考试结果进行认真检验和严格的质量控制,可以提供可靠、有效的学生学习信息,经过不断改良和完善,很快推广到全国各学校,在美国占统治地位,并被很多国家广泛利用。
但国家标准测试在美国的最初推广并非一帆风顺。美国教育长期以来由各州,而不是联邦政府负责,美国学校历来在内容和管理上存在多样化的特征,各州拥有自己制定教学政策的权利,因而实行全国性的统一测试几乎是不可能的。然而事实上,由于美国社会的高度流动性,教师的流动促进了课程与教学方法的相似性,并且美国大多数学校使用的教材都由少数几家出版商出版发行,因此各州学校实际上都在遵循一个相似的课程与教学模式。到了二十世纪六十年代,随着美国联邦政府在教育中地位的日益增强,针对美国缺乏有关学生学业信息的现状,开展一项全国性学生学业成绩评估体系被提上日程。由于美国宪法规定教育是各州的职责范围,反对者们认为建立全国性的评估体系是联邦政府试图扩张在州和地方教育上的权力。最终,心理学家、教育家泰拉尔夫·勒教授,统计学家约翰·塔基教授等人设计了一项研究计划,定期对美国国内几所样本学校中的学生样本,而不是全国所有学生进行测试,每四年对相似样本进行重复检测,结果以不记名的方式报告;评估结果并不用于州与州之间的比较,而是按不同区域进行报告。至1969年,美国各州教育委员会(ECS)接管了评估体系的管理,教育界的重心才真正转向评估体系的发展和实施。1983年ETS接替ECS,成立项目政策委员会,并将项目更名为国家教育进展评估。
随着教育的不断发展和改革,标准化测试和国家级评估对美国社会的影响日益增加,美国社会掀起了一股提高国家标准的运动。2001年出台的《不让一个孩子掉队法案》规定,美国各州必须确立各自的教育标准,以及与之相配套的教材、考试制度和评估模式,不遵守法案要求的州和学校将无法获得联邦政府的财政支持。法案还规定各州必须在四年级和八年级进行NAEP的阅读、数学和科学测试,并将测试结果与各州自己的测试结果相对比,如果两个结果产生较大差距,则该州必须解释产生差距的原因。标准化测试作为可靠的测量工具,不仅可以准确提供学生的学习信息,对学校和教师来说也意味着一项新的考验。没有达到NAEP测试目标的学校和教师将被监督并要求改进,因此教师将更关注学生的学习情况并对学习较差的学生进行有针对性的辅导。
标准化测试不断改进和发展,目前已被运用于几乎所有的国际教育考试,进一步推动了各国国家教育评估的发展。比如,多米尼加共和国在美国国际开发署(USAID)的资助下与教育评估研究联盟携手开展了一项长期评估。一些拉美和非洲国家也在联合国教科文组织的资助下开展起地区性的评估项目。[10]创建于1994年的拉美教育质量评估联合会如今已发展到19个成员,创建于1990年的南非和东非教育质量监督联盟如今也发展到15个成员国家,其中7个国家参加了1995年至1997年的第一次评估,14个国家参加了2000年至2003年的评估研究。过去,一些中央教育集权的国家发展国家测试体系的目的主要是为了选拔可以继续深造的学生,而不是用于评估课程的设置和实行情况。[11]随着时代的变化,如今的重点更多的在于利用测试和评估来判断教育体系的完善性以达到预期的结果。[12]在这样一种新形势下,国家级与州级教育体系对国家评估和测试的影响之间的区别就不那么明显了。以最发达的国家为例,不论是教育权力高度集中的法国,还是教育权力高度分散到州的美国,所有发达国家都开展了大量的国际化标准测试和国家教育评估。尽管各州的组织结构和教育机构有差异,但开展测试和评估的动力和压力是一致的。这一发展趋势直接影响到不同类别的教育系统——从以教室教育为基础的法国教育制度到证书考试广泛的美国教育制度。
但标准化测试也不可避免地存在一些缺点,如过多的选择题无法全面反映那些由手写答案才能反映出的考生素质。此外,由于学校和教师过多地重视统一考试的结果,教学中的生动性、创造性减少,取而代之的是应试教育的泛滥。教师们主要关注的不再是教育本身,而是如何帮助学生达到标准化测试的要求。目前的许多标准化测试已开始注意增加论述题、作文题等主观题型的数量。瑕不掩瑜,相信标准化测试的高效性、可靠性将使其在未来继续发挥不可替代的优势。
[1]Baker,D.P.,and G.K.LeTendre.National Differences,Global Similarities:World Culture and the Future of Schooling[M].Stanford,CA:Stanford University Press,2005.
[2] [10]Kamens,D.H.and Mcneely,C.L.Globalization and the Growth of International Educational Testing and National Assessment [J].Comparative Education Review,2010,(01):5-25.
[3]OECD (Organization for Economic Cooperation and Development).Education at a Glance,2006[J].Paris:OECD,2006:18.
[4] [9]National Assessment of Educational Progress.http://en.wikipedia.org/wiki/National_Assessment_of_Educa tional_Progress.2010.4.
[5]http://nces.ed.gov/nationsreportcard/worldhistory/and.http://nces.ed.gov/nationsreportcard/foreignlang/.
[6]National Assessment of Educational Progress.http://www2.ed.gov/programs/naep/index.html.
[7]周廷勇.美国高等教育评估的演变及其新发展[J].复旦教育论坛,2009,7,(3):22.
[8]http://nces.ed.gov/nationsreportcard/about/state.asp.
[11]Eckstein,M.,and H.Noah.Secondary School Examinations [M].New Haven,CT:Yale University Press,1993:102.
[12]Travers,K.,and I.Westbury,eds.The IEA Study of Mathematics I:Analysis of Mathematics Curricula[M].New York:Pergamon,1989:58.