述美国基础教育学业问责制度
2014-11-08杨茂庆
王 瑜 杨茂庆
(王 瑜:广西民族大学教育科学学院 博士 广西南宁 530006 杨茂庆:广西师范大学教育科学学院 副教授,博士 广西桂林 541004 责任编辑:张 敏)
学业问责制可以界定为:“根据州或学区的学业标准,运用测试和评估手段对相关对象(学校、教师、学生等)进行描述或判断,并将这种判断结果以及对象的教育情况进行公布和处理 (奖惩)。”〔1〕20世纪80年代开始,美国联邦政府为提升教育质量不断加强学业标准体系与测评系统的建设,并依据测评结果进行学业问责。2002年联邦政府发布的 《不让一个孩子掉队法》(简称NCLB)将问责制度推向了教育改革的顶峰,其要求各州有针对性地设立包括阅读 (或语言艺术)和数学的学业熟练标准,并以各学校、学区是否通过年度进步指标(Adequate Yearly Progress,AYP)进行问责。随后的奥巴马政府在NCLB核心理念不变的基础上继续完善问责制度的教育实践,进一步明确了其固有的构成要素与措施。〔2〕美国基础教育学业问责制度从实施流程上可划分为渐趋统一的学业标准体系、完备多元的测评系统、全面规范的报告制度以及责任共担的奖惩措施。
一、渐趋统一的学业标准体系
基于教育质量的提升与监控需要,美国从20世纪80年代开始的教育质量改革运动提出了统一和提升教育学术标准的目标。随后,美国联邦政府通过立法 (如 《2000年目标:美国教育法》)不断推动国家学科协会推出包括科学、历史、公民、艺术、地理等各学科的全国标准。2000年,美国教育技术国际协会颁布 《面向学生的美国技术教育标准》,为基础教育阶段的各个主要学科提供了全国标准。由于该国家标准并非强制性标准,各州普遍会在参考国家课程标准框架基础上自定州级标准。为了能提高学术标准并保证各地区的学生学业均衡发展,州内各个学区会根据州级标准来制定各自的课程标准,从而确保评估标准与课程教学标准的一致性。各学区根据州立的教学内容标准以及评估标准框架进行具体化和操作化,指导学校进行校本课程开发,从而确保地方学校系统有统一的教学目标、知识难度和学业评估标尺。
由于全国标准与各州立标准在内容、重点、特色等方面都存在比较大的差异,导致各州设立的课程、教学以及评估都自成体系,州之间的教育差距难以协调、弥合。而各州为了逃避NCLB法案中学校学业成就不达标而遭受严厉惩罚的后果,纷纷下调教育标准,降低了教育问责制度的权威性与实效性。为此,奥巴马政府推出了“力争上游”计划 (Race to The Top),拨款43亿元鼓励各州进行教育改革,更明确提出应出台全国统一标准,改变各州课程、评估标准不一的失衡局面。全美州长协会 (NGA)与州教育长官委员会 (CCSSO)在2010年6月共同颁布“共同核心州立标准”(CCSS),以期统一美国基础教育课程标准,实施学生能达到“升学与就业准备”能力的教育问责。该标准是全美48个州以及哥伦比亚特区和2个海外属地共同参与研制,因此各州积极调整本州课程与评估体系设置,确保与新标准匹配和同步。如符合各州升学与就业标准的评估系统应该能做到有效测评CCSS的广度和深度;能评估学生是否达到预定目标;能支持学校进行改善措施;能有助于促进标准提升等。〔3〕
统一的标准规定了学生学习后应达到的国家期望能力,而问责评估的主要目的是考察学生是否具备了这一期望能力的状况。因此,评估标准与课程标准应保持一致性,包括知识内容、知识样本分布、知识广度以及知识深度等方面。知识内容一致性关注评估项目所涉及的主题与课程标准的内容主题是否一致,考试知识点与课程标准知识点应确保吻合;知识样本分布一致性是指课程标准中每个知识点在关注程度与数量上能在评估与课程标准中均等分布,即每条课程标准都有同样数量的评估条目测量,且这些评估条目的分值应相等;知识广度一致性是要求课程标准中设计的知识跨度与评估项目包含的一致,即保证课程标准中每个知识点都得到评估;知识深度一致性是强调评估内容考察的认知要求与课程标准中的期望程度一致。只有当评估标准与课程标准保持一致时,评估信息才可能成为有效的评估数据。
二、完备多元的学业测评系统
为保障学生学业信息采集的科学性和有效性,美国建立了完备多元的学业测评系统,从测评主体、评价过程以及测评方式上保障学生得到全面、规范和多元的学业评价。首先,美国绝大部分州为了有效检验州范围内各个学区、学校和学生是否达到了设定的内容标准,都为基础教育的每一年级设立了全州的评估考试,建立了较为完善的学生测试体系。以马里兰州为例〔4〕,该州建立了从幼儿园到高中阶段不同层次的完备的州测试评估体系,并由州教育部将测评结果书面通知到每位学生家长。评估测试体系是以学生为中心的,首要体现的是“为了一切学生”的特点,即确保学生不会因为经济困难、少数族裔、身体残疾以及英语障碍等方面原因而导致学业成就薄弱。该体系包括了幼儿园入学准备计划、学校评估考试以及各类学校替代考试。不同类型和层次的考试为学生提供了多样化的评估途径和机会,真正确保政府在比较公平和正义的条件下帮助学生通过评估考试。
问责考试评估通常有三个环节,即命题、评测与数据转换。命题通常采用题库的形式。美国在全国范围内有比较成熟的考试系统和庞大的市场,美国教育考试服务中心、美国大学入学考试等考试机构提供了大量的考试与试题。许多州也都委任专业的评估中介机构建立了基于该州课程标准的试题库,并研发或购买了适当的试题抽样技术,确保试题尽可能低重复且涵盖了核心内容。评测环节主要是检测与评分,即设定适当周期的检测时间和评分规范。考生经过了标准化测试之后,各州将测试及其他采集的信息(主要包括该州的年度进步指标AYP、评估指标、毕业指标以及人口统计指标四类)进行整理、分析并据此建立有效的评估模型或调整合理的教育标准,从而对各个学区和学校实施科学评估。
学生学业成就问责评测主要通过传统的纸笔考试并结合表现性评估的方式进行。传统的纸笔考试因为评分公正、成本低且信度、可比性和规模性较高等优点,一直是美国问责评价的主流方式。然而,教育目标的全面性和纸笔考试的局限性决定了问责评估数据采集还需要借助表现性评估这一技术途径。随着NCLB发布后各州逐渐暴露的“降低标准”、“应试教育”等问题的出现,美国教育界一方面从问责数据分析环节进行评估评价模型改良,即由单一的终结性评估改为诊断性、形成性以及终结性合为一体的复合型评估模型;另一方面则从问责数据采集环节加入表现性评估途径作为辅助。学业成就不再局限于事实性知识的掌握,而是扩展到分析问题和批判思考的认知能力、表现性技能以及情感素质等,这些特定的学习目标需要合适的测评方式去评估,而表现性评估正是纸笔考试的重要补充(见表1)。
三、全面规范的问责报告制度
问责报告是美国教育问责体系中一个重要组成部分,一方面可以为公众提供清晰、准确的教育评估信息,有助于家长对办学质量与学业状况等信息进行理性择校;另一方面可以帮助学校对自身与学生有更好的关注与了解,学校可以根据报告进行改进并达到更高教育标准。教育问责通过向专业人员的赋权,以评估结果来保障教育质量,而问责报告则是将赋权对象扩展到家长和社群,是“评估型政府”通过教育分权促进发展的理念体现。美国各州在教育问责报告的撰写、内容以及公布上都有较大差异,NCLB发布后问责报告开始形成了统一的实施规范和内容框架。NCLB要求各州发布三种教育报告,即评估报告、项目评估报告以及问责报告。评估报告通常用于学生、教师、学校、学区以及州的学业绩效表现总结,由评估中介机构开发或使用评估模型完成;项目评估报告是各类项目的活动与服务的情况总结,通常由各州教育局或学区负责向州内部的利益相关者提供信息;问责报告是与州问责体系密切相关的州、学区与学校不同层次的报告,以及各州向联邦教育部提交的年度报告。
表1 学业成就目标与评估方法的组合 〔5〕
从报告的信息内容看,问责报告作为问责制度的一个主要组成部分,它一方面要反映提升学校教育质量的根本目的,另一方面则是要满足公众对于当前学校教育状况的知情权。因此,教育问责报告要体现出学校在促进学生学业成就的情况,必须在内容上有一个完整且合理的指标信息框架。美国基础教育问责报告内容通常应包括四个方面的信息,即学生学业成就信息,包含学生学业表现相关的各类数据信息;学生受教育机会信息,包含学生受教育机会相关的数据,如接受教育的时间、学校提供的课程等;学生受教育情境信息,包括影响学生受教育的环境因素,如学校环境、学区环境以及学校或政府的相关努力等;技术型说明信息,包括各种术语的通俗解释,确保报告内容易于理解和简洁。〔6〕
从报告的报告层次看,NCLB要求问责报告应在每学年初进行发布,反映上一学年的学业情况、整改方案以及发展趋势,包括州、学区、学校三个层次,每个层次的问责报告因目的的不同而有所差异 (见表2)。各州没有报告发布的义务,只须按规定每年向联邦教育部提交年度报告,但绝大多数州也通过网络及媒体门户向公众进行报告发布;各学区按照规定必须通过网络、媒体或公共机构等几种途径向本学区的所有学校、社区、家长进行报告发布;各学校与学区的报告信息中会提醒当地家长关于该区接受“第一条款”的资助状况和信息,以及各学区或学校的教师资格情况、州学术评估成就水平等。
表2 不同层次问责的目的及措施 〔7〕
四、责任共担的问责奖惩机制
以成绩为导向的、简单的奖惩机制在经历了一定的实践失败后,联邦及州教育部提出应针对不同地区和学校进行差异化问责,政府应与学校共同接受相应问责,从单向奖惩为主的制裁方式转变为改善和扶持为主的责任共担机制。美国各州对于学校教育成就高低的鉴别标准各不相同,但都会有一套严格的鉴定程序。不符合州规定标准的学校会被鉴定为需要改进,改进周期最多5年,改进力度需逐年增大。各州政府根据不同的评估结果以及背后的原因对州、学区与学校制定合理的责任分担框架。其中,政府强调的是外部的支持与干预,学校注重的是内部的自我改善。这种针对不同学校实施不同干预与扶助措施的差异化处理模式反映出美国基础教育改革已经进入精细化阶段,标志着美国基础教育改革已经达到新的高度。
政府主要关注的是表现优异与落后的学校,依据问责评估结果进行奖励或扶助干预。若学校的表现水平达到了规定的标准,政府会对这些学校进行精神或物质上的奖励。通常奖励措施有资金、荣誉以及自由权三类,即为学业成就优异的学校提供奖金作为鼓励;或是在公共场合、媒体中公开表扬,或公开授予奖旗、蓝丝带、证书等荣誉标志;或赋予表现优异的学校更多的自由空间,以期其获得更优异成就。扶助干预是整个奖惩措施的核心,根据干预程度不同可以有轻度、中度与重度三种干预程度及超过20种干预方式。〔8〕轻度干预通常是学校认识到自身的低成就表现并能自行实施改进。这类干预方式主要有鉴定低成就学校、学校成就公布并排名、提供学校改进技术扶助、指导教师专业发展等。中度干预是安排教育扶助队在学校的运行中提供改造意见和方案,并协助学校实施改造。这类干预方式包括学校的组织、氛围、决策、实践、领导等,如实施民主决策、更改人员配置、组建教学团体等。重度干预则是最高风险的政府干预措施,通常会为整个学校带来重要人事变动或教学变革。这类干预方式主要包括重组学校、关闭学校、接管学校及更改学校运营模式 (如普通公立学校改为特许学校)等。
因此,干预扶助措施主要可以分为学校自我改进、政府专业支持以及政府强力干预这三个实施阶段。首先,学校的自我改进主要是学校基于政府提供的有效问责评估信息进行自我诊断,并在此基础上制定并实施的改进计划。其次,政府会为学校提供持续性的专业支持,通过委派有经验的教师、教育家、学者或管理者组成专家技术扶助队为学校提供教学、管理、专业、领导等多方面的支持。最后,政府在经过了书面提醒、技术支持、资金援助、实施改进计划、实施改造计划等措施后,学校仍然无法在规定时间内 (通常为3年)取得有效改善或达到标准,政府将采取风险性较高的学校重组和接管措施。
注释:
〔1〕 The U.S.Department of Education.Public School Choice and Accountability in Public Education〔EB/OL〕 .http: //www.ed.gov/updates/PresEDPIan/art.html.2013-05-02.
〔2〕张斌.基于标准的学校教育问责研究 〔D〕.华东师范大学博士学位论文,2010:68-73.
〔3〕 Achieve.Aligning Assessments with the Common Core State Standards 〔EB/OL〕 .http: //www.pbs.org/teacherline/.2013-02-20.
〔4〕 Office of Academic Policy of Maryland State Department of Education.Strategic Plan 〔Z〕 .Update of Maryland State Department of Education,2005.
〔5〕Stiggins R J.促进学习的学生参与式课堂评价 〔M〕.北京:中国轻工业出版社,2005:77-81.
〔6〕 Sheinker J,Redfield D.Handbook for Professional Development in Assessment Literacy 〔M〕 .Washington, D.C.:Council of Chief State School Officers,2001: 15-32.
〔7〕 ERIC.ED419275.Education Commission of the States.Designing and Implementing Standards-Based Accountability Systems〔EB/OL〕 .http: //www.eric.ed.gov/PDFS/ED419275.pdf.2013-01-08.
〔8〕 Brady R C.Can Failing Schools Be Fixed? 〔M〕 .Washington:Fordham Foundation,2003: 78.