APP下载

美国俄亥俄州学业成就评价指标体系述评

2014-06-24周世科

教育测量与评价 2014年9期
关键词:俄亥俄州学区成就

周世科

美国俄亥俄州学业成就评价指标体系述评

周世科

美国俄亥俄州从监测项目的达标率、学业水平综合指数、适当的年进步率和增值评价四大模块对学区内中小学生学业成就进行评价。其评价指标全面,不仅关注核心学科课程的评价,还关注学生的出勤率、毕业率以及学生在所有学科上的表现;评价模式灵活,通过对四大模块的不同组合,形成具有一定冗余度的评价标准;注重对学校进行以自身为参照的发展性评价,关注每一位学生的成长。对比俄亥俄州的经验,我国基础教育质量监测还有很多需要改进的地方,比如要进一步加大政府对质量监测的政策支持、财政投入,评价指标要更加多元、全面,要弱化学校、地区之间的横向比较,评价标准需更具弹性化,等等。

质量监测;学业成就;增值评价

《国家中长期教育改革和发展规划纲要(2010-2020年)》指出,“改革质量评价”、“建立国家教育质量基本标准和监测制度”是今后教育的主要任务。[1]江苏作为一个教育强省,早在2006年便参加了教育部基础教育课程教材发展中心组织的“建立中小学生学业质量分析、反馈与指导系统”项目,并在随后的2008年、2010年和2012年连续四次参加该项目,目的就是希望超越个人经验,结合数据进行有针对性的研究与指导,为教学诊断提供依据,从而改进教学过程,提高学生学业质量。

在四次测试过程中,我们发现了一些问题,取得了一定的成绩,但由于目前的测试仅是对学生学业成绩的简单描述,尚未形成完整的学生学业成就评价指标体系,因此,在测试之后,不能对区域的教育质量进行明确的判断,在这种情况下,各地方各学校虽然得到了测试分析的结果,但改进教育教学的动力仍然不足。可见,目前我们亟需建立一套完整的学业成就评价指标体系来加强对区域学生学业质量的监控,从而对区域教育质量能有明确的判断,为区域改进教育教学提供动力和方向。

在国内,上海市于2011年建立了“中小学生学业质量绿色指标”评价体系,而在国外,尤其是美国,学生学业成就评价已经有几十年的历史,无论是国家层面还是州层面都形成了一套完整的评价指标体系。美国俄亥俄州从1987年便以法律的形式规定特定年级的所有学生都必须参加特定学科的州范围学生学业考试。经过20多年的发展,俄亥俄州学业成就评价指标体系得到不断的完善。该评价体系不仅关注核心学科课程的评价,还关注学校学生的出勤率、毕业率以及学生在所有学科上的表现。评价模式灵活,评价标准具有一定的冗余度。它注重对学校进行以自身为参照的发展性评价,关注每一位学生的成长。俄亥俄州学生学业成就评价体系的全面性、灵活性、发展性等特点恰恰是我国学生学业成就评价体系所欠缺的,值得借鉴。

一、美国俄亥俄州学业成就评价指标体系的四大模块及等级评定

(一)四大模块

一方面,为了配合联邦政府的教育改革行动,满足问责的要求;另一方面,为了检测州范围内的学区、学校和学生是否实现了设定的内容标准,从而改善学生的学习,美国俄亥俄州以法律的形式,规定了州层面的学生学业成就考试。[2]该学业成就评价指标的形式,规定了州层面的学生学业成就考试。该学业成就评价指标体系由四个模块组成,分别是“州监测项目的达标率”(State Indicators)、“学业表现综合指数”(Performance Index)、“适当的年进步率”(Adequate Yearly Progress,AYP)和“增值评价”(Value-AddedMeasure),将四个模块的结果按照一定的规则组合,便可以给学区评定学业成就等级(详见下图)。学业成就等级共分成6等,由高到低分别是“卓越”(Excellent with Distinction)、“优秀”(Excellent)、“优良”(Effective)、“继续努力”(Continuous Improvement)、“观察”(Academic Watch)和“危险”(Academic E-mergency)。下面以2011~2012学年学区A的表现为例,分别就学业成就评价指标体系的四个模块进行解读。

2011~2012学年A学区学生学业成就表现图

1.州监测项目的达标率

本模块监测项目共26项,分别为3~8年级的阅读和数学(12项)、5年级和8年级的科学(2项)、10年级和11年级的毕业考试(考试的内容是阅读、数学、写作、科学和社会,10项),本学年的出勤率(1项)以及上学年的毕业率(1项)。如果某项目学生“熟练”水平以上的比例达到了州设定值(75%),表示该项目达标,反之就不达标,其中,学生的能力水平被划分成5等,由低到高分别是“受限制”(Limited)、“基本”(Basic)、“熟练”(Proficient)、“优良”(Accelerated)和“优秀”(Advanced)。[3]通过计算达标项目的总数,我们便可以计算出达标率。从上图可以看出,学区A共有22个项目达标,达标率为84.6%。

学区要取得高达标率,必须要求每个年级的每一门考试学科都要有好的表现;单个年级或某门学科成绩优异并不能保证该学区取得高达标率,相反,如果某门学科成绩未达标,则会直接降低学区的达标率。因此,对项目达标率进行检测,可以避免教育行政部门主抓毕业年级或核心课程、忽视非毕业年级和辅助课程,从而促使他们对所在学区教学质量进行全面监控,实现教育的均衡发展。

2.学业表现综合指数

学业表现综合指数可以反映学区所有登记在册的3~8年级和10年级学生全年学业成就的综合表现,即,将3~8年级和10年级测试学科的表现汇总,计算出一个分值,在此称之为“学业表现综合指数”。在计算学业表现综合指数时,不分年级和学科,但对不同能力水平的学生赋予不同的权重。以能力水平“熟练”为基准,设定权重为1,能力水平为“受限制”、“基本”、“优良”和“优秀”的权重则分别为0.3、0.6、1.1和1.2。[4]将每种能力水平的比例与其相对应的权重相乘,计算出该能力水平的得分,最后将5个能力水平的得分汇总,便是学区的学生学业表现综合指数。从上图可以看出,学区A的学生学业表现综合指数为97.9。

“学生学业表现综合指数”是对“州监测项目的达标率”的进一步补充,因为要想在本模块取得高分,除了要求学区在“受限制”和“基本”能力水平上有较低的比例,还应该在“优良”,特别是“优秀”能力水平上有高的比例。通过学业表现综合指数,教育行政部门能明确判断本区域的学业质量,同时,通过对学业表现综合指数进行跨年度比较,可以直接看到本区域学业质量的发展趋势,为教育行政决策提供依据。

3.适当的年进步率

2001年,小布什就任总统后,将教育改革作为任内的主要议题之一,推出“美国中小学教育法案”,即《不让一个孩子掉队》(No Child Left Behind)法案,得到了国会两党议员的高度认可。该法案规定各州在数学和阅读科目上制定并实施有挑战性的学术标准,保证所有的学生在12年内达到“熟练”水平,即到2013年各州学生在数学和阅读科目上“熟练”水平的比例要达到100%。尽管这是一个几乎不可能完成的任务,但俄亥俄州教育部门还是根据联邦政府的要求,为各个年级制订了近4年的AYP目标(详见表1)。AYP的检测分成考试指标和非考试指标两类,其中,考试指标主要包括学业成就考试(3~8年级)和毕业考试(10年级)语文和数学学科学生“熟练”水平以上的比例,以及参加测试学生的比例是否满足州设定的标准。为了配合联邦政府的《不让一个孩子掉队》法案,除了对学区学生总群体是否满足AYP进行考察,还必须对其他9类学生群体①的AYP进行检测。非考试项目包括毕业率和出勤率的检测,检测的群体只针对学生总群体,不分类检测。

表1 美国俄亥俄州近四年的AYP目标(以三年级阅读为例)

AYP的检测非常严格,针对考试指标和非考试指标,只要任何一个群体有一项不满足,那么该学区AYP检测的结果便为“不达标”。一旦AYP未达标,则直接影响学区最后的等级评定。如果学区连续多年AYP未达标,将会受到来自联邦政府和州政府的问责。联邦政府会将连续多年未达标的学区记录下来,然后要求学区制订提高目标,而州政府的做法则是直接降低学区的评定等级。[5]从“2011~2012学年A学区学生学业成就表现图”可以看出,学区A的AYP结果为“不达标”。

4.增值评价

增值评价以学校教育活动对学生预期成绩的增值为教育评价标准,用来判断教师、学校对学生学业成长的积极影响,是一种发展性的评价。[6]以增值指标作为评价学区表现的方法在先进的国家和地区已经实施了多年,其最大优点是能考虑学生能力及学区特质等多种因素,反映学区对提升学生学业表现的相对效能。增值的测量是美国俄亥俄州评价学区学生学业成就的重要指标之一。[7]

俄亥俄州的增值评价目前只针对学业成就考试。由于全州的3~8年级学生每年都必须参加学业成就考试,因此给增值评价提供了基础。每个学区与自己上一年的学业成就表现对比,经过统计分析得到本学区在这一时期内学业成就的变化情况,并与预期结果进行比较,得到本学区在这一时期内的“增值”,高于预期的结果称之为正增值,达到预期的结果为零增值,没有达到预期的结果则为负增值。[8]从“2011~2012学年A学区学生学业成就表现图”中可以看出,学区A的增值评价结果为“负增值”。

(二)等级评定

将以上四个模块的结果按照一定的规则组合,便可以给学区评定学业成就等级。学区学业成就等级的评定分成两步,第一步是初评,第二步是将初评的结果与增值评价结果组合,得到最终等级。初评的组合模式如表2所示。

表2 初评的组合模式[9]

第二步组合的原则有三点:(1)如果你所在学区连续两年或两年以上的增值评价结果为正增值,最终等级便会在初评的结果上上升一个等级,“优秀”的上一等级是“卓越”;(2)如果你所在学区连续两年或两年以上增值评价结果为负增值,学区的最终等级便会在初评的结果上下降一个等级,“危险”的下一等级仍然是“危险”;(3)其他情况,增值评价将不起作用,初评结果便是最终结果。

仍以学区A为例,州监测项目的达标率为84.6%,学业表现综合指数为97.9,AYP为“不达标”,根据表2的组合模式,初评结果为“继续努力”。由于学区A本学年的增值评价结果为负增值,上一年的增值评价结果为零增值,因此,增值评价不起作用,初评结果“继续努力”便是学区A最终等级评定结果。通过等级评定结果,学区领导以及教师对本学区的学业质量能有一个明确的判断,从而为改进教育教学提供动力和方向,同样,教育行政部门可以依据等级评定结果对学区进行奖励或问责。

二、启示

我国基础教育质量评价起步较晚,2007年才成立了国家层面的基础教育质量监测机构,经过7年的发展,全国已有15个省份已经成立或明确了省级监测机构,开始了省域基础教育质量监测的探索,市级、区县级层面的基础教育质量监测机构也在全国各地不断地建立。尽管我国与美国俄亥俄州在教育制度和教育实践上存在着明显的差异,但俄亥俄州的教育评估政策是为了提升学生学习成就和提高教育质量而实施的,其出发点与我国的教育总体目标和教育改革诉求相符。因此,我国基础教育质量监测工作可以从俄亥俄州学业成就评价指标体系中得到一些启示。

1.建立健全基础教育质量监测保障机制

美国俄亥俄州学业成就考试能每年定期开展,离不开来自联邦和州政府的官方支持。为了使考试能够常态化进行,1987年,俄亥俄州政府以法律的形式规定特定年级的所有学生都必须参加特定学科的州范围学生学业考试,并且联邦政府和州政府每年下拨大额的专项经费保障监测的正常实施。因此,要将我国各级层面的基础教育质量监测工作更好地开展下去,各级行政部门应该提供必要的政策和财政的保障。政策的强制性可以使质量监测工作有据可依而不流于空谈,使评价活动程序化、常态化。而大规模监测所需的资源投入也只有依靠各级财政的支持才可能得以实现。[10]以江苏省为例,为做好全省范围内的质量监测工作,2008年省教育厅在省教科院下成立了基础教育质量监测中心,省财政厅把基础教育质量监测工作列为专项,每年拨付定额的专项经费保障质量监测工作的正常开展。

2.引入中介机构的专业支持

基础教育质量监测是一项具有高度专业性的工作。通过阅读美国俄亥俄州的学生学业成就报告,很多先进的测量技术都已应用其中,如题库的建设、试卷的设计、组卷、测验等值、增值评价,等等,这些测量技术虽在我国的报告中已有实践,但尚不成熟,因此我们迫切需要专业机构给予专业的支持。在当前强调政府机构精简的背景下,这样一种机构不应成为政府机构的一部分,而应以中介机构的形式存在。[11]由于以往我国政府管理过于强势,公共领域中的专业教育中介机构先天不足,“发育”也并不成熟,集中表现在专业性不强的问题上,并不能满足高投入、高技术的要求,这一点也非常突出地反映在江苏省的基础教育质量监测领域。因此,教育行政部门应投入精力与经费培育并扶持国内专业化的评价机构或与欧美国家具有认证资质的中介机构签订合同,让他们承担教育质量监测的技术性工作,包括实施监测、提供分析报告、为政府提供评估服务,等等。以江苏省为例,由于专业人员和技术的缺乏,2006~2012年,基础教育质量监测工作主要采取外包的形式,通过引入专业机构来完成。但是,在引入专业机构的过程中,江苏省非常注重自身专业力量的发展,通过高频次邀请专家做讲座、派遣专业技术和命题人员实地学习、直接参与专业机构各子项目研究等形式,在监测工具的研制、教育测量与统计、计算机软件编程等方面都积累了大量的经验。2014年,江苏省将独立开展覆盖全省所有区县的基础教育质量监测工作。

3.构建多元的评价指标体系

纵观我国全国范围内的各级教育质量监测,评价指标主要表现在两个方面:(1)基础性指标:描述学生知识与技能的基本状况;(2)背景性指标:描述学生日常生活和学习行为的基本情况。而对于美国俄亥俄州学业成就评价指标体系中的“发展性指标”(增值评价模块)和“趋向性指标”(AYP模块),我国却很少涉猎。其中,增值评价能控制学生原有学业水平、家庭背景和学校投入等影响因素,评价教学进步,对教师工作绩效和学校、学区效能的净贡献评价得更客观、更科学,更适用于绩效激励;趋向性指标能从数据收集的动态性中展示学生和学校的发展变化趋势,为区域、学校确定预期目标与预期范围,让教育和学校的发展“有的放矢”。[12]因此,在我国的质量监测工作不断发展和完善的过程中,我们可以考虑将发展性指标和趋向性指标加入到评价指标体系中,这样一来,就可以关注到每一个孩子的个性发展和需要,为学生提供多样化的评价手段和评价机会。

4.实施问责与干预

问责制度是对基础教育质量监测、结果报告的后续活动的规范,其后续的干预是保障监测体系目标实现的不可或缺的一个组成部分。美国俄亥俄州教育行政部门每年定期将学生学业成就的评定结果向社会公布,并依据评定结果对学区进行奖励或问责。对于连续多年被问责的学区,教育行政部门会将学区领导全部更换。当前,由于评价指标体系的不完善,各级层面开展的质量监测的结果尚未对社会公布,后续的问责亦严重缺失。以江苏省为例,由于问责制度的缺失,省级监测部门监控的力度大大削弱,直接导致的结果就是:各市、县(市、区)对报告内容不重视,省级教育行政部门要求的整改也未能做到位,质量监测的结果未能很好地予以利用。因此,各级质量监测部门应尝试以俄亥俄州学业成就评价指标体系为蓝本,研究和制定适合自身的学业成就评价指标体系,定期向社会公开测试结果,实行问责。实行问责不仅仅是对各级政府责任的追究,其更重要的目的在于督促各级政府对本辖区内教育质量负起责任,促进教育的发展和质量的提高。

注释:

① 9类 群 体 分 别 是 贫 穷 学 生(Economically Disadvantaged Students)、亚裔或太平洋岛民学生(Asian/ Pacific Islander Students)、非西班牙语系的黑人学生(Black,non-HispanicStudents)、美国印第安或阿拉斯加本地学生(American Indian/Alaska Native Students)、西班牙语系学生(Hispanic Students)、多元种族学生(Multi-Racial Students)、非西班牙语系的白人学生(White,non-Hispanic Students)、残疾人学生(StudentwithDisabilities)、英语受限学生(StudentswithLimitedEnglishProficient)。

[1][12]吴志华,王红艳,王晓丹.大规模教育评估的兴起、问题与发展——加拿大教育评估的启示[J].外国中小学教育,2011(8):1~5.

[2][11]崔允漷,王少非,夏雪梅.基于标准的学生学业成就评价[M].上海:华东师范大学出版社,2008.51~65.

[3][4][5][9]Ohio Department of Education,Center for Curriculum.Assessment and Instruction[EB/OL].http://www. ode.state.oh.us,2013-12-23.

[6]边玉芳,林志红.增值评价:一种绿色升学率理念下的学校评价模式[J].北京师范大学学报,2007(6):11~18.

[7]罗冠中,萧伟乐.香港中学增值指标的发展与应用[J].考试研究,2010(3):61~75.

[8]许志勇.运用增值评价,促进教育均衡发展——以某省教育招生考试院的实践为例[J].教育测量与评价,2011(4):8~12.

[10]刘学智.区域性义务教育学业质量监测制度建立过程中应注意的若干理论问题[J].考试研究,2010(4):21~28.

责任编辑/林 洁

G40-058.1

A

1674-1536(2014)09-0013-05

周世科/江苏省基础教育质量监测中心办公室助理研究员,主要研究方向为教育测量与评价的研究。(南京 210013)

猜你喜欢

俄亥俄州学区成就
了不起的成就
美国俄亥俄州社区学院绩效拨款:理论基础、政策演变及启示
全球创意建筑集锦(上)
加强乡镇学区建设 提高幼儿园管理水平
推进学区化集团化办学 促进教育均衡发展
第一家
学区房就是一面照妖镜
学区房
失恋“成就”的CEO
回顾五年成就