APP下载

美国学生学业质量评估联盟PARCC与SBAC述评

2015-07-06刘晶晶郭元祥IanWestbury

中国考试 2015年6期
关键词:语言艺术课程标准核心

刘晶晶 郭元祥 Ian Westbury

2009年2月17 日,为了振兴经济,奥巴马总统签署了《美国复兴与再投资》(American Recovery and Reinvestment Act,ARRA)法案,该法案包括投资教育在内的五大支柱领域。其总投资的1/7,即1400多亿美元将直接补助教育系统。[1]同年7月24日,奥巴马和联邦教育部长阿恩·邓肯宣布实施“竞争卓越(Race to the Top)”计划。按照该项计划,联邦教育部将提供43.5亿美元的“竞争卓越”基金供各州政府申请。[2]申请条件包括在基于《美国复兴与再投资》法案的四大重点领域需取得关键性进步,需采纳共同的课程标准并辅之以卓有成效的评估系统。

2010年6月2 日,由美国各州主导,全美州长协会(National Governors Association,NGA)和州首席教育官理事会(Council of Chief State School Officers,CCSSO)共同发布了《共同核心州立标准》(Common Core State Standards,CCSS),包括共同核心州立英语标准(Common Core State Standards for English language arts&literary in history/social studies science and technical subjects)和数学标准(Common Core State Standards for Mathematics)。[3][4]这份标准定义了美国K-12年级教育阶段学生所应该掌握的知识和技能,其目的是使所有学生在离开高中时都能为升学或就业做好准备。《共同核心州立标准》的出台在美国引起了广泛的关注,迄今为止,45个州、美属维尔京群岛、北马里亚纳群岛以及首府华盛顿哥伦比亚特区已经正式承诺采纳该标准。同时,美国教育部为了保证“竞争卓越”计划的实施效果,在共同核心州立标准公布的三个月之后,就通过竞标确定了评价体系的开发者,即“升学与就业准备评价伙伴”(The Partnership for Assessment of Readiness for College and Careers,PARCC)和“更智能平衡评价联盟”(Smarter Balanced Assessment Consortium,SBAC)。[5]并分别给予1.7亿美元和1.6亿美元的资助。

PARCC和SBAC两大评价联盟旨在为3~8年级以及高中学生开发英语语言艺术和数学的综合评价系统。两个新的评估系统发出一个强有力的信号,通过美国共同核心州立标准,学生应该获得哪些未来升学和就业的知识与技能,教育工作者将调整课程设置和教学等。这一评价系统将于2014—2015学年在参与州全面实施。

1 PARCC和SBAC学业质量评估系统的分析过程

PARCC和SBAC的共同目标都是创建形成性评价和总结性评价的功能系统评价体系。同时,为了更好地服务总结性评价的目的,两个联盟开发的测量过程都结合了需求—技术—评价管理的测量方式,以期待应用于共同核心州立标准的英语语言艺术和数学学业标准的长期技术管理评估体系之中。[6]

PARCC和SBAC两大联盟的评估会用不同的途径来进行按需评估。他们将分别测试3~8年级的学生的英语语言艺术和数学学业表现。然而,他们在高年级的评估方式有所区别。SBAC将在学生11年级进行一个总结性评估。而PARCC会测试学生的9~11年级英语语言艺术学业表现,对于数学,他们将使用代数1、几何、代数2课程结业的测试方式。两个联盟都将全面评估每个学生的认知复杂性,以鼓励学校为所有学生提供更深层次的学习机会。

在形成性评价方面,PARCC计划提供教师和学校评价工具,他们可以通过对照共同核心州立标准诊断学生的学习需要,以及将过程中学生表现评价作为标杆,为一年的总结性评价提供中期反馈。[7]SBAC相反,他们将为地区和学校提供项目资源库,以此可以建构中期测试,以监测和诊断学生的学习进度及预测结果。SBAC也将提供专业发展资源和工具来支持教师的形成性评价实践。同时,SBAC评价体系将利用计算机自动适应测试(CAT),其过程是根据学生之前的能力表现从自定义管理项目中推断表现水平。[8]而PARCC相反,年度终会使用标准、固定的测试形式(如表1所示)。

表1 PARCC和SBAC评估系统的组成

2 学业质量评估系统的分析方法

2.1 以证据为中心的框架设计

PARCC和SBAC两个评价联盟都采用以证据为中心(Evidence-Centered Design,ECD)的方法来进行评估的开发和验证。以证据为中心评估开始的基本前提,即评估是推理的过程,是从证据中推导学生掌握学习能力的原因。从本质上说,学生对评估项目和任务提供了推理过程的证据以及心理测量和其他有效性分析因素,以此共同建立证据的充分性。[9]

ECD是一个原则性的方法,它通过各领域内容和评价证据之间的关系,以此推断学生的学业表现。[10]其中,每一个阶段都成为保证联盟评价系统得以实现共同核心州立标准和深入目标学习的杠杆点。

图1列举了在共同核心州立标准背景下评估发展的这些阶段。这里的ECD过程开始于共同核心州立标准内容本身。PARCC和SBAC重组了共同核心州立英语语言艺术和数学标准方面学生能力的总体领域,即学生升学和就业能力的核心领域。然后将核心领域细化为更具体的分项要求。表2和表3汇总了PARCC和SBAC的各项领域及分项要求。

PARCC与SBAC在每一个领域中有进一步精确的证据说明(PARCC)或评价目标(SBAC)以形成“领域评价胶囊”。这些声明或目标瞄准了具体的共同核心州标准和学生的认知能力。在本质上说,这些“领域评价胶囊”限制了评价的内容、范围以及期待的学业表现,形成了学习项目或者学习任务的范式(如表4所示)。这些项目和任务的范式又提供了充足的指导,以形成必要的项目和任务之间的比较依据。这些范式同时也为设计者在设计时运用“领域评价胶囊”提供了指导。项目设计者运用范式形成项目和任务,进行复审和试点测试并形成测试蓝本,测试蓝本为测试提供取样指导。学生每一年的表现将依据测试蓝本所提供的评价要求来评价共同核心州立标准的学习完成情况。

以证据为中心的研究提供了一个透明的阶段性过程以确保PARCC与SBAC在共同核心州立标准在学生进行深入学习中有深入且广泛的体现。

2.2 对“深度知识水平”模式研究方法的应用

图1 以证据为中心研究方法的形成途径

表2 PARCC与SBAC在英语语言艺术形成评价中的领域及分项要求

表3 PARCC与SBAC在数学形成评价中的领域及分项要求

表4 SBAC在英语语言艺术11年级的学习任务范式

PARCC和SBAC的总结性评价和学生的熟练程度分类是基于代表多方面目标的深入学习,尤其是那些掌握并能够应用相关核心学术内容和认知策略与复杂思考、沟通和解决问题的评估方式的运用。两个联盟都建立了以分析为基础内容规范的测试,都具有样品测试、项目规范、表现任务,以及样品测试蓝图。为了学生的深层次学习和更好的反馈学生21世纪的能力,两个联盟都具备了巨大的潜力去促进学习目标的达成。在评价框架的设计中两大联盟都采用了诺曼·韦伯的“深度知识水平”模式(Depth Of Knowledge,DOK)分类方案。从应用角度,采用这种研究方法的原因是:1)DOK分类方案常用于当前状态的测试比对研究之中;2)DOK分类方案被全美政策决策者和各地行业从业者所熟悉;3)DOK分类方案已被用在现有基础的州测试研究之中。[11]

诺曼·韦伯的深层次知识归类方法运用了专业标准的研究方法,在标准与评价之间作为了保持一致性的参照,它同时也作为认知需求和认知水平相匹配的参照。[12]所以从研究角度采用这种研究方法的原因是:首先,DOK分类方案强调深层次学习范畴的一致性。范畴的一致性涉及标准内容范畴和评价内容范畴的共性。深层次学习的范畴是对共同核心州标准和评价标准涉及的项目的认知需求和认知水平相匹配的表述与运用。其次,深层次学习知识的范围界定。在评价中,参照学习意味着更多的项目要参与测试,并且要与标准目标匹配。所以DOK分类方案将涉及每一个课程标准目标知识的范围覆盖到一个或者多个项目之中。最后,DOK分类方案可以平衡表述。哪一个程度对应哪一个标准或者目标,是否在评价中给予了充分的强调是深层次学习平衡表述的目标。它作为每一个主题内容的参照,并且用标准目标水平去平衡知识的内容与掌握知识的技巧,DOK分类方案在四个层次给予了量的测量和标准。

诺曼·韦伯的“深度知识水平”模式分为以下四个等级,主要为:DOK1:一个事实、术语、概念或过程的调用;对基本概念的理解。DOK2:应用概念和/或程序;涉及思维过程的处理。DOK3:需要抽象思维的应用;推理和/或更复杂的推论。DOK4:需要扩展分析或调查;综合与分析应用于复杂文本和非常规的应用之中。[13]其中,DOK等级3和4可以充分反映21世纪学生所必备的能力,然而在之前的州测试之中却很少得以体现。

表5分析了SBAC英语语言艺术内容规格揭示出的平均35个内容目标在各个年级中的百分比,领域1(阅读)占有最大比例,是总体目标的40%,其次是领域2(写作)29%,领域4(调查/研究)20%,最后是领域3(听、说)11%。总体而言,DOK2和DOK3得到了最大程度的重视,分别所占比例为总考核指标的46%和43%,其次DOK1所占比例为总考核指标的33%,DOK4为25%。

同时,美国国家评价、标准和学生测试研究中心(CRESST)也正在对两大联盟的评估开发工作所能产生的目标是否具有更深入的学习计划进行跟踪监视。从CRESST 2013年发布的报告来看,发现SBAC评价系统多达49%与21%的数学评估目标是评估DOK3和DOK4,而43%与25%的语言艺术的评估目标是评估DOK3和DOK4,这些数据反映出SBAC评价系统比之前的各州评价在21世纪学生所必备的能力要求上有动态的增长趋势。两大联盟在由传统测试向深层次学习测试的转变中做出了巨大的贡献。

3 学业质量评估系统对我国课程改革的启示

2011年,我国修订完善了义务教育阶段课程标准,并于2012年秋开始执行。我国课程标准的设计与美国共同核心州立标准具有一些共同特征,例如标准的选择符合学生认知发展的规律,标准的建构是根据学段进行螺旋上升,每一年段的标准清晰明确。但是我国的课程标准并没有对课程标准质量进行评价开发与分析,美国PARCC与SBAC质量评估联盟的实践对我国课程标准的质量评价有所启示。

3.1 多种社会力量的参与是促成课程标准与评价执行的前提

美国中央政府通过充分利用市场原则调动了市场资源,通过竞争性资助吸引了评价联盟的参与,增加了地方政府、专业机构、教师、家长、学校管理者、教育研究者及社会公众对教育评价体系改革的参与。从开始的联邦政府依靠全国州长协会和州首席教育官理事会共同研制发布《共同核心州立标准》,到后来的联邦教育部拨出款项,提供43.5亿美元的“竞争卓越”计划以推动与标准相应的评价系统的开发。所有资金用于鼓励各州参与开发、实施共同核心州立标准,帮助各州进行学校改革,建立相配套的评估体系。

表5 SBAC 4、8和11年级英语语言艺术内容规格目标在DOK级别指定的平均百分比

在乔治华盛顿大学的国家教育政策中心(Center Education Policy,CEP)于2013年对40个州进行了全面调查,并发布报告。在被调查的40个州中,39个州采用了英语语言艺术和数学共同核心州立标准,1个州仅采用了英语语言艺术标准。通过调查得出以下结论:1)所有参与调查的州同意共同核心州立标准比他们以前的标准更加严格,将提高学生的技能;2)在30个调查的州中认为至少在某些地区或年级课程设置中已经与共同核心州立标准在数学和英语语言艺术相一致;3)调查显示大多数州已开始承接各种相关的共同核心州立标准的特定的国家级活动;4)大多数调查州正在采取具体行动指导老师执行共同核心州立标准;5)调查州中的绝大多数州正在地区和学校执行共同核心州立标准;6)几乎所有州都在通过与其他州通过合作的方式来执行共同核心州立标准。[14]而在参与共同核心州立标准评价联盟方面,至今,亚利桑那州,阿肯色州,科罗拉多州等16个联盟州参与到PARCC评价,宾夕法尼亚州作为“参与州”,学生数量覆盖全美各地1500多万名小学、初中和高中学生。SBAC参与州更多,为31个。SBAC执行委员会主席德布西格曼说:“通过采用共同的普遍工具,国家将能够提供允许所有学生展示他们的知识和技能进行评估,SBAC成员国正朝着2015年春天走去。”[15]

可见,美国联邦政府并没有直接参与标准的制定,但是采用了拨款刺激政策,在强大经济竞争的拨款刺激和政策引导下,各州政府不遗余力推动本州采纳共同核心州立标准,加入评价联盟,使得地方教育职能部门的积极性得以了充分调动。可以说,美国共同核心州立标准与评价联盟成为发展评估学生学业成绩以此支持学生深层次学习和适应21世纪发展走向成功未来至关重要的杠杆点。共同核心州立标准背后的支持者是联邦政府,而多种社会力量进一步促成了课程标准与评价的执行。共同核心州立标准评估系统促进了美国教育朝着标准化的方向持续发展。

3.2 分析工具的开发和良好的教师素养是实现评价质量的保证

美国共同核心州立标准并没有给教师提出明确的教学建议。它认为,课程标准是用来界定学生“应知”和“能做”的,是一套“共享的目标和期待”,它告诉教师、学生、家长应该达到什么样的目标以及哪些目标,但并不规定教师应该如何教学。这为教师和学校灵活实施课程标准留下了空间。那么以何种方式可以让教师清晰地理解并掌握标准,并能够在标准的基础上选择教学内容、实施教学以实现一致性呢?

首先,分析工具的开发。教学过程中教师需要靠自己的理解,识别重要的内容标准和表现标准,需要实时借助外部权威的解释对内容标准和表现标准进行分解操作技术分析,特别是需要有定期检测标准且能进行动态互动检测的工具。同时,因为一致性的研究需要涉及学科内容、学习心理、课程编制、测量评价等多方面。所以需要多个学科、多个领域、理论与实践的融合与碰撞,包含心理、教育、课程、评价专家、教师、管理人员的研究团队。美国国家课程标准的制定过程采取的是除了相关领域的专家,还包括专业机构、教师、家长、学校管理者及社会公众对课程标准共同参与制定的方式。工具开发的过程对教学资源进行了多元整合,体现出标准的、较强实用性和指导价值。

其次,教师素养的培养。在我国长期以来以教材为中心的教学导致教师备课时对市场上充斥的教参产生习惯性依赖,或直接借用教学同伴备课经验;上课时只关注内容标准,但轻视表现标准;评价时只关注结果,缺少多样评价手段和评价机会等等。这些教师专业素养意识丧失的表现直接导致了学生学习质量的低水平。所以,借助美国经验,开发外部支持工具,为教师搭建理解支架,帮助教师对标准有充分的认识与理解,并能够有效判断学生目标达成的水平,调整教学,以避免备课机械化、上课表演化、评价随机化等的教学现状。PARCC与SBAC以数据为中心的实证研究平台为教师、学校、地区提供了检测教学与标准的工具,也协助教师形成了专业素养。同时,笔者认为在教师教育课程和培训中应该加强如下方面:1)培养教师的课程标准解读能力;2)培养教师基于标准的命题能力;3)培养教师基于标准的评价能力;4)培养教师基于标准的反思能力。

[1] The American Recovery and Reinvestment Act of 2009:Education Jobs and Reform[EB/OL].http://www1ed1gov/policy/gen/leg/recovery/fact-sheet/overview1html,2010-05-20.

[2] The Race to the Top Begins-Remarks by Secretary Arne Duncan[EB/OL].http://www1ed1gov/news/spee-ches/2009/07/072420091 html,2009-08-26.

[3] Common Core State Standards for English Language Arts&Literary in History/social Studies Science and Technical Subjects[EB/OL].http://www.corestandards.org/the-standards.2011-02-18.

[4] Common Core State Standards for Mathematics[EB/OL].http://www.corestandards.org/the-standards.2011-02-18.

[5] Duncan,A.Beyond the Bubble Tests:The Next Generation of Assessments[EB/OL].http://www.ed.gov/news/speeches/beyond-bubble-tests-next-generation-assessments-secretary-arne-duncansremarks-state-l.

[6][11] On the Road to Assessing Deeper Learning:The Status of Smarter Balanced and PARCC Assessment Consortia[EB/OL].http://www.cse.ucla.edu/downloads/files/CRESSTReport823.pdf 2013-01.

[7]PARCC ASSESSMENT ADMINISTRATION GUIDANCE VERSION 1.0 [EB/OL].http://www.parcconline.org/sites/parcc/files/PARCC%20Assessment%20Administration%20Guidance_FINAL_0.pdf 2013-03.

[8] Smarter Balanced Assessment Consortium Theory of Action An excerpt from the Smarter Balanced Race to the Top Application[EB/OL]http://www.smarterbalanced.org/pub-n-res/theory-of-action/.

[9] Mislevy,R.J.,&Haertel,G.(2006).Implications for evidence-centered design for educational assessment.Educational Measurement:Issues and Practice,25,6-20.

[10] Mislevy,R.,Steinberg L.,&Almond,R.(1999).Evidence-centered assessment design.Princeton,NJ:ETS.

[12] NormanL.Webb.CriteriaforAlignmentofExpecta-tionsandAssessments in Mathematics and Science Education[M].National Institute forScienceEducationUniversityofWisconsinMadison,1997-14-22.

[13] Norman L.Webb.Alignment of science and mathe-matics standards[M].National Institute for Science Education University of Wisconsin-Madison,1999-11-18.

[14] On Track and Moving Forward:The Smarter Balanced Assessment System[EB/OL]. http://www.smarterbalanced.org/wordpress/wpcontent/uploads/2013/09/Smarter-Balanced-Milestones.pdf.

[15] Year 3 of Implementing the Common Core State Standards:An Overview of States’Progress and Challenges[EB/OL].http://www.cep-dc.org/displayDocument.cfm?DocumentID=4212013-08-07.

猜你喜欢

语言艺术课程标准核心
落实《义务教育艺术课程标准(2022年版)》的实践反思
我是如何拍摄天和核心舱的
近观天和核心舱
你好!我是“天和”核心舱
立足《课程标准》优化一轮复习
稳中求进,不断替身
——依托《课程标准》的二轮复习策略
小学语文教师的语言艺术浅析
关于高职课程标准建设的若干思考
生活中的语言艺术
习近平的语言艺术探析