美国“共同核心课程标准”基于信息技术网络的州际评价体系研究
2017-05-30牧童赵鹤龄
牧童 赵鹤龄
摘要:美国“共同核心课程标准”基于信息技术网络的州际评价体系,是在联邦教育部实施的“力争上游计划”项目支持下,由PARCC和SBAC两个州际评价联盟依据与“共同核心课程标准”相一致并实现学生“为大学学习和职场就业成功做准备”的课程培养目标,以信息技术智能网络评价手段和评价工具为载体,采取“互联网+”基础教育评价的形式而建构起的总结性评价、形成性评价和临时性评价相互平衡与结合的综合评价体系。这对当前进一步深化我国基础教育阶段学生学业水平考试和综合素质评价体系的建设,具有启发和借鉴意义。
关键词:共同核心课程标准;基于信息技术网络;州际评价体系
中图分类号:G434 文献标识码:A
美国自2010年6月由全美州长协会(National Governors Association,NGA)和州首席中小学教育官员理事会(Council of Chief State School Offices,CCSSO)颁布《共同核心州标准》(Common Core State Standards,简称“共同核心课程标准”)之后,这个旨在实现K-12阶段中小学生为“大学学习和职场就业成功做准备”的新一代课程与教学的评价,已经引起相当广泛的关注。特别是近年来,国内的许多专家学者,都在密切跟踪和研究正在由美国“大学和就业准备评价伙伴州际联盟”(the Partnershipfor Assessment of Readiness for College and Careers,简称PARCC)和“灵活平衡评价州际联盟”(the Smarter Balanced Assessment Consortium,简称SBAC)所建构并开始实施的与“共同核心课程标准”培养目标相一致的基于信息技术网络的州际评价体系。这对我国正在按照深化教育综合改革要求,完善义务教育和普通高中学生的学业水平考试和综合素质评价体系的建设,具有启发和借鉴的意义。
一、背景与意义
美国“共同核心课程标准”基于信息技术网络的州际评价体系之所以能够建构施行,是美国自20世纪80年代以来的30多年中,不断对K-12阶段基础教育存在的问题进行反思、完善和提升所得出的必然演进的逻辑结果。其过程始终体现着一个强调人类经验累积起来的系统知识、技能与态度培养的新要素主义课程与教学思想,对当代美国中小学教育秉持着强烈的忧思与期待。
(一)对K-12阶段基础教育存在的问题进行反思,而反思得出的结论是掀起了“基于标准的教育改革”
美国的教育传统是分权的制度设计,由各州规定自己的标准、课程与评价体系,彼此之间水平不一、难以衔接,既没有统一的核心课程,更缺少全国要求一致的课程标准,而呈现出杂多的状态,致使教育平庸,进而影响质量的提高。为破解这一存在问题,他们主要做出了两方面的努力:一方面是确立核心课程。1983年4月里根政府所发表的《国家处在危险之中:教育改革势在必行》报告首次提出基础教育阶段设置英语、数学、科学、社会和计算机科学等“5项新基础”的核心课程;1991年,布什总统在签发的6项全美教育目标中又确定了英语、数学、自然科学、历史和地理等5门核心课程,并建立学业考试制度;1994年克林顿政府期间,更在原来5门核心课程之外增加了外国语和艺术2门学科成为7门核心课程。另一方面是开发全国性的课程标准。自1989年全美数学教师协会编制发布《学校数学课程与评价标准》之后,陆续研制出台了全国性的科学、历史、艺术、公民、地理、英语和外语等学科课程标准,供自愿采用。尽管效果并非尽如人意,却是以此为标志兴起了美国教育史上重要的“基于标准的教育改革”运动。
(二)对“基于标准的教育改革”进行完善,而完善得出的结论是实行了“教育问责制度”
2001年,小布什总统签署了《不让一个孩子掉队法案》(No Child Left Behind Act),是对“基于标准的教育改革”的效果反思之后的强化推进与完善。该法案要求州政府依据联邦教育目标确定的严格要求,建立符合本州实际的“课程内容标准”(Academic Content Standards)和“学术进步标准”(Academic Achievement Standards)。重视对中小学生的数学、科学和英语学科教育,为确保到2014年全国所有学生在数学、科学和阅读上成绩必须达到熟练水平。联邦政府在全国中小学全面建立教育问责制度,实施标准化考试和对各州实行绩效责任制,依据考试成绩对学生、教师、校长和学校进行评价,然而却出现了为逃避责任而纷纷降低州标准要求让学生“达标”问题,未能达成改革的初衷。
(三)对“基于标准的教育改革”进行提升,而提升得出的结论是实施了“共同核心课程标准”
进入21世纪,在对“基于标准的教育改革”的得失进行全面反思的基础上,促使这个本身具有方向性、符合教育规律理论与实践的成果华丽转身,提升其成为全国统一性的、具有国际先进水准的“共同核心课程标准”,建构起了美国21世纪新一代的体现新要素主义价值追求的、强调与“共同核心课程标准”培養目标相匹配的基于信息技术网络的州际评价体系,开创了美国教育的新篇章。其重要的价值与意义,可以展示在如下所述的PARCC和SBAC框架与体系之中。
二、框架与体系
美国的PARCC和SBAC这两个新一代的教育评价体系,基于总结性评价方式存在的“应试教学”,主要是针对反思和改进传统的,而测不出真正重要的东西。在解决学习过程性评价缺失以及所测量信息对利益相关的使用者反馈不畅等问题的基础上,其建构起了与美国K-12阶段基础教育“共同核心课程标准”所提及的所有学生“为大学学习和职场就业成功做准备”相一致的课程培养目标,并基于信息技术网络的智能化载体,优化综合设计总结性、形成性和临时性评价工具,追求对批判性思维技能与复杂学习能力的考核,探索以人为本、促进公平和追求卓越的教育评价体系,具有十分重要的启发与借鉴意义。
(一)PARCC评价体系的框架建构
PARCC评价体系,主要包括终结性评价、形成性评价及其以核心学科为重点的评价模块设计。
1.终结性评价模式(Summative Assessment Model)
PARCC设计终结性评价的目标,是检测学生是否处在“为大学学习和职场就业成功做准备”的道路上,按共同核心课程标准要求,测量学生所掌握的知识与技能,并为各级教育机构及其人员提供学生学业发展的相关数据。终结性评价包括了两方面的内容设计:一方面是学生行为表现评价(Performanee-Based Assessment):在英语学科评价上,重点考查学生基于文本分析的实际写作能力;在数学学科上,重点考查学生对技能、概念的实际应用水平以及解决深层次数学问题所需要的策略性思维和推理能力,这项评价安排在学期末进行;另一方面是学年末终结性评价(End-of-Year Assessment):在英语学科评价上,侧重对学生的阅读能力的测量;在数学学科上,则是由一系列创新的、机器可测的项目组成,将在学年大约剩1/10时问的时候进行。
2.形成性评价模式(Formative Assessments Model)
形成性评价的目标是为教师有效改进教学、进行学习干预和促进教师本身专业发展需要,提供及时、快捷和准确的信息,也设计成两方面的评价内容:一方面是早期评价(Early Assessment),设计宗旨是以促进学生对掌握知识和技能的学习需要为目标,并在通过此目标实现的过程中,帮助教师改进教学和反思促进自身的专业发展;另一方面是学年中期评价(Mid-Year Assessment),将由依据学生行为表现的评价项目和任务组成,侧重对一些以往测量中难以考核的知识与技能的评价。
3.学科评价设计模块
(1)英语学科评价模块(English Language Art/Literacy)
主要包括四方面的内容设计:一是基于材料写作的读写能力评价(ELA-1 and ELA-2.Focused Literacy Assessments:Writing from Sources)。英语语言艺术模块1(ELA-1)在学年1/4时进行,英语语言艺术模块2(ELA-2)在学年1/2时进行。依据“共同核心课程标准”以测试学生“为大学学习和职场就业成功做准备”的最基本的能力,如阅读越来越复杂的文本,从中汲取证据并写出合乎逻辑的结论与现状分析的能力等;二是扩展性研究/写作的评价(ELA-3.Extended Research/Writing Assessment)。英语语言艺术模块3(ELA-3)在学年3/4时开展。依据调查需求,基础教育阶段要对学生进行研究素养和技能的培养,这对在大学学习和职场就业成功做好准备是必不可少的能力;三是学年末读写能力评价(ELA-4.End-of-Year Literacy Assessment)。英语语言艺术模块4(ELA-4)在学期还剩1/10的时候进行测评。这是一个计算机增强试题类型的电脑打分考试,考试建立在适当难度的优质、真实文本的基础上;四是口语和听力的评价(ELA-5.Speaking and Listening Assessment)。英语语言艺术-5模块(ELA-5)是学生完成英语语言艺术3模块fELA一3)项目后,教师在课堂教学中进行现场考核与呈现结果。为测量共同核心课程标准口语和听力水平,学生将把自己在英语语言艺术3模块(ELA-3)部分中的作品向同学作以展示,要求学生报告他们的研究、分析和发现,并回应现场的问题。通过师生双方合作互动并回答问题或讨论与辩论,教师依据评估学生英语口语和听力能力的标准和规则,考核学生以合乎逻辑的方式清楚地表达和呈现信息的听说能力,并作为改进教学决策的依据。
(2)数学学科评价模块
包括三方面内容的设计:一是基本主题评价(Math-1 and Math-2.Focused Assessments of Essential Topics)。数学模块1(Math-1)在学年1/4时进行,数学模块2(Math-2)在学年1/2时进行。在这两个数学模块中,每次评价都强调从共同核心课程标准或具体知识与技能的标准群(Clusters of Standards)所涉及的1-2个基本主题进行评价;二是拓展性数学评价(Math-3.Extended Mathematics Assessment)。数学模块3(Math-3)在学年3/4时进行。该数学模块,设计成表现性任务,学生将应用对关键性数学概念的理解来推导自己解决实世界问题的方案;三是学年末数学评价(Math-4.End-of-Year Mathematics Assessment)。數学模块4(Math-4)在学期还剩1/10时进行。这个评价部分是学生在计算机上完成的测量项目,考核共同核心课程标准要求学生为“大学学习和职场就业成功做准备”所需知识与技能的掌握程度,以及运用它们解决问题的能力。
(二)SBAC评价体系的框架建构
SBAC评价体系的建构内容包括总结性评价、临时性评价和形成性评价相互结合的综合性评价模式。
1.总结性评价模式(Summative Assessment Model)
总结性评价一般安排在学年的第12周考核,也可选择在学年初进行。其目的是提供学生在学业成绩方面所取得进展的信息,用于支持高风险的学生、学校、教师和校长的问责与决策,并设计成如下的两方面内容:
(1)计算机自适应评价(Computer Adaptive Assessment)
这是计算机根据对考生能力水平的估计为考生选择试题的评价。计算机基于等值条件的设计,考生答对了一道题目便会呈现另一道更难的试题;如果考生答错了就会呈现一道更容易的试题,以使计算机一直持续到能够精准测量考生的学业水平。计算机自适应评价的每个科目大约有40-65道题目,主要采取如下三种评价题型设计:一是选择反应式题型(Selected-Response Items)。该项目作为评估平台的一部分,将使用“机器评分”(Machine-Scored)方式。所有答案将至少由两名内容专家验证,并根据现场测试反应进行重点检查分析,以确保得分的准确性;二是建构反应式题型(Constructed-Response Items)。更复杂的反应式题型评分(如建构反应式题型、表现性任务等)将需要使用人工智能评分。虽然其仍是正在进行重点研究的一个新兴技术,SBAC对此有信心并且大力支持实现这个目标;三是技术提升式题型(Technology-Enhanced Items)。作答该项目采取各种反应的功能与形式,如移动鼠标的拖放、热点、绘画、制图绘图和书面回复等,且其中大部分都将自动得分。在某些测试题目上还允许学生在线使用字典、词汇表等嵌入式通用辅助工具。
(2)表现性任务评价(Performance Tasks)
该项目任务通过向学生提供一个围绕英语语言艺术和数学科目的学习评价目标的具体问题情景,考查在此过程中学生各方面的表现。这是一些传统纸笔考试很难或不能考查的内容,学生每年将完成一定数目的表现性任务。其主要设计有三方面的内容:一是一个阅读任务;二是一个写作任务;三是两个数学任务。这些任务的测量,都由学生操作计算机施行,通常要求在1-2个课时内完成。对这些任务的完成,要求学生进行自主规划、管理信息和观点、同其他材料和人进行交流互动,并以诸如口头展示、物品展出、产品开发和扩展性作文写作等呈现的方式,做出拓宽与深入的应答。
2.临时性评价模式(Interim Assessment Model)
临时性评价是基于认知发展理论所设计的,是在学生所取得每一个学习进展的现有理解水平基础上所开发出的评价,主要有两种模式:一是反映年末自适应评价的测验时长与范围。学生成绩与年末自适应评价使用相同的分数量表,所报告的量表分数可以用于计算机成绩或进步成绩;二是更深层次上考查一套由若干标准归并而成的标准集。伴随总结性评价的开展,SBAC将开发一个评价框架、题库和项目说明,以指导临时性评价题库的开发,各州根据各自需要组成自己个性化的考卷。
3.形成性评价模式(Formative Assessment Model)
形成性评价的设计,其功能在于帮助管理者和教师有效地使用总结性评价和临时性评价的数据,并培养他们在教与学的过程中收集学生学业进展的证据以诊断学习需要的能力。SBAC基于共同核心课程标准研制的形成性评价,主要目标追求的是帮助教师收集课堂教学中学生学习的有用信息来了解、掌握学生的学习需求,以便使教师和学生持续地改进教与学的实践,既能满足学生更好学习的需求,也能促进教师的专业发展。为保证形成性评价模式的有效运行,开发建设了基于信息技术网络的形成性评价工具。
三、特色与启示
基于对以上与“共同核心课程标准”相匹配的新一代评价体系所产生背景和意义的分析和论证,以及依据对这两个评价联盟的评价框架与体系的梳理和归纳,在此基础上就可以概括出当下美国基于信息技术网络的“共同核心课程标准”州际评价体系的建构及一些主要特色带给我们的启示与思考。
(一)教育评价理念上的特色与启示
PARCC和SBAC所建构的代表美国K-12阶段基础教育新一代的两个评价体系的建构特色,主要表现在这样三个方面:
1.体现了追求“为大学学习和职场就业成功做准备”培养目标和教育公平的理念
面对美国新一代要在竞争激烈的21世纪取得成功,PARCC和SBAC评价体系所追求的评价目标建构指向,就是旗帜鲜明地秉持为所有K-12阶段的基础教育学生能够“在大学、职场和生活中获得成功所需具备的知识、技能”为其设计理念要旨,依据通用设计等理论和思想建构评价体系框架结构,在最大限度与可能的范围内不分性别、年龄和能力,特别是要满足母语非英语学生和残障者的需求,使得新一代评价的价值功能导向有教无类,切实面向所有学生,并促进对其在教育机会、教育过程和教育质量上的公平。给我们带来的启示是:基础教育阶段学业水平考核的设计原则,要切实落实好与课程标准所确定的培养目标、课堂上的教与学、考试评价、学生全面而有个性成长和教师专业发展要求的一致性,才能达成教育公平的目标追求。
2.体现了总结性、形成性和临时性评价相结合的教育评价理念
PARCC和SBAC两个州际评价联盟,基于反思、总结现有州际评价通常以总结性评价为主,而无法获得学生学习的动态信息,不能及时改进教学活动的缺失,按照趋利避害、优势互补的教育评价理念要求,都在各自的评价框架中设计既有总结性评价,又有形成性评价,以及临时性评价,以此构建了这三种评价方式有机统一的、综合性的K-12阶段基础教育的学业评价体系。其带给我们的启示是:要认真研究、设计和平衡好基础教育阶段学业水平考试与综合素质评价之间的功能作用及其各自内部体系结构之间的关系。
3.体现了运用前沿教育测量理论指导下科学有效评价的理念
PARCC和SBAC两个州际评价联盟都非常注重在教育测量等理论指导下开发设计评价体系。PARCC和SBAC在研制和开发设计其评价体系时,依据了“以證据为中心”的设计理论、行动理论和基于教育公平的“通用设计”理论等,努力确保追求其评价体系的客观性、公平性和科学性以及对弱势群体的评价公平。特别是在试题研制完成施测前,如PARCC还要通过其下设的测验试题审查委员会等机构进行审核。其带给我们的启示是:基础教育阶段的学业水平考试要依据国家课程标准确定的考核内容要求,并遵循教育规律和学生成长规律,自觉强化运用科学的教育测量理论与技术设计评价工具。
(二)网络技术支撑上的特色与启示
PARCC和SBAC建构了与共同核心课程标准学科评价相匹配的信息技术网络支撑的评价体系,主要内容有三个方面:
1.创设在线资源中心
PARCC开发建立了一个在线的数字资源中心,为教师提供可以使用的示范性课程框架和学生学业项目与任务,以便进行形成性评价。开发计算机自适应性工具,以确定学生最近发展区,并提供适当水平阅读文本建议。各成员州持续地向资源中心提供高质量的考试文本案例,使该资源中心的工具功能得以不断增强。SBAC还通过搜集各州现有的评价项目和表现性任务,建立总结性和临时性评价的网络题库。这启示我们应高度重视并加快推进“互联网+基础教育评价”的建设步伐,以便“多快好省”地共享网络教育评价资源与工具。
2.构建评价反馈体系
为加强州际评价联盟成员州之间的评价信息适时交流、互动与反馈,需要建立畅通的网络评价互动反馈体系。如SBAC开发了一个可以使用一个相互操作的计算机网络电子平台和一套促进教学的州际综合性在线资源和分数报告系统,可以在线公布评价结果,也可以发表追踪分析方面的标准化报告或定制报告;学生可以在学习过程中关注自己成长与发展的提升和改善;大学和职场代表等利益相关者也能够通过网络在线报告和跟踪系统,获得各年级学生的关键信息,也为高校和企业代表筛选出能够胜任的学生和员工。这启发我们要更新观念,充分应用互联网载体建构基础教育评价的互动反馈体系。
3.施行网络试点测试
通过早期试点测试,PARCC在2012-2013学年初组织成员州开展了与正式实施情景与时間相一致的基于网络评价的实地测试;2014年3月25日至6月13日期间,SBAC州际评价联盟的21个成员州和维尔京群岛的420多万3至11年级学生、16549所学校和上千名教师参加了为期12周的美国有史以来最大的实地测试的网络在线评价,达到了预期的目标,为今后预设的大规模在线网络评价积累了经验。这启发我们应该立足当前、放眼长远并勇于探索和构建基于互联网的这种“既安全、更公平、又省钱”的基础教育在线网络评价。
(三)组织运行方式上的特色与启示
共同核心课程标准评价体系建构并运行的突出特点,得益于如下的三种机制:
1.组织开发评价方式
PARCC和SBAC作为与共同核心课程标准相匹配评价体系建构的开发者,承担这个美国新一代基础教育评价体系的设计、开发、建设和实施工作。目前,PARCC和SBAC分别有成员州22个和31个。两个评价体系将于2014-2015学年正式在成员州实施,届时将取代传统的基于州标准的考试评价系统。对诸如这种专业性、公平性和高利害性的教育评价项目产品的开发,要依法面向资源市场、采取政府采购方式才能保证质量。
2.评价管理运行方式
PARCC和SBAC两个州际评价联盟,都由数十个固定或不固定的州作为成员参与其中。联盟成员中富有经验的可作为牵头成员州,再延伸到学区、学校,形成了一种有效的评价管理运行方式。这启发我们在基础教育评价体系的建构中,在评价工具的资源共享上也可以采取这种跨省或在一个省区内跨地区进行合作评价。
3.试题资源编制方式
PARCC的试题命制开发主要由“美国教育考试服务中心”“进步测量”和“麦克劳希尔教育测评中心”考试服务承包商合作提供服务,还有“美国大学理事会”及一些高校也参与试题命制,这对我们研制试题问题拓宽了思路。
四、总结与借鉴
美国“共同核心课程标准”基于信息技术网络的州际评价体系,是在联邦政府教育部通过实施3.3亿美元竞争拨款的“力争上游计划”项目支持下,由两个竞标成功单位PARCC和SBAC州际评价联盟依据与“共同核心课程标准”相一致原则,基于对传统单一的总结性评功能评价(仅仅是对学生“知道什么和能做什么做出诊断”,而测不出真正重要东西的反思),建构起总结性评价、形成性评价和临时性评价相互平衡与结合的、能够考核学生批判性思维技能和复杂学习能力的综合性评价体系。特别是以信息技术智能网络为载体,建立起州际共享的在线评价数字资源中心,开发面对所有学生使用的计算机自适应性评价工具及其嵌入式辅助工具。构建起的州际联盟之间畅通的网络评价互动反馈体系,使用一个相互操作的计算机网络电子平台和一套促进教学的州际综合性在线资源和分数报告系统,可以在线公布评价结果,也可以发表针对个别学生、学生群体、课堂、学校、学区和州的追踪分析方面的标准化报告或定制报告,学生、教师、家长以及大学和职场代表等利益相关者,也能够通过网络在线报告和跟踪系统,分享这些信息。我们可以借鉴这些有价值的理念与做法,结合自己的实际,建设具有中国特色的基础教育质量监测与评估的综合性评价体系。