试论评价任务与学习目标的关系
2023-08-09毛玮洁
● 毛玮洁
评价任务是为检测学生是否达到学习目标而要求学生做的事,旨在引发和收集学生的学习信息,是实现高质量课堂评价的关键抓手。评价任务一般包含三个核心要素,即在何种情境中做事、用什么知识或技能做事以及具体做什么事。就其形式,评价任务可以是课堂上教师要求学生回答的一个问题,也可以是一份随堂纸笔练习,还可以是一个复杂的表现性任务。但是,评价任务不同于传统的单元测验、期末考试或大规模测验,其目的在于促进学生学习,而不是对学生进行分等和选拔。评价任务与学习目标相互作用、相互影响,但是许多教师对评价任务与学习目标的交互关系认识不清,在日常的课堂教学过程中产生了许多问题。比如:第一,教师只注重自己的教学,而不关注学生有没有学会,忽视对学生学习的评价;第二,教师即使具备了评价的意识,也往往与教学分离,即评价所评的不是教师所教的;第三,教师在评价的运用上存在局限性,表现为只会用传统试题测试学生,关注学生的分数与排名,忽视了评价对于学生学习的促进作用。因此,厘清评价任务与学习目标的关系,对于改善当前的课堂实践、促进学生学习具有重要意义。
一、学习目标引领评价任务的设计
从学习目标之于评价任务的意义来看,学习目标引领着评价任务的设计,是评价任务设计的指南针。评价任务与学习目标的匹配,在“教—学—评”一致性视角下是自然而然的结果。“教—学—评”一致性是体现课程思维的专业实践,起源于“掌握学习”运动中对评价任务和行为目标之间匹配程度的分析。科恩(S. A. Cohen)在此基础上提出“教学一致性”的概念,认为教学一致性是实现高质量课程教学、提升学生学业成就的关键,有效的教学要求教学的刺激条件与评价的刺激条件保持一致。[1]不过,如何把握所谓的“刺激条件”对教师来说并不明确,而且这种一致性的分析主要指向行为目标,忽视了认知与情感目标。之后,随着美国“基于标准的改革”运动的兴起,一系列美国国家教育及课程标准出台,各种“基于标准、追求质量”的改革措施也陆续登场,教师对于学生应该“学会什么”有了更清晰的认识,教学与评价的依据也更明确了,即教学、评价应该与课程标准保持一致。[2]实际上,无论是科恩所说的“刺激条件”还是课程标准,都反映的是不同层次、不同类型的学习目标。清晰的学习目标是实现“教—学—评”一致性的核心与灵魂,“教—学—评”一致性就是在学习目标的引领下,课堂系统中教师的教、学生的学和对学生学习的评价的统一协调程度。[3]因此,评价任务应当与学习目标保持一致。具体而言,评价任务应与学习目标在内容主题上一致,在认知要求上匹配,同时涵盖所有的学习目标,但对应形式可以是多样化的。
(一)内容主题一致
评价任务和学习目标必须指向相同的内容主题。例如,对于有关人物描写的语文学习目标,其评价任务也必须指向学生对人物描写手法的阐释和运用,而不是让学生写一篇游记;对于理解平行四边形概念的数学学习目标,其评价任务考查的也必须是平行四边形的概念,而不是正方形或长方形的概念;对于听说特定词汇与句式的英语学习目标,其评价任务也必须以这些词汇和句式为基础进行设计,等等。在“教—学—评”一致性的相关研究中,韦伯(N. L. Webb)曾提出一套系统分析评价任务与课程标准一致性的方法。该方法主要从知识种类的一致性、知识深度的一致性、知识广度的一致性和知识分布平衡的一致性四个方面来分析。其中,知识种类的一致性主要就是指评价任务与课程标准包含相同的内容主题。[4]再如,基于美国《K-12 科学教育框架》(Framework for K-12 Science Education)对“为所有学习者创造平等的科学学习机会”的倡议,有学者提出了一个面向双语学习者的科学评价任务设计框架,其中就包含“一致性与严谨性”维度,主要关注评价任务与美国《下一代科学教育标准》(Next Generation Science Standards,简称NGSS)内容的一致性以及是否使用符合年级水平和学科特点的科学词汇等。也就是说,科学评价任务的设计要与NGSS 涵盖的三方面学习内容匹配,包括学科大观念、跨学科概念以及科学与工程实践。[5]以美国科学课程中关于“生态系统”模块的学习为例,其学科大观念包括生态系统中的相互依存关系、生态系统中的物质循环和能量转移等,跨学科概念包括因果关系、稳定与变化等,科学与工程实践包括发展与使用模型、分析与解释数据等。那么在针对这一模块的学习目标设计评价任务时,教师需要考虑所设计的任务是否要求学生运用相关的学科大观念、跨学科概念以及科学与工程实践经验来完成。
(二)认知要求匹配
评价任务和学习目标的认知要求必须处于同一水平,也就是知识深度的匹配。这也是韦伯一致性评价方法所关注的重要维度。以安德森(L.W. Anderson)等人修订的布卢姆教育目标分类学为参照[6],如果学习目标只是记忆相关知识,那么评价任务的认知要求也相对较低,只需要求学生背诵、默写相关内容即可;而如果学习目标指向更高的创造层级,那么评价任务的认知要求也必然需要提升,如要求学生创作一项别出心裁的作品并说明设计意图等。如果评价任务与学习目标的认知要求不匹配,就难以获取教师想知道的学生学习水平信息。
而要设计与学习目标匹配的评价任务,就要选择适用于学习目标的评价方法。对此,斯蒂金斯(R. J. Stiggins)曾提供一个通用性的参考框架,如表1 所示。[7]当然,在目前素养导向的课程改革背景下,学习目标不仅仅包含认知维度,更是知识、技能、情意的综合,需要反映价值观念、必备品格和关键能力“三位一体”的核心素养。评价任务与学习目标的匹配不能只考虑认知维度,而忽略了素养要求。这对评价任务的设计提出了更大的挑战。国内有学者将学习目标和评价方法的匹配关系视为一个连续体,学习目标的复杂程度和整合程度越高,越接近具有整体性的核心素养,那么评价方法的建构性和开放性也就越强。[8]例如,对于低阶思维和单一技能目标,适合采用课堂问答、知识测验和技能测试;对于元认知和情感维目标,适合采用结构化思维工具和自我反思;对于素养目标,则适合采用表现性评价等。因为不同评价方法所需要的任务样态不尽相同,所以教师只有在确定恰当的评价方法的基础上,才能进一步设计符合不同类型目标要求的评价任务。例如,为了考查学生对知识的记忆和理解,教师可以运用选择题测试的方法,那么此时的评价任务就是一道道选择题,教师应按照选择题的标准设计题干和选项;而为了考查学生的探究实践素养,教师可以采用表现性评价的方法,那么评价任务就需要按照情境、角色、挑战、受众、作品或表现五大要素来设计和细化,同时满足真实性、开放性、挑战性等标准。
表1 学习目标和评价方法的组合
(三)对应形式多样
评价任务必须涵盖所有学习目标。在韦伯的一致性评价方法中,知识广度的一致性是一项重要指标,要求课程标准的每一个具体目标至少要有一个评价项目与之相对应。[9]尽管韦伯判断的是标准化考试与复杂的课程标准之间的一致性,但是这一标准在课堂教学情境中也同样适用。即使只在一节课之中,学习目标也往往不止一条,而是有多条。因此,每条学习目标都应至少有一个评价任务对其进行评价。不过,其对应形式可以有多种类型,包括“一对一”“一对多”和“多对一”。[10]“一对一”是指一项评价任务检测一个学习目标,评价任务与学习目标是一一对应的关系;“一对多”是指一项评价任务检测两个及以上的学习目标;“多对一”是指有两项及以上的评价任务检测同一个学习目标。具体采用哪种对应形式与学习目标的性质有关。简单知识与单一技能目标往往采用“一对一”的形式,但当相关目标是一个单元或课时中的重点和难点时,往往采用“多对一”的形式,旨在更好地检测学习迁移的效果。此外,素养目标中有关价值观念和必备品格的部分具有内隐性且难以观察,往往与知识技能目标整合起来进行评价,这时,评价任务与学习目标就呈现出“一对多”的形式。
二、评价任务检测并促进学习目标的达成
从评价任务之于学习目标的意义来看,评价任务有助于检测并促进学习目标的达成。一方面,评价任务为学生提供了达成学习目标的学习机会;另一方面,评价任务可以检测学习目标的达成情况,为教师调整和改进教学提供依据。
(一)评价任务是支持学习目标达成过程的脚手架
从社会文化理论视角来看,脚手架(Scaffolding)和形成性评价实际上是同一回事,都是教师用来促进学生在最近发展区学习的策略。[11]维果茨基的最近发展区理论指出,学生的发展至少存在两种水平:一是学生的现实发展水平,即学生能够独立解决的问题水平;二是学生在成人的指导和帮助下能够解决的问题水平。[12]这两个水平之间的差距就是学生的最近发展区。教学应当走在学生发展的前面,在学生的最近发展区内进行。脚手架是指教师在学生解决问题过程中提供的物质、语言、社会等各个方面的支持和帮助,如提醒、提示、鼓励等,对于促进学生在最近发展区内的学习具有重要的作用。换言之,脚手架是为了控制那些超出学生能力的要素,以帮助学生成功解决问题。而评价任务中的一些提示、评价量规,以及教师通过评价任务收集、分析学生的学习信息,针对学生在完成任务过程中不断变化的需求进行支持,起到的就是脚手架的作用。
根据最近发展区和脚手架的理论可知,评价任务支持了学生学习目标的达成过程。首先,评价任务是基于学习目标设计的,高于学生现有的能力水平,对学生提出了较高程度的认知要求,这就为学生提供了有挑战性的学习机会,形成了一个最近发展区。研究表明,在课堂教学开始时就提供高质量的复杂任务是非常重要的。[13]其次,只有在实施评价任务时结合脚手架的进入和退出,才能更好地帮助学生达成学习目标。很多教师可能会对评价任务存在误解,认为评价任务是布置给学生独立完成的,教师就只要检测学生完成任务的情况即可。实际上,教师在实施评价任务时不能只把评价任务布置给学生就撒手不管,而是需要通过任务提示、课堂问答、操作演示等方式,对学生无法独立完成的部分加以指导,选择适当的时机对遇到困难的学生提供支持。例如,有学者研究了如何通过评价任务中的脚手架设计培养初中生基于证据的科学解释能力,发现“使用情境化的现象”“评价量规”“核查表”“语句框架”“鼓励学生在书面解释中画出解释模型”五种类型的脚手架都有利于提升学生的科学解释质量,其中“使用情境化的现象”产生了最好的效果。[14]随着学生能力逐渐增强,教师可以把学习的主导权交还给学生,减少外部的帮助,直到教师不再提供支持,学生也能独立完成同一任务或类似任务,这就表明学生已达成了学习目标。这一过程就是脚手架的逐渐退出(fading)。从这一角度来看,评价任务也是学习任务。借助评价任务以及教师在这一过程中提供的脚手架支持,学生能够有效地达成学习目标。
(二)评价任务是检测学习目标达成结果的诊断仪
如前所述,提供一定的脚手架支持在评价任务促进学习目标达成的过程中起到了重要的作用。而对于脚手架何时进入或何时退出、提供怎样的脚手架等问题,“评”的过程是至关重要的,这也是评价任务区别于学习任务的关键特征之一。教师要能够利用评价任务引出的学生学习信息来推断学生的学习目标达成情况,进而采取教学调整与改进措施。所以,评价任务还是检测学习目标达成结果的诊断仪。
根据“以证据为中心的设计”(Evidence-Centered Design)理论,评价是基于证据的推理过程。[15]学生是否达成特定的学习目标就是教师需要推理论证的论点(claim)。为了证明学生已经达到某个学习目标,教师需要寻找相应的学习证据(evidence)来支持这一论点。而评价任务就是引发学生学习表现、收集学生学习证据的一种手段。在学生展示出学习表现之后,教师需要进一步对评价任务引发的学习信息做出观察、解读和判断,这时,学生的学习信息才能变为学习证据,以支持最初的论点。例如,如果教师预期的目标是学生能够理解力的概念并掌握受力分析的一般顺序和方法,那么对应的证据就是学生能够在各种情境下绘制出物体的受力图,并且正确标记力的名称、大小和方向。基于此,相应的评价任务也呼之欲出,即要求学生根据情境绘制物体受力图。只有学生完成这样的任务,教师才能够获取学生的学习信息,分析学生是否达到了学习目标。由此可见,评价任务在帮助教师评估学生学习目标达成情况的过程中起到了非常重要的作用。
此外,评价任务并不是以检测学习目标的达成情况为终点,而恰恰是评价任务实施的起点。只有在检测、了解学生现有的能力水平之后,教师才能利用这一信息,调整和改善下一步教学,更好地支持学生达成学习目标。评价正是这样一个以终为始的过程,旨在帮助学生形成良性的学习循环,不断地往更高层次的目标进阶。
三、评价任务与学习目标关系的启示
从学习目标之于评价任务的意义来看,评价任务需要基于学习目标来设计,与学习目标保持一致;从评价任务之于学习目标的意义来看,教师需要在设计与实施评价任务的过程中做到扶放有度,同时恰当地解读并利用学习信息,基于学习信息做出教学决策并为学生提供反馈,这样才能有效发挥评价任务支持学习目标达成的功能。
(一)基于学习目标设计真实情境中的评价任务
学习目标决定了评价任务需要引出什么样的学习信息,因此评价任务的设计应该紧紧围绕着学习目标。那么,教师应该如何设计与学习目标匹配的评价任务呢?首先,需要确定可落实、可评价的学习目标。新课标确立了以核心素养为统领的“目标一族”,不仅包含课程目标、课程内容,更建构了刻画学业成就表现的学业质量。[16]然而,新课标中描绘的学习结果仍然是比较宏观和抽象的,教师需要将新课标所要求的素养目标按照学段、学期、单元、课时逐级细化。其次,梳理评价任务与学习目标的对应形式。也就是说,在某一单元或某一节课的所有学习目标中,哪些学习目标是可以用评价任务“一对一”评价的,哪些学习目标是更适合整合起来进行评价的,以及哪些学习目标是学生学习的难点,需要运用多项评价任务进行多次的评估与诊断。比如,价值观念层面的目标就是无法运用独立的评价任务进行评价的,只能与其他知识技能目标整合起来加以评价。再次,关注学习目标中的行为动词和名词。行为动词反映的认知要求或素养要求决定了评价方法,名词则限定了评价任务的内容范围,在此基础上再来设计具体要让学生做什么事。例如,对于“能够说出人体生命活动所需的主要营养物质”这一目标,由于其只包含单一的知识,认知要求也仅仅处于“知道”的水平,因此比较适合采取简答题或者课堂提问的方式进行评价;而对于“能够运用食物中的营养成分、消化与吸收、均衡膳食等知识,设计一份合理的食谱”这一目标,其内容主题虽然与前者类似,但是在认知层面上不仅仅涉及单一的知识技能,更指向复杂的素养,因此比较适合采用表现性评价的方式,让学生根据特定人群的需求编制食谱并说明设计思路。最后,在确定做事的内容和方式之后,教师还需要设计做事的情境。在传统的课堂教学中,教师聚焦于知识的记忆理解目标,因而往往采用传统纸笔测验,并不关注评价任务的情境真实与否。但是,在当前学校育人目标出现素养转向的背景下,只有那些基于真实情境的复杂评价任务才能检测并促进学生核心素养的发展。所谓真实情境,并不是说任务的情境要跟现实世界一模一样,而是强调任务情境要反映现实世界中人们使用目标知识和技能的方式,或者反映现实世界正面临的机遇、干扰和挑战,或者是学生感兴趣的、与他们生活相关的内容。只有这样,学生才能在运用知识解决问题的过程中发展素养。
(二)在评价任务的设计与实施过程中做到扶放有度
为了实现评价任务支持学习目标达成的功能,评价任务的设计与实施需要结合脚手架的进入和退出。一是教师在任务设计阶段就针对同一目标安排多个逐步进阶的评价任务,让任务本身嵌入的脚手架的支持程度由高到低逐渐减弱。教师可以按照范梅里恩伯尔(J. van Merriënboer)提出的任务类型来设计和安排,从高支持性到低支持性依次为样例任务、逆向任务、模仿任务、自由任务、补全任务和常见任务。[17]例如,样例任务是指直接提供问题解决的完整样例,学生只要一步步按照样例去做就能完成任务,如仿照课文《走月亮》的第六自然段描写一段月下的情景;补全任务是指提供问题的给定状态、目标状态和部分解决方案,需要学生添加缺失的步骤来补全解决方案,如让学生根据给定的开头和每段需要描写的景物完成一篇游记;而常见任务是指提供问题的给定状态和目标状态,需要学生自己生成解决方案,如为朋友推荐一处值得游玩的景点。二是教师在学生完成评价任务的过程中根据学生的表现或能力水平运用各种脚手架策略,及时提供支持,但随着学生能力水平的提高要逐渐撤除。有学者归纳了形成性评价过程中运用脚手架策略的五类意图,主要包括:第一,让学生对评价任务感兴趣;第二,降低自由度,即简化评价任务;第三,帮助学生专注于任务目标;第四,帮助学生保持学习动机;第五,认知结构化,即为如何组织任务提供解释。[18]为了实现上述意图,教师可以采取的具体手段包括:第一,通过操作示范为学生提供样例,帮助学生了解应该怎么做一件事;第二,通过步骤指导明确解决问题、完成任务所需要经历的过程,这是对学生如何解决问题的一种提示和引导;第三,通过规则约束来限定不同任务阶段学生需要达到的表现或条件,以避免出现一些与任务无关的或者不必要的行为。除此之外,教师的言语激励、评价量规或核查表等工具也能起到脚手架的作用。
(三)恰当解读并利用评价任务引出的学习信息
评价任务的设置是为了引出学生学习目标达成状况的信息并服务于教学决策与学习改善,而这一目的的实现依赖于教师对学习信息的解读与运用。首先,教师要正确地分析和解读评价任务引出的学习信息,并将这些信息与学习目标或预期标准进行对比,探究学生产生如此差距背后的过程和原因。即使两位学生在同一评价任务上做出了同样的回答,背后可能也存在不同的认知逻辑,反映出他们不同的知识技能水平。比如,在一项辨认平行四边形的评价任务中,两位学生都能指认出不规则四边形不是平行四边形,但是一位学生是因为该图形的两组对边不平行而认为其不是平行四边形,另一位学生却是因为把该图形认作了梯形。两位学生虽然做出了相同的回答,但是他们的目标达成情况显然是不同的。对此,教师可以让学生在完成评价任务的同时出声表达或者写出他们解决问题的过程,也可以通过课堂问答来引出学生的思考过程,以更好地进行诊断。其次,教师要能够运用这些信息进行教学决策与改进。这一过程取决于教师对学习信息的解读,尤其是对学生表现成因的分析。比如,当教师发现学生产生错误或遇到困难的原因是对某一概念存在误解时,那么教师需要反思以前的教学是否对这一概念的讲解不够清晰,后续如何设计学习任务,来帮助学生厘清这一概念。再者,教师要能够利用这些信息对学生提供及时的描述性反馈。反馈一定是关于学生表现的信息,而且一定是与目标相关的信息,以揭示学生实际水平与目标之间的差距。[19]基于此,反馈的内容一方面要指出学生的表现与目标相比,存在哪些优点与不足;另一方面也要提出改进建议,帮助学生明确应当经历怎样的过程、采取怎样的方法才能达到目标。例如,“你的游记结构清晰、布局合理,但是没有写出景物的美,建议增加比喻、拟人等写作手法的运用”是一个有用的反馈,而“你的文章只能得B”就不是一个合格的反馈。此外,教师还要确保学生理解反馈信息,这就要求反馈的信息量不能太大,而且在反馈之后给予学生一定的时间进行消化,从而支持学生实现自我调整、自我改进。