基于评价三角理论的学业质量评价设计
2019-05-29李连杰单中伟
王 健 李连杰 单中伟
(北京师范大学,北京 100875)
近年来,中小学生学业质量的测评和国际比较研究备受关注,成为世界各国和教育研究机构的研究热点领域之一。例如,在PISA和TIMSS等大型学生学业质量评价项目中,各个国家和地区都非常关注学生在数学、科学、阅读等领域的国际排名。新修订的普通高中各学科课程标准(2017年版)对学业质量提出要求,并对不同水平作出质量描述;但是如何开展学业质量评价,还需要厘清相关问题,例如,学业质量评价的基本价值取向是什么?如何科学、规范地进行评价整体规划和设计?这些问题都将影响到学业质量评价的效果,进而影响到教育质量和学生的全面发展。本文从“促进学生学习的评价”立场出发,以评价三角理论作为理论指导,尝试构建以证据为核心的评价框架,以期为学业质量评价工作的开展提供借鉴。
1 学业质量评价的价值取向
学业质量包含2层含义,第一是构成性概念的层面,是指学生在各类因素影响下,通过课程的学习,所达成的学业表现、品德行为、身心健康等方面的发展水平;第二是关联性概念的层面,它包括影响学业表现的动机、师生关系、校长领导力等相关因素及其相互关系[1]。
评价是一种工具,可以用于观察学生的行为,借此获取相关数据,并对学生的所知和所能进行合理推论[2]42。因此,学业质量评价是一个系统、科学和专业的过程,主要工作是获取信息,为课程设计、学生的学习、教育政策等方面提供决策参考[3-4]。
纵观学业质量评价的相关研究,其价值取向大致分为2种:促进学生学习的评价(assessment for learning)和对学生学习结果的评价(assessment of learning),它们既存在基本共性,也有本质上的区别,见表 1[5]。
在当前的学业质量评价中,反映出一些普遍的问题:在评价内容方面,以测查知识为主,较少考查考生的学业能力;在评价方法和技术方面,人为性和主观性较为明显,缺乏心理测量学等客观和科学的程序指导;在评价证据来源方面,大都以考试成绩为主,较少考虑学生的学业质量全貌;在评价功能方面,更多的是对学生进行等级评定,缺乏诊断和指导[6]。这些方面反映出当前的学业质量评价多以“评价学生的学习结果”作为主要的价值取向。
随着教育评价的不断发展,人们对评价功能有了更加深入的挖掘和全面的认识,使得评价工作逐渐从诊断性向过程性转化,“促进学生学习的评价”已成为当前的主流趋势。
2 基于评价三角的学业质量评价设计系统
评价就是利用证据进行推理的过程,这一过程可以用认知(cognition)、观察(observation)和解读(interpretation)3个要素构成的三角形来表示,这3个要素构成了三角形的3个角,因此将其形象地称作“评价三角”[2]44。
认知是一种理论或观念,用以展示学生在特定学科领域内的所知和所能,例如,学生的错误概念、学习发展路径、学生的学科能力发展水平等。观察是一种描述或评价任务细目,主要指构成评价本身的多种类型的任务,这些任务要与认知相匹配,例如,要评价学生的高阶思维水平,那么评价任务就应该能够使学生有效地展示出其高阶思维水平。解读是指用以对观察结果进行分析和推理的所有方法和工具,评价工作者可以据此选择与评价任务相匹配的分析方法,这一工作同样也要在认知框架的指导下完成。
在评价三角中,3个构成要素相互一致,认知是评价设计的前提基础,观察和解读都要与之相匹配,而评价结果的解读会再次印证学生学习特定内容的相关认知。3个要素“三位一体”,可以有效地评价学生的学业质量水平[7]。
我国当前的基础教育改革强调学生在学习核心概念的同时发展学科能力,最终培养其核心素养。基于这一教育发展背景,运用评价三角理论,构建中小学生学业质量评价框架,见图1。在该系统中,将核心素养作为评价的认知基础,学科能力和核心概念作为评价的重要内容,将证据收集和解读作为评价设计的基本范式。
表1 2种价值取向的学业质量评价对比表
图1 基于评价三角理论的学业质量评价设计框架
2.1 核心素养是学业质量评价认知框架的设计依据
当前,国际上的基础教育课程改革都十分关注学生核心素养的发展,将其作为一项重要的教育目标。核心素养是指与职业上的实力、与人生的成功直接相关的,涵盖了社会技能与动机、人格特征在内的统整的能力[8]。新修订的普通高中各学科课程标准(2017年版)凝练了学科核心素养,并将其作为课程目标,如语文学科核心素养包括语言建构与运用、思维发展与提升、审美鉴赏与创造、文化传承与理解[9];化学学科核心素养包括宏观辨识与微观探析、变化观念与平衡思想、证据推理与模型认知、科学探究与创新意识、科学精神与社会责任[10];生物学科核心素养包括生命观念、科学思维、科学探究和社会责任[11]。
核心素养与传统的三维教育目标不同,核心素养是对学生多年学习成果的一种预期,是学生在拥有一定教育经历之后所具备的关键素养和能力。它不仅涉及学科的核心知识、基本技能,以及情感、态度与价值观,还涉及学生在这3个维度上的整合能力,并将其运用于分析和解决实际问题的能力。换句话说,核心素养既关注学生应该知道什么,更关注他们在现实情境中能够做什么。培养学生的核心素养,可以为他们能更好地适应日益变化的世界创设良好的开端,同时也为其终身学习和发展,以及社会的良好运作奠定基础。
核心素养的提出,表明我国的教育随着时代的发展正在进行不断的变革。将核心素养制定为课程目标,表明我国在学生培养模式以及输出人才类型上正在发生变化,教育不再是培养重知识轻能力的学生,而是培养能够解决实际问题、拥有更强实践能力以及更能适应社会变化的学生;同时,也意味着教师需要按照更高要求的课程目标进行日常教学,教育评价也有了新的依据。
在教育体系内,课程、教学和评价是3个核心构成要素,见图2。在这3个要素中,课程是教育体系的软性实体,课程目标则是通过教师的教和学生的学来落实的,最终的效果可以通过教育评价进行评估。课程、教学与评价3个要素应相互一致、协调运作,才能够明确教什么、评什么,同时也能够为学生提供机会,真正地展示其学业成就水平[12]。
图2 以核心素养为中心的教育体系构成
由于发展学生的核心素养是课程设计和发展的主线,因此,课堂教学以及教育评价都应该与之相呼应。作为评价形式之一的学业质量评价,也应该遵循这一要求,将核心素养作为评价设计的重要依据。
2.2 学科能力和核心概念是学业质量评价的重要内容
核心素养是学业质量评价的重要依据,其落实和达成需要通过学科教学活动来实现。学科能力和核心概念是形成核心素养的基础,也是学业质量评价的重要内容。
2.2.1 学科能力及其解构
学科能力是指学生顺利进行相应学科的认识活动和问题解决活动所必需的、稳定的心理调节机制,包括对活动的定向调节和执行调节机制,其内涵是系统化和结构化的学科知识技能及核心学科活动经验图式(稳定的学科经验结构)[13]。学科能力通常可以分为学科一般能力和学科特殊能力两大部分[14]:学科一般能力指的是学生在各学科的学习过程中普遍应该具备的能力,包括观察能力、抽象概括能力、问题解决能力、探究能力、批判能力等;学科特殊能力指的是学生学习某一具体学科时,由于学科知识逻辑体系存在本质差异而出现的不同能力取向,如语文与外语学科中的语言表达能力和书写规范能力,数学学科中的数字运算能力和空间想象能力,政治学科中的明辨是非的能力,科学课程中的实验探究能力,等等。
根据信息加工理论,可以将学生的学习活动概括为3个方面:知识和经验的输入——学习理解,知识和经验的初级输出——实践应用,知识和经验的高级输出——迁移创新,这就构成了学科能力的整体架构[13]。在实际运用时,还需对学科能力的这3个方面进一步解构,以增强其可操作性和应用价值。对具体的学科能力进行解构时,通常需要考虑相应学科的一般学科能力和特殊学科能力,例如,对生物学科能力进行解构后,其构成要素如表2所示。
表2 生物学科能力构成要素[15]
生物学科能力要素框架遵循学生学习的发展规律,共分为2个模块:一是输入模块,此模块下的能力要素为“学习理解”,学生通过观察记忆将知识与先前知识进行整合,并从知识中概括出上位概念,概念彼此连接,形成概念图,完成知识系统性的学习;二是输出模块,此模块下的能力要素为“实践应用”和“迁移创新”,其中“实践应用”为初级输出,“迁移创新”为高级输出。学生针对简单熟悉或复杂陌生情境下的现象或问题,利用已知事实和概念,通过演绎推理、批判性思维解释个人观点或提出问题的解决方案。生物学科能力要素框架较为完整地设计出了学生在解决实际问题、实践创造等方面所需的能力,为学生学业质量水平和教学实践效果标准的制定提供了立足点。
学科能力是学生培养过程中十分重要的一部分,是学生适应社会发展、进行终身性学习的必要条件。学科能力既是学科教学的目标指向所在,也是学业质量评价的重要内容,因此学科能力的系统化架构对教育评价改革提供了重要依据,这与国际上一些大型的学业质量评价项目(如PISA、TIMSS)具有共性,即将学科能力作为评价的重要内容。
2.2.2 核心概念及其解构
在学生核心素养的发展过程中,内容是重要的学科载体。内容领域可以分为若干核心概念(或概念主题),学生只有在掌握了相关学科的核心概念后,才能为其核心素养的逐步形成和提高奠定基础。核心概念是位于学科中心的概念性知识,包括重要概念、原理、理论等基本理解和解释,这些内容能够展现当代学科图景,是学科结构的主干部分[16]。
核心概念具有概括性和统摄性,通常可以用名词术语或陈述句的形式来表示,例如,“生物体的稳态”是用名词术语来表示核心概念,“生命个体的结构与功能相适应,各结构协调统一共同完成复杂的生命活动,并通过一定的调节机制保持稳态”则是描述概念内涵的陈述句形式。名词术语形式的核心概念属于心理学领域的话语体系,而概念内涵陈述句的形式则是教育学范畴的话语体系。在课程和教学中,这2种概念呈现方式相互融合,通常共同使用。
核心概念不管是用名词术语的形式来呈现,还是用概念内涵陈述句的形式来展示,在实际的教学和评价中,都需要对这些核心概念进行解构,将其分解成较小的概念,从而使其具有可操作性。对核心概念的解构通常运用“剥洋葱”的方式,逐层剥开,分解成小的概念要素,例如:PISA在设计过程中,列出了各内容领域所考查的内容要点;美国《下一代科学标准》(The Next Generation Science Standards)列出了各内容领域的核心概念,并进一步呈现了相关的概念要点,这与我国普通高中科学相关课程(物理、化学、生物)标准中的概念呈现方式一致。由此可以看出,可以通过“内容领域—核心概念—概念要点”的方式对核心概念进行解构(见表3),以便于学业质量评价的操作。
表3 “物质科学”领域核心概念的三级解构[17-18]
2.3 学习预期是学业质量评价设计的核心指标
学习预期(intended learning outcomes,ILOs)是指在结束某门课程或某个主题单元的学习后,关于学生应该知道什么和能够做什么的描述[19]。学习预期与课程目标存在本质性的区别,课程目标通常是较为笼统的描述,学习预期的描述则相对具体,并不特别强调知识的覆盖面,更加关注学生在素养层面的发展水平。此外,学习预期的描述通常采用具体的行为动词来展示学生的所知和所能,具有很强的指向性、操作性和可测性。
学习预期的描述需要综合考虑学科核心素养、学科能力和核心概念。如果只考虑核心素养和学科能力,脱离概念载体,将会导致测评操作不够精准,使得学生能力与核心素养表现泛化和空洞。如果仅考虑概念载体,学习预期的描述又会变成课程标准中内容标准的复制品,对学业质量评价没有实质性的指导意义。如何协调这三者之间的关系,成为制订科学合理的学习预期指标体系最需要解决的问题。
要解决这一问题,在整合核心素养、学科能力和核心概念时需要一个桥梁纽带,这一纽带就是针对相应概念主题的典型活动任务。学生在完成特定活动任务过程中所表现出的关键能力与核心素养是制订学习预期指标体系的前提。
典型活动任务不同于课程标准中的内容条目和活动建议,也不是事实的简单堆积,而是一类具有同一属性的活动的统称,涉及解决与学科息息相关的问题。这类活动从表观上看情境各不相同,活动任务形式多样,但从本质上讲,学生完成这些活动,都需要运用同一心理认知操作和相同的概念属性。对典型活动任务的理解,关键在“典型”二字,不是指“全面”,也不是指“基础”,而指向于学生完成此类活动任务过程中所表现出的特定学科能力和核心素养。
学习预期指标体系是基于学科典型活动任务制订的,是学生在经历一定的学习活动之后在各类活动任务的解决中所表现出来的比较稳定的心理特征和行为特征,这种心理和行为特征指向即是学生应具备的学科核心素养和学科能力。学习预期可比作一架梯子,典型活动任务就是横梁,随着活动任务的不断解决,学科的核心素养和学科能力也在不断地发展与提高,最终指向学生在学习完某个概念主题或某门课程之后的学习成果。学习预期是反映学生学习质量和成果的重要维度。基于学生认知发展规律和知识掌握程度,学习预期通常体现为内隐的典型活动任务解决要求与外显的可操作可测量的核心素养和学科能力。不同年龄阶段的学生,对于典型活动任务的理解不同,所能解决的任务类型和程度也存在很大差异,同时所表现出的核心素养和学科能力水平也会有高低之分。
针对不同概念主题的典型活动任务的提炼一般有3个途径:一是基于课程标准进行提炼。课程标准根据学生认知发展规律规定了学生需掌握的知识,从这些知识中进行抽提概括。二是基于教学实践经验进行提炼。丰富的教学经验为发现学生亟待解决的问题指明方向。三是基于习题作业进行提炼。大量的习题作业中隐含时下热点与评价的动向,以此为法,将不同概念主题下的典型活动任务概括总结出来,并与核心素养和学科能力进行科学合理的有机整合,形成一套完整的学习预期指标体系。
以生物学科“细胞的结构与功能”主题为例,说明如何基于典型活动任务描述相应的学习预期。首先,分析与该主题有关的典型活动任务,主要包括理解结构与功能是如何相适应的,理解细胞的完整性与系统性是如何体现的,理解细胞失水和吸水的机制及其应用;然后,在此基础上整合学科核心素养、学科能力,拟定“细胞的结构与功能”主题的学习预期(见表4)。
从以上分析可以看出,学习预期和课程目标共同阐释了课程标准的要求,学习预期搭建了连通课程标准与教学和评价的桥梁,为实际教学、学生学习以及教育评价提供了强有力的依据。因此,基于学习预期的学业质量评价设计具有很强的操作性,也为评价结果的解读和反馈提供精准的定位。
2.4 基于证据进行推理是学业质量评价设计的基本范式
设计良好的学业质量评价能够为了解学生的学习表现提供重要的信息[20]。这些信息是研究人员赖以进行推论和决策的重要依据,即常说的证据。在学业质量评价中,证据是其核心所在。
2.4.1 证据的来源
在学业质量评价中,可以通过多种途径获取学生学习表现的证据,纸笔测验是其中一种,也是获取证据的重要来源途径。纸笔测验具有诸多优点:1)高效:学生可以在相对较短的时间内回答一定数量的试题;2)覆盖面广:纸笔测验能够覆盖学科不同领域的重要内容;3)实施和管理较为容易;4)评分客观便捷:试题的评阅相对简单,特别是选择题、判断题和填空题。但是,纸笔测验也有不足之处,比如无法提供学生在特定内容领域所知和所能的完整证据,不能反映学生的复杂问题解决能力,无法评价学生的实际动手操作能力等。如果不能获得关于学生所知和所能的全面和足够的证据,即使运用再先进的结果分析方法和工具,也不能对学生的学业质量进行推论[21],自然也就不能对政策和经费决策提供支持。随着评价理论的发展,关于学生学业质量的证据来源也在不断丰富和扩展,例如实作评价、课堂观察等。
实作评价(performance assessment)是与纸笔评价相对而言的一种评价方式,评价任务并不要求学生在给定的选项中选择正确的或合理的,也不要求学生填空或简答,而是要求学生在真实的情境下完成一项任务,例如解决复杂问题,进行操作或表演,或制作某种作品,然后由评价者根据特定的量规(rubric)对学生的表现或作品进行评定[22]。对于短文写作、观点论述等一些常出现在纸笔测验中的开放性任务,如果是单独的任务类型,并不要求学生在固定的时间内与其他任务一同完成,那么这类任务可以看作是实作评价任务。由此可以看出,是否用纸笔介质完成任务并不是实作评价和纸笔评价的根本区别。在基础教育阶段,实作评价可以用于各个不同学科学生学业质量评价的证据来源,例如学生在音乐课上的演唱、器乐演奏,美术课上的绘画,体育课上的篮球投篮,科学课上的实验操作和科普剧表演,英语课上的语言对话,语文课上的短文写作,等等。
表4 生物学科“细胞的结构与功能”主题的学习预期
此外,在课堂上也存在大量对学生的学业质量进行评价的机会,即通过课堂观察,记录学生在相应内容领域的学习情况,收集相关证据;这些证据包括学生的口头报告、回答问题、与同伴之间的讨论和交流等。通过这些证据,可以记录和分析学生的思维发展过程。
在学业质量评价中,应通过多种途径广泛地收集有关学生所知和所能的各种证据,不管是纸笔测验,还是实作评价或课堂观察,只要能获取与教育目标所指的各类行为有关的有效信息,都可作为获取证据的可能途径或来源[23]。
2.4.2 评价任务设计
评价任务是收集证据的重要载体,因此,评价任务的质量直接影响到证据可靠性。这里所说的评价任务既包括纸笔评价中的试题,也包括实作评价中的具体活动或作业等。在设计评价任务时,需要根据评价的认知架构(核心素养)来构建评价蓝图,如表5所示。对学业质量评价有全面和系统的整体规划,才能保证评价三角中的认知和观察相互匹配,同时也能保证所收集证据的全面性,有利于评价工作的顺利开展和有效实施。
在设计具体的评价任务时,要以核心素养作为出发点,既要考虑到与学习预期的相关性和匹配性,又要保证评价任务的科学性(如试题的难度、区分度、信度、效度等)和规范性;此外,在设计评价任务时,还需要开发相应的评价标准或量规。评价标准或量规也要与核心素养相一致,其客观性和准确性也是保证评价任务质量的重要因素。
2.4.3 证据的收集与解读
通过评价任务,可以收集到学生在以下4个方面的证据:有关学科知识掌握的证据,有关学科能力形成的证据,有关学科核心价值观发展的证据,有关学生学习品质养成的证据[24]。在实际工作中,具体收集哪方面的证据,需要根据学业质量评价的认知框架而定。
完成相关证据收集后,需要对证据按照预先设定的认知框架进行整理和筛选,并对其有效性进行评估。筛选整理完毕后,通常采用经典测量理论对证据进行处理和分析。随着教育统计与测量理论的发展,概化理论、项目反应理论、认知诊断理论等数据分析方法也常常应用到处理分析中来,以提高证据处理分析的客观性与科学性。
对证据的解读则是在上述步骤完成的基础上进行的,主要包括对统计结果的阐释和说明,以及基于此作出的可能推论。证据解读是学生学业质量评价的重要一环,此部分可以运用Bookmark或Angoff等方法对证据进行解读,以将学生的整体学业质量水平进行划分和描述[25];还可以在此基础上针对认知框架中的每个维度进行详细的水平划分和描述,例如描述学生在生命观念、科学思维、科学探究和社会责任等不同生物学科核心素养维度上的表现情况。
此外,针对学业质量评价结果的解读,还可以深入挖掘结果产生的可能影响因素,如学生的家庭背景、学业负担、学习动机、可获得的学习资源、学习投入时间等[26],这也是当前国际上学业质量评价的发展趋势之一。这种证据的解读方式能够从不同的角度阐释学生的学业质量水平,并对教师的教和学生的学提供宏观和微观2个层面的有效反馈信息,符合“促进学生的学习”这一学业质量评价取向。
无论是证据的收集,还是证据的解读,都需要本着公平的原则来进行,例如:要给所有学生真正展示其学业质量的机会;在设计评价任务时,不能存在性别、种族等方面的偏见;数据分析时要确保分析方法的客观、公正。全方位的公平性支持是提高学业质量评价的重要保障。
表5 学业质量评价蓝图样例
3 结束语
学业质量评价是基础教育的核心任务之一,高质量的评价设计将直接影响到教育教学质量。在开展中小学生学业质量评价时,应以“促进学生的学习”为评价工作的价值取向,在此基础上进行科学、规范的整体规划和设计。在设计工作中,以评价三角理论作为指导思想,构建以核心素养为导向的认知框架,通过对学科能力和核心概念的解构,进而整合形成学习预期指标体系,并在此基础上构建评价蓝图,进行评价任务设计、证据收集和解读等工作。这一学业质量评价框架可以为具体工作的开展提供借鉴。
作为教育工作者,应该更新评价观念,注重挖掘评价的多重功能。以终为始,以评反馈教学,以评改进学习,从多个渠道收集反映学生学业质量的证据,将学业质量评价工作嵌合在全部教学工作中,从而使学业质量评价服务于教育目标的达成,最终实现学生的全面发展。