一致性研究:实现基于标准的评价
——2015年语文教育论著评析之四
2016-07-07胡根林赵梦雷
胡根林 赵梦雷
一致性研究:实现基于标准的评价
——2015年语文教育论著评析之四
胡根林赵梦雷
【评议论著】刘晶晶《小学语文阅读能力标准与学业评价一致性研究》,华中师范大学博士论文,2015年。
【内容提要】使用美国课程实施调査模式(简称SEC)对近年来小学语文阅读试题的内部结构进行一致性分析,同时从“标准驱动”的国家或地区语文课程标准与国际评价项目框架的分析中得到启示,尝试建构了我国小学语文第三学段阅读能力表现标准,以探求语文阅读能力标准和学业评价的一致性,推动基于语文课程标准的评价。
近年来,“基于标准的教学与评价”成为一种世界趋势。国内学界以崔允漷先生等为代表,借鉴国际上这个领域的研究,并立足本土实际不断探索,取得了丰硕的成果。
众所周知,语文课程标准规定了语文课程的性质、目标、内容框架,提出教学和评价建议,体现了国家对不同学段的学生在语文知识与技能、过程与方法、情感态度与价值观等方面的基本要求,它是语文教材编写、教学和评价的基本依据。基于标准的语文学业评价,其基本目的是考査学生经过一段时间学习后,“应知”“应会”哪些内容,即学生到底掌握了哪些语文课程标准所规定需要掌握的知识、技能、方法以及掌握的程度到底如何。要实现基于语文课程标准的评价,就要立足于语文课程标准和学业评价的一致性,也就是两者匹配程度的研究。一致性是基于标准评价的核心。目前在语文学界,关于这个论题的研究凤毛麟角,鲜有涉及。本文试图通过对刘晶晶《小学语文阅读能力标准与学业评价一致性研究》一文的评议,对这方面研究作些介绍,以推动语文学科领域更多教师基于课标开展教学与评价。
一、何为“一致性”?
《小学语文阅读能力标准与学业评价一致性研究》一文在文献综述中提到国际和国内学者关于“一致性”的研究情况,也有专章(第二章)对这个概念进行哲学基础、心理学基础等多方面的理论阐释。
所谓“一致”,指的是“调整一致”,英文文献里的名词形式是“alignment”,动词形式是“align”,本意是指两个或若干个事物之间的匹配。教育评价领域中的一致性研究始于布卢姆教育目标分类,但是从20世纪80年代开始,随着评价理念的发展,人们对一致性进行了更深入的研究,认为一致性的作用应该在于促进学生获得更高水平的学业成就,其核心在于:课程标准是教学与评价的依据;教学与评价是为了实施课程标准;评价的内容就是所教的内容。三者之间相互促进实现高质量的一致性,满足学生获得高质量的学业成就。
1.实现一致性的起点——课程标准
标准是客观事物所具有何种意义的一种参照物,“标”是技术,即投射器;“准”是效益,是靶心。“标”“准”合用,具有行为和结果一致性的内涵。课程标准是课程的严谨性和考试难度的质量与卓越的基准。某一学科的课程标准规定了该学科的课程性质、课程目标、内容目标、实施建议,是教学与评估的指导性文件。课程标准不仅仅包括学习领域,即规定学生学习后“应知”和“应会”的内容,即内容标准,还应该包括规定学生在某领域应达到的水平,即表现标准。表现标准是课程标准的内在指标,其作用是提供一个基本的、有意义的关于内容标准与学业表现是否一致的反馈。也就是说,内容标准是指学生应该知道什么和能做什么,而表现标准指学生掌握内容标准的程度和质量,它需要对学生掌握知识与技能的成就水平进行界定。可以说,表现标准是内容标准的抽象化和具体化,是对内容标准深度的细致描述。如果说内容标准是推动标准与评价一致性的指南针,那么表现标准是丈量标准与评价一致性关系的刻度尺。
2.实现基于一致性的途径——基于标准的评价
基于标准的评价是学生学业成就评价与课程标准的一致性的核心。和传统的评价相比,“基于标准的评价”的评价理念和评价手段都有区别,这可以从评价理念和评价技术两个方面反映出来:(1)评价理念。传统的评价强调的是目标,宗旨是通过对学校实践教育目标程度的评价来诊断教学中存在的问题,以改善课程与教学,泰勒的“八年研究”的目标评价模式可为代表。而基于标准的评价,其价值取向从“目标”走向了“过程”,它把评价分为“为学习的评价”“对学习的评价”“作为学习的评价”三种类型,特别强调“作为学习的评价”。这种评价通过教师频繁和持续提供指导、支持、模型的方式帮助学生调整学习,建立个人学习目标。功能上由侧重甄别转向侧重发展,越来越强调评价是一个学习过程的有机组成,强调评价的真实性和情境性。(2)评价技术。基于标准的评价,要求评价与标准调整一致,技术上要做到:首先,完成试题需要的知识范围及其认知要求与内容标准的内容范围及其认知要求一致;其次,完成试题覆盖的内容领域和内容主题与内容标准的内容领域范围一致;最后,评价所包含的内容和技能的比例与内容标准和表现标准调整一致。
二、“一致性”分析模式
研制一致性分析模式是国内外近年来基础教育课程领域的重要课题。研究者们纷纷借助技术分析来保证评价与课程标准的一致性,《小学语文阅读能力标准与学业评价一致性研究》对此就国外研究情况作了一些介绍。
1.一致性分析维度
最早开始进行一致性模式分析的是美国课程专家马扎诺(Marzano),他提出一致性的内容有四个方面:(1)测试的内容是所有学生在各年级需要掌握的吗?(2)所有学生都会进行标准技能的示范吗?(3)测试是被分为简单、中等、难的水平吗?(4)测试有一套完整的关于深度和广度的标尺吗?
1999年,美国著名的课程专家、威斯康星州教育研究中心高级研究科学家诺曼L.韦伯(Norman L.Webb)经过多年研究指出“一致性”就是课程期望与评价之间的契合度,并能引领整个课程系统为这个期望服务。在1999年、2002年、2005年、2007年的研究中,从最初12个标准中抽取与内容集中性相关的四个标准作为分析维度,形成了目前标准与评价一致性研究的最常用工具,称之为韦伯模式。后来又出现了巴罗斯中心研究模式、2061计划项目、成就公司模式等。虽然不同的机构或学者在分析一致性时所关注的维度存在差异,但一般而言,主要关注四个方面的一致性,即知识种类一致性、知识深度一致性、知识广度一致性和知识样本平衡一致性。
2.一致性测量方法
《小学语文阅读能力标准与学业评价一致性研究》一文简要介绍了双向细目表在一致性测量中的作用,其重点是分析美国学者安德鲁·帕特(Amiirew Porter)等人开发的课程实施调査模式(简称SEC模式)的一整套方法及程序。
SEC模式的核心内容涉及三个“一致性分析”。第一是内容一致性分析。该方法强调二维分类,分为内容维度和认知维度。内容分主题内容和亚类主题内容,如英语语言艺术与阅读主题可分音素意识、注音、词汇、文本和书写特点、流畅性、理解、逻辑推理、作者加工技术、写作过程、口头和书面表达原理、写作应用、语言学习、听和看、口语和表达共14个通用领域,这14个领域又被分为163个亚类主题。第二是深度一致性分析。认知维度是深度一致性分析的重要依据。认知维度包括五个层次,以英语语言艺术和阅读为例,分为记忆,回忆,执行程序,解释和创造五个层次。这五个层次根据学科特点还可分若干亚类层次。第三是平衡一致性分析。就是按二维矩阵的方式对任意两个文档(内容标准、评估、课程材料、教学实践)进行比较。研究者首先给所有文档编码,然后将每个目标或测试项目放置到定义了一个或多个亚类主题和认知需求亚类层次维度中,最后将这些数据转换成比例平均数再进行内容分析。由此产生的矩阵比例可以用来计算一致性指数:
xi和yi分别代表亚类主题和亚层次所呈现的比例。该指数的值可以被认为是在两个共同的文档内容之间的比例,指数范围从0到1,1表示完美对齐(即有100%的内容共同之处)。
研究者用上述测量方法对美国州标准和共同核心州立标准进行一致性分析,提出共同核心州立标准数学学科的校准度为0.22,英语语言艺术与阅读学科的校准度为0.27,并分析了两者在内容维度和认知维度存在的差异。一线教师普遍感觉到,研究者提供的报告使他们更明确本学科哪些内容应该被教授,教授到什么程度,哪些认知需求和水平应该被强调,强调到程度。
表1 PISA、PIRLS、NAEP测评框架中的“概念框架”
三、基于一致性的国际阅读能力学业评价基本框架
《小学语文阅读能力标准与学业评价一致性研究》一文从国际视野出发,详细介绍了国际学生学业成就评价项目(简称PISA)、国际阅读能力进展研究项目(简称PIRLS)、全美教育进展评价(简称NAEP)、美国评价联盟(简称PARCC与SBAC)四种阅读能力学业评价框架。这里特别介绍前三种。
PISA、PIRLS、NAEP三个国际阅读测评项目基本都是从这几个要素展开的:阅读的目的、阅读的情境或环境、文本类型、认知目标或过程。当然,对这几个要素的理解又以对阅读素养概念清晰、明确的理解为基础。PISA、PIRLS、NAEP三个评价项目都是在对阅读素养概念进行了条分缕析之后,再对阅读的目的、阅读的情境或环境、文本类型、认知目标或过程这几个要素展开进一步探究。现将三个“评价框架”中共性的概念框架要素及各个项目对每个要素的理解进行简单梳理,如表1所示。
用非常明确的语言清晰地表达所观察或测量的内容,是可靠的评价设计和说明面对的第一个难题。国际评价项目评价框架的设计要能充分反映评价的目的和方式及内容之间的关系。从表1可以看出,上述三个评价项目在阅读能力学业评价框架的设计都紧密围绕阅读素养即阅读目的展开,其中包括阅读文本、阅读认知过程、阅读情境三个维度的设计。
四、基于一致性的我国阅读能力标准及评价方案的设计
《小学语文阅读能力标准与学业评价一致性研究》一文,大量介绍了国际上关于一致性研究以及基于一致性的国际阅读能力学业评价框架等文献。颇为难得的是,刘晶晶博士还基于国际阅读能力学业评价框架的共性要素和我国语文课程标准的特点,进行了我国阅读能力标准和评价方案的尝试性设计。
她根据《语文课程标准(2011版)》中第三学段的内容标准建构表现标准,并提供学业测查的阅读试题及学习情态考察的参考样例。她将阅读能力的表现标准的分类分为阅读与语言、阅读与文本、阅读基本技能、阅读情志四类。阅读与语言包括:(1)字与词(2)句与段(3)篇章;阅读与文本包括:(1)童话、寓言、故事(2)儿歌、儿童诗(3)诗文(4)记叙文(5)说明文(6)非连续性文本;阅读基本技能包括:(1)朗读(2)默读(3)略读(4)标点的使用(5)字典的使用(6)电子工具的使用;阅读情志包括:(1)阅读情感(2)阅读态度(3)阅读习惯。按一致性构成要素,将表现标准分为表现水平、表现描述、呈现方式三个部分。阅读表现水平分为阅读理解能力、阅读鉴赏能力、阅读创造能力,即阅读的初级水平、中级水平、高级水平;表现描述是根据阅读能力分类对《语文课程标准》中第三学段的内容标准部分的进一步详细解释;呈现方式是指学生学习结果的展示方式,也是教学中常见的任务方式,如“阅读与文本”中,设计一份调查问卷以搜集信息。
为了实现阅读能力学业评价与标准的一致性,作者根据阅读能力框架中认知维度的阅读理解能力、阅读欣赏能力、阅读创造能力设计出阅读能力学业评价框架,其中包括测评内容、测评方式、素材来源。除此之外,为了全面考察学生的学习情态,还设计了阅读能力情态评价表,其中包括阅读情感评价、阅读态度评价、阅读习惯评价。
这里我们姑且不论这个评价框架是否存在缺漏,其严谨性和科学性是否经得起检验,也不论其参考样例和各种评价表是否真正体现了阅读和阅读评价的要义,单从这项工作的创新性上来看,目前还没有哪一位研究者这样系统地梳理和解构既有课程标准,综合并建构形成阅读能力表现标准以及对应的评价方案。这项工作的开展,不仅对在课程标准理解上形成一致性具有重要意义,而且有助于在学业测评,包括命题、解题、试题评价过程中贯彻这种一致性要求,甚至引导着语文课堂教学在目标确立上形成与课程标准一致性要求的意识。
五、小结
一致性研究对我国语文学术界而言是个前沿课题。能力发展的评价问题一直是我国基础教育改革中的瓶颈问题,如何对学生的语文阅读能力发展状况进行评价,如何结合学生能力与语文阅读素养进行检测,如何深化课程与教学评价理论与方法的研究,目前我们明显缺乏科学有效的理论支撑和技术支持。刘晶晶博士力图解析语文阅读能力表现的内在结构,借鉴国际阅读能力的标准及评价框架,尝试建构语文阅读能力表现的分层指标体系,对学生语文阅读能力表现进行观察和评价提供了理论支撑与实践指导。她的这项研究为我们实现语文学业评价与课程标准一致性探索打开了一扇窗户,更多的人将从中看到我们语文学科在学业评价和课程标准方面存在的错位,知道如何解决这方面的问题,从而走上基于课程标准的评价与教学之途,不断提高学生的语文学业质量。
[作者通联:胡根林,上海浦东教育发展研究院;赵梦雷,新疆喀什大学教育科学学院]