APP下载

发展性评价再诠释

2018-01-28郭志英

天津市教科院学报 2018年2期
关键词:理论评价课程

李 勇,郭志英

自2001年开始的新课程改革以来,发展性评价理念已经深入人心。学生评价改革作为新课改六大改革目标之一,推动发展性评价是其核心要义。《基础教育课程改革纲要(试行)》中明确提出“建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生在原有水平上的发展”。然而, 随着新课程改革的深入推行,学生评价的改革变得举步维艰, 从而影响到新课改推进的速度和质量,以及社会各界对新课改的评价。[1]发展性评价为何叫好不叫座,逐渐走入困境?究其原因是课程改革设计者自身对发展性评价理念的认识存有偏误,基层对于什么样的评价才是发展性评价、如何开展发展性评价的理解不可避免地陷入混乱,以致很多评价实践工作盲目化、形式化。

一、发展性评价的内涵

在国内关于发展性评价的文献中,大多将发展性评价翻译为Developmental Assessment 或Developmental Evaluation。但是从国外文献看,在教育领域,这两个术语多用于指对婴幼儿的生理和心理成长的发展水平评估,如果翻译为中文,应该是“发展的评估或评价”。与发展性评价相近的一个术语是由威金斯1998年提出的教育性评价(Educative Assessment)。他认为评价一是为了改进学生和教师的表现,二是必须向学生和教师提供有意义和有用的反馈。[2]

新课程改革的设计者认为“发展性课程评价的提出,不仅体现了当前课程评价最新发展的趋势与先进的评价思想,而且主要针对我国现行课程评价体系中的不足与局限,因此,深具前瞻性和现实性,对于推进基础教育课程改革意义深远。但在广大的教师队伍中,发展性课程评价还几乎是一个全新的概念,有必要进行诠释和分析,并给予相应的实施建议,从而使课程改革从概念变成行为,真正获得实效”。[3]可见,一方面,发展性评价并不是一个外来引入的术语,而是新课程改革设计者针对我国教育评价现状,在分析和吸收了国际上教育评价新理念的背景下提出的一个全新的本土化概念;另一方面,这一概念还在发展初期,并未达到成熟,需要我们进行大量的研究与诠释。

二、发展性评价提出的背景

库巴和林肯将教育评价的发展划分为四个阶段,分别为测量时代(19世纪末至20世纪30年代),以追求评价结果的数量化、客观化为主要目的;描述时代(20世纪30-50年代),泰勒正式提出教育评价这一术语,侧重于对测验结果作描述,以判断实际的教育活动是否达到预期的教育目标及达到的程度如何;判断时代(20世纪50-70年代),显著特征是重视制定评价标准,并据此搜集数据,作出目标达到与否的价值判断;建构时代(20世纪70年代以后),以回应和协商为重要标志,认为评价活动本质是一种心理建构的过程,强调评价者要重视利益相关者的意见,运用共同协商的方式推动评价活动。[4]作为第四代评价理念提出者的库巴和林肯认为,前三代评价理念根植于科学主义范式,是完全由评价者控制的,而第四代评价提倡“价值多元化”“使用质性手段”“相互协商”等观念。[5]

新课程改革设计者正是深受第四代评价理念的影响,认为根据评价思想的最新发展,当前我国的课程评价中存在很多问题,并据此提出了发展性评价理念:(1)评价主体互动性,强调评价过程中主体间的沟通协商,改变单一评价主体的现状,加强自评、互评,使评价成为教师、管理者、学生、家长共同积极参与的交互活动;(2)评价内容多元化,不仅关注学业成绩,更注重学生综合素质的考查,尊重个体差异,以质评为基础;(3)评价过程动态化,注重学生成长发展的过程,给予多次评价机会,鼓励将评价贯穿于日常的教育教学行动中,如口头评价、作业评价、成长记录袋等。[3]

应该说,第四代评价的提出对推动评价理念的发展有积极意义,但过于强调价值多元、共同协商,也导致了其在实践应用中的局限:一是需要不断与利益相关者沟通协商,实施的工作强度大;二是过于强调评价标准的主观性、不确定性,使评价工作容易陷入模糊化、随意化;三是适用范围受限,更适用于形成性评价。正如有研究者[6]在90年代就已警告的,第四代评价不重视对运用范围进行限制,如果盲目扩大到其他性质的评价活动中去,其优势可能就会变成弱点。鉴于此,与其把第四代评价作为新一代的评价,似乎还不如把它视为一种新的评价理论更恰如其分。

三、发展性评价的本质

顾名思义,发展性评价的本质要求就是“促进学生发展”。实际上,强调促进学生发展也是不同时期评价理念的共同目标,只不过它们的切入点和着重点不同而已。比如,最早泰勒提出教育评价这一术语,其定义就是“判断课程和教学计划在多大程度上实现了教育目标的过程”。[7]通俗地说,就是要求通过评价手段描述学生是否达到了预设学习目标的要求,以及达到何种程度。为改进课程与教学而进行评价是泰勒的一贯思想。其评价理念强调要注重课程目标在评价中的作用;评价方法可以有多种,不应限于笔试;评价并不是在教学的最后阶段才出现的,应该与教学同步, 起着校正教学,使之向目标的方向发展的作用。[8]再如,作为第三代评价代表人物的布卢姆强调评价要基于清晰制定的评价标准,评价的目的在于为优化和改善教学过程提供依据,是改进教学过程和学习过程的手段。布卢姆还从评价功能的角度出发,将教学评价分为诊断性评价、形成性评价和终结性评价三大类。他提出的“掌握学习”教学理论,以适应学生个体差异,帮助大多数学生获得发展为主旨,强调形成性评价和诊断性评价手段的应用,注重从具体细微的学习目标角度分析教学质量,促使大多数学生达到对课程材料的真正掌握。[9]可见,提倡发展并不是第四代评价理念的创举,而是教育评价概念诞生以来永恒不变的主题。

四、发展性评价的核心特征

发展性评价作为配合新课程改革提出的新概念,其最主要的特征是什么?对这个问题的解答,既关系到对发展性评价的理论探讨与发展,也影响着广大一线教育工作者对其概念的认知和实践的取向。

基于对促进学生发展这一本质的认识,我们认为发展性评价的核心特征主要有以下三点:

一是基于过程。要评价学生的发展,必然至少要有一个起点和一个终点,通过终点相较于起点的进步状况判断学生发展的总体进步幅度以及发展的优势点与不足之处。需要注意的是,这种起点和终点发展状况信息的获取不一定通过形成性评价手段,也可以通过终结性评价手段。比如对学生在两个年度的期末成绩进行纵向比较,可以通过学习目标的掌握比例的变化情况评价总体进步水平,也可以根据不同内容领域或具体目标的掌握情况,评价学生在哪些方面发展得快,在哪些方面还有不足。

二是自我比较。要尽量采用标准参照方法,评价学生相对于既定标准的自我进步情况,避免使用学生间相对比较的常模参照方法。常模参照方法的主要问题是容易受到学生群体水平和任务难度水平的影响而不能反映个体的实际进步情况。但是常模参照方法在有的情况下,比如选拔和升学情景中,其作用还是难以被完全替代的。比如,一项可以将学生区分为优秀、达标和未达标的英语等级测试,如果学生先后两次参加,成绩由达标提升为优秀,则可以判断其英语学习取得了明显进步。这类评价的关键之处是要求评价标准前后保持一致,即虽然评价的具体任务可能是前后变化的,但评价的内容范围以及优秀、达标等等第的含义是不变的,因此,不同次评价的数据常常需要进行专家主观标定或进行更复杂的等值化、量表化处理。需要注意的是,很多人将增值评价理解为自我参照性评价,而与标准参照性和常模参照性评价并列,实际上,虽不能说这是一种误解,但却可以说这种认识有片面性。首先,增值评价一般用于学校和教师评价,而非学生个体的评价。其次,增值评价的着重点不是评价自我发展,而是评价“净”发展。它是将影响学生学习的外部因素,如人口学因素、家庭背景状况、学校周围地区的发展水平等效应分离出去,从而考察学校或教师对学生学业成绩影响的净效应,进而实现对学校或教师效能较为科学、客观的评价。再次,增值评价更偏向于统计手段,而非评价方式。增值评价这一术语基本上可以等同于其最常采用的多水平分析模型,而标准参照和常模参照性评价的划分则体现的是不同的评价理念,并不绑定于某几种统计方法。因此,增值评价体现的是评价之术,而标准参照和常模参照性评价体现的是评价之道。最后,增值评价统计模型的运算中,或多或少需要利用平均分等群体表现数据,做不到真正意义上的自我参照。

三是提供诊断。相较于告知学生发展的幅度,更重要的是要让学生明了发展的方向。当前的评价实践中,一个主要的问题是评价往往止步于报告总体水平,比如等第、总分、百分位,没有进一步提供全面而详实的诊断信息,这就造成学生只知道自己的整体水平如何,不知道哪些方面是自己的优势点或弱势点,从而不能有针对性地提高改进。需要注意的是,要想保证诊断信息的全面性和准确性,必须在编制评价工具之初,就进行科学的设计,清晰梳理好评价领域及目标。

五、对发展性评价的认识误区

基于对上述发展性评价核心特征的理解,可以发现,当前理论与实践中对发展性评价的认识还存在一些误区,主要体现在以下四个方面。

一是简单化,认为发展性评价是区别于个体间横向比较的一种纵向评价手段。有研究者[10]提出,发展性评价是针对以分等和奖惩为目的的终结性评价的弊端提出来的一种形成性评价。应该说发展性评价不能简单等同于纵向手段的评价。

二是复杂化,泛泛地将各种现代教育教学理论的要求加诸其上,使其内涵庞杂,面临理念的被接受程度大于实践的被接受程度的窘境。很多研究者[11-13]提出发展性评价的理论基础包括了多元智能理论,要求评价内容全面;人本主义思想,要求评价体现人文关怀;后现代主义思想,要求对不同的学生设立不同的评价标准。甚至还有研究者认为斯滕伯格的成功智力理论[14]、赞可夫的发展性教学理论[15]、皮格马利翁效应[16]等都是发展性评价的理论根基。应该说,从发展性评价的提出看,主要是基于第四代评价理论及其背后的建构主义教学理论。

三是片面化,过于推崇质性手段,贬低量化手段。正如有研究者[17]指出,由于新课程改革强调质性评价手段的倾向,导致有些学校“谈分色变”,大有视量化评价为发展性评价大敌之势。实际上,量化与质性评价的区别不在于评价结果是否以分数呈现,而是要看评价过程是否贯穿了量化或质性的思想。

四是割裂化,将发展性评价视为对传统评价的革新,而将两者完全对立起来。应该说,发展性评价更为强调评价活动的“基于过程、自我比较、提供诊断”价值取向,其评价目的、手段与传统评价并无本质区别;它的提出意义更多在实践层面,而非理论层面。

在发展性评价的理论研究与实践操作中,需要尽快走出上述误区,推动对发展性评价理念的再认识和再实践。

参考文献:

[1]张永胜. 学生评价改革的困境与反思[J]. 西北师大学报(社会科学版), 2010,47(5):71-75.

[2][美]Grant Wiggins,国家基础教育课程改革促进教师发展与学生成长的评价研究项目组.教育性评价[M]. 北京: 中国轻工业出版社, 2005:12-13.

[3]钟启泉,等. 为了中华民族的复兴 为了每位学生的发展——《基础教育课程改革纲要(试行)》解读[M]. 上海: 华东师范大学出版社, 2001:301-304.

[4]卢立涛. 测量、描述、判断与建构——四代教育评价理论述评[J]. 教育测量与评价(理论版), 2009(03):4-7.

[5][瑞典]胡森, [德]波斯特尔斯威特,许建钺,等.简明国际教育百科全书:教育测量与评价[M]. 北京: 教育科学出版社, 1992:59-65.

[6]张民选. 回应、协商与共同建构——“第四代评价理论”评述[J]. 外国教育资料, 1995(03):53-59.

[7][美]拉尔夫·泰勒,罗康, 张阅.课程与教学的基本原理[M]. 北京:中国轻工业出版社, 2014:113.

[8]刘春惠. 泰勒课程评价模式述评[J]. 北京邮电大学学报(社会科学版), 2001,3(2):47-50.

[9]纪淑军. 布卢姆:美国教学改革大师[J]. 教育与职业, 2013(22):110-111.

[10]亓文涛, 乔爱玲. 形成性评价在基础教育教学中的应用研究[J]. 现代教育技术, 2007,17(11):89-92.

[11]周智慧. 发展性教学评价的内涵及其理论基础[J]. 内蒙古师范大学学报(教育科学版), 2004,17(8):35-37.

[12]何云峰. 学生评价的转向:基于发展性评价的视角[J]. 教育理论与实践, 2009(09):15-17.

[13]乔淑霞. 浅谈发展性学生评价[J]. 教育探索, 2010(12):33-34.

[14]彭智勇. 数学新课程发展性评价研究[D]. 重庆:西南师范大学, 2004:41-44.

[15]谢婧. 发展性评价在小学数学学业评价中的运用[D]. 上海:上海师范大学, 2010:16-17.

[16]徐魁鸿, 张荣娟. 发展性学生评价理论与实践研究[J]. 当代教育论坛,2004(5):53-54.

[17]许爱红. 对发展性学生评价本质的思考[J]. 中国教育学刊, 2005(03):57-59.

猜你喜欢

理论评价课程
坚持理论创新
神秘的混沌理论
SBR改性沥青的稳定性评价
理论创新 引领百年
数字图像处理课程混合式教学改革与探索
中药治疗室性早搏系统评价再评价
相关于挠理论的Baer模
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
A—Level统计课程和AP统计课程的比较