APP下载

形成性评估理论框架的构建

2014-04-20李清华

教育测量与评价 2014年4期
关键词:实证主义范式框架

李清华

教育评估既可以监测教育教学水平,还可以评价学生的学习,对学习提供诊断性信息。从评估与学习的关系来看,教育评估可分为三种:对学习的评估(assessment of learning,简称AoL)、为学习的评估/学习性评估(assessmentforlearning,简称 AfL)、作为学习的评估(assessment as learning,简称AaL)(Earl,2003)。“对学习的评估”在单元、课程或学期结束时进行,相当于总结性评估(SummativeAssessment),通常是根据评估结果(考试分数或等级)作出分班、提升、证书颁发等决定。而“促进学习的评估”的重心从学习结果转移到学习过程,目的是用评估结果为下阶段的学习提供必要的指导。在这种评估中,教师借助于学生的“学习成果”(artifacts),跟踪学生学习发展的过程,对学生提供及时的个性化反馈。在“作为学习的评估”中,学生既是评估的对象又是评估的主人,评估真正融入教学与学习之中。在当今世界的教育评估中,最常见的是第一种评估,第二种评估正在迅速发展,而第三种评估则初露端倪(Earl,2003)。

形成性评估(FormativeAssessment)具有巨大的促学潜力,也被称为“学习性评估”(Berry,2008;Berry&Adamson,2011;Broadfoot&Black,2004;Stiggins,2002,2005)或“促学评估”(Huhta,2008)。自从Black&Wiliam(1998)关于形成性评估的综述发表以来,形成性评估实践在全世界的教育评估中迅速发展。但是,形成性评估的理论构建一直没有受到足够的重视。这是形成性评估研究中存在的主要问题之一(Bennett,2011)。一些学者提出的形成性评估理论(如,Black&Wiliam2005,2009)也仅仅是从操作实践的层面来勾画评估实施的步骤和策略,似乎形成性评估不过是一些评估技巧与方法,没有什么理论。本文拟追溯教育评估范式的演变,评述现有形成性评估理论的研究,并据此提出形成性评估的理论框架,以指导形成性评估实践和研究。

一、教育评估范式的演变

一些学者从哲学范式的视角来审视教育评估的变革。“范式”一词由美国著名科学哲学家库恩(Kuhn)于1962年提出,在自然科学与社会科学研究中得到了广泛的应用。范式是一套相互关联的概念,它提供了人们观察和理解特定问题和活动的框架,决定了人们的研究目的、解释观察到的现象以及解决出现问题的方式。当旧范式不能解决新出现的问题时,范式便要发生变革。而教育评估范式是指,人们以某种特定的思维方式,对教育评估的理论与技术进行研究,进而所形成的一系列基本规范。在此基础上建立起来一套能够表征人们对教育价值有某种特定认识的理论与技术框架,用以指导人们进行揭示教育价值和建构价值世界的认识活动。正如瑞典教育学家胡森(Husen,1989)指出的那样,自教育学这门学科形成之日起,它本身就存在着两种范式之间的冲突:一是模仿自然科学,强调适合于数学工具分析的、经验的、可定量化的观察,研究任务在于确定因果关系,并做出解释,因其哲学思想来自于实证主义,故被称为“实证主义范式”;而另一类范式是从人文科学推衍而来的,所注重的是整体和定性的信息以及说明的方法,可以称之为“后实证主义范式”。20世纪,很多领域都经历了“实证主义范式”到“后实证主义范式”的演变,二者的对照详见表1(Jacobs&Farrell,2001)。

表1 “实证主义范式”与“后实证主义范式”的对比

Gipps(1994:158)指出,“评估正处于范式演变之中,评估实践从心理计量学走向教育评估,从测试文化(testing culture) 走向评估文化(assessmentculture)”。对于评估范式的变化,有的学者主张二元论,如,Berlak等(1992)的“心理计量范式”(psychometricparadigm)与“情景化范式”(contextual paradigm),Jacobs&Farrell(2001)提出的“实证主义范式”与“后实证主义范式”;更多人认为存在三个阶段,如Shepard(2000,2006)的“科学测量范式”、“分裂型范式”和“社会建构主义理论框架下的课堂评估范式”,Gipps(1994)的“心理计量范式”、“教育测量范式”(educational measurement)和“教育评估范式”(educational assessment),Mabry(1999)的“心理计量范式”、“情景化范式”和“个人化范式”(personalized paradigm)。

下面简要讨论Mabry(1999)、Shepard(2000,2006)、Jacobs&Farrell(2001)的观点。

1.“心理计量范式”、“情景化范式”和“个人化范式”

Mabry(1999)从评估策略、关注的焦点、实施的情景、题型、评估人、形成性或总结性、自我评估等方面总结了“心理计量范式”、“情景化范式”和“个人化范式”的特点,并指出各自的优点与不足,详见表2。

表2 心理计量范式、情景化范式和个人化范式的比较

2.“科学测量范式”、“分裂型范式”和“社会建构主义理论框架下的课堂评估范式”

Shepard(2000,2001)根据学习、教学与评估关系的演变及其理论基础,提出了教育评估的三种范式:(1)科学测量范式(1900s~2000+):20世纪占统治地位,延续至今;(2)分裂型(dissolution)范式(1980s~2000+):教学思想与测试思想分裂,盛行于当今;(3)社会建构主义理论框架下的课堂评估范式(1990s~2000+):处于萌芽状态。

在科学测量范式中,教学与测试主要受连接主义(associationist)和行为主义(behaviorist)学习理论的影响,其原则包括:

(1)学习是“刺激—反应”的过程;

(2)学习是零散知识点的积累过程;

(3)学习的内容有严格的先后顺序和高低层次;

(4)每个目标应明示地传授,目标之间很少存在迁移;

(5)为保证学习效果,采取“测试—教学—测试”的循环流程;

(6)学习动机来自于对诸多小进步的肯定。

在这些原则指导下,教师担心对学生学习整体评价的“主观性”,会尽可能保证课堂评估的“客观性”,所以倾向于使用以多项选择为代表的所谓“客观测试”。传统范式所倡导的“科学测量”至今仍对教师的评估思想及教学实践具有很大影响。

20世纪80年代以来出现的“分裂型范式”的主要特点是测试与教学的错位:外部测试完全脱离教学,而课堂评估也模仿外部测试,与日常教学脱节。造成这种局面的根本原因是,一方面建构主义教学思想广为大众接受,另一方面语言测试仍受“科学测量”的禁锢。交际教学思想促进了教学实践的改革,但配套的评估体系并未建立起来。滞后的评估范式阻碍了语言教学的发展。

20世纪90年代以来逐渐发展的“社会建构主义理论框架下的课堂评估范式”所依据的学习理论和教学思想促使人们把关注的焦点转移到课堂之中。

认知心理学和社会建构主义的学习理论主要强调以下几点:

(1)思维能力是在特定的社会和文化环境中发展起来的;

(2)学习者的知识建构与理解是在特定的社会情景中发生的;

(3)新的学习建立在已有的知识之上;

(4)学习过程涉及元认知(meta-cognition)能力(即,对学习和思维进行自我调整的能力);

(5)只有“深刻理解”(deep understanding)的知识才能迁移并运用到新的场合;

(6)认知行为表现取决于情感倾向和个性认同。

基于上述学习理论的社会建构主义课堂教学理念及评估原则详见表3。

表3 社会建构主义的课堂教学理念及评估原则

总之,新范式下的学习是主动反思的知识构建,教学以学习为中心,评估则是基于行为的情景化的“为教与学服务的评估”(Birenbaum,2003)。

3.后实证主义范式

近半个世纪以来,在外/二语教育领域的“后实证主义范式”表现为从以行为主义心理学和结构主义语言学为主导转变为以认知心理学、社会认知心理学和功能语言学为主导,主要原则如下(Jacobs&Farrell,2001):

(1)更重视学习者的角色,教学从以教师为中心转变为以学生为中心;

(2)更重视学习过程,教学从以结果为导向转变为以过程为导向;

(3)更重视学习的社会属性,不把学生看成孤立的与社会情境无关的个体;

(4)更重视学习者之间的差异性,注重研究个体差异,个性差异不应看作学习的障碍,而应受到认可和欣赏;

(5)更重视教室内的教学活动参与者的看法和情境的独特性,而不仅仅关注外部专家的看法,更重视质性研究;

(6)把学校及其外部世界结合起来研究,促进整体学习的发展;

(7)帮助学生理解学习目标并形成自己的学习目标;

(8)教学应从总体到部分,而不是从部分到总体;

(9)强调“意义”的重要性,而不是仅仅死记硬背的“形式”;

(10)主张终身学习的学习观,反对为考试而学习。

因此,在外/二语教学中,应实现八个方面的转变:

(1)培养学生的自主学习能力(learner autonomy),强调内部动机和自我评估;

(2)倡导合作学习;

(3)加强课程整合,实施内容为导向的教学;

(4)重视意义;

(5)重视多样性,表现在学习风格、学习策略等方面;

(6)重视高级思维能力,如,批判性思维、创造性;

(7)实施非传统评估,如,真实性评估、同伴评估、档案评估(portfolio)等;

(8)教师的角色是学习的合作者。

这八个方面是互相联系在一起的,相互依赖,相互支撑。仅仅追求某些方面而忽视其他因素,都难以成功。所以,新评估范式的建立和实施是一项系统工程。

总之,尽管学者们使用的名称不同,但范式之分的实质基本相同。Shepard的第二种范式其实是一种过渡状态,其第一种范式与“实证主义范式”一致,第三种范式则与“后实证主义范式”和“个人化范式”基本吻合。上述三种范式的出现虽有先后,但当今教育评估中三种范式并存,尤其是第三种范式尚处于萌芽状态,它所倡导的课堂评估尚未得到应有的重视(Shepard,2000,2006)。在评估范式的演变浪潮中,形成性评估的角色越来越清晰,在第二和第三范式中均占有重要地位。世界范围的教育评估正经历着范式的变革:从心理测量模型向着更广泛的教育评价模型,从测试文化向着评估文化演变。形成性评估思想正是顺应了这一潮流,应当在这场变革中扮演更重要的角色。

二、形成性评估的社会文化理论

Pryor&Crossouard(2008)基于他们的研究和社会文化理论,提出了形成性评估的社会文化模式(A socio-cultural model of formative assessment)(详见图1)。

图1 形成性评估的社会文化模式

在图1上部的六边形表示形成性评估的循环过程。六边形内的“沟通”是指,师生之间对评估任务和质量评价标准的讨论——这一活动在评估过程中占有核心地位,其他三种活动——提问(教师对学生既可以进行以测量或测试为目的的提问,也可以给予“支架类”的帮助式提问)、观察(教师观察学生的学习过程和结果)、反馈和判断(教师对学生的表现提出反馈信息和评价意见),均以此为出发点和落脚点。右侧的箭头表示,学生在与教师或同伴的合作活动中完成自己的学习任务。

图1下方的六边形内容与上方的内容相同,这是新一轮评估的过程。右侧的箭头表示,学生通过“元语境反思”(metacontextualreflection)可能会改变自己的“身份”(identity)——修改已经完成的学习成果。

两个六边形之间用波浪形的箭头连接是为了突出形成性评估过程的动态性和循环性。最右边的“元语境反思”是指,在师生之间对评估任务和质量评价标准的讨论中不仅可以使学生更加清楚评估任务和评价标准,而且可以调整预设的评价标准,修改已经完成的学习成果。

在这一评估模式中,Pryor&Crossouard充分强调了社会和文化因素的重要性。形成性评估发生在教室这一微观的情景中,但也会受到学校、地区和国家这样宏观的情景因素的影响。师生之间、学生之间的沟通是权力的博弈和身份的认知与重构。应当指出的是,这一社会文化模式没有涉及形成性评估的教育学和测量学的理论基础。

三、形成性评估的理论框架

综合上文所述,我们认为有必要在社会文化的大环境下构建全面的形成性评估理论。形成性评估理论应包括主要的原则和实施的策略(Bennett,2011)。Shepard(2006:640)强调,“理想的新课堂评估理论必须建立在当代认知和社会文化学习理论之上”。学习理论是形成性评估的理论基础之一。除此之外,还应当有教育学理论、心理学理论、测量学理论等。形成性评估的操作框架应当基于形成性评估理论结合当时当地评估的具体条件来设计。(详见图2)

形成性评估理论包括的基本原则如下:

(1)评估的目的:形成性评估主要是为促进学生知识和能力提高提供持续的反馈,也可以对学生的知识和能力做全面的衡量,评估的结果为教师改进教学提供依据。

(2)评估实施的时间:在教学过程中进行。

(3)学生的角色:鼓励学生参与评估过程,决定评估的内容和评分标准,学生具有内在动机,以掌握学习目标为目的。

(4)教师的角色:让学生清楚了解具体的学习目标和评估目标,与学生沟通决定评估的内容和评分标准;及时向学生提供非评价性的、具体的、与学习目标相关的反馈,为学生提供修改和完善学习任务以及加深理解的机会,根据评估结果做出教学调整。

(5)所衡量的认知能力:涉及深层次的理解、应用、推理等能力。

(6)评估程序:可以根据实际情况调整。

(7)评估方法:形成性评估一般采用非正式的方法,如,自我评估、同伴评估、档案评估、课堂观察、作业等。

(8)评估的技术质量:评估在多大程度上促进了学生知识和能力的提高?

形成性评估的操作框架可以多样化。这里介绍Rea-Dickins(2001)提出的“课堂评估的过程和策略”框架。操作过程分为四步,即,计划——实施——调整——记录和发布。从第一步到第四步并不是严格的线性先后顺序。在第二步的实施中获得的信息可能促使“计划”的修正;第三步的“调整”中包含修改教师的教学计划和学生的学习计划,更是直接为“计划”的完善提供信息。至于第四步的评估结果发布,则使得形成性评估具有了一定的“高风险”(详见图3)。

图2 形成性评估的理论框架

图3 课堂评估的过程和策略

形成性评估是一种评估理念,而不是某种或某些评估方法或策略。形成性评估理论既包括理论依据,也包括具体的操作程序与方法。本文认为,形成性评估应当基于教育学、心理学、测量学等理论,在实际评估过程中评估者可以从具体情况出发,依据形成性评估的基本原则设计操作框架,用以指导评估实践。当然,本文提出的“形成性评估理论框架”,尚需在形成性评估实践中不断完善。

注释:

因篇幅限制,本文未能展开讨论形成性评估的理论基础,如教育学理论、心理学理论、测量学理论等。对此,我们另文阐述。

[1]Bennett,R.E.Formative Assessment:A Critical Review[J].Assessment in Education:Principles,Policy&Practice,2011(1):5~25.

[2]Berlak,H.,etal.Toward a New Science of Educational Testing and Assessment[C].Albany:State University of New York,1992.

[3]Berry,R.Assessment for Learning[M].Hong Kong:HongKongUniversityPress,2008.

[4]Berry,R.&Adamson,B.(Eds.).Assessment Reform in Education:Policy and Practice[C].New York:Springer,2011.

[5]Birenbaum,M.New Insights into Learning and Teaching and Their Implications for Assessment[C]//M.Sergers,F.Dochy&E.Cascallar(Eds.).OptimizingNewModesofAssessment:In Search of Qualities and Standards.Dordrecht:Kluwer AcademicPublishers,2003.13~36.

[6]Black,P.,&Wiliam,D.Assessment and Classroom Learning[J].AssessmentinEducation,1998(1):7~74.

[7]Black,P.,&Wiliam,D.Developing a Theory of Formative Assessment[C]//J.Gardner(Ed.).Assessment and Learning.London:Sage,2005.81~100.

[8]Black,P.J.,&Wiliam,D.Developing the Theory of Formative Assessment[J].Educational Assessment,Evaluation,andAccountability,2009(1):5~31.

[9]Broadfoot,P.,&Black,P.Redefining Assessment?TheFirstTenYearsofAssessmentinEducation[J].Assessment inEducation:Principles,PolicyandPractice,2004(1):7~26.

[10]Earl,L.M.Assessment as Learning:Using Classroom AssessmenttoMaximizeStudentLearning[M].ThousandOaks,California:CorwinPress,2003.

[11]Gipps,C.V.Beyond Testing:Towards a Theory of E-ducationalAssessment[M].London:FalmerPress,1994.

[12]Huhta,A.Diagnostic and Formative Assessment[C]//Spolsky,B.,&Hult,F.M.(Eds.)The Handbook of Educational Linguistics.Malden,MA:Blackwell Publishing Ltd,2008.235~246.

[13]Kuhn,T.S.The Structure of Scientific Revolutions(2nded.)[M].Chicago:UniversityofChicagoPress,1970.

[14]Jacobs,G.M.,&Farrell,T.S.Paradigm Shift:UnderStanding and Implementing Change in Second Language Education[J].TESL-EJ,2001(1).

[15]Mabry,L.Portfolios Plus:A Critical Guide to AlternativeAssessment[M].California:CorwinPress,Inc.1999.

[16]Pryor,J.,&Crossouard,B.A Socio-cultural TheorizationofFormativeAssessment[J].OxfordReviewofEducation,2008(1):1~20.

[17]Rea-Dickins,P..Mirror,Mirror on The Wall:IdentifyingProcessesofClassroomAssessment[J].LanguageTesting,2001(4):429~462.

[18]Shepard,L.A.The Role of Assessment in a Learning Culture[J].EducationalResearcher,2000(7):4~14.

[19]Shepard,L.A.Classroom assessment[C]//R.Brennan(ed.).Educational Measurement(4th ed.).Westport,CT:Praeger,2006.624~646.

[20]Stiggins,R.J.Assessment Crisis:The Absence of Assessment for Learning[J].Phi Delta Lappan,2002(10):758~765.

[21]Stiggins,R.J.Student-involved Assessment for Learning[M].UpperSaddleRiver,NJ:PrenticeHall,2005.

[22]胡森·托尔斯顿(Husén,Torsten).平等——学校和社会政策的目标[M].张人杰(译).上海:华东师范大学出版社,1989.

猜你喜欢

实证主义范式框架
包容性法律实证主义、法律解释和价值判断
框架
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
分析实证主义、法律现实主义和法律方法的未来
广义框架的不相交性
孙惠芬乡土写作批评的六个范式
管窥西方“诗辩”发展史的四次范式转换
WTO框架下
可废止性与法律实证主义