教育评价理论发展视角下的高考评价改革审视
2018-04-03李雄鹰张瑞宁
李雄鹰,张瑞宁
在国家提出“分类考试、综合评价、多元录取”的高考改革导向之后,高考评价便成为高考改革的新趋势与新内容。高考评价既是一个实践问题,也是教育考试研究中的理论问题。改革要推行,理论需同行。对高考这项高竞争、高利害、高风险、大规模的考试进行改革,必然会受到各方面的广泛关注,产生重大影响。因而在积极部署、大胆实践的同时,还需从理论视角深化认识,加强对基本问题的思考。本文从教育评价理论发展的视角分析当前我国高考评价改革的现状与缺失,以期为改革的顺利进行和化解改革难题提供借鉴思路。
一、教育评价理论发展与述评
回顾教育评价理论的发展,多将其划分为四个时期,即“测量时期”“描述时期”“判断时期”和强调“心理建构”的时期。
(一)测量时期
测量时期(19世纪末至20世纪30年代)的教育评价以“测量”理论的形成以及测验技术广泛运用为标志,教育评价被等同于“测量”,以测量为手段了解学生知识掌握及相关情况,追求评价的客观化。流行于这一时期的科学管理运动影响了学校教育及教育评价,学校被视为工厂,教师被视为产品加工者,学生被视为学校教育的产品。“凡是存在的东西都有数量”“凡是有数量的东西都是可以测量的”[1]14,认为教师教的如何、学生学得如何以及学校教育成功与否都是可以测量的。这一时期的教育测验,内容上由单科向综合发展,范围上由小学向其他学校延伸,教育测量的客观化、标准化得到加强,[2]27从工具制作、测量对象选择、测量实施以及分数解释都有一套规范的程序要求。但由于测量等同于评价,因而,这一时期的教育评价内容多以认知类、记忆性知识为主,而对于非认知类的兴趣、动机等方面的评价受限。
(二)描述时期
描述时期(20世纪30-50年代)的教育评价以泰勒(R.W.Tyler)提出的以教育目标为核心的教育评价原理即泰勒原理为标志。泰勒指出:“教育评价的历程在本质上是一种测定教育目标在课程和教学方案中究竟被实现多少的历程”。[3]119教育评价分为八个步骤,即拟定教育目的和目标,把目的和目标进行分类,将目的、目标转换为适合课程实施的形式,塑造可以使具体目标达成的情景,选择和编制客观性、可靠度、有效性较高的测验,收集学生行为表现的资料,把学生的行为表现与既定目标进行比较,根据评价结果修改教育方案。泰勒的教育评价理论具有评价结构严谨、操作性强、评价效率高以及优化了教育评价的功能的优势。但他的教育评价模式是一种看重结果的总结性评价,没能突出对教育过程的关注;过于强调目标化的评价活动,对一些非预期的教育目标无法评价;过于强调客观性评价,对于无法量化的教育目标难以评价。
(三)判断时期
判断时期(20世纪50-70年代)的教育评价强调价值判断,基于对泰勒模式的质疑与超越而形成。这一时期的教育评价研究专家克隆巴赫(L.J.Cronbach)、斯塔弗尔比姆(D.L.Stufflebeam)、斯克里文(M.Scriven)等纷纷发表对教育评价的观点,认为教育评价是指作出关于教育方案的决策,收集和使用信息;评价不应局限于评判者所确定的教育目标预期效果的达到程度,而应收集有关教育方案实施的全过程及其成果资料,评价应为决策提供信息;教学过程中的评价目的是形成适合于教育对象的形成性评价;提出了旨在评价非预期教育目标的目标游离评价模式。[4]1977年,毕比(C.E.Beeby)将评价定义为“系统的收集和解释证据,并以此作为评价过程的一部分,进而以行动为取向进行价值判断”[5]613。这一阶段的教育评价的特点是将评价视为价值判断的过程,提出了评价为决策服务的思想,重视过程评价,关照到教育过程中的变化。但这一时期的教育评价将评价对象及相关人员排除在外,评价主体不够多元。过于强调科学实证主义方法,忽视了其他方法的应用,形成了严格、固定的评价程序,缺乏必要的灵活性与弹性,评价方案的适应性较弱。[6]35-36
(四)建构时期
建构时期(20世纪70年代以后)的教育评价强调评价是一种“心理建构”过程,被称为第四代评价理论。20世纪70年代初,前三代教育评价受到猛烈攻击,认为传统教育评价中心理实验或心理测验占绝对优势,但这类方法应用范围狭窄,已无法解决教育评价中的复杂问题。[7]60-61建构时期的教育评价强调评价的多元化,评价应根据情景而定,应打破量化评价一统天下的局面,让质的方法占有一席之地。该时期教育评价的两种基本方法是回应性聚焦法和建构性探究法。但是,建构时期的教育评价也存在一些不足。一是强调知识和认识的相对性,看轻客观性和绝对性,使评价容易陷入相对主义和主观唯心主义的认识论误区;[8]二是建构时期的教育评价方法和流程复杂,对评价者和评价对象有较高要求,实践中的阻力较大;三是建构时期教育评价既强调价值多元,又重申达成共识,使所获评价信息资料的整合以及得出评价结论都陷入两难。
纵观教育评价的四个发展阶段可以看出,评价的目的从以决策为中心向以人为中心转变。评价的功能从依凭测量来增选适合教育的学生发展到评价教育活动是否达到教育目标,再发展到通过评价优化教育决策,提高教育质量,促进学生发展。教育评价的方法从单一的教育测量到全面收集信息、定量与定性方法相结合,从静态的终结性评价到动态的形成性评价。评价内容则从以课程内容为中心发展到关注学生全面发展的综合评价。评价主体由单一向多元演变,学生逐渐成为不容忽视的评价主体。
二、教育评价理论发展视角下的高考评价改革现状与反思
(一)我国高考评价改革的现状
进入新世纪以来,基于人才发展的个性化差异,满足高校对多样化人才的选拔需求,观照不同地域教育发展不均衡、促进教育公平的社会诉求,在统一高考制度框架下,高考评价改革的多元化趋势日益明朗。随着基础教育新课改的深入实施,以文化科目为主要指标的高考评价体系的局限性日渐显露,如何多元、综合、个性化地考查考生的素质与能力拷问着现行的评价体系。
1.高中学业水平考试与高考评价改革
2004年高中新课改推行后,高中学业水平考试逐步取代会考,成为衡量学生高中学业的水平性考试,率先进入新课改的广东、山东、海南、宁夏同时宣布实行高中学业水平考试。一些国家重点建设的高水平大学开始探索自主选拔录取改革,在选拔综合素质高、有创新精神和潜质的人才方面,试行高考、高中学业水平考试和综合素质评价与学校测试相结合的多元化评价选拔办法。2014年《教育部关于普通高中学业水平考试的实施意见》对学业水平考试科目、内容、对象、时间、成绩呈现和组织保障均做了详细规定。[9]由此,高中学业水平考试与高考被捆绑在一起,成为高考成绩、高中学业水平考试和综合素质评价“三位一体”的高考评价体系的组成部分。
实践中,各省市区新课改后的高考方案都以“分类考试、综合评价、多元录取”为纲领,构建新的高考评价体系,其中不乏学业水平考试的影子。2017年上海市启动高考综合改革,将高中学业水平考试分合格性考试和等级性考试科目,规定在合格性考试的基础上将等级性考试的成绩纳入高考总分。浙江省则继续将考生的高中学业水平考试成绩同统一高考成绩和综合素质评价结果合成综合成绩作为通过“三位一体”途径入学考生的选拔依据。
2.高中综合素质评价与高考评价改革
配合新课改的推行,实施高中新课改的广东、山东、海南和宁夏推出高中新课程一揽子方案,其中就包括综合素质评价。随后进入新课改的省市区也都积极探索建立了符合本地实际的综合素质评价制度。2008年,教育部在《关于普通高中新课程省份深化高校招生考试改革的指导意见》中首次对综合素质评价进行清晰定位,明确提出将其与高考评价相结合。2010年,《国家中长期教育改革和发展规划纲要(2010-2020年)》要求“全面实施高中学业水平考试和综合素质评价”,“改革教育质量评价和人才评价制度。做好学生成长记录,完善综合组织评价”,“普通高等学校本科招生以统一入学考试为基本方式,结合学业水平考试和综合素质评价”。
实践中,进入新课改的省市区相继出台新的高考实施方案和高中学生综合素质评价实施方案,并将综合素质评价纳入高考评价,作为高校评价选拔新生的参考。由于综合素质评价多以描述性、定性方式呈现结果,因而不量化、不计入高考总分,其与高考的关系多为“软挂钩”。[10]从综合素质评价与高考评价体系关系的视角,受“分类考试、综合评价、多元录取”的改革导向驱动,北京、浙江、云南、广东、江苏等省市区都提出了“统一考试+高中学业水平考试+综合素质评价”三位一体的新的高考评价体系,综合素质评价在高考评价中的角色与功能是提供参照、作为评价选拔的依据。
(二)我国高考评价改革的缺失
1.高考评价实践远远落后于理论发展
回顾历史,教育评价作为现代教育活动中的重要手段,在早期发展阶段曾经历了“测量=评价”的时期,二者混为一起,功能尚且没有分化。随后,测量与评价进入分化发展阶段,各成体系。测量与评价的不同之处在于测量是反映学生水平的一种方式,所收集的信息有限,评价则通过包括测量在内的多种途径收集信息,能够对学生进行全方位的了解与评价。反观目前的高考评价,仍有明显的“测量=评价”时期的烙印,以考查记忆性、客观性内容为主,评价方法单一,以分数为唯一取舍依据。由此可见,教育的评价理论已经从最早的“测量=评价”,测、评功能不分的初始阶段发展到测量与评价各自成为独立的教育活动、发展出丰富的理论方法体系的今天,高考评价却依然以最早的评价理论为根基,停留于测评不分的水平。由此可见,高考评价实践远远落后于理论发展,最新理论成果在高考改革中的应用十分欠缺。这一事实与测评理论的发展优化不相符合,与高考利益相关方对高考评价的改革期待相差甚远。
2.对高考评价理论的应用脱离我国教育实际
布卢姆(Bloom)的认知目标理论是我国教育目标、考试目标划分的主要理论依据之一,一段时间内我国高考评价目标体系建构完全照搬该理论。这其中的问题是,布卢姆的理论是从一般意义上的教育目标划分,而我国长期具有按照学科划分教育目标的传统。曾经所有学科都是照搬识记、领会、应用、分析、综合、评价六个层级的目标,没有体现出学科目标特点。这一问题同样存在于高考评价目标的划分上。高考也是按照科目考查学生能力,理论上理想的高考评价目标应是先有国家目标,将国家目标分解到科目目标、内容模块目标、题目目标。其中,不同科目、不同知识内容模块、具体到不同题目分别承担不同的考查目标。所有考查目标关系清晰、层次分明、职责明确,共同支撑总体考查目标。
但目前的高考评价目标较为混乱,一是没有处理好高考评价目标与高中课程目标的关系,高考评价目标与高中课程目标的关系不够明确。如新课改后高考语文的考查目标是识记、理解、分析综合、鉴赏评价、表达应用、探究六个层级,高中新课改后语文课程目标是积累整合、感受鉴赏、思考领悟、应用拓展、发现创新五个层级,二者之间有部分重叠,也有不同之处,关系若隐若现,不够明确。二是没有处理好高考不同科目目标间的关系。基于高考以总分选拔人才的现实,高考不同科目承担不同考查任务,不同科目的考查目标应该是对总体考查目标的分解细化。但就目前实际来看,各个科目的考查目标各自为阵,以学科知识体系及特点为出发点设置考查目标,各个科目之间的目标互不关联,没有形成合力。以文科考试科目为例,考查目标的表述体例不一,详略不一,能力划分标准不一。没有形成逻辑清晰、分工合理、表述清晰的浑然一体、易于操作的高考评价目标体系。缺乏合力作用,不利于高考全面、综合地评价学生。
三、教育评价理论对我国高考评价改革的启示与应用
(一)推动高考评价实现由“考”向“评”的转变
审视教育评价理论的发展,最新理论成果已不满足于对学生记忆性、客观性知识的了解,不单纯以数量化方式反映学生的水平,而是希望深入其内部认知过程,揭示学生应答题目时的知识运用、思维方式、逻辑推理、概念关系等认知过程,通过此方式深层反映学生所掌握的知识、具备的能力和潜力。由考试向评价的转变,其实质是要改变以考试为唯一评价学生的手段,改变考试所反映的学生信息有限的状况,引进更多评价方式,多途径、全方位地考查学生。目前,高考评价距离这一理想图景尚远。但在由考转评的改革呼声下,高考的研究者和实践者已向这一目标进发。其一,是将高考改革写进规划纲要,提出了“分类考试、综合评价、多元录取”的改革导向,重视发挥高考的评价功能。其二,高考的相关研究开始增多。成立了国家层面的考试指导委员会,研究、指导高考改革。教育评价的理论研究受到重视,大量介绍引进西方评价理论及最新成果。并努力将其中国化,为教育评价理论研究开阔了视野,奠定了基础。教育评价理论的研究也逐步受到关注,系统的研究逐步出现。其三,在新的教育评价指导下的高考综合改革实践不断涌现。各省市区研究新的高校招生录取机制,将国考三科和省考三科进行组合,贴合学生的兴趣特长和未来的职业走向。[11]同时自主招生考试评价改革和三位一体综合评价改革亦日趋成熟。
(二)完善高考评价目标体系的建构
高考评价目标对高考实践发挥指导、规范、准则的作用,是高考评价体系建立、考试内容与形式选择、高考命题以及分数解释应用的前提基础。高考标准化改革之前,高考评价基本处于经验的、传统的、封闭的状态,考试内容与形式选择、高考命题等以高中课本及教学内容为依据,考试评价目标以选拔“德智体全面发展”的人才为主要内容,教育评价理论在高考评价中几乎没有体现,尚未形成体系化的高考评价目标体系。[12]366随着国外的教育评价理论被大量翻译介绍进来,国内学者一边研究理论,一边试图应用于指导考试实践。尤以布卢姆教育目标分类理论为主要依据,研究并实践建立高考考试目标体系。通过几年的实验,人们日益认识到考试目标体系的重要性,认为考试目标体系应从人的全面发展的总体要求出发,兼顾德智体美各方面以及知情意各个领域,注重学科本身特点,详细编制每个学科的考试目标。[12]3691990年后,教育部根据布卢姆教育目标分类理论的认知领域,基于高中教学大纲目标与内容,开始编制每个学科的考试说明,并将考试目标写进其中,改变了过去“以纲为纲,以本为本”的局面,使考生和命题者有了明确的复习目标和命题准则,提高了命题的科学性、试题难易度的稳定性。[13]298-2992001年启动的新课改中,布卢姆教育目标分类理论依然是高中课程目标和高考评价目标的理论依据,高中课程目标和高考评价目标的建立都参照了教育目标分类理论。
自从20世纪80年代高考评价目标开始受到关注,布卢姆教育目标分类学理论一直是指导高考评价目标建立的理论基础。目前,已经形成了从国家目标到学科目标的高考评价目标体系。虽然该目标体系问题重重,但其对完善我国高考评价目标体系建构所起的作用不容小觑。
(三)能力立意,科学命题实现质的飞跃
在“实现从考试到评价的跃升”的改革背景下,为了较好地体现高中新课改的反拨作用,实现为高等学校选拔优秀人才的考试目标,高考命题不断深化考试内容和形式改革,从实践中总结命题规律,能力立意的命题呼声日渐高涨。[14]作为对考试质量具有决定性意义的高考命题面临种种改革压力。2017年,包括福建、四川、广东在内的八个省市不再自主命题,所有科目由教育部统一命题,全国只有北京、天津、上海、浙江、江苏五省市仍采取自主命题,其余省市全部采用全国统一命题。即便省市自主命题范围逐渐缩小,但绝不会消失,其命题思路将延续下来,继续发挥优势。
新课改强调高考命题要以能力立意,科学命题。实现以能力立意的命题思路,体现新课程的理念和要求,促进“知识与技能、过程与方法、情感态度与价值观”三维培养目标的实现,则需注重考查考生独立思考、分析问题和解决问题的能力,重视对知识的综合应用能力和知识迁移能力的考查,重视对实践能力和探究能力的考查。命题素材应力求贴近社会发展实际,贴近生活,创设具有鲜明时代特征的试题情境,从而引导学生关注社会、经济、科技和文化的发展。要实现以上命题目标,从命题技术角度,需依靠先进的计算机信息技术,进行题库建设与完善,并利用教育测量技术,检测试题的信度、效度、难度和区分度,以实现选题严谨、内容完整、结构合理、评分科学的标准化试题。而教育评价理论中测试理论的发展为命题的科学性提供了较好的理论支撑。