APP下载

对改进评价方法的思考

2015-12-22姚春艳张勇

湖北教育 2015年35期
关键词:档案袋测试指标

●姚春艳 张勇

对改进评价方法的思考

●姚春艳 张勇

改进评价方法是2013年《教育部关于推进中小学教育质量综合评价改革的意见》中提出的要求。文件明确提出中小学教育质量综合评价改革的评价方法应以测试和问卷调查等方法为主,辅以必要的现场观察、访谈和资料查阅;其中测试和问卷调查是较为常见的定量评价方法;现场观察、访谈和资料查阅则属于定性的评价方法。中小学教育质量综合评价的内容包括5大方面20项关键指标,每一项指标应采用何种评价方法更为恰当,能获得有效的信息或数据,一方面要基于对各种评价方法特点、功能、分类等情况的正确认识,另一方面要基于对各项指标应评定的内容的理解。此外,还需要认识到,同一指标可以采取多种评价方法,不同方法得出的结论可以相互校验,以获得对被评价对象更为全面的认识。为此,笔者对教育评价中可使用的几种评价方法逐一介绍,并对中小学教育质量综合评价的20项关键指标适用的评价方法进行简要说明,希望能为教育评价改革先行的地区提供一些参考。

考查学业成就的纸笔测试

考查学业成就的纸笔测试根据测试的标准化程度不同,可以分为标准化测试和教师自编测验两种。标准化测试一般是指根据统一、规范的标准,对考试的各个环节包括测试目的、命题、施测、评分、计分、分数解释等按照系统的科学程序组织,从而严格控制误差的考试,试卷的编制通常由专业机构和专业人员承担。教师自编测验是由教师根据具体的教学目标、教材内容和测验目的自己编制的测试题,是为特定的教学服务的。由于学校科目繁多,教学检查需要经常进行。而教师自编测验操作过程容易,应用范围一般限于本班、本年级,施测方便,是学校中最多和教师最常用的测验。

教育质量综合评价实验过程中,因为要实现多所学校之间的比较,一般采用标准化测试。在学校内部评价中,则可以采用教师自编测验。

中小学教育质量综合评价改革中的20项关键指标适合采用纸笔测试的指标有:品德发展水平中与课程有关的、需要识记的部分;学业发展水平中的知识技能、学科思想方法指标;身心发展水平中的健康生活方式和审美修养中的认知部分。

问卷调查法

问卷调查法是一种将要调查的内容以问题的形式提出,设计成问卷,然后让调查对象来回答,借此来收集所需信息的方法。

有两类不同性质的问卷:一种是由一些测量独立的变量的问题组成的问卷,这类问卷仅用于了解调查对象在某些方面的教育心理状况,有时可作为编制严格量表的前期工作和基础。这类调查通常设计一些以多项选择为主的问卷,调查结果的分析以描述统计分析为主,如某答案选择的频次、百分比等。

另一种是具有内在逻辑结构,用于测量某些心理特质的量表,这类问卷需要严格检验问卷的信度、效度;调查结果分析除了描述统计分析之外,还使用推理统计分析的方法,如差异检验、回归分析等。由于量表式的问卷的编制对专业性要求较高,在中小学教育质量综合评价改革实验中,可以选择一些经过实证验证的成熟量表。

20项关键指标中,适合采用非量表式问卷调查的指标有:品德发展水平中各项指标中的部分行为表现;学业发展水平中的实践能力;健康生活方式中的人际沟通、兴趣特长养成中的爱好特长以及课业负担中的学习时间、课业质量、课业难度、学习压力。宜采用量表式问卷调查的指标有:人格品质、创新意识、情绪行为调控、好奇心和求知欲、潜能发展等。

行为观察法

指在自然情境或专门设计的情景中对学生的特定行为进行观察的方法。行为观察法有以下特点:可提供学生人际行为和学习风格的信息;可提供学生行为与其他人行为的系统记录,这些记录可用于评价、干预计划以及监测干预实施后的变化;观察所提供的信息不受学生能力或报告信息意愿的影响。

行为观察法的操作流程包括:定义要观察的行为,如观察学生考试是否作弊,作为评价学生诚实的一个方面;确定观察时间和频次,假设要观察学生考试是否作弊,则需要确定一学期观察几次,以及在哪些考试中进行观察等;实施观察,记录观察结果。

在记录观察结果时,可以采用行为记录表的方式。行为记录表设计样式如下:

表1:品德发展水平评价指标行为观察记录表(示例)

通过将不同频次转换为分数,即可得到学生在某一行为表现的量化分数。以上表为例,如果将条目1、2、3、5的分数转换规则定义为A=1,B=2,C=3,将条目4的分数转换规则定义为A=3,B=2,C=1,则该生在遵纪守法方面获得的分数为12分。

行为观察法的缺陷是,教师对学生行为的观察可能会受到教师对学生的偏见以及观察时间取样限制而产生观察偏差。为避免行为观察可能产生的不公平,行为观察结果应与学生或家长确认,对于有争议的项目,双方需要协商确定。唯有学生或家长确认后的行为观察结果才能计入学生档案中。这种协商的过程也恰恰是“第四代评价”所倡导的,评价结果应该是各方协商的结果。

20项关键指标中适合采用行为观察的指标有:品德发展水平中的部分行为;实践能力、创新意识、健康生活方式、情绪行为调控、人际沟通、好奇心求知欲、爱好特长。

表现评定法

1.概述。表现评定法是对学生实际的表现进行直接的、系统的观察,并根据预先设定的表现标准对其表现进行评分的方法。在这种方法中,一般要求学生执行一个复杂的表现性任务或者创作一个作品。这种方法既可以用于个体评价也可用于小组评价。所设定的任务通常是与考察高级思维技能的真实生活有关的任务。表现评定法的难点主要有三个:一是表现评定标准的制定,包括在一项任务中,应从哪些方面进行观察,如何定义不同的表现水平,如何对不同的表现水平赋予分值等问题;二是任务的设定,包括希望通过这项任务考察学生哪些思维技能或者动手能力或者创造能力,为了要考察这几个方面,哪些任务是最恰当、最合适的问题;三是评分者的专业性,即评分者必须熟悉评分标准的含义及其指向,并能够根据评分标准选取恰当的行为进行观察,同时也能对不同的水平作出恰当的判断,并给予相应的分数。

由于表现性评定法会受到评分者主观因素的影响,为了使结果更为公平,通常会采用2-3人同时评分,取平均分的方式来处理。

以下为英语作文表现性评定标准的示例。须选择和判断放入档案袋中的内容;设定学习目标;监控学习进程。在目标的指引下,学生可以反思他们自己的进步和作品的质量。学生可以在自己的水平上进行工作,展示自己的学习风格和表达方式。

表2:表现性评定标准(示例)——英语作文

档案袋作为学生综合素质能力展现的一种重要手段,是对传统的纸笔测试的重要补充。科学、有效的档案袋评价,需要根据评价的目的精心设计档案袋内容,需要有科学的评分标准和评分量表,需要对评价结果加以解释并对应用做出指导,同时还需要对评分者进行培训,规范评分过程以保证评分信度。

20项关键指标中除了学业负担的各项指标不宜采用档案袋评价方法之外,其他四个方面的各项指标都可以采用档案袋方式来获得其他评价方法所不易获得的学生的信息。

较多的低频词,且低频词的使用恰当。低频词的使用较少,且部分低频词的使用不恰当。所使用的单词基本上都是高频词,或者是低频词的使用不恰当。正确使用过渡词或过渡句,主题突出,有主题句可以统摄全篇,每段具有中心句,段落之间紧凑,结构清晰,读者能很容易把握结构。段落之间衔接合理,有些段落与中心无关,使得逻辑主线的清晰度稍差,读者尚能理解文章结构。段落之间衔接不合理,东拼西凑,使得文章结构混乱。遵循文章的特定文体格式,能根据写作目的和特定的读者,恰当地选用语域。基本能够遵循文章的特定文体格式,能根据写作目的和特定的读者,较为恰当地选用语域。文章的格式不正确,或不能根据写作的目的和特定的读者选用语域。没有拼写错误和标点错误。拼写错误(遗漏或者多填字母,或者创造不存在的新词)和标点错误(出现汉语标点)较少。拼写错误(遗漏或者多填字母,或者创造不存在的新词)和标点错误(出现汉语标点)很多。字数达到写作要求的字数。字数少于写作要求的字数。距离规定字数相差很多。词汇结构格式拼写与标点字数1 2 3 1 2 3 1 2 3 1 2 3 1 2 3

20项关键指标中适合采用表现评定法的指标有:实践能力、创新意识、审美修养。

2.档案袋评价。档案袋评价又称为“学习档案评价”或“学生成长记录袋评价”,是表现性评价的一种重要形式。档案袋是指学生在教师的指导下搜集起来的,可以反映学生的努力情况、进步情况、学习成就等一系列学习作品的汇集。它展示了学生某一时间段内、某一领域内的综合发展情况。

档案袋评价在西方国家得到较为普遍的应用,主要是因为其具有以下一些特点:①全面深入地展示学生的多种才能。没有压力和时间限制的情况下,学生可以利用各种资源和参考资料,与他人合作完成高质量的工作,从而展示学生多方面的才能,这些才能是单纯的纸笔测试无法检测到的,如口头表达能力、实验操作能力、创新性等。②促进学生主动学习与自我反思。学生必

本次评价改革提出了改变评价方法的要求,然而,需要我们注意的一个问题是:评价方法的转变,不仅仅只是在评价中引入定性评价方法而已,更为重要的也是最为困难的问题在于,如何将由定性评价方法获得的结果以量化的形式呈现,使得定性评价的结果也可以参与学校教育质量综合评价的计算,如此才能确保对学校的评价不是以单纯的升学率或者是学业成绩为主要依据。因此,定性评价结果的量化呈现,应成为改变评价方法研究中的一个重点。

作者

姚春艳公众教育研究院副院长,公众考试研究院执行院长;

张勇中国教育学会中小学教育质量综合评价改革实验区办公室副主任,公众教育研究院、公众考试研究院院长。

(责任编辑曾宪波)

猜你喜欢

档案袋测试指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
国内档案袋评价方式的相关研究概述
幽默大测试
“摄问”测试
“摄问”测试
“摄问”测试
最新引用指标
莫让指标改变初衷
教学档案袋在美国教师教育计划中的应用探究
电子档案袋评价技术与高中信息技术教学