命制科学有效的试卷助力学校、教师实现分层分类教学
2020-03-23谷云菲
摘 要:随着教育水平的发展以及国家对教育的重视,考试与评价也逐渐在教育领域发挥着越来越重要的作用,考试不再是简单地给分数、排名次,而是为甄别、诊断学生的能力提供可靠有效的数据,并以可靠的数据为决策依据,进而实现因材施教和因人施教,真正促进学生多元、个性、全面综合发展,帮助学生在学科学习、基础成长中选择适合自己的学习成长方式方法。
关键词:因材施教;考试;评价;科学命题;课程标准
考试是教师检验学生学习效果的最直接最有效的工具。近些年随着国家对教育的重视,考试与评价应运而生并得到飞快的发展。有了考试与评价的改革,考试不再是简单的给分数、排名次,而是真正能够以可靠的数据为决策依据,实现因材施教和因人施教,真正促进学生多元、个性、全面综合发展。如何更有效地利用考试?一份科学合理能够达成预定目的的试卷必不可少。
那么如何科学命题?从而达到帮助学生在学科学习,基础成长的过程中找到适合自己的学习成长方法,真正地实现“量身定制,因材施教”?
首先,命制一份科学有效的试卷需要有相关原则性的约束:严格按照《课程标准》来确定考试的知识范畴,其次严格按照考试的目的要求来确定考试内容和考察重点,同时要确保试题的信度,效度,难度,区分度都在符合要求的区间内。那么如何把《课程标准》的要求在一份试卷中变成可以度量的可测标准?如何保证试卷的信效度,难度和区分度都在既定的考试要求范围内?
以下以某学校五年级的英语试题实例对以上几个问题进行分析论证。
一、 试卷的效度论证
(一)试卷的知识结构效度论证
根据最新版《小学英语课程标》(以下简称《课程标准》)可以将小学生英语学科教学内容归纳出以下几个关键词:“语音”“词汇”“语法”“功能”“话题”。由于《课程标准》对知识内容的划分比较概括,无法实现精细分析,我们可以借助语言学相关理论,按照语言构成要素,对《课程标准》中“语音”“词汇”“语法”“功能”“话题”进行细分界定。同时结合语言构成要素可以把小学阶段英语知识细分为以下知识指标:语音(读)、语音(听)词汇、词法、句法、句子、对话、文章。细分后根据考试目的在施测试卷中分别命制各个知识指标的试题,制定出更精细化的评分标准,细分到每一个语音,词汇或者句法等指标的考查点多少分的形式。根据新的评分结果可以清楚地了解学生在哪些考查点有优势,以及在哪些考查点有劣势。这样的考查结果,可以更进一步对学生进行分析诊断。因为取得同样分数的两个学生不一定在每个细分后的知识指标得分一致。在获得客观反映学生学习状况及其问题或困难的诊断结果后,可以帮助学生认识自身学习状况及其问题或困难成因;教师或者学校就可以对学生进行有针对性的指导,促进学生进步,指导教师教学;学校可以了解学情,也可以为分层分类教学提供有效帮助。
根据《课程标准》,本试卷的知识指标主要包括语音(读)、词汇、词法、句法、句子、对话、文章,各知识指标所占题量和分值比重见图1、图2。
考查词法、文章的题目无论是题量还是分值,在整份试卷中所占比重都很大,学生的成绩受词法、文章模块上的表现影响较大。
《课程标准》中对于小学生“语言知识”部分的要求是基础教育阶段学生应该学习和掌握的英语语言基础知识包括语音、词汇、语法、功能和话题等五方面的内容。其中小学毕业时学生要达到二级水平。其中“功能”是指了解问候、告别、感谢、致歉、介绍、请求等交际功能的基本表达形式。“话题”是指能理解和表达有关相关话题的简单信息。试卷中并未涉及“話题”的有关“表达”的知识考查项,说明试卷的知识结构效度是有缺失的。
(二)试卷的能力结构效度论证
20世纪50年代布鲁姆的教育目标认知领域的分类公布之后,该理论在世界范围内引起了巨大的反响。教育研究人员科研人员也竞相对其进行了广泛深刻的论证。布鲁姆的教育目标分类学中认知向度定义为学生在能力层面的可测指标得到了有效论证。因此,我们可以把布鲁姆的教育目标分类学结合课程标准中语言技能中听、说、读、写的有关要求,将学生应掌握的能力转化为可操作的定义,从而确定能力的考查指标。我们可以把能力层级由简到难依次排列:记忆,理解,信息提取,综合概括,推理,应用,分析,评鉴,创造(表达)。
从记忆到信息提取,属于较低的能力水平;从应用到创造,属于较高的能力水平。随后根据考试结果同样可以得到更清晰的数据,也就可以清楚地了解学生在能力指标上哪一个能力考察点有优势或者有劣势,更进一步对其进行分析诊断。
就本份试卷所考查的低级能力指标全部覆盖,且突出对记忆指标的考查。高级能力指标只考查了应用,且分值比明显高于题量比,对“应用”要求较高。如图3、图4所示。
低级能力,主要考查学生基础知识的掌握情况、从文章提取基本信息的能力,是评定学生学业水平的主要技能项。
高级能力是考查个体英语语言能力的重要表现,对初高中的学习至关重要,因而对这些能力指标的考查在一定程度上能够预测个体将来英语学习能力和发展的潜力。
总体而言,本套试卷考查能力层级的分值比重为:低级能力85%,高级能力15%,试卷中低级能力的考查比重明显高于高级技能,高级能力只考察了“应用”,明显有缺失。说明整套试卷能力项指标结构的均衡性较差,结构效度不理想。
二、 试卷的信度论证
试卷的信度是指试卷测试分数所具有的一致性或稳定性的程度,这里的一致性指的是同一测试项目测试结果的一致程度。较高的一致性意味着同一个群体接受同一份试卷测试结果显示强烈的正相关;这里的稳定性指的是在不同时间内,对考生重复测试所得结果的相关程度,如果一群学生在不同时间接受同样的试卷测试时,测试结果差异很小说明试卷具有较高的稳定性。
考试前试题信度的计算,考虑操作复杂性与可行性,一线教师出题一般可以选择更容易操作的办法,也就是试卷稳定性高,那么它内部考查同一知识层面或者能力层面的题目得分前后应该高度相关,因而保证较高信度的前提就是每一考查的知识层面或者能力层面都有充足的测试题目。经过多次实际操作,考前命制试题参考内部一致性信度这一概念是容易操作且可行的,本套试卷试题都达到较好的信度要求。
三、 试卷的难度论证
试题的难度需要根据考试目的或者评价的目的来具体确定,试卷的难度界定是通过学生该题上的正确比例来进行,是属于统计方法界定。而这需要在考试结束后确定,如何在考试之前确定试卷的难易程度,我们可以粗略地根据细分后的知识指标对试题进行解析:其中语音的分值比和题量比占5%左右;语法部分,也就是句法和词法占据40%左右;词汇占15%左右;“功能”即试题分析中的“对话”占15%左右,试题分析中的“句子”涉及句意的理解以及句子结构的分析,属于较难的知识指标,在试卷中只占了5%左右;試题分析中的“文章”占20%左右,而文章也是以词汇和语法为基础的。以上说明试卷以考查基础知识为主,因此可以得出本套试卷难度设置中等偏简单,在难度预设上符合形成性评价的要求,基础知识掌握牢固的学生得高分的可能性较大。
四、 试卷的区分度论证
考前要保证较好的区分度,可以根据布鲁姆的教育目标分类学进行预测,实测有效。布鲁姆的教育目标分类学中认知历史向度是由简到难排列的。根据认知历史向度水平从低到高的排列,两端各取两个指标,作为极难(应用、信息提取)和极易题目(知识、理解)的代表。结果显示极难、极易题目分值比重分别为64%、36%,极难题目所占比值较小,极易题目所占比值大。结合上面知识比重、效度和难度的分析结果,可以推测这份试题对中间段学生和低水平学生的区分度较好,对高水平学生的区分度较差。
综上所述,命制科学试卷首先要在《课程标准》的规范下命题,确保各知识指标都能考查到。其次要保证试卷的信效度难度区分度在考试要求的范围内,根据考试或者评价要求不同对试题的信效度、难度、区分度进行可控的微调。对考试结果数据进行分析,为教师教学提供依据,为学校管理提供依据。最终实现因材施教和因人施教,真正促进学生多元、个性、全面综合发展,帮助学生在学科学习、基础成长中选择适合自己的学习成长方式方法,最终达到教师有效教学,学校有效管理的良性循环。
参考文献:
[1]黄涛.新版布鲁姆教育目标分类对外语教学与测试改革的启示[J].西华师范大学学报,2009.
[2]洛林·W·安德森.分类学视野下的学与教及其测评/布卢姆教育目标分类学修订版(完整版)[M].北京:外语教学与研究出版社,2009.
[3]刘宝权,席仲恩.SPSS在英语试卷统计分析中的应用[J].外语电化教学,2004.
[4]宋小平,张敏.SPSS在医学生物试卷的信度和效度分析中的应用[J].生物学通报,2008.
[5]义务教育英语课程标准[M].北京师范大学出版社,2011.
作者简介:谷云菲,江苏省苏州市,西交利物浦大学附属学校。