APP下载

中学英语测试有效性之我见

2017-10-21李飞

学校教育研究 2017年27期
关键词:测试有效性语言

李飞

摘要:本篇论文的主题是探讨英语测试的有效性,主要采用研究综述的研究方法。理论部分主要分为语言测试的定义及其意义,对于有效性的定义,语言测试的形式等,论文的后半部分以高考卷为例,分析其题型的有效性。

关键词:语言;测试;有效性

引言:测试是学生和老师在英语的学习和教学中必不可少的一环,测试能让学生对于本单元或者本学期学习情况有一个清楚的掌握,同时对于教师的教学有指导意义,以利于下一学习阶段学生改进学法,教师完善教法。因此,对于测试的研究是我们教学工作者所不可缺少的。国内外学者在语言测试评价体系的研究方面,主要认为信度,效度,和实用性这三者可用于测试评价的标准。而陈佑林教授在教育部人文科学重点研究项目“语言测试的评价标准研究”中提出:语言测试的评价标准应由,思想性,可靠性,有效性,公平性,规范性,实用性,后效性等七个一级指标构成。(语言测试的评价标准研究,陈佑林1)本文重點研究语言测试中的有效性。

一、相关理论的研究综述

(一)测试

根据教育测量学,测试是一种特殊测量技术,以获取量化的信息为目的,该信息反应应试者所掌握的某一方面的知识或能力的程度。(现代语言测试模型---王振中2)。典型的测试由一套问题构成,每一个问题都有一个正确答案。在中学教育阶段,测试一般是书面作答。对于测试问题答案的正确性来说,一套测试问卷一般有相应的参考答案作为该次测试的评价标准。但现今国内的英语测试体系还存在很多不足,这一点将在后文阐述。

测试主要可以分为,学业测试、进展测试、水平测试、学能测试、诊断测试和分级测试。(现代语言测试模型---王振中,3-6)

学业测试主要是考察学习者掌握教学大纲规定学习内容的情况。学业测试通常在一门课程结束的时候实施。

进展测试和学业测试类似,可以在一门课程的不同阶段或结束时实施。水平测试考察学习者掌握学科知识的水平,不以教学大纲,课程计划或教材为命题依据。

学能测试用来考察应试者学习某一学科的潜能。例如:J. Carroll 和 S. Sapon 所设计的MLAT(Modern Language Aptitude Test ) 以及 Pimsleur 设计的PLAB( Pimsleur Language Aptitude Battery ) 都是著名的语言学能测试。其中MLAT适用于成人,即高年级学生。而PLAB适用于中学阶段的学生。

诊断测试其目的在于确定学习者尚未完全掌握或掌握得不完全的知识,以便于学习者自身查漏补缺,也有利于教师采取措施补救。学业测试和进展测试都可用于诊断目的。

分级测试考察应试者的运用知识的水平,并以此为依据划分等级。例如,分班考试,大学公共英语四六级考试等等。

(二)测试的有效性

陈佑林教授(2015)指出有效性即指想要检测的事物与实际检测到的事物之间的吻合程度。这两者有赖于测试题目的主题,难度,学生的配合度等,如果测试者想要测试学生语音的准确度,而给出的单词又超出了学生的能力范围,这个测试自然是失败的,测试的结果并不能反映出学生的语音。再者,如果一场考试出现了大量的作弊行为,那么这场考试所实际检测到的事物就缺乏真实性。那么这也是无效的。

下图取自陈佑林教授语言测试评价标准一文中对于有效性标准的总结:

一级指标 二级指标 三级指标 四级指标 五级指标

有效性

检测

目的

的有

效性

内容的有效性

语言能力 语言要素:语音,语法,词汇

语言技能:听力,口语,阅读,写作,翻译

语言交际能力 口语交际能力

书面语交际能力

理论的有效性 语言学习潜能

结果

使用

目的

的有

效性 选拔的有效性

区分的有效性

达标的有效性

预测的有效性

验证的有效性

管理的有效性

而王振中教授(2008)在其《现代语言测试模型》中提到效度研究就是为支持我们根据测试分数做出的推论取得证据的过程。他认为,内容效度效度研究,准则关联效度研究,以及结构效度研究是效度研究的主要形式。其中内容效度与测试的内容有关,准则关联研究与测试的结果和其他测试或者测量评估方法有关,结构效度则与语言本身有关。

Bachman and Palmer(1999)认为有效性应包括信度,构念效度,真实性,相互作用性,返校作用,可行性。

Lenning(1987)认为有效性指的是一种测试或者测试的组成部分的适效性,一种测试有效在某种意义上是说它能测试出预期所要测出的东西。

由上可知,英语测试应结合纵横向,既要考虑语言本身,也要考虑测试的结果和内容以及其他评估的方法。在内容方面,应包括语言能力方面和语言交际方面,它应有适当的难度,能将不同层次,已达标,未达标的学生区分开来。教师还应就测试的内容以及学生的现有状况对测试的结果做出预测,并加以验证以求发现、改进教学中的问题。本文将会采用陈佑林教授的最新成果,利用检测目的的有效性和结果使用目的的有效性对试题加以分析。

一、二、英语测试的内容和试题种类

(一)英语测试的内容

根据国家英语课程标准,英语课程具有工具性和人文性的双重性质。就工具性而言,要求学生要掌握基本的英语语言知识(词汇,语法,语音等)和英语语言技能即听说读写四种,并初步形成利用英语与人交流的能力,进一步促进思维能力的发展。而人文性则对学生的综合人文素养做出了要求,主要包括情感态度,学习策略,文化意识等方面。 教师在日常授课中应注意结合隐形课程和显性课程来培养学生,在测试中也应不仅考虑到基本的语言知识和语言技能,还要包括情感态度,学习策略,和文化意识等方面。

(二)英语试题的种类

到目前为止,国内外专家(例如: Harris,1969; Valette,1977; Heaton,1988; Alderson,1999; 王振中,2008等)都对试题的种类做过专门介绍。主要有以下几种:

1.封闭类试题

:多项选择,正误判断,完形填空等。

2.开放类试题

:完形填空(无选项),简短答案题(多存在于阅读与听力),写作,口语。

3.单独性与综合性试题

:单独性试题指只对一项内容进行测试,例如:词汇测试,听力测试,阅读测试等。综合性试题指融合了听说读写,语法,词汇,语音等因素在内的考察。

二三、英语测验的有效性分析实例分析

以成都市某区高中三年级2014年12月英语月考考卷为例:

主要類型 子类型及数量 主要考察内容

选择题 单选(10) 冠词,主谓关系,时态,词义(2),连词(2),助动词,代词,数词

完形填空(20) 词义,语义,搭配,连词

阅读理解(20) 细节,单词理解,推断,主旨,语义理解

补全对话(5) 语义理解

非选择题 阅读表达(5) 标题,细节题

改错(10) 时态,语态,介词,连词,搭配,主谓

写作 半控制型

(一) (一)检测目的的有效性

检测目的的有效性是指检测目的所要检测事物与实际能检测的事物之间的吻合程度。它包括内容的有效性和理论的有效性。

1. 内容的有效性

内容的有效性是指检测目的所要检测的内容与试卷实际检测的内容是否一致。内容有效性可能涉及到语言能力或者是语言交际能力。语言能力又可分为语言要素与语言技能。语言要素包括语音、语法、词汇。语言技能包括听力、口语、阅读、写作和翻译。语言交际能力包括口语交际能力和书面语交际能力。从语言能力方面来说,该套试卷涉及了语言要素的,语法,词汇等方面以及语言技能的阅读,写作方面。并未涉及口语,翻译,听力,语音四方面的内容。在英语语言学中有一个普及的观点:口语(speaking)先于书写(writing),但目前为止在四川地区中学对英语的测试中,口语这一测试形式少之又少。这就存在一个问题。我们学习英语是为了什么?为什么国家会要求我们的学生学习英语?为什么有的学生英语考试的分数很高,但在日常生活中还是不能流利的用口语使用他们在写作中所使用的句子?从这一方面来说,这套试卷是不太符合检测目的有效性中内容的有效性的。

2. 理论的有效性之语言学习潜能

理论的有效性指的是试卷所体现出的理论与相关的理论研究的成果是否一致。根据Pimsleur 设计的PLAB( Pimsleur Language Aptitude Battery ) ——著名的语言学习潜能测试,PLAB主要考察学生的言语智能(对词语的熟悉程度和分析言语材料的能力),学习动力,听觉能力。该套试卷能测试出学生的言语智能——通过阅读理解等,但不能测试出学生的学习动力,听觉能力。

(二)结果使用目的的有效性

1.选拔的有效性、区分的有效性、达标的有效性

选拔的有效性指的测试结果用来有效地选拔语言能力优秀的学生。那么这就要求测试的内容要有一定的难度,测试结果要有高低之分,这样才会有利于选优。区分的有效性指的是测试的结果能将不同层次的考生区分开。例如,在高考中,如果考生的成绩在某一分数段的人数特别多,而在其他分数段的人数又特别少,这样的结果肯定不利于不同层次的高校选拔人才。达标的有效性指的是测试的结果能将已达标的考生和未达标的考生区分开。

根据上述英语月考高三一班的考卷,采用中小学成绩分析系统软件,将学生月考成绩分为,高,中,低三线。所计算出,年级总人数为159,达到高线(理110分,文115分)人数为23,比例为14%。达到中线人数(理95分,文101分)为86,比例为54%。达到低线人数(理85分,文92分)为114,比例为64%。

总参考人数 分数线 达标人数 达标比例

159 高线 23 14%

中线 86 54%

低线 113 71%

(此图为根据此次月考学科上线统计表人工计算而成)

由上图可见,此次月考能根据测试结果,运用相应软件分析出达到高中低分数线情况,因此该次月考具有选拔有效性、区分的有效性和达标的有效性。

2.预测的有效性

预测的有效性指的是基于测试结果所做预测的准确性。

根据此次月考学科上线统计表,各班主任估计达到低线人数为114,比例为百分之七十二。但实际上低线人数为113,比例为百分之七十一。由此证明,此次测试预测的基本具有有效性。

3.验证的有效性

验证的有效性指的是测试结果用来验证某事的准确性。例如,在语言教学的研究中,我们认为某种新方法的使用能够提高学生的英语口语学习成绩。为了证明这种想法,我们决定做个实验,实验结束后,我们通过测试来检验实验班和对比班学生的口语学习效果。如果我们所用的测试对实验班的学生有利,而对对比班的学生不利,即使测试结果能说明试验班的英语成绩优于对比班的成绩,这样的结果也不能用来验证该方法的效果。因为这样的测试没有验证的有效性。而此次考试并无明确要验证的东西。

4.管理的有效性

管理的有效性指的是测试结果可用来作为教学管理决策的依据。此次测试结果,分析出了学生达到既定分数线的实际人数,其实际分数又与教师所预测的分数有一定的差距,这无疑是对教师的教学和领导层的决策具有指导性的。

(三)对以上实例分析的总结

上述月考卷,覆盖了语言技能中的读和写,听说技能却没有涉及。在16年高考改革后,情况有所缓解,听力又重新被纳入一般的考察范围之内,但在中学阶段,说的方面还是没有一个正式的合理的测试系统,能就同学们的语音和口语进行测评和分析。这样不仅不利于学生语音的标准,也不利于学生发展流利的口语,和使用英语进行口语交际的能力。因此,在我们平时的测试和课堂中,教师应注意对学生听说技能的训练,做到学之有用。

在语言知识方面,涉及了基本的词汇和语法方面,语音,翻译等方面却并无提及,词汇和语法固然重要,很多语言学家也认为词汇是英语学习的基础,但实际上,学好词汇和语法并不等于这个学生有很高的英语水平。

关于学习潜能方面,上述考卷并未能测出学生的学习动力,个人认为学生的学习动力很难被量化,陈佑林教授也没有列出详细的方法来量化这一方面。但我们也应重视学习动力在学生英语学习中的重要性,所以我们的教师应该考虑,怎么去提高学生的学习动力?关于这一点,本人将会在下文做一个粗略的不成熟的阐述。

在结果使用的有效性中,我们可以上述考卷的预测是基本有效的,但是还有一个问题多少的差距是正常值?多少的差距说明此次预测属于无效预测?陈佑林教授并未做出更进一步的阐述。

三四、怎样才能提高英语测试的有效性?

基于陈佑林教授的研究,本人认为提高英语测试的有效性首先,就要从测试内容入手,即选择相应的语言知识和语言技能。但英语语言知识包括的范围太广,教师在出题的时候如何选择须考的知识是一个问题。在编写一本教材的过程里,有一个重要的方面是编写者所必须要注意到的东西,那就是知识点的复现率。知识的复现能加深学习者对于之前所学的印象,以在无形中达到巩固知识的目的。因此,教师在出题时也应注意对之前所学重要知识点的涵盖。这样才能实现课堂,教材,考卷三者的有机结合。

再者,语言技能的方面,听说读写翻译,是语言学习中必不可少的,但由于说这一方面的测试太过于繁杂,高考也并未涉及这一方面的内容,因此被大家所忽略,而翻译对于语言学习者的要求过高,因此在中小学阶段的测试中对于翻译的考虑有限。但,这五者的结合对于英语学习者来说的意义重大,哪一项技能都不应被放弃,因此,在日常课堂中,我们的教师应加大对于学生的产出能力,特别是对学生的口语表达能力上的培养,将听说课进行得更为活跃,避免学生成为,分数上的巨人,口语交流上的矮子。

关于学习动机方面,最后,因其难以量化的特性,所以需要教师在日常的授课中,应注意关注学生的情感(affect),好的情感能激发学生的学习动机。,教师应加大对于学生思想工作的力度,避免学生产生对于考试的抑制情感。考试后教师所做的总结在给予学生适当压力的同时,给予一定的表扬。

除此之外,对于新课标中要求的文化意识,情感态度以及学习策略等方面,我们对英语的测试中也应有体现。而阅读理解是包含上述三方面最理想的题型。

在确定所须考察的内容之后,接下来便应着重考虑题型的选择。目前为止,英语大型考试中常用的题型就是阅读理解,完形填空,写作,改错,单选。这其中,一半以上的都是选择题,选择题虽便于教师改卷,能让学生在相对短的时间内做完大量的题目,即有利于教师扩大考察的范围,但却不利于学生的书写方面的产出。因此,在日常的考察中,教师在选择选择题这一题型时,应慎重。

要做出一份绝对有效的试卷来说,对于命题者的要求是很高的,但我们教师也不能放弃对于这一点的追求。首先,在测试之前,年级英语学科备课组集全组教师智慧梳理出所测试范围的测试内容(考点),制作出一个试题双向细目表,再分工,但这个分工也并不绝对,可以是一人负责一套试题的命制,或者多人分题型共同命制一套试题,但命题和审题人必须分开。在成功完成一套试卷的命题工作之后,应对该次的工作内容给予总结,并加以保存,以待下次命题者参考并做出方法上的调整和完善,达到资源共享,从而减少教师工作量,提高教学质量,当然,新学期各年级备课组间进行教学课件、教学设计、教学素材、考题的电子、纸质文档移交是实现资源共享的重要环节。

结语:英语测试命题要从测试内容、语言技能、学习动机、文化意识、情感态度及学习策略等方面去考虑并力争在试题中加以体现,方能确保测试的有效性。

參考文献索引:

1.王振中《现代语言测试模型》(2008)

2.陈佑林《语言测试的评价标准研究》(2015)

猜你喜欢

测试有效性语言
班级家长会有效性的探究
思辨性阅读不能忽视“小心求证”——关于论据的有效性探讨
心理测试
我国股票市场的有效性研究
我国股票市场的有效性研究
靠近“最近发展区”,增强教学有效性
心理小测试
我有我语言
测试
小测试:你对电子邮件上瘾了吗?