APP下载

浅议外语教学评价材料收集中的效度

2013-12-29李联现

考试周刊 2013年25期

摘 要: 外语教学评价是提高外语教学质量的重要途径,而评价信息效度的高低关系到能否反映学生真实的外语水平。本文就效度的定义、效度的收集方法、信息的收集方法等进行了探讨,以期为教学提供准确的评价信息,使教师准确把握学生的外语水平,有针对性地、更好地进行教学。

关键词: 外语教学 效度 评价 信息

对于外语教学,我们通常采用定性(质性)和定量性(量性)信息进行评价。在评价中,信息的质量是至关重要的。无论我们采取什么方法收集信息,必须始终关注用于评估的信息的质量。信度和效度是信息质量的两个方面。信度是指信息的一惯性和稳定性,效度是指信息的相关程度。信度和效度是判别信息质量的关键[1]。同时,在收集评价信息时还要注意所采用数据的实用性,在此我们主要探讨外语教学评价中效度的收集问题。

一、效度的定义

效度是我们所收集的材料对我们所要了解的对象的特征或属性的真实反映的程度[2]。这是对效度最直接的定义,但还有一些隐含的意义需要引起注意。首先,我们想要准确知道的对象往往不是一个容易回答的问题,特别是当涉及外语学习时。比如,什么是交际能力?什么是外语学习的潜能?什么是关于基本句型的知识?所有这些问题都是教师和语言学家们长期以来争论的问题。其次,我们最关心的是信息的真实程度。例如,在一个有关学习背景的面谈中,我们得到了大多数学生的学习背景的准确信息,但也可能会有个别同学给出了不准确的信息。有的学生在这种情景下倾向于夸大其词,而有的却对以前的经历描述不足,这可能是为了增强或者削弱采访者对其外语能力的判断,或者仅仅是因为他们记不清了。这些回答表明了每个应答者学习英语的时间的长短,而实际上还被当成了效度的指数。

正如信度一样,效度也用0.00~1.00之间的数字来表示。完全效度用1.00来表示,而没有效度用0.00来表示。这些数字表达的只是理论上的区间,在实践中,我们永远没有办法确定我们在评价过程中的效度,而只能估计。而在评价中,我们也不可能期望有完全效度的过程。我们应该认识到,信度和效度有一些很重要的关联。首先,评价仪器或过程只具有它本身本次所具有的可靠性。也就是说,其他次别就可能会和本次不一致,而这些不一致的过程会降低评价的信度,评价结果会受到这些因素的影响。其结果是,这些因素会导致产生不一致的、错误的信息。过多的信息也会降低效度。例如,对年龄的态度会影响学生对调查问卷的回答。其次,没有效度目的倾向的测试可能更可靠。比如,在评价表上有一个问题问学生对老师的印象。在不同的场合,学生可能会给出一致的答案。但他们这样评价老师是因为他们觉得这是一种被欣赏的社交应答方式,或者他们害怕老师看到他们的评价而给低分。他们对老师的真实感觉可能完全不同,但回答却是一致的。

二、效度的估计

效度与信度一样,不能直接评价。要评价相关信息的效度,我们必须对评价对象的真实性或状态有确切的把握,以便将其与我们收集到的信息进行比对。在人为评价的范畴内,大多数优秀的评价者不是对他们的评价对象而是对直接评价更感兴趣。因为没有直接的方法能使我们了解到我们所感兴趣的对象的品质及能力的真实水平,我们只有一些关于这些对象的信息,通过此了解我们所感兴趣的对象,即只有通过间接的方法估计信息收集过程的效度。在评价中,我们收集信息的目的是能对有关学习或教学作出符合逻辑的判定。如果我们收集的信息有助于达到这一目的,就可以认定得出这一结论的信息和过程是有效度的。依据我们想要得出的结论的种类,我们选择所要评价的信息效度的收集方法。主要有三种方法[3]:

1.内容相关度

内容相关性是指通过有逻辑的、详细而系统的方法检测评价的内容、方法和过程是否代表了我们所想要评价的语言技能。内容相关性对评价来说很重要,因为外语教师常常想知道学生在某一特定场景或某一类型的情境下的表现,而在这些场景下教师无法通过询问评价学生的表现。因此,评价学生在某一限定场景或者我们不感兴趣的场景下的表现是很有必要的,通过总结这些评价结果,我们能得出我们所感兴趣的场景下学生的表现。

内容相关度在分班考试中非常重要,在标准测试中也很重要。在这些测试中,测试内容是否代表了教师所教的语言技能或评价了教师最感兴趣的东西是一个关键问题。如果摸底考试的内容不能准确反映课堂所教的知识,学生在考试中的成绩就不能准确反映他们在这些课程中的表现。换句话说,如果摸底考试中所考的语言技巧和教学中所教的语言技巧之间没有或几乎没有联系,我们就不能通过摸底考试准确判断学生对这些课程的学习情况。

2.标准关联效度

标准关联效度是指用一种方法评价信息的属性或者特征与用另外一种方法评价同一信息的属性或特征所得出的结果之间的关联程度。标准关联效度可以通过统计计算得出某一评价和标准之间的一致程度。通常用0.00(无关联效度)到1.00(完全关联效度)之间的关联效度指数来表示。

3.结构效度

结构效度对课堂评价来说可能是最难理解且用途最小的一种效度。下面的例子可能会帮助我们理解什么是结构效度。英语老师想要知道学生对于学习英语重要性的认识,于是让学生在“很重要”、“重要”、“不重要”之间进行选择。随后他将学生的选择与他们的英语成绩相比对,结果发现,那些认为英语学习“很重要”的学生都是班里学习最好的学生。因此他得出这样的结论,评价是有效度的,因为通常来说,学习动机越强的学生成绩会越好。结构效度在我们不了解要评价的内容的准确的属性和特征时最有用,因此它不能用于内容效度。

如信度一样,评价过程的效度也可以通过鉴别影响效度的因素来确定。比如,在考试成绩方面,除了学生的外语水平外,其他因素也可能会影响学生的成绩。如果有许多其他因素影响学生的表现,那么将这个评价过程作为衡量外语水平的标准就会效度很低。要提高信度,往往需要消除、减少或者将这些因素考虑在内。

三、信息的收集方法

外语教学评价需要收集大量的教学信息(教学目的,教学计划,教学实践)、学生信息(学生需求,个人背景,语言阅历,学习成绩,学习态度和感受)、教师信息(语言经验,语言技巧,教学态度)、学校信息(学校的教学和人力资源)等。可以采取不同的方法收集不同的信息。考试可以用来收集学生学习成绩方面的信息,但不能用来收集其他方面的信息,而其他的数据收集方法却适合收集这些信息。比如,课堂观察和学生会议可收集到学生在阅读和学作中所使用的策略;对话记录能说明学生课堂学习的态度;学校记录,课程档案,或其他的资料能说明学校的管理和人力资源情况,也能说明教学本身。

有些信息的收集是直接的,不需要特别准备的,比如,查看学校记录和教学资料。在这种情况下,我们就可以了解到与此相关的信息,进而了解其内容。其他方法,比如档案袋法、会议法、调查问卷法需要事先准备并有一定的程序。

我们不必在任何时候都要用所有方法收集信息,而是要决定哪个或者哪几个是某一特定场景下能使我们作出最合适的决定的最恰当的方法。何况,并不是所有的方法都适合我们所要收集的用于评价目的的信息。有些方法(比如,会议和日志)既可用于教学又可用于其他评价目的。因此,教师可以选用一些方法作为评价活动的一部分,而选用何种方法则要由他们的评价目的来决定。

参考文献:

[1]Brian K.Lynch.Language Program Evaluation[M].Shanghai:Shanghai Foreign Language Education Press,2001.

[2]Fred Genesee Johna A.Upshur.Classroom-based Evaluation in Second Language Education[M].Beijing:Foreign Language Teaching and Research Press,2005.

[3]James Dean Brown.The Elements of Language Curriculum:A Systematic Approachto Program Development[M].Beijing:Foreign Language Teaching and Research Press,2001.