中学英语教师如何学会做语言测试

2020-12-06朱武平

广东教学报·教育综合 2020年134期

朱武平

【摘要】中学英语教师在日常教学中经常要面对大量的考试或语言测试，学会如何对测试试卷和测试成绩作出正解的分析，这对提高语言测试水平和英语教学具有重要意义。在本文中，笔者简要概述语言测试相关理论，探讨如何对中学英语的语言测试作出分析和撰写测试报告，希望能给中学英语教师提供借鉴经验。

【关键词】语言测试;信度;效度;测试分数;试卷分析

对于中学英语教师来说，在语言测试后作出测试报告是很有必要的。中学英语教师经常要面对大量的考试或测试，在教学反思或测试报告中都要对考试成绩作出分析和合理解释。在这种情况下，语言测试领域的一些问题常会让教师感到困惑。中学英语教师应如何分析和解读学生成绩呢？他们的测试是否高度可靠或有效呢？这些测试结果又会如何影响他们未来的教学或测试开发呢？中学英语教师有必要学习语言测试的知识，及测试开发和测试分析的相关理论和原则。因此，笔者简要概述语言测试相关的理论和原则，并提出一些与语言测试分析相关的问题。

一、影响语言测试的关键因素

英语教师要想对试卷和考试成绩进行合理的分析，就必须考虑语言测试的信度和效度。由于信度和效度是语言测试中最重要的因素，我们应该了解和分析这两个关键因素。

1. 信度

信度是任何一种好的测试的必要特征，如果一个测试是不可靠的，我们怎么知道被测试者的真实语言能力？语言测试的信度一般有三个组成部分：考试本身的信度，考生在不同场合的表现，测试分数的信度。测试的信度取决于许多因素，如测试的类型和长度，以及测试所检测学生的能力范围。总的来说，可能会影响到测试信度的因素包括：测试相同的语言能力;考生的方差;学习者的波动（动机、疾病等个人因素）;得分波动;考试管理波动;测试长度;充足的考试时间;测试项目辨析;响应特性误差;为试验所选择的材料的样本范围;测试指令;试题难度。我们可以做的是通过测试设计，尽量减少那些不一致的潜在来源的影响。虽然不可能实现完全可靠的测试，但在设置测试工具时要尽可能使其可靠，比如我们应该确保测试说明是清晰的，并且没有含糊不清的题目。

2. 效度

效度是一种综合的评估判断，效度不是测试或评估本身的属性，而是测试分数的意义。Messick认为，测试的统一效度最好是通过对测试的整体评价来体现。

效度是一个统一的概念，包括五种效度：表面效度、内容效度、结构效度、预测效度和同时效度。表面效度指的是测试的“表面可信度或公众可接受性”，经常被测试者认为是不科学的和不相关的。内容效度是指内容的代表性或抽样充分性——衡量工具的实质、事项、主题。结构效度是一种研究活动，是对理论进行检验并加以确认、修改或放弃的手段。预测效度指的是测试对学生未来表现的预测程度。预测验证需要时间来评估。同时效度是使用一个公认的、有信誉的测试来检查目标测试的有效性，由此产生的相关性提供了测试同时效度的度量。

3. 信度与效度的关系

无论测试的理论假设是什么，测试的效度和信度构成了评估任何测试的两个主要标准，信度和效度之间存在权衡关系。在实际的语言测试中，如何处理信度和效度之间的矛盾？中学英语语言测试往往更注重信度而不是效度。过分注重信度而忽视效度，会给我们的语言教学带来严重的不良后果。我们必须在信度和效度之间做出积极的妥协。因此，当我们开始分析学生的考试成绩和写一份后测报告时，我们应考虑到这两个因素来解释考试成绩的意义，并对所进行或执行的测试的信度和效度做出判断。

二、试卷分析

语言测试使用者应该收集测试后的多种数据和信息，来分析和判断这个测试是否令人满意。此外，语言测试机构和教育部门也要求英语教师获得一些相關的统计数据及其对数字的解释。最重要的数据就是收集所有客观题的分数和主观题的分数。

1. 描述性统计

语言测试后，我们通常采用描述性的方法来处理测试结果。应该收集整个测试及其每个组成部分的描述性统计信息。最常用的统计类型是柱状图、平均值、众数、中位数、极差和标准差。柱状图是用列来说明考试分数出现的频率（见下图1）。从这个图表中，我们可以很容易地得到学生考试成绩分布的信息。

我们常用众数、中位数、均值等指标来描述学生考试成绩的集中趋势，其中，均值是衡量集中趋势最有效的方法，但它并不总是恰当的。任何考试的平均分数都是均值，平均分数能够通过比较来描述单个学生的分数，但它并不能告诉我们最高和最低分数以及分数的分布。标准差（s.d）是一种显示分数分布的方法，它显示了所有的分数是如何分散的，例如，如果50题测试的最高分是43分，最低分是21分，那么范围只有从21到43分的，标准差却可以给出了比这分数范围更完整的描述。计算标准差（s.d.）的一种简单方法如下图2。标准差对于提供关于不同群体的特征的信息也是有用的。例如，如果一个班级在某项测试中的标准差是4.08，而另一个班级在同一项测试中的标准差是8.96，那么可以推断后一个班级的异质性远远大于前者（引自：Alderson， 2000）。

2. 项目分析

许多教师认为，一旦取得了原始成绩，考试就结束了。事实远非如此，测试结果可以提供很多有价值的信息，比如学生群体的表现，从而在课堂测试中反映教师教学的有效性、学生个人表现和每个测试项目的表现。学生整体表现和每个学生的表现对于教学是很重要的，由于测试结果不仅显示出最经常犯的错误，还可以显示出犯错误的实际原因。

我们在设置测试时，应考虑测试项目的功能、难度和效度。一个项目的难度指数（或设施值）显示了该项目能被证明的难易程度。困难指数（FV）通常表示为回答正确问题的学生的比例（或百分比）。计算公式：FV=R/N （R表示正确答案的数量，N表示参加考试的人数）。

另一个指数就是区分程度（D），表示该测试项目区分能力较强与能力较弱学生的程度。从统计学上来说，我们可以用这个公式来计算得出这个数值：D=正确的U -正确的L / N （D=区分度;N=检测人数;U=上半部分;L=下半部分）。测试工具的信度和区分度通常都会以表格形式来记录，并以相同的公式来统计得出，要注意区分度低于.30的测试项目是可疑的，因为它们不能有效地区分。

总之，英语教师应该学习关于语言测试的理论知识，尤其是测试成绩分析方法和测试后报告的写作。虽然不能在一篇文章中完全讨论，但我们还是可以从中得到一些教学启示。因此，我们需要进一步研究测试分析和基于分数的推断技巧，这样我们才能成为一个明智的语言测试使用者。

参考文献：

[1] Alderson JC.C. Clapham. D. Wall. Language Test Construction and Evaluation [M]. Beijing：Foreign Language Teaching and Researching Press，2000.

[2] Bachman， L. F. Building and supporting a case for test use[J].Language Assessment Quarterly，2（1）：1-34，2005.