浅析大学英语语言测试中的信度与效度

2015-09-10曹娟

考试周刊 2015年103期

曹娟

摘要：语言测试是大学英语教学过程中必不可少的一环，是检测外语教学成效和提高英语教学质量的重要手段。本文首先说明了信度与效度的定义及关系，然后以分析广泛用于大学英语测试中的多项选择题为入口，发现大学英语在应试教育的指挥棒作用下有普遍追求高信度而忽视效度的倾向，提出当前大学英语语言测试的取向应是效度重于信度。

关键词：效度语言测试信度多项选择题

1.信度与效度

1.1信度。信度是什么？信度是指测量的结果要有稳定、可靠和一致性，一般情况下，多以内部的一致性表示测验信度的高或低。信度的系数如果越高，此测验的结果就越可靠、一致、稳定。由于系统误差始终以同样的方式影响测量值，不会造成不一致性，因此系统误差对信度的影响可以忽略。相反，随机误差却可能因为导致不一致性而降低信度。我们可以把信度定义为随机误差r影响测量值的程度，如果r=0，就认为信度最高，测量是完全可信的。在大学英语测试中，信度表明了试题、应试者及分数之间相互的关系，而影响试题的因素很多，包括考试的相关组织形式、试题质量和试卷的评判等。测试者要想确保有较高的信度，必须首先保证试卷有一定的量。一般情况下，试题量愈大，信度就愈高，而且考试的分数必须有一定的分散性，即两头小，中间大。那么，怎样才能达到这个标准呢？首先，试卷要能很容易被区分开，这样方能将不同水准的考试者区别开来；其次，试题要具备适宜的难度，既不能太难，又不能太简单，否则测不出考试者的层次；最后，试题应具有同质性，也就是说，要考的内容属于同一个范围，试题与应试者之间具有相互适应性。

1.2效度。效度指什么？效度指的是一种相关性，表示的是测试与测试目的的相关度。我们可从以下两方面进行理解，首先，想考的内容与所考的内容是否是一样的；其次，考试能否达到目的。效度是考试的关键所在，即如果某项高信度的考试没有考到应考的内容，那么这项考试效度就低。各种考试种类多，规模大，但大多数只管得到成绩，很少有人考虑成绩是否有效，命题人员很少分析考试的结果。如果命题人对所命的题缺乏足够充足的反馈信息而命题，那么题目的水平就难以得到提高。最近几年开始有一些考试的分析研究，但只限于研究信度，对一些大型的如CET等考试，需要对其展开效度调查和研究。原因是在一项测试中，效度信度同等重要，若其中的任一项被忽略，命题的质量就无法得到保证、

2.语言测试中效度与信度的关系

第一，信度与效度是辩证统一的关系。一个语言测试拥有以下两个基本的过程：一是确保语言行为能有效说明受试者的语言能力，并在此范围内选择样本；二要确保受试者的语言行为能被测试结果准确真实地反映出来。因此，语言测试效度反映的是语言能力与所测语言行为的关系，而语言测试的信度则表明考试结果与语言行为的关系。如果没有信度，那么测试人员难以借此测量出任何东西，该测试不能真实地反映被测试者的语言行为。相反，无效度测试也是没有意义的，因为没有效度的测试准确地测量出了与语言能力毫无关系的东西。在此情况下，测试者同样没办法根据测试结果推测被测试者真实的语言能力。综上所述，效度信度要在一起方可实现某项语言测试的目标，二者具有辩证统一性。

第二，信度与效度是相互对立的。信度要求语言测试彰显语言的科学性，即将语言进行划分处理，并要求测试题目具有同质性，如此方能使语言测试的内容与形式与语言应用的真实情况脱离开来；效度则声称语言测试需关注语言的整体性、艺术性及题目的多样性，并且，测试的内容与形式应符合语言应用的真实情景。因此，任何测试题型、任何测试，都不能同时兼有极高的效度与信度。以真实语言为内容的交际性测试能保证较高效度，而强调以分散性为主要特征的语言测试则能确保较高的信度。

3.多项选择题信度效度剖析

3.1题型信度分析。一是题目具有客观性。广泛存在于大学英语测试中的多项选择题是通过测试学生所掌握的词汇、语法、语音等知识，推断学生构建句子、理解句子及语篇的能力。由于此种题型考点层次比较低，因此，在有限的时间内，多项选择题语言点覆盖面较广泛，而且通常题量较大，这会让评阅试卷的人能够更准确地推测出考生对语言知识的掌握程度。因此，多项选择题拥有较高的信度。而且，只要某多项选择题被用于语言测试，那么它的评分就不会受到一些人为因素的干扰。所以，多项选择题具有客观性。

二是评分的客观性。只要多项选择题的题目被设计好，每个题目的分值比例被确定，那么阅卷人对其进行评阅就很便捷。在规模比较大的语言测试中，此优越性特别受人们的欢迎，原因是多项选择题题型的答案已经是固定了的，评分非常客观，完全不会受到不同评卷人主观情绪等因素的影响，甚至可以使用电脑进行阅卷，能维持很高的评分信度。

3.2题型效度分析。第一，英语语言能力包括听、说、读、写，多项选择题只能测试被测试者的language receptive ability，即语言接受能力，如听和读，却不能测试被测试人员的language productive ability，即语言输出能力，如写和说。多项选择题孤立地测试组成语言的元素，忽视了听、说、读、写这些元素在真实语境中的相互作用功能。然而，语言的本质不单单是各要素处于孤立状态而呈现出的特性，更重要的是这些要素在语言整体系统中相互作用而体现的功能。综上所述，多项选择题考察的仅仅是学生的语言形式识别能力，而对语言的输出能力和语言知识的运用能力无从判断，也无法测试出学生的语言知识与语境特征相结合时的创新能力。

第二，多项选择题题型有些时候所测试的只是受试人员的猜测和推理能力，而不是他们真正的语言运用能力。

考试大纲不能依据考试内容设定，不应该把语言技能训练的主要方法定义为考试技术训练，正常教学不能被测试取代。大学英语语言测试不仅要重视信度，更要思虑其效度，效度要重于信度。通过上述对多项选择题题型的信度效度剖析，可知多项选择题题型的优点与弱点并存，既有其他类型题型所无法比拟的优点，又具有语言使用不真实、不能测试受试者语言输出能力等效度方面的弱点。笔者认为对待该题型应采取科学和理性的态度，可通过采取综合考虑各项语言技能、不同考试不同对待、保证命题质量、提高试题效度等策略。

参考文献：

[1]孙成岗.现代语言测试与试卷分析[J].解放军外国语学院学报，2000（4）.

[2]牛强.现行高校英语测试中的问题[J].外语教学与研究，2001（2）.