APP下载

语言测试中的效度与信度

2015-09-08邹微杨纾凡

校园英语·中旬 2015年8期
关键词:语言教学效度信度

邹微++杨纾凡

【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。

【关键词】语言测试 语言教学 信度 效度

一、引言

随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。Bachman曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。”

二、效度

效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。它是测试最基本的出发点。“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。”

1.内容效度。内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。

2.标准相关效度。标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。”如果两者的关联程度越高,就说明测试的标准相关效度越高。标准相关效度又分为共时效度和预测效度。共时效度是建立在差不多同时施考的两个考试结果的比较之上的,如果两组考分出现较高的一致性,就说明测试具有较高的共时效度。在这里,两个测试中其一必须是公认的、有较高效度的考试;而预测效度能测试出一个考生是否有胜任其未来角色的能力。如公务员考试,其考试内容主要就是考查受试者的逻辑能力,思维分析能力及书面表达能力等,这些都和其以后的工作息息相关。

3.构卷效度。构卷效度指“试卷所反映的作为其基础的相关理论假设的程度。”检验语言测试的构卷效度就是要检验语言测试的构卷与语言学习、语言测试理论是否一致。

4.表面效度。表面效度就是学生及其他相关人员对该试卷的感知。从表面看,考题难易,是否考察了应该覆盖的语法点、句型、词汇等。如果是一个专项的法律英语的考试,而其考试内容则全是和经济相关的,考生的合作性和积极性将会大打折扣。一份表面效度较高的试卷,是能引起老师和考生的注意力,对考生来讲也就有了答题的兴趣和动力,必将尽其所能答好这份考卷。从这个意义上来说,表面效度并非真正意义上的效度,而是外行人对考试的接受程度。

影响效度的因素主要有:

(1)题目过难或过易。如果一项考试在一开始题目难度较大,会导致考生灰心沮丧,从而失去了本来可以得分的题目。总的来说,过难或过易的考试其效度都不高,仅通过测试,很难区分中等水平和高水平考生之间的差距。

(2)选择项目区分度低。题目选项设计相近,考生很有可能被这些相似的选项弄昏头脑,从而选出错误的选项。

(3)题干的指向性不明显。考生较难读懂题干要求,从而出现没有按要求答题而失分的情况。

(4)题目数量过多或过少。一般来说,一项测试的题目数量是很考究的,如题目数量过大,考生会被海量的试题折磨得筋疲力尽,从而影响其真实水平的发挥;而题目数量过少的话又很难测量出考生的真实水平,所以在出题过程中,出题人必须把握好量,从而保障测试的表面效度。

测试具备有效性之后,就要考虑测试结果的可靠性,即测试的信度。

三、信度

信度,简而言之,就是语言测试的可信度。一项好的测试,其信度较高,其测试结果能较为准确地反映学生的学习效果和教师的教学水平。但是,出现信度为100%或完全没有信度的情况是没有的。评估测试信度的高低大致有以下几种方式。

1.再测信度。“再测信度是指用同一份试卷在相同的条件下对同一批考生在不同的时间内进行两次测试,两次考试结果的相关系数就是再测信度。”如果考生两次测试的成绩一致或相近,那么这项考试的信度就高。但是,在实际情况中,这个间隔的时间不好把握,间隔时间太短,考生对上一次的考题以及答案还有记忆,很有可能凭借自己的记忆重新作答;而间隔时间太长,考生通过在两次间隔时间内的进一步学习、提升或者在这一时期内厌学、退步,其学习成绩必定会较以前发生变化。所以,从这个角度来说,通过再次测试考察一项考试的信度并不高。

2.平行测试信度。平行测试信度指的是通常,受试群在接受完一项测试以后,在短时间内(通常为两周),再次接受另一项与之相当的测试,两次测试结果的相关系数就是该考试的信度,即平行测试信度。在设计与第一套考题平行的试卷时,其难度、题数、题型、考点都应该与第一套考题相同。通过这对这两套试题的测试,分析受试者的成绩。如果考生在这两次测试中取得的成绩相同或相似,就说明这项测试的信度高。然而,在实际情况中,出题人对试题难易程度的一致性很难把握,要设计出两套无论在难度、题数、题型、考点都完全一致的考题几乎不可能。所以,从这点出发,平行测试信度也较难实现。

3.阅卷人信度。通常,一项测试是由主观题和客观题两种题型组成的。一般来说,客观题的信度相对较高,不受阅卷人的主观喜好、情绪的影响,且通常标准答案只有一个。而主观题的作答一般不受标准答案的约束,受试者只要回答的内容与标准答案的中心点相同或相似,便可得分。阅卷人信度对应试卷中主观题的评分,主观题评分不可避免地会受到阅卷人主观因素的影响,与阅卷人的对考题的理解、主观情绪、喜好或学生的书写质量部分关联,由于阅卷人自身存在不稳定性,故阅卷人信度也较难完全保证。

综上,无论使用何种方法评估信度,它都是有其不稳定的一面。评估语言测试信度的方式应取决于测试者的目的、用途以及测试的类型等。

影响信度的因素主要有:

(1)考场环境的好坏是影响测试信度可靠与否的重要因素。考生在环境脏乱、四周嘈杂的氛围里,很难静心答题。进行听力考试,考场内音响设备的好坏直接影响考生考试成绩的高低。

(2)测试的效度高低也是影响测试信度的不可忽视的因素。效度低的试卷(尤其指表面效度低),会影响考生答题的情绪和速度,进而阻碍考生发挥自己的真实水平。

(3)考生对题型的熟悉和答题技巧的熟练程度也是影响信度的重要因素。如果考生对一项考试的题型不熟悉,答题前会花大量的时间去研究作答形式,从而影响其整个答题进程。相反,考生答题技巧娴熟,答题的速度会相对较快,作答完毕后会有较充裕的时间检查以增加其答题的正确率。

(4)试卷的排版、印刷及质量也能影响考生的答题情绪,所以在命制试卷前,为保障测试的信度,考题设计者应考虑到上述因素。

四、信度和效度的关系

信度和效度是既统一又对立的两个要素。一项好的测试,它必须具有较高的信度和效度。效度首当其冲,没有效度的考试是没有意义的;而信度是一项测试的可靠性,没有信度的测试,很难测量出考生的真实水平,从而测试的目的难以实现。然而,测试中很难出现信度和效度双高的情况。这就需要命题人在设计考题时寻求这两者的平衡,使测试的效度和信度都达到最优。一般来说,效度高的考试其信度必然就高,而信度高的考试其效度不一定高。如,客观题的信度相对较高,因为它不受阅卷人主观因素的影响,且标准答案固定。但是一个只有客观题的语言测试,虽然信度高,但实际测试的效度较难保证。不利于学生发挥自己的主观能动性,所以考察学生思辨能力的主观题必不可少,这样才能更全面地检测学生的学习效果。反之,试题中主观题越多,测试的效度相对就越高。

五、结语

语言测试与语言教学是一个有机的整体,脱离语言教学,语言测试毫无意义;反之,摈弃语言测试,语言教学工作者难以对语言教学的效果进行评估,进而影响其进行下一步教学计划的制定、把握下一阶段教学的重难点。因此,在语言教学中,教师应充分利用语言测试的反拨作用,根据学生测试结果,调整或改进教学方法、手段,使语言教学的目标、重点更为明确。

一项好的语言测试必须兼具效度和信度。效度是测试的根本,高效度的测试能达到命题人预期想要达到的测试目的,从而帮助其较为准确地对考生的能力进行评估,所以试卷的效度应是考题设计者优先考虑的因素;高信度的考试则能真实地反映学生的水平,是达到测试目的的保障。然而同时出现高效度和高信度的情况是几乎没有的。因而命题者在设计考题时应根据教学大纲内容、测试目的以及学生具体的情况,在测试的信度和效度之间寻求一个平衡点,从而使语言测试结果更好地为语言教学服务。

参考文献:

[1]Lyle F.Bachman.Fundamental Considerations in Language Testing[M].Shanghai Foreign Language Education Press,2004.

[2]施丽娜,徐芝苹.国内十年语言测试信度与效度研究的统计分析[J].四川教育学院学报,2010(12):76-78.

[3]尹付.英语口语测试设计的效度分析[J].湖南医科大学学报(社会科学版),2010(1):90-92.

[4]张蕾.英语语言测试的信度与效度[J].张家口职业技术学院学报,2008(1):48-49.

[5]赵玉闪,王志,卢敏.全国翻译专业资格(水平)考试笔译试题命制一致性研究报告[J].中国翻译,2007(3):53-56.

[6]皇甫伟.二语习得试验中的信度和效度检验方法研究[J].中国科技信息,2009(9):224-225.

作者简介:

邹微(1987—),女,汉族,四川广元人,西南科技大学外国语学院助教,硕士,研究生方向:教学法,认知语言学,应用语言学。

杨纾凡(1991—),女,汉族,四川绵阳人,西南科技大学外国语学院助教,硕士,研究方向:英语翻译。

猜你喜欢

语言教学效度信度
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
对外汉语教学中的文化教学
浅谈西班牙语歌曲在教学中的运用
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架
中文版脑性瘫痪儿童生活质量问卷的信度
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度