SPSS软件分析评价英语测试
2015-07-04王瑞雪
王瑞雪
摘 要:本文从语言测试相关理论的角度,对铜陵市第六中学初二年级某班级期中英语考试进行试卷分析,利用SPSS软件,对试卷的整体结构、信度进行分析,并以单项选择题为客观题代表進行难度及区分度的统计,以此探究试题质量和学生的表现情况。此项分析与研究不仅有利于审改题目、建立试题库,更有利于从学生和教师两个角度找到最有利于提高学习成绩和学习效率的方法。
关键词:SPSS软件 语言测试 试卷分析 信度
一、 引言
语言测试是近几十年来研究较多的热门学科,它属于应用语言学的范畴,涉及计算机、教学法、二语习得和心理语言学等多方面领域的知识。通常来说,语言测试针对的是对外语的测试,因此在外语教学中有着举足轻重的作用。从历史发展的角度来说,语言测试可以分为四个阶段,分别是科学前时期、结构主义时期、社会语言学时期和交际语言测试时期,四个时期所关注的测试内容和方法都有所不同。
二、信度和试卷分析
信度指测试成绩的一致性,充分反映了成绩与试题、试题与应试者之间的关系。信度一般受以下因素影响:试题质量、测试的组织及最后试卷的评阅情况。为了保证测试的高信度,试卷应包含足够的试题量。一般来说,试题量越大,试卷的信度越高。此外,试卷应具备能够区分不同成绩等级学生的区分度。试题的难度应适中,太难或太简单都无法对学生的水平做出足够的区分。最后,试卷的评阅工作应保持一致。
试卷分析是指利用计算机和软件对测试的结果进行数据分析,对提高测试水平和未来的测试准备工作起着十分重要的作用。测试者可以借此将优秀的试题放入试题库,分析和试题修正之间的相互循环可以有效地使试题库更加合理与科学。正因如此,很多大型考试的组织者会将试卷分析与阅卷评分放在同等重要的位置,并将其作为整个测试过程的重要组成部分。
三、 研究方法
本研究的样本来自一次八年级学生的期中英语测试,因此研究对象为此次测试的成绩和试卷。在刚过去的半学期中,该班级学生对大纲要求的词汇和语法进行了系统的学习,这也正是本次测试的主要内容,目的是为了检测该班级学生是否掌握了过去半学期所应该掌握的知识。对于本次研究,此数据真实可靠,具有可信度。
SPSS作为分析测试成绩的工具,在测试分析当中运用十分广泛。本文首先对试卷的整体结构进行概述和分析,包括试题分布,基于原始成绩的成绩分布直方图,计算难度与区分度。作者试图利用SPSS计算整张试卷的信度,并将单项选择题作为客观题代表,进行进一步分析。通过对其数据的统计和F.V.(易度系数),DI(区分度)数值的计算,在分析试题和原因的基础之上对教学和试题的设计提出建议。
四、基于SPSS的具体试卷分析
(一)试卷结构
整份试卷共分为六个部分,分别是单项选择、完形填空、阅读理解、词汇、补全对话和写作,其中除写作是主观题以外,其他五项均为客观题。虽题型多样,但试卷所测试的内容主体为语法。本次测试是一次期中考试,目的在于测试学生是否掌握了过去半学期所学习的语法和词汇,因此将大部分分值的试题设计成了客观题,以此来测试学生的基本知识,整体上来说,试卷的设计是相对公平合理的,能够满足测试的要求和目的。
(二)成绩分析
下表反映了本次期中测试的一系列描述性数据以及整体成绩分布直方图。从成绩分布直方图来看,比较集中的分数段是40—50、70—90,这两个分数段之间差距很大,说明学生的水平之间有很大的差异。任课教师应该对低于50分的学生给予更多的关注,此水平的学生基数比较大,他们缺乏能够解题的足够基本知识,应该在课后多加强基础知识的练习。同时,70—90分数段的学生数量也比较多,他们多为班级中优良等级的学生,已经掌握了大部分的所学知识,可能这部分学生需要注意的就是提高练习和应试技巧的问题,任课教师可针对这部分学生采取一些有效措施,如加强提高练习、对难点进行梳理等。对于整个班级而言,高分组和低分组的同学结对互助学习也是有效且广而行之的方法之一。
表一 描述性数据
表二 成绩分布直方图
(三)选择题分析
1.信度
作为客观题的典型代表,单项选择题似乎是在无论大型还是小型考试中不可或缺的一种题型。在单项选择这种题型中,选项和题干的多样性很容易给学生造成迷惑,它的目的在于考查学生对知识的掌握情况,以及学生分析和辨别的技巧。因此,本文作者特意将单项选择这一题型作为客观题代表在SPSS数据分析的基础上深入探讨。
表三 信度
表四
表三和表四是基于SPSS的统计分析结果,其中表三显示的是整个单项选择的信度,表四反映的是单项选择题中每道题的信度和整个单选题的信度对比。从表格当中可以看出,大部分的选择题信度都很符合整体的信度值,但其中也不乏少数相对信度值比较低的题目,因此在建立题库时,应该有所舍弃。
2.D.I. 和FV数值计算与分析
表五 D.I. 和FV
表五给出的是单项选择题中每道题的D.I.和FV值。理论上易度系数值应该处在0到1之间,易度系数越高,题目则越简单。但通常情况下,为了保证题目不会太难或太简单,理想的易度系数值应控制在0.3到0.7之间。从上表的数据来看,大部分的题目则未处于这个理想的范围内,且题目设置过于简单。然而,结合之前给出的学生成绩数据可看出,学生并没有在这一部分得到很高的分数,为了探究这其中的原因,作者接下来将会从选择题中抽取几个例子来分析。
Item 4: Don't waste water again, or we will it one day.
A. look out B. take out C. run out of D. get out of
诊断1:在这道题中,四个选项均为关于out的短语,意义实则有很大差异,若学生无法清楚区分四者之间意义和用法上的区别,则无法最终选出正确答案,因此这题具有很高的区分度。
Item 17: She asks me if it tomorrow. If it tomorrow, she will go camping with me.
A. will rain; won't rain B. will rain; doesn't rain
C.rains; doesn't rain D.rains; won't rain
诊断2:此题目难度偏高,全班只有约四分之一的学生选出了正确答案。因为此题有两小空,所以对学生来说,两空都答对难度就自然而然提升。此题是一道高區分度的题目。
通过对以上两组抽样分析,可以发现一些明显存在的问题。学生们普遍对选项中的相似语法点感到迷惑,因而难以做出正确的判断。对教师而言,应该帮助学生总结学习过程中的这些难点,并且在授课过程中结合相关练习加以强化。而对于学生,也应该对自己的学习弱点进行分析并且花费额外的精力去努力克服。
五、 结语
本文以一项具体的考试为研究对象,对试卷结构和测试结果进行详细分析。从分析的结果以及探究的原因来看,教师和学生双方面均存在有待提高的地方。学生的水平层次不同,因而如何针对不同层次的学生设计有效的教学方法,提高整个班级的水平层次成为了教师最关心的问题,也许针对不同的学生布置有区别性课后提高练习会是个短期可行的方法之一。试卷分析通过统计数据,提供了有关应试者和试卷设计的相关信息,这些信息对应试者、试卷设计者和教师有着很大的帮助。但从另一方面来说,机器毕竟是死板的,不能与人相比,正是由于试卷分析呈现出来的结果对风险承担者来说十分重要,我们就更应该客观对待这些机器数据。一方面,它有自己的科学性,另一方面,当我们在使用这些数据的时候应该小心谨慎,不能过于盲目,具体问题具体分析,用试卷分析的数据对题目进行审查,提高考试的信度,使语言测试达到其真正最有价值的目的。
参考文献
[1] Bachman&Palmer.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[2] Lado,R.Language Testing[M].New York:McGraw-
HillCompanies,1961.
[3] Spolsky,B.Measured Words[M].Oxford:Oxford University Press,1995.
[4] 邹申,戴炜栋.语言测试(第二版)[M].上海:上海外语教育出版社,2012.