APP下载

体育专业学生英语成绩测试的信度和效度分析

2011-12-29李雪叶李孝英

考试周刊 2011年29期

  摘 要: 由于各种因素,大学中体育专业学生英语水平相对比较差。而学校对其进行的英语成绩测试也有一定的不足之处,使得测试的信度和效度很低。本文分析了体育专业学生的英语状况,以某校一份期末试卷为例,进行了信度和效度的分析,同时提出了相关的建义,以期提高体育专业学生的英语水平。
  关键词: 体育专业学生 英语成绩测试 信度 效度
  
  随着社会的不断发展,学校对大学英语水平的要求越来越高,大学英语测试除了英语四、六级考试外,还有每个学期的期末考试,部分学校还组织了期中考试等。而在大学各个专业中,体育专业学生的英语水平状况比较特殊,使得一些英语测试的信度和效度较低。本文就此作了分析和讨论,并提出一些建议和意见。
  一、体育专业学生英语水平状况
  一般来说,在大学中体育专业学生英语水平普遍较差。这是由多方面的因素造成的:首先,考入大学的体育学生有两类,一类是经过高考考入大学的,这类学生很大一部分选择体育不是因为喜欢体育,而是因为学习成绩差体育专业录取分数低容易进入大学;而另一类是体校等中专生考入大学的,这类学生文化水平比较低,有些甚至没怎么接触过英语。另外,体育专业学生课程大部分是训练课,都是高强度、高运动量,这样,学生的体力精力消耗很大,难以投入到英语学习上。除此之外,学校对于体育专业学生的英语水平要求也不高,只需达到英语三级水平。并且,部分学校体育专业还规定只要参加全国比赛获奖就可以加分获奖学金,因此,在这种情况下体育专业学生对英语这类公共课程并不重视。这些情况都导致了体育专业绝大多数学生的英语水平过低。
  二、大学英语成绩测试的重要性及其目前存在的问题
  对于英语教学来说,测试是一个必不可少的环节。成绩测试是依据某一教学大纲及其相应的教材内容和要求来命题对学生进行检查的测试,是“用来考查个别或全体学生在学习外语的某一阶段或最终阶段的成功程度”(束定芳、庄智象,1996)。它包括了“期末测试和阶段性测试”(Hughes,2000:10)。如本文开头所讲,非英语专业大学都要参加两种测试,大学英语四、六级考试及学校组织的校内考试。本文所谈的便是指校内考试,包括期中测试、期末考试等。
  成绩测试目的在于检查和评定学生在一个教学阶段里学习上所取得的成绩,看其在教学大纲和教材所要求的范围内,外语水平达到的程度。研究表明:“有效发掘、延伸期末考试的正面反拨作用,可实现英语教学向课堂外延伸,帮助学生形成正确的学习方法,提高英语运作能力。”(赵亮,2002)“成绩测试不仅可促进学生对课本知识的掌握,而且有利于提高他们的整体语言水平”(原萍,2002)。
  由此可见,成绩测试在大学英语教学中起着举足轻重的作用。在大学英语教学中,如何科学地运用成绩测试是必须解决的问题。刘润清(1991)说过,“有些语言教师开始掌握语言测试的理论和方法,也设计出了一些比较成功的试卷。……但从全局来看,我国的语言测试还相当落后”。目前,我国的大学英语成绩测试仍然存在一定的问题,设计试卷的科学性和测试结果的可靠性仍然难以得到保证。比较常见的情况是题型设计的不合理。如一些院校为了保证评分更加“方便、快捷、公正”,把试题大都设制成多项选择题,这就产生了很大的弊端,Hughes(2000:60-62)在谈到多项选择题时列举了其存在的六个方面问题:1)只能检测应试者的语言识别能力,不能全面真实反映其语言应用能力;2)猜测成分很大且难以确定其在得分中所占比值;3)严重限制了测试内容;4)设计出成功的题项很难;5)反拨作用往往不好;6)考生作弊更容易。
  那么,在下面一节,本文以某校一份期末试卷为例,结合体育专业学生的英语学习状况,对该试卷进行了信度和效度分析。
  三、信度与效度分析
  这份试卷是2008年12月体育专业学生的期末试题。现将试题概况列表如下:
  LC=listening comprehension,RC=reading comprehension,VS=vocabulary and structure,CL=cloze,WR=writing,M/C=multiple choice,O=objective test,S=subjective test
  1.信度分析
  信度和效度,是衡量学期成绩测试质量高低最重要的指标。信度指的是测量数据和结论的可靠性、稳定性程度,也就是考试结果的可靠性,即测量的结果是否真实客观地反映了考生的实际水平。李筱菊(1997)认为,信度就是测试的结果是否可信。可信的测试结果应该能够准确地反映测试参加者的能力。准确地说,语言测试的信度就是测试结果对测试者的表现而言有多可信。影响测试信度的因素很多,就试题本身来说,信度取决于测试范围与题量;而评分的信度则取决于评分标准的客观性和准确性。
  先看这份试卷的测试范围。这次试题对学生各个方面的能力都进行了考核。听力部分考核了数字、地点、人物关系等。阅读部分包括了推断题、主旨题、词义题、态度题等。词汇与结构部分主要考查了动词短语的用法、介词短语与其他词语的搭配,同义、近义词辨析等。完型填空部分是选词并用适当形式填空,主要考查了学生的理解能力,及其对词型变化的掌握。写作部分则是要求学生对目前学校进行的每学期一次的口语考试提出自己的看法,学生联系实际状况,与目前形势结合,以所学知识各抒己见。从题量上看,这份试题共有5大题81小题,考试时间定为2个小时。对于大学二年级的学生来说,即使是英语水平较差的体育专业学生,这次考试的题量和时间安排也是比较合理的。从评分标准来看,如表中所示,这次考试试卷的组成中客观题占了85%,主观题只占了15%,可以说,评分很大程度上兼具了客观性和准确性。
  这样看来,这份试题的信度似乎比较高,但是,认真看这份试卷,发现阅读理解部分2篇文章选自课本后TEST阅读理解原文,另外2篇来自2002年大学英语4级考试阅读理解原文。课文中原文会使学生更方便作弊,而且学生可能会将答案记住参加考试而不是真正去阅读,4级考试的题目又远远超过体育专业大多数学生的英语实际水平,这样的测试并不能真实反映学生英语学习情况,不能达到测试的目的,测试可信度很低。还有完型填空部分,选自课文原文选段,测试的结果并不真实。
  2.效度分析
  Henning(1987,引自Alderson,2000)将效度定义为:“效度通常是指测试的恰当性或者测试的任何组成部分发挥出其测量的作用。有效的测试应该能够测试出其应该测试的东西。”他认为测试有各种作用与目的,不应该错误使用测试,如果错误使用了,测试就失效了。效度的概念有几个方面内容效度、标准相关效度、结构效度、表面效度等。其中内容效度是最重要的,如果测试内容不能测试被测试者的能力,那么这个测试就失去效度。内容效度研究有以下几个方面:测试内容是否和测试目标有关;测试内容是否有代表性;测试内容是否全面地、充分地体现了要考查的各方面内容;试卷中是否有足够的题目去体现所要考的各方面内容;测试内容是否适合测试对象等。
  这份试卷的测试对象为大学二年级体育专业学生;测试目的是检验学生对本学期教学内容的掌握情况,了解学生在这一学期学习之后的英语水平;测试的范围是上海外语教育出版社出版的《大学英语精读》第二册5—10单元及第三册1—2单元。
  试题听力部分分两种题型,Section A要求学生听10段简短对话,每一对话一道题目,Section B要求学生听3段小短文,每段短文3—4道题目。听力原文中并未出现生单词,且语法项目与学生学过的内容基本保持一致,仅在答案选项中有个别生单词,但是并不影响学生选择正确答案。因此,该部分的考核存在比较高的效度。
  
  第二部分阅读理解,一共四篇文章。阅读理解题着重考查学生对语篇的理解,它能够考查学生根据所提供的语境提示,综合利用信息解决实际问题的能力。这四篇文章内容涉及多个领域,但是作为一次成绩测试,这四篇文章并不能反映学生的真实水平。Passage 1和Passage 2是《大学英语精读》第二册“Test yourself 2(Units 6—10)”中选取的两篇阅读理解文章,并且题项完全相同。学生对于这种课堂上已经做过的题目在考试中只需凭自己的记忆选择正确答案即可。若是学生提前从老师口中得知考试题目会从课本Test中选取,学生会死记硬背正确答案,考场上找到对应的选择。并且,这样的题目更方便了学生作弊,产生不良后果。而Passage 3和Passage 4选自2002年1月大学英语四级考试,大学英语四级考试属于水平测试,而这份试题是期末考试,也就是成绩测试。选取四级考试的题目与测试目的不符合,并且,对于体育专业大多数学生而且,四级考试题目远远超过了他们的英语水平,并不能真正检验学生的英语状况。因此,阅读理解部分效度过低。
  第三部分词汇与结构,共30题,有18道题目与本学期教学内容符合,均选自《大学英语精读》的课件中对重要词汇短语的讲解例句。余下题目考查了一些比较基础的语法知识,如动词时态的使用、连词的使用等。对于体育专业学生来说,这样的题目难易适中,既考查了学生对课堂讲解内容的掌握情况,也对其基础知识的了解进行了检验。因此,这一部分有效度较高。
  第四部分完形填空,出题者选取了课本Unit 10的课文第4,6,14自然段,将这几小段组成一篇短文,让学生从给出14个单词中选择恰当的单词并用适当的形式补充短文空白处。需要补充的地方都是一些形容词、名词,没有对一些如介词短语搭配等进行考查,学生只是凭记忆选词填空,并且这样使学生更方便了作弊。这部分的测试并不科学,效度极低。
  最后部分写作,题目为“Is a Test of Spoken English Necessary?”要求学生写100个词以上。对于体育专业学生来说,这个题目比较接近他们的实际,他们有一些自己的看法,能够有话说,而100个单词对于大二的学生并不困难。因此,作文部分能够比较有效地考查到学生水平,效度较高。
  四、结语
  总的来说,这份试卷设计并不科学,信度和效度都较低。对于体育专业学生,要根据他们的英语实际水平,设计有质量的科学合理的试题,从而能够真实有效地检验和考查他们的英语学习状况。
  
  参考文献:
  [1]Alderson,J.,Clapham,C.,and Wall,D.Language Test Construction and Evaluation,Beijing:Froeign Language Teaching and Research Press,2000.
  [2]Hughes,A.Testing for Language Teachers,Beijing:Froeign Language Teaching and Research Press,2000.
  [3]李莜菊.语言测试科学与艺术.长沙:湖南教育出版社,1997.
  [4]刘润清,韩宝成.外语测试和它的方法(修订版).北京:外语教学与研究出版社,2000.
  [5]束定芳,庄智象.现代外语教学——理论、实践与方法.上海:上海外语教育出版社,1996.
  [6]原萍.成就测试对外语教学的正面反拨效应.外语教学,2002,(4):18-21.
  [7]赵亮.以考促学——一项强化、延伸期末考试反拨作用的试验研究.外语研究,2002,(4):51-54.
   注:“本文中所涉及到的图表、公式、注解等请以PDF格式阅读”