APP下载

PRETCO考试中阅读测试的效度研究

2012-08-15张晓萍

湖南邮电职业技术学院学报 2012年3期
关键词:内容效度测试者被试者

张晓萍

(南京大学教育研究院,江苏南京 210093;常州机电职业技术学院基础部,江苏常州 213164)

PRETCO考试中阅读测试的效度研究

张晓萍

(南京大学教育研究院,江苏南京 210093;常州机电职业技术学院基础部,江苏常州 213164)

阅读测试是语言类测试的重要组成部分,其目的是测量学生的阅读能力。阅读测试的效度又是达到这一测试目的的保证。文章结合全国英语应用能力考试,即PRETCO考试,从阅读本质、表面效度和内容效度等方面探讨了阅读测试的效度,并指出通过明确测试目的、选取高质量的阅读材料和采用恰当的测试问题等方式,可以提高阅读测试的效度。

PRETCO考试;阅读测试;内容效度;表面效度

PRETCO即高等学校英语应用能力考试,是由教育部1998年批准的标准化英语水平考试,2000年正式实施,主要考核高职学生实际应用英语进行日常和业务涉外交际的能力。它已逐渐成为高职高专类学校的统考内容,教育部把该考试指标作为评估学校的硬性标准之一。

PRETCO考试由5个部分组成,即听力、词汇、阅读、翻译和作文。第三部分是阅读理解,即考察学生从书面文字材料获取信息的能力,总阅读量约1,000词,阅读材料涉及的词汇限于《高职高专教育英语课程教学基本要求》所列的词汇表中的3,400词的范围。此部分得分为35分 (占总分的35%),测试时间为40分钟,阅读部分在整个考试中分值和时间上所占比重都很大,因此对阅读测试的效度研究很有必要。

1 阅读的本质

对学生的阅读技能进行测试并使之具有一定的效度,首先必须先明确阅读的本质。阅读就是读者与作者交流的过程,从最小的语素到最大的段落、篇章,最终取得对整片文章的理解。阅读活动是一种多种因素、多向交流与反应的复杂解码过程。从对文字的感知、理解到获得信息,需要经过一系列的心理和物理多种因素相互作用的过程,从而完成多种认识活动。例如:接受“视觉输入” (visual input)信息,激活已有的背景知识,对输入信息的理解,对未输入视觉信息的预测,对未明确表达的概念的推断等。

从心理学的图式理论来讲,阅读不是被动地接受信息,而是积极地把新信息同已有的图式表征的旧知识加以联系,在以往经验的旧知识与新信息相互联系的基础上,通过“同化”与“顺应”而形成的现有的知识结构框架,就达到了阅读理解,启动脑中相应的图式或是使现有的知识系统活跃起来。

Goodman(1967)[1]和Smith(1971)[3]提出了心理语言学的阅读模式,称为“自上而下模式”(topdown)。其中提出:人在阅读的过程中,大脑就像是一个信息加工中心,阅读者根据本人大脑中已有的句法知识和语义知识对阅读材料进行预测,并在阅读过程中逐一证实和修正。这一模式的实质即是:阅读活动实际上是一种语言知识的实践和实现。

后来,拉柏格(Laberge)和萨姆尔(Samuels)提出了一种“自下而上模式”(bottom-up)。该模式强调把材料作为信息输入,阅读者从字母和单词的辨认开始,不断进行信息组合,完成阅读活动。其实质就是把阅读过程看作一种纯粹的语言知识的应用活动。

由此可见,阅读是一个极其复杂的过程,人在阅读时,大脑需要不断的对外界输入的信息进行自上而下和自下而上的综合加工处理。

2 阅读测试的效度

Hughes(1989)[2]指出:阅读测试要准确地反映出被测试者的阅读能力,即测试阅读的效度(validity)。

效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度具体讲,是指一份测试是否测量了设计者所想要测量的东西,或者说,是否测量了设计者所要考查的内容。即便一项考试信度很高,但并没有考到应考的内容,这样的考试效度就不高。所以说效度的高低是语言测试的最基本出发点。

Bachman将语言测试的效度分为以下几种类型:1)内容效度(content validity),内容效度的高低根据测试所包含的具体内容来确定。测量目的是设计者在测试之前必须先考虑的因素,然后确定具体的测试内容。2)结构效度(construct validity),结构效度的高低根据测试项目和其所反映的理论关系决定。比如,语言交际能力测试和语言交际能力理论的关系越大,测试的结构效度就越高。3)标准关联效度(criterion-related validity),标准关联效度的高低源于一项测试在反映学习者水平方面与其他外在评估标准的一致性程度上。4)预测效度(predictive validity),预测效度的高低根据测试能否准确地预测学习者将来的学习成绩而定。某一单项语言测试应该能够预测学习者在这一语言能力方面的水平。5)表面效度(face validity),指测试中根据观察者的主观判断。达到测试预先设想的知识或能力的程度。

效度的分析角度很多,本文只从内容效度和表面效度来分析阅读测试的效度。

内容效度(content validity)指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。如果要测试一个人的学习成绩,应该按照教学大纲和教学目的来设计测试内容;如果考试的目的是测试阅读理解,应该提供专业性不强、被试者比较熟悉的材料。表面效度(face validity)指测试应达到的卷面标准,测量的内容与测量目标之间是否适合,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多被试者没有学过的方言词汇,那么这次测试缺乏表面效度。表面效度是测试出被试者正常水平的一种保证因素。

例如,在英语阅读测试中,经常会遇到对某个词的测试。例如2010年6月A级英语考试第43题“forewarn” (Line 2,Para.4) is used in the passage to refer to____.本题要求考生根据上下文的来推测“forewarn”的含义,但是很多考生根据上下文也难以选出正确答案。而如果有些考生最近碰巧看过这单词,根本不需要通过上下文就能轻而易举地选出正确答案。而且这种方法所能测到的词往往很少,因此具有极大的偶然性和随机性,该测试的内容效度就很低,从而影响了测试的效度。

在2010年12月的A级考试中,有如下两个阅读理解问题:

36.In the author’s opinion,which of the following is vital for a company to be successful?

A.Specialized knowledge B.Highly-skilled staff

C.Exceptional talent D.Teamwork skills

40.What is the best title of the passage?

A.Team Building B.Problem Solving

C.Communication Skills D.company Management

第36题考核考生能否根据文章内容来进行推理判断,也可以视为主旨大意题,通看全文也不难发现答案是D Teamwork skills。因为文章的第2、3段落的内容都是围绕这个主题展开,40题则要求考生找个最佳标题,即主题思想,这与36题作者的观点相一致,所以36题直接影响了40题答案的选择,正确答案即为A Team Building。根据项目反应理论[4],一个考生对试卷里各个题目的反应在统计上是独立的,这就是说,他对某个题目的反应不应影响他对别的题目的反应;一个题目的内容不应对其他题目提供任何提示。所以在某种意义上来说,它违背了项目反应理论。从表面效度来看,它达到了卷面标准,且“符合”设计者的考察要求,但从内容效度来看,测试的内容覆盖面程度不高,从而影响了考生的成绩信度。

3 阅读测试效度的提高

测试与考生的实际水平之间是存在差别的。但是,从某种程度上来说,以能力为主的考试可以有效测试学习者的实际水平和能力。要有效提高阅读测试的效度,必须要做到:

1)明确测试的目的。从内容效度上来讲,测试者首先要明白阅读测试的目的、测试的对象、被试者的语言能力和阅读能力层次。针对不同阶段、不同水平的学习者,测试者才能设计出效度高的阅读问题。

2)选取高质量的真实的阅读测试材料。根据要测试的阅读能力,选择学习者合适的、比较熟悉的阅读材料,为了保证阅读测试的内容效度,选择阅读材料时要注意:

①所选材料的长度和篇数要适当。对于非英语专业的专科学生,每篇阅读材料的字数要控制在250词左右,一般以4-6篇为宜。

②阅读材料的类型要真实多样。选取的材料要贴近生活,而且要具有多样性。比如在2007年6月的A级考试中,阅读第三篇涉及到一则药物说明NUROFEN RECOVERY(纽洛芬去痛片),阅读第五篇讲的是Life Insurance。在2007年12月的A级考试中,同样在阅读第二篇讲到劳动合同Terms and Conditions of Employment,在现实生活中,人们常常会遇到此类问题,对考生来讲,这类材料是真实存在的。

③避免选择某一文化氛围太重的文章,以免某些学生因不熟悉文化背景而影响理解;也不要选择学生十分熟悉的题材,因为学生可能完全凭借背景知识来解题。这样就无法真正测出学生的阅读能力。比如2007年12月的A级考试,阅读第一篇主要介绍了墨尔本这个城市,有以下两道题目:

36.Melbourne is well-known in the world for its____.

A)large population B)educational institutions

C)transport system D)beautiful parks and gardens

38.Melbourne people are very interested in____.

A)sports B)sunbathing

C)sightseeing D)traveling

这两道题目考生完全可以根据自己的文化背景来找到答案,墨尔本作为澳大利亚第二大城市,享有文化重镇和体育之都的美誉。因此36题目答案为B,喜欢网球和F1赛车的考生不难发现38题的答案为A。

④语言难度要适当。避免在文章中出现太多的生词,一般生词量不超过文字的2%就可以。

3)选择恰当的测试问题。避免设计的测试题目考生根据一般常识就能回答。测试者应多采用考查语言运用水平的题型,尽量使试题多样化。在历年的PRETCO考试中,阅读题型也会兼顾多样化,除了传统的选择题,还设置了填空、回答问题和某一领域专业词汇匹配题。

事实上,测试者很难设计出一份完美的试卷。有些考生可以采用一些与阅读理解无关的应试技巧就可以回答问题。这些方式包括排除法、常识推理法、推测法、或者在前后的测试题目中发现相关线索等等。所以,测试者要尽量避免这类题目的出现。

4 结语

从理论上讲,测试中所反映出的被试者的水平必须与他的实际水平完全相同。但实际上,由于测试题目设计的内容效度、表面效度等客观原因或考生精神紧张,心情不好,缺乏考试经验等主观原因很难做到。要想达到理想的阅读测试效度并不是一件容易的事情。测试者要选择合适的阅读材料、设计出高质量的测试题目;同时还要考虑被试者的语言水平和阅读能力层次、被试者的文化背景等等。所有这些都属于内容效度的范畴。如果能够综合地考虑到上述种种因素,就会使得测试能最大限度地反映被试者真正的阅读水平,体现被试者的实际阅读能力,达到较高的测试阅读效度。

当然,作为英语语言工作者,也应该掌握一些语言测试理论,不能只凭感觉出题或随意从一些文章或参考资料中信手拈来一些现成的试题来测试学生。在命题时,为保证试题的质量,必须在试题的选材和题型上狠下功夫。只有科学有效地测试学生的阅读能力才能有利于提高教学效果,促进教与学的共同发展。

[1]Goodman,K.S.Reading:A Psycholinguistic guessing game,Journal of the Reading Specialist[J].College Reading Association,1967,(6):259-264.

[2]Hughes,A.Testing for Language Teachers[M].Cambridge:CUP,1989.

[3]Smith,F.Understanding reading[M].New York:Holt,Rinehart,and Winston,1971.

[4]刘润清,韩宝成.语言测试和它的方法(修订版)[M].北京:外语教学与研究出版社,2000.

[5]李卿,任素贞.英语阅读测试的效度研究 [J].鸡西大学学报,2008,(5).

[6]刘润清.论大学英语教学[M].北京:外语教学与研究出版社,1999.

[7]易兴霞.从效度、内省法看我国英语阅读测试[J].广东教育学院学报,2000,(4).

On the validity of reading materials in PRETCO tests

ZHANG Xiao-ping

(Education Research Institute,Nanjing University,Nanjing,Jiangsu,China 210093;Basic Courses Department,Changzhou Institute of Mechatronic Technology,Changzhou,Jiangsu,China 213164)

As an important part of language tests,reading test aims to check students’reading ability.Validity is an important means to ensure the goal.By analyzing the reading materials in PRETCO tests,the essay explores the validity of reading tests from perspective of the essence of reading test,face validity and content validity.The validity of reading tests can be improved by defining the testing purpose,choosing proper reading materials as well as adopting proper questions.

PRETCO tests;reading test;content validity;face validity

10.3969/j.issn.1671-9581.2012.03.023】

G424.74

A

1671-9581(2012)03-0089-04

2012-05-01

张晓萍(1979-),女,陕西渭南人,常州机电职业技术学院基础部讲师,南京大学教育研究院在读硕士,研究方向:英语教学。

猜你喜欢

内容效度测试者被试者
COSMIN方法介绍:评价患者报告结局测量工具内容效度的评分系统
德西效应
德西效应
搜救犬幼犬挑选测试
指纹收集器
儿童花生过敏治疗取得突破
英语专八阅读理解部分内容效度的历时对比研究(2009—2017年)
小议语法测试
为什么我们会忍不住发朋友圈?
大学英语新四级阅读理解内容效度研究