APP下载

探究大学英语四、六级考试功能的多重性及由此引起的问题

2012-04-29桂敏

教育教学论坛 2012年45期

桂敏

摘要:进入21世纪人们对大学英语四、六级考试(以下简称为CET)的争议从未停止。本文通过剖析CET的测量学属性,分析了它的多重功能,即CET具有很强的选拔和区分功能,一定的判断学生是否达到课程教学要求的功能,以及测量学生实际运用英语能力。从分析中得到的启示是CET复杂的测量学属性和多重功能有可能是引起人们对CET争议的原因之一,为了让CET更好地发挥它的作用,CET应该使其功能单一化。

关键词:大学英语四、六级考试;常模参照的测试;尺度参照的测试;学业考试;水平考试

中图分类号:G640 文献标志码:A 文章编号:1674-9324(2012)12-0110-03

一、引言

大学英语四、六级考试对中国英语教学和学生英语水平的提高起了较大作用,但是进入21世纪后对它的争议从未停止(如韩宝成,2002;刘润清,2003;钱冠连,2003;陈祖芳,2004;韩宝成 戴曼纯等,2004;王初明,2006)。有学者质疑CET是否准确地测量学生的英语水平(如蔡基刚,2007;韩宝成、戴曼纯等,2004)。有学者关注CET对大学英语教育和学习是否有促进作用。有些研究表明CET对大学英语教育和学习带来负面影响(如井升华,1999;牛强,2001;肖云南 罗晓英,2002;李炯英,2002;高远,2003);有的研究结果表明它的正面反拨效应大于其负面反拨效应(如辜向东,2007;叶菊仙,1998)。对CET进行改革已是大势所趋,教育决策者、CET研究开发单位和语言教育专家都从不同的视角提出CET的改革发展方向(张尧学,2003,2008;金艳,2004,2006;王初明,2006;蔡基刚,2007)。基于分析CET复杂的测量学属性和它的多重功能,本文探讨了对CET争议的原因。

二、CET的测量学属性

分析CET的性质是理解对CET争议的重要视角之一。它本身是一个什么性质的考试,考试研发者期望它能满足什么样的功能,而质疑者认为它应该是什么样的考试,它应该在社会和教育界起什么样的作用,角度不同,答案也不一样,因此分析他们之间的偏差可以更好地理解对CET的争议。用来描述语言考试和评估的专有名词很多。根据不同的解释测试结果的参照系,心理测量研究人员通常把测试分为标准参照(criterion-referenced)和常模参照(norm-referenced)考试;根据考试内容选取的依据,考试通常分为学业考试(achievement test)和水平考试(proficiency test)(Bachman,1990;徐强,2000;束定芳 庄智象,1996);根据不同的评估型式,考试分为形成性(formative)和终结性(summative)评估。下文将以测试的不同分类方法为视角对CET的测量学属性进行剖析。

1.CET是常模参照-尺度相关的考试。心理测量理论认为如果测试的结果是参照某一标准进行解释(语言能力等级量表或教学大纲标准),该考试被称之为标准参照。比如雅思把语言能力分为十个等级,每一个等级用语言进行定性的描述,达到某个等级就表示该考生能用语言完成所描述的功能。根据雅思的能力等级量表如果一个考生“有能力运用英语,虽然在某些情况有时会发生不准确、不适当和误解,基本上能很好地掌握复杂的英语句子,也能理解推理的细节”,该考生的语言能力为七级。而常模参照考试是以某一常模作为参照系来解释考生的成绩。常模是由测试单位选取的,呈正态分布的用均值和标准差来进行描述的标准化样组。考生的成绩是以它在常模中所处的位置来解释的。如果某一考生的原始分数与常模的均值大一个标准差,他的能力就可以解释为比84.13%的考生强。因此,从分数解释的参照系的角度出发,CET是常模参照性的考试。常模是由北京大学,清华大学,上海交通大学,复旦大学,中国科技大学和西安交通大学本科生组成。这样选取常模是因为考试的最初设计测量对象是重点大学本科生。后来CET扩展到全国普通高校,并用小于常模均值一个标准差作为及格线(杨惠中&Weir,1998;杨惠中 金艳,2001;蔡基刚,2007)。CET也是尺度相关的考试。杨惠中和Weir(1998:30)认为“这一常模的建立和某种事先确定的标准密切相关”因而称之为尺度相关。CET研发中心按照国家教育委员会颁布的《大学英语教学大纲》(1985)中的要求:“重点大学经过一定时期的努力,基本上达到大纲所规定的四级要求”,把“基本上”理解为85%的学生达到要求。这样常模累计比例85%,比平均分小一个标准差的分数就定为及格分。经过线性转换,100制的60分就成为及格分;得60分的考生就达到了大纲所规定的四级要求。但是,自2005年起,CET总分改为710,平均分为500,标准差为70的常模正态分数,它的尺度相关的测量学属性逐渐淡化。

2.CET是学业考试和水平考试的结合体。根据考试内容选取的依据,考试分为学业考试(achievement test)和水平考试(proficiency test)。前者的测试内容以教学大纲为依据,后者的测试内容以语言理论为基础(Bachman,1990;徐强,2000;束定芳 庄智象,1996)。CET考试的内容基本上以大学英语教学大纲为基础。比如教学大纲对听、说、读、写、译的速度和难度有量化的要求,CET也基本上是按教学大纲的量化标准考察学生的五项技能。所以,CET能对学生学完大学英语课程的结果进行一定的考核。从这个意义上讲CET是学业考试。CET也是水平考试。CET是基于分立语言测试、综合语言测试和交际语言测试理论的测试(杨惠中 金艳,2001)。基于五个分项(听力、阅读、词汇与结构、完型填空和写作)的相关系数分析以及因素分析,CET研发中心历时三年的效度研究证明CET“能够准确而有效地反映学生总的语言水平”(杨惠中 & Weir,1998:61)。因此,CET也是建立在语言能力理论和语言测试理论研究的基础之上的水平测试。

3.CET是终结性的考试。根据考试的型式,教学考试或教学评估一般分为形成性和终结性评估。形成性评估是对学生的学习进展的评估,是在教学过程中为改进教与学而进行的评价。形成性评价注重对学习过程的指导和改进,强调评价信息的及时反馈,旨在通过经常性的测评,提高学生的学习效果,并改进教师的教学(Black & William,2003)。它的形式多种多样,譬如学生自我评估,学生相互间的评估,教师对学生的评估。终结性评价是指在一个学习阶段末,对学生的表现与能力所做的评价,它关注的是学习的结果。前者被称作是为了学习而进行的评价(Assessment for learning),后者是对学习进行的评价(Assessment of learning)。CET是在学生完成一段时间的课程学习(一般为四个学期)对他们进行英语综合能力的评价,所以它是终结性评估。综上所述,CET是常模参照-尺度相关,融合了学业考试和水平考试的特点,对大学生的综合英语水平进行终结性评价的考试。

三、CET的多重功能

一个测评系统能够发挥什么样的功能是与它的性质密切相关的。首先,CET是常模参照的考试,所以它具有很强的选拔和区分功能。它是标准相关的考试,所以它对考生是否达到大学英语教学大纲的基本要求或较高要求能进行判断。其次,CET融合了学业考试和水平考试的特点,因此它能在一定程度上判断学生是否达到课程教学要求,满足教育管理者对督促教师贯彻教学要求和对教学效果进行评价的目的。它也能从一定程度上评定学生的英语水平,满足社会对毕业生求职者的英语水平进行量化评判的要求,也满足了打造“中国的民族品牌”与其他国家的大型标准化英语考试竞争的目的。最后,CET能对学生学完大学英语课程后进行终结性的测评。总之,目前的CET身兼多重功能。这种多功能的考试在上个世纪对教学和社会都起到了积极的作用。但是随着人们对测评系统的专业化程度和精确度要求越来越高,这种多功能的考试引起了越来越大的争议。

四、CET多重功能的局限性

对CET的争议与其性质和功能是密切联系的。有些争议是由它的多重功能之间的矛盾性引起的。下面讨论对CET的两个主要的争论:CET对大学英语教育和学习的影响;CET是否能准确测评学生修完大学英语四、六级课程后的英语语言水平。CET对大学英语教育和学习影响的研究结果并不一致。有的研究结果表明它的正面反拨效应大于其负面反拨效应(如辜向东,2007;叶菊仙,1998)。有的调查结果显示它有很大的负面效应(如韩宝成 戴曼纯等,2004)。虽然对CET的反拨效应的调查研究不多,但认为CET对大学英语教育和学习带来负面影响的人却不少(如井升华,1999;牛强,2001;肖云南 罗晓英,2002;李炯英,2002;高远,2003)。对CET的质疑部分是由它的功能之间的矛盾性引起的:为英语教学服务和为社会对语言能力测评需要服务。这两者之间虽然有统一性,但随着社会对专业化需要越来越强,他们之间的矛盾日渐突出。他们之间的统一性在于能力高低的相关性:如果某个学生能很好地完成教学要求,他在学业考试中就会获得高分,他在水平考试中也很可能得高分,虽然两种考试的目的和内容不一样。不同考试之间的相关性往往会掩盖他们的差异性。但人们对测试标准的要求越来越高,他们之间的差异性就会逐渐显现。首先,为教学服务的学业考试内容和重点可变性强,而基于能力结构的水平测试是相对稳定的。教育政策对教学要求和教学重点有很强的指导性,而教育政策是经常变化的,这样基于教学要求的学业考试重点和内容也会不断地变化。比如,1999年的大学英语教学大纲和2004年颁布的大学英语教学要求差异很大。前者强调培养学生较强的阅读能力,后者突出要求学生的听说能力。教学大纲和要求的改变使得CET的内容和比重作出相应的改变。张尧学(2008)明确指出CET必须随着教学大纲的改变而改变。若干年之后,由“听说领先”改为“读写领先”也不是没有可能的,因为能读会写才不是文盲。但是基于能力结构的水平测试却依然对听、说、读、写有全面的要求。然而水平测试的内容相对稳定,虽然也会变化,但变化的依据是人们对于语言能力的认识,即语言理论。其次,为教学服务的学业考试的主要服务对象是学生,教师和教育管理者,而为社会服务的水平考试的主要服务对象是求职者和用人单位。形成性的学业考试对学生的学习过程进行评估,以帮助学生认清自己的强项和弱项,调整学习重点。考试结果也可以帮助教师调整教学方法、进度和教学重点。终结性的学业考试可以对一段时间的学习和教学进行总的评估,为教育管理者提供信息。而为社会服务的水平考试是对应试者的英语进行测评,为用人单位甄选人才提供信息。学业考试可以对学习的过程或者学习结果进行考评,而为社会服务的水平考试只关注考试结果。王初明(2006)认为CET改革的根本问题是考试如何实用和对谁使用的问题。再次,为教学服务的学业考试的构念(construct)是测评学生的“一般语言能力”,或“是否学会了自主学习和掌握了不断提高英语实用水平的英语学习可持续发展能力”(金艳,2009),而为社会服务的水平考试的构念是测试应试者的“实用英语能力”。学业考试的主要内容是人文、社会、科普,而为社会服务的水平考试的主要内容是日常交际、国际交流、商务、旅游等。学业考试关注学生的“可持续发展能力”,而为社会服务的水平考试的主要使用者更关注应聘者此时此刻具有的实用英语的熟练程度和英语应用能力,他们对学生过去的学习过程和将来的发展可能并不十分关注。总之为教学服务的学业考试和为社会服务的水平考试之间的矛盾性使得CET这样一个兼备学业考试和水平考试性质的测评系统很难充分发挥其为教学和为社会服务的双重功能。

从测量学属性来看,CET是常模参照-尺度相关、融合了学业考试和水平考试的特点、对大学生的综合英语水平进行终结性评价的考试。因此,CET具有多重功能,如:很强的选拔和区分功能,判断学生是否达到课程教学要求的功能,测量学生实际运用英语能力的功能。同时,CET打造了“中国的民族品牌”,与其他国家的大型标准化英语考试进行竞争,为社会对求职者的英语水平进行量化评判提供依据。但是,CET的多重功能性也使其难以满足人们对语言测试系统的专业化程度和准确度的要求日益提高的要求。如果CET能够使其功能更加单一化,目的更加明确,就可以更好地发挥它的作用。

参考文献:

[1]Bachman, L. F. Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.

[2]Black,P.&William,D.Assessment for learning:Putting it into practice(Inside the black box)[M].New York: McGraw-Hill House,2003.

[3]蔡基刚.大学英语四级考试新大纲目标定位修正及其意义[J].外语界,2007,(4):76-82.

[4]陈祖芳.学术讨论要尊重事实——就四、六级考试问题与刘润清先生商榷[J].外语界,2004,(1):74-77.

[5]方绪军.杨惠中,朱正才.制定全国统一的语言能力等级量表的原则和方法[J].现代外语,2008,(4):380-387.

[6]高远.外语教学改革要科学论证和放开搞活[J].外语教学与研究,2003,(3):222-223.

[7]辜向东.大学英语四、六级考试对中国大学英语教学的反拨效应实证研究[J].重庆大学学报(社会科学版),2007,(4):119-125.

[8]韩宝成.高校学生英语能力测试改革势在必行[J].外语教学与研究,2002,(6):410-411.

[9]韩宝成,戴曼纯,杨莉芳.从一项调查看大学英语考试存在的问题[J].外语与外语教学,2004,(2):17-23.

[10]金艳.大学英语四、六级网考的设计原则[J].外语界,2009,(4):61-68.

[11]金艳.提高考试效度,改进考试后效——大学英语四、六级考试后效研究[J].外语界,2006,(6):65-73.

[12]金艳.改革中的大学英语四、六级考试[J].中国外语,2004,(1):27-29.

[13]井升华.我国大学英语教学费时低效的原因[J].外语教学与研究,1999,(1):21-23.

[14]李炯英.中国现行大学英语四、六级考试的问题与思考——兼评国内外相关研究[J].外语教学,2002,(5):33-38.

[15]刘润清.高校英语教学改革笔谈之二[J].外语教学与研究,2003,(3):221.

[16]牛强.现行高校英语测试中的问题[J].外语教学与研究,2001,(2):140-143.

[17]钱冠连.还是要整合性考试——谈纯分析性考试为何是失误[J].外语教学与研究,2003,(5):379-380.

[18]束定芳,庄智象.现代外语教学——理论、实践与方法[M].上海:上海外语教育出版社,1996.

[19]王初明.外语学习的必要条件与大学英语四、六级考试改革的反思[J].中国大学教学,2006,(11):48-51.

[20]肖云南,罗晓英.关于英语测试的改革[J].外语教学与研究,2002,(4):294-299.

[21]叶菊仙.大学英语考试对教学反拨作用的调查和思考[J].外语界,1998,(3):40-43.