口语能力构念及口试任务设计
2022-05-30徐惠琦
摘 要:随着中高考听说考试的推广,口语测试在英语教学中愈发重要。文章重点梳理了口语能力的构念和任务设计。口语能力的概念众多,但可从技能、要素、知识、课程四个方面分别详细解读。口语能力作为听、说、读、写四大语言技能的一项,在考试中不可或缺,但口语考试有一个相对完整的开发循环过程。口语任务多样,可分为个人任务、对子任务和小组任务,各任务均体现了任务的情境是否真实、任务的目的、任务的馈入形式和产出要求及任务的难度等。
关键词:口语能力;口语测试;口语任务
中图分类号:G427 文献标识码:A 文章编号:2097-1737(2022)24-0038-05
引 言
《普通高中英语课程标准(2017年版2020年修订)》(以下简称《课程标准》)在为高考提出具体命题建议时,明确说明了高中听说考试的内容和形式。《中国英语能力等级量表》详细描述了中国英语学习者和使用者的英语能力等级及相对应的表现特征(包括听说能力),为听说教学和测评提供了参考[1]。《中国高考评价体系》也在功能目标、考查内容、考查要求、考查载体和命题要求等方面为听说考试提供了理论支撑和实践指南[2]。
从2011年起,广东省在高考英语科目中增加了听说考试,为听说考试树立了一面旗帜[3]。随后,上海、北京先后实施了人机对话的听说考试。这些高利害考试中,口语都占到相当一部分比重,对基础教育阶段口语教学起到了强有力的正向反拨作用。由于这些口语测试出现时间短,实施范围小,大多一线教师对口试的本质了解得不多。但是,作为四大语言技能之一,口语能力的考评已经从无到有,而且在高利害考试中的占比还有可能由少变多。因此,我们有必要对口语测试的构念及任务设计等进行详细梳理。本文将从口语测评的构念、口语测评的分类、口语测评的任务设计三个方面分别阐述。
一、口语测评构念
语言测试与语言教学密不可分,有效语言测评是语言教学与语言学习之间的桥梁。没有有效测评,教与学是不完整的,口语测评也不例外。
(一)什么是口语能力
不同时期、不同流派的语言学家或学者对口语能力的概念界定不一。潘鸣威提出,口语能力是一种交际驱动下的产出性语言能力,是说话者在特定的语境下,为达成一定的交际目的,并在受众因素影响下综合运用语言的能力[4]。尽管口语能力的概念多样,但均具有一些共性特征,我们可以分别从技能、要素、知识、课程四个方面来解读。
1.从技能角度解读口语能力
在语言教学中,听、说、读、写四大技能可以根据语言的方向来描述。由学习者发起的语言行为(如说和写)被称为产出性语言技能;对学习者有引导性的语言行为(如听和读)被称为接收性语言技能。从语言信息传输的途径来看,语言又可分为口头语言和书面语言。相对于书面语言,口头语言具有即时交互性、情景性、非预测性等特点。总体而言,口语能力是一项产出性的口头语言,难度相对较大(Nunan, 2013)[5]。
Bygate认为口语能力包括微语言技能、常规技能、应变技能三个层次。微语言技能包括语音、语法和词汇知识。常规技能指的是常用的或者典型的口头表述与传递信息的方式,包括日常功能交际用语、叙述事件和描述事物、完成多轮次的交际活动等。应变技能指的是在实际的语言交际中随机应变,以达到交际目的的能力。这三个层面的技能在具体的交际活动中共同协作,各自发挥着不可或缺的作用。
2.从要素角度解读口语能力
20世纪末兴起的交际法认为,人们学习语言是通过与他人交流互动学会的。其中,弱版的交际法(weak version)强调教师在教学生学习各个语言要素的同时,要使用交际活动;强版的交际法(strong version)则认为,教师应该在课堂上为学生提供丰富多样的交际活动以习得目标语言[6]。这样就导致强版的交际法使教师过多地注重语言的交际目标,却相对忽略语言的准确性。因此,對于语言学习者来说,语言的准确性不可或缺,而要提升语言的准确性,就需要掌握语言的各个要素。
口语能力要素最基本的是语篇。真实的口语交际是以语篇形式呈现的。口语的语篇形式又由句子和短语组成。口语能力的要素还包括词汇,而发音是口语能力的关键要素。
3.从知识角度解读口语能力
《课程标准》指出,语言知识包括语音、词汇、语法、语篇和语用知识[7]。学习语言知识的目的是发展语言运用能力,因此我们要特别关注语言知识的表意功能。
需要强调的是,口语能力还涉及文化知识(如图1)。文化知识既包括中外文化知识,也包括显性和隐性文化知识。学生在口语学习中要关注中外文化的异同,汲取中华文化精华,正确认识异国文化,积极增强跨文化交际能力,坚定文化自信,积极传播中国特色社会主义文化。
4.从课程角度解读口语能力
口语能力是四大语言技能之一的“说”,属于表达性技能。《课程标准》《中国高考评价体系》和《中国英语能力等级量表》均对口语能力进行了描述或限定。
《课程标准》将说和写这两项语言技能合并描述为表达性技能,并分别对其在必修、选择性必修、选修三个阶段的具体内容要求做了详细描述。如在必修阶段要求学生能够根据交际需要发起谈话并维持交谈,根据需要选择正式语或非正式语,借助语调和重音突出需要强调的意义等。
《中国高考评价体系》在描述高考英语科考查内容时明确指出,口语表达包含语音语调、词汇语法、语言组织和互动交际,同时描述了反映这四个要素的口语表达能力应具有的四个特征。这四个方面的能力几乎全部涉及上文提到的口语能力要素。同时,该评价体系还提出了口语能力评分标准:第一和第二项标准主要从准确性出发,涉及发音、语调、词汇、语法,以及意义的准确传递;第三项标准主要从流利性出发,强调口头语言的衔接、连贯;第四项则主要从得体性出发,表明为达成交际目的要使用恰当的策略。
《中国英语能力等级量表》根据语言能力描述框架对口语能力进行了描述。具体到与高考相对应的四级及相近的三级,其口语能力描述语参照口语能力的三个层次,从三級到四级,口语技能逐渐由强调微语言技能、常规技能到需要将应变技能运用于人际交流或协商,交流的话题也逐渐由熟悉的话题过渡到感兴趣的话题及日常生活和工作中常见的话题。
综上所述,我们可以说《课程标准》对口语能力的要素和知识构成进行了详细解读,《中国高考评价体系》对口语能力的评价标准做了界定,而《中国英语能力等级量表》则根据口语的语篇输出类型对口语能力的九个级别进行了全方位描述。
(二)为什么要测试口语
英语测试根据测试的目的可以分为选拔性考试、分班考试、学业测试、诊断性测试和水平测试等。无论哪种类型的口语测试,也无论有什么测试目的,它们都体现了一种对口语测试分数的需求。根据这种需求,考试开发者建立了一个测评开发系统,该系统要详细规划测试的开发、实施、评分等过程,保证口语测试的质量,如测试的有效性、科学性、公平性等。测试任务开发好后,口语考官(或人机对话)要对受试者施测。受试者在测试中的表现将纳入评分系统,评分员(包括人工评分员和计算机评分系统)根据先前制订的评分标准和受试者的表现给出相应的评分结果。评分结果最终被对考试分数有需求的利益相关者所使用,如教师、学生、家长、教育行政部门等。至此,口语测试的目的及结果形成一个完整的闭环,口语测评的开发和使用完成一个循环周期(如图2)。
二、口语测试的分类
口语测试可以有多种分类法:一种是按照理论基础的发展顺序,分为结构主义口试和交际口试;另一种是按照测试的内容和方式,分为直接口试、间接口试和半直接口试。当然,与听力和阅读测试一样,口语测试还可以按照测试题型分为客观题、限定主观题和开放主观题。
(一)结构主义口试和交际口试
结构主义口试主要测试说的技能及与说有关的分项技能,常见的题型包括朗读、复述、补全对话、看图说话、问答等。交际口试主要测试社会交际活动中的真实语言交际能力,充分体现上一节中提到的口语活动的特点。常见的题型包括配对对话、面试和小组讨论等。
(二)直接口试、间接口试和半直接口试
口试如果旨在让考生展示自己说的能力,这是直接口试。常见的朗读、复述、看图说话、对话、面试和小组讨论都属于直接口试。这些口语活动瞬间性强,准确打分难度递增,评分一致性的控制难度也变大。因此,这种考试方法效度高,但信度需要特别关注。
间接口试要求考生展示口头表达能力的组成技能,主要指用笔试的方式考查口语能力,如笔试中的辨音题、情景交际题等。这种测试没有让受试者通过口头发声跟他人交流,因此效度较低,但是机器可以取代人工阅卷,评分信度相对较高。
半直接口试又叫录音或人机口试,是让同一批次的考生同时在条件相同的语言实验室中进行人机对话并录音。这是一种不完全真实的交际活动,可以视为对前两种测试方法的一种妥协。这种口试方式能消除考生与考官对话的紧张感,而且事后打分还能增加评分的一致性和口试的信度。这种考试操作性强,但真实性不足。然而,这种考试效率较高,在同一时间可以参考的学生较多,评分在考后进行且能够监控,因此,信度比直接口试有所提高。
(三)客观题、限定主观题和开放主观题
口语能力中的微语言技能,如语音、语汇和语法知识可以通过客观题考查,如采用多项选择题、正误判断题等。但由于这种测试的效度较差,目前已被多数测试开发者放弃。
限定主观题有朗读、情景提问、快速应答、简答、复述、看图说话、提问有脚本的面试等,要求考生用一定长度的口语表达展示出自己的口语能力。
开放主观题是互动交际型的口语测试方式,如灵活提问的面试、情景式角色扮演、小组讨论等。这种题型对考生在不确定的交际中快速思考并随机灵活运用语言的要求很高,开放性也很强。另外,演讲允许学生的作答开放、灵活、多样。这些开放主观题的口语测试主要针对中高级语言水平的学生。
三、口语测试的任务设计
在口语测试过程中,考试开发者通过所设计的口语任务引导学生去“说”。这些任务限定了考试的内容的形式,同时也提供了口试的情境。因此,口语任务的设计在口试开发过程中至关重要。
(一)口语任务的参与形式
根据口语任务中学生的参与形式可将口语任务分为个人任务、对子任务和小组任务。
个人任务主要指一对一的测试任务,可以包括简单的打招呼,描述图片,叙述故事,就某一话题展开论述,就已听、读、看的内容进行讨论,结束谈话等。一对一测试任务的优点是能够有效检测学生的口语能力的,但缺点是费时费力,而且考官的性格、身体条件等均会对分数产生影响,进而影响口试的信度。随着人机对话技术的发展,这些问题大都得到了有效解决。目前人机对话口试的个人任务主要有两类:一是朗读类,包括朗读单词、句子和短文;二是口头描述类:即用英语表述一段话,包括听后转述,根据问题及提示词口头表达,话题简述,根据关键信息和图片表达等。
由于个人任务有局限性,因此对子任务在口试中也经常出现,如简单的打招呼;互相描述一幅图片并点评;描述一组图片,达成一致结论;每人一部分图片,组成完整故事;根据对方描述,合用完成图画;角色扮演,根据情境和角色提问或回答(人机),与一对一的口语面试类似,如广东省高考英语听说考试的Part B Role play部分。
对子任务最明显的优点是相对个人任务来说,省时省力,但同时也有缺点,如同伴口语水平影响受试者分数,口语任务组织管理的质量影响分数,受试者对任务内容不熟悉影响分数,任务形式在人机对话测试中受限等。也有一些相应的解决方案,如尽量保证对子中的两个学生有相同的口语表达机会,也可多准备一些问题或口试任务,甚至要备有重新组织口试的方案。
小组任务由于活动时间长、开放性过大等原因,在较正式的口语测试中并不常见,但在课堂评价中被广泛使用。小组任务中,学生可参与评分,学生参与的过程可录音、录像等,以便评分者更科学、合理地给出分数。
(二)口语任务的目的
口语任务的目的根据侧重点的不同可分为基于构念和基于任务的两种口语测评目的。传统语言测试会将听、说、读、写四项技能分开来测评,口语测试从构念上来说会重点测评口头表达能力,即便是口试任务中涉及听、读或写的能力,也要尽量减少这些技能对“说”的测评结果或最终分数的影响,这就是基于构念的口语测评目的。
基于任务的口语测评目的更强调测评任务和语言使用情境,受试者的得分则根据他们在口语任务中的具体表现而定。尤其是任务型测试更强调任务的真实性及学生完成真实口语任务的效果,如找医生看病,向医生陈述病情。但是,基于任务的口语测评也要在设计任务时考虑到构念。也就是说,测试开发者所设计的口语测评任务要具体体现所要考查的口语能力。
无论基于构念,还是基于任务的口语测评目的,都会影响到考试内容、考试评分标准及考试成绩的解读。最保险的措施是在测试开发过程中充分考量两种任务的目的,保证测试在内容、构念、任务、测试过程、评分标准、分数解读等方面能够真正反映学生的真实口语能力。
(三)口语任务情境的真实性
我们设计口语测试任务时,会遇到任务的真实程度问题。根据真实程度,口语任务可以分为教学性任务和真实性任务。
教学性任务是为了专门测试某种语言使用而设计的测试任务,强调测试与教学的一致问题。总的来说,教学性任务有三个特点,一是根据语言使用目的创设任务,二是形式灵活多样,三是有助于教学或测评。
真实性任务是对现实生活中真正存在的口语交际情景的模仿。这种任务聚焦意义,注重交流,主要模仿日常生活中常见情景或角色扮演,如购物、就医、就餐、出行、参观、借书等。真实性口语任务属于表现测试,即学生的得分是根据他们在完成任务过程中的表现而评定的,而且这种表现测试又有强弱版之分。强版的表现测试几乎是完整复制了现实生活中真实的语言使用情况,评分标准也以是否达成了真实的交际目的为依据。弱版的表现测试关注更多的则是学生是否能够在特定的情境下使用恰当的、特定的语言。至于使用哪个版的表现测试需要根据考试目的确定。当前,大部分口语测试用的都是弱版的表现测试。
例1 In a clinic.
Suppose you are a doctor. Please reassure a patient who is worried about his fever.
强版表现测试评分标准:判断病人是否能够真正得到安慰。
弱版表现测试评分标准:判断病人是否能够充分使用恰当的目标语言。
(四)口语任务的输入内容
口语任务的输入内容主要包括做题说明和语言输入材料。
口语任务的做题说明就是答题时的任务要求,主要内容有总体说明、材料呈现形式(包括书面、音频或二者皆有,或是视频等)、具体任务内容、答题位置、做题时间(含准备时间和答题时间)、题目数量、分值比例等。做题说明还要注意语种的使用,有的做题说明是中文,有的是英文,测试开发者要根据实际需求和具体情境选用。但不论选择哪种语言,都必须简洁明了。
口语任务的语言输入材料需要重点考虑的因素有语言形式、语言风格、语言内容和语言难度。语言形式指输入材料的形式,可以是单词、短语、句子、短对话、长对话和语篇等[8]。口语任务输入材料的语言风格以口头语言为主,书面语言为辅,而且为了体现测试对教学的反拨作用,材料通常不是完全源自生活中的真实的语言,而是需要命题人员精心加工的。输入材料的内容一般会选择受试者熟悉的话题,而其语言难度总体来说低于同级的阅读理解材料。如2021年广东省听说考试Part A的口语输入材料的分析数据见表1。
需要注意的是,在日常的口语测试或课堂测评中,口语任务的输入材料还包括角色扮演任务卡、菜单、日程表、写有要讨论话题的卡片或纸条、图片,甚至实物等。
(五)口语任务的产出
根据产出类型,口语任务可以分成限制性和开放性两种。限制性的口语任务主要指朗读(词汇、短语、句子、语篇)、复述(句子、对话、故事等)、简答(根据实际情况作答)和日常交际应答(功能)。开放性的口语任务主要指描述、叙述、说明、比较、解释、辩护、预测、决定等,主要体现在面试、角色扮演或情境反应等题型中。需要注意的是,在大规模高利害考试中,口语任务多是有限制性的。例如,广东省的故事有10个信息点,每个信息点1.5分。又如,上海市高考听说考试的看图说话,也要求叙述内容与图片相符。而开放性的口语任务因为评分信度问题难以保证不被使用。
(六)口语任务的难度
难度与任务的特征及受试者的能力水平高度相关。一般而言,教学计划及课堂检测中的口语任务要由易到难,而且不同口语测试套题难度要基本相当,保证测试公平。
影响口语任务难度的因素有很多,如输入材料的难度和频次、输入材料中人物及事件的数量、受试者对任务的熟悉程度、完成任务的准备时间及任务的复杂度等。
例如,朗读短文这个题型,如果要求学生在听一遍之后就模仿朗读,则难度较大;如果像广东省一样,先让学生看一遍视频,接着默读一遍原文,然后再听一遍录音,最后才模仿朗读,则难度要降低许多。
结 语
听说考试的推行势在必行,而作为听说考试最重要的一部分——口语测试,在教学中扮演着重要角色。搞清楚口语能力的构念及其内涵,掌握口语任务的设计原理等对口语测试至关重要,我们期待广大一线教师能够在掌握这些理论和概念的基础上将口语课堂测评落到实处,让测评真正为教学服务。
[参考文献]
中华人民共和国教育部.中国英语能力等级量表[M].上海:上海外语教育出版社,2018.
教育部考试中心.中国高考评价体系[M].北京:人民教育出版社,2019.
屈凌云,黄念念.“人机对话”的过去、现在和未来:专访广东外语外贸大学博士生导师曾用强教授[J].英语学习,2017(03):6-9.
潘鸣威,徐雯,冯豫,等.从考试命题迈向科学测评[M].北京:人民教育出版社,2021.
Nunan,D.Practical English Language Teach-ing[M].Beijing:Tsinghua University Press,2013.
Luoma,S.Assessing Speaking[M].Cambridge:Cambridge University Press,2011.
中华人民共和国教育部.普通高中英语课程标准(2017年版2020年修订)[M].北京:人民教育出版社,2020.
徐惠琦.2018年北京市中考听说考试述评[J].名师在线,2019(09):47-50.
作者简介:徐惠琦(1976.9-),女,山西临汾人,
山西师范大学副编审,英语周报社教育教学研究院研究員,硕士学位,曾被英语周报社派往英国剑桥大学和加拿大希尔学院学习语言测试和TESOL课程。2019年被山西师范大学派往北京外国语大学中国外语与教育研究中心访学一年。目前已公开发表学术论文10多篇,参与了中国教育学会“十三五”规划课题“中国中小学英语教师命题能力及提升研究”。