APP下载

测评、教学与学习的衔接
——第三届语言测试与评价国际研讨会暨第五届英语语言测评新方向研讨会述评

2018-02-08杨帆吴莎

中国考试 2018年2期
关键词:外语量表测试

杨帆 吴莎

(教育部考试中心,北京 100084)

为落实中英两国教育部部长签署的《中英教育合作伙伴行动计划》,在教育部的指导下,教育部考试中心与英国文化教育协会于2017年12月2日至3日在上海联合举办“第三届语言测试与评价国际研讨会暨第五届英语语言测评新方向研讨会”。会议以“测评,教学与学习的衔接”为主题,围绕语言能力标准、人工智能技术在语言测试中的应用、外语教学及测试的改革与发展等议题进行深入的交流和讨论,探讨外语测评在教学和学习中的作用,推动语言测评、教学和学习三者的共同发展。来自欧美、亚太地区等23个国家及国内的专家学者、国际教育机构的500多名代表参加了会议,这是2017年度全球语言测试领域规模最大的会议。

教育部党组成员、部长助理郑富芝出席本次会议,与英国文化教育协会代表进行了会晤,并在大会开幕式就我国外语教育改革及外语能力测评体系的建设发表讲话。他指出,推进外语教育改革,提高国民外语能力,是为实现“两个一百年”奋斗目标提供强有力智力支持和人才保障的重要举措。教育部把外语能力测评体系建设作为推动考试综合改革的一项重要工作,三年来取得了卓有成效的进展。顺利完成中国英语能力等级量表研制,加快建设英语能力等级考试体系,积极推进中国英语能力等级量表与国际知名英语考试的对接研究等。他还提出要用新理念、新技术、新方式推动外语考试改革,增强相互间的沟通与合作,促进外语教育发展。教育部考试中心主任姜钢在会议采访中指出,语言测试与评价国际研讨会是教育部考试中心在中国举办的年度学术研讨会。2017年和英国文化教育协会联合举办,是落实中英两国教育部部长签署的《中英教育合作伙伴行动计划》、促进教育合作交流的一项重要活动。会议旨在为中国及其他国家地区的外语教学、测试领域的研究人员,以及考试机构和教育政策制定者提供外语教学、学习和测试交流的平台。他还简要介绍了外语能力测评体系建设的进展,指出教育改革,标准先行。中国英语能力等级量表即将出台,国家英语能力等级考试将逐步推出,为各类英语考试与测评提供了衡量能力的指标体系,有助于促进英语教、学、测的协调发展。

本届语言测评国际研讨会为期两天,包含大会主旨发言、专题论坛、平行论坛等多个环节。主旨发言邀请到多名国内外语言测试知名专家学者,包括广东外语外贸大学刘建达教授、英国文化教育协会首席专家Barry O’Sullivan博士、上海交通大学金艳教授、美国哥伦比亚大学语言测试专家James Purpura教授、英国兰卡斯特大学语言测试专家Luck Harding教授。同时设置两个大会专题论坛,多名与会专家分别就“语言能力量表”及“人工智能技术在语言测试中的应用及研究”进行专题讨论。平行论坛涵盖多个专题,近70场学术报告,围绕语言能力量表研究、人工智能技术的应用研究、外语教学及测试的改革和发展动向等话题展开学术交流。本文就大会主要内容进行简要概述。

1 语言能力量表研究

语言能力量表,是对语言使用者运用语言能力的一系列描述,由低到高覆盖不同的级别,用于描述语言能力发展的不同阶段[1]。自20世纪50年代起,语言能力量表在国外逐步发展,迄今已有60多年的历史[2]。然而我国的语言教学环境和教育体制与其他国家和地区存在差异,并不适合直接采用或照搬现有的语言能力等级量表,需要立足于中国国情和国内英语教育现状[3]。2014年9月,国务院发布的《关于深化考试招生制度改革的实施意见》中明确提出要加强外语能力测评体系建设,三年来,在教育部的领导下,教育部考试中心及数百位国内外一流专家共同努力,中国英语能力等级量表的研制工作已顺利完成。

本次国际研讨会上,国内外多名语言测试专家、量表研制团队专家及成员通过大会主旨演讲、语言能力标准主题论坛、中国英语能力等级量表专题论坛及平行论坛报告等多种方式,对量表研制理念、方法及成果进行了全面介绍,与会专家对中国英语能力等级量表取得的成果给予了高度的肯定。国内专家认为外语能力测评体系建设卓有成效,体现了外语教育发展方向,提供了贯穿各学段的测评依据,有助于推动外语教育“一条龙”。参会高校教师和研究机构代表认为量表倡导学以致用,有助于弥补学生综合语言运用能力弱的“短板”,将对教学产生积极导向作用。国外学者认为量表研制过程科学、严谨、规范,在多方面填补了国际同类语言标准的空白,为国际语言教育贡献了中国智慧。

1.1 中国英语能力等级量表的研制

刘建达教授在大会主旨演讲中,就中国英语能力等级量表的研发背景、研制过程及主要内容和成果进行了简要概述,指出中国英语能力等级量表聚焦语言运用,借鉴国际经验并基于大规模实证研究,将我国学习者的英语能力分为基础、发展、熟练三个阶段,每个阶段包含三个级别,即“三段九级”,并且创新开发了语用能力、笔译能力及口译能力标准,填补了国际同类语言能力标准的空白。中国英语能力等级量表是国内首个面向全体学习者的英语能力测评标准,为各级各类英语学习、测试提供共同能力目标参照,为各种英语考试的能力目标衔接定位提供共同标尺。量表将有助于解决我国各项英语考试标准各异,教学与测试目标分离,学习目标不连贯等问题,促进英语考试质量的提升,促进英语教、学、测的协调发展,实现英语教学“一条龙”和多种学习成果的沟通互认。他在发言中还就中国英语能力等级量表的使用提出了相关建议,指出量表必须在实践中不断发展,在英语教师、测评工作者和学习者的共同努力下不断完善。

1.2 英语考试与中国英语能力等级量表的对接工作

目前,中国英语能力等级量表的研制工作已顺利完成,许多国际知名英语测试机构已积极与量表研发团队沟通,开展国际语言测试与量表的对接工作。英国文化教育协会首席专家Barry O’Sullivan在大会主旨演讲中提出,语言测试与能力标准的对接意义重大,能够有效确保标准、实施以及评价三者的一致性,对语言学习产生积极影响。同时他对中国在如此短的时间内完成量表研制工作表示高度肯定,指出我国量表在翻译能力和语用能力上的经验值得借鉴,量表研制符合国际规范。

根据中英两国教育部部长的协议,英国英语考试与中国英语能力等级量表的对接研究工作已全面启动。Barry O’Sullivan在发言中总结了中国英语能力等级量表的特点,阐述了英国英语考试与中国量表对接研究的理论框架及研究方法,指出对接研究已完成了阶段任务,计划于2018年完成中国量表与雅思和普思两项英语测试的对接工作。

1.3 语言能力量表在教学、测试中的应用

语言能力量表为语言教学和测试提供了标准,如何将量表更好地应用于语言教学和测试也成为与会专家关注的焦点。

上海交通大学金艳教授以语言能力标准在衔接英语教学与测试中发挥的作用为主题发表了大会主旨演讲。当前很多语言测试都在开展与语言能力标准的对接工作,但如何通过对接更好地提升语言教育仍然值得探讨。金艳教授在发言中简要介绍了中国英语能力等级量表研发的基本原理,肯定了其在语言教育中的重要意义,并从高校英语测试改革的角度,论证了语言能力标准、国家课程标准和测试间的关系。她同时指出量表在外语教学与测试中的应用前景及可能的挑战,并提出应保证量表的持续验证、有效实施,强调了量表使用过程中合理监管的必要性。

美国哥伦比亚大学语言测试专家James Purpura教授从社会语言学的角度对语言测试进行了深入解读。当前不少测试更多地关注语言的使用功能,如学习者能用语言做什么。使用语言完成任务的能力固然重要,但语言的语用功能对交际的意义是不可替代的。James Purpura教授的发言以写作测试为例,强调了语用功能的重要意义,学习者的语言能力应当包含语言使用功能和语用意义两个层面。最后他指出,尽管语用意义较为复杂,在操作层面上挑战较大,但在语言教学学习和测试中忽略语用功能是不可行的,仍然需要对此进行教学以及考查,以确保语言学习的有效性。中国英语能力等级量表以交际语言能力模型为基础,关注语言学习者的语用能力和翻译能力,进而能够更好地对外语教学和测试产生积极影响。

剑桥大学考试委员会测试研发总监Nick Sav⁃ille主持了题为“语言能力量表”的专题讨论,来自中国英语能力等级量表研制团队的专家何莲珍教授、张文霞教授,教育部考试中心吴莎,西班牙教育部的Neus Figueras研究员,日本东京大学的Negishi Masashi教授共同参与,分别就各国语言能力量表的发展及应用现状展开热烈讨论。Neus Figueras从目标、特点及影响三个方面总结了欧洲语言共同参考框架(Common European Framework of Reference for Languages)的发展。Negishi Masashi教授结合日本语言测试发展现状,简单介绍了欧洲语言共同参考框架在日本的发展历史、现状以及未来的发展前景。浙江大学何莲珍教授以中国英语能力等级量表中的听力能力量表研制为例,详细介绍了能力描述语研发的过程,并通过与欧洲语言能力框架的对比,总结了中国英语能力等级量表的特点。教育部考试中心吴莎和清华大学张文霞教授基于近期的实证研究,探讨了中国英语能力等级量表将对国内英语教育产生的影响,同时也就可能出现的担忧和挑战提出相关建议和解决办法,指出量表下一步的发展方向:如何更好地与外语教学及测试相结合,促进国内外语教育的改革与发展。此外,在语言能力标准平行论坛中,多位与会专家学者从多层面、多角度共同探讨了中国英语能力等级量表以及国外语言能力标准的现状和应用。

2 人工智能技术在语言测试中的应用及研究

人工智能的迅速发展在不断改变着人类的社会。为加快国家科技建设,把握发展机遇,2017年7月国务院发布了《关于推动新一代人工智能发展的实施意见》(以下简称《意见》)。《意见》指出,要建设安全便捷的智能社会,其中明确了智能教育的发展。为积极响应推进人工智能的国家战略和国际教育领域的最新发展趋势,人工智能技术在语言测试中的应用及研究也是本次会议的主题之一。教育部党组成员、部长助理郑富芝在会议致辞中也特别提到,信息技术的发展日新月异,语音识别、人工智能技术的应用为推动外语考试改革打开了新思路,提供了新路径,为测评的发展带来新的面貌,为教育考试现代化开拓了新的空间。本次会议吸引到众多相关领域专家及科技公司的技术人员积极参与,围绕语音识别、口语和写作自动评分及自适应考试等方面展开研讨。

英国文化教育协会首席专家Barry O’Sullivan主持了“人工智能技术在语言测试中的应用及研究”的专题讨论,来自英国剑桥的评价专家、美国培生教育专家以及我国讯飞启明和流利说技术公司的专家分别就口语和写作的自动评分技术与参会人员进行交流和讨论。

英国剑桥评价专家Helen Yannakoudakis以写作自动评分为例,指出实现自动评分和反馈的重点在于如何使评分系统基于输入数据对新的数据进行判断。因此,就自动评分系统而言,除了机器算法的选择之外,数据输入是否具有代表性、如何提取重要的语言信息都是决定性的影响因素。同样,讯飞启明公司的技术专家魏思也就写作自动评分系统在大规模考试中的应用实践进行分享,指出了未来的发展方向,比如如何评估创造性或艺术性文本,如何实现篇章逻辑性的评价等。

流利说技术公司专家林晖以口语的形成性自动评估为题,对口语和写作、形成性与终结性评估进行了比较,从大数据的角度总结了语音识别的发展现状,并指出该技术目前的挑战及未来的发展方向。美国培生教育专家Ali Van Moere从语言学的角度就口语的终结性评价进行了探讨。基于不同的评价目的及输出语言的受限程度,口语任务分为不同类型。在朗读、重复对话、给出事实性信息等任务中,考生的语言输出很大程度上受限于材料输入,在观点、批判评价等口语任务中,考生的语言不再局限于材料输入,而是关注到语言的内容、流利度等方面。如今限定类口语任务自动评分的准确度已达到90%以上,未来需要攻克的挑战之一是如何从社会语言学的角度,实现自动评分系统对语用功能的评价。英国文化教育协会首席专家Barry O’Sullivan在对专题论坛进行总结时指出,人工智能技术在语言测试的应用已逐步发展推广,但仍有未知的领域亟待探索,需要各位专家的不懈努力,使其更好地服务于语言测试的变革和创新发展。

除专题论坛外,共有来自国内外的数十位专家学者就此话题在大会平行论坛进行了分享。浙江大学陈达建探讨了视觉信息在机试听力中对考生产生的影响。英国文化教育协会的Richard Spiby以普思英语测试为例,分享了测试改进中的框架创新。流利说技术公司林晖介绍了大规模自适应语言测试以及语音识别技术在分班测试中的广泛应用。

3 外语教学的改革及发展

本次会议基于语言教师的评价素养和教学能力评估两个话题,对当代语言教师提出更高要求,探讨了外语教学的改革及未来的发展方向。

3.1 语言教师的评价素养

评价素养是指个体在评价过程中所需的专业知识和技能,这一概念早在20世纪90年代就已经出现,但直到近些年才逐渐进入语言测试领域,如2011年“第33届语言测试研究学术研讨会”召开了以“评价素养”为题的研讨会,2013年《语言测试》也就此话题发表专刊进行探讨[4]。教师评价素养是教师教学能力的重要组成部分,测评对教学的反拨作用以及教师对测试的理解将直接关系到教学的质量。而在我国,一般的教师都没有接受过语言测试方面的培训,缺乏必要的教师评价素养[5]。本次国际研讨会专门开展有关“语言教师评价素养”的平行论坛,为各位与会专家学者提供交流的平台,加强对教师评价素养的关注,推动其在外语教育中的发展,促进我国外语教育事业的发展。

英国兰卡斯特大学Luck Harding教授以“语言评价素养的过去、现在和将来”为题发表了大会主旨发言。他强调了评价素养的重要意义,并简要回顾了语言评价素养在过去20年的发展历史。从多个维度对评价素养进行分析,并探讨比较了相关群体对此的不同需求。他指出,语言评价素养应关注到语言中的“意义”,评价素养到评价交流的转变是十分必要的。

为期两天的平行论坛讨论中,来自中国、英国、韩国、越南、新西兰等十余位专家学者就语言教师测评素养的话题进行了分享。韩国建国大学Hyoshin LEE分析了韩国国内英语教育的现状,指出韩国当前外语教育存在的各种问题,如课程标准与教学、测试目标不一致,外语教师缺乏必要的评价素养,等等,同时肯定了课程标准、教学与评价三者间对接的必要性,以此提升教师的评价素养,推动外语教育的发展。越南河内工业大学Tue Hoang院长基于一项质性案例研究探讨了越南高校教师的外语测评素养,同时强调了测评素养在外语教师专业发展中的重要作用。英国文化协会高级研究员Vivien Berry围绕“评价素养对外语教师意义”一题展开讨论,通过一项实证研究说明外语教师对提升自我评价素养的需求。同时她还指出,中国英语能力等级量表在教学中的应用能够有效提升语言教师的评价素养。

3.2 语言教师的教学能力评估

语言测试不仅可以测量学生的语言能力,同时可以间接地反映教师的教学能力和水平。本次会议开展了以“教师语言教学能力评估”为主题的平行论坛,吸引众多专家学者展开讨论。越南平阳大学Nguyen Le Duy Hai以一项旨在提升该国外语教师语言能力的国家课题为例,指出现有措施及测试未能对教师的专业发展乃至课堂实践产生积极影响,并分享总结了该国的经验和教训。伊朗德黑兰大学Sayyed Mohammad Alavi教授针对外语听力教师在课堂中的诊断能力展开论述,基于一线教师的实证研究,为教师培训工作者提供一定的启示。

4 外语测试的改革及发展

本次国际研讨会就外语测试的改革及发展方向展开研讨,分设两个专题:面向就业需求的外语测试和教育体系下的招生及毕业外语测试。

4.1 面向就业需求的外语测试

习近平总书记在讲话中多次指出,为适应全球化发展的时代特点,提高我国参与全球治理的能力,增强我国在国际上说话办事的实力,需要一大批具有全球视野、熟练运用外语、通晓国际规则、精通国际谈判的专业人才。现如今,越来越多的行业发展都离不开外语人才,而测试作为人才选拔的重要手段之一,如何在就业需求中更好地发挥作用、提升学生的就业能力,早已成为测试界关注的重要话题。本次会议的主题之一就是面向就业需求的外语测试。

浙江大学罗兰基于一项实证研究,探讨了课堂评估对医学生专业英语学习产生的积极影响,指出了课堂评估的重要性和必要性。香港理工大学Al⁃an Urmston以大学毕业语言水平测试(GSLPA)为例,对高校毕业生及招聘人员的写作水平进行研究,分析了高校教育能否满足学生的就业需求。英国文化协会的Johanna Motteram结合英国就业现状,探讨了护理行业与雅思考试的关系,试图解决全球劳动力供给问题。美国培生教育Mike Mayor在发言中指出,当前多数职场人员外语能力无法满足就业需求,分析了原因并提出解决办法,将全球英语水平测试标准与职业能力相对接。同时他还提出,不同职业对语言能力的要求有所差异,因此,相应的评价方式应当结合职业特点有所变化。

4.2 招生及毕业外语测试

与会专家结合教育体系对于学生语言能力的要求与期望,对招生和毕业外语能力测试进行深入的探讨,以期对外语教学产生积极的反拨和引导作用。

中国人民大学陈倪基于国外高校的招生录取,就几项入学外语测试的有效性进行探讨,同时强调了外语测试在全球化教育体系中发挥的重要作用。浙江大学闵尚超以一项学校内部听力测试为例,对学生听力能力进行分析,以优化听力课程设计、提升听力教学。台湾科技大学黄达夫分享了该校在提升学生外语能力的经验,结合职业院校的学生特点,设计了适应学生能力水平的教学材料和毕业测试,为台湾高等职业院校的英语教育带来一定的启示。马来西亚玛拉工艺大学Suchithra Nair介绍了其国内一项面向学生就业需求的外语毕业测试,从考试的设计、发展及实施等方面分享了经验。

5 小结

本次国际研讨会深入探讨了语言测评、教学和学习间的相互作用,涉及语言能力量表、人工智能技术等多个话题,与会专家学者共同分享了国内外外语测试领域最新的发展现状和动向。国内专家在会上向社会公布了中国英语能力等级量表。教育部考试中心副主任于涵在大会闭幕式上指出,此次会议切合中国教育改革方向,促进了相关领域专家学者的学术交流。此外,在此次研讨会上,教育部考试中心与英国文化教育协会宣布推出“联合研究资助计划”,双方将共同资助围绕中国英语等级量表的研究项目,推动国内外语言测评专家就中国英语能力等级量表开展深入研究。本次会议取得了丰硕的成果,为语言测试及教育的发展和改革指明了新的方向、提供了新的方法。

[1]NORTH B.The development of a common framework scale of lan⁃guage proficiency[M].New York:P.Lang,2000.

[2]韩宝成.国外语言能力量表述评[J].外语教学与研究,2006,38(6):443-450.

[3]刘建达.我国英语能力等级量表研制的基本思路[J].中国考试,2015(1):7-11.

[4]林敦来,武尊民.国外语言评价素养研究的最新进展[J].现代外语,2014,37(5):711-720.

[5]杨惠中.有效测试、有效教学、有效使用[J].外国语,2015,38(1):2-26.

猜你喜欢

外语量表测试
网络服装虚拟体验的概念模型及其量表开发
幽默大测试
胸痹气虚证疗效评价量表探讨
“摄问”测试
“摄问”测试
“摄问”测试
外语教育:“高大上”+“接地气”
大山教你学外语
大山教你学外语
三种抑郁量表应用于精神分裂症后抑郁的分析