APP下载

何安平谈语料库与语言教学*

2019-08-22广东外语外贸大学华南师范大学何安平

语料库语言学 2019年1期
关键词:主题词语料语料库

广东外语外贸大学/华南师范大学 何安平

1.语料库资源和技术的利用主要适用于哪些教育教学环节?

从宏观视角看,语料库资源和技术可渗透到课程教育的四大板块,包括:

(1)课程标准制定和教学大纲设计。例如,其目标语词汇和语法附表的来源依据。

(2)教材编写。例如,语言输入的选料原则和练习活动的设计理念。

(3)课堂教学(见后文)。

(4)课程评估。例如,建设题库及对学生口笔语语料库作分析。

其中最有作为的板块当是教材编写。典型的教材包括:(1)20世纪末Willis & Willis的Collins COBUILD English Course(1988);(2)21世纪初Sinclair的Reading Concordances(2003);(3)McCarthy的Touchstone(2006);(4)Burdine & Barlow的Business Phrasal Verbs(2008)等。他们都明确表示这些教材完全是基于语料库编写的(corpus-based),如(1)、(2)、(4);或者是受语料库信息指引的(corpus-informed),如(3)。

从微观视角看,语料库资源和技术可以走进课堂教学的各个环节。包括:

(1)课前备课。例如,课本内外的语料选辑、微本制作。

(2)课堂呈现。例如,聚焦批量语言事实的呈现。

(3)启动探索。例如,基于语言频数信息和局部语境分析和归纳语言应用的典型型式和规律。

(4)课后巩固。例如,让学习者课后到更大规模语料库验证探究结果。

其中最有作为的环节是教学资源收集和堂上实料观察分析(具体可参见上述的教材编写案例)。由此可见,只要有批量化语料存在的教育教学环节,语料库作为资源和应用技术都有用武之地。

2.您认为利用语料库开展语言教学在理论和方法上有何特点和优势?

利用语料库开展语言教学有两大特点:一是凸显语言的使用频数;二是关注语言的使用语境。前者有助于判断教学内容的价值,例如,高频的词语往往代表语言使用的趋向性、核心性和典型性,可据此做出教学次序或重点的决策。后者有助于获取语言在真实语境中的意义和功能,从而实现语言形式、意义和语用在教学中的结合。语料库的这两大特点在教育理论和方法上至少有两大优势:

(1)语料库辅助语言教学能与当今大教育和学科教育中的语言课程改革理念对接。因为基于批量语言事实获取语言知识,探索语言运用规律,进而提升对语言真实使用的敏感意识,体现的是一种归纳式和探究式的现代教育理念。

(2)语料库辅助语言教学能与当今“互联网+”的现代教育技术整合,体现当今信息化、数据化、可视化的教育技术发展成果。语料库经典的界面,如索引行(concordances)和各种词频表(如word list、keyword list、n-gram list)的最大优势是将大量繁杂的语料加以“瘦身”,使得观察视角高度聚焦,而且观察界面可便捷切换,信息可迅速提取和储存。因为视野决定目标,“当你直面大批量语言实例时,你对语言的看法会截然不同”(Sinclair 1991:100)。

有人认为,语料库只能局部性、碎片式地解决一些词汇语法层面上的教学问题;尤其对目标词项的检索看似主观选定,“空降”而来。我认为不然。如今语料库在语言教学中的应用已经从词汇拓展到语篇乃至语域,突出表现为围绕单个或批量语篇开展的关键词(或称主题词)研究。这种由计算机自下而上驱动,并通过对比频数而提取的关键词,排除了人为的主观认定,成了揭示语篇本质属性的有效指针。它们直接指向语料的主题大意、文体风格乃至立场态度。基于语料库的关键词理念更拓展出多种短语形态的意义型式。例如:

(1)“关键性语块”(key clusters/bundles/n-gram list),指复现频数达到并超过所设门槛的多字语块;也可指按照主题词提取原理通过对比目标库语块表和参照库语块表所获得的显著性高频语块;

(2)“关键性短语”(key phrase),指基于名词类主题词衍生的多字语块(详见Panunziet al.2010:463-468);

(3)“短语框架”(phrase frame),指基于纯频数提取的非毗邻式多字语块(2-8字),语块内部除有一个变体外其余的都相同;

(4)“主题词链接”(keywords links),指在设定搭配范围内主题词之间的共现(详见Scott 2014:237);

(5)“关键性语块”(aboutgram),指基于搭配频率自动生成的不连续的短语型式(详见Warren 2010:118)。

这些拓展式与单个主题词统称为语篇的主题性(keyness)。它们所构建的语篇内在意义网络,能更加充分地揭示语篇的主题、文体和认知立场内涵。国外已有学者从词频表和主题词表切入提取主题隐喻以揭示作者对命题的隐含立场态度(Philip 2010);或者使用主题词、核心主题词链接和短语框架分析游记类话语的历时性嬗变(Gerbig 2010);又或者通过对比主题词和主题语块来探寻不同学科话语的知识构建观(Malavasi & Mazzi 2010;Cacchiani 2018),后者还将研究成果转化为二语高级写作的课程教案。国内早期对语料库主题词和主题语块研究多用于学习者与本族语者的写作对比(如甄凤超 2002;李文中 2003)或中外新闻话语的对比分析(如李文中 2007;高超 2006;钱毓芳 2010)。近来也有从专题话语主题词和主题短语切入,开展商务英语主题式教学研究,以促进商科基础知识构建和学科话语能力同步提升(Chen & He 2018:31)。可见,语料库研究的频数优势已经从20世纪60年代关注哪个多哪个少(如口笔语对比)发展到90年代关注哪个核心哪个典型(如语言意义单位分析),再发展到如今对语料库信息组织方式的语用探究(Hunston 2016)。

3.您能否介绍一下国内外较早利用语料库开展语言教学的典型案例?

国外较早利用语料库开展语言教学的莫过于20世纪90年代初Johns率先倡导的“数据驱动学习”(Data Driven Learning, 简称DDL)。具体是在语言教学中采用语料库的索引分析工具呈现一批目标词的索引行,通过引导学生观察目标词的周边词来归纳其词汇共选和语法结构共选型式,以此解决易混淆词或多义词的学习难点。例如以下两例教学活页的截图(摘自Johns 1991)

图1 CONVINCE-PERSUADE 索引练习

图2 SHOULD 索引练习

这两个为研究生学习语法而设计的例子分别源自25万词次的“New Scientists”杂志语料库和76万词次的“交通与公路工程”出版物语料。每个目标词分别提供20例索引行的活页。例1用了40分钟准备语料,堂上学生用不到10分钟解决了问题;例2备课用4小时,课上用45分钟。虽然教师备课花时间不少,但其优势在于“能激活学生的问题意识和探究精神,能让教师成为学生探究的引领者和协调者,能重新审视以往规约性语法教学,能发展学生从真实语料库中归纳型式和总结规律的能力”(Johns 1991:4)。

在国内,较早开展语料库辅助英语教学的是华南师范大学外文学院的语料库团队。它从1998年起开设本科师范生语料库辅助英语教学课程,陆续延伸至硕士生、博士生课程以及该校承担的大、中、小学英语教师 “国培”级、“省级”及“市镇级”培训班。以下是两例教学PPT截图1。

图3 广州市萝岗区某小学老师设计的语音教学案例

图4 广东珠海某中学教师设计的join与 & take part in辨析活动

早期的语料库课堂教学应用大多使用语料库检索软件的索引功能,针对语言学习中某个词汇或语法问题提供10-20条有局部语境的实例让学生观察分析。这一点被后来的学者(如Braun 2007)视作选择性的、碎片式的语料库辅助教学,所以有必要从DDL转向教育需求驱动(needs-driven)的语料库辅助教学。于是在21世纪初国内外许多学者(如Braun 2005,2007;Flowerdew 2008;McCarthy 2008;Frankenberg-Garcia 2010;何安平 2010)提出了“语料库教学加工”(Pedagogical Processing of Corpus,简称PPC)的口号,主张将语料库辅助教学纳入日常教学的主流课堂,即教师利用语料库丰富教学资源和教育技术,并且根据日常教学目标量身定做语料微本(mini files);而学生则通过语料库检索观察,不仅解决词汇语法学习难点,也培养了阅读和写作等核心能力,由此引发了新的研究选题。

4.基于语料库开展语言教学研究的主要选题和难点有哪些?

目前国内基于语料库开展的语言教学研究仍侧重对学习者的产出语料分析,尤其是将外语学习者和母语者的语料进行对比。从课程教育角度看,这是对教学之后的学生产出作评估,固然能够获得有益的教学反馈和参考。然而,我认为更应该重视的是运用语料库理念和技术手段开展教学之前和教学过程的探究,也就是加强对“语料库教学加工”的研究。其核心内涵包括:(1)建设基于语料库的多模态教学资源库。(2)将语料库的理念和技术引入日常课堂教学。(3)师生共同探究语料的典型特征、使用规律和意义功能,以达成日常的教学目标。

第(1)方面的选题涉及如何整合语料库资源和多媒体教育技术,打造优质语言教育教学平台。研究的难点有二:一是如何收集适合不同需求的学习者的优质教学资源,包括高校各学科专业,或基础教育各学段的教材、读物和学生的口笔头语料;二是如何在现今各校各单位自行建设小规模教学语料库的基础上整合并互通有无,从而避免重复和资源浪费。目前国内外都有相关课题在寻求这方面的突破。例如,欧盟资助建设的跨国青少年外语学习平台Sacodeyl(https://www.um.es/sacodeyl/),它的语料由欧洲7种语言的青少年用各自母语围绕32个话题开展结构性对话的视频转写而成,被统一赋码而且设计成各种外语学习活动供全欧洲的中学生免费使用(Pérez-Paredes & Alcaraz 2009:56-57)。又例如,英国伦敦大学学院研发了专供中小学师生免费使用的英语语法多模态教学资源库网站Englicious(www.englicious.org),内含语法教案、互动练习、探究项目和教学视频等(Aarts & Smith-Dennis 2018)。再如,北京外国语大学、华南师范大学、外语教学与研究出版社组织全国各地一批中学教师合作研发的“基于语料库智能学习的读写能力培养平台”2,等等。

第(2)方面的选题可聚焦如何将语料库技术与其他现代教育技术整合。虽然上述的多模态资源平台建设已经融入了不少多媒体技术,然而就目前国内高校而言,语料库和其他教育信息技术这两个方面的教研人员仍然缺乏沟通与合作。其深层原因可能还是学科壁垒。华南师范大学曾将师范教育的《语料库辅助英语教学》与《多媒体信息技术》这两门本科课程对接。先在前一门课程的作业中,布置学生针对中学英语教学的重点难点问题,使用语料库理念和技术手段加以解决,形成案例;然后带到后一门课程的作业中,添加多媒体技术,制作成图文音视频加网络教学课件;再带到教育实习中试用和改进(He 2015)。这也可视为整合两者的一种尝试。

第(3)方面的研究课题更加广泛,但要突破的难点至少有三:一是语料库研究如何与一线教师的教学需求对接;二是语料库应用于语言教学的效果如何评价;三是语料库应用如何与语言学习理论互动提升。浏览近几年的“教学与语言语料库”国际研讨会(Teaching and Language Corpora,简称TaLC-2014、TaLC-2016、TaLC-2018)的网页,发现国际知名语料库教学专家们的大会主旨发言很值得借鉴,其中包括:

(1)Gabrielatos(英国知山大学)谈如何开展功能语言学理论、学习者语料库分析、频数探究和教材评价的多维互动研究,构建以教学问题为导向的、基于语料库的词汇语法学习路径(Pedagogy-driven corpus-based lexicogrammar,TaLC-2018)

(2)Anthony(日本早稻田大学)谈大力开发语料库语言学教学方面的软件程序(A view to the future in corpus tools development,TaLC-2014)。3

(3)Ellis(美国密歇根大学)谈利用语料库探究语言使用规律、语言习得规律和知识构建规律(Corpus linguistic investigations of construction usage and construction learning,TaLC-2014)。

(4)Hunston(英国伯明翰大学)谈语料库的型式语法如何与构式语法对接,为学习者提供1000个词汇语法构式(Towards one thousand constructions: Rethinking the learner's understanding of lexis and grammar,TaLC-2018)。

(5)O'Keeffe(爱尔兰利默里克大学)谈DDL与二语习得的接口,探讨DDL到底激活了学生哪些认知潜能,以及显性/隐性习得理论对DDL的启示(Throwing the pigeon among the cats - Data-Driven Learning and the second language acquisition interface debate,TaLC-2018)。

5.语言教师利用语料库开展教学研究,应具备哪些分析技术和方法?

教师要运用语料库开展教学研究,需具备的语料库基本能力在广义上可界定为“使用语料库技术调查语言并促进学生语言发展的能力”(the ability to use the technology of corpus linguistics to investigate language and enhance the language development of students,Heather & Helt 2012:417)。其中用语料库调查语言的技术和方法并不难掌握。例如,在互联网上免费下载的、特别适用于教研的“小蚂蚁”(AntConc 见注释3)。通常在半天内就能学会其基本操作(包括加载语料、提取目标词索引行、呈现其分布概貌、提取其周边的搭配词表、提取某语篇或某语料库的词频表、主题词表等等)。此外,还有大批网上可免费在线检索的巨量语料库4来实现对某个词、某种句型、某种语域话语的检索5。

然而,我认为比语料库技术和方法更为重要的还有两个方面。一是教师自身的语言敏感意识提升,即能够从批量语料中发现有意义的现象,进而归纳成语言使用的范式。例如,对批量索引行的观察可采用“逢30进一”的方法:即先看头30例索引行中目标词周边词语在拼写形式、语法结构和语义趋向等几个层面上的相同点或相似性,初步形成目标词的一个或多个使用范式;接着再看另外30行,一边验证之前的范式,一边补充新的内容;如此几个“30行”的回合,就大致归纳出目标词在扩展意义单位中的典型意义和功能(详见Sinclair 2003: xiii,xvixvii)。这种批量实例观察、归纳总结、凝练范式的过程“正是以往语言教学中很欠缺的智力技能”(同上:x)。

二是教师自身的教学意识提升。据我以往20多年语料库教学经历发现,很多教师学会了使用语料库检索工具之后,就问要去哪里找语料库,要带多少语料进课堂,要选择哪些语言点来实施语料库辅助教学,要如何将语料库活动融入常规教学活动等等。而要解决这些问题,教师首先得熟悉自己教授的课程目标或教学大纲的要求,了解学生的需求和现实水平。例如,目前最新版的高中英语课程国家标准提倡“英语教学应以主题意义为引领,以语篇为依托”,“对主题意义的探究应是学生学习语言的最重要内容,直接影响学生对语篇理解的程度、思维发展的水平和语言学习的成效(中华人民共和国教育部2018:1,14)。而针对内容主题的语料库关键词探究正是一个很好的切入点。具体实施可包括根据教学内容的话题发动同伴和学生收集和选择相关的多套教材或课外阅读语料,建成专门话题(主题)微型语料。然后从微型库的关键词入手,构建主题的核心内容导图;再基于关键词及其拓展短语型式的使用情景创设教学活动;或者在教材已有的情景活动中聚焦对主题内容的语言表达形式、语义趋向及语用功能等等。之后,将与教学活动相关的语料制成教学微本(可以是15-20个例子,也可以是几百到几千字的语篇)带入课堂教学。当然,教师得根据每个活动的目标自己先行分析过微本,获得解决问题的步骤和结果,然后再思考教学的引导性话语(例如设计提问语或做事步骤)。这既是“语料库教学加工”的过程,也是语料库辅助教学能力提升的过程。

6.基于语料库的语言教学应用前景如何?哪些方面有待进一步挖掘?

在当今大数据背景下,语言教学的环境、资源、教学和评价模式正在发生革命性的转变。语料库以其海量语言资源和自动检索技术的特色已经超越了传统的纸质教材和课堂黑板教学环境而进入了网络化的学习时代,其中包括多校联合,乃至全球共享的教学语料库资源和智能学习平台。目前发展的一个趋势是语料库辅助的语言教学已经从互联网进一步走进了移动学习平台,开创无界、无时差、更加个性化的学习时代。例如,美国杨百翰大学Mark Davies在2018年推出面向语言学习者的iWeb语料库检索平台(可在手机上使用)。它通过大数据链接了2000万个网页,9.5万个网站,拥有140亿词次的语料,可据此自建任何话题的语料库,可检索最常用的6万个英语词,不仅呈现其索引行、词性、定义、同义词、词丛,还能即时链接到与之相关的网页、话题、发音、图像、视频乃至100多种语言的译文(Davies 2018:20)。

再如,欧洲最早做语料库语言学的英国伦敦大学学院“英语用法调查”(Survey of English Usage,SEU)研究团队,这几年从事的知识转化和教育创新项目研发了系列手机APP程序,其中包括“英语语法互动教学程序”(iGE)、“英语学术写作教学程序”(AWE)和“英语拼写与标点教学程序”(ESP)(Mehlet al.2016;Aarts & Smith-Dennis 2018)。这些手机APP程序最大的特点是瞄准基础教学和高等教育的语言课程目标,从相关的大型语料库选择一批适合学习者年龄段和水平的真实语料,经过教学加工之后,转化为可在手机上使用语料库工具检索的、可进行多界面切换的、配有简明教学的指导讲解和练习活动,还能即时评分并记录学习发展轨迹。虽然这些手机应用的开发还面临诸多方面的挑战,然而语料库应用于语言教学已经从DDL发展到PPC,正迈进APP时代。

注 释

1.图3引自华南师范大学外文学院周榕主持的教师教育国家级精品资源共享课程《中学英语教学设计》第16单元《语料库辅助教学设计》课件。图4引自He(2015:98-113)。

2.系由何安平、许家金主持的全国教育科学“十三五”规划2017年度教育部重点课题“基于语料库智能学习平台的读写能力培养研究——以英语学科为例”。

3.他与Paul Nation联合开发的各学段学习者英语词汇水平自动听读写测试软件PVST已于2017年推出免费使用,见http://www.laurenceanthony.net/software/pvst/。

4.如https://skell.sketchengine.co.uk/run.cgi/skell、http://corpus.byu.edu、http://wse1.webcorp.org.uk。

5.具体操作示例可参考何安平等(2017)编著的《语料库辅助英语教学入门》和梁茂成等(2010)编著的《语料库应用教程》。

猜你喜欢

主题词语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
《语料库翻译文体学》评介
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
《中国骨与关节杂志》2016 年第五卷英文主题词索引
基于JAVAEE的维吾尔中介语语料库开发与实现
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入