基于美剧《欲望都市》剧本台词语料库的短语动词检索与口语教学
2015-12-11王静
王静
摘要:能够娴熟使用具有习语性的短语动词体现了英语口语的地道性。影视剧本台词文本库中蕴含了大量的习语性短语动词。本文自建了欲望都市台词文本库,运用搜索软件检索出文本库中具有习语性的短语动词,指导如何将检索到的短语动词用于英语口语教学。
关键词:文本库;习语;短语动词;数据驱动学习
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2015)31-0171-03
一、引言
20世纪90年代初Tim Johns提出了一种基于语料库的外语学习方法(data-driven learning,简称DDL):数据驱动学习。它的主要思想是学生对语料库呈现的批量语例进行观察、推断和归纳,自行发现语言特征和规律。与此同时,Sinclair开创了语料库驱动的短语学,强调词语序列的频数和定量分析(Sinclair 1991)。随着计算机技术的普及,越来越多的教师发现,文本是保存数据的主要形式。对批量文本进行搜索和操作,可以发现文本背后数据的规律性和特征性(詹宏伟 2013)。梁茂成也提出研究者需要特殊语料时,可以自己动手搜集一些文本,建立一个小型的语料库(梁茂成 2010)。鉴于此,数据驱动教学的理念和做法日臻成熟。本研究基于自建的美剧《欲望都市》剧本台词语料库,利用检索软件检索出台词中出现频率最高的前20位短语动词,为数据驱动口语学习的模式打开了一个新的视角。
二、《欲望都市》台词剧本与短语动词
美剧《欲望都市》由美国有线电视HBO出品并自1998年开播,连播6年。全剧共六季,94集。该剧自播放以来,深受观众好评,将艾美奖、全球奖最佳喜剧、最佳女主角、最佳女配角等奖项一举收入囊中。故事主要描述了四位现代都市单身女性寻找爱情,体会大都会城市生活的故事。《欲望都市》的剧本台词富有美国大都会职业妇女的动感和时尚气息,成为经典的英语口语学习内容。
在英语口语之中,短语动词因其数量众多,语义丰富而成为口语的基本特征之一(陈怡 2009)。可以这么说,在口语中能否熟练运用短语动词对英语口语的地道性有着举足轻重的作用(杨惠中 2005)。从结构上说,短语动词的是由“动词加上介词”、“动词加上副词”或“动词加上副词再加上介词”三种形式构成。从语义上说,同一个短语动词的某些义项可能是习语性的,某些义项则可能不是习语性的(骆世平 2006)。本研究集中关注的是如何检索习语性动词短语并将其用于英语口语教学。
三、剧本台词语料库的操作方法
本研究从网络途径收集齐全该剧共六季、94集的英文台词,建成台词文本语料库。
1.文本清洁。由于网络途径获得的文本存在各种不合规范的符号和格式,进而影响到检索结果的正确性和可靠性,需要对批量生文本进行清洁与整理。免费软件“文本整理器”专为文本格式整理而编写的,可处理单个或批量文本。打开文本整理器界面,设置所需进行清洁的格式转换,即可对批量的剧本台词文本库进行整理。见下页图1和图2。
2.文本赋码。对短语动词进行检索需要借助其语法结构,这就要求对清洁后的文本进行词性赋码。本研究中使用的词性赋码工具是免费软件TreeTagger,利用该软件对所建台词文本语料库进行词性赋码。考虑到一些动词有大量的屈折形式,出于本研究的目的,需要把同一个动词的屈折形式归并到一起,视为同一个词。因此,在用TreeTagger进行赋码时,同时运用该软件对文本库进行词形还原,便可生成如下页图3所示界面。
3.检索软件与检索步骤。本研究中所使用的检索软件为免费软件AntConc。该软件由日本早稻田大学Laurence Anthony博士研究开发,是一个语料库文本分析工具。它有七大功能模块:Concordance、Concordance Plot、File View、Cluster、Collocates、Word List、Keyword List,并且支持使用正则表达式进行搜索(何安平 2004)。动词短语的语法构成为“动词加上介词”、“动词加上副词”或“动词加上副词再加上介词”,因此对文本数据词性的检索与分析可以借助正则表达式。经过对Tree Tagger赋码集的观察,三个相对应的正則表达式分别为“\S+_VV\w*\s\S+_IN”、“\S+_VV\w*\s\S+_RB”、“\S+_VV\w*\s\S+_RB\s\S+_IN”。
下图4示范了第一种检索方式。通过正则方式搜索出的高亮词组还需要进行人工抽查、检验和校对。
4.检索出的动词词组进行频数统计。利用AntConc软件中的Concordance标签,对从第三步检索出的动词词组进行频数统计。输入所要检索的动词词组,点击start键,出现的索引行界面如下图5所示。
四、数据分析
通过利用Concordance标签对《欲望都市》(全六季)剧本台词文本库进行语料检索和频数统计,下表列示出该台词文本库中出现频率最高的前20位短语动词。
在《欲望都市》台词文本库中出现较多的短语动词还有check on,kick in,drop by,fall into,fit into,hang on,make for,reach for,screw in,throw in等。由于《欲望都市》电视剧题材为婚恋类,因此与恋爱交往相关的短语动词出现较多,如下图6所示。
五、以“学生为主体、教师为主导”的数据驱动学习模式在英语口语教学中的运用
国家中长期教育改革和发展纲要中指出:以学生为主体,教师为主导,充分发挥学生的主动性,把促进学生成长成才作为学校一切工作的出发点和落脚点。数据驱动学习的教学法充分体现了学生的主体作用以及教师的主导作用。教师激励学生独立观察语料库中呈现的批量索引行,自主探讨和发现索引行背后隐藏的语言特征以及搭配规律。这种教学法充分体现了以学生为主体的特点。然而数据驱动学习大规模的实践却未能展开,部分原因是因为现成的大型语料库中的索引行高密度、大容量,缺少语言的语境背景,使得一些学生感到畏惧或抵触。教师的主导作用可以克服这些困难。教师预先通过复杂检索对所需呈现的索引行进行控制(Sinclair 2001),从而使得课堂中呈现的批量索引界面有助于激发学生的兴趣和主动性。此外,播放与所研究索引行相对应的视频,可以给文本提供语境。Widdowson就认为:如果要意识到语言的使用,必须对其重新语境化(recontextulization)(2000:7)。因此,运用影视剧本语料库进行口语教学一方面发挥了学生的主体和教师的主导作用,另一方面可以克服数据驱动学习模式的一些现有局限性。
六、结语
本研究展示了教师发挥主导作用,通过数据驱动学习的模式激发学生发挥主体作用。在这种模式下,教师首先通过自建影视剧本台词文本库,借助一些语料库的检索软件,搜索到在英语口语教学中某个特定语义框架下的高频习语性短语动词。在课堂上批量呈现索引行的同时,播放与之相对应的视频,为所学习的索引行提供语境。学生发挥主体作用,在教师引导下,对口语的语言特点和习语性短语动词的意义以及搭配法进行分组探讨,最后由教师做总结归纳(陈怡 2011)。当然,本研究中所展示的仅仅是剧本台词文本库,如果需要找到与研究的索引行相对应的视频片段,对教师来说时间和精力都是巨大的挑战。因此,影视剧本台词文本库的下一个发展方向将是语料检索与音视频定位同步播放的多媒体语料库(李文中 2009)。
参考文献:
[1]Sinclair,J.Corpus,Concordance,collocation[M].Oxford:Oxford University Press,1991.
[2]Sinclair,J. 2003. Reading Concordances.London:Pearson.
[3]Widdowson,H. G. On the limitations of linguistics applied[J].Applied Linguistics,2000,1(1):3-25.
[4]陈怡.影视语料与当代英语口语解析[M].上海交通大学出版社,2009.
[5]陈怡.融合多视角的影视剧本语料库与英语口语教学[J].西安外国语大学学报,2011,(4):61-66.
[6]何安平.语料库语言学与英语教学[M].北京:外语教学与研究出版社,2004.
[7]何安平,等.语料库在外语教育中的应用—理论与实践[M].广州:广东高等教育出版社,2004.
[8]李文中.Multimedia Corpus Positioning Concordancing[Z].上海:語料库语言学发展战略研讨会,2009.
[9]梁茂成,李文忠,等.语料库应用教程[M].北京:外语教学与研究出版社,2010.
[10]骆世平.英语习语研究[M].上海:上海外语教育出版社,2006.
[11]杨惠中,卫乃兴.中国学习者英语口语语料库建设与研究[M].上海外语教育出版社,2005.
[12]詹宏伟.语块的认知加工与英语学习[M].杭州:浙江大学出版社,2013.