APP下载

文学语料库驱动下的英美文学教学模式探索

2018-04-25张立柱

关键词:奥斯丁英美文学教学模式

张立柱

摘 要:基于自建的简·奥斯丁六部小说语料库,借助语料库文体学的研究方法,通过对软件得出的统计数据、高频词、词表、词簇等进行定量和定性分析,采用数据驱动的发现式学习方法指导英语专业学生进行英美文学课的学习。以语料库驱动下学生细读作品为出发点,通过课外资料查找、课堂演示和小组讨论,把教学从被动的知识传授转化为学习者的主动建构,从而实现课堂的“翻转”和教学效果的提高。

关键词:语料库驱动;英美文学;教学模式;简·奥斯丁

中图分类号:G642.0 文献标识码:A 文章编号:1002-4107(2018)04-0024-04

英美文学课程是我国高等院校英语专业学生在高年级阶段的一门必修课,属于专业知识课程,对于培养学生的语言能力和文学修养都具有重要的作用。在高等院校中,由于就业压力和应用型导向,英美文学课在英语专业的课程设置中不断被边缘化,面临着学时逐渐减少、教材设计简单、师资力量不足、学生基础薄弱等方面的问题。由于大学阶段英语专业教学的特殊性,英美文学课的讲授不适合涉及过多的背景知识和文学术语,而应以英美新批评所倡导的“细读法”为基础,回归文学作品本身,尤其是以文本中的语言为基础来理解和分析文学作品的意义,赏析作家的风格。建构主义教学法强调学生在教学过程中的主体地位,知识和能力需要学习者在一定情景下不断进行学习和实践,最终才能建构和内化所学知识,提高实际能力。当今教育界盛行的以“微课”“慕课”等网络教学资源平台开展“翻转课堂”与建构主义的观点一脉相承。

一、语料库文体学

语料库语言学形成于20世纪50年代,主张语言研究应以真实语料为基础,描写语言使用的客观规律,语料库方法的应用能够提供关于语言运用的数据,从而将定量研究(quantitative research)方法引入语言研究领域[1]。文体学是借助语言学的理论和方法来研究文学作品,考察文学作品中特定语言特征的选择及其所产生的主题思想和艺术效果[2]。文体学是对文学文本的语言分析,语料库语言学是通过电子手段对语言数据进行分析,两者的结合催生出了语料库文体学,即对通过电子手段存储的文学文本进行语言分析[3]。在文体学中,语料库有助于发现语言表象以下无法靠直接经验获得的隐性特征,因为言外之意常常有其特殊的表达方式。在研究作者风格的时候,如果不使用语料库技术,任何关于历史的、文体的研究都将是不完整的[4]。鉴于语料库在文学文本的语言分析和作者风格研究中的巨大优势,以语料库为基础在英美文学的教学中开展“数据驱动学习”(DDL),有利于发挥学习者的主观能动性,培养批判性思维,从而提高语言文化知识的实际应用能力。

二、奥斯丁小说语料库驱动下的英美文学教学模式

(一)建立语料库

18世纪英国著名女性小说家简·奥斯丁的作品都是经典作品,也不失其现代性,她的作品常常出现在当今各大畅销书单中,根据她的作品改编成的影视作品同样令现代观众深深着迷。她的作品也在学生读者尤其是女性读者中广泛传阅,深受欢迎,因此以下将尝试以她的六部小说为例,运用语料库的数据驱动方法对其进行分析,探索英美文学教学模式的改革。

笔者通过古登堡文本库(http://www.gutenberg.org)很方便地采集到了简·奥斯丁六部小说的电子版,并对其进行了除噪、整理、清洁、分词以及简单的标注,建立了一个语料库(约72万词),以下简称为Austen Corpus。同样,大部分没有版权限制的英美经典小说电子版都能在该网站轻松下载。此外,教师还可以通过文本电子扫描(OCR)、网上数字图书馆以及人工录入等方式获取文学作品的电子版。

(二)数据收集与统计

运用WordSmith Tools (5.0版)对Austen Corpus进行分析,可以得到关于该语料库的一些基本统计数据以及词表(word list)和词簇(word cluster),词表可以按频率的顺序也可以按字母表的顺序进行排列。教师可以把词表或词簇制作好以电子版的形式发给学生,供学生观察、学习和研究,或者通过网络平台指导学生使用软件自己生成词表或词簇,这样更有利于学生举一反三,自己制作其他作家作品的小型语料库,用于研究分析。由于Austen Corpus词表中的词达到一万多个,数量可能过大,教师还可以以英国国家语料库(BNC)为参照语料库(reference corpus),提取出Austen Corpus的关键词和关键词词簇,便于缩小学习和研究的范围。

教師或学生在使用该语料库的时候,可以以观察到的某个词或短语为检索词,在语料库中进行检索和分析,从而通过大量丰富的例句开展词汇的教学和学习。由于每个词和短语可以清楚地看到上下文,学生可以在一定的语境中阅读和理解词汇与短语的意思,从而通过反复阅读熟悉作品的内容。

1.基本数据分析。通过对语料库软件得出的一些基本数据进行分析,学生会对作品的语言使用有一个基本的总体认识,这种认识不是主观印象式的、反复不定的,而是具有一定的客观依据和数据支撑的,可以进行合理解释的。比如,标准类符形符比(standardised TTR 或STTR)和平均句长(mean in words)是两个比较常用的指标,前者可以表明词汇的丰富程度,后者可以说明句子的复杂程度,而它们的标准差(standard deviation)则反映了词汇丰富程度和句子长度在整部作品中的变化程度。

简·奥斯丁六部小说的STTR为41.09,比英国国家语料库(BNC)的42.66略低,由于奥斯丁小说选材的范围相对比较小,小说中有大量日常生活中的人物对话,因此会出现词汇丰富程度不如BNC的情况。奥斯丁六部小说中,《爱玛》的STTR最小,为39.87,《诺桑觉寺》的STTR最大,为42.37,其他四部小说的STTR从小到大分别为41.05、41.17、41.41、41.59,相差很小,六部小说的STTR标准差也很相似,在56.34—59.36之间。这表明了简·奥斯丁在这六部小说的创造过程中基本采用了丰富程度相当的词汇,奥斯丁小说的语言在很大程度上具有同质性。

平均句长方面,奥斯丁六部小说的平均句长为18.63,比BNC的20.59略低,主要原因也是对话比较多,所以句子相对较短。六部小说中,《爱玛》的句子最短,为15.40,《劝导》的句子最长,达到了22.87,其他四部小说的平均句长从小到大分别为17.19、19.75、20.21和20.49,总体来说,相差也并不大。平均句长标准差在14.58—20.87之间,区别不大。Rudolf Flesch对英语句子长度与文体的关系做过如下的数字统计[5]。

Very easy(easy prose,mostly dialogue):8 words or less

Easy:11 words

Fairly easy:14 words

Standard(average reader):17 words

Fairly difficult(literary English):21 words

Difficult:25 words

Very difficult(scientific English):30 words or more

簡·奥斯丁六部小说的平均句长为18.63,小于文学类英语的平均值21词,仅略高于标准英语文体的平均值17 词,因此奥斯丁小说在文学类作品中的难度相对不是太大。其中《爱玛》的句子长度15.40,小于标准英语文体的平均值17 词,略高于比较简单的文体的平均值14词,适合大众读者阅读。由于《爱玛》的STTR也是六部小说中最小的,语言基础相对薄弱的同学可以先从这部书开始阅读,逐渐熟悉奥斯丁作品。

2.词表分析。通过比较Austen Corpus里六部小说

《诺桑觉寺》《理智与情感》《傲慢与偏见》《爱玛》《曼斯菲尔德庄园》和《劝导》(表1分别简称为:NA、SS、PP、E、MP和P)的前20位高频词(见表1)也可以观察到,奥斯丁的用词十分相似,六部小说的前20位高频词基本一致,甚至排列顺序都相差不大,说明奥斯丁小说语言风格的一贯性。

从北外CQPweb下载到狄更斯小说语料库(本文简称为Dickens Corpus)的词表(http://111.200.194.212/

cqp/dickens/),提取前20位高频词,连同BNC前20位高频词与Austen Corpus做一个对比(见表2),可以发现这三个语料库前5位高频词完全一样,只是排列顺序有所不同。第6~20位高频词中,Austen Corpus中排第6位的“HER”,在Dickens Corpus中仅排第16位,在BNC中则没有出现。Austen Corpus中排第11位的“SHE”,在另外两个语料库中都没有出现,女性代词的高频率出现表明了奥斯丁小说中的人物以女性角色为主,这也是其显著特色。

从六部小说各自的词表来看,出现频率最高的第一个人名就是小说的女主人公,分别为CATHERINE(第28位)、ELINOR(第32位) & MARIANNE(第42位)、ELIZABETH(第33位)、EMMA(第32位)、FANNY(第29位)以及ANNE(第29位)。而且,Austen Corpus前200位高频词中还出现了“MRS”,“MISS”,“HRESELF”,“LADY”,“SISTER”,“MOTHER”等大量与女性相关的词以及女性人名,也表明了小说的主题主要围绕女性人物展开。除了“MRS”,“MISS”等女性尊称之外,前200位高频词中还出现了“MR”,“SIR”等男性尊称,表明人物间的称呼十分礼貌,与奥斯丁刻画的中产阶级上流社会的惯例相吻合。

3.特殊高频词的检索与分析。如表2所示,Austen

Corpus高频词中有一个词“NOT”,共出现了8565次,排在第12位,而在Dickens Corpus 和BNC中前20位高频词中均未出现,说明奥斯丁小说中的人物以及叙事者惯用否定语气。六部小说中,每千词“NOT”的出现次数从小到大分别为10.48、11.22、11.48、11.75、12.50、13.66,其中《爱玛》中“NOT”出现的频率最高,《理智与情感》最低。基于统计数据,教师可以以此为出发点,引导学生“细读”作品,分析 “NOT”高频出现的原因,发现语言背后所蕴含的文体意义。比如《爱玛》中的伍德豪斯先生就偏爱否定形式,“not unwholesome”在他的对话中出现了两次,通过语言手段,作者成功刻画出了一个胆小怯懦、犹豫不定的人物形象[6]。

以“NOT”为检索词在Austen Corpus中进行检索,同样可以发现一些规律,“NOT”左侧第一位的常用搭配词除了“BE”,“DO”等助动词外,多为“COULD”,“WOULD”,“WILL”,“SHOULD”,“MUST”,“MIGHT”,“SHALL”,“ NEED”,“MAY”,“OUGHT”等情态动词,而且很多还是情态动词的过去时态。从高频三词词簇来看,也能验证这一发现,前200位高频三词词簇中有39个包含否定词“NOT”。前20位高频三词词簇中有6个含有“NOT”,分别是“I DO NOT”,“SHE COULD NOT”,“COULD NOT BE”,“IT WAS NOT”,“IT IS NOT”,“DO NOT KNOW”,其中有2个含有情态动词过去式“COULD”。以BNC为参照语料库提取关键2~5词词簇,Austen Corpus中前20位中有三个含有“NOT”,分别为“COULD NOT”,“SHE COULD NOT”和“I DO NOT”。

Fischer-Starcke以《傲慢与偏见》中两个含有否定式“NOT”的四词词簇“I DO NOT KNOW”和“SHE COULD NOT HELP”为例,分析了小说人物,主要是女性人物在表达对别人的批评,陈述自己的观点以及表露自己感情时所有意采取的委婉、礼貌、含糊的语言策略,以此来符合社会惯例对女性的要求,同时也反映了女性人物内心的不安全感[7]。

除了“NOT”的高频使用之外,Austen Corpus中还有一些其他否定式的用法,如“NEVER”,“NO”的出现频率也很高,教师可以指导学生结合具体例子进一步分析研究。同样以《爱玛》为例。

Her daughter enjoyed a most uncommon degree of popularity for a woman neither young,handsome,rich,nor married.Miss Bates stood in the very worst predicament in the world for having much of the public favour;and she had no intellectual superiority to make atonement to herself,or frighten those who might hate her into outward respect.She had never boasted either beauty or cleverness.Her youth had passed without distinction,and her middle of life was devoted to the care of a failing mother,and the endeavour to make a small income go as far as possible.And yet she was a happy woman,and a woman whom no one named without good-will[8].

這是书中的第三章,贝茨小姐在小说中第一次出场时作者的描述,短短几句话作者用了很多否定词和含有否定意思的词,如“uncommon”,“neither”,“nor”,“no”,“never”,“without”,“no one”等,似乎要把一个又穷又老、既不漂亮又不聪明的“剩女”描述得异常凄惨,但是接下来笔锋一转,这样的一个女子竟然还很受欢迎,活得有滋有味,这种先抑后扬的写作手法不禁让人佩服奥斯丁不愧为“语言大师”,寥寥数语,不露声色,没有借助任何外貌、景物描写,却道尽了社会的世态炎凉,鲜活的人物形象跃然纸上,让人读起来忍俊不禁,同时也深刻理解了那个时代女性的命运。

同样,还有其他一些高频词,通过数据检索和深入分析,结合定量和定性研究,也会有许多新的发现。如,González-Díaz以奥斯丁小说人物尤其是女性人物角色使用程度副词“QUITE”的频率为研究出发点,从社会学和文体学角度深入分析了奥斯丁如何通过人物语言,尤其是女性人物的个人习语来塑造不同的人物性格和特点[9]。

(三)课堂展示和讨论

通过在课堂或课外的语料库呈现和观察,学生可以围绕具体的词语或句子展开研究分析,结合自己的兴趣,形成研究问题,探讨其中的言外之意、修辞特点和文体风格,比如上文中提到的“NOT”的高频使用以及与情态动词的搭配就是一个很好的出发点。在教师的指导下,学生以小组为单位在课外进行资料收集和整理,并在课堂上展示自己的发现和心得体会,使课堂教学设计以教师为中心向以学生为中心转变,学生成为课堂的主体,展示和建构自己的所思所得,并以此为基础展开课堂讨论,从而实现课堂真正意义上的“翻转”。

随着大数据、“互联网+”时代的来临,使用计算机、手机或其他移动平台进行移动学习变得更加便捷和流行,语料库驱动的学习方式是数据运用到教学上的一种形式,对于改进教学方式将具有巨大的潜力,但是语料库如何与教学更好地在具体环节上结合起来仍需要广大教师和学生通过实践进行不断探索和研究。

参考文献:

[1]胡开宝. 语料库翻译学概论[M].上海:上海交通大学出版社,2011.

[2]任晓霏,冯庆华等.语料库戏剧翻译文体学[M].北京:中国社会科学出版社,2014.

[3]Fischer-Starcke,Bettina.Corpus Linguistics in Literary Analysis:Jane Austen and her Contemporaries [M].London: Continuum,2010.

[4]Biber,Douglas,Susan Conrad & Randi Reppen.Corpus Linguistics[M].Beijing:FLTRP,2000:222.

[5]连淑能.英汉对比研究[M].北京:高等教育出版社,2010.

[6]Page,Norman.The Language of Jane Austen[M].Routledge, 2011.

[7]Fischer-Starcke,Bettina.Keywords and frequent phrases of Jane Austens Pride and Prejudice[J].International Journal of Corpus Linguistics,2009,14(4):492-523.

[8]Austen,Jane.Emma[M].北京:中央编译出版社,2013.

[9]González-Díaz,Victorina.‘I quite detest the man:Degree adverbs,female language and Jane Austen[J].Language and Literature,2014,23(4):310-330.

猜你喜欢

奥斯丁英美文学教学模式
群文阅读教学模式探讨
简·奥斯丁的《傲慢与偏见》教会读者什么
简·奥斯丁:别样的“文化研究”
简·奥斯丁:似朋友,似陌生人
“一精三多”教学模式的探索与实践
“导航杯”实践教学模式的做法与成效
5E教学模式对我国中学数学教学的启示