《热爱生命》的语料库检索分析
2015-10-14王婧仪
王婧仪
(南京师范大学 文学院,江苏 南京 210097)
《热爱生命》的语料库检索分析
王婧仪
(南京师范大学 文学院,江苏 南京210097)
本文通过利用Wordsmith Tools软件,对英文小说文本《热爱生命》的总体特征、表达方式、主要情节三个方面进行检索、统计和分析。发现了该文本在人称使用、叙事方式、主题表达、否定词使用以及角色设定等方面的特点。语料库检索分析为该文本的文学分析提供了可靠的量化依据。
《热爱生命》语料库检索分析
自20世纪80年代以来,语料库语言学获得了蓬勃的发展。它为语言学研究提供了一套全新的研究思路和方法,被广泛应用于语言研究的各个层面。伴随着计算机技术和网络的普及、发展,学者们开始利用各类语料库索引软件作词汇搭配、翻译以及中介语的描述和分析。Wordsmith Tools作为一种常用的语料库检索工具,其软件内部主要包含语境共现检索工具(Concord)、词频列表检索工具(WordList)、关键词检索工具(Key Word)、分割工具(Splitter)、替换工具(Text Converter)、浏览工具(Viewer)六种工具。本文主要利用前三种常用的文本检索工具对文本进行分析。
1.总体特征的统计分析
首先,我们对文本进行要进行定量研究,即进行文本的检索和数据的统计。我们把 《热爱生命》的英文文本用Wordsmith Tools软件的词频列表检索工具进行统计,可以得到一些相关的统计数字,如字节数(bytes)、形符数(tokens,指文本一共有多少个词)、类符数(types,指文本一共有多少个不同的词形)、类符形符比(type/token ratio,指形符与类符的比率,即用词的变化性)、标准化类符形符比(Standardised Type/Token)、平均词长、句子数等(如图所示)。
通过以上的统计数据,我们可以根据字节数、形符数和句子数可以推断出这是一个较短的文本。该文本的类符形符比为22.29。虽然单纯的形符数和类符数不能反映语篇的本质特征,但按一定的长度分批计算文本的类符形符比求平均值就可以得出标准类符形符比。它在一定程度上反映了语篇的某种本质特征,即用词的变化性。该文本的标准类符形符比数41.63,由此可以认为此文本的词汇变化量为较低程度。整个文章的句子有530,句长为15.52,与平均句长9.25相比,这表明该文本又比一些简易文本的句子要长。另外,该文本的平均词长为4.19,其中三个字母的的词最多,有2228个。通过计算,四个字母以内的词数有5387个,占形符数65.47%。总而言之,通过上述统计分析,我们可以推断该文本属于难度水平较低、句子稍长、篇幅较短的小说。
2.表达方式的检索分析
我们主要利用WordSmithTools语料库检索软件中的词频列表检索工具对小说文本的言语表达进行统计分析。首先,通过对文本的统计,我们可以得到一个主题词表(如图所示,只截取了前30位)。然后,根据观察词表中词的频率排序规律,我们可以分析该小说在人称使用、叙事方式、主题表达以及否定词使用这四个方面的特色。
2.1人称使用
根据观察主题词表,我们发现了一个异常的现象——人物名称并不在主题词表的前30位。按照小说三要素的一般规律,人物名称出现的频率应该是比较高的。但我们发现“he”、“his”、“him”这三个词出现的频率非常高,分别排在第2位、第4位和第12位。而文本中唯一出现的人名“Bill”排在了第48位,仅出现了20次。这中现象有两种可能的解释:一是只有“Bill”一个人,且人称的使用过分频繁,二是“he”和“Bill”是两个人,且主角不是“Bill”而是“he”。第二种解释更符合小说情节设置的一般规律,而阅读小说内容之后我们可以得到印证。该小说的主人公并没有名字,通篇都用第三人称“he”来指代主人公,而“Bill”在小说中只是作为配角出现。因此,我们发现不赋予主人公名字,而用第三人称来指代成为小说的特色之一。
2.2叙事方式
词表中的最高频的动词为 “was”,后面依次是“had”、“were”、“did”等动词过去式,这表明小说以过去时来叙述故事情节。另外,通过观察词表,我们可以发现类似“before”、“after”、“then”这样的词出现也比较频繁。这表明小说充分利用时间先后变化来描写故事。这样的叙事方式不仅使整部小说的情节紧紧相扣,还为读者迫切了解后续情节的提供了动力。
2.3主题表达
根据小说的标题,我们可以推测小说的主题与生命相关。通过观察主题词表我们发现“life”、“die”出现的频率也很高。通过阅读小说内容,我们发现这两个词紧扣住小说的主题,小说主要以主人公在荒野中跟死亡的抗争来表现生命的顽强与可贵。在恶劣环境中,主人公与寒冷、饥饿、伤病和野兽抗争。面对生与死的抉择,他表现了人对生命的珍爱以及生命的坚韧品质。
2.4否定词使用
在主题词表中,我们观察到“not”出现了77次,“no”出现了35次,即否定词的出现频率非常高。文章没有直接叙述主人公在前进,而是以“没有停下”作为表达的方式。这样的否定让读者能感觉到主人公每走出一步都要有巨大的毅力,和的前进十分艰难。此外,小说中常常出现对负面情况否定的表达,比如主人公对自己疲惫状态的否定或对被队友抛弃的残忍事实的否定。主人公以类似这样的心理暗示给自己一些生的希望,以支撑自己走出困境。
3.主要情节的检索分析
我们利用WordSmith Tools软件的语境共现检索工具,检索出与所有角色共现的句子,以此来发现于主要角色的细节描写。这对研究人物性格以及把握主要情节非常关键。接下来,我们将结合Wordsmith Tools语料库软件的统计结果,对小说中的主要角色进行详细分析。通过上述主题词表的统计,我们筛选出的主要角色包括:主人公“he”、配角Bill和狼。
首先,对主人公“he”进行分析。我们利用语境共现检索工具,统计出“he”在整个文本共出现409次,并得到其情节表格(如图所示)。
我们发现,在与“he”共现的文本中,开头部分多出现类似痛苦、疲倦、受伤这样的词汇,这表明小说首先被定下了生死较量的压抑的基调。结合小说内容,我们发现作者直接把主人公放置在了一个险恶的环境之中,但文本中没有任何的说明他为何会在这样的荒野之中。另外,在与“he”的共现的文本中,我们发现很多句子中多次出现恐惧、糟糕、饥饿等词汇。这表明主人公的生理状态极差。但结合小说内容,我们发现尽管主人公的状态很糟糕,他还是一直和困难抗争,顽强地维系生命。例如类似这样的描述:“He fought with his fear again,overcame it,hitched the pack still farther over on his left shoulder,and lurched on down the slope.The bottom of the valley was soggy with water,which the thick moss held,spongelike,close to the surface.”[1]在共现文本的后半段,主人公几乎失去意识,但他也在不断的进行心理暗示。
然后,我们对文中人名Bill进行检索分析。通过利用语境共现检索工具统计,我们发现Bill在整个文本中共出现20次,并得到其情节表格(如图所示)。
关于Bill的情节并不多,通过观察和总结,我们可以把Bill的出场可分为三个阶段。第一阶段是在小说开头,主人公与Bill在荒野中同行然后被Bill抛弃;第二阶段是主人公通过想象Bill并没有抛弃自己,猜测他在某个地方等待他;第三阶段是他看到了Bill的尸体。虽然Bill在小说中出场很少,却也发挥了配角的作用。他的形象鲜明,与主人公形成强烈对比。例如文本中这样的表述:“Well,Bill had deserted him;but he would not take the gold,nor would he suck Bill’s bones.Bill would have,though,had it been the other way around,he mused as he staggered on.”[2]尽管Bill没有同现出任何贬义的词语,我们还是可以发现他的自私、贪婪、懦弱。Bill充分地反衬出主人公意志坚强、不畏艰险、淳朴善良的人物特征。
最后,我们对狼进行分析。通过利用语境共现检索工具,我们统计出“wolf”在整个文本中共出现20次,并得到其情节表格(如图所示)。
根据上图我们观察到,狼在文本中出现的时间非常晚,关于它的表述主要集中在文章的最后部分。另外,我们统计发现“wolf”共现最多的词是“sick”,这表明小说中的狼是一头病弱的狼。例如“Once he crawled near to the sick wolf.The animal dragged itself reluctantly out of his way,licking its chops with a tongue which seemed hardly to have the strength to curl.”[3]作者之所以安排一个病狼出现,是因为考虑到主人公生理状态极差,他能够战胜一条病狼都是难能可贵的。纵观小说内容,我们发现主人公和狼的搏斗是小说发展的高潮,关于搏斗的细节描写紧张而又刺激。小说通过病狼的角色设置,所传递的思想是更能直指人心。在人与野兽双方都濒临死亡之时,战胜对手未必能给另一方带来生的希望,可是人之所以在斗争中最终胜出,就在于他对生命始终是热爱的态度而不是像野兽一样维系生命,这也是人兽之别。
4.结语
就目前的研究趋势而言,语料库索引不但被广泛地应用于应用语言学领域,而且近年来在文学作品的研究中也开始发挥作用。这种分析为研究作家的写作风格或某类小说的文学特色提供了可靠的量化依据。通过对其总体特征的分析,我们发现该小说属于难度水平较低、句子稍长、篇幅较短的小说。通过对其表达方式的分析,我们发现该小说中的主人公没有被设定人物名称,小说主要以时间先后作为叙事方式,且利用生命和死亡这两个词紧扣小说主题,并利用否定词从侧面表达人物环境的艰险和主人公不屈不挠的性格。通过对其主要情节分析,我们发现虽然主人公生理状态极差但是在面对生死抉择时表现出顽强的毅力,配角Bill出场较少以虚伪自私的形象却反衬出主人公人格的伟大,病狼在小说的后半段出现,它与主人公的激烈搏斗把小说推向了高潮,衬托出人类生命的强大。总之,通过利用语料库检索软件Wordsmith Tools,我们对英文小说《热爱生命》进行分析。我们主要以列表、统计等量化的方法对小说的总体特征、表达方式、主要情节等方面进行统计分析,使对其艺术特征的诠释更加理性。
注释:
[1][2][3]引文皆源自杰克·伦敦野性的呼唤(英文版)[M].延吉:延边人民出版社,2013.
[1]Kellemann,Bernard,ConcordancinginStylistic Teaching[Z].AtHttp://web.hban.ac.uk/johnstf/.
[2]Maria Rosario Caballero Rodriguez,Using a Concordancer in Literary Studies[M].University JaumeI,Castellon,1998.
[3]贺亚男.基于语料库的文学语篇分析——以《外婆的日用家当》为例[J].内江师范学院学报,2009(5):75-78.
[4]杰克·伦敦野性的呼唤(英文版)[M].延吉:延边人民出版社,2013.
[5]李晋,郎建国.语料库语言学视野中的外国文学研究[J].外国语,2010(2):82-84。
[6]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
[7]杨建玫.《警察与赞美诗》的语料库检索分析[J].四川外语学院学报,2002(3):56-59.
[8]周艳丽,张发祥.《德伯家的苔丝》的语料库检索分析[J].河南科技大学学报,2008(8):62-64.