基于语料库的作品对比分析
2014-10-21杨秋月
杨秋月
【摘要】本文采用基于语料库的研究方法,使用Antconc和Monoconc对《简爱》和《呼啸山庄》两部经典文学作品进行了对比研究,旨在发现两部作品在词汇使用频率,类符形符比等方面的差异并通过进一步分析,找出造成差异的原因,以帮助读者更好的理解这两部经典的文学作品。
【关键词】简爱 呼啸山庄 语料库 对比分析
一、引言
随着《简爱》和《呼啸山庄》的出版,这两部著作的作者——勃朗特夏洛特勃朗特和艾米莉勃朗特获得了广泛的关注。这两部作品都以女性为关照对象,一百多年里,简爱对个人独立的不懈追求和她与罗切斯特先生之间浪漫而又波折的爱情故事,凯瑟琳和希刺克利夫之间狂热而又颇引人争议的爱情故事一直为人们所津津乐道。
二、文献
语料库是一系列自然语言形成的文本,Sinclair(1991)认为语料库的作用是为了检测或研究某一语言状态或变体。研究者经常使用基于语料库或语料库驱動的方法以实现其研究目的。
三、研究方法
本文采用基于语料库的研究方法,旨在通过Antconc和Monoconc对《简爱》和《呼啸山庄》两部经典的文学作品进行对比研究,包括两部作品在词频等方面的不同,以帮助读者更好的了解这两部作品。
四、分析
《简爱》和《呼啸山庄》这两部文学作品是由勃朗特姐妹所著,并且由于其戏剧场景、对女性价值观的独特描述获得了关注。由于女权运动的发展,它们更是得到了众多学者的关注,但很少有人以基于语料库的方法对这两部作品进行对比。以下是这两部作品中词频的检索片段:
由于篇幅的限制,这里只列举了5个出现次数最多的词。但通过检索我们发现,和《呼啸山庄》相比,《简爱》中”I”的出现次数要高出很多,而且“me” “my”等第一人称代词的频次也高于第三人称的频次。值得注意的是两部作品中“was”的出现频次均高于“is”,这说明两者都用过去时叙述整个情节。此外,在两部作品中“that” “which”的比例都比较高,这表明两部作品中的句子都比较长。而且“Eyre” 和 “Rochester”在《简爱》中的所有名词中所占比例最高,这说明整个故事是围绕着这两个人物展开的。此外,我们还通过SPSS进一步发现了这两部作品中人称代词、冠词、介词和连词的比例都很高,这再次证明上文结论:文章中的长句子、复杂句子较多。此外,我们还可以通过词汇密度来对比《简爱》和《呼啸山庄》。从下表我们可以看出《简爱》中的类符形符比为0.07而《呼啸山庄》中为0.08,所以《呼啸山庄》中词的变化更大。
另外,我们还可以通过软件SPSS来观察这两部作品是否在词性方面存在显著性差异。通过数据分析,我们得出下表:
《简爱》是一部具有个人自传色彩的作品,主要描写了简爱的个人经历。而《呼啸山庄》描写的是发生在Heathcliff, Catherine和Linton之间的故事。以下分析主要以《呼啸山庄》为例。首先是Heathcliff,这是个比较有争议的人物并且在性格上存在缺陷。通过语料检索我们发现用来描写他的的形容词基本上都是负面的,比如“rough”, “irritated”,“hard”,“cruel”等,而用来描写女主角Catherine的形容词都是distraught,peevishly,wild harshness,fiery,furiously及 gloom,silence,breathless, confused等,这都表明了其双重性格。尽管勃朗特两姐妹没有接受太多的教育,但她们对生活的理解都很深刻。尽管她们自己并没有得到期望的爱情,但她们笔下的人物都找到了真爱,虽然有的结局并不那么完美。两部作品中主人公命运的不同在一定程度上反映了两姐妹生活经历的不同,尽管Charlotte Bronte的生活经历似乎更多一些,但其性格是孤独的。
五、结论
本文基于语料库用Antconc和Monoconc两种应用软件,对《简爱》和《呼啸山庄》这两部作品进行了对比研究。研究发现,两部作品在词汇使用频率,类符形符比,词性等方面存在差异。此外,文章还分析了造成这些差异的原因,以帮助读者更好的理解这两部经典的文学作品。
参考文献:
[1]Bronte,Charlotte.Jane Eyre[M].北京:当代中国出版社,2002.
[2]Bronte,Emily.Wuthering Heights[M].上海:上海世界图书出版公司,2003.