基于语料库的“Life”语义韵对比研究——以小说《德伯家的苔丝》为例
2016-12-13□孙娟
□孙 娟
基于语料库的“Life”语义韵对比研究——以小说《德伯家的苔丝》为例
□孙 娟
本文分别采用数据驱动方法和基于数据的方法,对托马斯·哈代《德伯家的苔丝》中的“life”一词进行分析与研究,并与LOB语料库进行对比。首先通过AntConc 3.2.1w软件进行检索,利用Collocates功能分别从自建的Tess语料库与LOB语料库中筛选出MI值大于等于3.0的“life”显著性搭配词,在此基础上进行语义韵对比分析;同时采用基于数据的方法,建立类链接,对“life”在这两个语料库中的语义韵进行对比研究。在这两种研究方法下,文章得出了一致性的研究结果,即在LOB语料库中“life”一词多为中性含义,而在Tess语料库中,“life”多呈现消极意义。这种显著性差异说明,在小说中,作者托马斯·哈代借助了词汇手段着墨苔丝的悲惨命运以及她落魄无助的生活,增添了整个故事的悲剧色彩,为故事情节的展开埋下了伏笔。
语料库 life 语义韵 德伯家的苔丝
一、引言
语料库研究表明,词项的搭配行为显示出一定的语义趋向:一定的词项会习惯性地吸引某一类具有相同语义特点的词项,构成搭配。由于这些具有相同语义特点的词项与关键词项在文本中高频共现,后者就被“传染”上了有关的语义特点,使语境内弥漫着某种语义氛围。这就是语义韵(semantic prosody)[1][2]。语义韵是语料库语言学迄今为止发现的重要语言运作机制之一[3],它可以大体分为积极语义韵(positive prosody)、消极语义韵(negative prosody)和中性语义韵(neutral prosody)三种。如果节点词吸引的词项几乎都有积极涵义,那么该词具有积极语义韵。相反,如果节点词吸引的词项几乎都有消极涵义,那么该词具有消极语义韵。如果节点词吸引的词项中,一些有积极涵义,一些有消极涵义,那么该词具有中性语义韵[4]。
将语料库应用于文学作品也是语料库研究的一个热点。根据文学文本情节复杂的特点,语料库检索工具可以对其主题、人物和情节发展等进行趋于理性的加工、分析和统计,从巨量的文字库中提取出骨架,再结合文义,进而从一个全新的角度对文学文本进行研究。托马斯·哈代的《德伯家的苔丝》是一部非常经典的悲剧作品,讲述了出生于没落贵族家庭的女主人公苔丝最终没能逃脱悲惨的命运而死于绞刑的故事。她的一生充满了悲剧色彩,因此本文从文本中提取“life”一词,结合语料库对其进行语义韵分析,并与LOB语料库进行对比,通过对比差异深入分析哈代为渲染主题而采用的技巧。下面首先简要介绍语义韵研究的一般方法。
二、语义韵研究的一般方法
卫乃兴(2001)对语义韵的一般研究方法进行了归纳与总结。他认为,语义韵的研究主要有三种方法:1.建立并参照类联接,用基于数据的方法(data-based approach)研究;2.计算节点词的搭配词,用数据驱动的方法(data-driven approach)研究;3.用基于数据与数据驱动相结合的方法研究。
(一)建立类联接,基于数据来概括和描述的语义韵
类联接是词语搭配研究中的一个重要概念,指语法范畴间的结合。类联接不是与词语搭配平行的抽象表述,而是高一级的抽象[5]。Mitchell[6]认为,类联接是关于词语组合类别的抽象表述,搭配则是类联接的具体实现。换言之,类联接是一种句法结构,是从文本中概括或抽象出来的用句法范畴表述的搭配类,用来描述词语的典型语法功能。一个类联接代表了一个搭配类(collocational class),类联接建立后,便可以观察、概括和描述关键词的语义韵。
(二)计算搭配词,用数据驱动方法研究语义韵
这种方法主要是利用软件,对语料进行自动检索,并对搭配进行计算和统计测量。目前使用的统计手段主要有Z值、T值或MI值,以检验搭配词与节点词共现的显著程度。当Z和T值达到2.0,或MI值达到3.0时,搭配词可以视为显著搭配词。所谓节点词(node word),即研究人员要在语料中检查其搭配行为的关键词。跨距(Span)是由节点词左右词项构成的语境,以词形为单位计算,不包括标点符号。一般来说,将跨距界定为-4/+4或-5/+5是最适宜的[7]。所有落入跨距的词项都视作节点词的搭配词(collocates)。这种研究方法的特点是:研究者头脑中没有太多先入为主的观念,而是由数据引导进行研究和描述,人为因素较少,主要靠自动化程序进行检索、提取和统计测量。
(三)基于数据与数据驱动相结合,建立语义韵结构
这是一种比较折中的方法,是将上述两种方法结合起来使用。一般做法是:先从语料库随机抽取一定数量的索引,然后界定跨距、提取搭配词、建立和参照类联接、检查和概括搭配词的语义特点,最后建立节点词的语义韵结构。
三、研究设计
本研究以自建的托马斯·哈代《德伯家的苔丝》语料库和LOB语料库为基础。自建Tess语料库库容量约为30万词。LOB语料库建于上世纪70年代初,由英国Lancaster大学和挪威Oslo大学以及Bergen大学建成,库容量约为100万词次。
本研究首先采用数据驱动的方法,主要通过AntConc 3.2.1w软件进行检索,利用Collocates计算“life”的搭配词的MI值。当MI≥3.0时,表明该词与节点词之间有较强的搭配力(Church & Hanks,1990;Hunston,2002;Stubbs,1995)。因此,本文用跨距为±4,相互信息值MI≥3.0的标准分别提取自建Tess语料库和LOB语料库中“life”的搭配词。在此基础上,对“life”在两个语料库中搭配词的语义内涵进行对比分析,以此来考察哈代的写作手法。为了研究结果的准确性以及权威性,本文同时采用了基于数据的方法,即利用AntConc软件中的Concordance功能,分别提取“life”的索引行,然后建立类联接,进行语义韵分析。
四、研究结果与讨论
(一)基于数据驱动的方法
本文利用Collocates统计出在自建语料库(Tess)中,“life”搭配词的MI值≥3.0的共计417例,节点词“life”所吸引的显著性搭配词主要有“Modern,impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,universe,rough”等,在此只列举具有典型代表性的几例。本文以同样的方法提取了从LOB语料库中所检索到的符合要求的“life”显著搭配词。如表1所示:
表1:“life”的显著搭配词统计数据
通过观察表格不难发现,“life”的显著性搭配词无论是在自建语料库(Tess)中,还是在LOB语料库中,都呈现较高的MI值,说明节点词“life”具有较强的语义选择趋向,吸引它们相互聚集。在Tess语料库中,这些搭配词有如下特点:“impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,rough”这8例均呈现出明显的消极性语义,“modern”和“universe”呈现出中性语义内涵。这说明在Tess中,和“life”搭配的词多是表现悲观的生活态度和消极情绪的词语。而在LOB语料库中:“single,uneventful,antecedent,everyday,the,tranquil,inner”这7例呈现中性语义,“comfortable”呈现出明显的积极语义,“dully”呈现出明显的消极语义。对比表明,LOB语料库与Tess语料库在“life”的搭配词方面表现出了明显的差异性,在LOB语料库中,“life”的搭配词多呈现中性意义,而在Tess语料库中却多呈现出消极语义。通过搭配词的语义差别对比可以推测出,在《德伯家的苔丝》这部小说当中,作者托马斯·哈代为了渲染整个故事的悲剧色彩,特别是为了着墨苔丝的悲惨命运以及她落魄无助的生活,运用了悲剧化搭配词的写作手法来实现理想的情感目的。
(二)基于数据的方法
通过AntConc的Concordance检索发现,“Life”一词在自建语料库(Tess)中共有131条索引,其中有1条索引重复,剔除重复的1条后,剩下有效索引130条。在LOB语料库中,检索到711条索引,本文采用系统随机抽样法,即每隔四行取一次的方法抽取了共计142条有效索引。限于篇幅,现仅将两个语料库中的前10条索引显示如表2和表3。
表2:自建语料库(Tess)中的前10条索引
表3:LOB语料库中抽样后的前10个索引
本文对在这两个语料库中所提取的索引分别进行了归纳和总结,并建立了类联接,在此基础上分析“life”的语义韵。表4为Tess语料库中“life”的相关类联接及语义韵,表5为LOB语料库中“life”的相关类联接及语义韵。
表4:Tess语料库中“life”的相关类联接及语义韵
表5:LOB语料库中“life”的相关类联接及语义韵
PRON+N 39(27.46%) 11(36.67%) 21(25.00%) 7(25.00%)V+N+PREP 15(10.56%) 2(6.67%) 11(13.10%) 2(7.14%)总数 142(100%) 30(21.12%) 84(59.15%) 28(19.72%)
对比表4和表5可以发现,“life”的类联接与语义韵在Tess语料库与LOB语料库中既有相似之处,也存在差异性。通过观察得知:“life”的类联接形式在这两个语料库中存在很大的共性,都包含六种类联接,即N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP。每个类联接在这六个类联接中所占的比重相似,其中,ADJ+N和PRON+N占的比重较大,两者大约占总数的一半,其余四项类联接比重较小且比例相当。这充分说明了托马斯·哈代《德伯家的苔丝》中“life”一词的用法遵循了英语的一般用法,符合英国人的表达习惯。
值得一提的是,“life”一词的语义韵在这两个语料库中呈现出了较大的差异,主要表现在:在自建语料库(Tess)中,“life”的语义韵积极涵义和中性涵义所占比重相当,分别为25.38%和27.69%,而消极涵义接近半数,占到了总数的46.92%。这说明在Tess中,“life”多呈现消极意义,具有浓厚的悲观主义色彩,这一点与哈代的宿命观是一致的。在LOB语料库中,“life”的积极语义韵和消极语义韵比重相当,分别为21.12%和19.72%,中性语义韵超过半数,为59.15%。通过这两个语料库的前后对比,可以很清晰地看到哈代的写作手法,悲观色彩贯穿作品全篇。通过运用这种词汇手段来渲染苔丝的悲惨命运,为小说的悲剧结局埋下了伏笔。通过基于数据的分析,本文得出了与基于数据驱动的分析相一致的结论,进一步证明了本文数据的有效性。
五、结语
语义韵研究可以丰富人们对语言规则的认识,加深对语言运作机制的理解,促使人们重视词语行为模式(卫乃兴,2002)。为了增强研究结果的可靠性和权威性,本文分别采用了数据驱动的方法和基于数据的方法,对《德伯家的苔丝》中的“life”一词进行了语义韵研究,并与LOB语料库进行了对比。研究表明:在自建语料库(Tess)与LOB语料库中,“life”一词的类联接形式具有很大的共性,都有六种类联接:N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP,并且各自所占的比重相当。但是“life”在这两个语料库中呈现出的语义韵却存在较大的差异性,主要表现在:在LOB语料库中,“life”多呈现中性语义韵,而在自建语料库(Tess)中,“life”多呈现消极语义韵。这种显著性差异充分说明了:在小说《德佰家的苔丝》中,作者托马斯·哈代多用消极悲观色彩词来描述命运与生活,通过运用这种词汇手段来渲染苔丝的悲惨命运,充分体现了作者的宿命观,悲观主义色彩贯穿全篇,为小说的悲剧结局埋下了伏笔。
(本文为广东外语外贸大学高层次人才引进联合项目“认知翻译学的理论及模型建构”[GWTP-YJ-2015-07]和广东省人文社会科学重点研究基地广东外语外贸大学翻译学研究中心2015年招标项目“认知翻译学的学科理论基础及体系建构研究”[CTS201503]的阶段性研究成果。)
[1]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.
[2]Louw,B.Irony in the Text or Insincerity in the Writer?The Diagnostic Potential of Semantic Prosodies[A].In M.Baker,G.Francis &E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair[C].Amsterdam:John Benjamins,1993.
[3]卫乃兴.基于语料库学生英语中的语义韵对比研究[J].外语学刊,2006,(5):50-54.
[4]Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.
[5]Firth,J.R.Papers in Linguistics 1934-1951[C].London:Oxford University Press,1957.
[6]Mitchell,T.F.Principles of Firthian Linguistics[M].London:Longman,1975.
[7]Jones,S & J.Sinclair.English Lexical Collocations:A Study in Computational Linguistics[C].Cahiers de Lexicoligie,1974,(2):15-61.
(孙娟 广东广州 广东外语外贸大学高级翻译学院 510420)