APP下载

基于语料库的文学研究:内涵与意义

2019-01-04胡开宝

关键词:语料库范式文学作品

胡开宝 杨 枫

(1.上海外国语大学 语料库研究院,上海 200083;2.上海交通大学 外国语学院,上海 200240)

一、引 言

文学研究是对文学文本特征以及文学与社会、文化、人类精神和情感等关系的研究。文学研究的主要领域涵盖作品研究、作家研究、文学理论研究和文学史研究。长期以来,文学研究主要采用定性研究方法。无论是经验方法的应用,还是哲学方法、社会学方法和心理学方法的应用,主要凭借研究者的主观判断和逻辑演绎,对文学作品或文学现象进行分析,揭示文学作品或文学现象的特征与属性,很少采用语料库方法等实证研究方法。不过,自20世纪80年代以来,学界开始利用语料库进行文学文本的语言特征、文本意义[1-3]、人物形象[4-6]、作家风格[7-9]、创作技巧[10]和叙事方法[11-13]等的研究。在这一历史语境中,基于语料库的文学研究这一具有鲜明实证研究特征的文学研究领域便应运而生。

基于语料库的文学研究是指采用语料库方法,在分析文学文本的语言特征并进行相关数据统计的基础之上,深入探讨文学文本特征、作家风格以及文学与社会的关系等问题。应当指出,基于语料库的文学研究不仅能够拓展并深化文学研究,更为重要的是,能够使文学研究的方法实现由定性研究向定性研究和定量研究相结合的重要转变。然而,基于语料库的文学研究目前仍处于发展的初期,学界对基于语料库的文学研究的属性、特征、研究领域、研究路径和研究意义等的认识尚不太清晰,甚至对基于语料库的文学研究的价值存在怀疑。为此,本文将在阐述基于语料库的文学研究的缘起、属性与特征的基础上,重点分析基于语料库的文学研究的主要领域和研究意义。本文将回答四个问题:(1)基于语料库的文学研究在何种历史语境中形成?(2)基于语料库的文学研究的属性和特征是什么?(3)基于语料库的文学研究主要包括哪些领域?(4)基于语料库的文学研究对文学研究的意义表现在哪些方面?

二、基于语料库的文学研究的缘起

基于语料库的文学研究是语料库语言学与文学研究的有机融合,形成于文学研究的语言学转向和语料库语言学的迅速发展等历史背景之中。

(一)文学研究的语言学转向

20世纪,随着索绪尔结构主义语言学的兴起,哲学产生了语言学转向。哲学家们发现人们无法直接认识现实世界,而是要通过语言媒介来认识世界。他们认为哲学首先要探讨的是语言问题,是一种语言分析活动,而非抽象的形而上学。学界普遍认为,语言为不同民族提供了认知事物的模式。语言命名不同,不同民族对世界的认知也就不同。语言在某种程度上遮蔽了现实。人们并非生活在客观世界里,而是生活在语言的世界里。与此同时,哲学的语言学转向也波及文学研究领域,引发了文学研究的语言学转向。文学作品不再被视为客观世界的忠实再现,文学创作的直接对象并非现实,而是语言符号本身。文学批评不再关注外部因素,不再分析与文学作品相关的作家生平和作品的社会背景,而是转向内部研究,即以语言为文学研究的出发点,关注文本和语言的分析。俄国形式主义理论认为文学文本是自足的系统,文学由语言构成,其本身是语言艺术。文学批评的重要任务在于分析具体文学文本语言符号独特形式的“文学性”。结构主义批评理论指出文学的意义存在于文学作品或者作为一个系统的文学整体中各文学要素之间的差别和联系之中,文学批评的最终目的在于探寻文本的深层结构。语言是文学的生命,是文学存在的世界。文学问题是以语言形式出现的问题。在这一历史背景下,语言学分析方法开始应用于文学研究之中。

(二)语料库语言学的迅速发展

语料库语言学是指以语料库应用为基础,基于大量真实语料分析所开展的语言研究。

20世纪50年代初,由于实证主义和行为主义的影响,经验主义受到以哈里斯为代表的语言学家的推崇,真实语料被视为语言研究的唯一对象。在这一历史语境中,语料库开始应用于词典编纂、句法和词汇等领域的研究之中。20世纪80年代以来,在经历30年的停滞之后,语料库语言学进入快速发展阶段。一方面,学界逐渐认识到自20世纪50年代中期便占上风的乔姆斯基理论以及笛卡儿理性主义的缺陷和不足,承认语料库语言学对语言研究的重要性。另一方面,计算机技术的快速发展,尤其是计算机运行速度和存储能力的提高,使得语料库的库容和加工精度大幅增加,语料库应用的范围也不断扩大。20世纪90年代,以Mona Baker为代表的一批学者开始将语料库应用于翻译学研究,语料库翻译学最终诞生[14-17]。不过,自20世纪80年代以来,学界开始探讨语料库在文学研究中的应用,语料库文体学由此形成[6]。

有必要指出,语料库语言学与文学研究具有契合之处。具体而言,语料库语言学强调对文本所体现的语言事实进行描写,并基于此探讨与文本相关的社会文化因素,而文学研究通常关注文学文本语言特征或创作技巧的分析,揭示与文学文本相关的政治、历史和文化等社会文化因素。由于语料库语言学与文学研究之间的契合,两者逐渐有机融合并最终形成基于语料库的文学研究。

三、基于语料库的文学研究的属性与特征

(一)基于语料库的文学研究的属性

与其他文学研究的领域不同,基于语料库的文学研究不是根据其研究对象来界定,因为其研究对象并非语料库。基于语料库的文学研究首先是一种方法论,即语料库方法。众所周知,传统意义上的文学研究一直采用定性研究方法。研究者常常根据自己的经验、顿悟、主观判断和逻辑推演,分析文学现象和文学本质,研究结论往往不够客观,不够全面。然而,20世纪80年代以来,语料库方法逐渐应用于文学研究之中,催生了基于语料库的文学研究。语料库方法是指以语料库应用为基础,在考察大量语料并进行相关数据统计之后,对相关理论假设进行证实或证伪的方法,其特征主要表现为观察对象的充分性、数据统计的科学性以及定量研究和定性分析相结合。语料库方法既重视以概率统计为基础的量化分析,也强调对所观察的现象和所获得的数据进行阐释的定性研究。语料库方法的应用不仅可以使研究更为客观、科学,而且可以帮助我们发现凭肉眼看不到的文学文本的语言特征或文学现象。

然而,基于语料库的文学研究不仅是一种方法论,更是一种文学研究范式。范式是指“具体科学共同体从事科学活动所必须遵循的公认的模式,包括共有的世界观、基本理论、范例、方法、手段和标准等与科学研究有关的所有东西”[18]90。一方面,基于语料库的文学研究具有不同于传统文学研究的方法,拥有自己独特的研究领域,如语料库文体学和作家归属研究等。另一方面,从事基于语料库的文学研究的学者均认可描写性研究,认为文学研究应当在对文学文本或文学现象进行充分描写的基础上揭示文学文本的意义及其与社会文化和意识形态之间的关系,强调文学研究既要重视描写的完整性,也要关注解释的充分性。从这个意义上讲,基于语料库的文学研究具有研究范式地位。

文学研究主要经历了四次研究范式的转变,即传统社会历史批评研究范式、形式主义文论研究范式、文化研究范式和“后理论”研究范式。

传统社会历史批评研究范式从社会历史角度对文学事实或文学现象进行研究,关注文学作品与社会生活之间的关系,重视作家思想以及文学作品社会作用的分析,强调文学的社会性质,认为文学离不开社会历史,文学本质上是人们社会生活的再现。该范式发端于19世纪法国文学理论家丹纳的《艺术哲学》。丹纳依据社会学原理阐述文学艺术的发展历史,阐明了种族、环境、时代等要素对文学发展的决定作用。社会历史批评关注文学对社会产生的影响,主张文学作品的内容不仅应该是真实的,还应该是正确的。文学作品的分析应当考察作品能否反映历史的趋向和时代的本质,而且要把作品放到社会历史的大背景中进行考察。社会历史批评研究存在一些局限性,具体表现为过分强调文学与社会生活的关系,常常忽略文学作品特性及其形式因素的分析,未能充分关注读者的自主性和作品的创造性。

形式主义文论研究范式形成于20世纪初,受到索绪尔结构主义语言学和俄国形式主义的影响。形式主义文论研究范式认为文学研究的对象是文学性,也就是使某一作品成为文学作品的特征。文学研究的任务在于分析文学语言与现实语言之间的差异,以及这种差异产生的原因。该范式强调应从语音、词汇、句法、语篇、意象和隐喻等角度对文学作品形式进行分析,认为文学研究应分析文本的语言技巧和文学修辞,挖掘文学作品的审美内涵,提炼文学的形式意义。

文化研究范式兴起于20世纪50年代,侧重于研究文学文本所蕴含的文化内涵、文化价值和文本背后隐藏的各种权力关系,其研究对象不仅包括文学现象和文学作品,还包括文学现象和文学作品背后的社会阶级、性别和种族等因素。文化研究范式常常分析文学现象如何与意识形态、种族、阶级或性别等产生关联。根据该范式,文学是一种文化现象,文学研究应置于更广泛的社会文化语境之中,应关注包括意识形态在内的制约文学创作的各种外在因素。该范式的研究通常选取女性主义、后殖民主义、东方主义和解构主义及其他相关理论来分析文学作品或文学现象背后的文化内涵和权力关系等。

“后理论”研究范式始于20世纪80年代。当时,西方理论界认为理论已终结,后现代主义已死亡,各种“后理论”和“反理论”的主张先后提出。在这一历史语境中,学界开始将研究焦点重新集中于文学文本形式的解读,重新关注文学性和审美性的研究。该范式是形式主义文论研究范式的回归,是对文化研究范式的反拨。

应当指出,以上研究范式要么侧重于文学内部的研究,如形式主义文论研究范式和“后理论”研究范式,要么以文学外部研究为主,如传统社会历史批评范式和文化研究范式。根据雷纳·韦勒克的主张,文学研究可划分为内部研究和外部研究:前者侧重于作品本身的研究,关注文学的审美形式、文学创作技巧和文学修辞等,探讨文学的特殊性和文学性;后者主要研究文学的外部因素,如文化、政治和历史等。而且,这些范式主要采取定性的研究方法,常常依据研究者的主观判断和逻辑论证对相关文学事实或文学本质进行分析,研究结论往往失之于片面、主观。

与以上研究范式不同,基于语料库的文学研究范式不仅重视文学内部研究,也关注文学外部研究,强调由内及外,由表及里,以文学文本语言特征分析为基础,探讨对文学产生影响的不同外部因素。该范式将文学视为一种文化现象或社会现象,认为文学具有自身独特的属性或文学性,不仅受制于不同社会文化因素,也对社会文化产生反作用。此外,该范式推崇语料库方法的应用,强调在观察大量文学语料并进行定量分析的基础之上,对文学内部或外部的相关问题进行研究。通常,基于语料库的文学研究涵盖描写和解释两大阶段。在描写阶段,研究者以相关数据的统计与分析为基础,对文学文本的语言特征进行客观描写,分析文学文本的意义、作家风格、创作技巧和人物形象。在解释阶段,依据文学理论或文化理论,对以上特征或相关文学事实背后的意识形态或社会文化因素进行分析。该范式具有三方面的优势。其一,基于大量文学语料的观察和数据统计,归纳文学语言和文学创作的规律性特征,有效克服了传统文学研究的主观性和片面性,研究结论较为客观、科学。其二,既重视文学语言特征和诗学传统等共性特征的分析,也关注文学的创造性和作家风格等个性特征的研究。其三,将文学内部研究与文学外部研究融为一体,打破了文学内部研究和文学外部研究之间长期存在的壁垒。具体而言,基于语料库的文学研究在文学作品的语言特征描写基础之上,将文学作品重新置于具体社会文化语境之中,分析与文学作品或文学创作相关的不同因素,概括决定文学发展和变化的普遍规律。

(二)基于语料库的文学研究的特征

基于语料库的文学研究形成于语料库语言学与文学研究的有机结合,本质上是以语料库应用为基础的实证性研究范式,其特征主要表现为语料库方法的应用、定量分析和定性研究相结合以及文本数据挖掘技术的应用等。

1.语料库方法的应用

长期以来,内省式研究方法在文学研究中独步天下,只是到了20世纪80年代初,语料库方法才开始应用于文学研究之中。内省式方法是指研究者依据自己的直觉和判断,就具体文学事实或文学现象提出理论假设,并选择少量典型的案例加以论证的方法。内省式方法的应用往往使得具体研究结论具有一定程度的主观性和片面性。语料库方法是指以语料库的应用为基础,对大量文学作品进行统计和分析,以发现文学语言特征和文学性及其背后的社会文化因素等。应当指出,作为一种新型的语言资源和知识平台,语料库的应用可以帮助研究者获取大量文学语言实例及研究所需的不同类型的数据,为文学现象或文学创作规律的描述提供远远超出研究者个人认知能力的巨大空间与可能性。

2.定量分析和定性研究相结合

基于语料库的文学研究一方面重视定量分析方法的应用,另一方面强调在对文学文本语言特征进行描写的基础上开展定性研究,探讨文学作品的文学性、作家风格、作品主题和意义、人物形象以及文学作品背后的社会文化因素。定量分析方法是指提取关于研究对象的数据进行检验和分析,以测定关于研究对象特征的数值或找出因素间量的变化规律,获得有意义的结论[19]。在基于语料库的文学研究中,研究者利用语料库软件,提取并分析关于文学语料的数据,总结文学作品的语言特征和文学性,探讨文学与社会文化语境之间的关系。一般而言,基于语料库的文学研究所用的定量分析方法涉及四方面的数据:(1)关于文学文本特征的基础数据,如类符与形符比、平均词长、词汇密度、词频、高频词、关键词和平均句长等;(2)典型词汇和句式结构的使用频率;(3)关于搭配和语义韵等方面的数据,如Z值、T值和MI值(相互信息值);(4)关于数据之间差异显著性的数据,如卡方检验和对数似然比。定性研究一般侧重于研究对象性质的分析,深入分析研究对象的特征及其产生的原因,考察研究对象是否具有某种属性或特征,以及它们之间是否有关系。

3.文本数据挖掘技术的应用

文本数据挖掘技术是指从文本数据中抽取有价值的信息进而发现文本知识的计算机处理技术。通常,文本数据挖掘技术包括文本结构分析、文本摘要、文本分类、文本聚类、关联规则、分布分析与趋势预测以及可视化等技术。文本数据挖掘技术的应用可以实现对大量文本的快速处理,可以有效地提取和描写文本信息,分析文本的情感倾向、主题和语义网络等,并对文本内容进行可视化处理。应当指出,语料库所收录的语料均已实现电子化,并已进行语料清洗等技术处理。这为文本数据挖掘技术在文学研究中的应用提供了重要物质基础。事实上,基于语料库的文学研究可以采用文本数据挖掘技术来分析作家风格、文学作品的主题、人物形象、人物的情感倾向、人物之间的关系以及不同时代文学作品风格的演变。

四、基于语料库的文学研究的主要领域

基于语料库的文学研究可以划分为以下领域:基于语料库的文学作品研究、基于语料库的作家研究、基于语料库的文学理论研究、基于语料库的文学史研究。

(一)基于语料库的文学作品研究

基于语料库的文学作品研究包括文学作品的文体特征研究、文学作品主题和意义研究、文学作品的创作技巧和手法研究、文学作品人物形象研究、文学作品比较研究、文学作品的接受和传播等领域的研究。

基于语料库的文学作品文体特征研究,又称为语料库文体学研究,是指采用语料库方法,对文学作品在语音、词汇、句法和语义等层面所呈现的特征或语言风格所开展的研究,是“将语料库语言学研究范式与文体学研究相结合而催生的研究领域”[20]47。该领域研究侧重于分析文学作品的总体语言特征,如形符数、类符数、类符与形符比、词汇密度、词汇丰富度、平均句长和高频词等,典型词汇或句式结构使用的频率或趋势,以及文学作品的词丛、搭配、类连接和语义韵等。

基于语料库的文学作品主题和意义研究旨在分析文学作品的主题词或关键词、高频词或高频词簇,并基于此探讨文学作品的主题和意义。主题词是指一个文本或语料库与另一个可比的、容量较大的文本或语料库相比出现频率更高的那些词语[21]。主题词或高频词通常反映一部作品所讨论的话题或问题的焦点。分析作品的主题词,可以揭示作品的主题和思想内涵。比如Stubbs所做的语料库研究表明,康拉德的小说《黑暗之心》的主题词为不确定的实词和虚词,以及抽象名词和带有否定前缀形容词的名词词组[22]。这些主题词的应用凸显了主人公马洛心理上的不确定感,反映了文明社会与原始社会之间的冲突以及种族偏见等主题。刘娟依据功能语言学相关理论,对乔伊斯小说《伊芙琳》的关键词进行定量分析,探讨了伊芙琳逃亡时的心路历程,揭示了该作品的主题[23]。

基于语料库的文学作品创作技巧和手法研究旨在分析文学创作中反映社会现实、塑造人物形象的各种具体技巧和方法,包括情节推进方法、文学意象、修辞手法和文学语言的创造性等。我们可以在分析高频词丛或词簇的基础之上,探讨文学作品情节的推进方法,可以相关意象词汇(常常是高频词)为检索项,考察这些意象词汇以及与这些词汇意义相近或相关的词汇及其语义场,分析文学作品的意象及其意蕴。比如Mahlberg对狄更斯的23部作品进行语料库考察,分析其中的高频词簇,发现和身体部位相关的词簇往往是推动关键故事情节发展的线索[24]。任艳等发现在英国哥特式小说语料库中,时间介词词丛、空间介词词丛、其他介词词丛和动词词丛的出现频率位居前四位,远远高于其他种类的词丛。另外,哥特式小说中对时间和空间的描述都要多于其他同时期的文学作品。他们认为哥特式小说在展开故事、推进情节发展时,更强调时间和空间的描述[25]。张仁霞等对海明威《永别了,武器》进行语料库考察,发现rain高频出现,频次为139次,rain实为意象,所表达的象征意义为:苍凉、萧条;离别伤悲;绝望、沮丧;焦虑、死亡、悲痛[26]。

基于语料库的文学作品修辞研究可以相关词汇为检索项,结合正则表达式的运用,提取具体作品中运用修辞手法的语句,并基于这些语句的分析考察修辞手法的使用及其效果。Louw分析了utterly在英国诗人拉金的诗歌“First Sight”中的使用及其产生的反讽效果[27]。

基于语料库的文学语言创造性研究侧重于分析文学作品中的临时词或创造性搭配使用的趋势与特征。临时词是指为特殊目的而特意创造的、用于特殊情境的词汇。临时词使用频率较低,但可增加语言表达的独特性和创造性。搭配是一些词与另一些词同时出现或共现的关系[17],是“词项的习惯性结伴使用”[28]12。创造性搭配是指偏离语言使用常规的搭配。Hori以库容为460万词的狄更斯作品语料库为基础,以220万词的19世纪小说语料库为参照库,从词汇搭配模式角度切入,揭示了狄更斯作品语言的创造性及其文体效果[29]。

基于语料库的文学作品人物形象研究侧重于分析文学作品中具体人物形象的性格、情感及其他相关特征。我们可以人物姓名或指代该人物的称呼或人称代词为检索项,提取包含这些词汇的语句,分析与具体人物描写相关的高频词和关键词,考察与具体人物名称搭配的形容词、名词、动词和副词,归纳具体人物形象的特征。Inaki和Okita采用语料库方法,对《爱丽丝梦游仙境》进行分析,探讨爱丽丝这一人物形象,发现爱丽丝小心翼翼,处境被动;而在《爱丽丝镜中世界奇遇记》中,爱丽丝则积极乐观[4]。陈婵对2013年诺贝尔文学奖获得者爱丽丝·门罗所著12部小说中的词簇进行语料库分析,发现as if词簇和包含第三人称代词she在内的词簇的关键值很高。其中,as if词簇运用于女主人公外表、行为和心理活动等的描写,使女性人物形象的描写生动鲜活。而包含she的词簇多与否定词并用,勾画了女主人公的迷茫、困惑和纠结[30]。

基于语料库的文学作品比较研究旨在以文学作品文体特征、主题和意义、创作技巧和人物形象等的语料库分析为基础,对不同国家或民族的重要文学作品进行比较,揭示这些作品的共性与差异。

基于语料库的文学作品传播和接受研究凭借文学作品评论语料库的应用,对具体文学作品的传播与接受趋势和特征进行分析。一方面,通过提取语料库的篇头信息,包括出版商、出版时间、作者姓名和性别、作品版本和发行情况等,对某一文学作品的传播与接受趋势进行客观描述;另一方面,在分析具体文学作品评论的关键词、高频词以及相关文学评论情感极性的基础之上,探讨学界或普通读者对具体文学作品的认知和态度。

(二)基于语料库的作家研究

基于语料库的作家研究旨在以语料库为研究平台,在作家作品分析的基础上,对作家的创作风格及其创作理念进行分析。该领域研究既可以以单个作家为研究对象,也可以以作家群体为研究对象,如男性作家或女性作家,或具体历史时期的作家群体。该领域研究主要包括:作家或作家群风格研究,作家或作家群的创作手法和技巧研究,作家或作家群的创作理念研究,作家或作家群的创作风格和创作理念比较研究。

基于语料库的作家或作家群风格研究侧重于具体作家或作家群作品语言特征的分析,并以此为基础总结作家或作家群风格的具体特征,包括作家或作家群风格在不同历史时期所呈现的具体特征。风格是独特的或与众不同的表现方式[31],通常有作品风格、作家风格、流派风格、时代风格和民族风格之分。作家风格可以界定为使某位作家作品区别于其他作家作品,并且表现于同一作家不同作品的创作方式或语言模式,包括作家偏爱的或重复出现的词汇和句法结构等语言形式,以及作家在叙事特征建构以及创作手法与技巧应用等方面所表现的特征。Tabata以语料库的应用为基础,采用词类分布对应分析法,探讨了狄更斯创作风格的变化[8]。Hoover采用语料库方法,对亨利·詹姆斯创作风格的历史演变进行分析,发现亨利·詹姆斯在创作生涯的前期与后期呈现不同的创作风格[9]。

基于语料库的作家或作家群的创作手法和技巧研究以具体作家或作家群作品的分析为基础,归纳、总结作家或作家群在创作方法和技巧运用方面所表现的趋势、偏好和变化及其背后的包括诗学传统和意识形态在内的社会文化因素。陈建生等通过对标点符号、关键词和词丛进行检索,将乔伊斯的《尤利西斯》与20世纪其他小说进行定量和定性对比,分析了乔伊斯小说中意识流技巧的运用[10]。

基于语料库的作家或作家群的创作理念研究基于作品主题选择、人物形象描写、语言风格和创作手法等方面的分析,探讨具体作家或作家群在文学创作过程中遵循的基本思想和基本思路。

基于语料库的作家或作家群创作风格和创作理念比较研究是指在分析不同作家或作家群作品在文体特征和创作手法方面所呈现的共同趋势与差异的基础上,比较他们的创作风格和创作理念之间的共性与差异,并以此为基础揭示社会文化因素对文学创作的影响。该领域研究主要包括以下研究内容:不同国家或民族的重要作家创作理念和创作手法的比较研究,不同历史时期作家或作家群创作理念和创作手法的比较研究,不同文学流派作家群体创作理念和创作手法的比较研究,不同性别作家群体创作理念和创作手法的比较研究。

(三)基于语料库的文学理论研究

文学理论研究是指关于文学本质、特征、发展规律和社会作用原理的研究。基于语料库的文学理论研究主要包括基于语料库的文学流派理论研究和语料库叙事学研究。

1.基于语料库的文学流派理论研究

基于语料库的文学流派理论研究旨在利用语料库技术对具体文学流派的作品在叙事结构、创作手法和创作风格等方面所呈现的趋势和特征进行分析,以考察该流派创作理念和相关主张是否体现于其创作实践之中。文学流派是指一定历史时期内出现的一批作家由于审美观点一致和创作风格类似,自觉或不自觉形成的文学集团和派别。众所周知,不管是作为具有明确组织形式的自觉集合体,还是作为由于创作风格相近而不自觉形成的派别,任何一个文学流派都具有自己的文学主张和创作理念。然而,具体文学流派是否会在文学创作中践行自己的文学主张和创作理念?利用语料库分析具体文学流派文学作品在创作技巧和创作风格等方面的具体特征,可以验证该流派的创作理念和主张是否在文学作品中得到体现。毕竟,具体文学流派的理论和主张通常表现于具体文学作品的创作技巧和创作风格之中。

2.语料库叙事学研究

叙事学是关于叙事行为和叙事文本的理论,是关于叙事行为的形式和结构以及叙事效果的研究。语料库叙事学是采用语料库方法分析叙事文本形式与结构以及叙事效果的研究,包括叙事视角、叙事结构、人物塑造方式和叙事进程等方面的研究。

基于语料库的叙事视角研究侧重于分析叙事作品中人称代词和动词应用趋势以考察该作品所采取的叙事视角。叙事视角也称叙述聚焦,是指叙述语言中对故事内容进行观察和讲述的特定角度。叙事视角一般分为外视角和内视角。外视角主要包括全知视角和选择性全知视角。全知视角是指叙述者以旁观者身份进行叙述,可以从任何角度来观察事件,也可以透视人物内心活动,一般都采用第三人称。选择性全知视角虽然采用第三人称,但放弃了第三人称所具有的无所不在的自由,侧重于描写主要人物的心理活动。内视角一般采用第一人称,叙述者同时是故事中的角色。叙述者不仅可以参与实践,还可以向读者进行描述和评价。我们可以采用语料库方法分析具体作品中高频出现的人称代词,便可确定该作品的叙事视角是外视角还是内视角。还可以通过分析作品中人称代词与动词的搭配来考察作品叙事视角是全知视角还是选择性全知视角。具体而言,如果第三人称代词与表示心理状态动词的搭配在某一作品中高频出现,我们可以确定该作品的叙事视角为选择性全知视角。Wynne等基于大量语料的考察,分析了虚构文本的语言特征以及不同文类文本的叙事视角[32]。张仁霞等对海明威《永别了,武器》所做的分析表明第一人称代词位居该小说的词表和关键词表之首,且在小说中贯穿始终,由此可见该小说的叙事视角是内视角[26]。凤群对弗吉尼亚·伍尔夫《达罗卫夫人》中标点符号、主题词和词簇所做的语料库考察表明,弗吉尼亚·伍尔夫使用分号、破折号、不定代词one和过去完成体动词had实现叙述视角的转换,使得叙述者声音在叙述者和不同人物之间切换,从而将错综复杂的人和事通过人物内心倾泻而出,反映了人物心理、思绪的变幻无常[33]。陈建生等利用厄普代克所著“兔子系列”小说语料库与厄普代克其他类型小说语料库,对其关键词进行分析,发现第三人称代词高频出现,且多与心理动词搭配。作者据此认为这些小说采取了选择性全知视角[34]。

基于语料库的叙事结构研究通常考察具体作品中频繁出现的时间副词或与时间有关的语篇衔接词汇,以及高频动词和关键词,分析作品叙事结构的类型与具体安排。叙事结构一般分为正叙、倒叙和插叙三大类。正叙是指按照时间顺序或事件发生发展的顺序进行叙述。倒叙是指将结局或最重要、最突出的片段放在文章或小说最前面,然后再按事件发生发展的顺序进行叙述。插叙是指在叙述主要事件的过程中,插入一段与主要事件或主要情节相关的回忆或故事。

基于语料库的人物塑造方式研究通常以表示人物的名词或代词为检索对象,通过分析这些词汇的前后搭配,依据这些搭配是否包含说明人物特点的形容词,或者与人物动作、言语、外貌和环境有关的动词、名词或副词,确定人物塑造方式是直接法还是间接法,所塑造的人物是扁平人物还是圆形人物。直接法是指采用直接点明人物特点的形容词和抽象名词描写人物主要特征。间接法是指对人物进行多维度描述,包括对人物动作、言语、外貌和环境的描写,以及基于人物关系的描写来烘托人物性格。扁平人物指在故事情节发展的各个阶段,某一人物的思想和行动不会有大的改变,具有象征意义。圆形人物是指某一人物具有多面性和复杂性,心理活动较为复杂,类似现实生活中的人。

基于语料库的叙事进程研究旨在对文本核心信号标记进行语料库分析,探讨具体作品的叙事如何发展,或“叙事从开始到结束的活动以及支配这些活动的规则”[35]219。根据图伦的观点,文本的核心信号标记主要分为:包含主要人物形象名称的语句,描写人物行动的语句的叙事时态限定动词,叙事段落开头语句,高频实词和词丛等[12]。一般而言,主要人物形象的名称既可以是动物和拟人化的无生命实体,也可以是具体人物的名称。这些名称和指代主要人物形象的代词均为具体作品中的高频词汇,与事件的描述密切相关。描写人物行动的限定动词通常揭示具体人物的所作所为。与那些表示交际性、报告性或询问类的动词,如said、whispered和pleaded等相比,这些限定动词更能推动叙事进程的发展。叙事段落尤其是新段落往往表明新情节的开始。因而,分析叙事段落的开头语句,可以把握叙事进程的开始和发展线索。高频实词和高频词丛的分析可以揭示具体作品叙事的主题和内容,以及具体事件发生发展的脉络和特征。在图伦看来,“读者对叙事进程的体验和期待受到精确编排的文本词汇的引导”[36]1。因此,可以在考察以上词汇、词丛和语句使用的趋势和特征的基础之上,分析具体作品的叙事进程。图伦基于主要人物形象名称Corley和Leneham使用的频率和特征分析,探讨了短篇小说《两位勇士》的叙事进程[36]。

(四)基于语料库的文学史研究

基于语料库的文学史研究旨在利用语料库对文学发展的过程和规律进行研究,以揭示文学发展与社会文化因素的关系以及本民族或本国文学与其他民族或其他国家文学之间的关系。一般而言,文学史研究以作家、文学作品、文学流派、文学思潮和文学事件为主要研究对象,而语料库在作家研究、文学作品研究和文学流派研究方面均有作为的空间。事实上,基于语料库的文学史研究可利用收录不同时期出版、发表的重要文学作品和相关文学评论文章的历时性文学语料库,在对文学作品和文学评论文章进行定量分析和定性研究的基础之上,结合不同时期的诗学传统和社会文化因素,分析文学发展与演变的主要趋势和特征及其内在原因,探讨文学发展的内在规律及其与社会文化的互动关系,勾勒文学发展的全景图。历时性文学语料库所收录的文学作品语料均为具有重要影响的作品或在文学创作理念和创作技巧等方面与众不同的作品。这些语料均配有篇头标注,提供关于出版社、出版时间、作家出生年月和性别、作品标题、作品类别以及印刷和发行等副文本信息。对这些语料及其副文本信息进行语料库分析,我们可以掌握重要作家的创作理念和创作风格,把握不同时期文学形式、文学结构、文学内容和文学流派的主要特征,理解文学发展的脉络、规律与特征。此外,历时性文学语料库收录了不同时期发表的文学评论或文学批评文章。对这些语料进行分析,可以揭示具体文学作品传播和接受的趋势和特征,文学作品的社会意义及其推动文学发展的历史价值。应当指出,基于语料库的文学史研究秉承描写性原则,从文本出发,从历史实际出发,还文学史以本来的文学发展面貌,追求文学史书写的客观、真实与全面,能够有效克服传统文学史研究存在的片面和主观等缺陷。

五、基于语料库的文学研究的意义

综上所述,对文学研究而言,基于语料库的文学研究不仅意味着文学研究方法的重要变革,而且意味着文学研究自身的拓展与深化。

(一)基于语料库的文学研究推动文学研究方法发生重要变革

前文述及,文学研究一直以定性研究为主。而基于语料库的文学研究将语料库方法引入文学研究领域,文学研究方法实现由定性研究方法向定性研究和定量分析相结合转变。事实上,定量分析方法与定性研究方法的有机结合可以有力推动文学研究的发展。正如赫尔曼在论及语料库应用对叙事学研究的价值时所言:“倘若缺乏实证,缺少以数据为基础的检验,叙事学术语的构成和提炼有可能是空洞的。但是,如果没有以定性分析为出发点,对故事的实证研究是盲目的。因此……整合定量方法和定性方法是最有效的策略。”[11]127

首先,由于语料库方法的应用,关于文学事实的描写以及文学本质或文学创作规律的探索可以建立在大量文学作品或丰富的文学语料分析的基础之上,文学研究因而具有充分的事实依据。而在语料库应用于文学研究之前,研究者仅仅依据有限的文学现象或文学事实对文学研究的有关问题进行归纳,研究的全面性往往不太令人满意。

其次,凭借语料库及相关软件的应用,我们可以获取关于文学作品典型词汇、语句、词丛、语块、语篇结构以及词汇搭配和语义韵等方面的数据。这些数据为文学研究提供了可靠的量化依据,使文学研究更趋客观。

最后,应用语料库对文学作品进行分析,可以帮助我们发现凭肉眼无法观察到的文学现象或文学事实。比如,如果不借助于语料库技术对文学作品进行多维度、多层次分析,我们无法获取关于某个作家创作风格的全面认识。如果没有语料库的支持,我们也无法对具体文学作品传播的趋势与特征开展扎实的实证研究。

(二)基于语料库的文学研究拓展并深化了文学研究

文学作品的文体特征研究是文学研究的重要内容。无论是文学作品研究,还是作家研究,均以文学作品的文体特征研究作为重要研究内容。长期以来,由于技术条件的限制,文学作品文体特征研究一直停滞不前。迄今为止,我们尚未获得关于文学作品文体特征的客观、全面的认识。不过,语料库方法在文学研究中的应用使得文学作品文体特征的多层次描写成为可能,文学作品文体特征研究因而获得新的发展动力。而其他相关领域的研究,如作家创作手法和技巧研究、人物形象研究、作家风格研究以及比较文学研究等,也因此拥有坚实的基础。

作家风格研究一直是文学研究关注的焦点,一大批研究成果相继发表、出版。然而,这些研究基本上是以一部作品或少量文学语料的分析为基础,往往带有很强的主观性和随意性。而且,这些研究所分析的作家风格并非真正意义上的作家风格,而是具体作品的风格。实际上,真正意义上的作家风格研究应当基于同一作家的不同作品特征的分析来归纳作家风格。基于语料库的文学研究凭借语料库的技术优势,可以在对同一作家或作家群的不同作品在词汇、句法、语篇、叙事、搭配和语义韵等层面所表现的趋势和特征进行充分描写的基础之上,总结作家风格的总体特征并分析作家风格的成因。在这个意义上讲,基于语料库的文学研究有力推动了作家风格研究。

此外,长期以来,学界侧重于介绍和阐释文学流派理论主张,很少对具体文学流派的理论和主张进行验证。基于语料库的文学研究强调在对具体文学流派的文学文本进行客观描写的基础之上,验证这些流派是否按照他们所提出的理论或主张进行创作。显然,基于语料库的文学流派理论研究拓展了文学理论研究的外延。

本文系统阐述了基于语料库的文学研究的缘起、属性和特征、研究领域和研究意义。基于语料库的文学研究产生于语料库语言学与文学研究之间的融合,本质上是以语料库应用为基础的文学研究范式,其问世不仅推进了文学研究方法的变革,而且拓展了文学研究的外延。鉴于此,学界应当着力推动语料库在文学研究中的应用,推动文学研究的发展。

猜你喜欢

语料库范式文学作品
当文学作品扎堆影视化
为什么文学作品里总会出现“雨”
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
平行语料库在翻译教学中的应用研究
孙惠芬乡土写作批评的六个范式
《语料库翻译文体学》评介
管窥西方“诗辩”发展史的四次范式转换
文学作品与数学
语篇元功能的语料库支撑范式介入