基于语料库的约翰·邓恩诗歌语言研究
2023-12-09李正栓王密卿
赵 烨 李正栓 王密卿
河北师范大学 石家庄 050024 中 国
引 言
英国玄学派诗人约翰·邓恩(1572-1631)的诗歌语言一直以来都是研究领域关注的热点。邓恩写作风格独特、特点鲜明,其出人意料的开头、强烈的反讽效果、不规范的标点符号、语句的错位和巧妙的悖论都使他的诗歌新奇有趣,充满智慧,但有时又狡黠诡谲,令人难解其中深意,再加上戏剧化的节奏、张力的句法和有力的雄辩,都是对伊丽莎白时代传统诗歌的颠覆,也是对欧洲矫饰风格和技巧的变革。多年来,学界对于邓恩诗歌语言特征一般使用定性研究方法,作者在品鉴邓恩作品时往往都是依据自己的主观判断,且研究的内容也是具体的个人实践,因此是感性的,并无规律可循。“语料库和数据库的应用能够方便研究者提取大量语言数据,并在数据分析的基础上揭示语言事实或语言现象背后的趋势和特征,……”(胡开宝,43)近年来,许多学者都尝试将语料库的研究方法应用于文学的研究领域,利用语料库检索技术对文学作品进行多角度分析,“大规模客观的统计数据可加强文学文体学研究的实证性,拓宽其研究视野”(诸葛晓初吴世雄, 2022:15),将定性研究与量化研究相结合,为读者鉴赏文学作品提供新的途径和方法。本文尝试运用语料库方法,对邓恩诗歌语料进行量化分析,通过数据的展现,直观说明邓恩诗歌的语言特征,为深刻理解其诗歌内涵提供统计学依据,探索邓恩诗歌定性与定量研究相结合的新方法。
本研究自建邓恩诗歌观察语料库,收集了包含爱情诗、神学诗、哀歌、挽歌、祝婚曲、讽刺诗、赞美诗、书信体诗文等在内的180首作品,同时以CLOB英国英语语料库(该语料库是由许家金和梁茂成于2012年建成的通用语料库)作为参照语料库,主要使用WordSmith6.1和RANGE V1.0.3等语料库检索工具,针对邓恩诗歌的不同语言特征进行相应的检索,包括词汇的变化和分布情况、高频词、主题词等方面,并根据分析结果制作可视化表格进行对比分析,从而探究邓恩诗歌的语言特征。
一、表现层统计分析——口语化的诗歌语言
口语化是邓恩诗歌语言的一个显著特征。虽然邓恩的作品以似非而是、含混多义、令人费解而著称,实际上,他的大部分诗歌都使用了生活化的语言,用直接而常见的语句带给读者眼前一亮的感觉。口语化的语言是自然语言,也是先天的语言,其表达方式通俗易懂、自然流畅。
为了探究邓恩诗歌口语化的语言特征,本文对邓恩诗歌语料库与CLOB英国英语语料库进行比较研究,以两个语料库的类符/形符比、标准化类符/形符比、平均词长、词汇分布等数据(表1),客观分析两者的词汇密度、复杂性的分布统计等情况,验证邓恩诗歌口语化的特点。
表1:邓恩诗歌语料库和CLOB基础数据对比
类符/形符比(TTR)在一定程度上能够反映文本用词的变化情况,其值越大,不同词汇的数量越多;其值越小,词汇复现率越高。但如果是库容(形符数)不同的两个文本,用类符/形符比进行比较就很不合理。这个时候,标准化类符/形符比(STTR),即每千词形次比的均值,能够很好地解决这个问题。虽然邓恩诗歌语料库的库容远远小于CLOB(邓恩,386,203;CLOB,6,035,828),但邓恩诗歌与CLOB的STTR却差别不大,分别为46.29%和45.82%,这充分说明邓恩诗歌的语言是日常生活化的语言。邓恩诗歌的STTR略高一些,TTR也达到11.61%,这表明邓恩诗歌的词汇密度略高,即在相同文字数量下,邓恩诗歌的语言用词是富于变化的,但两者标准化形次比的接近依然能够证明邓恩的诗歌语言是普通人口语化的语言风格。另一方面,平均词长(mean word length)是指语料库中类符所包含字母的平均数,能够说明作者词汇的多样性和用词的复杂度。一般而言,平均词长越长,文本越深奥复杂;平均词长越短,文本越浅显易懂。常见文本的词长通常为2-5个字母,平均词长为4左右。从表中数据可以看出,邓恩诗歌语料库的平均词长为4.15,CLOB英国英语语料库的平均词长为4.76,都处于均值水平,而CLOB语料库本身为通用语料库,是为代表英国英语全貌而建成的语料库,因此两个语料库平均词长的接近充分说明邓恩的诗歌语言简约质朴,贴近生活,用读者喜闻乐见的语言描绘立意深刻的主题。
本研究还运用RANGE软件对邓恩诗歌语料库的词汇分布情况做出统计(表2),由此进一步分析邓恩诗歌语言的特征。RANGE软件的基本原理是把对象文本中的词汇与自身的公认权威词表进行对照比较,从得出的数据考察对象文本出现在词表中的词汇占总词汇的比率,它提供的三个基础词表是按照词汇使用频率由高到低统计而成的。前三个词表是使用频率最高的词:词表1包含约1000个最常用的核心词汇,词表2包含约1000个次常用核心词汇,词表3是通用学术词表(AWL),包括最常用的学术词汇。由数据表可以看出,邓恩诗歌语料库分布在三个基础词表的类符所占百分比分别为24.26,14.80和4.09,总和为43.15%,接近半数,说明邓恩大量使用人们日常生活中常用的基础词汇,而非正式的诗性语言来传达情感。此外,邓恩诗歌语料库的总字符数为71060,除去高难词汇即词表外词汇的11354字符,基础词汇共59706,占总字符数的84.02%,这同样可以看出,邓恩所使用的语言是生活中的语言,天然去雕饰,人们喜闻乐见,读之也倍感亲切,诗人向伊丽莎白时期诗歌的绮丽文风发起挑战,用日常的表达吸引读者透过浅显的表层含义来体味诗中奇特的隐喻和诡异新奇的深层含义。
表2:邓恩诗歌语料库词汇分布情况
口语化是陌生化的方法之一。什克洛夫斯基认为,日常语言是文学语言的直接来源,文学语言是在日常语言基础上的一种升华。通过对语料库数据的描述与分析可以看出,邓恩用接近生命本真状态的口语进行诗歌创作,他的诗歌语言很少挖空心思的练字谴词和铺陈,而是用平白素朴的生活语言写成,却处处透着“反常规”所带来的“新”与“奇”。
二、主题词分析——复义性的诗歌语言与主题
主题词表是指将观察语料库与参照语料库相比,观察语料库中出现频率显著偏高的词汇列表。“计算主题词要求以统计测试来确定目标语料库中频率与参照语料库中频率之间差异的显著性。”(Egbert, et al., 2020:137)主题词表是研究文本内容和语言特征差异的重要方法。词语出现频率偏高的程度可以用对数似然率(Log Likelihood)来表示,主题词差异的显著性可以用P值来表示,P值越低,显著性越高。本研究以邓恩诗歌语料库为观察语料,以CLOB英国英语语料库为参照语料,用WordSmith生成主题词表,根据对比发现,在邓恩诗歌语料库主题词表所列的500个正主题词中,有285个P值为0.0000000000的绝对主题词,本文列出前10个来探究邓恩诗歌的语言特征和主题,根据对数似然率由高到低排列如下(表3):
表3:邓恩诗歌语料库主题词表(前10)
根据表中数据可以发现,邓恩诗歌语料更多地出现thou, thy, thee, doth, hath等在中世纪英语(Middle English)以及早期现代英语(Early Modern English)中常见的人称代词和助动词,体现出邓恩所处时代诗歌的语言特点。其次,从主题词thou, thy, thee可以看出邓恩诗歌对象化的语言,诗人从接受者的角度出发进行创作,好像对面坐着一个朋友,诗人站在朋友的角度,向他娓娓道来。也就是说,邓恩面对的似乎是一个具体的人,要时刻关注他的反应,这样的表达更真实、更贴近生活,更容易让读者接受,也会增加文字的真诚性、信服力和对象感。此外,表中的love和soul揭示了邓恩诗歌的两大主题:爱情和宗教。为了更好地揭示邓恩诗歌的主题内容,本研究将词表中的功能词剔除,提取出排名前10的实义主题词,列表如下(表4):
表4:邓恩诗歌语料库主题实词表(前10)
从表中数据可以看出,邓恩的诗歌主题以爱情和宗教为主,其中兼有对死亡和灵魂的思考。Love, love’s向读者揭示了邓恩诗歌最重要的内容。诗人的爱情诗集《歌与短歌集》收集了邓恩经典的55首爱情诗,再加上《哀歌》《祝婚曲》等,构成了邓恩独特的爱情观,他所珍视的爱情是灵与肉的结合,是心灵相通的。他在诗中寻找真爱,向往理想的爱情,却又对爱情充满怀疑。他笔下的爱情既世俗又神圣,既有对不离不弃的赞美也有对虚情假意的否定,既有对不忠的轻蔑和对女性的怀疑,又有真心的期待和对美好爱恋的赞颂。邓恩诗歌的第二大主题就是宗教,这从主题词soul, heaven, souls, sin, die上可以看出。邓恩的宗教意识里夹杂着罪与救赎、怀疑与焦虑,这本身就是对他宗教立场游移不定的一种写照。“作为安抚他精神焦虑的一种方式,邓恩审视自己的灵魂,希望能找到为他辩护的证据。”(McKelvey,2022: 321)邓恩早年信奉天主教,后改信英国国教,并升任圣保罗大教堂教长一职,这导致他一生都对自己的信仰充满怀疑和叛逆。他惧怕死亡,内心极度痛苦和挣扎,虽然在诗中他与死亡对峙,似乎可以勇敢面对死亡,实则外强中干,忏悔自己信仰的背叛,害怕受到惩罚。
从以上分析可以看出,邓恩用具有时代特色且接地气的诗歌语言表达含混多义的主题思想。他把爱情和宗教表现得标新立异,既矛盾又统一,既复杂又简单,平静的诗歌语言下面是波涛汹涌的情绪释放和模糊多义的诗意表达。
三、高频词分析——独树一帜的主题意象
利用语料库工具进行词频统计就是计算语料库中每个类符出现的次数,得出它们出现的频率,以了解文本的用词规律。在词频统计中,高频词尤为重要。一般情况下,语料库词表中的高频词绝大多数是功能词,实词的出现则表明该实词所指的人、事物或行动等是语料关注的焦点,因此高频实词是同样可以反映文本的主题。同时,根据高频实词我们还可以了解诗人创作的主题意象。本研究利用Wordsmith的词表功能,建立了邓恩诗歌语料库高频实词词频表,除去一些常用的功能词、数词、代词等,表格列举前10个以实词形式出现的高频词(表5):
表5:邓恩诗歌语料库高频实词
从高频词“爱”“心”“死”“灵魂”“上帝”“天堂”可以看出,与爱情和宗教相关的主题意象占据邓恩诗歌的重要位置,印证了主题词表数据呈现的结果。邓恩渴望真心,追求灵魂契合的爱情,认为世上最好的爱情是灵魂与肉体的统一。另一方面,邓恩的宗教观充满彷徨和挣扎,他放弃天主教而改信英国国教的行为让他痛苦一生,备受折磨。除此之外,邓恩诗中的其他主题意象也是别具一格,既有文艺复兴传统意象的影子,也有玄学派诗歌的独有的特征。
“人的发现”与“世界的发现”是欧洲文艺复兴的两大主题。文艺复兴时期,随着近代科学的兴起,人们开始了对世界与人类的探索,试图用逻辑,而非神的意志来解释世界,开始探索未知领域,重新认识世界。人们对世界的新态度、对人文主义的自信以及对理性方法的信赖同样影响着邓恩诗歌的内容和主题。高频词“世界”向读者展现了一位对世界充满好奇心的诗人形象,他诗歌中的世界观既有宗教的深重影响也有科学的影子,既有宇宙新发现和地理新探索带来的新科学的影响,也有托勒密的传统宇宙论和古代炼金术影子。“诗歌成为人文学科与自然学科的间接载体、天体、地图等典型历史发展轨迹中物化的概念被多恩赋予了玄学诗性。”(南健翀 赵妍,2020:112)。
“太阳”也是反复出现在邓恩作品中的高频词。在文学作品中,太阳往往是英雄的形象,或者是一个强大的人物,具有坚强的个性温暖的品格,尤其是在诗歌中,太阳常被诗人用作光和希望的象征。邓恩也用太阳来赞颂完美的爱情,表现强大,揄扬力量,比如在神学诗“花冠组诗”中,他为赞颂耶稣的神圣而将其比作太阳。但有时他也另辟蹊径,公然否认太阳的权威,如在《太阳升起来》中,他声称自己的爱是永恒的,而不是时间或季节的奴隶。邓恩告诫太阳他们的爱情是不受太阳运动的束缚或奴役的。太阳在整首诗中都受到批评,被称为“不守规矩”。他把太阳从其崇高地位上狠狠拉下,否认太阳光束的强大。这是对太阳意象的陌生化。
“眼睛”是邓恩诗歌中出现频率最高的人体词,诗人诗中的眼睛是感知世界的工具,用以辨别形形色色的人和物,看清前路,洞察世事。同时,眼睛的光芒是爱情的催化剂,中世纪晚期和文艺复兴时期的欧洲诗歌将爱情与眼睛联系起来,将眼睛作为陷入爱恋的渠道,将目光作为引诱的工具,发展出了一种爱情过程的表现形式。在爱情诗中,邓恩将眼睛看成传递情感的工具,从情侣的相遇到坠入爱河,都需要眼神的交流、目光的吸引。
“名字”是身份的象征,是名字主人在世间的名声与威望的寄托,也是现实生活与非自然社会的一条关联线。邓恩诗中的高频词“名字”既有表示身份的含义,也表示名义(by the name of)。受到魔法论著中常见观念的影响,邓恩还认为名字是具有某种法力的,如在“赠别:论窗上我的名字”中,邓恩表示将名字镌刻于窗上,就好像给这玻璃施了符咒,使其无比坚硬,以此比喻爱情。此外,邓恩也认为名字可以体现一个人的品性和思想行为表现,如在“致玛德琳·赫伯特太太:论圣玛丽·玛德琳”中,邓恩以与圣女同名暗示赫伯特太太可以圣女的后半生为榜样。
可见,邓恩诗歌中的主题意象富于想象力,独特且不落窠臼,惯用寻常事物表达深刻寓意,他“总是对那些寻常惯用的诸多意象加工变形”(李正栓,2010:81),予以陌生化的处理,形成巴洛克意象,既遵从传统又旨在打破传统。
结语
综上所述,本研究采用语料库的方法,在考察邓恩诗歌语料的基础上对其诗歌语言进行定量和定性相结合的全面分析,“当定量结果与合理的定性语言解释相结合时,仅以数字形式存在的模式就可以用一种生动的方式为语言的使用、变化、发展和变化提供重要的见解。”(McIntyre & Walker, 52)因此,“语料库方法的应用不仅可以使研究更为客观、科学,而且可以帮助我们发现凭肉眼看不到的文学文本的语言特征或文学现象。”(胡开宝 杨枫,2019:145)由此不难发现,邓恩的诗歌语言平实质朴、朴素自然,不追求华丽的辞藻,显得真切深刻,生活化的语言中蕴含深意,同时邓恩诗歌语言表意的含混性和多义性以及主题意象的独创性,使其看似简单而确定的诗作却蕴含着多重而不确定的意味,令读者回味无穷。