狄更斯和哈代小说的语料库文体学分析
2021-03-08陈秀美
陈秀美
查尔斯·狄更斯和托马斯·哈代都是19世纪英国的伟大作家,两人都以写实见长。但两位作家的家庭情况和生活环境不同,导致他们的写作风格也略有差异。狄更斯的作品描绘了底层社会,而哈代的作品则体现了地方特色。那么,两位作者在写作风格上有什么差别呢?本文拟从语料库文体学的视角,来分析这两位作家文体风格上的差异,从可读性、词汇密度、平均词长、名词化手段密度、常用介词密度五个角度对两位作家的四部作品:《雾都孤儿》《我们共同的朋友》《一双蓝眼睛》《无名的裘德》进行文体风格分析,以此揭示两位作家文体风格的异同,以及他们早期和后期文体风格的变化。
一、文献综述
语料库文体学是一个新兴学科,它随着语料库语言学发展而来,利用语料库的检索功能,将文本的特征和属性用一种量化的方式体现出来[1],这从一定程度上能够反映出作者的文体风格。语料库文体学的理论基础分为两个方面:形式与意义、频率与意义。每个文本在语言使用或者表述方式上都有其特点,每个文本的特点都有所不同,甚至同一个作家不同时期的作品之间也有所差异,我们称之为“个体属性”[2]。语言形式在一定程度上反映了文本的这种个体属性。不同的作者选择不同的语言形式,这其中必定隐藏着特定的意义。对其文本构成的语料库进行检索,能够在一定程度上揭示这种意义。语料库文体学研究认为意义上的显著性就是用语料库中的出现频率来体现的[3]。因此,运用语料库对作者的文体风格进行研究有一定的理论基础。
国内外语料库文体学的研究领域主要集中在文学和翻译领域。Burrow通过研究简·奥斯汀作品中的单词分布情况,对主人公性格进行了分析[4]。陈建生、付涛通过构建语料库,对比分析哈代“环境与性格”小说和其他类小说,以及与其同时期作家的小说,揭示了哈代“性格与环境”小说的特点。华信敏从类符/形符比、词汇密度、句子层面等角度分析十九大报告英译文体风格[5];彭发胜和万颖婷从平均词长、词长分布、高频词和标准化类符/形符比等方面研究《边城》三个英译本文体特色[6]。
狄更斯和哈代作为19世纪英国的伟大作家,其文学作品描绘了当时的社会状况,能够帮助读者更好地理解和研究当时的社会情况。但目前国内外的研究多侧重于对其一部作品的研究[7]。或将其作品中的某一人物形象与中国的文学大家做对比[8]。对这两者的文体风格的对比研究匮乏,从语料库文体学的角度进行的研究更是少之又少。
因此,本文将从可读性、词汇密度、平均词长、名词化手段密度、常用介词密度五个角度对狄更斯和哈代两位作家的作品的文体风格进行对比分析,以此揭示两位作家文体风格的异同,以及他们早期和后期文体风格的变化。
二、研究设计
(一)研究问题
本文旨在研究狄更斯和哈代两位作者作品的文体风格差异以及他们的作品在前后期文体风格的差异及其原因,具体的研究问题如下:
1.狄更斯和哈代的小说在可读性、词汇密度、平均词长、名词化手段密度、常用介词密度五个方面有什么异同?
2.狄更斯和哈代前期和后期的小说在可读性、词汇密度、平均词长、名词化手段密度、常用介词密度五个方面有什么异同?
(二)数据收集与分析
用Readability Analyzer2.0对语料进行检索,得到四部小说的可读性和平均词长。本文用Flesch Kincaid Grade Level来表示可读性。它通过计算每个句子的平均单词数和单词的平均音节数来表示文本的复杂程度。然后它将复杂程度转换为分数。其产生的结果越高,文本的复杂程度就越高,读者阅读起来就越困难。直接读取文本的平均词长,平均词长是4个字母左右的文本属于难度中等的,高于4个说明该文本用词复杂,阅读难度高,反之则较为简单,易于通读[9]。
用Antconc3.5.7对语料进行检索,得到四部小说的词汇密度、常用介词密度和名词化手段密度。笔者选取四部小说中最频繁出现的10个介词(to,of,in,with,as,for,at,by,on,from)为检索目标词,得到四部小说的常用介词密度。并选取4种常用的名词化手段(*tion,*sion,*ity,*ness)为检索目标,得到四部小说的名词化手段密度。获得的数据录入SPSS对数据进行t-检验分析。
三、研究结果
(一)狄更斯和哈代小说的文体风格对比
1.可读性
可读性,也称易读性,指书面材料易于阅读和理解的程度,可读性越高,说明这个文本的阅读难度越低,越容易被读者理解,反之则阅读难度越高,读者越不容易理解。
经过数据分析,得出狄更斯小说的可读性(4.4)比哈代小说的可读性(7.5)高,且存在显著性差异(p=.000)。可见,哈代的作品阅读难度比狄更斯的作品高。
2.词汇密度
词汇密度是文本信息量大小的一个衡量标准。本研究用标准类符/形符(TTR)来表示词汇密度,以此来衡量文本的复杂程度。
经过数据分析,得出狄更斯作品的词汇密度(42.49%)比哈代作品的词汇密度(44.05%)小,并且存在显著性差异(p=.006)说明哈代作品实词密度较高,信息量大,阅读难度更高;狄更斯作品的实词词汇密度较低,阅读难度更小。
3.平均词长
平均词长指特定文本中词汇的平均长度。平均词长反映了文本的词汇难度。平均词长越长,说明该文本中的长词越多,阅读难度越大。反之则表明该文本的长词越少,阅读难度越低。
经过数据分析,得出狄更斯作品的平均词长(4.58)比哈代作品的平均词长(4.47)大,且存在显著性差异(p=0.001),说明两位作者的作品用词都较为复杂,且狄更斯的作品中长词用的比较多,阅读难度更高。
4.名词化手段密度
名词化是跨范畴的语言现象,它用名词的形式来表示动词的过程、形容词的特征。这些由动词或者形容词转化过来的名词词汇密度大、信息浓缩,因此,增加了读者的理解难度。名词化蕴含较大信息,理解它们需要花费大量的时间,甚至有时会出现语言歧义。如果一篇文章充满了这些名词,可读性就会大大降低。
经过数据分析,狄更斯作品的名词化手段密度(1.06%)比哈代作品的名词化手段密度(1.10%)小,但是不存在显著性差异(p=0.554)。
5.常用介词密度
笔者选择了10个常用的介词进行检索,得到结果如下:
狄更斯作品的常用介词密度(9.02%)比哈代作品的常用介词密度(8.88%)大,但两者之间不存在显著性差异(p=0.463)。
(二)狄更斯和哈代小说前后期文体风格的变化
1.可读性
经过SPSS数据分析得出,狄更斯作品后期的可读性(4.16)比前期的可读性(4.66)大,阅读难度更小,且两个时期的可读性存在显著性差异(p=0.043)。而哈代的作品在后期的可读性(7.56)比前期的可读性(7.46)相比,略有减小,阅读难度略微变大,但变化程度不大(p=0.881)。
2.词汇密度
经过数据分析,这两位作者作品的词汇密度都有所下降(狄更斯:前期42.81% vs 后期42.18%;哈代:前期44.34% vs 后期 43.76%),且不同时期的词汇密度之间不存在显著性差异(p=0.431, p=0.451)。因此,可得出两位作者在创作的前期和后期作品的词汇密度都有所下降,但相差不大。
3.平均词长
经过数据分析得出,狄更斯的作品后期的平均词长(4.58)比前期(4.57)略大,但前后期的平均词长之间不存在显著性差异(p=0.951)。哈代的作品后期的平均词长(4.39)比前期的平均词长(4.55)更小,且前后期的平均词长之间存在显著性差异。(p=0.000)。
4.名词化手段密度
根据数据分析结果得出,狄更斯作品后期的名词化手段密度(1.03%)与前期(1.09%)相比,略有减小,但两个时期的名词化手段密度之间不存在显著性差异(p=0.515)。哈代作品后期的名词化手段密度(1.01%)与前期(1.23%)相比,也有所降低,且存在显著性差异(p=0.026)。
5.常用介词密度
由数据分析结果可知,两位作者在两个不同时期的作品的常用介词密度都有所增大(狄更斯:前期8.31% vs后期9.66%;哈代:前期8.46% vs后期9.20%),且都存在显著性差异(p=0.000.p=0.000)。
四、讨论
从上述数据分析得出:在可读性上,狄更斯作品比哈代的阅读难度更低,且狄更斯的作品在后期阅读难度有所降低,而哈代的作品在后期的阅读难度变化不大。造成两位作者作品可读性差异的原因可能是两人的教育背景不同造成的。狄更斯出生在一个普通的家庭,他只上过几年学校,主要靠自学和从生活中获得文学知识,因此,他的文字比较贴近生活。而哈代曾就读于由朱丽亚·马丁资助建立的国立学校和多切斯特的不列颠学校。两个人的教育背景的差异导致作品的阅读难度有所差别。
在词汇密度上,狄更斯作品的词汇密度比哈代的小,说明狄更斯作品的词汇复杂度比哈代小说的词汇复杂度低,可读性更高。并且两位作者在创作后期的作品词汇密度都有所下降,但差异不大。
在平均词长上,狄更斯作品的平均词长比哈代作品的大,说明狄更斯的作品中长词用的比较多,文本较为复杂。且狄更斯的作品的平均词长在后期变化不大,哈代的作品的平均词长在后期有所减小,说明其后期作品的阅读难度显著减小。
在名词化手段密度上,两位作者的作品相差不大。且狄更斯作品的名词化手段密度在后期的变化不大,哈代作品的名词化手段密度有所降低。说明哈代的作品在后期的可读性有所增大,阅读难度有所减小。
在常用介词密度上,两位作者的作品相差不大。且两位作家后期的作品的常用介词密度都有所增大,说明两位作家在创作后期的作品阅读难度有所降低。
五、结语
本文从可读性、词汇密度、平均词长、名词化手段密度和常用介词密度五个方面对两位作家的四部作品:《雾都孤儿》《我们共同的朋友》《一双蓝眼睛》《无名的裘德》的文体风格进行对比分析。分析得出:狄更斯的作品普遍比哈代作品的阅读难度低,且两位作者在创作后期作品的阅读难度都有所下降。这可能与作者的教育背景和生平有关。通过语料库对这两位作者的写作风格的分析更具客观性,更有助于读者了解两位作者独特的文体风格。