《人世间》语料库检索分析
2020-11-09徐超
徐超
摘要:《人世间》是当代著名作家梁晓声的长篇小说。以语料库文体学为理论基础,利用AntConc语料库检索软件和ICTCLAS汉语分词系统,通过量化的方式对小说的主人公和故事情节进行分析。首先通过词频表分析小说的高频词,然后选定参照语料库,提取小说关键词,最后借助软件的Concordance功能分析主人公的性格特征,发现小说具有人物角色丰富、形象刻画细腻等特点,且该书与作家的其他作品之间具有很强的延续性。
关键词:《人世间》 语料库 检索
中图分类号:I06 文献标识码:A 文章编号:1009-5349(2020)17-0104-03
梁晓声是当代著名作家,他曾创作出版过大量的小说、散文和影视作品。在创作过程中,知青经历带给他無限的灵感。他的多部作品都涉及知青话题,如《这是一片神奇的土地》《今夜有暴风雪》《雪城》等。2017年由中国青年出版社出版的《人世间》[1]是其最具影响力的长篇小说之一,该书曾获第二届吴承恩长篇小说奖,同年8月获第十届茅盾文学奖。小说展示了北方某省会城市背景下普通工人子弟之间的亲情和友情,以及他们之间既相互影响又各自独立的人生,也描绘出中华人民共和国成立后波澜壮阔的社会巨变。
文章基于语料库,首先利用分词系统对小说的全部文本进行分词处理,然后通过AntConc语料库检索软件进行词频统计、主题词提取并归类,分析小说的主题和情节,利用软件的索引功能对主人公“秉昆”进行检索,并对其搭配词进行整理分析,探讨主人公的个性特点。本研究的目的在于,借助语料库检索软件,对《人世间》的文本进行量化分析,在此基础上挖掘小说在人物塑造、情节叙事等方面的特点,为该书的研究提供一个新的视角[2]。
一、理论基础
虽然出版时间不长,但已有多位学者对《人世间》进行分析研究。在中国知网中以“《人世间》”为关键词进行检索,共有论文23篇,这些研究以对书中某一人物性格特征的分析、小说的叙事方式为主,如李贵成(2019)《“永恒的女性,引领我们向上”——梁晓声〈人世间〉中的女性形象与社会变迁》、高心悦(2019)《论梁晓声〈人世间〉的情爱叙事》等。但是,还未出现运用语料库技术对该书进行量化分析的研究。
随着大数据时代的发展,语言研究领域对语料库技术的应用更加广泛,出现了基于语料库的翻译、话语分析研究、二语习得研究等。语料库文体学是在对语料进行加工标注的基础上,通过词频统计、主题词检索、索引、词类分布以及特殊结构的人工标注与检索统计等手段,对文学作品主题、人物形象的塑造、叙事的发展以及作家风格等进行研究[3]。
但由于汉语不实行分词连写的特点,对中国作家作品的语料库分析研究还很少,在中国知网中进行检索,发现通过语料库检索分析的研究多为英文小说原著的文本分析,或是对英译本小说的研究。笔者选择汉语长篇小说《人世间》作为研究对象,首先要解决的就是文本的分词问题。通过对比多种汉语分词系统,最终选择中科院分词软件——ICTCLAS汉语分词系统对文本进行分词。
二、基于语料库的分析
(一)借助词频表初步分析
通过软件的词表功能得到《人世间》所有文本的词频表,如表1所示。发现书中人称代词出现的频率非常高,其中频率最高的是男性第三人称“他”,据此可以判断出,该书对人物的描写着墨颇丰,且以男性主角为主要描写对象。此外,出现频率最高的人名为“秉昆(周秉昆)”,因此可以判定“秉昆”是小说的主人公。词表中出现频率最高的动作动词为“说”,可见作者注重角色对话的设计,书中人物之间的言语互动十分丰富。
(二)提取关键词表分析小说情节发展
文本的关键词表是通过与其他文本对比形成的。在检索过程中,过滤掉这些文本中都存在且频率相似的词,如结构助词、判断动词等,凸显只有在该作品中出现的,或是频率远高于其他文本的词。因此,提取关键词表需建立两个语料库,一个为目标语料库,另一个为参照语料库,通常规模要大一些,以此来凸显目标语料库的一些特别高频词以显现该语料库的主题或内容特色[4]。在本研究中目标语料库为梁晓声的长篇小说《人世间》,参照语料库中为路遥创作的《平凡的世界》和格非的《江南三部曲》。具体内容如表2所示:
选择《平凡的世界》和《江南三部曲》建立参考语料库的原因如下:
第一,这两部作品都是茅盾文学奖获奖作品,有很高的文学价值,且篇幅较长,具有代表性。
第二,《平凡的世界》与《人世间》的时代背景相同,小说都是从二十世纪六七十年代写起,人物角色众多,时代跨度大。
第三,《江南三部曲》是发生在南方的故事,而《人世间》则是以东北一城市为背景,两位作家的籍贯也是一南一北,通过与《江南三部曲》进行对照,能够发现《人世间》的地域特色。
关键词检索之前,先借助分词系统对所有的语料进行分词。由于汉语的特点,目前的分词软件还不够完善,分词后会出现人名和地名等方面的切分错误,需要人工修正。将修正后的文本进行关键词检索,依据检索结果对其进行分类,具体如表3:
结合小说的人物角色和称谓这两类关键词,可以发现该书的一个特点是人物角色众多,且主要是围绕亲情和友情这两张关系网展开。除主人公“秉昆”(K)外,出现频率较高的“秉义”(Y)“周蓉”“郑娟”均是其家人,而“赶超”“春燕”“国庆”“德宝”则是“秉昆”的朋友。此外,人物角色的命名也体现出作者的别具匠心。“秉昆”及其哥哥姐姐、朋友们都出生于二十世纪五六十年代,他们的名字,如“赶超”“国庆”“进步”等体现了鲜明的时代背景和政治色彩,而他们的下一代,如“楠楠”“周聪”“玥玥”这些名字则更多体现了父母对孩子的美好期望。
书中与时代背景相关的词体现了作者作为当代知青文学的代表作家之一,其作品之间具有很强的延续性。书中的主要人物“秉义”和“周蓉”都曾是知青,参加过上山下乡运动。“文革”与“平反”也紧紧牵动着书中人物的命运。如“周蓉”为了恋人“冯化成”上山下乡,一起去往贵州,在那里的生活是“周蓉”青年时期的主要经历。又如“秉昆”嫂子“冬梅”的父母因为“文革”入狱,后又经平反,生活环境发生很大变化。这些看似宏大的时代背景信息,实则对书中人物性格的塑造、情节的推动至关重要。
与地点有关的词既有工作地点,如“酱油厂”“和顺楼”“军工厂”,也有居住的地点,如“共乐区”“胡同”“新区”,还有求学的地点“北大”“法国”。这些地点既体现了中华人民共和国成立后几十年间中国经济体系的变迁,也体现了社会不断发展给人们生活带来的巨变。尤其是对居住环境的描写贯穿全书,开篇就介绍了“共乐区”的街道、住房;父亲“周志刚”最喜欢的生日礼物是修整房子的砖块水泥;“秉昆”賺钱后最想做的事是买一栋小洋房;“秉昆”的朋友和家里人吵架的原因也大多是因为房子;哥哥“秉义”在任期间做的最后一件事就是改善“共乐区”的居住环境,想尽办法让大家搬进新区。“衣食住行”是人世间最重要的事情,作者着力刻画居住环境的变化,也与书名相照应。
作者选取“工人”“干部”“编辑”等作为人世间各种职业的代表,也体现了书中所体现的“知识改变命运”的观点。周家三兄妹中,哥哥姐姐是知识分子的代表。哥哥大学毕业后进入官场,改善了家乡人的生活环境,帮助“共乐区”人民住上了舒适的楼房。姐姐是典型的新时代独立女性的代表,有文化,有思想,追求自由。“秉昆”从小受哥哥姐姐的影响也对文艺很感兴趣,当机会到来时,凭借自己的文化素养抓住机会,改善自己的生活条件。
(三)检索主人公“秉昆”分析角色性格
利用语料库软件中的Concordance功能,能够检索到与主人公“秉昆”有关的上下文,这有利于对其进行角色性格和小说人物塑造技巧的分析。将检索的结果进行分类统计,分别为:(1)“秉昆”的亲属;(2)“秉昆”的朋友;(3)“秉昆”的动作描写;(4)“秉昆”的心理描写。结果如表4所示。
从表4可以看出,秉昆的交际圈非常广,除了家人之外,还有很多朋友。与“秉昆”相关的有“问”“听”等动作描写,以及“楞”“明白”“记住”等神态心理描写,这些词语的选择体现了作者借助不经意的动作和神态描写细腻地刻画人物性格。因为“秉昆”是家里最小的弟弟,而哥哥姐姐从小又非常优秀,所以作为“老小”,他在家中的话语权不高,经常听父母或者哥哥姐姐的话,形成了缺少主见的性格。而“替”“陪”“聊”等动词体现了他与朋友之间关系亲密,重视友情。而“笑”在“秉昆”的上下文中出现多次,说明他一生虽经历了很多挫折,但对人生还是充满希望,保持乐观积极的生活态度。
三、结语
虽然目前已经有很多基于语料库技术的文学研究,但是主要以英文作品为主,对中国文学作品的研究还很少。本文利用语料库检索软件对梁晓声的长篇小说《人世间》从主要角色、故事情节和人物形象塑造等方面进行了分析,发现了小说具有人物角色丰富、形象刻画细腻等特点,且该小说与作家的其他作品之间具有很强的延续性。
参考文献:
[1]梁晓声.人世间[M].北京:中国青年出版社,2017.
[2]陈婵,程乐.莫言作品《蛙》的语料库检索分析[J].浙江工商大学学报,2014(5):26-34.
[3]卢卫中,夏云.语料库文体学:文学文体学研究的新途径[J].上海外国语大学学报,2010,33(1):47-53.
[4]徐丽雯.巴金长篇小说《家》的语料库检索分析[J].海外英语,2017(22):212-214.
责任编辑:景辰