基于情感分析技术的莫言小说英译本在西方的接受程度研究
2020-08-01石春让邓林
石春让 邓林
(1.西安外国语大学 英语实验基地,陕西 西安 710128;2.西安外国语大学 英文学院,陕西 西安 710128)
0 引言
当前,在中国文学对外传播过程中,全球化的电子商务是重要的一个传播渠道。西方的普通消费者可以通过电商平台购买中国文学译介读本,并通过电商平台的商品评论机制反馈阅读感受。此类消费者在一定程度上代表着广大的读者群体。他们不同于专业书评人,他们的评论反映了中国文学译介读本的真正消费者的意见。归纳总结这类读者的网络评论能更真实地反映出西方普通消费者对中国文学译介读本的接受特点(张璐,2019:81)。通过应用计算机情感分析(Sentiment Analysis)技术,可以突破人工分析的局限性,能够高效率的批量处理大量评论数据,并进行分析归纳,因此网络平台的用户评论拥有更高的研究价值(李涵昱 等,2017:51)。本研究选取近年来具有重大国际影响力的中国传统文学作家莫言的小说为例,对葛浩文翻译的11部莫言小说英译本在西方电商平台的所有购买评论进行情感分析,归纳出西方读者群体的代表性评论,进而评判莫言小说在西方国家普通读者群体中的接受态度与特点。
1 情感分析技术的原理
情感分析(Sentiment Analysis),又称意见挖掘(Opinion Mining),是指能够对文本观点、情感以及主观性进行计算分析的计算机信息技术。作为自然语言处理中的一条重要分支,情感分析可以在不同的文本层级上完成相应的自然语言处理任务(Pang et al., 2004:271)。应用情感分析技术,可以识别和理解他人的观点态度,使得人们能够积极应对网络信息资源带来的机遇与挑战(Pang et al., 2008:5)。根据文本的不同层级,文本情感分析可细分为针对词汇、句子以及篇章三个层面的情感信息识别与分类。由于本研究中的文本研究对象为用户评论,属于篇章层面,因此本文主要讨论篇章层面情感分析的方法及原理。总体而言,针对篇章的情感分析综合了词汇以及句子的情感分析模式,并且在输出结果的准确性上也大程度上依赖于词汇以及句子的情感分析结果信度,此外,篇章情感分析还需考虑到文本上下文语境,因此篇章情感分析在方法原理上更为复杂(杨立公 等,2013:1574-1575)。
目前,针对篇章的情感分析主要有两种方法,分别是基于情感词典的分析方法和基于统计机器学习的分析方法(李涵昱 等,2017:52)。两种方法各有优劣,针对不同属性的目标文本具有不同的适用性。其中基于情感词典的文本情感分析主要依赖预设的情感词典来计算目标文本的情感极性并进行情感分类。一般来说,情感词典由已标注情感值的情感词汇单元或词汇组合单元构成。在进行情感分析时,情感词典可以识别和提取目标文本中的情感词,并根据词典数据匹配相应的单个情感词的情感值,通过求和或加权平均等算法计算出目标文本总体的情感值,进而判断目标文本的情感倾向。可以直接使用现有的较为权威的情感词典,如General Inquirer lexicon,Sentiment lexicon等(杨立公 等,2013:1576)。也可以根据研究对象的特殊性构建专用的情感词典,以保证情感计算和分类的准确性。基于情感词典的文本情感分析方法可以快速准确地识别并计算词典收录词及相应的情感值,整体操作难度也相对较低。然而,其局限性在于不能准确地计算词典非收录词的情感值(杨立公 等,2013:1575)。
基于统计机器学习的文本情感分析方法主要依赖于使用机器学习模型,将已标注的文本作为训练集训练出文本情感分类器,并基于此分类器对新的目标文本进行情感分析。通常用于训练文本情感分类器的机器学习模型有K近邻算法、最大熵模型、支持向量机和朴素贝叶斯模型(李涵昱,2017:52)。其中,支持向量机与朴素贝叶斯模型在训练文本分类器时被多数相关研究证明具有较好的效果(杨立公 等,2013:1576)。基于统计机器学习的文本情感分析方法,可以对任意词语情感预测,但仍然不能准确有效的处理含有复杂情感的文本以及特殊领域的文本,重新训练适配的分类器需要收集大量数据,操作难度也相对较大。因此,针对特殊文本,根据此方法是一种相对较为简便,省时且准确的方法。
目前,情感分析主要被应用在产品评论分析,舆情分析以及信息预测三个方面(赵妍妍 等,2010:1843-1844),并已获得较好的研究成果。
近年来,中国文化“走出去”成为中国重要的国策和主要文化潮流。在中国文化“走出去”的过程中,中国当代文学的译介及评价是重要的工作之一。评价中国当代译介文学的传播质量,可以找出目前工作中的问题和不足,制定更加合适的中国文化对外传播策略。
本文收集了英国和美国亚马逊网站上11部莫言小说的葛浩文英译本的所有读者评论,基于情感分析技术,量化普通在线消费者群体对于莫言小说的情感取向,并以此作为参考,总结莫言小说在西方英语读者群体中的接受现状和特点。
2 研究设计与流程
2.1研究思路
本研究以葛浩文所翻译的11部莫言小说的英译本的亚马逊英语读者的书评作为研究对象,通过TextBlob的情感极性分析功能,将每一条书评所包含的情感态度量化,用定量分析法在宏观层面上说明莫言小说的英译本在英语读者群体中的总体接受程度。基于情感分类后的读者评论,可以筛选出读者的共同偏好和观点,进而反映出莫言小说在西方读者群体中的宏观接受特点。
2.2研究工具
本研究使用的辅助工具为TextBlob,它是由Steven Loria带领团队基于Python语言开发的第三方程序库,库中整合了Pattern与NLTK工具包,可以完成一些常见的自然语言处理(NLP)任务,如词性标注、文本分类、名词短语抽取、情感分析等。
2.3研究流程
1)获取原始分析文本并进行预处理。分别从美国亚马逊和英国亚马逊网站上收集《红高粱》《天堂蒜薹之歌》《酒国》《四十一炮》《丰乳肥臀》《生死疲劳》《檀香刑》《变》《蛙》《透明的红萝卜》《师傅越来越幽默》十一部葛浩文英译本的读者评论,以文档形式分别保存,截至2019年11月5日共收集评论536条。随后对文档中的评论文本进行人工检查,即替换或删除原评论文本中无法被Python识别的字符,修正原评论文本中存在的错误拼写以及重复输入。通过以上程序可以达到人工文本降噪的效果,使得最终数据分析结果更加准确可靠。
2)TextBlob情感分析。从Python中加载TextBlob程序库,并调用其情感分析功能。如前文所提到的,TextBlob整合了Pattern和NLTK工具包,因此它具有两种不同的情感分析器,分别为PatternAnalyzer和NaiveBayesAnalyzer。经过实际运用发现,针对本次研究的研究对象而言,读者评论篇幅长短不一,基于机器学习的NaiveBayesAnalyzer常常不能有效地分析长文本,对于篇幅较长的单条评论来说,容易得出完全积极或完全消极的情感值,进而以偏概全地影响最终结果。而基于情感词典的PatternAnalyzer则不会受到目标文本篇幅长短的影响,它通过将内置情感词典中被预先赋予情感值的词汇与目标文本中的词汇进行匹配,再根据加权平均的算法得出目标文本情感极性值,计算结果不会出现极端值,因此本研究选择使用PatternAnalyzer。通过PatternAnalyzer可以得出的情感极性值的范围在-1到1之间,1和-1为情感值的上限和下限,分别为绝对积极情感和绝对消极情感。当极性值处于0到1之间时,当前评论被视为正向/积极评论;当极性值处于-1到0之间时,当前评论被视为负向/消极评论;当极性值为0时,当前评论被视为中性评论。将经过情感分析的读者评论以积极/消极评论为单位,归纳出两类评论中普遍出现的观点,可总结莫言小说在西方读者群体中的总体印象。
3 研究结果与分析
3.1读者对莫言小说英译本的总体评价
通过对搜集到的536条读者评论进行情感极性分析后,经过统计可得出表1数据。
表1 各类型评论的数量,占比以及均值
在所有评论中,正向的积极情感评论共410条,占比76.50%;中性情感评论共25条,占比4.66%;负向的消极评论共101条,占比18.84%。其中,正向的积极情感评论的情感极性均值为0.25,负向的消极评论的情感极性均值为-0.19。从情感分析得出的数据可看出,莫言小说英译本在西方普通读者群体中的接受情况较好,多数读者对其作品持有积极评价。
根据分类后的读者评论,可归纳出西方读者针对莫言小说较为突出的正向和负向评价共同点,如表2所示,其中中性情感评论无实质内容和突出观点,此处忽略不计。
表2 西方读者评论中突出的正、负向观点
3.2读者对莫言小说英译本的正向评价
通过对所有情感极性值大于0的积极正面评价进行汇总归纳,,可以总结出读者对莫言小说的共同偏好(即在各部作品评论中均提及的积极评论),以及读者对莫言小说持有的普遍观点。通过归纳分析,可总结出以下几点。
3.2.1莫言的小说让西方读者了解近代中国的历史,社会,政治,文化等多元化信息
74%的正向读者评论反映了这一观点。从以20世纪初清政府时期为故事背景的《檀香刑》到以20世纪末新中国农村改革为故事背景的《四十一炮》,11部莫言小说反映了20世纪中国不同时期的社会现实,向西方读者提供了一个了解近代中国历史发展变迁的媒介。同时,莫言小说多以中国农村为故事舞台,更加突出了近代中国动荡变迁的历史对普通劳动人民的影响。因此,有读者将莫言的作品称为“极其绝妙的却又朴实接地气的中国近代史诗”(Guilford, 2012)。针对小说的历史背景,一些读者评论中提到,莫言是一位创作型作家,将历史事件和政治事件描写得淋漓尽致,让西方读者了解到了义和团运动、日本侵华等20世纪中国具有代表性的历史事件(Whipple, 2004),也让西方读者了解到了计划生育和改革开放等中国具有代表性的社会政策(Biblioteca, 2015)。因此也有读者认为,莫言通过小说介绍了不为西方人所知的中国农村日常生活(Thuringer, 2014)。从整体来看,莫言的小说很好的对外传播了近代中国的人文发展历程。
3.2.2莫言小说普遍具有幻觉现实主义色彩
21%的读者在正向评论中共同提到莫言小说普遍具有幻觉现实主义色彩。多数读者评论将莫言与拉丁美洲及其他地区的魔幻现实主义文学作者进行横向对比,如加西亚·马尔克斯、若泽·萨拉马戈、萨尔曼·鲁西迪、君特·格拉斯以及威廉·福克纳等。有读者称“莫言是中国的加西亚·马尔克斯”(Snaporaz, 2016)。有读者表示《生死疲劳》通过魔幻现实主义手法讲述一个村镇在半个多世纪中的人民生死,婚姻和人际关系的变迁容易使人联想到《百年孤独》中布恩迪亚家族七代人的百年传奇故事(Profane,2012)。而《丰乳肥臀》中对上官鲁氏和她八个女儿将近一个世纪的命运描写与《百年孤独》在叙事对象上也存在共同点(Clara,2013)。同时,也有读者提到萨尔曼·鲁西迪的《午夜的孩子》,将其与《生死疲劳》作对比,认为两部作品在描述社会历时变迁上具有相似性(Emilsson, 2014)。在《四十一炮》的评论中,有读者表示《四十一炮》是对君特·格拉斯《铁皮鼓》的致敬,两部作品均通过超现实的手法描绘了一个精神心理不愿成熟的主人公所感知到的成人世界(Eustathios,2014),以此揭露成人世界中复杂的矛盾冲突。由此可见,莫言独特的写作风格引起了多数西方读者对于魔幻现实主义的共鸣。总体而言,西方读者对于莫言小说的写作风格持欣赏接纳的态度。
3.2.3莫言和他的作品因2012年诺贝尔文学奖在西方获得了广泛的知名度和影响力
28%的读者都在正向评论中提到,他们是通过诺贝尔文学奖得知莫言,并以此为契机开始接触莫言的小说。诚如一些读者所说,在2012年诺贝尔文学奖颁发之前,并不知道莫言这位中国作家(Brunyate, 2012),此后才开始购买和阅读莫言的英译小说。在西方读者群体中,比起近现代中国大陆本土作家,外籍华裔作家历来受到的关注度和流行程度更高,如谭恩美、邝丽莎等,西方读者从书籍中了解到的“中国元素”大多来自这些作家的作品(cotlar, 2012)。毫无疑问,诺贝尔文学奖对于莫言小说对外传播的推进作用是巨大的,不仅使得莫言的小说加速进入了西方书籍市场,而且也让西方读者有机会了解到一位中国大陆作家带给他们的与以前不一样的阅读体验和原汁原味的中国故事。
3.3读者对莫言小说英译本的负向评价
相比于正面积极评论,负面消极评论数量较少,仅占不到两成。汇总所有情感极性值小于0的负向消积评论,可以发现读者对莫言小说普遍持有的批评观点有以下几点。
3.3.1小说中的人物名字难记
44%的负向评论中指出,小说中的人物名字难以记住,常常无法将出场人物与名字对应起来,因此造成了一定程度上的阅读困难。一位读者说,对于非中文母语的西方人来说,难以跟进每一个人物在曲折故事情节中的走向,阅读体验欠佳(Roth, 2013)。
3.3.2小说存在多处繁复的描述
11%的负向评论中指出,小说中有时对人物和场景存在过度描写,对某些事物存在重复描写,这使得故事稍微显得冗长。有读者在评论中表示,《红高粱》中有非常多对于“红高粱”的描写,即使已经明白了这一个意象所包含的象征意义,因此阅读时会有冗长和频繁重复的感觉(Stauffer,2013)。在《丰乳肥臀》中,对主角迷恋乳汁这一现象有不断重复的描写,使部分读者感到乏味(BlueDog,2013)。
3.3.3小说中太过残酷的故事情节
40%的负向评论中指出,小说中一些场景和情节充满了荒蛮和暴力,其中对人性太过现实的刻画令读者感到压抑,甚至难以接受。部分读者在评论中称,《四十一炮》中刻画出的贫穷,贪婪和腐败令人难以继续阅读下去(Woodside, 2013)。《丰乳肥臀》中的一些描写性词语令读者感到不快(Margo, 2014),甚至部分读者认为这样的词语选择有损女性的形象,是对女性的诋毁(Kline ,2014)。《红高粱》中一个接一个的血淋淋的画面难以让人感到放松,即使这样的描写确实帮助读者体会到了当时中国受到日本侵略时人民的苦痛(pripollg ,2012)。
4 结语
本研究表明,经过情感分析后的西方电商平台读者评论显示,莫言的11部英译作品在西方普通英语读者群体中的接受情况较好,约八成读者对其持积极的接受态度。原因在于,一方面,莫言小说内容多数以中国近代历史为基础,介绍了不少西方读者相对较为陌生的中国近代大事件,因此激发了西方读者的阅读兴趣。另一方面,莫言小说的写作风格类似于西方读者所熟知的魔幻现实主义风格,给西方读者带来了一种熟悉却又新颖的阅读体验。经过情感分析后的西方电商平台读者评论还表明,约二成读者对其持消极的接受态度。原因在于,莫言小说中包含的民族性或地域性的文化成为西方读者的阅读障碍之一,具体表现在难记的人名、繁复的人物和场景描述风格、太过残酷的故事情节等。本研究也表明,情感分析技术可以为中国文学作品的译作在西方受众接受效果分析研究提供可靠的客观量化标准。因此,将计算机自然语言处理技术应用到译介文学书籍西方受众接受效果分析的研究中是具有一定的可行性,尤其为中国知名乡土作家(如贾平凹、阿来)作品的对外译介提供借鉴。