草原文化特色词汇的汉英平行语料库的构建、应用及意义
2018-02-13内蒙古大学
内蒙古大学 林 杨
一、引言
在语言学中,语料库(corpus)指大量文本的集合,库中的文本称为语料,通常经过整理,具有既定的格式与标记,特指计算机存储的数字化语料库。语料库是一个多角度、多层次和多领域的研究工具,因此对其分类也显得错综复杂,没有统一的划分。一般来说,研究目的与研究方法是决定语料库类型的根本因素。(王克非 2004: 6-9)。平行语料库(parallel corpora)亦称为对应语料库或双语语料库,是由原文本及其平行对应的译语文本构成的双语语料库,其双语对应程度可有词级、句级和段级几种。平行语料库在翻译中起着十分重要的作用,可以有效地辅助翻译者进行词汇查询,提供地道的译文表达。Teubert (2005: 1)在“语料库语言学之我见”一文中认为,“语料库研究已成为几乎所有语言研究的重要元素”。
词汇的翻译在具体翻译实践中起着很大的作用,因此研究常用词汇的对应翻译显得尤为重要。目前,国际国内不少的平行语料库解决了诸多翻译方面的问题,比如英法双语词汇和句型翻译,对汉语中高频动词的翻译研究等。本文通过利用汉英平行语料库研究内蒙古地区的特色词汇的翻译,旨在为今后翻译相关领域提供真实、可靠的译文,同时也表明汉英平行语料库在翻译中有着较大的使用价值和潜在的开发前景。
内蒙古是一个极具民族特色及异域文化的地区。内蒙古作为“一带一路”上一亮丽的风景线,将“草原丝绸之路”置于重要的战略位置。该区域历史上各民族文化不断交融与发展。帮助内蒙古的草原文化更好地走向世界,做好少数民族文化的传承,是新时代提出的要求。为此,重视翻译少数民族文化成为新的研究方向,做好这项工作才能更好地保护、发扬各民族文化传统。可是,笔者进行草原文化翻译实践时发现,草原文化翻译存在诸如一词多译、音译不统一等诸多问题。比如“马头琴”的译法有以下几种:译法一:matouqin;译法二:morin huur;译法三:horse-head fiddle;译法四:horse-head stringed instrument;译法五:Mongolian bowed stringed musical instrument;译法六:the morin huur or horse-head fiddle, the most traditional Mongolian instrument, with two strings made from horse hair and a carved horse head(“马头琴”的蒙语读音为“木仁胡尔”,是一种蒙古族常用的弓弦乐器,因通常在琴首雕有马头造型而得名)。
究其原因,主要是由于草原文化多样,人们没有总结出规范的译文做参照,也没有权威部门或人员进行相关统筹工作。翻译不仅仅是语言层面上的转换,更是对原作文化层面上的阐释。像“马头琴”这样的文化特色词语具有鲜明的民族文化特点,如果在翻译过程中处理不好,就会导致不同文化背景的读者难以准确地理解,造成文化错位或文化误导,从而影响不同文化间的交流与传播。陈亚杰、王新(2011: 80)认为,“从目的论来看,翻译少数民族特色词汇时,译者应博采众长,必要时采用中和策略,即音译、直译、意译、释译、移译或几种译法并举。这样才能做到既实现跨文化交际、传递民族文化信息,又保护民族传统文化的目的。”译法六音译后面的释义部分补充了所丢失的指示意义。本文详细叙述草原文化特色词汇汉英平行语料库构建及其应用,通过建立这样一个总结性的词汇库,集合草原文化特色词汇的译例,为以后的翻译和研究提供一定借鉴,以提高该领域相关内容的翻译质量。
二、草原文化特色词汇汉英平行语料库的建立构想
“一带一路”战略的提出和实施,显著提升了我国对外开放的高度,也将为少数民族地区发展注入全新活力。历史上,“丝绸之路”主要有四条路线,其中之一就是“草原丝绸之路”,贯通内蒙古自治区和外蒙古高原草原地带,经西伯利亚、中亚北部抵达欧洲。自2015年起,内蒙古自治区牢牢把握国家实施“一带一路”战略带来的机遇,积极协调,大力推进内蒙古自治区草原“丝绸之路”经济带建设。
内蒙古自治区地域辽阔,在漫长的地质历史演化过程中,形成了高山、草地、平原、盆地、沙漠戈壁等复杂的自然风貌。这些复杂的自然环境,同时也造就了内蒙古地区多元化的人文环境风貌。从旧石器时代的“大窑人”,到新石器时代的“红山人”,再到青铜器时代的“夏家店人”,一直到后来的北狄、匈奴、鲜卑、突厥、回鹘、契丹、女真、蒙古等民族,这些草原民族经过世代繁衍生息,交往融合,形成了厚重的历史文化积淀,造就了博大精深的草原文化遗产。草原文化是指世代生息在内蒙古地区的先民、部落、民族共同创造的一种与草原生态环境相适应的文化,这种文化包括草原人们的生产方式、生活方式以及与之相适应的风俗习惯、社会制度、思想观念、宗教信仰、文学艺术等,其中价值体系是其核心内容。如何做好草原文化的英译工作是一项任重而道远的事业。如何把极富民族特色的外宣资料翻译成地道的英语,准确传递文化内涵,实现与源语等同的交际功能是译者在进行翻译时首要考虑的问题。草原文化英译语料库的构建可以在理论指导下,为从事内蒙古民族文化英译的专业人员提供更为准确的少数民族文化负载词的英文表达,更好地向世界展现内蒙古草原文化,增加目标语受众对文化背景的理解,从而达到弘扬内蒙古民俗文化的目的。
国家对“中国文化走出去”非常重视,国家哲学社会科学规划办公室于2010年设立“国家社会科学基金中华学术外译项目”,而最负盛名的项目无疑要数 《大中华文库》,这是我国首次全面系统地对外译介中国文化典籍的重大出版工程。内蒙古历史文化的英译研究也应在这种大环境中蓬勃发展。从语料库翻译学的角度来探讨内蒙古文化的翻译可谓是一种新的翻译研究方法。计算机的发展,为建立语料库提供了可能性;语料库翻译学的发展日趋成熟,已经被运用到许多方面。目前,在翻译领域,我国学术界正在或已经构建了会议口译、党政文献、地方法律文本、中华典籍、广西壮族文化等英译语料库;但是,目前国内在内蒙古文化英译语料库的建立方面是一个空缺,无法对内蒙古文化的英译起到规范作用,因此十分有必要建立草原文化特色词汇英译语料库。
草原文化是中华文化的重要组成部分,随着世界间文化交流的日益密切,“草原丝绸之路”上的草原文化英译也成为国内外学者高度重视的一个领域,因为它有利于内蒙古文化走向世界,扩大国际交流。基于语料库翻译学的草原文化汉英平行语料库的构建,有助于提高译者的翻译效率和译文的质量。
Baker(1995)把双语语料库分为3类:首先是平行语料库,即通过将源语文本同目的语文本对应后建成的文本库,对应层级包括词汇级别、句子级别和段落级别,因此也称对应语料库;第二类是多语语料库(multilingual corpus),虽然称之为多语语料库,其实包括两个或多个单语种的源文本语料库;第三类为可比语料库(comparable corpus),既包括源文本,也包括从其他语言译为此种语言的文本。与另外两种双语语料库相比,同翻译实践、尤其是计算机辅助翻译与教学联系最为紧密的当属平行(对应)语料库。这种语料库中含有大量真实的翻译句子对,为翻译实践﹑翻译教学﹑翻译语言研究和语言对比研究打下坚实基础。同时,平行语料库本身也是计算机辅助翻译记忆库与术语库的存在形式与载体。Teubert & Cermakova (2004: 124)认为,平行语料库是“翻译者的宝库”。从平行语料库中可提取大量的翻译等值单位,由于这些翻译等值单位出现在具体的语境中,文化翻译难点问题可最大限度地得到解决。
语料库翻译学对翻译研究的理论和方法提供了一种新思维、新策略。其从语言学的普遍性这一角度出发,又不局限于此。在未来的发展方向中,它将纳入更多的领域,可推进学科间的相互交叉性的发展。这一新的研究模式必定对翻译理论和翻译实践研究起到积极的推动作用。这一语料库的建立同时得到“文化翻译观”的指导,此概念的提出者是英国社会人类学家埃德蒙·里奇(Edmund Leach)认为:文化翻译是在文化研究的大语境下进行的,即研究各民族间的文化及语言的表层与深层结构的共性和个性,探讨文化与翻译的内在联系和规律(转引自刘禾 2002: 1-4)。文化翻译既关注历史、社会风俗、习惯,又注重语言间的差异。因此,本语料库的构建着眼于文化差异,实现译语文化和源语文化的功能等值。草原文化英译语料库的构建可以在理论指导下,更好地为从事内蒙古民族文化英译工作的专业人员提供更为准确的少数民族文化负载词的英文表达,更好地向世界展现内蒙古的草原文化,增进人们对民俗背后文化的理解。
三、草原文化特色词汇汉英平行语料库的研究设计
语料库创建大体上分为四个步骤,即建库规划、语料采集、语料加工处理以及语料检索。词汇库是一种特殊的语料库,根据语料库建库的普遍性,我们根据自身项目特点做了创造性工作。现就词汇语料加工及语料检索介绍如下。
(一)建库规划
第一阶段为整理、分类语料,语料电子化,建立“库一”,即内蒙古少数民族地名人名的翻译;“库二”,即草原文明中的考古类词汇,以“红山诸文化”为代表;“库三”,即延续数千年的游牧文明的东胡、匈奴、突厥三大系统的历史类词汇;“库四”,即著名历史旅游景点介绍表达;“库五”,即历史与文化书籍的英译。第二阶段是语料标注,第一步进行词性赋码 (POS Tagging),第二步进行深层次标注。
建库之前必须进行系统规划,才能使语料库能发挥应有作用。语料库建库要考虑文本选取、文本录入及处理等多方面问题。本次建库以方便翻译实践与教学为目的,选取不同语类的多本书籍进行筛选录入,以达到可检索与分析的效果。在了解和熟悉语料库建立原则和建立方法的基础上,根据实际情况做出规划。在完成建库规划以后,就进入了语料库构建阶段,主要包括以下几个部分:语料采集与对齐、语料标注、分词和赋码、语料检索。
(二)语料采集及对齐
语料库根据收录语料内容及属性不同,可分为同质型语料库(homogeneous corpus)、异质型语料库(heterogeneous corpus)、专用型语料库(specialized corpus)和系统型语料库(systematic corpus)。因此,该语料库为同质、专用型语料库,仅采集涉及到草原文化特色词汇的中英文原生性文本,以目的性取样为原则。
为保证语料的翻译质量、代表性和平衡性,应首选正规出版的书籍,其次是网络资源。语料主要采自以下书籍:
1)《草原文化的生态魂》。在这本书中,作者笔下的草原文化浸透着草原人民美的神韵与美的理想,是一本充盈着浓浓情感阐释草原生态文化精神的书。外文出版社出版了英文版EcologyofCulture:TheSoulofChina’sGrasslands。
2) 《草原天道:永恒与现代》。该书以记述见闻和丰富的史料相结合的方式,全景式勾勒出草原上的人类在狩猎、游牧和现代等不同阶段的生产生活图景。外文出版社出版了英文版TheWayofPrairies:GrasslandsandHumanCivilization。
3)姜戎的小说《狼图腾》。它讲述了1960年代和1970年代北京知青在内蒙古草原的插队生活,细致描写了草原生活和自然生态,回顾了中国历史并做出评价,赞扬和推崇了游牧民族文化。迄今,《狼图腾》已被译为30多种语言发行,其中美国汉学家和翻译家葛浩文的英译本WolfTotem,于2008年由英国企鹅出版社发行,并荣获2007年“曼氏亚洲文学奖”。作为描写内蒙古草原生态以及游牧文化的小说,加上译者的成功翻译,《狼图腾》顺利进入西方读者的视野,其中对草原文化词汇的成功处理,值得借鉴。
4)《蒙古秘史》。《蒙古秘史》 (Mongqol-unniucatobcaan) 是蒙古史官记载成吉思汗黄金家族出身和家谱的古书。它是以黄金家族的兴衰过程为中心,记述蒙古族从神话传说起源到13世纪历史演进的“敕修”官方史书,同时也是一部具有丰富文化内涵和永久价值的文学经典。《蒙古秘史》是蒙古族最早的一部史籍,记述了蒙古民族500多年形成、发展、壮大历史的典籍,它也是蒙古族文学史上第一部由文人创作的书面文字经典作品,涉及13世纪中叶前蒙古族政治、经济、军事、思想、文化、语言等多方面的珍贵材料,是一部反映古代蒙古民族生活的百科全书。本语料库选定具有代表性的乌尔贡格·奥侬(Urgunge Onon)英译本进行研究,拟归纳整理其具有民族文化特色的翻译。1990 年,奥侬编译了《成吉思汗的历史和生活(蒙古秘史)》 (TheHistoryandLifeofChinggisKhan:TheSecretHistoryoftheMongols)一书,由Leidon 出版社出版。该译本在经过修订后题名为《蒙古秘史:成吉思汗的生活和时代》(TheSecretHistoryoftheMongols:TheLifeandTimesofChinggisKhan),于2001 年改由Curzon 出版社出版。
5) 《内蒙古:马背上的民族》。作为一部有深度、有特色的重点展现中国全景风貌的丛书之一内蒙古卷,该书全面展现了内蒙古旖旎的风光、丰富的物产和悠久的历史,英文版(InnerMongolia:TheHorsebackPeople)由外文出版社出版。
6)《微观内蒙古(汉英版)》 (InnerMongolia:ColorfulandMagnificent)。该书是2017年商务印书馆出版的一部内蒙古自治区成立70周年献礼图书,作者是莫久愚。该书共有10章,400余条“微博”,用微视角呈现出多维、多彩、厚重、广袤的内蒙古。
7)《黄金史纲》。该书是我国蒙古族编年史中最杰出的文献之一,在蒙古史学和历史编纂学上占有重要地位。这是一本文化标志性很强的蒙古族典籍,反映了当时蒙古社会的文化风貌。本语料库选取查尔斯·鲍登(C. R. Bawden)的英译本TheMongolChronicleAltanTobei(1955年版),以反映其在翻译历史文化术语时采取的翻译策略。
8)《鞑靼千年史》(AThousandYearsoftheTartars)。它是英国汉学家巴克尔(E. H. Parker)于1895年出版的著作,在西方较有影响。鞑靼是中国古代北方多个少数民族的泛称。该书主要叙述了自汉代至成吉思汗出现前1000年间,中国北部的匈奴、鲜卑、蠕蠕、突厥、西突厥、回纥、契丹等少数民族国家的历史,重点阐述鞑靼地方的历史。该书汉译本由商务印书馆1936年出版,向达、黄静渊译。本语料库选取其中的卷一“匈奴”部分。
9) 《中亚古国史》。该书原为英文版,书名TheEarlyEmpiresofCentralAsia,作者W. M. 麦高文(William Montgomery McGovern),中译本由中华书局于2004年出版,译者是章巽。主要讲述了中亚古国的政治、经济、文化、社会等各方面的历史。本语料库收录其中的第二卷“匈奴帝国之兴亡”,叙述西汉时期匈奴人的历史。
本次采集方式有别于一般过程,我们将以上书籍内容全部电子化(除《狼图腾》外),人工梳理与草原文化相关的特色词汇,将汉英对照词汇按条目放入Excel表格中,然后在Excel表格的基础上,生成文本文件。经过实验研究,文本编码使用UTF-8比较容易为检索软件识别。在文本手工录入的过程中,实际上已经对语料进行了除噪,基本解决了生语料普遍存在的诸如遗漏、空格或多余空格、多余段落标记符、乱码等问题。因此,得到的文本为清洁文本。
由于汉英语料是按对应释义分组录入,这个过程实际上已经完成了汉英语料的对齐。对齐后的文本包含汉英对照内容,一行内容为一组汉英对照。语料对齐后为了将语料库应用于实践中,需要转化为标准的文本文档。另外,还需要按照一定规则对语料进行标注、分词和赋码,使语料库具备检索和分析功能。如图1所示,提取特色词汇查干诺尔龙,即N.qaganesis。
图1
(三)语料标注、分词和赋码
语料的加工是语料库系统构建中的一个重要环节,而语料的标注会大大提高内蒙古文化翻译研究与教学的深度与广度。经过阅读和查证多方面资料,发现大部分语料库标注都是采用XML语言模式,标注一些基本信息,主要进行的是元信息标注。考虑到本次建库主要是提供双语译例,语料基本信息对翻译作用有限,故暂时省略元信息标注。语料标注对语料库建成后的检索影响重大,所以语料标注的原则、模式与类型是本语料库的研究制作重点。比如在“引言”中提及的关于“马头琴”的翻译,在语料数据收集中,有以下的翻译方法。译法一采用汉语拼音,如果不加注释,对于英语读者在不太了解内蒙古文化的情况下,没有起到传播文化的作用。译法二采用的是音译法,是指原字形单位被目的语字形单位替代的过程(Shuttleworth & Moira 2005: 189)。音译法适用于翻译那些具有独特文化内涵和民族特色的人名、地名、术语等目标语文化空缺词语。 但仅用音译表达蒙古语文化词汇,难以让英语读者深刻领悟独具草原文化特色的民族音乐形式。译法三和四只是传递了一个简单的乐器信息,英语读者无法领略到蒙古族文化的内涵信息。译法五使得目标语读者能够比较准确地接受马头琴作为民族乐器,但无法体会到蒙古语的读音。译法六则是采用中和或综合策略。基于每一个词条对应的英语翻译将按照语料背景信息、语料来源、翻译方法或策略及其相关翻译理论进行分类处理。例如,在整理查尔斯·鲍登英译《黄金史纲》中的历史文化术语中,根据艾克西拉关于文化专有项翻译理论,通过分析这些历史文化术语的处理,进一步探讨了影响鲍登翻译策略选择的相关因素。
在语料标注这一部分,分词指的是将一连串的字符转化为相互分离的可识别形符。由于采集来的文本内部存在很大的不一致性,如果不进行分词处理,一来会容易导致检索困难,二来可能会使语料库的频次统计出现误差,还可能影响语料库的后期加工。如果需要分析词的语法特征,或者需要检索特定的语法结构,就需要进行词性赋码,这是根据上下文信息来自动标注文本所有词的词性的过程。根据语料库的具体特征,选用中国传媒大学国家语言资源监测与研究有声媒体中心开发的传媒语言语料库在线分词标注系统。此系统能够对汉语进行细致标注,可以选择切分粒度、词性输出和标记集(中国传媒大学或北京大学)。经过分词和词性赋码的文本,可以满足多方面的检索需求。
(四)语料检索
语料检索是根据一定规则,利用关键词进行查询,以便找到合适的对应词和例证。语料库检索软件使用的是AntConc,设置一定检索条件,能满足多方面的检索需求。为了更加方便利用语料库,我们根据检索需要建立了专业术语词典查询模式。采用桌面电子词典的运行模式,在成型的词汇库中,输入任意专业词汇,如果该词在库中存在,则返回对应英汉/汉英释义。词汇库检索及加工运用相关软件为:ExcelToTxt(for MDX)——生成生文本,MdxBuilder——建立MDX文件,MDict——生成词典查询。
本语料库的构建主要以建立词汇库为目的,词汇库加工目标是建立专业术语词典查询模式。
步骤(以“蒙古秘史双语词汇表-2016.10.31-汇总”为例):
首先运行ExcelToTxt(for MDX),见图2:
图2
选择要转换的Excel文件,自动填充工作簿中要填充的工作表(只有一个工作表的情况下),见图3:
图3
开始转换,生成标记过的文本,见图4:
图4
接下来对文本进行整理,删除冗余、重复及乱码部分,形成规范标记文本。
根据得到的标记文件,利用MDXBuilder制作MDX文件,见图5:
图5
打开MDict.exe,添加刚生成的文本文档,见图6:
图6
点击Done完成,形成如下查询列表,见下页图7:
图7
进行试查询“成吉思汗”,可得到以下结果,见图8:
图8
这样,可查询检索的草原文化词汇库建立完成。此次建库不免存在诸如词汇量、文本加工检索等方面的问题,今后我们会不断完善,提高词汇库的可用性和查询效率,改进查询效果。
四、结语
一门科学学科的创立和发展需要一个描写的基础,而在草原文化的英译研究中,目前尚缺乏系统的以语料库为基础的成果。通过建立草原文化特色词汇汉英平行语料库,对源语和目标语进行量化分析,可以帮助译者瞬间获取丰富的译文信息,这些是传统教科书所不能给予的。译者在翻译过程中如果遇到一些翻译难题,可以参照双语语料库中的译法,从中挑选出最合适的翻译。语料库翻译学对翻译研究的理论和方法提供了一种新思维、新策略。其从语言学的普遍性这一角度出发,又不局限于此。在未来的发展方向中,它将纳入更多的领域,推进学科间的交叉性发展。这一新的研究模式必定对翻译理论和翻译实践研究起到积极的推动作用。
草原文化英译语料库的构建可以更好地为从事内蒙古民族文化英译工作的人们提供蒙古族民俗与文化负载词的英文表达,更好地向世界展现和介绍内蒙古的草原文化。