基于类比语料库的江西省景点解说牌英译文本的语言分析
2021-11-18熊婧
熊 婧
(南昌工程学院 外国语学院,江西 南昌 330099)
随着“一带一路”战略的推进,相关国家和旅游城市之间的互动交流变得日益频繁,推动了中国与世界各地旅游业的深度融合和共同发展。旅游是发掘、弘扬、优化、保护和丰富文化的有效途径,因此旅游文本在旅游业中也起着越来越重要的桥梁作用[1]。为了吸引国外游客,我国众多的旅游网站或景点解说牌均提供英译版本,而这些英译版本是否地道,和旅游英语原生文本有何差距,是我们值得思考的问题,同时也是在提高我国旅游业的国际地位过程中亟需解决的问题。
语料库是指经过大规模的科学取样和加工收集起来的电子文本库,经过计算机辅助工具,可以用来进行语言理论和应用研究。语料库方法是一种实证研究方法,其特征主要表现为以大量自然文本的观察和分析为基础,数据分析和定性研究相结合[2]。上世纪末,语料库方法开始运用到翻译研究中来,翻译研究者可以利用大量的客观真实语料,研究结论更加确凿可信,拓宽了描述性翻译研究的领域和视野。1993年,英国学者Mona Baker[3]曾提到:利用大型的原文加译文的语料库,加上语料库研究方法的探讨,将使翻译研究者得以揭示翻译文本作为沟通媒介的本质。
目前国内外创建的旅游专门语料库并不多见。2005年,芬兰约恩苏大学的萨翁林纳翻译研究学院研制了英语旅游文本语料库,约67万词。2006年,日本Kiyomi 等人研制了“京都旅游语料库”,约4万词。国内比较有名的旅游专门语料库有青岛科技大学康宁及其团队研制的约188万词的英语旅游文本类比语料库,香港理工大学李德超等人研制的约200万词的新型双语旅游语料库。然而这些语料库均不对外开放,无法满足我们进行旅游英语翻译研究的需要。同时,由于以往基于语料库的旅游英语翻译研究主要基于网站资料和宣传册等,较少涉及景点解说牌示语的翻译研究,而景点解说牌示直接影响游客的游玩体验和中国文化的对外传播。有鉴于此,本人将基于自建的江西省旅游景点牌示解说的类比语料库,对景点牌示英译语言特征进行描述。
一、语料描述及研究工具
自建语料库中的所有语料取自2018—2020年江西省内各大旅游景点的中英文解说牌示,均为完整篇章样本,在经过一系列校对去噪后,得到清洁文本并全部收录为UTF-8编码TXT格式,并在此基础上创建了 “江西省旅游景点英译牌示语料库” ——CTETIPJ(Corpus of Translated English Tourism Interpretive Panels in Jiangxi),库容为21554词。为了考察其与英文源语旅游文本语言特征的区别,收集了国外英语源语旅游景点牌示,建立了参照语料库,即“国外旅游景点英文源语牌示语料库”——CETIPA(Corpus of English Tourism Interpretive Panels Abroad),库容为20173词。两个语料库虽然都属于自建小型语料库,但是都涵盖了自然景观和人文景观,且取样框架基本一致,因此对比结果更科学有效。
在创建语料库之前需要对文本进行基本处理,先利用Editplus工具进行去噪,去除多余的空格、空行、回车等。在建好语料库后,需要从语料库中提取信息进行分析,这一过程称为检索。本研究用到的索引工具包括Wordsmith5.0和Antconc,不仅能检索到具体的节点词,还能对节点词进行带有语境的检索(KWIC),从而提取节点词在一定跨距(span)内与之共现的所有词,并以清单形式列出。同时不可避免要用到正则表达式,正则表达式能使准确的句段长度检索和严格的句段内部结构检索成为可能,有助于提高检索的准确性和效率,进而提高语言研究的质量[4]。
二、语料对比分析
1.类符/形符比与平均词长/句长(TTR与MWL/MSL)
形符(Token)是指文中出现的所有词,类符(Type)是指不重复计算的形符数[5]。因此类符/形符比TTR(type/token ratio)一般用来分析词汇丰富程度,一般值越大,说明该文本词汇越丰富。而当各语料库的容量不一时,只有将该比率进行标准化处理后——即对每一千词的类符/形符比进行计算——得出的平均值,即标准类符/形符比(STTR),才具有参考价值[6]。
平均词长(Mean Word Length)是指语料库中每个单词所包含的音节数/字母数。平均句长(Mean Sentence Length)指的是语料库中每个句子所包含的单词数。一般而言,文本难度除与词长关系密切外,与句长也有密切的关系[7]。平均词长或句长越短,文本越浅显易读,平均词长或句长越长,文本的阅读难度相对较大。
利用Wordsmith5.0工具的Wordlist功能进行分析后,结果如表1,表2。
表1 CTETIPJ与CETIPA类符/ 形符比
如表1所示,CTETIPJ的类符/形符比低于CETIPA的类符/形符比,前者为9.49,后者为11.06。鉴于这两个语料库库容大小有区别,所以为了更科学的对比,需要进一步对比标准类符/形符比,即对每一千词的类符/形符比进行比较。通过对比,依然发现CTETIPJ的STTR(40.32)低于CETIPA的STTR(43.45)。由此可以看出,江西省旅游景点英译解说牌示的用词变化相对较低,丰富程度不如国外旅游景点英文源语牌示。
表2 CTETIPJ与CETIPA平均词长和句长比
如表2所示,CTETIPJ的平均词长为4.76,略低于CETIPA的平均词长(4.85),这说明江西省旅游景点英译解说牌的用词难度和正式性略低于国外旅游景点的英文源语解说牌。
这些差异与江西省景区聘请的翻译人员的词汇掌握量有关,本土译者用的较多的是简单词汇,在词汇量和词汇运用能力方面不如英语母语者。在今后的景点解说牌翻译中,译者应该丰富自身的词汇量并运用到翻译当中去。
除此之外,表2还统计了两个语料库的平均句长,出乎意外的是CTETIPJ的平均句长(18.65)高于CETIPA(15.32),上文中提到CTETIPJ的形符/类符比和平均词长都不及 CETIPA,把译者与英语母语者的语言运用能力差距考虑在内,照理说江西省旅游景点解说牌示的英译文本中的句子应该大部分是简单句,句子较短,复杂程度不及国外旅游景点英文源语牌示,可是结果却相反。要厘清其中的缘由并不难,通过分析我们发现受母语语法负迁移的影响,英译文本中使用了大量的流水句,句子冗长,最终可能会导致词不达意,而且犯诸多语法错误。如:
例1.96~65百万年,庐山地壳处于强烈伸展拉张状态,产生了一条巨大的低角度主拆离断层,将古鄱阳湖底下15~21千米处的深变质岩撕拉到地表,形成了变质核杂岩构造及古鄱阳湖盆地。(原文)
96~65 millions years ago,Lushan region was in the intensive extension state,brought about a huge low angle main detachment fault and caused the deep metamorphic rock underlying in the depth of 15~20 kilometers of the ancient Poyang Lake pull to the surface,so the metamorphic core complex structure and ancient Poyang Lake basin were formed.(译文)
本牌示原文内容主要向游客讲解庐山地貌形成的由来,谓语较多,译文受中文母语影响,并没有进行断句,反而用拖沓冗长的一段话来表述,整句话长达58个词,其中还犯了个别语法错误,给游客造成了较大的阅读负担。
2.名物化特征
名物化可界定为用名词来体现本来要用动词或形容词所体现的“过程”或“特征”[8]。王立非、刘英杰[9]提出将名物化分为词汇名物化和句法名物化两种,词汇名物化包括动词名物化、形容词名物化。基于以上定义,本文主要探讨CTETIPJ和CETIPA在词汇名物化方面的运用,利用Antconc3.5.8工具检索-ment/-ion/-ness/-ity/结尾的代表“过程”或“特征”的名物化词汇,并人工排除干扰项,比如moment、billion、business、city等,因为这些名词并不是从动词或形容词转化而来的。通过检索分析如下如表3。
表3 CTETIPJ与CETIPA名物化特征
如表3所示,江西省景点英译解说牌名物化使用频数高于国外英语源语解说牌。名物化结构可以压缩信息,简化语言结构,也提高了英语表达的客观程度,不需要点名动作的执行者,但是另一方面,会导致所叙述的过程过于客观,仿佛在叙述与读者无关的事件,在感染性与调动读者积极性方面的功能还是大打折扣。根据Reiss[10]的文本分类,文本可以分为信息功能文本、表情功能文本和操作功能文本。旅游文本属于第三种类型,强调的是文本的感染性以达到“引发听者某种行动”的作用。
例2.Pleasure seekers and adventure addicts will discover an impressive palette of activities in this unique natural setting.(原生文本)
例3.The discovery of the scenic beauty of Poyang Lake has added charm to the picturesque landscape.(翻译文本)
原生文本取自于夏威夷岛的景点牌示解说,翻译文本取自于鄱阳湖生态保护区的景点牌示解说。从对比分析可以看出,例2原生文本中将动词主动式“discover”作为谓语动词,能较好地将读者带入到当前语境中来,增强互动。例3翻译文本中使用名物化词汇“discovery”作为主语,从而可以不点明动作的执行者,句子显得简洁客观,但是在感染读者方面功能不如原生文本。
3.时态特征
英语中的时态比较多样化,为了揭示江西省旅游景点英译牌示和国外英文源语牌示的时态特征,利用正则表达式检索出各种时态的使用频数,主要包括一般现在时、一般过去式、一般将来时、完成时和进行时。通过检索发现结果见表4。
表4 CTETIPJ与CETIPA时态特征
一般来说,英语旅游文本中一般现在时最为常见,主要用于介绍旅游景点和目前的状态,其次是一般过去时,主要用于介绍旅游景点的历史由来。将来时一般用于介绍景点将来的规划和发展,而旅游景点牌示内容一般都是陈述景点的景色和历史,极少涉及将来的规划,所以将来时应用较少。值得注意的是,CTETIPJ中完成时的使用频次是CETIPA的两倍之多,这里的完成时主要是指现在完成时,这说明在江西省旅游英译牌示中较关注过去发生的事件对现在产生的影响。如:
例4.井冈山地处湘赣两省交界的罗霄山脉中段,被誉为“中国革命的摇篮”。(原文)
Jinggangshan is located in the middle of Luoxiao Mounain Range on the border of Hunan Province and Jiangxi Province.It has been praised as “the cradle of Chinese revolution”.(译文)
该例中“被誉为”的时态翻译成现在完成时,是为了突出井冈山在红色文化中的历史地位一直都很高,影响持续深远。
4.语态特征
英语的语态是通过动词形式的变化表现出来的,是英语中的典型结构[11]。本研究对江西省旅游景点英译牌示和国外旅游景点英文源语牌示的语态特征的分析主要从被动语态频数及频率(每千词)两个方面来考察,我们在Antconc3.5.8中用正则表达式搜索含有be/get及其不同形态的所有句式。结果见表5。
表5 CTETIPJ与CETIPA被动语态
如表5所示,江西省旅游景点英译解说牌中的被动语态频数高于英语源语解说牌中的被动语态。通过考察,我们发现江西景点中文解说牌在汉译英时很多主动句译成了被动句。究其原因,主要是由于汉语语法呈隐形特征,所以汉语中的语句常常省去主语或者将主语隐含在句子之中[12],因此在翻译成英语的时候,常常需要补充主语或者将汉语中的宾语转化成英语中的主语,这时就使用到了英语中的被动语态。除此之外,汉语是话题—说明型的句式结构,英语是主语—谓语型的句式结构[13]。英语中的主语能统领全句且只能是名词或名词性结构,然而汉语中的主语概念很宽泛,这些主语实际上代表的是话题,汉语以话题为中心,放在句首。因此在汉英翻译中,我们必须用主谓结构来变形句子结构,很多主动结构被译成被动语态。例如:
例5.“庐山第一奇观”——三叠泉可谓是“四季佳景各千秋”。(原文)
The Three Step Waterfall is known as “No.1 wonder of Lushan Mountain” and you will be stunned by its different enchanting scenery all through the year.(译文)
例6.Also known as the Hudson River Bridge and the Columbus Bridge,the George Washington Bridge which connects Fort Lee to Manhattan came into use in 1931 after a construction period of almost 4 years.It is a two level suspension bridge that cost about $52 million to build.(原生文本)
例5原文的主动句翻译成了两个被动句,读起来略微拖沓,而且变化了主语,影响句子的流畅性。例6是乔治华盛顿大桥的简介,所有句子均为主动句,信息较为丰富且表达更为干脆直接。
三、结语
本研究以江西省景点英译解说牌为研究对象,参照国外英文源语解说牌,从类符/形符比、平均词长/句长、名物化特征、时态特征和语态特征分析探讨两者的差异,最后发现英译解说牌文本的类符/形符比较之于英文源语更低,平均词长更短,这说明英译解说牌的词汇难度和变化程度更低,这是由译者的词汇储备量和运用能力不及英语母语者导致。在句长方面,由于受母语负迁移影响,有些英译句子显得冗长拖沓。在名物化方面,英译文本的名物化使用频率更高,一方面使得文本更为客观,但另一方面在感染性和号召力方面不及英文源语文本。至于时态,最大的区别在于英译解说牌更频繁地使用现在完成时,更为关注过去事件对现在的持续性影响。从语态来看,英译文本更为频繁地使用被动语态,究其个中缘由,跟英汉语言的“隐性”和“显性”的语法差异是分不开的。研究结果表明江西省旅游景点的英译解说牌在某些方面还是有欠规范,在今后的景点解说牌的英译过程中应当关注目的语的表达习惯,更好地达到交际效果。同时这一研究还可以运用到翻译教学当中,类比语料库可以通过大量的真实语料,尤其是英语源语语料,帮助学生去分析旅游英语的语言特点和文体特征,而这些对翻译过程具有重要的指导意义。