双语平行语料库与词语“假的”的翻译研究
2012-08-15李毅鹏
李毅鹏
(东莞职业技术学院 应用外语系,广东 东莞523808)
双语平行语料库与词语“假的”的翻译研究
李毅鹏
(东莞职业技术学院 应用外语系,广东 东莞523808)
从语料库出现到现在已经有数十年历史,许多学者运用其进行各种语言学或翻译学领域的研究,并创立了语料库翻译学。在各种语料库中,对翻译研究贡献最大的是已有二十多年历史的双语平行语料库。随着社会的发展,中文词语“假的”的使用频率大幅上升。文章将使用一个自建综合类双语平行语料库对中文常用词汇“假的”的翻译情况进行调查。
假的;语料库翻译研究;双语平行语料库
一、引言
著名翻译学者Mona Baker于1993年发表的《语料库语言学与翻译研究:启示与应用》(CorpusLinguisticsandTranslationStudies:ImplicationsandApplication)正式揭开了翻译学和语料库结合的序幕。自此之后,语料库在翻译研究中的地位得到显著提高,越来越多的学者开始关注语料库,并运用语料库对某些翻译原则和现象进行研究,如,翻译的过程、共性、转换与规范、翻译痕迹等。语料库在翻译规范和翻译普遍性这两个译学研究方向中发挥的作用最大。语料库和翻译研究的结合产生了“一种连贯、综合和丰富的研究范式,涉及翻译理论、描写和实践等方面的诸多问题,已成为当代描述翻译研究中的一种新范式。”[1](P474)
随着社会的发展,尤其是层出不穷的假冒伪劣产品的出现,中文词汇“假的”已经成为现实生活和网络世界的一个非常热门的词汇。据相关的汉语语料库统计,2011年和2010年中,“假的”一词在新闻稿出现的频率远比2009年高。但中文“假的”一词有许多对应的英语单词,许多译者在译稿中遇到它时都难以准确把握应该使用哪一个,大多依赖于查询词典和网络资源来寻找对应的单词,但从总体上分析,“假的”一词翻译的准确度并不高。针对此情况,本文将利用一个自建综合双语平行语料库评估中文“假的”的翻译情况,并对某些翻译进行分析。
二、自建综合双语平行语料库简介
此语料库属于双向双语平行语料库,在建设前,笔者已经对整个建设过程进行了详细的探讨、论证和咨询,解决了一系列将影响语料库质量和使用的关键性问题,目前,此语料库已完成建设并投入使用。同时,建库人员将按照实际要求对语料库进行周期性的维护、更新数据和扩大规模。
(一)语料收集
此语料库是综合语料类型,语料分为两大类:文学和非文学,其中文学语料占总量30%;非文学占70%。文学类主要是小说和散文;非文学类涵盖商务、金融、科技、政治和工作报告等领域。所有语料主要来源于书本、公开出版的学术刊物和认可的网上资源。在代表性问题上,严格执行了Biber等人提出的“比例取样”要求。
(二)语料处理
建设人员对每段收集来的语料的翻译情况都根据奈达的“对等”理论进行了翻译质量评估,符合要求的才被允许收录。在预处理阶段,所有入库语料都经过格式转换处理至纯文本格式,统一以“语言_主题_类别_长度_来源_采集时间”命名,并采用结构标记采用<a></a>标记完整句子和<b></b>标记完整段落。在语料对齐阶段,我们采用winalign软件,主要以自动对齐为主,人工对齐为辅。建库人员对经过软件对齐的每一段语料对进行评估和校对,对于对齐精确率欠佳的语料对,将重新将其进行对齐,再导出收录。
(三)语料标注
语料标注是大多数语料库建设中,不可缺少的一个环节。生语料库(所含的语料未经标注)在翻译领域和语言学领域所能发挥的作用有限。语料标注主要分为两种:词性标注和句法标注。本语料库主要采用汉语词法分析系统(ICTCLAS)对所有中文语料进行词性标注,精确率可达90%以上。对于系统自动完成的标注,建库人员对其抽样进行评估和校对,对于有误的标注,将对照权威字典对其进行纠正。
三、“假的”译文检索结果
我们采用ParaConc软件对“假的”进行检索和提取,发现有391条检索结果,对应的英文翻译一共有13种(按始字母顺序排列):artificial,bogus,counterfeit,fallacious,false,fake,feigned,forged,mock,phony,sham,spurious,unreal。初步发现,在不同领域,它们各自的出现频率有很大差异。
四、“假的”典型译文及分析
我们选取最具行业代表性且翻译完全符合“对等”理论的译文作为典型译文列举出来,并主要根据各单词使用概率对译文进行分析。
(一)商务领域
The regulators assert the bank had conducted fraud,using phony loans,phantom deposits and false accounting,starting a decade ago.
监管机构断言,银行在十年以前已经开始利用假的贷款、存款和账行骗。
The improved Internet Explorer 7alerts you when you're visitingone of those fake banks or eBay Web sites(phishing scams).
改善了的探索者7浏览器会提醒您正在访问那些假的银行网站或易趣网站(钓鱼欺骗网站)。
A Texas resident clicked on the link in the message,which took her to a counterfeit eBay site where she entered personal information.
一个得克萨斯州居民点击了在留言中一个假的易趣网连接,在假网站中,她输入了个人信息。
商务领域中,“假的”共出现96次,对应英文单词出现频率:artificial:5% ,bogus:1%,counterfeit:10%,fallacious:3%,false:41%,fake:21%,feigned:4%,forged:2%,mock:5%,phony:3%,sham:3%,spurious:1%,unreal:1%。
(二)金融领域
The report issued last month said officials were concerned counterfeiting could grow as computer use gains popularity,they note,counterfeiters can easily email prototypes of fake bills within seconds.
上月报告称,政府人员关注随着电脑的普及造假有所上升的现象,他们注意到造假人员可轻易地在数秒之内将假的钞票原图通过电邮发出。
The Coast Bank supplied US currency to overseas banks and businesses.The official working for it became publicity-shy after media reports of counterfeit$100bills traveling the globe.
海岸银行向海外银行和公司提供美国货币,在媒体暴出假的一百美元周游全球后,就职于该银行的高官就不愿在公开场合露面了。
You might think that it would be easy to make a phony financial report.Many people have tried,but they failed.
你也许会认为造出假的财务报告很容易。许多人做过尝试,但他们失败了。
金融领域中,“假的”共出现83次,对应英文单词有7个,出现频率:bogus:7%,counterfeit:12%,false:27%,fake:32%,feigned:3%,phony:13%,unreal:15%。
(三)科技领域
Stealth technology is hardly a sham.
隐形技术绝不是假的。
A spurious electronic signal caused by a brief,unwanted surge of electric power.
假信号由一种多余的短暂电力增加引起的一种假的电子信号。
Some residents say they decline to use a web if they don't like its regulations,while some provide false information if they are uncomfortable with the regulations.
一些居民称,如果他们不喜欢一个网站的规定,就会拒绝使用该网站;然而,另一些称,如果他们对规定感到不舒服,他们会提供假的信息。
科技领域中,“假的”共出现69次,对应英文单词有10个,出现频率:artificial:15%,bogus:3%,counterfeit:3%,false:33%,fake:21%,feigned:3%,mock:2%,phony:2%,spurious:2%,unreal:16%。
(四)法律领域
It did not mean he had no experience with the law——his criminal records included robbery,resisting arrest,using false identification.
这并不意味他从来没有跟法律接触过——他的犯罪纪录,包括:抢劫、拘捕和使用假身份证。
In July,he accused James of using and selling phony documents.
在七月,他起诉了詹姆斯使用和出售卖假文件。
We regulate all the researches which yield some bogus questions about authenticity and impartiality.
我们规范所有将产生真实性和公平性假问题的研究。
法律领域中,“假的”共出现75次,对应英文单词有10个,出现频率:artificial:5%,bogus:3%,counterfeit:13%,fallacious:3%,false:32%,fake:29%,phony:2%,spurious:3%,unreal:10%。
(四)文学领域
Sham is sham and the mask must be stripped off.
假的就是假的,伪装应当剥去。
He got angry and asked Pig to bring Boy down from the tree;he ordered Monkey to carry the Boy on his Back.As they started to go,Red Boy jumped into mid-air,leavinga false Red Boy for Monkey to carry.
唐僧动怒,要八戒将红孩儿救下,并要悟空背上红孩儿走时,悟空背的只是个假的,红孩儿真身早已跳到九霄云外。
“Come,dear ones,”said Morrel,“let us go and see,and heaven have pity upon us if it be false intelligence!.”
“来,亲爱的孩子们,”莫雷尔说,“我们去看看,假如这个消息是假的,愿苍天可怜我们。”
文学领域中,“假的”共出现68次,对应英文单词有12个,出现频率:artificial:6%,bogus:3%,counterfeit:6%,fallacious:12%,false:22%,fake:19%,feigned:3%,mock:3%,phony:3%,sham:3%,spurious:9%,unreal:11%。
在整个综合双语平行语料库中,false和fake出现的概率非常接近且远高于其他11个单词。在不同领域里,每个单词出现的频率有很大变化,尤其是在特定领域里,个别单词使用频率出现骤升情况。为了确保研究结果准确无误,我们依据奈达的“等值”理论对这391条结果进行逐一复查,发现全部翻译准确无误,结果有效。为了进一步验证研究结果的可靠性,我们将这13个英文单词输入到美国杨百翰大学的现代美国英语语料库进行词频检测,发现false和fake两者在现代美国英语中出现的频率非常接近,而且远远高于其他11个单词,这不仅说明笔者以上的研究结果可靠可信,同时表明此自建综合双语平行语料库的可信度非常高。
五、结束语
随着社会的变化发展,“假的”在各种文体中出现的频率较以前大幅提高。虽然中英文存在较大的差异,但通过对这个中型自建综合双语平行语料库进行检索、统计和分析,发现其对应的英文单词的范围和使用频率有一定的规律。这种利用双语平行语料对具体翻译问题进行研究的方法,为翻译研究、翻译实践和翻译教学提供了大量宝贵的真实范例与统计数据,大大地促进了整个翻译领域的发展。以上研究成果望能给正使用语料库研究翻译具体问题的人员提供一点启发,基于语料库研究翻译的方法在未来仍将大放光芒。
[1]Laviosa S.Corpus-based Translation Studies[M].Amsterdam & New York:Rodopi,1998.
李毅鹏(1985-),男,东莞职业技术学院应用外语系讲师,硕士研究生,主要从事语料库翻译学、计算机辅助翻译研究。