大数据背景下石油科技翻译
2016-12-01王永谌阳敏侯柯康王琳妹
王永+谌阳敏+侯柯康+王琳妹
【摘 要】随着科技的进步,大数据已引发了翻译界的重大变革。以谷歌翻译、有道翻译为代表的机器翻译就是成功借助大数据功能进行翻译的典型。然而,这种翻译相比较人工翻译可谓优缺点并存。笔者以大数据时代机器的石油科技英语翻译作为切入点进行深入分析。探讨大数据背景下石油科技翻译的存在的机遇和问题,以期为大数据背景下的石油科技翻译提供可行性建议,促进石油科技翻译的高效化和智能化。
【关键词】大数据背景;机器翻译;石油科技翻译;应对的建议
在科技进步的推动下,大数据时代已经到来,它正以前所未有的广度和深度影响着人类社会。“人们对于大数据的挖掘和运用,预示着新一波生产力增长和消费盈余潮的到来”(Manyika J 2011)。翻译作为推动人类文明进步的重要环节,不可避免的受其影响。然而,在翻译界真正结合大数据的研究几乎空白。基于此,笔者初步探讨大数据与翻译间的关系和相互影响,构架出翻译与大数据间内在逻辑关系和理论框架,探索出如何借助大数据进一步推动翻译的高效化和智能化,推动翻译为人类文明进步作出更大贡献。在此,笔者以谷歌翻译中石油科技翻译作为切入点,进行深入分析。
一、大数背景下的翻译特点
以谷歌翻译为代表的搜索引擎翻译是利用大数据功能进行翻译的典型。“根据维基百科公布的数据,截至2016年1月,谷歌翻译支持90种语言,每天为超过两亿人提供免费的多种语言翻译服务”(斯介生 2016)。因此,它具有快捷、量大、高效、语种多等特点。但这种大数据背景下的翻译在准确性方面还存在很多缺点和不足。为此,我们从以下几点进行探讨:
首先,大数据时代背景下的机器翻译(以谷歌翻译为代表),主要是基于大数据功能产生,其翻译质量受到平行语料库数据量的制约。而且,语料库数据中存储样本量的不同都会影响翻译质量。
再者,大数据时代背景下的机器翻译的模型不能有效识别上下文信息;造成不能识别诸如虚拟语气、被动语态等语法信息,要么只能识别部分信息。
其次,大数据时代背景下的机器翻译不能翻译过长句式的文本。一旦文本句式过长,其翻译的质量就会下降。
最后,大数据时代背景下的机器翻译给出的词频不能作为译者采纳的标准。
二、石油科技翻译语言特点
石油英语的语言基于其特殊的专业性和历史发展,具有其自身特点。笔者以英语为代表进行分析,其具备以下特点:
首先:石油英语具有准确性的特点。这主要表现为:构词的准确性。石油科技英语从拉丁语、希腊语借用大量术语,以及借助拉丁和希腊词缀构成大量新词,而由于拉丁语和希腊语本身意义单一,造成其歧义较少,故准确性较强(邹宇2007)。例如,hydrocarbon(碳氢化合物, 烃类)。词缀构成词汇较多,如desalting(脱盐)。抽象名词广泛使用,如permeability(渗透率)。
再者,石油科技英语中大量运用严密、复杂、条理的复合长句表达理论原理、发展变化过程。
再者,石油科技英语具有客观性。被动语态广泛使用、现在时态较频繁。
其次,石油科技英语具有简洁性。缩略词大量使用,就是其中最明显的一个特点。如,EOR(enhanced oil recovery):提高采收率。
最后,石油科技英语具有多重学科背景,而且伴随着石油业的不断发展,不断有新词汇产生,如,timestep(时间步长)。
三、大数据背景下石油科技翻译的建议
首先,我们翻译界尤其是石油专业的高校要和石油公司紧密联系,获取丰富的翻译文本,不断进行与石油相关的平行语料库建设和完善,为大数据的数据搜索提供原材料。由于石油科技语言的准确简介性特点决定了只要我们进行充分的词汇和句式收集就可为大数据时代机器翻译的准确性提供保证。从实践中提炼出翻译准确,标准规范的词组、句式,继而通过语料库进行储备,然后再通过网络进行传播使用,可以有效提升大数据搜集的准确性和严密性,从而使诸如谷歌之类的翻译更具可靠性。
再者,基于大数时代的机器翻译功能仍未达到成熟水平,不能有效识别上下文语境和复杂长句子。这要求石油科技的翻译同时要依靠人工翻译,由译者去判断分析句式语法结构,去思考英语句子中的逻辑,再结合译入语和译出语的具体语言结构进行恰当翻译。
其次,基于大数据时代机器翻译时分析搜集出的词和词组仍没有完全结合语境,其词频高低不能作为准确翻译的标准。“从翻译理论上分析目的语中普通真实语言的词频大小一般不作为译文的选择标准,即: 高频词不一定适合语境”(倪传斌 2003)。当然,这种情况也适用于固定搭配。举例来说,译者不能由于“petroleum”比“oil ”在真实英语环境中的使用频率高,在英译汉时就不加分析总把“petroleum”作为“石油”。同理,大数据搜集出的结果总是基于词汇频率高低,有时高频的译入语就不能作为语境的最佳选择。这就需要译者在进行大数据机器辅助翻译时,将数据搜集结果结合语境,结合其他关键词进行逻辑分析,以准确把握词的意义。
再其次,译者要结合石油科技语言特点和大数据时代的机器翻译功能原理,主动进行多学科知识积累和储备;尤其要对大数据的原理和功能进行学习掌握,以更有效发挥其功效。
最后,大数据时代的到来,要求译者必须和计算机、统计学科领域的学者进行密切合作,以开发出适合特定领域翻译特点的翻译软件和应用程序;对于石油科技英语而言,就要研发出特定的石油科技翻译软件和应用程序,以推进石油科技英语翻译的高效化和智能化。
四、结语
综上所述,大数据时代的到来,为石油科技等领域的翻译打开了一扇门。大数据的强大功能将继续推动翻译界的变革。译者要全面认识大数据时代石油科技翻的特点和机理,分析其不足,找准译者职责新的定位点。既要借助大数据的功能又要发挥译者翻译时的主导性;同时,译者要进行跨学科学习与合作,不断研发适合石油科技翻译的新软件和应用程序,提升石油科技翻译的高效化和智能化水平。
【参考文献】
[1]Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh C, Byers AH. Big data: nextfrontierforinnovation ,competition,andproductivity.2011.http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
[2]倪传斌 郭鸿杰 赵勇. 论利用互联网搜索引擎协助翻译的科学性和可行性——兼与朱明炬先生商榷--[J]. 上海科技翻译,2003,04
[3]斯介生 宋大我 李扬. 大数据背景下的谷歌翻译 统计研究[J] .统计研究,2016,05 .
[4] 邹宇.石油英语的特点及翻译[J].中国科技翻译,2007,08.