APP下载

机器翻译软件的适用性与局限性分析

2016-12-08陆芙蓉

戏剧之家 2016年24期
关键词:适用性局限性实例

陆芙蓉,吕 乐

(上海理工大学 上海 200090)

机器翻译软件的适用性与局限性分析

陆芙蓉,吕 乐

(上海理工大学 上海 200090)

本文介绍了机器翻译软件的原理,叙述了翻译软件的诞生背景以及发展至今的技术状况。随着各种新技术的发展,机器翻译软件不仅在日常工作生活中得到了广泛应用,也极大拓展了翻译的应用形式。分析了机器翻译软件在不同需求下的适用性和局限性,并对其发展前景进行展望。

机器翻译软件;适用性;局限性

机器翻译是利用计算机技术智能化地把一种语言转换成另一种语言的过程。1954年IBM公司首次完成了俄英双语机器翻译的实验。随后,很多国家,如前苏联、英国、日本、中国等也相继进行了机器翻译试验。如今,市场上已出现了多种基于不同原理的机器翻译软件。

很多学者都对机器翻译的技术原理进行了分类,总体可以将机器翻译系统从方法上大致分为四类:基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译。基于不同原理的翻译软件各有所长,译者可根据不同的翻译需求合理选取这些机器翻译软件。

基于规则是通过语法、语义等语言习惯约定一种规则,通过对源语言语句的此法、语义、语法和句法进行判断分析,按照一定的规则重新排列组合,生成目标语言。基于规则的机器翻译系统擅长于翻译符合规则的内容,翻译的质量较高,然而有效规则的形成过程通常具有很高难度。而基于实例的机器翻译的本质是“以翻译实例为基础,基于相似原理的机器翻译”,这种实例既可以是不加修饰的翻译原型,也可以是一种经过加工的翻译实例。基于统计的机器翻译技术本质上也是一种基于语料库的翻译技术,它可以将语料库中的实例抽象成一种统计模型,翻译过程即为对这种统计模型的重新解码。基于统计的机器翻译系统具有通用性,自动从语料库中学习语言知识,这种翻译技术通过概率统计的理论建立包含各种句型的双语对照资料库,并在翻译过程中不断完善、优化、修改这个资料数据库,在翻译时,软件自动从这个数据库中提取相似的例句、短语等,并模仿该句型实现源语言和目标语言的转换。

目前的商业化机器翻译软件,多数采用了多种翻译技术混合的模式。从最初的简单规则,到如今千变万化的复杂规则,依靠长期翻译训练中积累的大量语料库和在长期翻译实践中通过译者的反馈和测试不断优化的语料库,很多翻译软件已具有较高的翻译成功率,被广泛应用于文件浏览、信息查阅、数据检索等方面。

一、机器翻译译文质量及错误模式分析

机器翻译系统的评价主要有七大因素:译文的质量、应用效率、工作方式、使用环境、维护性和扩展性、机器翻译系统性能价格比、鲁棒性(robustness)。其中译文的质量是最主要的考量因素。

在科技文翻译中,罗季美等人以汽车技术科技文献的翻译为例,统计得出各种句法错译发生的概率,如图1所示。事实上,半个世纪以来的机器翻译研究在句法处理上已经取得了很大的成就,机器对被动语态、大部分主要时态及某些特殊句型等的处理都达到了相当高的准确率(10.3%)。而该统计的错误率也从侧面反映出语言的千变万化对机器翻译的巨大考验,在机器翻译软件中为每一种语句应用的特例都制定规则是不现实的,而长期的机器翻译应用和人工比对修改也是机器翻译不断进步的必不可少阶段,从而逐步更合理限定词汇处理范畴,提高机器翻译的准确率和效率。

图1 句法错译发生率

二、机器翻译软件的适用性与局限性

机器翻译软件的优势在于翻译速度快、运用范围广、成本低和无需专业译员等;局限性在于机器翻译的译文比较粗糙、文体风格难以掌控以及语言表达不够地道等。翻译标准的差异及机器翻译软件的原理决定了机器翻译非文学材料的适用性比文学材料要强。一般情况下,翻译界都认为科技翻译易于文学翻译。理论上,若输入计算机中的规则和语言材料越多,翻译的质量就越高。如果把人类所有的语言规则和语言现象都输入计算机中,那么机器翻译完全可以取代人工翻译。但是语言的应用千变万化,尤其在文学作品中,语言的多样性使得语义规则多到无法估量,而即使建立了非常庞大的语料库,也不可能完全涵盖语言的所有用法,更别提语言中的文采、多义化表达等文学作品特有的性质,使得机器翻译软件在有较高需求的文学翻译中几乎不可能代替人工翻译。

而在翻译要求相对较低的其他场合,有效的机器翻译可节省大量的资料阅读时间,极大地提高了工作效率。然而,如何建立一个有效的翻译规则,并逐步完善翻译语料库,是翻译工作者和计算机软件开发者面临的共同难题。

根据日常生活中大量浏览性阅读需求,机器翻译软件在多个层面开发了相应的应用功能,如在线翻译、网页自动翻译、图片翻译、语音翻译等。从使用者的角度来看,用户在打开外语网页时,可以选择“翻译该网页”功能,直接将原

网页文字翻译成另一种文字,这种功能的实现并非来自于原网站服务器中的数据,而是一种基于网页应用层面的机器翻译技术。当今,机器翻译软件还可以借助OCR(屏幕识别技术)翻译出非文本格式的图片文件,甚至还可以借助于语音识别技术,识别出用户所讲的内容,并迅速翻译成另一种语言。

可以预见的是,机器翻译技术将来还会与更多技术相结合,进一步丰富其在日常生活、工作中的需求。同时,机器翻译技术也将这种理念运用在了更复杂的未知语言探索中。

三、结论与展望

机器翻译经过长达半个世纪的发展,如今已成为人们日常工作生活中不可或缺的翻译技术工具。语言既是一种建立在一定规则基础上的表达方式,也具有千变万化无法捉摸的特点,这使得机器翻译软件不仅需要制定一定的规则,也需要在投入运用的过程中,不断改善技术,并和语言学知识相结合,提高机器翻译的译文的准确性和翻译效率,降低人工译员译后编辑的劳动量。如今的商业化机器翻译软件经过几十年的发展,已经在很多场合证明了其适用性。同时,由于语言的多样性和随机性,目前的机器翻译软件尚无法完全替代人工翻译,具有一定的局限性,尤其在要求较高的翻译场合,仍非常依赖于人工翻译。

随着大数据技术在各行各业的不断渗透,以及人工智能技术的起步,未来机器翻译软件势必会更加智能,借助于各种现代化应用型技术,一方面可以更轻松完成日常翻译工作;另一方面,甚至可以通过人工智能技术,进行自我学习和感知,逐步涉足更复杂、更多变的翻译工作。

[1]罗季美,李梅.机器翻译译文错误分析[J].中国翻译,2012(5).

[2]王内.文学材料与非文学材料机器翻译适用性比较研究[D].湖南师范大学,2012.

[3]冯志伟,徐波,孙茂松.机器翻译的现状和问题[M].北京:科学出版社,2003.

[4]胡清平.机器翻译中的受控语言[J].中国科技翻译, 2005(8).

[5]Arnold D. & Lee H Machine Translation: Special Issue on Evaluation of MT system[A]. In Arnold D. & Louisa S. Evaluation: An Assessment[C]. Dordrehct: Kluwer Academic Publishers, 1993.

[6]Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Petra, Fredrick Jelinek, John D. Lafferty, R obert L. Mercer, and Paul S. R oossin.A Statistical Approach to Machine Translation [J]. Computational Linguistics. 1990,16(2): 79-85.

[7]刘剑.超文本语境下的翻译形态变化研究[D].华东师范大学,2014.

[8]王海峰,吴华,刘占一.互联网机器翻译[J].中文信息学报,2011(11).

TP391.2

A

1007-0125(2016)12-0270-02

猜你喜欢

适用性局限性实例
强调简洁和适用性 MICHI by Rotel X5/X3合并功放
小议阶级分析理论的适用性
自动化事实核查的前景及局限性
新一代车上转换装置在厂矿企业铁路运输中的适用性研究
胸腹部局限性Castleman病的CT特征
我国公共行政的系统分析:可行性、必要性及局限性
“最近发展区”理论及其在教学中的局限性
完形填空Ⅱ
完形填空Ⅰ