APP下载

机器翻译特点研究及其发展分析

2015-12-08谷秾

人间 2015年33期
关键词:句法汉语规则

谷秾

(吉林建筑大学,吉林 长春 130000)

机器翻译特点研究及其发展分析

谷秾

(吉林建筑大学,吉林 长春 130000)

作为两种完全不同语系的语种,汉语和英语在翻译过程中,特别是机器在分析转换中会遇到各种不同的问题,自然也会总结出很多不同的经验。本文用实例分析并介绍了典型的机器翻译方法,存在的难点等。最后,对机器翻译在今后的发展做出了总结,讨论和展望。

机器翻译;基于规则;难点

随着科技与经济的快速发展,人们对于效率的讲求日渐升高,这也在翻译领域有着体现。现代社会,我国对外交流的需求日益增大,社会方面,各个领域对于翻译需求也越来越大,翻译作为文化传播的重要手段也越来越引起了人们的重视,对于其追求和渴望也日渐增加。然而,翻译领域在经历了一个快速发展阶段之后,现有的理论方法和技术模型对于翻译整体性能的提高已开始到了瓶颈阶段。从产业角度和实用角度来看,机器翻译对于整个社会来说是绝对被需求的,对于人类的翻译事业来说呢,目前的机器翻译与预期中的效果差距仍然非常大。现有的机器翻译在理论方法和整体性能方面提升的空间呈减小趋势,对于用户的实际需求来说更是有很大的提升空间。那么,面对社会和人们的期望、面对日渐增长的需求,机器翻译之路应该如何走呢?它的特点和难点又是什么呢?本文将一一进行简要阐述。

一、翻译事业的发展

人类对机器翻译的研究已经持续了50多年。追溯到上个世纪40年代电子计算机诞生之日,计算机应用于语言翻译的探索就不曾被停止探索。在这几十年的探索过程中,先后出现了各种基于双语字典的直接翻译型、基于抽象表达式的中间语言型和基于规则的转换型翻译系统。现代社会,机器翻译领域的研究主要包括基于语言学的规则研究、基于语料库和统计方法(如KDD技术)的研究、基于记忆的方法(translation memory)研究和基于受限语言的研究等方面,这些元素显示了我国现在的翻译现状。作为世界上第5个进行机器翻译实验的国家,翻译事业从一开始就得到了我国的高度重视,早在1956年,它便以“机器翻译/自然语言的数学理论”列入了当时的《科学发展纲要》以后则列为“六五”、“七五”,以及“863”等重大科研项目,引起了一代又一代政府和人民的高度重视。在这个过程中,我国的翻译事业先后集结了多家科研院所和许多部委的研究人员,大家进行协同攻关,并与国际上享有盛名的机译研究机构进行过合作和交流,不但加强了人才的培养,积累了重要的资源,更使中国机器翻译研究的总体水平站在了世界的前列,并在不断地发展和探索中取得了一个又一个傲人的成绩。

二、基于规则的翻译方法(Rule-based Machine Translation)

从Chomsky提出转换生成文法的方法之后,基于规则的方法就一直是机器翻译研究的主流,Chomsky的观点认为,一种语言中,无限的句子可以通过有限的规则被推导出来。早期的机器翻译系统,从体系结构上来看,可以分为直译式、转换式和中间语言式,它们所存在的不同之处就在于对源语言分析的深度,它们的相同点就是都需要很大规模的双语词典、大量的源语言推导规则、语言转换规则和目标语言生成规则。同时,对源语言分析得比较深的是转换式的基于生成方法,它涉及到词汇结构分析、语法分析、语义分析三种,并完成词汇、语法、语义三层结构从源语言到目标语言的转换。相对于中间语言方法来讲,这种方法更容易获得高质量高水平的翻译结果。显而易见的是,规则的翻译机器翻译的核心问题是如何构造构造完备的或适应性较强的规则系统。但是,如果想要建立规则库的话就要花费大量的人力物力和财力,即便真的做到了这样规则的完备性却依旧不能得到充分的保证,规则库依然很难全面覆盖所有复杂的语言现象.然而,随着规则数量的不断增加,各个规则之间的冲突毕竟难以避免;用系统化的分类规则也很难。

三、难点所在

机器翻译的存在确实给我们带来了很多便利,当然,它的发展前景也足够吸引人,不得不承认的是,它的翻译质量还是不那么令人满意的,对于其讽刺性的评价也不在少数。转眼间,机器翻译已经走过了五十年的风雨艰辛,我们不难发现,它的发展还是相对迟缓。那么,机器翻译的难点究竟在何何处呢?

机器翻译最大的的难点就在于它研究的对象,因为自然语言本身存在复杂性,它的结构和文法也绝非单纯的符号堆砌,而是各种语言符号通过复杂的作用结合到一起。来源于现实世界的语言忠实地反映了客观世界和人类社会多变得复杂性,如汉语是讲究意合的语言,生动形象,不会有太多过于直白的描述。一般都通过使用虚词、词序的手段来表示。一些在汉语中有英语所没有的丰富的量词(如个、根、只、块、片等)和语气词(如吗、呢、哩、嘛、了等)。然而,作为综合和分析参半语言,英语有着多变的数、格,以及汉语中所没有的冠词、关系代词及关系副词,包含很广。同时英语中应用得非常广泛的引导词和虚词在汉语中更是没有明确对立的译文或结构。英汉语言不同的特点就使机器在分析转换这两种语言时遇到很多问题如:汉语同形歧义严重、定语从句的语序混乱、英语动词形态的生成、省略成分的确定、英语冠词的生成和英语名词单复数的确定等。这些问题严重影响了译文的可读性,特别是在处理上下文相关联的篇章时尤为突出。

四、总结,发展和展望

近几年来,机器翻译在统计方法的推动下,其发展有了很大的进步,涌现出了很多让人印象深刻的新理论和新方法。相比从前,翻译质量有了很大提高,远远超过传统方式。同时,因为可以从大规模语料库中自动获取翻译知识,不再依赖于人工撰写规则,使得机器翻译系统的开发周期得到了缩短,机器翻译的应用也得到了很大程度上的拓展,这更大大降低了机器翻译研究的门槛,以至于更多的研究者愿意投入到机器翻译研究中来,整个研究领域也充满充满了生机与活力。现在看来,统计机器翻译中用到的语言知识相对来说还是很有限的。基于词的方法和基于短语的方法几乎没有用到任何常见的语言知识,而是采用了一种词汇化的概率计算方法,使所有的语言知识直接通过对词语的概率统计表现出来。目前来看,基于句法的统计翻译方法开始逐渐成为研究的热点,特别是在基于语言学句法的翻译模型中,种种句法知识得到了充分的利用,已经开始超越单纯基于短语的方法或者基于形式化句法的方法。同时,现在还很少有人用基于语义的方法,仅有一些基于词义排歧的工作。这种种都证明,词义排歧可以使得现有的机器翻译性能略有提高。我们应该看到的是,如果不对更复杂的语言知识进行引入,机器翻译存在的问题是不可能真正得到解决的。这都有待于研究工作者进行更加深入的研究。我们更坚信,随着研究层次的不断深入,更多的语言知识将能够有效地融入到统计机器翻译之中,使得机器翻译的水平更上一个台阶。

注:基于机器翻译平台的土建类工程翻译实践训练,项目结项使用。

TP391.2

A

1671-864X(2015)11-0084-01

猜你喜欢

句法汉语规则
学汉语
撑竿跳规则的制定
述谓结构与英语句法配置
轻轻松松聊汉语 后海
奥斯卡的规则变了!
句法二题
诗词联句句法梳理
追剧宅女教汉语
让规则不规则
汉语不能成为“乱炖”