机器翻译面临的语义分析难题在日译汉翻译中的体现
2021-07-14李佳钰
李佳钰
摘要:在机器学习和自然语言处理技术支撑下,机器翻译取得了飞速发展。但机器翻译依然面临语义分析这一难题,本文旨在通过分析机器翻译的错误译文,总结语义分析难题在日译汉翻译中的体现。
关键词:机器翻译;难题;语义分析;日译汉
一、引言
基于计算机技术、自然语言处理技术和机器学习算法的不断发展,机器翻译不断革新,取得了巨大的成果。[1]随着跨语言、跨文化交流的扩大和深化,机器翻译正逐渐成为实现沟通交流、跨越语言障碍的重要手段,有效降低了沟通成本,在教育、社交、商业贸易、文化交流等领域内都有广阔的应用空间。
当前的机器翻译方法无论是基于规则的机器翻译方法、基于统计模型的机器翻译方法、还是基于神经网络的机器翻译方法,依然面临语义分析这一绕不开的难题,本文以心境小说《在城崎》的原文和百度翻译的错误译文为例,分析语义分析难题在日译汉翻译中的具体体现。
二、机器翻译方法和语义分析难题
当前的机器翻译方法,大致有基于规则的机器翻译方法、基于统计模型的机器翻译方法、基于神经网络的机器翻译方法。基于规则的机器翻译方法着重语言学知识,通过深层次语言学分析得出翻译规则,是较传统的翻译方法;基于统计模型的机器翻译方法将平行语料作为翻译知识的来源,通过大量分析平行语料库的内容,类比得出新内容最合适的翻译方式;人工神经网络本质上是受到大脑神经网络的启发而建立的数学模型。[2]2013年以后,基于人工神经网络的机器翻译逐渐兴起,在谷歌翻译开发并使用了Google神经机器翻译系统后,神经网络机器翻译正式进入运用阶段[3]。
自然语言具有的歧义特征使机器翻译面临语义分析这一大难题。歧义是自然语言中普遍存在的现象,实质是同一语言形式可能具有不同的意义。自然语言在词汇、句法、语义、语用等各个层面都充满歧义。在词汇层面上出现一词多义;句法层面上一个句子可以表示多个意思,即句子本身是歧义的。[4]机器翻译集成了自然语言处理学科中各个分支的诸多难题,由于词形、词性、句法、语义都存在着不同程度的歧义,使得机器翻译面临重大难题。[5]
现有研究显示,基于规则的机器翻译方法通过构建自然语言之间的转换规律进行翻译,难以解决语义分析难题。基于统计模型的机器翻译方法依靠大量语料,通过数学模型描述自然语言的转换过程,将传统基于规则的机器翻译难以解答的“语义问题”交由数据和统计解决。基于神经网络的机器翻译方法使用深度学习神经网络获取自然语言之间的映射关系,绕开了“语义问题”并使“语义理解”的过程成为“黑箱”。[6]当前的机器翻译从产出效果上来讲已经取得了很大的进步,但无论是基于统计模型的机器翻译方法还是基于神经网络的机器翻译方法,都只是盡力实现得出正确译文的概率最大化,语义分析依旧是不能也无法绕开的难题[7]。
三、语义分析难题在日译汉翻译中的体现
机器翻译面临的语义分析难题在日译汉翻译中有多种体现。下文通过日本作家志贺直哉的心境小说《在城崎》中的原文与目前国内知名度较高的在线翻译平台百度翻译的译文为例,分析语义分析难题在日译汉翻译中的体现。
(一)多义词、多义句型翻译。
多义性是自然语言的特点之一。多义词和多义句型的翻译需要在语义分析的基础上选取适当的义项。
(1)原文:子供が二三人、四十位の車夫が一人、それへ石を投げる。なかなか当らない。
百度翻译:有两三个孩子,一个四十多岁的车夫向他扔石头。很难猜中。
正确翻译:两三个孩子和一位四十多岁的车夫向它扔着石头。总是打不中。
「当たる」有“猜中;击中;中奖”等多个义项,文中的意思应为“(石头)击中,打中”。
(2)原文:寂しい秋の山峡を小さい清い流れについて行く時考える事は矢張り沈んだ事が多かった。
百度翻译:在寂寞的秋天的山峡里,随着小清澈的河流前进的时候,思考的事情还是很多的。
正确翻译:沿着小溪行走在寂静的秋季峡谷中,此时此刻想的也多是令人心情沉郁的事。
「について」在本句中是“沿着”的意思。
(二)代名词翻译。
在译文中正确将代名词指代的内容表达出来,需要对原文进行语义分析。
原文:自分は自身で病院をきめた。それへ行く方法を指定した。
百度翻译:我自己决定去医院。我指定了去那个的方法。
正确翻译:我自己决定了去哪个医院,并指定了去医院的方法。
代名词「それ」在文中指的是“医院”。
(三)划分句子层次。
当某些假名汉字组合在一起,能够通过不同的层次划分方式判断成不同的句型时,需要在语义分析的基础上正确划分句子层次,进而判断句子应用的句型。
原文:或所迄来ると橋だの岸だのに人が立って何か川の中の物を見ながら騒いでいた。
百度翻译:到了某个地方,明明是桥或岸边却站着人,一边看着河里的东西一边吵闹着。
正确翻译:走到某个地方,只见桥上和岸边挤满了人,一边看着河里的东西一边喧闹着。
原句中出现的句型是「……だの……だの」,表示列举,“又是……又是……”,「に」表示所处的位置。原句的意思是“人们站在桥上和岸边”,百度翻译将句型识别为「のに」“明明,却”,导致整句译文偏离原意。
(四)补译。
在语义分析的基础上,才能做到恰当且正确地补译。
(1)原文:鼠はどうかして助かろうとしている。顔の表情は人間にわからなかったが動作の表情に、それが一生懸命である事がよくわかった。
百度翻译:虽然人类不知道脸上的表情,但是从动作的表情中,我明白了那是非常拼命的。
正确翻译:虽然人类无法理解老鼠脸上的表情,但是从老鼠的动作上,我明白它在拼命挣扎。
「顔の表情」、「動作の表情」的主语都是“老鼠”,补译后句意表达完整,便于读者理解。
(2)原文:それは見ていて、如何にも静かな感じを与えた。淋しかった。
百度翻译:那个看着,给人一种安静的感觉。我很寂寞。
正确翻译:它看起来有一种极其安静和寂寞之感。
「淋しかった」的主语不是“我”,而是文中的「それ」(蜜蜂的尸体),百度翻译补译错误。
(五)译文语意是否符合逻辑。
若要使译文符合语境,逻辑通顺,必须在语义分析的基础上进行翻译。
(1)原文:祖父や母の死骸が傍にある。それももうお互いに何の交渉もなく、――こんな事が想い浮ぶ。
百度翻译:祖父和母亲的尸体在旁边。而且双方都已经没有任何谈判了——这样的事情让人浮想联翩。
正确翻译:旁边是祖父和母亲的遗骸,但我们相互之间再没有任何联系。——我脑海中浮现出这样的景象。
此句作者在议论生死,语气严肃,将「想い浮ぶ」译为“浮想联翩”與前后文逻辑不合。
(2)原文:若し医者が留守で、行って直ぐに手術の用意が出来ないと困ると思って電話を先にかけて貰う事などを頼んだ。
百度翻译:如果医生不在家,去了之后不能马上准备手术的话就麻烦了,所以拜托他先打电话。
正确翻译:若是医生不在,不能在自己到达后马上准备手术的话就糟了,所以还托人先打了电话。
句中「留守」指医生不在医院的情况,译为“不在家”不符合句子逻辑。
四、结语
日译汉机器翻译的译文中由语义分析难题带来的误译十分常见。当前人机结合翻译模式是解决这一问题的一种方法,即机器翻译与译后修改编辑相结合[8],机器翻译快速翻译大量原稿,人工翻译在此基础上进行修改补充、译文润色。机器翻译减轻了译者在初步搭建译文句型方面的压力[9],专业译者人工介入进行译后编辑,弥补机器翻译在消除语言歧义性方面的缺点[10],修改机器翻译译文中由语义分析难题带来的误译。
科技与人文的融合是未来翻译技术发展的必然方向[11]。机器翻译与人工翻译形成互补互助的关系,呈现出人机共存、人机互补的发展趋势。
参考文献
[1]王钰.自然语言处理及其在机器翻译中的应用[J]. 现代语文,2019(5)
[2]冯志伟.神经网络、深度学习与自然语言处理[J].上海师范大学学报(哲学社会科学版),2021,50
[3]席敬,董一恒.跨文化交际视角下的机器翻译谬误分析[J].北京印刷学院学报,2019,27(10)
[4]张政.机器翻译难点所在[J].外语研究,2005(05)
[5]史树敏.机器翻译方法的研究现状[J].内蒙古师范大学学报(自然科学汉文版),2004,33(2)
[6]李晗佶,陈海庆.机器翻译技术困境的哲学反思[J].大连理工大学学报(社会科学版),2020,41(06)
[7]王革,华南.语义分析对机器翻译的影响——以新闻语言为例[J].江苏经贸职业技术学院学报,2013.
[8]张英杰,余美琪,李文博,等.人机结合翻译现状与发展[J]. 山西青年,2019(24)
[9]潘雨晴.“机器翻译+译后编辑”模式在联合国文件翻译中的应用[D].上海外国语大学,2021.
[10]胡亚琴.机器翻译的词义消歧难点及应对策略[D].上海外国语大学,2021.
[11]祝朝伟.机器翻译要取代作为人的译者了吗?--兼谈翻译人才培养中科技与人文的关系[J].外国语文,2018,(3).
(西北大学 陕西 西安 710127)