当前日译汉机器翻译的缺陷及对策
2017-07-06孙泽方
摘 要:本文通过调查问卷考察了日语专业大学生的日汉翻译软件使用现状,并以“百度翻译”为机器翻译的代表,用它对特朗普就职演讲的日文版进行了汉译,逐句考察其译文错误并对错误类型进行归纳总结,在此基础上提出了一些改进日语机器翻译质量的建议。希望能为中文信息处理及中日文化交流领域提供参考。
关键词:机器翻译 日语 日译汉 特朗普就职演讲 百度翻译
一、引言
机器翻译是最早的信息处理研究①。20世纪30年代初,法国科学家阿尔楚尼有了“机器翻译”的构想。我国于1956年开始研究机器翻译,随着互联网的迅猛发展和跨文化交流的扩大深化,机器翻译正逐渐成为人们克服获取信息时所面临的语言障碍的重要手段,翻译需求的不断增大使得翻译软件进入一个新的发展时期。②
机器翻译中,汉日翻译备受瞩目。随着中日经济、文化交流的不断扩大深化,中国迅速准确地获取日文信息的需求日益迫切。虽然中国的日语学习者不断增多,目前中国已超过韩国成为日语学习者最多的国家,但仍远不能满足这一需求。日译汉机器翻译软件的出现,为突破汉日语信息壁垒提供了一种高效的手段。
目前国内关于机器翻译的研究多集中于英汉翻译,对于日汉机器翻译软件在日语专业大学生中的使用情况、不足之处的分析及对策的研究比较罕见。本文通过问卷调查,考察了目前日汉翻译软件在曲阜师范大学日语专业大学生中的使用现状;并以目前中国知名度最高的机器翻译软件“百度翻译”为代表,以美国新任总统特朗普的就职演讲日文版③为语料,考察其不足之处,并提出改进建议。
二、日汉机器翻译软件在日语专业大学生中的使用现状调查
笔者以曲阜师范大学日语专业大学生为样本,对其日汉翻译软件的使用现状进行了问卷调查,以此估计日语专业大学生整体的使用状况。共发放问卷200份,回收184份,有效问卷178份。
问卷结果显示,对于日汉翻译软件,仅有31.5%的学生“经常使用”,从没用过的学生比例高达12.9%。
对于使用日汉翻译软件的场合,8.4%的学生选择“浏览日文网页”,“阅读日文版书籍”的比例为12.9%,“辅助课后作业”的比例高达22.5%。
使用过日汉翻译软件的同学中,对于其翻译质量,选择“非常好”的仅占5.6%,选择“非常差”的高达51.7%。可见,总体上,日语专业大学生对日汉翻译软件是不满意的,这反映出日汉翻译软件质量仍然不够高。
三、日译汉翻译软件的翻译质量实证考察
为了对日语专业大学生对日汉翻译软件满意度较低的具体原因進行探究,本文进行了实证考察。以美国新任总统特朗普的就职演讲日文版为语料,以目前中国机器翻译领域最著名的软件“百度翻译”为工具进行分析,逐句考察其译文的适当性,将其出现的错误归类,并列出代表性的错误例句。
(一)专名错误
1.专名误译为普通名词
(1)原文:トランプ大統領就任演説
误译:打牌总统就任演说
确译:特朗普总统就职演说
「トランプ」在日语中是平假名表示的外来语,英语原词是“trump”,表示“扑克牌”,恰好与新总统的名字“Trump”拼写相同。
2.专有名词未译
(2)原文:ネブラスカ
误译:ネブラスカ
确译:内布拉斯加州
造成这种错误的原因大概是百度翻译的词库中未收录这个地名。
(二)漏译
1.连续出现的词的漏译
(3)原文:ロバーツ最高裁判所長官、カーター元大統領、クリントン元大統領、ブッシュ元大統領、オバマ大統領、そしてアメリカ国民の皆さん、世界の皆さん、ありがとう。
误译:罗伯茨最高法院长官,卡特前总统,克林顿总统,布什总统,奥巴马总统,以及美国国民的诸位,世界的诸位,谢谢。
确译:首席大法官罗伯茨,卡特前总统,克林顿前总统,布什前总统,奥巴马总统,全体美国国民,所有世界人民,谢谢。
原文中出现了四个「大統領」(汉译:总统),其中前三个「大統領」前有「元」(汉译:前),百度翻译仅译出了第一个「元」,后两个「元」都漏译了。
(4)原文:私たちは雇用を取り戻します。私たちは国境を取り戻します。私たちは富を取り戻します。そして、私たちの夢を取り戻します。
误译:我们将通过雇佣。我们把国境取回。我们把财富取回了。然后,我们的梦想。
确译:我们将把就业岗位取回。我们将把国境取回。我们将把财富取回。并且,我们将把我们的梦想取回。
原文共用了四个「取り戻し」,然而第四个「取り戻し」漏译了。
2.出现一次的词的漏译
(5)原文:私たちはともに、アメリカと世界が今後数年間進む道を決めます。
误译:我们共同决定,美国和世界今后数年的前进。
确译:我们共同决定美国和世界今后数年的前进道路。
原文中的「道」(汉译:道路)漏译了。
(6)原文:きょうの私の宣誓は、すべてのアメリカ国民に対する忠誠の宣誓です。
误译:今天的我的誓言,对所有的美国国民的忠诚的宣誓。
确译:今天我的宣誓,是对所有美国国民的宣誓。
日语指定助动词「です」(相当于汉语判断动词“是”)漏译了。
(7)原文:貿易、税、移民、外交問題に関するすべての決断は、アメリカの労働者とアメリカの家族を利するために下されます。
误译:关于贸易、税收、移民、外交问题的一切的决断,是为了让美国的劳动者和美国的家人进行的。
确译:关于贸易、税收、移民、外交问题的所有决定,都是为了有利于美国的劳动者和美国的家庭而做出的。
句子的核心——动词「利する」没有被译出,造成译文成分残缺。
(8)原文:私たちは、話すだけで常に不満を述べ、行動を起こさず、問題に対応しようとしない政治家を受け入れる余地はありません。
误译:我们说,总是会说话总是不满意,不引起行动,没有接受问题的政治家。
确译:我们不会接受那些总是只是通过话语表达不满,而不采取行动,不应对问题的政治家。
复合动词「受け入れる」没有译出。
(9)原文:中間層の富は、彼らの家庭から奪われ、世界中で再分配されてきました。
误译:中间层的财富,被他们的家庭被剥夺,在全世界被分配了。
确译:中产阶级的财富,被从他们的家庭剥夺,在全世界再分配了。
格助词「から」没有翻译出来。
(三)增译
原文中没有的内容,在译文中却错误地出现了。
(10)原文:あまりにも長い間……
误译:在太长时间的时候……
确译:在太长的时间里……
译文中出现了原文中没有的“时候”。
(11)原文:あなたたちは二度と無視されることはありません。
误译:你再也不会被无视的事了。
确译:你再也不会被无视了。
(12)原文:あなたの声、希望、夢はアメリカの運命を決定づけます。
误译:你的声音,希望,梦想是美国宾客的命运。
确译:你的声音、希望、梦想将决定美国的命运。
例(12)中增译了“宾客”。
(13)原文:ありがとうございます。
误译:谢谢你。
确译:谢谢(你们)。
(四)重复翻译
指同一个成分翻译了两遍。
(14)原文:子どもたちのためにすばらしい学校を……
误译:为了让孩子们为了孩子们的美好的学校……
确译:为了孩子们优良的学校……
「子どもたちのために」的译文重复出现。
(五)词义错误
1.义项选取不当
是指某个词有多个义项,译文没能选择适合语境的那个义项,而是选择了不恰当的义项。
(15)原文:皆さんのものだからです。
误译:因为是大家的东西。
确译:因为是大家的事情。
名词「もの」在这个语境下明显是指无形的“事情”,而不是指有形的“东西”。
(16)原文:1つまた1つと、工場は閉鎖し……
误译:一个又一个和,工厂封闭……
确译:一个又一个地,工厂倒闭……
将表示状语的虚词「と」,误认为是表示并列的「と」。
(17)原文:そして、何兆ドルも海外で使う一方で、アメリカの産業は荒廃し衰退してきました。
误译:并且,在海外使用几兆美元的一方面,美国的产业也荒废了。
确译:而且,一方面在海外使用数兆美元,另一方面却使美国的产业荒废了。
连词“一方面”应与“另一方面”搭配使用,译文中却漏掉了后者,而且前者在分句末尾这一点不符合汉语表达习惯。
(18)原文:アメリカ人の手によって、アメリカの労働者によって、われわれの国を再建します。
误译:根据美国人的手,根据美国的劳动者,重建我们的国家。
确译:用美国人的手,靠美国人的劳动者,重建我们的国家。
「によって」(相当于汉语的介词)有许多义项:“原因,理由,手段,方法,根据,依据”。很明显,这里「によって」表示“手段”,而不是“根据”。
2.译文超出了原词的义项范围
有时,某个词的译文的意思,并不属于原词的任何一个义项,这种错误更加严重。
(19)原文:教育は金がかかり……
误译:教育是金钱……
确译:教育花费金钱……
将行为动词“花费”误译为了判断动词“是”。
(20)原文:われわれの国の富と強さ、そして自信は地平線のかなたに消えていきました。
误译:我们的国家的财富和强度,并且自信地在地平线的那一边消失了。
确译:我们国家的富强及自信,消失在了地平线的那一边。
将结构助词「は」误当成「に」来翻译了。
(21)原文:ほかの国々が、われわれの製品を作り、われわれの企業を奪い取り、われわれの雇用を破壊する……
誤译:其他的国家,我们的产品的制作,我们的企业,唆使我们的雇佣破坏的掠夺……
确译:其他国家,制作我们的产品,夺取我们的企业,损害我们的就业……
复合动词「奪い取り」被翻译成了“唆使”,二者没有任何关联。笔者在百度翻译中输入其动词原形「奪い取る」,正确翻译为“夺取”,可能是百度翻译的程序对动词连用形的翻译有漏洞。许多例句出现了这种情况。
3.词性选择错误
(22)原文:政治家は繁栄してきましたが……
误译:政治家的繁荣起来了……
确译:政治家繁荣起来了……
将动词「繁栄する」当作了名词来翻译。
(23)原文:最後に、私たちは大きく考え、大きな夢を見るべきです。
误译:最后,我们要大的考虑,应该看一个大的梦。
确译:(直译)最后,我们应该大地考虑,应该看到一个大的梦。
「大きい」是形容词,其副词形态为「大きく」(日语语法中称为“连用形”),作状语,应翻译为“大地”,而不是“大的”。
(六)语序不当
(24)原文:私たちは4年ごとに、秩序だち、平和的な政権移行のために集結します。
误译:我们每4年,就要和秩序,和平的政权为转移而集结。
确译:我们每4年,就会有秩序地,为了和平的政权转移而集结。
「のために」表示“为了/为”,其介词宾语应为「政権移行」,而不是「政権」。
(25)原文:それは私たちが黒い肌であろうと、褐色の肌であろうと、白い肌であろうと……
误译:那是我们黑色的皮肤,无论是褐色的皮肤,还是白色的皮肤……
确译:那就是,无论我们是黑色的皮肤,还是褐色的皮肤,还是白色的皮肤……
连词“无论”应前移,以覆盖住黑皮肤、褐皮肤、白皮肤这三种情况。
(26)原文:しかし、常に団結することを追い求めなければなりません。
误译:但是,通常团结的精神追求必须。
确译:但是,平时必须追求团结。
情态动词「なければなりません」表示“必须”,日语中是放在动词后面,而汉语中要放在动词前面。
(七)肯定否定颠倒
(27)原文:私たちは単に、1つの政権から次の政権に、あるいは、1つの政黨から別の政党に移行するだけでなく、権限を首都ワシントンの政治からアメリカ国民に返すからです。
误译:因为今天,我们仅仅是一个政权,或从一个政党的政党转移到另一个政党,从首都华盛顿的政治到美国国民。
确译:因为今天,我们不仅仅是一个政权转移到下一个政权,或从一个政党转移到下一个政党,而是把权力从首都华盛顿的政治归还到美国国民手中。
「だけでなく」(汉译:不仅)没有被翻译出来,造成否定句变成了肯定句。
(28)原文:彼らの勝利は皆さんの勝利ではありませんでした。
误译:他们的胜利是大家的胜利。
确译:他们的胜利不是大家的胜利。
(29)原文:できないことを話すのはもうやめましょう。
误译:说不出的话就别再停止吧。
确译:做不到的事情就别再说了吧。
(八)主动、被动颠倒
(30)原文:私たちは守られ、そして守られ続けます。
误译:我们保护,并继续守护着。
确译:我们被保护,并将一直被保护。
把被动态当成了主动态。
(九)时态错误
(31)原文:私たちは課題や困難に直面するでしょう。しかし、私たちはやり遂げます。
误译:我们面临过课题和困难。但是,我们做到了。
确译:我们或许会面临课题和困难。但是,我们将完成(任务)。
原文表示的是对将来的承诺,但译文中却使用了动态助词“了”,表示过去完成。将「ます」翻译成“了”是错误的,一般而言,「ました」或「た」才翻译为“了”。
原文表示对未来的预测,译文中却用了动态助词“过”,是过去时。
(十)搭配不当
(32)原文:彼らは本当にすばらしかったです。
误译:他们真的很美妙。
确译:他们真的很棒。
“美妙”一般形容事物、感觉等,而不形容人,应将「すばらしかった」翻译为“棒”。
(33)原文:私たちは2つの簡単なルールを守ります。
误译:我们保护2个简单的规则。
确译:我们遵守两个简单的规则。
与“规则”搭配的动词应为“遵守”,原文将「守り」翻译为“保护”不恰当。并且数词“2”一般不和“个”搭配使用,应将“2”改为“两”。
(34)原文:私たちはアメリカを再び偉大にします。
误译:我们把美国再次伟大
确译:我们将使美国再次变得强大。
(十一)层次划分不当
(35)原文:数百万もの瞬間に出会うでしょう。
误译:数百万的瞬间会相遇吧。
确译:数百万人瞬间相会吧。
正确的划分方式为“数百万/もの/瞬間に/出会う/でしょう”,而百度翻译明显是根据错误的划分方法来翻译的:“数百万/も/の/瞬間/に/出会う/でしょう”。
(十二)惯用搭配翻译不当
1.惯用词组翻译不当
(36)原文:いま、私たちは未来だけに目を向けています。
误译:现在,我们只针对未来的目光。
确译:如今,我们只关注未来。
「……に目を向ける」是日语中的惯用搭配,表示“注目于,关注”。百度翻译软件将其拆开翻译,造成误译。
2.惯用句翻译不当
(37)原文:神の祝福が皆様にありますように。
误译:神的祝福各位都在。
确译:愿神的祝福与各位同在。
这是基督教祝福时的惯用句。
(十三)标点符号错误
(38)原文:きょうという日は、皆さんの日です。
误译:今天是大家的日子。是给大家的祝贺。
确译:今天是大家的日子,是给大家的礼物。
将日语逗号翻译为了句号。
四、关于日汉翻译软件质量改进的建议
(一)大幅提升词库的容量
对于专有名词,如人名、地名、书名等,尤其是当今社会中重要人物的名字,要更多地收入词库,这样才能避免将“トランプ大統領”翻译成“打扑克总统”之类的错误,而更有利于跨文化交流交际,有利于了解异文化的实事动态。
日语不同于汉语这种孤立语,而是一种词形变化较为丰富的语言。如同一个动词,会有“连体形”“连用形”“假定形”“终止形”“意志形”“未然形”等形态,因此要将一个动词所有可能的形态都收入词库。这样能避免例句中一些动词形态没有被辨认出来的错误。
对一些专业领域的词汇,非专业领域的人士往往不认识。对此可以编纂容量巨大的各种专业电子词典,将专业词汇囊括其中,从而做到在各个专业翻译领域中都游刃有余。
(二)改進相关编程,纠正语序错误
汉语与日语的语序差异很大。汉语的主要语序是“主谓宾”,日语的主要语序是“主宾谓”。另外,汉语的否定成分与情态动词一般都在动词的前面,而日语是在后面。程序编写者要充分认识到两种语言的语序差异,深入研究相关语言对比的知识,并用程序语言精确地表达出来。
(三)尽量消除漏译与增译
漏译与增译的错误较为突出,这两种情况都会改变原有成分数量,使语义发生较大改变。应改进程序算法,杜绝这种低级错误。
(四)提升智能性,提高运用语境知识的能力
翻译软件翻译时经常只关注局部而忽略了与之相关的其他部分,“只见树木,不见森林”。翻译软件应提高“记忆力”,建立记忆库,使之能够存储语句的上下文以及语法知识,甚至各种文化知识、百科知识、时事知识。当有需要时,便能调动知识库进行一些简单的推理,排除不合理的翻译可能项,确定最适合语境的翻译。这样,很多搭配不当、义项选择不当的错误就都能避免。
(五)日汉翻译软件与人工翻译有机结合
当今日汉翻译软件的翻译质量与之前相比已有了长足的进步,但不可否认,日汉翻译软件与专业翻译人员的翻译质量仍然差距巨大。尤其是在文学翻译领域,由于缺乏人类的感情,没有人类细腻的推敲功夫,缺乏人类的“百科知识”与语言文化知识,机器翻译还难以涉足。此外,在法律文书、合同这些要求语言十分精确、语言错误会引起严重后果的领域,机器翻译的使用也要慎之又慎。机器翻译的优势在于“量”,在于其人类难以企及的速度,人类译员的优势在于“质”,要想又快又好地翻译,就要将两者有机结合起来,将两者的突出优势相结合,如安排人类译员对机器迅速翻译出来的初加工文本进行仔细审校再加工,从而实现优势互补。
五、结语
本文就日语专业大学生对日汉翻译软件的使用状况进行了问卷调查研究,并以“百度翻译”为工具,对特朗普就职演讲的日文版进行了汉译,逐句考察其错误并对错误类型进行归纳总结,在此基础上提出了一些改进日汉机器翻译质量的建议,希望能够为促进中文信息处理及中日文化交流略尽绵薄之力。
注释:
①陆俭明,沈阳.汉语和汉语研究十五讲[M].北京:北京大学出版
社,2004:452.
②杜金华,张萌,宗成庆,孙乐.中国机器翻译研究的机遇与挑
战——第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).
③http://mt.sohu.com/20170121/n479273966.shtml
参考文献:
[1]陆俭明,沈阳.汉语和汉语研究十五讲[M].北京:北京大学出版
社,2004.
[2]杜金华,张萌,宗成庆,孙乐.中国机器翻译研究的机遇与挑
战——第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).
[3]http://mt.sohu.com/20170121/n479273966.shtml
[4]沈阳.语言学常识十五讲[M].北京:北京大学出版社,2005.
[5]Daniel Jurafsky&James H.Martin.自然语言处理综论[M].冯志
伟,孙乐译.北京:电子工业出版社,2005.
[6]于根元.应用语言学概论[M].北京:商务印书馆,2003.
(孙泽方 山东曲阜 曲阜师范大学文学院 273165)