即时翻译器能够成就一段恋爱吗？

2016-07-09斯宾塞·麦斯泰尔小月遥

海外文摘 2016年7期

斯宾塞·麦斯泰尔++小月遥

乔希注视着窗外的群山，望得出神了，手边的茶慢慢凉了下来。群山近在咫尺，威严而壮丽。他手中捧着他最爱的小说，书里曾无数次地描述过这美景。咖啡馆里熙熙攘攘，人们畅快地谈论着天南海北的奇闻异事。乔希独自坐着，但他并不孤单。当他的目光回到身前的时候，他发现自己的面前坐着一个人，用他听不懂的语言，对他讲话。乔希戴上了一对小耳机。耳机把那陌生的语言转换成了他熟悉的语言，乔希捕捉到了最后一句话：“……我最喜欢的小说。”

“这本吗？”乔希举起了手中的书，问道。

“对呀。”

“这也是我的最爱，”乔希说，“这是译文版，不过，这本小说我至少读过12遍了。”

乔希的新朋友笑道：“是哪个版本的译文？谷歌版的还是亚马逊版的？”

科技乐观主义者认为，总有一天，人类能够借助翻译器，去阅读任何书籍，无论这本书的原语言多么晦涩难懂。一直以来这都是人工智能工程师的奋斗目标之一。翻译工作是电脑不能用数字技术解决的最古老的难题之一。1954年，乔治敦大学和IBM公司共同推出了第一款翻译器。这款翻译器能够把俄语翻译成英语，可以应对十分复杂的句子。它总共能够识别60个句子，遵循6种语法规则，内部储存了250个词汇。设计者对公众表示，机器翻译的技术难题，将在未来3到5年得以解决。

有无数人在这个领域进行着不懈的探索，2001年，谷歌重新投身于这个领域，并且很快就超过了其他竞争者。一开始，谷歌只能做6种语言之间的翻译（英语、葡萄牙语、德语、意大利语、西班牙语和法语），它不断改进自己的算法、翻译质量和翻译速度。到2005年，谷歌的翻译器已经能够支持8种语言了。它在一场翻译比赛中，用1000台电脑，在40个小时之内翻译1000个句子。而今，2016年，谷歌网站能够在几秒钟内，完成对103种语言的翻译。每个月，都有超过5亿人次使用翻译器。其中超过92%的用户不在美国。让机器翻译能够与具体的语境相结合，是所有程序员共同努力的方向，有的人甚至声称，机器翻译已经解决了这个问题。

上周，纽约市韦弗利实验室发布了他们的最新成果派乐（pilot）。这是一副售价299美元的耳机，预计在2017年发售。这项设备预计能够对4种语言进行接近于同声传译水平的翻译。这个设备受到了视频“当他与一位法国女孩相遇”的启发。项目的创始人安德鲁·奥乔亚说，派乐能够让“人与人之间摆脱语言的障碍，让生命信马由缰”。在发布会之后，《福布斯》杂志采访了韦弗利实验室，仔细询问了这个翻译设备的真实性。但是他们却忽略了这个项目背后一个更加重要的假设：抛开资金问题不谈，这项设备能够帮助人们与外国人相恋吗？

乔希无意结识任何人，但这实在是一场美丽的偶遇。乔希正打算告诉他的新朋友，这本书是他在一次交通事故双腿受伤之后，他妈妈送给他的，这本小说陪伴了他10多年。服务员开始给他续茶。当服务员说话的时候，他发现，她说话的节奏与周围的人不同。然后，翻译器里就开始发声了：“你从哪来？”这个问题真是一个和陌生人开始聊天的万能句式。

电脑（比如IBM的设备）曾经运用和人类一样的模式学习语言：把一门语言中纷繁复杂的语法、例外用法、例外的例外用法进行内化。语法太复杂了，电脑程序可能要掌握超过一百万种指令。翻译结果经常显得非常笨重粗糙。1949年，科学家沃伦·韦弗提出了一种新的理念，它可以取代基于语法的翻译技术，这种技术被称作基于统计模型的机器翻译技术（SMT）。该技术并不会逐点进行翻译，韦弗提出了一种双管齐下的方法：首先，电脑会检索上百万份文档，用统计法找出具有典型性的语言模式，并由此记忆其中的语法、句法和遣词的规则。与此同时，程序会创建一个模型，来预测特定的短语将出现在句子中的什么位置，如何进行翻译。比如，一台电脑在数十亿次的重复之后，能够预测到，在德语中，动词一般出现在句子的末尾。

韦弗利实验室还没有公布他们软件的细节，但是，谷歌的翻译软件很可能也采用了同样的技术方法，谷歌用这种预测机制来提供统计学上最接近真实的翻译，这很可能是迄今为止最好的翻译方法。但是人们运用语言的环境多种多样，翻译软件也必须对具体的语境（也就是“域”）进行识别。比如，当一位客人正在买吉他的时候，翻译器就知道应该把“neck”翻译成“琴颈”。但是，为了实现统计上的典型性，一个“域”必须非常大，至少有200万个词。因此，这方面的翻译训练材料都来自如联合国这样的大型组织。这些组织拥有大量的已经被人工翻译的材料，即便如此，这种算法还是有其自身的局限性。

很多人即使阅读了5万份由英语翻译成罗马尼亚语的欧盟议会报告，也学不会罗马尼亚语；但是他们却能够轻而易举地看懂那些YouTube评论区里或是Facebook上的网络语言，这些网络语言就像垃圾场一样，充满了语法错误、词汇滥用或纯标点符号组成的表情。但是一台电脑遇到了哪怕一点程序之外的语法规则，都无法识别。

从结果上看，基于统计模型的机器翻译技术极大地提高了机器翻译的流畅度。但是它还无法应对俚语或者方言。这个问题只是一个技术层面的问题；理论上来讲，更大的数据库，更快的运算速度和更先进的算法最终能解决这个问题（就像办公软件里面的自动纠错功能一样）。其实，机器翻译技术所面临的真正难题，并不是技术层面的，难题来自于语言本身。

乔希告诉服务员，她的声音特别好听，然后又点了一份曲奇。他的新朋友也不介意服务员打断他们的谈话，但是乔希手里全是汗。他用餐巾擦了擦，不知道怎么样才能把话题带回那本小说上来。他口吃了半天，然后直接问出了头脑里出现的第一个问题：“你最近怎么样？”

愉快的气氛是如此的平常，人们经常忽视这种气氛的复杂性。从语言学上来看，这被称之为交际语言，意思是一种表达不光传递了一份信息，更达成了一种社交目的。比如，当别人问你“最近怎么样”的时候，多数人会觉得别人只是发出一份关心，并不是真的想打听你最近都经历了什么。只要数据库够大，机器就能识别“最近怎么样”这个句式，并进行与之相关的联想。但是交际语言，就像所有的常用语言一样，非常不稳定。如果乔希生在了乔叟的那个时代（14世纪），他可能会说：“贵客，欢迎来此”；在莎士比亚的年代（16-17世纪），他可能会说：“天赐良日，天公作美啊。”（那个时候“hello”用来表示惊奇、意外。）

因特网是一个巨大又复杂的语言环境，这个环境使得语言翻译也不停地变化。1986年，美国和英国英语最大的语言数据库伯明翰语料库里包含了2000万个词汇。到了今天，数据库中的牛津字典分区里就有25亿个词汇了，这些词汇中有很多都来自于爱尔兰、澳大利亚、新西兰、加勒比、加拿大、印度、新加坡和南非。更何况，现在的词典编撰者还要去了解博客、电子邮件、社交软件、电视节目剧本、留言板等很多媒体。对于那些用户自己可以进行编辑的网站，新词汇的数量更是呈爆炸式的增长。

语言的自我演变进行得十分迅速。比如“Netflix and Chill”（字面意思是“看个电视剧放松一下”，实则带有一定程度的性暗示）这个词，如果这个词在下一季《欢乐再满屋（Huller House）》结束后仍在流行，那么它的含义很可能已经随着观众兴趣的改变而改变了。矛盾的是，基于统计模型的机器翻译技术的特征，是静态的、保守的、被动的。数据库中那些已经过时的表达，会阻碍翻译算法去适应语言的演变。如果想要让翻译程序实时适应语言的演变，那就必须让程序能够准确地接触所有的书面、口头表达，这个过程中翻译程序很可能识别不了某些语言的自我演变。

过了一会儿，咖啡馆里就只剩下乔希他们俩了。他们两个人的人生经历特别相似。他们都有一个亲哥哥，小的时候都有成为艺术家的梦想，每早都起来跑步（而且都睡过头过）。这场对话轻松自然，没有尴尬，也没有冷场。乔希甚至都没空吃曲奇。乔希的目光多次掠过曲奇饼，然后乔希的朋友就说：“咱们一起吃吧。”

英语里，很多表示肯定的表达中，深藏了各式各样的潜台词。比如，乔希可以斩钉截铁地回复一句：“好！（yes）”但是，出于讨论的需要，我们假设乔希已经饿得前胸贴后背了，咖啡厅的厨师又刚好下班了，他特别想一个人把曲奇全吃了。所以，他很可能说“好吧（fine）”。“好”和“好吧”字面上都表示赞同和许可。但是后者包含着勉强，不舒服的情绪。“好吧”是小孩子被父母喊去下楼丢垃圾时，既表示遵从又表示不情愿时会使用的词。就像交际语言一样，“好吧”真正所要表达的东西，不是字面上的意义，而在于它所暗示的情感。

15分钟之后，这场聊天已经进行得十分顺利了，乔希想要有更进一步的表示，但是他忍住了，就像所有人第一次约会一样，乔希觉得现在的气氛有些暧昧。

如果乔希的约会对象说的是日语，乔希必须小心翼翼地应对。一般来说，日本人觉得，你一声不响地听别人讲话，不太礼貌，你应该经常说“是嘛、啊、没错”等予以回应。这些表达，在英语环境下，会让人觉得聆听者对这个话题十分感兴趣；但是在日语环境下则并非如此，聆听者予以回应完全是出于礼貌。日本人几乎从来不直接拒绝别人。如果乔希与他的新朋友吃完了饭，邀请他一起回家，那乔希很可能得到一个模棱两可的回答：“可以是可以，只不过……”任何一个日本人都会立刻发现这其实就是拒绝，但是天真的乔希听不出这弦外之音。

但是，在辨别亲密关系的时候，日语是一门绝佳的语言。基于谈话双方的社会地位和亲密关系，他们的动词和名词有完全不同的4种修辞方式。如果和乔希约会的姑娘讲话时完全不使用敬语，谈吐特别随意，那么这就是一种强烈的暗示：她对乔希很感兴趣。

如果乔希在波哥大，他的约会对象很可能会用“您”（usted）来称呼他。相比于“你”（tú），这是一个比较正式的第二人称称呼。如果对方把“您”改成了“你”，显然这暗示着两人的关系变亲密了。但是英语中的第二人称称呼只有“你（you）”，翻译器应该如何传达出这种情感上的差别？这类难题，即使是人工翻译，也很难解决。对于乔希的翻译器来说，就更难了。计算机依据统计数据来进行翻译，而不是依据对词语或者人们行为的准确理解来进行翻译，计算机没办法判断亲密关系。没有任何的统计模型能够对两人关系的亲密程度进行量化、比较。不过我们还是要恭喜乔希，他迈出了拉近关系的第一步。

当两人准备起身离开的时候，乔希坦率地说，他之前和他的伴侣一起生活了5年，最近一段时间才分手。不幸的是，对于“伴侣”这个词的真正含义，翻译器没法准确掌握。

性别，就像礼貌用语一样，在不同的语言中，表达方式多种多样。例如在阿拉伯语中，可以轻易地从名词、动词、形容词中分辨出性别。在英语中，词语的性别特征则不那么明显。在英语文章中作者完全可以不露痕迹地掩盖一个人的性别，就像这篇文章，只看乔希和新朋友之间对话，读者无法判断乔希的约会对象是男是女。英语的“伴侣”（partner）一词，既可以指代异性情侣，也可以指代同性情侣。

多数情况下，一个人想要了解另一个人，会更加关注他说话的方式，他的弦外之音，而不是他说话的具体内容。有意无意地，在一场对话里面，聆听者总会捕捉到各种各样的来自语言之外的信息。即使是说话的口音，也能传递很多，比如人们一听到伦敦口音，就会觉得这个人多半很刻板、保守。对于乔希自己来说，想要讲清楚英语中几个同义词的具体差别就特别困难，更不用说翻译器了。这种来自语义上的小差异，在表达中会引起特别不一样的效果。就好比一副近视眼镜，度数上差一点点，普通人可能觉得无伤大雅，但对使用者来说，整个世界都会变模糊。

抛开这些繁琐的语言学理论不谈。乔希现在和他男朋友回到了小旅馆。他的新男朋友有点紧张，耸着双肩，无所适从。“呃……”他说，“你最近怎么样？（how are you）”乔希的男朋友把乔希刚见面时的窘态模仿得活灵活现，两个人都笑了，一起倒在床上。乔希深深地吸了一口气说：“我们再也不离开这个大鼻子小厨师（nosey little cook）了。”然后他发现自己口误了，他其实想说“可爱的小家（cozy little nook）”，但是两个人又被逗得前仰后合。

乔希刚刚犯了一个首音误置的错误。他把第一个词的元音字母和第三个词的元音字母互换了。乔希的口误是无心之举，但是人们经常会精心设计这类文字游戏来取乐。这也是人和电脑之间的一个重大差别。电脑可以完成庞大复杂的运算，但是却没有办法理解这种脱离语法规则的语言游戏。就像上文提到的，机器翻译的难点，并不在于对单个词汇的翻译，任何一个单独的词，无论多难，都能翻译。比如葡萄牙语中的一个词“绍达蒂思（saudades）”，在英语中，找不到任何一个词能跟它完美匹配，但是我可以用英语去解释它：这是一种相思病，对某人某物思念得无可救药。翻译的真正难点在于，当人们使用某个词的时候，他们的意图是不稳定的、多样的、模棱两可的，甚至是具有欺骗性的。

除开这些种种的不足，谷歌翻译和他的同行所提供的机器翻译技术，已经在效率上和经济上超过人工翻译了。正如某次会议上，一位谷歌翻译的程序工程师所指出的那样：当你想快速浏览某些文件，或者查看某些评论（比如说餐馆评论）的时候，你不在乎语法错误。这时候，机器翻译就是你的一个完美选择。从商业的角度上来说，当翻译内容特别客观，可以排除人的主观干涉的时候，比如说，当北美红十字会想要得知墨西哥城所有医院的医疗用品库存总计的时候，机器翻译就大有用武之地了。

就算韦弗利的新产品“派乐”翻译出来的内容生涩难懂，对于学生、游客、移民和难民来说，它已经可以帮上大忙了。它能够帮助人们与社会有更加实质性的接触，甚至可以让人们相爱。但是，它什么时候才能做到像它承诺的那样，让“人与人之间可以摆脱语言的障碍，生命信马由缰”？

当乔希到达机场，必须与他的男朋友分离的时候，他一直在抽泣，不停地说自己回家收拾好了东西，就会马上飞回来，回去之后，天天都要保持电话联系。等乔希回家之后，才发现，他们俩的作息时间差别太大了。开始还天天通话，后来就只有周末通话，再后来，只是每周通话一次。最后他们甚至只用电子邮件联系了。6个月之后，当乔希回忆起这段感情的时候，他觉得自己所迷恋的，可能并不是那个人，而是那份异国恋爱的体验。

把语言当作是一组统计学意义上的语法集合，是非常不切实际的观点。人们之间的谈话是如此的复杂，它凌驾于最精致的计算机算法之上。电脑所作的翻译，深深地依赖着数据库，没有真情实感，太过纠结于单个的字符串。语言不是一种单纯的工具，也不是一种公式，它像小兔子一样机灵狡黠，让人捉摸不透。

[译自美国《大西洋》月刊]