语言是打开文化的一扇窗
2017-11-16马迪
马迪
最近,谷歌推出了一款名为Pixel Buds的蓝牙无线耳机,除了无线、智能等卖点之外,它还有一个让人吃惊的功能:实时翻译。谷歌在简介中表示:“Pixel Buds可以听到用户的声音,然后通过扬声器用另一种语言播放出来;而当另一个人说话的时候,你会从耳机里听到翻译出的语音。”
戴上一個耳机,就能听得懂、说得出世界上现存的大多数语言?究竟是怎么做到的呢?其实这副耳机的背后,是强大的谷歌助手以及越来越强大、越来越智能的机器翻译。
古往今来,人类为了互相了解,一直依赖于少数拥有多语能力的人,翻译因此成为最古老的职业之一。但人工翻译效率低、难度大、成本高,能不能用机器代替人来做这份工作呢?
20世纪30年代初,法国科学家阿尔楚尼就提出了机器翻译的想法,但显然当时没有任何技术能支持这样的“天马行空”。当现代电子计算机诞生后,1954年,美国乔治敦大学在IBM公司协同下,成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化,这才拉开了机器翻译研究的序幕。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,且仅限于文字互译,更像是一个拙劣的“笔译员”。
自2011年开始,伴随着语音识别、机器翻译、深度神经网络等技术的快速发展和全球化的需求,机器翻译再次变得炙手可热—这次可不只是笔译了,而是直接升级成了可以识别语音的“高级口译员”。比如谷歌于2011年1月正式在其Android系统上推出了升级版的机器翻译服务,微软的Skype于2014年 12月宣布推出实时机器翻译,都可以实现简单的语音实时翻译。
想要“译的准”,首先要能“听得清”,也就是要求机器能够准确接收说话者的语音,并能理解停顿和断句,以及根据“上下文”来理解一些模糊音。“听清”之后,还要包容口语的一些不标准特性,比如重复、多义、颠倒、冗余和残缺,以及方言、俚语、网络用语等非正式词汇。这些都需要机器有深度学习的能力。
2016年谷歌发布了GNMT神经机器翻译系统,这种技术在机器翻译领域无疑是革命性的。GNMT模仿人脑的神经思考模式,将整个输入句子视作翻译的基本单元,产出媲美人工翻译的高质量译文,在大大提升翻译效率的同时,还将误差降低了55%-85%。
谷歌公司己经将该技术应用于网页翻译与手机应用。作为谷歌翻译的忠实用户,笔者切身感受到这些年来机器翻译质量的明显提升—曾经那些令人啼笑皆非的错误几乎完全消失,虽然在长句子中译英时还会有一些错乱,但简单句常常通顺得令人惊讶。现在,谷歌翻译已经可以在超过100种语言之间进行互相翻译,难怪有翻译工作者感慨:“我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。”
机器翻译已出现了70年,但过去一年里涌现出的AI翻译软硬件产品,已超过最近30年的总和。2016年12 月,微软发布了世界上第一个万能翻译器,甚至可以实现多达100人之间实时翻译交谈。再说说我们都熟悉的腾讯、百度、阿里巴巴、科大讯飞等国内互联网公司,不但推出多款在线翻译和手机应用,甚至还创新性地推出了AR实时翻译、拍照翻译、实物翻译、涂抹翻译、文言文翻译等特色功能。
美国未来学家雷·库兹韦尔预言过:到2029年,机译的译文质量将达到人工翻译的水准。机器学习快、不会累,同时掌握上百种语言也不是问题,那么从事翻译行业的人会不会彻底失业呢?现在看来,担心失业这个问题还为时尚早。目前的机器翻译还处在“翻得不太准确,但基本能看懂”的水平上,也就是说,它们的角色更像是辅助,还不能取代真正的翻译。
笔者更倾向于相信,即使未来机器能够彻底理解语义,也做不到高水平翻译所讲究的“信、达、雅”。尤其是文学艺术翻译,情感、温度、节奏、韵致等等字里行间的妙处,机器是永远模仿或创造不出来的。
世界上最遥远的距离,不是天涯海角,是你站在我面前,我却不知道你在说什么。然而有了像Pixel Buds以及未来可以想象的更先进的产品,即使从来没学过任何一个外语单词的人,也能与全世界无障碍交流,那么人还需要学习外语吗?
答案见仁见智。如果你认为语言只是交流工具,那么有了机器翻译这个真正的工具,学不学自然无所谓;但事实上,语言是打开文化的一扇窗—你能呼吸不一样的空气的味道,看到不一样的阳光照射的角度,认识不一样的人和他们不一样的人生。学一种语言,丰富的是看世界的角度和自己的人生观。
所以,只要巴别塔一天没建成,人类还说着纷繁复杂的语言,外语的魅力就永远不会消失,学习外语的人也绝不会停止。endprint