人工智能领域新突
2015-08-03程彦博
程彦博
近日,百度发布了融合统计和深度学习方法的在线翻译系统,宣称在机器翻译技术上取得了重大突破。百度称,该系统借助计算机模拟的海量神经元,模仿人脑“理解语言、生成译文”,同时结合百度已有的统计机器翻译技术,使得机器翻译质量实现了“质的飞跃”。
机器翻译一直被公认为是人工智能领域最难的课题之一。让机器理解语言,进而实现不同语言之间的翻译,不仅仅是该领域的科学家们孜孜追求的技术梦想,也寄托着普罗大众对自由沟通交流的美好愿望。
机器翻译技术的发展一直与计算机技术的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。
此次百度发布的基于深度学习的在线翻译系统,实现了类似人脑的“理解语言、生成译文”的翻译方式。这种翻译方法最大的优势在于译文更加流畅,更加符合语法规范,让人更加容易理解。相比之前的翻译技术,质量有“跃进式”的提升。
百度称,基于深度学习的翻译系统的核心,是一个拥有无数结点(神经元)的深度神经网络。一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。有趣的是,这个庞大的系统在刚刚构建完成之后像刚出生的婴儿一样,不懂任何事情。它通过学习大量双语互译对照的句子,逐渐提升翻译水平。百度利用自身得天独厚的庞大网页库资源,挖掘了海量的双语句对,作为系统的“学习教材”。由于深度神经网络结构极其复杂,整个学习过程非常耗时,需要持续很长时间。百度机器翻译团队经过技术攻坚,使得翻译系统的学习效率提高了十几倍,大大缩短了学习时间。“教材”的数量如果按照字数换算成《大英百科全书》,翻译系统在一周内学习的内容相当于千万部《大英百科全书》。
此外,该翻译系统还应用了长短时记忆(LSTM,Long Short-Term Memory)的循环神经网络(RNN,Recurrent Neural Network)模型。该模型擅长对自然语言建模,把任意长度的句子转化为特定维度的浮点数向量,同时“记住”句子中比较重要的单词,让“记忆”保存比较长的时间。该模型很好地解决了自然语言句子向量化的难题,对利用计算机来处理自然语言来说具有非常重要的意义,使得计算机对语言的处理不再停留在简单的字面匹配层面,而是进一步深入到语义理解的层面。百度自然语言处理部致力于自然语言处理技术的创新探索,对深度学习模型的应用研究走在了该领域的前沿。目前,该技术不仅在百度在线翻译系统中取得成功,大幅提升了译文质量,还在篇章理解、语义计算、深度问答等多个重要方向取得了突破性进展。
其实,百度一直在机器翻译领域深耕细作,希望通过技术创新不断提升翻译质量和系统性能,并致力于大规模互联网应用,为广大用户提供高质量、方便快捷的翻译服务。依托海量的互联网资源和自然语言处理技术的优势,百度研发出高质量翻译知识获取技术,突破了传统方法在翻译知识获取方面规模小、成本高的瓶颈;基于互联网大数据的多策略翻译模型,能够实时响应用户复杂多样的包括网络新词、科技文献、电子商务、古文、粤语等多领域、多文体的翻译需求;基于枢轴语言的翻译方法,使得资源有限的小语种翻译成为可能。百度在机器翻译核心技术上的创新和突破,不仅使普通用户受益,享受到方便快捷、高质量的互联网翻译服务,也得到了学术界的认可。由百度牵头,联合国内顶尖学术机构中科院自动化所、浙江大学、哈尔滨工业大学、中科院计算所、清华大学共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目获得了中国电子学会科技进步一等奖。
技术的创新要以喜闻乐见的形式普惠到每一个有需求的用户,这是互联网的精髓。百度机器翻译团队一直秉承让所有人平等便捷地获取信息、找到所求的使命,致力于消除用户跨语言沟通交流的障碍。结合百度领先的图像识别、语音识别等技术,“百度翻译”APP为用户打造了一个全方位的随身翻译官。这位“翻译官”不仅可以帮助用户实时地与外国人进行面对面交流,根据用户所处场景,智能推送实用口语例句,还可以通过摄像头拍照对菜单、车站站牌等进行翻译,解决用户在海外学习和旅行时的语言难题。
百度发布基于深度学习的在线翻译系统,让我们看到解决机器翻译这一人工智能经典难题的希望。也许不久的将来,世界各地的人们都能够自由交流,在全球范围内获取资讯和服务。即使使用不同的语言,人们也可以交流想法和观念,传承思想和文化。毕竟,语言是保存和传递人类文明成果最重要的工具之一。