Meta计划推出全球通用语音翻译软件,并开源相关技术代码及文档
2022-04-29
近日,Meta公布了一个人工智能领域的全新研究项目,即希望做出能适用于全球所有用户的语音翻译软件。该公司认为,人工智能可以为其元宇宙计划带来广泛的好处。
Meta的首席执行官马克·扎克伯格称,“能够用任何语言与任何人交流是人类永远的梦想,人工智能将在我们的有生之年实现这一点。”
现在,市面上出现的翻译软件已满足了英语、中文和西班牙语等国际常用语言的需求,但还有许多小众语言被排除在外。有数十亿人无法通过母语与外部世界沟通,也不能自由访问互联网上的许多信息。
原因在于,虽然机器翻译系统正不断进步,但它们始终依赖于包含大量文本数据的训练语库。对于鲜少被使用到的小众语言来说,机器翻译系统很难获得训练所需且易于访问的书面文本语库,甚至得不到标准化的书写规则。
Meta表示,“我们希望通过在两个特定项目中部署新的机器学习技术来改善这种情况。”这两个特定项目,一个是“不让语言掉队”,Meta将致力于建立依靠少量训练示例就可完成语言翻译工作的人工智能模型;另一个是通用语音翻译器项目,该公司希望开发出无需经过书面文本就能实时翻译语音的系统。
目前,Meta尚未表露进行这两个项目的具体时间。不过,他们指出了通用语言翻译的理想化情况。
他们表示,“消除语言障碍将是深远的,会使数10亿人能够以他们的母语或首选语言在线访问信息。机器翻译系统的进步不仅会帮助那些不会说当今互联网上占主导地位语言的人,还将从根本上改变世界上人们联系和分享想法的方式。”
Meta认为,通用翻译技术将惠及该公司遍布全球的产品,不仅会使产品覆盖得更广,还将推动这些产品成为数百万人不可或缺的通信工具。
此外,该公司指出,“通用翻译软件将成为未来可穿戴设备中的杀手级应用,并将突破VR、AR技术的界限。”
例如,不同母语的人们可以运用智能手机、手表及眼镜等设备进行实时交互,全球所有人都可以用他们的母语访问互联网上的多媒体内容,人们可以与在任何地方的任何人一起参与读书俱乐部或者合作开展工作项目。
这样看来,推出通用语音翻译软件既富有人道主义精神,又能够为Meta等公司带来良好的商业效益。
Meta称,“要为世界各地的每个人提供真正通用的语音翻译工具,还需要做更多的工作。但我们认为,现在的努力是向前迈出的重要一步。”
未来,Meta还将对外公开其技术细节并开源所使用的源代码和文档,这意味着其他有能力的技术人员可以在他们的工作基础上开展进一步研究。
需要注意的是,虽然机器翻译的速度和准确性随机器学习的进步得到一定提升,但机器翻译的底层技术仍存在一定问题。
有人指出,当前的机器翻译忽略了人类在说话时微小但关键的地方,并输出了有性别偏见的表述,还会出现一些只有计算机才能做出的意想不到的错误。
此外,有一些使用小众语言的人表示,如果語言翻译能力掌握在科技巨头手中,那么他们可能会失去对其母语和文化的控制。
对于拥有脸书和Instagram等大型社交平台的Meta来说,其更需要认真看待这些问题。
一直以来,Meta希望将其产品服务扩展至全球市场,但目前他们的产品仍只覆盖到部分国家和地区。根据该公司的官方文件,其正在努力减少语言翻译中所出现的仇恨言论及滥用行为,这些言论或行为都可能产生令人难以置信的可怕后果。
2017年,有一名用户在脸书上发布了一条内容帖子,随后被警方误抓。真实情况是这名男子输入了阿拉伯语的“早安”,而脸书平台却将内容翻译为希伯来语的“攻击他们”和英语的“伤害他们”。直到今天,涉及可疑翻译的类似案件仍大量堆积在Meta的监督委员会。
因此,除技术上的突破外,Meta还需做到公平公正地运用通用语音翻译软件的研究成果。(综合整理报道)(编辑/小文)