谷歌同传耳机,依旧是噱头
2018-03-12智信
智信
近日,谷歌(Google)推出了智能耳机Pixel Buds,其最大亮点是支持谷歌实时翻译。
目前,Pixel Buds支持40种语言的实时翻译,优先用于难度系数高的中英翻译。这个功能听上去强大,但我认为,谷歌多年来在翻译服务方面,没有太大变化,这次虽有更新,却不会掀起新一轮的技术革命,看起来更像是一场商业炒作。
说到更新,Pixel Buds的最大亮点,是整合了机器翻译和语音识别。
近年来,很多专家预测,人工智能将是继互联网浪潮之后的下一个增长点。人工智能是计算机科学的分支,有望了解智能的实质,生产出新的、能以人类智能相似的方式做出反应的智能机器。人工智能还有语言识别、图像识别、自然语言处理和专家系统等领域。
这一次,Pixel Buds引入了语音识别。机器翻译和语音识别,在技術层面上是不同的,但都会用到“深度学习”的基本技术:自然语言处理。目前,世界上最先进的翻译系统方法,并不是基于语义理解的翻译系统,而是基于大数据机器学习的翻译系统,它包括三大类:基于规则(rule-based)、基于统计(statistical-based)和混合。Pixel Buds属于基于统计,即通过用户直接搜索的翻译结果、对网页内容的抓取翻译等渠道,获取大量的语料资源,用于深度学习,逐渐获得明白两种语言如何匹配的能力。
但是,要让机器自如地翻译并不容易。以往翻译软件在翻译中文的名言警句、诗句时,都闹出了令人啼笑皆非的译法。对此,人们并不理解,反而感叹:谷歌这么厉害的公司,连个机翻都搞不好吗?从原理上来说,一个词有N个意思,一句话又有N个词组成,N个句子又组成一段话,每个组合的意思都不一样。最关键的是,同一个句子,在不同的语境、用不同的语气,说出来的意思也不一样。目前,机器只能根据储备的词汇、语句、固定短语、句子的意思,做固定模式的转换和组合。即使把两种语言所有的词汇、语句,都能储存到一个软件里,从人工智能的角度看,要让机器人完全掌握人类的语言,还存在很多无法企及的技术难点。归根到底,机器并不能够懂得人类语言的具体意思,即便是最先进的机器学习模型,其本质还是基于大数据的统计规律。
前些天,有新闻报道:谷歌AlphaGo Zero能完全通过自学习提高棋艺,但围棋的规则是确定、有限的,这跟天天都有新词、新的说话方式产生的语言来说,难度不在一个层面。
另外不要忘记,谷歌可是炒作的资深玩家。
早在2012年,在微软亚洲研究院二十一世纪计算机大会上,微软高级副总裁Richard Rashid就演示了微软英译汉的同声传译系统。该演示受到广泛关注,在YouTube网站上已经有超过一百万次的播放。如今,谷歌又高调宣传具有同声传译功能的智能耳机Pixel Buds。我们无法从技术细节以及用户量上,简单对比这两个系统的优劣,但从技术发展和产品问世的角度出发,Pixel Buds肯定不是第一代产品。
技术是积累迭代式发展的,不可能从原始社会一下跃入现代社会。谷歌Pixel Buds确有亮点,但距离技术成熟还需要时间。
责任编辑:曹晓晨