智能语音助手:叽叽喳喳的生活帮手
2017-10-13彼得·诺阿常成
彼得·诺阿++常成
在科技高速发展的时代,像“亚马逊echo”和“谷歌助手”这样的人工智能语音识别设备正在悄然改变着我们的生活方式。
所以,究竟什么是人工智能语音识别设备?是简单的你问我答吗?直到前几天我在开车时才有了亲身感受。为了方便大家理解,以下是我和它的对话:
我问它:“谁发明了比萨?”
智能手机回答我:“据说,1889年意大利国王翁贝托一世和女王玛格丽塔访问那不勒斯时,酒馆老板拉费勒·埃斯波西托为招待他们制作发明了比萨。”
“好吧,那是誰发明了夏威夷比萨?”
“夏威夷的比萨并不来自夏威夷,而是来自于查塔姆。现已退休的厨师山姆·潘诺普洛斯说,1962年,他在自己工作的‘卫星餐厅发明了这道菜。”
“可是为什么人们不喜欢它?”
“比萨是意大利的传统,而菠萝是夏威夷风味。大部分人觉得这两种东西不应该结合在一起,他们觉得甜酸口儿的菠萝不是比萨饼应该有的味道。”
简单的对话激起了我对于比萨起源的好奇心,我想到附近刚开了一家意大利餐馆,于是打算去尝尝。我点开我的谷歌助手,说了句:“你好,谷歌。”
很快,一个友好、磁性的女性声音就立即和我打招呼并且迅速而准确地回答了我的问题——因为刚才的对话让我很饿,所以我就问那家口碑很棒的比萨饼店在哪里。根据我的位置,谷歌语音助手就立马帮我规划好了道路甚至找到了附近的停车场。
几分钟后,我饱餐了一顿,一瞬间,自己的饥饿感和对高科技的求知欲同时被满足了。
抛开比萨饼是否可口不谈,谷歌助手以及与之类似的语音助手正迅速成为技术领域的重大变革,这并非空穴来风。这些人工智能语音助手——包括亚马逊的Alexa、微软的Cortana和苹果的Siri——都在给我们提供各种各样的即时讯息,同时他们可以在必要的时候真正帮助我们。
最近,全世界的智能手机正在被一条广告疯狂刷屏,好莱坞明星“巨石强森”亲身示范Siri的正确打开方式,令“苹果”的狂热粉丝们为它的强大功能而倾倒。语音助手能够管理我们的日程安排、订餐,了解我们的生活习惯,并预测我们可能想要的东西:比如,当我们准备出门工作,驾驶汽车时,它就会自动播放我们最喜欢的歌曲。
当然,这样的智能语音助手不止应用于智能手机,它呈发散之势,从烤面包机到咖啡机、从衣服到汽车,只有你不敢想的,没有它做不到的。
在今年的拉斯维加斯消费电子展上,亚马逊语音智能语音识别系统Alexa大放异彩。Alexa和亚马逊的echo工作原理一样,它们在灯具、扬声器、吸尘器、汽车甚至冰箱中都有应用。
但是,智能语音助手给我们的生活带来的改变,远远不止于把这些冷冰冰、无生命的物体带到生活中来;它们要做的,将是改变我们使用技术的方式和方法,更重要的是使用它的人。“仍然有很多人不知道如何与科技互动,”滑铁卢大学视觉与图像处理研究小组的主任亚历山大·王说道,“当你把技术应用到可以用语言进行交流的时候,几乎任何人都可以在任何时候使用它。”
虽然语音助手的基础技术已经发展了几十年,但是,直到2011年,它第一次在苹果的iPhone 4S上应用后才引起了世界的轰动。Siri不仅“听力”超凡,还用幽默感征服了她的用户。事实证明,Siri的编程中用到了很多幽默的词汇。
不过,当最初的新鲜感逐渐消退,Siri却因为经常出错而变得更加出名,比如她难以分辨“再见”和“迪拜”等发音相近的词。然而,苹果的竞争对手却注意到了这一点。2014年,微软发布的Windows Cortana,亚马逊发布的Alexa都在市场上推动了语音识别设备的发展。不同技术的融合,让人工智能语音助手们最终变得成熟。
语音助手AI有4个基本组成部分:语音识别(理解正在说的内容)、处理能力(用于处理大量的信息)、快速网络连接(在云计算和设备之间来回传输数据)和自然回放(因此听起来不像是机器人播报那样机械)。
驱动助手的编程算法也需要大量的数据。他们拥有的越多,使用者能得到的信息也就越多。例如,听一首歌,一个人工智能助手不知道你是否喜欢它。但是,播放几十次,人工智能助手就能够合理地识别出它是你最喜欢的东西之一,几乎所有智能助手的工作原理都基本相同。
消费者似乎对这样的语音设备很感兴趣,echo扬声器已经成为亚马逊的热门品牌。虽然在线零售商没有透露销售数据,但亚马逊已将其列为网站最受欢迎的商品之一。外部估计显示,在Alexa进入其他家用电器和汽车领域之前,仅在美国,就有多达1400万的echo用户。
与此同时,谷歌多年来一直在尝试不同的语音人工智能应用程序,直到去年秋天才最终在谷歌助手上确定下来。这名助手在其Pixel手机和谷歌家庭扬声器中应用,因为它的准确性广受好评,被认为是Alexa最强大的竞争对手。
去年秋天,三星拒绝坐以待毙,收购了Siri的创始人Viv,这是一家位于加州圣何塞的初创公司。这家电子巨头计划将Viv纳入其众多产品中,推广到包括手机、电视和洗衣机等众多领域内。
数据分析公司Gartner的数据显示,全球语音人工智能市场预计将以43%的复合年增长率增长,到2020年将达到21亿美元。到那时,全球3.3%的家庭将至少拥有一个智能语音助手,而其中四分之一的家庭将拥有不止一个。全球市场洞察公司的一份报告显示,到2024年,人工智能语音助手的市场价值将达到110亿美元。
根据Gartner公司的说法,下一个语音设备的前沿领域将是汽车。福特、大众、沃尔沃、现代、菲亚特、克莱斯勒、日产和宝马都是合作制造商,他们宣布计划将Alexa、谷歌助手加入到他们的汽车内。Siri也是苹果CarPlay的核心部分,它在许多新车型中已经得到应用。endprint
用语音助手控制汽车仪表盘在以前是难以想象的。从GPS导航到调整座位温度和播放爱听的音乐,很多用户认为语音命令能减少发生交通事故的几率。
同样的情况也适用于近年来出现的从家用电器到可穿戴设备等各种联网产品中。这类产品通常需要一个应用中介,比如手机或平板电脑应用程序来管理设置或收集结果。在不久的将来,语音助手们都可以解决人们对这些应用的需求。
斯科特·霍夫曼是谷歌助理工程师兼副总裁,他说起自己调整客厅灯光颜色的经历:“如果我想在晚餐时把灯光颜色变成蓝色,就得拿出遥控器,一个一个的调整……这很痛苦,所以我不打算这么做,我想知道,语音助手的出现是否会帮助我简化它。”
然而,这项技术的实现从目前来看仍是困难重重。与所有大数据应用程序一样,语音助手在某些情况下需要不断地更新信息、高度个人化,这些信息可以被国家安全部门或黑客利用,而一些用户认为语音识别设备总是在监听他们的激活短语并且备份,这增加了他们被窃听的风险。
为了强调这一点,FBI最近要求亚马逊在一个谋杀案中提供echo语音记录。在嫌疑人允许公布这一数据后,亚马逊公司将数据转交给了相关安保部门。
可以理解的是,Gartner公司最近的一项研究显示,有三分之二的消费者表示,他们担心自己的家用設备会被监听。
所以,该技术会涉及互相信任的问题,这意味着制造商必须清楚地了解用户数据是如何收集、存储和使用的。“我们希望当我们说到智能助手时,大家聊的是它给我们带来的便利,而不是我们的隐私正在被侵犯,”来自多伦多大学公民实验室的研究员克里斯托弗·帕森斯说,“为了打消公民的顾虑,这些公司需要更加透明化。”
滑铁卢大学的研究团队正在设计一种新的解决方案。他们的设想主要围绕如何“运用”人工智能系统,或者是智能语音助手,研究方向主要集中在设备本身。这种设计定位将限制公司在互联网上发送大量个人用户数据,而且在必要时,这些数据可以被拦截。他们说:“我们正试图利用这些回路复杂的大脑,并将它们填满,这将有助于减少部分风险。”
人工智能专家表示,这一想法是有价值的,但同时也指出,在与互联网连接时,人工智能助手能更好地发挥作用。在互联网上,他们可以实时地利用、处理庞杂的数据资源。
与此同时,谷歌公司的霍夫曼也承认,公司可能会做更多的宣传来教育公众如何保护自己的隐私。例如,谷歌助手允许用户查看他们的使用日志,并在必要时删除它们。但是由于这个选项是新增的,很多用户都还没有使用它。霍夫曼说:“我们必须尊重每一个用户对于自己信息的所有权。”
有了适当的保护措施,人工智能语音助手有潜力进一步扩大获取信息和工具的途径,特别是对于那些缺乏技术经验的老人或者残疾人来说。霍夫曼说:“与安装应用程序或学习如何使用电脑完全不同,这是非常强大的功能,希望它能造福所有人,这才是我们关注的重点!”endprint