智能语音助手抢占AI入口市场
2017-06-02孟晋
孟晋
人工智能正在成为新经济领域的核心技术,智能语音助手作为人工智能的最佳切入点,正在成为各大公司布局人工智能市场领域的关键。比如苹果的Siri,微软的Cortana、亚马逊的Echo以及谷歌的谷歌助理。虽然智能语音助手尚处发展期,但智能语音助手已开始逐步渗透入人们的生活之中。智能语音助手逐渐从被动变为主动,通过抢占AI入口市场,很多服务和商业行为都可以通过语音识别技术来实现智能化操作,特别是与物联网硬件的结合,能够为用户提供更加全面的服务。
从苹果的SIRI到星巴克的语音点单
提到智能语音助手,我们首先想到的应该是这项技术的先驱—苹果Siri 。自从苹果 2010 年收购 Siri 公司为苹果设备开发虚拟助理后,Siri就成为苹果手机的卖点之一。Siri的出现也是消费电子界第一次向市场科普性地介绍智能语音助手。
Siri可以支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。Siri可以令iPhone4S及以上手机(iPad 3以上平板)变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
在技术的不断追逐中,人们看到智能语音助手展现的巨大价值。虽然苹果的 Siri 自面世以來就成为了智能语音助手的代言人,但更多的公司希望用新的人工智能技术来超越现有的智能语音助手所覆盖的领域。
2014年,微软官方发布了 Cortana(小娜)这个类似 Siri 的个人语音助理平台。微软的小娜不仅可直接与微软搜索引擎必应相连,还能真正的充当个人助理。这意味着,它可以为主人做很多事情,比如安排会议、订购机票、设置闹铃,甚至能够讲笑话。
2014年3月,谷歌宣布Google Now语音服务正式登陆Windows和Mac桌面版Chrome浏览器。但是由于推广效果不佳,2016年初,谷歌又推出了基于人工智能技术的语音数字助理“谷歌助理”(Google Assistant)、家用智能硬件“谷歌家庭”(Google Home)以及智能短信和视频通信应用等最新产品。
从2015年起,国内也陆续出现了灵犀语音助手、百度语音助手、出门问问、欧拉蜜等多种应用。比如灵犀是由中国移动和科大讯飞联合推出的智能语音助手,既能为您语音打电话、发短信、查天气、设置提醒,又能帮你查话费、查流量、买彩票、订购彩铃,还可以陪你语音聊天
如今,越来越多的公司希望将将智能语音助手背后的自然语言解析技术运用到包括电子商务、娱乐行业等领域,使各个领域的客户能够创建自己的语音助手。
比如全球最大的语音识别公司Nuance针对企业市场也不断推陈出新。Nuance的虚拟客服助理Nina集成了语音识别、语音合成以及自然语言理解技术。很多品牌都采用了由Nina平台提供技术支持的虚拟助理,其中包括达美乐比萨的Dom、荷兰国际集团的INGE、捷星航空的Jess以及美国联合服务汽车协会网站和澳大利亚税务局(ATO)新推出的虚拟助理。
Nuance进入中国市场后在国内市场早已和HTC、华为、宏碁和上汽等知名公司在移动终端设备和汽车领域建立了良好的合作关系。在中国企业客户自助服务方面,中国移动江苏省在10086客服号使用了由Nuance及华为合作实施的自然语言导航应用,浦发银行信用卡中心也同样部署Nuance自然语言理解(NLU)以及来电导航技术(小浦随心听),为客户提供更加直观、拟人对话式的用户体验,成为了国内信用卡行业首家提供语音导航服务的银行。
2017年,咖啡连锁巨头星巴克在公司的移动应用My Starbucks里推出了一项新的语音助手功能,方便用户通过语音点单和支付。借助该功能,用户便可修改自己的订单,就像在现实世界中与真的咖啡师交流一样。
通过硬件抢占AI入口市场
智能语音助手真正的付费用户还是企业级用户,正如星巴克利用语音技术来点单一样。多以围绕着企业级用户群体,新的商业合作马上就如雨后春笋一般开始成长。
2016年Alphabet推出了能通过语音助理“声控”的Google Home。Google Home可以让你听音乐,处理很多的任务,只需要跟Google Home对话就可以了。在CES 2017展会上,Alphabet围绕Google Home发布了新消息,将虚拟助手放进了现代、克莱斯勒汽车;Alphabet还收购了Limes Audio,这家公司专门开发语音通信系统,未来Limes Audio的技术可能会植入Google Home、Hangouts及其它产品。
微软也与日产合作,将Cortana装进汽车。根据CES 2017上日产发布的概念视频来看,Cortana 现阶段的功能仅限于通过语音修改日程表、路线规划等简单任务。概念视频还展示了 Cortana 在到达目的地后询问驾驶员是否需要开启自动泊车,预示了 Cortana 日后可以更多地参与汽车操控。
同时,为了抢占AI入口,微软公布了一系列有关语音助手的开发工具,包括 Cortana Skills Kit 和 Cortana Devices SDK,极大地扩展了 Cortana虚拟助理的适用范围。这些工具将让物联网领域的OEM 和 ODM 厂商能够围绕 Cortana 轻松打造第三方智能物联网设备,以及开发与这些物联网设备相关的应用程序。微软表示,Windows 10 的远场语音交互正在完善中,未来将能够让用户在房间的另一端,直接向微软小娜提问或者让它播放一首歌,再或者语音唤醒和关闭电脑。与此同时,物联网版本的 Windows 10 IoT Core 在 Creators Update 更新中将加入 Cortana。
未来厂商基于 Windows 10 IoT Core 所打造的冰箱、洗衣机、恒温器、智能镜子等物联网设备,无论是有屏幕还是没有屏幕都将支持与 Cortana 进行交互。
苹果也在开发受虚拟语音助手Siri支持的智能家居设备。据悉,苹果开发的智能家居设备能够通过语音控制屋内的各种电器、开关、灯光等。该设备的测试阶段还使用了面部识别技术。不同的是,Siri智能语音控制家居设备制胜的法宝分别是高质量的麦克风和语音处理技术。另有消息人士称,苹果还添加了脸部识别传感器。
同时,苹果开始向外界授权Siri技术。2016年6月,苹果宣布开放Siri后台代码,通过API提供给第三方开发者,用户可以用语音Siri命令激活APP,还可以为Siri增加新功能和新数据,避免犯下当年苹果将操作系统的蛋糕让给了微软的错误。
谷歌则将“谷歌助理”与家庭产品结合,推出了名为“谷歌家庭”的家用智能硬件。“谷歌家庭”犹如一只胖肚花瓶,是一款无线声控小型音响,可以连接电视、灯具和空调等家用电器。“谷歌家庭”这款家用智能硬件设备可通过与用户双向对话的形式开展持续“互动”,帮助用户完成一系列家庭日常活动。融合“机器学习”和在线搜索等技术,“谷歌家庭”可以对用户的语音指令作出反应,执行一系列家庭日常任务,比如播放音乐、关闭房间的照明、回答知识性问题、查询交通状况、帮用户修改预约等。用户通过自然说法的方式即可控制设备。
目前谷歌正在 Pixel 中为 Google Assistant 添加全新功能,允许用户通过 Google Assistant 虚拟助理来控制智能家居设备,该功能被称为“Home Control”,而目前支持的智能家居厂商和产品包括贝尔金的 Wemo,谷歌的 Nest,飞利浦 Hue 以及三星的 SmartThings 系列。此次让 Pixel 拥有智能家居控制功能无疑带来许多便利:用户无需针对某个智能设备去单独下载操作该设备的 APP。而且这种通用性也让用户无需购买 Google 自家的智能家居设备就能享受到语音控制的便利。如果家中的智能设备支持,用户能够向 Pixel 发出语音指令,就能调节屋内温度,控制照明,切换电视频道,播放音乐等。
位于爱尔兰都柏林的Voysis公司则希望通过自己的AI平台来切入企业级语音助手市场。2017年初,Voysis公司获得了800万美元A轮投资,由Polaris Partners领投。Voysis公司开发了一个深度学习引擎,专门用于模拟语音和语言任务。不同于Google Assistant,Voysis公司开发的Voysis Search可以直接集成到网站或应用程序中,用户可以直接与品牌的网站或应用程序交互,浏览可使用的产品。
据悉,Voysis平台可以获取所有相关数据,包括产品名称、类别、描述、评价以及元数据等,以创建用于强化语音体验的强大模型。即使在初始问题已经提出后,Voysis还可以细化搜索,这是其他虚拟助手在今天还无法实现的。目前,Voysis的平台支持16种语言,包括普通话、俄语、阿拉伯语和其他欧洲语言。
市场咨询公司Tractica发布的报告称,虽然目前最流行的还是智能手机消费者虚拟数字助手,但是虚拟助手技术已经开始进入其它设备,比如智能手表、健身追踪器、PC、智能家庭系统、汽车。
亚马逊Alexa的成功之道
在使用智能语音助手抢占AI入口市场的战斗中,美国电商巨头亚马逊公司推出的内置“亚历克萨”(Alexa)语音助理功能的“亚马逊回声”(Amazon Echo)智能音箱获得了巨大成功。该产品是贝索斯在2014年11月推出的,可以接受各种语音命令,使用的时候,只要说一声“Alexa”。
亚马逊在语音技术方面的投入算来有些晚,亚马逊2011年收购语音识别公司Yap,这家公司成立于2006年,主攻语音转换文本的技术。2012年,亚马逊又收购了语音技术公司Evi,其在商品搜索的语音识别上有独特技术。2013年亚马逊又收购Ivona Software,做文本语音转换技术。
Alexa的主要功能是让用户可以通过Echo的语音识别功能,操控任何一项具有联网功能的设备,比如电灯、电视、空调等等。得益于高效率的语音识别功能,Alexa可以帮助用户通过语音指令迅速驱动相关软件。据亚马逊的数据,Alexa在2014年最初发布时只有13个内嵌的技能,到了2016年11月,这项功能已经兼容6000款应用,包括连接Uber、Twitter等应用程序。到2017年3月,亚马逊宣布其Alexa智能语音助手平台的功能已经突破了一万种。或许你觉得一万算不了什么,但你知道吗,2016年1月,这个数字才不过130,而2016年11月也才6000,如今才过了不到4个月的时间,就已经翻倍到一万,这种增速让人大为吃惊。
是什么让亚马逊的Alexa取得了成功?答案是高质量、低价格和开放的推广策略。Alexa平台的高质量体现在其独特的语音识别技术上,低价格体现在其建立用户群的思维中。2016年下半年,亚马逊推出Echo Dot二代产品,售价仅50美元,成为去年假日购物季最热卖的产品之一。据悉,2016年,亚马逊Alexa成为最炙手可热的语音助手,在2016年12月的假日购物季,Echo的销量同比增长了9倍。
所谓的开放性,那就是开放自己的Alexa智能平台,允许第三方开发者和第三方硬件厂商在该平台上开发各种基于语音的技术功能。这是一项非常了不起的举措。
正是通過对第三方的免费开放策略,Alexa吸引了大量的个人开发者和厂商,也获得了日益丰富的功能。Alexa帮助各种硬件设备连接、控制家居设备,帮助打造一个完整的生态闭环,进而成为万物互联的智能枢纽和控制中心。这种开放策略与当年谷歌开放Android技术类似,从这种策略我们可以窥测出亚马逊的野心和意图,那就是通过开放,把Alexa打造成智能家居、万物互联版的安卓。
据悉,如果你是Echo用户,就会知道每周Alexa APP都会增加新功能,随着第三方开发者越来越多,Alexa会的本领技能越来越广泛,除了基本功能、订餐、购物、打车、控制电器等功能外,新闻、游戏、教育等方面的技能也日益凸显,亚马逊甚至还建立了一个Alexa技能商店,颇有点想建立另外一个“苹果帝国”的意图。
2016年12月,英特尔与亚马逊联合宣布,双方未来将在一系列智能家庭项目上合作。汽车生产商福特在CES2017上也宣布与亚马逊合作,未来车主将能够在福特的车辆上体验Alexa语音服务,实现声控购物、搜索导航,甚至车主在家就可以通过语音指令启动引擎、锁定或解锁车门。华为也宣布今年1月6日在美国开售的Mate 9智能手机成为第一个预装Alexa虚拟助手的智能手机。Mate 9将于1月6日在美国市场发售,售价为600美元。
亚马逊已经成为通过智能语音助手抢占AI入口的真正大赢家,它与LG、Dish Network、惠尔浦、华为、英特尔、福特的合作,不断扩大了Alexa的版图。
智能语音助手将成为AI的主战场
人工智能将成为人机互动的砥柱,语言是人类用来交流的最广泛的一种工具。人类在地球上的成功,很大程度上依赖于复杂的语言和如此多样的词汇。而且语言交流迅速、直接,是布局人工智能市场的最佳切入点。
2016年被认为是主流科技公司迎接智能语音助理的发展元年,近期在欧美持续走红的亚马逊Echo更凸显了该趋势,通过Echo的智能语音助理Alexa,用户直接说话,即可完成设置闹钟、叫车、订餐等。用户需要调整什么业务,这些事情都可以通过虚拟助理来完成。
如果智能语音助手技術成熟,Echo将有望替代目前的人工客服。亚马逊的云服务部门AWS正在为常设客服岗位的各类企业开发一套云端软件,让Alexa接听用户打进来的电话,或者用文字回复顾客咨询。这个内部开发代号为Lily的软件,据称包括了亚马逊去年推出的文本和语音互转服务Lex和Polly,预计在今年3月中旬发布。
伴随着诸多科技企业纷纷涉足虚拟助手技术,社交网络霸主Facebook也欲凭借着语音助手“Moneypenny”进入该领域,这项综合功能能够帮助消费者完成产品购买和在线服务等在内的多项任务操作。据报道该项目正处于内部测试阶段,声称为现代化数字助手服务带来人性化体验,例如用户可要求Moneypenny对目前市场HDTV市场行情作为判断和研究,并下单购买。
诺基亚也在准备推出自己的虚拟助手,名字可能为“Viki”。诺基亚在欧盟为“Viki”申请了注册商标。在应用程序的产品描述部分,公司描述Viki“用于创建和监控使用数字知识的移动和Web助手,并将所有数据源合并在单独的语音界面显示。这也意味着诺基亚也即将加入激战正酣的虚拟助理大战。
虽然智能虚拟助理技术已经历了较长时间发展,但科技巨头们都认为,智能虚拟助理尚处发展期,未来智能助理发展的道路仍任重而道远。