智能对话机器人时代降临
2017-12-29
手机应用即将消亡。智能对话机器人万岁!
它永远对你俯首帖耳,随时准备
满足你任意一个哪怕是最任性的要求。
机应用的蓬勃时期已经成为过去。目前已经有超过420万个手机应用适用于安卓和苹果iOS系统,但是全美智能手机用户中有四分之三的人平均每月下载的新应用数量为零。即便大多数手机应用是免费的,并且很方便调取,但是要用户真正把这些应用安装到他们的手机或者平板设备上,可并不是件容易的事隋。据ComScore公司发布的—项统计,大部分时间我们只会使用手机上的3个应用,美国人每天用手机的时间中,有一半的时间只花在某一个应用上。
哪一类应用最受欢迎?即时通信类。当全世界的目光都集中在Whatsapp.Facebook即时通、微信和Skype上的时候,开发者已经开始着手将一度非常简单的聊天应用变成一个复杂的生态系统。这一改变的核心就是一大堆服务类的智能对话机器人程序(以下简称机器人程序)。
2018年11月2日是个星期五。你经过了一周的繁忙工作,刚回到家走进厨房,“播放埃塔·詹姆斯(Etta James)。”你说《最终》(Ar Last)这首歌开始在房间里回荡。你口袋里的电话震动起来,屏幕上有一条信息写着“多伦多往返机票现在特价每人220英镑,是否预订?”你输入“是”,并且用手机的指纹识别功能确认了你的身份。你打开厨房的柜子,看看还有什么能吃的东西,然后你又掏出电话,输入两个表情符号:披萨、红酒。二十分钟后,门铃响了。
想一想,最后—个动作如果发生在应用软件上会怎样。你要动用鼠标、键盘或者触摸屏,经过一系列选取点击之后,才能完或一项任务。在此过程中,你被迫遵守着30年不变的软件使用规则;这种互动方式是由软件决定的,而不是由你决定。现在,拜机器人程序所赐,这些规则正在改变。
在中国的聊天平台、新加坡的政府职能服务,以及英国的语音私人助理等领域,机器人程序都已经占据一席之地了。下一代的用户界面不会再基于拟物化设计和繁复的菜单选项,而是基于简单的对话。从企业级沟通工具Slack到微信,从Kik到Facebook即时通,從跨平台聊天应用Telegram到亚马逊的语音助理服务亚历克莎(Alexa),机器人程亭正在或为人类和机器之间的主要沟通界面。“这个领域大有可为,”印象笔记(Evemote)前任首席执行官菲尔·里宾(PhilLibin)说,“几年之内,机器人程序就会无处不在。”
里宾如今是麻省坎布里奇(Cambridge,Massachusetts)一家风投公司General Catalyst的董事总经理,他正在投资一些他认为会将机器人程序引入主流的初创公司,并展开合作。他感兴趣的机器人程序并不是那种拟人化的智能助手,它们要简单得多。他将它们形容为“对话界面”,是通过讲话、信息、表情包、图片、视频及其它手段与软件互动的一种方式。“你不需要学习如何使用它,你直接用就好,”他说,“你说句话,它就能帮你办事,让你为所欲为,而且不需要在一系列的选项中间绕来绕去。”
对于作家及出版商蒂姆·奥莱利(Tim o'ReiuV)来说,机器人程序的出现令人回想起计算机刚刚问世的那段日子。“我们回到语音界面,实际上是回到了指令做主的时代。”他解释说。指令操作的局限性在于它需要绝对明确的指示,所以才会被迅速取代。可是,它虽然有局限性,但仍然是与电脑交流的最简单的方式。归根到底,还有比对话更加自然的沟通途径吗?
“回溯用户界面的漫长历史,无非就是机器能懂多少指令以及人类花了多少精力来帮助机器懂得人类指令的集合。”奥莱利说,“过去,指令必须非常非常明确,但是现在越来越不需要太明确,因为现在的机器已经可以处理更为混沌复杂的情形。”
到底什么是机器人程序,这要看对谁来说。对于某些开发者和投资者来说,机器人程序是一项复杂的、结合人工智能技术的创造,它几乎能够理解所有的交互行为。对其他人来说,机器人程序就是一个故意做得很笨拙的互动界面,只能接受事先设定好的一些有限的指令。开发者的目标是让程序与人类产生对话并通过图灵测试,后者可能只会简单地问,“你想吃什么口味的披萨?选一是玛格丽塔,选二是狄阿波罗,选三是夏威夷,选四是四款奶酪。”
奥莱利形容机器人机器人程序“有一丁点儿人工智能”,但并非完全依赖于人工智能。“如果你仔细研究一些机器人程序的工具包,就会发现它们其实就是更加智能化的分支任务系统。”他这样认为。里宾同意他的说法:“对于机器人程序的样子,公众的想象中存在一些误解。”
“可能最主要的一个误解就是,机器人程序要像真人一样说话。如果我让某个机器人程序帮我做事情,我并不会要求它表现得像一个真正的人,我不希望它能像一个活人一样跟我对话。我希望它用一种超越人类的更加高级的方式跟我对话。我不想模拟人类的体验——我要一种更好的体验。”
里宾的投资项目中包括一个在企业内部的沟通工具Slack上面听取并激发用户多表扬的机器人程序Growbot。“这个程序是对话的参与者,为对话增加了一种系统功能。”他解释说。当Growbot注意到对话中有赞扬之词,它就会记录是谁发出了赞扬,随后还会生成一份报告发给其上级。该公司在前两轮种子融资中一共得到了170万美元(130万英镑)的投资,现在这一程序已经被趟过两千家公司使用,其中包括星巴克(Starbucks)以及位于伦敦的广告公司“海绵细胞”(Spongecell)。
工作中团队协作即时通讯服务迫切需要现象级应用出现,而Slack就战为了这—领域早期的先行者。2016年7月,该公司宣布将会向14家初创公司投资200万美元,致力于研发在Slack平台上使用的机器人程序。这笔钱是2015年12月阿塞尔(Accel)、安德森·霍洛维茨(Andreesscn Horowitz)和指数公司(Index Ventyres)对Slack进行的8000万美元专项投资中的—部分。Slack自2013年8月问世以来增长迅速,每天的活跃用户达到了300万人,并有93万付费用户。
“我们有一些完全置入Slack内的机器人程序。”Slack的产品部门副总裁爱普尔·安德伍德(April Underwood)说。她说这些机器人程序能够帮助用户完战工作中一些并非关键却又很烦人的工作:比如填写报销单、预算报批或者订购新的办公用品等等。“Slack允许机器人程序加入对话,并且更迅速地协同已经在对话中的应用程序团队一起解决问题。”
Slack一马当先,其它平台也趋之若鹜。“你在Slack上看到的那些互动行为,将会成为微软公司所有平台的基础配置,”奥莱利说,“这关系到你如何在一台电脑上引发行动——无论是打字输入还是语音对话其实并不是那么重要。”而贸然摒弃机器人程序将会“大错特错”,奥莱利说。
对于Slack中的机器人程序来说,简单是关键。“目前很多这类机器人程序并不需要非常复杂,可以从最简单的命令入手。”安德伍德说。这意味着你不需要跟机器人程序对话,你只需要告诉它该做什么。“把它们想象成能够服务于人类的动物,而不是人类本身,”里宾说,“一只牧羊犬能够超水平完成它的工作:它能够比任何人类都更出色地放牧羊群。它并不聪明,但是它工作的效果很好,比任何人类都更优秀。”
比如Slack上面的“信使”(Envoy)机器人程序,会在员工到达办公室后自动通知那些需要跟他见面的人。这个程序很方便地完成了一个简单又非关键的任务,并且不需要员工安装学习新的系统。“如果我们能够把日常工作中需要处理的千头万绪都用这些机器人程序解决掉——那我觉得员工的体验确实会越来越好的。”安德伍德说。
1998年以来,其实你一直在与一个机器人程序互动着——它就是谷歌搜索引擎。那么为什么应用软件仍然坚持不改拟物化原则呢?为什么连叫份披萨饼外卖都需要下载一个手机应用,再注册一个账号,然后还要在下拉菜单里找到特定选项,才能多加一份辣椒?机器人程序带来的巨大希望在于,它们能够打破人类和机器之间一直存在的隔阂,从而让大量的应用程序显得多余。奥莱利说,转换到对话界面的速度会很快:“2019年我还会在特斯拉车里点击触摸屏吗?我不会。我跟它讲话就可以了。”
在仅仅3个月的时间里,Facebook、谷歌和微软同时打响了下一轮平台竞赛的第一枪。2016年3月,微软推出了编写机器人程序的开发者工具,并且将其开源;4月,Facebook推出为自己旗下的即时通讯软件专设的机器人程序开发平台;5月,谷歌也展示了一款全新的人工智能辅助程序“助理”(Assistant)。但是西方世界已经落后了,在中国,不受既定的应用程序市场制约的即时通讯平台,已经指明了前进的方向。
“它成为了与线下世界交流的全新界面。”即时通讯软件Kik的首席执行官以及创始人泰德·利文斯顿(Ted Livingston)说。“中国现在每天微信上推出的机器人程序比他们在互联网上新发布的网站都多,”他解释说,“换句话说,现在中国的互联网就是微信。”Kik是微信所属的腾讯公司的合作伙伴,并且获得了腾讯5000万美元的投资,它是从中国蓬勃发展的机器人程序产业中获益良多的几家西方公司之一。
4月,Kik推出了自己的机器人程序商店,目前已经吸引了超过两万余款程序,其中包括为美国有线新闻网(CNN)、维多利亚的秘密(Victoria%Secret)以及H&M服务的机器人程序,及至目前,在这款聊天软件上与机器人程序互动的通讯已经超过了180万条,使用机器人程序的用户比不使用的用户多了32%的聊天时间。这些程序可以提供着装风格建议,帮助测量胸罩尺寸,播送天气预报等等。“潜力无限,”利文斯顿说,“聊天应用就是新一代浏览器,智能对话机器人程序就是新一代网站。”虽然目前各种奇思妙想很多,但他也坦承这个领域目前还是早期阶段。不过,机器人程序的产业化发展会非常迅速。
“接下去的6至12个月里,我想你会看到下一波机器人程亭的设计构思,无论从想法上还是设计上都非常优秀,以期引发足够的重视。”里宾说。目前这些应用程序的局限性很明显,里宾也承认这一点,但是更好的开发工具能够帮助建立更好的用户体验。“如今大部分程序还是文字驱动,”他说,“我觉得就像是20年前的浏览器,只有一堆各种颜色的文字,渐渐地人们加上图片、视频和动画效果。可是过了15年之后,在浏览器里你可以植入任何你想要开发的应用。聊天程序也会经过同样的进化过程。”
為了转向更有变革力的科技,机器人程序需要一个牢固而庞大的后端系统。“会有巨大的云端平台,提供让很多机器人程亭赖以生存的基础智能。”奥莱利说。大公司对于人工智能以及自然语音处理投入大量资金之后,产生了苹果的Siri、谷歌的Now和微软的“小娜”(Cortana)等等,但机器人程序会比它们再进一步。这些平台收集起来的海量数据会在科技发展普及的过程中成为语音互动界面的基础。
“如果我是谷歌云端平台或者‘小娜’,我会跳出来说,‘好吧,我们怎样才能通过语音控制全世界所有的设备呢?’”奥莱利说,“大公司会开发很多基于平台的功能,所以会发展得越来越好,它也会融入越来越多的人工智能技术。你已经有了Azure机器学习(AzureMachineLearning)和谷歌云端机器学习(Google Cloud Machine Learning)等等类似的技术。如今非常复杂的一些事情,将来会由平台解决。”
“机器人程序就是新的应用。”微软的首席执行官萨特亚.纳德拉(SatyaNadella)在2016年3月表示。在所有的科技巨头中,总部位于西雅图的微软公司对机器人程亭做出了最高调的支持。微软推出开源程序开发工具包或许是一场赌博,但它也有可能让该公司成为奥莱利所说的“基础智能”服务的最大供应商。
那么微软到底意欲何为?每当一个用户与微软平台上的程序产生互动的时候,即使这个机器人程序是安装在Slack、Facebook即时通或者其他应用内,微软的人工智能都会因此变得更聪明一些。“我们系统中的数据量越大,它就会变得越智能。”微软必应部门的企业副总裁德里克·康纳尔(Derrick Connell)说。
出于对新型机器人程序的执迷,微软也把目光转向了中国,此前微软在中国市场一直战绩平平。自从2014年5月推出以来,微软的人工智能机器人“小冰”已经与超过4000万用户进行了超过200亿次对话。“我们最初的理论是这样的:我们能否和另一个人将谈话一直持续下去?”兼任這款机器人程序开发团队领导人的康纳尔说。这款程序成功与否的关键标准是它能将一次聊天维持多久。“第一版,我们在一次聊天中能有12句对话。3年后的今天,平均的对话数已经上升到23句。”这个对话机器人在微信平台上也可以使用,目前已经能够理解文字、图片、视频和语音。
2015年12月,“小冰”那熟悉的女声开始在上海东方卫视的新闻频道播报天气。之后她又开始播报新闻,并且还主持了2016年奥运会转播的部分报道。
微软另一项机器人试验Tay(泰伊)就没有那么成功了。这款机器人是以“小冰”为基础再开发的,它模拟一个十九岁美国女孩的语言习惯,到推特上通过与用户互动来学习。2016年3月23日推出后,一天之内,泰伊已经学到了社交媒体中最糟糕的部分——她开始散布种族主义和性暴力的言论。两天之后,泰伊发出的约96000条不良言论被推特删除,这一试验也被叫停并下线。
微软并没有被挫折吓住,在同年7月宣布与新加坡政府合作开发一款处理公共事务的机器人程序。“如果你是新加坡公民,你就可以与代表新加坡政府的一个机器人程序互动。它能回答问题,你可以向他投诉,你能够与一个机器人政府代表交流。”康纳尔说。
西方国家里,率先取得惊人成功的是亚马逊(Amazon)。2014年11月推出的亚马逊“回声”(Echo)服务中,有一个叫做亚历克莎的会话机器人。想听Daft Punk乐队的歌?只要说一句,“亚历克莎,播放Daft Punk。”播放音乐的时候,想设定煮蛋器的时间?说,“亚历克莎,设定一个四分钟定时提醒。”想叫一辆优步?说,“亚历克莎,让优步叫一辆车。”亚马逊的机器人程序一直在聆听,也能够听懂命令。2015年6月,亚马逊向开发者开放了“回声”的源程亭——一年之内,超过1400个新“技能”(亚马逊给“程序”起的特定称呼)都为这个服务提供了支持。
与试图模拟真人互动的微软“小冰”不同,“回声”同样延续了微信为机器人程序设定的“简单”原则。你不会跟它聊天,你只是告诉它应该做什么。“语音比人们想象中更能改变游戏的玩法,”奥莱利说,“在Siri和谷歌的Now还有其他被Nuance系统支持的应用程序中都能看到,但是在我看来,‘亚历克莎’和亚马逊的‘回声’对于游戏规则的改变,不亚于iPhone。”谷歌似乎也认同这种说法。2016年5月,谷歌推出与亚马逊的“回声”有异曲同工之妙的声音控制无线扬声器Home。“一旦你有了一款一直在听你命令的设备,你与语音的关系也就发生了改变。”奥莱利说。
2009年10月,苹果在应用商店推出了应用内购买的功能。软件产业自此一发不可收拾。仅2013年下半年,糖果粉碎传奇游戏(Candy Crush Saga)已经从微交易中收入10亿4千万美元。最近,任天堂大获成功的口袋妖怪(PokemonGO)游戏推出两周之内就通过应用内购买获得了3500万美元的收入。据国际数据中心(IDC)的分析,2015年从手机应用中获得的非广告类收入已经达到了342亿美元。
对于机器人程序来说,时机不可能再好了。机器人程序的出现为移动服务的分销渠道提供了更大的可能。不仅因为即时通信类应用的用户忠诚度更高,也是因为开发机器人程序比开发手机应用的成本低得多。“从简单到复杂的进步过程会很陕,”安德伍德说,“应用开发商能够从之前互动界面中吸取经验,因为手机应用出现并没有多久。手机应用的开发花了几年时间。在机器人程序上我想大概用一半时间就够了。”
机器人程序领域最主要的投资人里宾毫不怀疑这种技术转变的潜能。“将来会有1亿个机器人程序。就像手机应用的黄金时代一样,只不过量级会扩大。”他说,“正如手机应用一样,大部分的机器人程序意义不大,但是那几百个真正优秀的机器人程序,才是改变世界的关键。”