定制唤醒词
2017-07-27李蓉慧
李蓉慧
过去两年,智能家居产品、无人驾驶汽车等智能终端,都会标记“内置亚马逊Alexa”字样,以示“智能”。亚马逊于2014年发布的智能音箱Echo依靠语音助手Alexa实现音乐播放、新闻搜索、网购下单、Uber叫车、外卖预定等功能,以语音为入口接入家庭智能。越来越多的人也因此判断,未来物联网的入口应该是智能语音识别器。
2015年,在与不少语音助手开发者交流之后,人工智能语音交互公司KITT.AI的创始人兼CEO姚旭晨发现,很多传统电器厂商想为自己的产品增加新功能,特别是定制化体验。简单来说,目前,用户在使用Alexa控制家里的电器时,必须先开口说一声“Alexa”,使用Google Home时则要先说一声“Ok Google”。
某种程度上,一个用语音助手来与电器、汽车交互的环境正在迅速催化。但传统厂商的困难在于对语音交互的研发资源投入较少,另一方面也不算真正理解语音交互,例如有些厂商认为语音交互就是在电器里增加一个麦克风而已。
博士毕业就创办KITT.AI的姚旭晨在创业中学会的道理是:始终关注市场变化,才能在新机会出现时早点入场,并建立先发优势。要避开与大公司直接竞争,又找到了开发者的需求,姚旭晨决定了KITT.AI要“往前端做,做唤醒词”的方向—在使用KITT.AI的自定义唤醒词开发工具Snowboy后,厂商可以设置一个唤醒词,取代“Alexa”“OK Google”。
无论是满足交互还是对服务开发者,KITT.AI对使用流程都尽量简化。例如使用Snowboy的开发工具后,设置过程是对着所部署的电器重复3次唤醒词即可,支持macOS X、Linux和Raspberry Pi平台。
在面对开发者的服务上,KITT.AI不仅把使用方法写进文档,这是为开发者提供信息最常见的方式,他们还给产品拍摄了解说视频,就像普通的面向消费者的公司向用户介绍自己的产品那样。
7月5日的“2017百度AI开发者大会”上,百度集团总裁陆奇宣布收购更多的AI初创公司,而最新的目标就是KITT.AI。在收到不少祝贺信息后,姚旭晨在朋友圈里写下了一段感慨,其中一句是“不管人工智能有多火,也不能离开商业的本质”。
事实上,在决定接受百度的收购之前,KITT.AI也收到过一些来自硅谷或者西雅图技术公司的收购邀请。目前Snowboy拥有2万多个开发者,该公司的另外两款产品分别叫作NLU(Natural Language Understandig)自然语言理解,以及ChatFlow,后者是一款给开发者开发对话系统的工具。在创业近3年时,KITT.AI先后获得微软联合创始人Paul Allen成立的AI2和亚马逊Alexa Fund的投资。
和普通创业者不太一样的是,姚旭晨创业的出发点,是把他读博士期间的研究成果做成一个产品。
姚旭晨本科毕业于南京大学,后来在约翰·霍普金斯大学读博士,研究方向是语音识别和自然语言识别。毕业之后,他希望将自己的研究成果付诸实践。读博士的第二年,他在Google Now实习时参与过对Google人工智能助手的“训练”。这一段实习经历让他感慨—因为有搜索引擎,构建了知识图谱,Google由此在自然语言理解和问答技术方面领先。
结束实习后,姚旭晨觉得,要实现自己的想法,最有效的途径还是创业。2014年,临近毕业时他收到了位于西雅图的AI2人工智能研究所的一场演讲邀请。AI2的全名是AllenInstitute for Artificial Intelligence,其创始人是微软联合创始人之一Paul Allen。当时AI2提出聘请他为AI2做研究员,但姚旭晨表示他想创业。沟通之后,AI2同意将他的创业项目作为AI2孵化的第一个创业项目,并且为他的团队提供免费办公室。
毕业后,姚旭晨搬到了西雅图开始创业。早期,姚旭晨用了3个月时间把自己在博士期间的研究做成产品,并演示给一个投资人看。对方告诫他:“你这个产品做得很漂亮,但不会有人用的,因为没什么使用场景。”“当时那一下挺醍醐灌顶的,”他说,“一下子把我的思路打开,去从业界的角度想问题。”
創业的第一年,姚旭晨慢慢学会了关注市场和用户,而不仅仅看技术的先进程度。在他搬去西雅图没多久,亚马逊发布了智能音箱Amazon Echo以及内置的人工智能助手Alexa。事实上,2014年Alexa还没有太大的影响力,但仅仅过了一年,亚马逊为了扶持这个生态系统的成长,宣布投入1亿美元成立Alexa Fund。
姚旭晨由此看到,语音交互未来会改变人与机器的交互体验,但Alexa到底能做到什么程度,他并不清楚。之后他特意买了一台Echo用于研究,“我记得刚开始用的时候,问了Alexa很多问题,当时就对Alexa对五六米远的远场识别能力感到惊艳,唯一失望的是Alexa听不懂中文。”
为了更了解语音识别这个商业市场,姚旭晨决定从他最熟悉的群体开发者中去寻求答案,理解他们在语音识别这里究竟想获得什么。当时姚旭晨思考的是,如果做从A到B的路线规划、或者做普通意义上的语音识别、语义分析,那无异于是在与亚马逊、Google等大公司正面竞争。在语音助手这个新发展起来的领域里,他要做的是去找那些困扰开发者,并且大公司暂时还没做的事情。
某种程度上,你可以将这看作是“为掘金者提供矿泉水”的商业思路。KITT.AI想在语音识别领域里为开发者提供工具,这一想法很快得到了战略投资人亚马逊Alexa Fund的认同。对亚马逊Alexa Fund来说,一个公司的精力和专注程度毕竟有限,它投资创业公司的根本目的在于让自己的生态和使用场景更加丰富。而对KITT.AI来说,有了Alexa Fund的投资,不仅可以获得亚马逊的资源,也可以作为将来获得大客户的品牌支 持。
从商业的角度来说,做针对开发者的产品,可以通过聚拢开发者形成长尾效应,再吸引大公司成为其客户。而且使用免费+付费两种模式,通过增值服务把免费用户转为付费用户。
在Alexa成为家里设备的控制中心之后,与Alexa相连的电子产品只能用Alexa来唤醒—要操作它,用户必须先叫“Alexa”。KITT.AI发现,用户其实希望有更定制化的选择。但是,做唤醒词需要的技术能力很高,很多硬件厂商未必有足够的技术能力和资金来解决这个问题。对亚马逊来说,支持多个厂商的定制化需求暂时比较麻烦,它目前做的更多是完善通常意义上的的语音识别和语义分析。
而这就是Snowboy在做的事情。最好的例子可能就是在百度大会上所演示的那样—进入Snowboy的唤醒词库,新建唤醒词“你好景鲲”,接连说3遍“你好景鲲”,即完成了唤醒词的更换训练。
Snowboy的开发者用户呈现出滚雪球式的增长。前3个月每月新增开发者300多人,从第五个月开始,新增用户每个月超过1000人。在商业模式上,Snowboy有免费和付费两种版本。免费版本开放给所有开发者使用,如果想使用更多功能,可以选择付费版本。其用户主要集中在智能家居、医疗、通讯等领域,其中付费用户95%以上来自欧美国家。
姚旭晨认为不同于普通的免费+付费的技术产品,KITT.AI的优势在于做得早,而且市面上的可替代选择很少。事实上,创办至今,KITT.AI的全职员工依然只有3名。保持这种小团队“精益创业”的风格和工作效率,姚旭晨称从最近一两个月开始,KITT.AI已经盈利。