李志飞少谈算法,多想想AI商业落地
2018-07-13徐梅
徐梅
一谈到AI,大伙儿好像就很难坐在一块儿好好说话了——
去年还是暴热的话题,投资人打破了头想要进场,转眼间算法红利时代已经宣告终结,媒体预警AI创业者将遭遇资本寒冬,计算机视觉和 AI 领域专家 Filip Piekniewski也发出了《AI Winter is Well on its Way》的推文……
“今天把你捧到天上,明天把你扔到地上,”出门问问创始人兼CEO李志飞笑着摇头,他说这种180度大反转的剧情适合出现在电视剧里,对于公众建立“正确的科技观”却没有半点儿帮助,“正确的科技观是你要知道科技的边界,建立正确的认知。”
与大多数国内一线AI企业在To B生意中隐姓埋名不同,估值达到10亿美金的出门问问,几乎所有收入都来自直接面对用户的消费电子产品,这些看得见摸得着用得上的AI产品包括智能手表、智能音箱、智能耳机与智能后视镜。
“我们既不是硬件公司,也不是纯粹的软件公司,在AI企业里是独一无二的。”资本市场青睐这只特立独行的“独角兽”,C轮他们曾获谷歌数千万美元的融资,去年4月初得到大众汽车(中国)集团 1.8 亿美元独家 D 轮融资。
今年5月出门问问推出了与杭州国芯科技合作开发的AI 语音芯片模组“问芯”,这款已经可以量产的AI芯片模组直接面向智能电视、机顶盒、机器人等企业级市场。
两次人机大战,AI热潮无远弗届时,李志飞格外冷静,谢绝了各种峰会,专注于产品升级。去年接受本刊采访时他表示,“今天的AI还是非常基础的,”那时他就担心AI被玄虚空谈和市场虚火所误,“我们还是踏踏实实用它来解决一些具体问题吧,如果AI技术能够给社会带来价值,也许人们会对它有一个更正向的认识。”
今年春天“人工智能衰退论”初起时,他却以AI独角兽企业创始人的身份多次站到台前,“不是为自己的产品做广告,是布道”——
“AI到底用在什么地方?商业化怎样能够形成一个正向循环?一个科技公司如何才能在发展中越来越关注科技本身?”
“我不是口才很好的人,但我愿意毫无保留地分享自己的思考,”所有表述的核心只有一个指向,“set up正确的认知。”
算法不能当饭吃
李志飞算得上是国内AI创业的先行者,2012年他从硅谷回到北京,除了霍普金斯博士头衔和谷歌总部工程师的履历,“(产品、商业模式)什么都没有,红杉就给了我一千万。”
“红杉还有徐小平老师的真格基金早期投我的时候,人工智能还不是一个热词,我也只能告诉他们,我看到了一座美丽的山峰,云雾缭绕,如果登临,一定有绝美的风景。但是怎么到达哪里、用什么交通工具、有哪几条可以走通的路径,其实我也是不知道的。”
他所说的“美丽山峰”,正是人工智能的重要研究领域语音识别和自然语言处理的“技术落地”。
“AI是个技术,不是产品,就像灵魂需要肉身一样,AI也需要找到自己可以施展的场景,找到了合适的场景,就是‘灵魂附体。找不到,则只能是一个飘荡的‘无脚鸟。”
洪泰基金副总裁宋楠在接受“钛媒体”专访时表示今年投资标的“已经从算法转向了应用”,他提醒人工智能领域的创业者“少谈算法,多接地气”,“算法、算力上的技术优势反馈到客户那里,可能会有3%-5%准确率的差别,但这种差异很难去做一个定量的横向比较。AI 公司去拿单的一个核心因素是商业的服务能力。而在实际的项目落地层面,客户真正需要的,与 AI 行业讲究的所谓高大上的算法、豪华的团队又完全不是一回事。”
李志飞毫不讳言自己当年正是因手握高大上的算法而获得资本青睐,但“算法只是起点,是一块敲门砖,快速把它商业化,至少能看到一个朝向正向循环的过程,从创业第一天(我)就是这样想的。”
以语音识别技术为核心来“定义下一代人机交互”是他的雄心和愿景,五年多的“地推”经验让他感慨,说话看起来是最自然最轻松的交互方式,但实际上“让人开口其实很难”。
“刚需加私密,才是语音交互能够获得价值的地方。”
外界认为出门问问的产品线过于分散复杂,他也在新品发布会上笑言,“五年多来我们智能手表竟然累计做了十多个单品,但我们真的不是一家表厂。”所有的产品都只有一个企图,就是抓住语音交互的真场景——车里、家里、路上,“我们做过很多尝试,只有这三个场景才是‘刚需加私密。”
2012年我刚回国的时候,主要精力投入在算法的研发。因为我以前是做自然语言处理和机器翻译的,对非常复杂的算法很了解,所以花了 8 个月就做到了端到端的语音交互,完成了AI技术积累。
为了尽快实现商业化,2013年我就用研发出来的语音交互算法做了微信公众号“出门问问”,也做了手机上面的语音助手。但是这些东西没有形成闭环,因为没有用户量,也没有任何营收。
后来才理解到手机上的语音交互其实是很难火起来的,因为用户习惯已经在那里了,一个公司很难改变,在这个问题上我们不要太狂妄,即便是Apple也很难。
语音交互真的只是交互方式之一,要么就是在比較偏垂直的场景,要么就是偏年轻一代的人群,只有通过这两种方式才能慢慢地把语音交互变成主流交互方式之一,只是之一,不是唯一甚至不一定是最主要的。
我们一直在找各种应用场景,手机上的语音交互没有黏性,我们又做了谷歌眼镜上面的语音交互,那个有黏性,但是这个设备本身没有流行起来。
2015年决定做智能手表,当时有人说你一个高大上的算法公司做这个干吗呀?这简直是跪着都不能挣钱。
一个独立的AI企业要想存活下来,就应该在算法的基础上,尽早找到可以掌控的场景,建立技术、产品、商业的闭环,然后在更大的规模上循环、迭代。
今天的现实主义是为了支撑明天的理想主义。一个算法到商业化,中间有很长的路,你把90%资源都投在AI研发上,不商业化的话,你可能明天就挂掉了!
抵制情怀和虚幻的情绪
2015年,出门问问开始做智能手表,“物理世界太复杂了”,李志飞跟同事到南方跑工厂,“先不谈智能不智能,那个产品本身就非常粗糙,我们还需要在上面运行软件,你可以想象一下那种绝望。”“创新可能未必是那些科幻小说里写的天马行空的东西,而是从很小但对用户而言是实用的方面踏实累积起来的东西。”李志飞说。手表电量少、体积小、天线难做,在手机中易于加入的3G、NFC、GPS等模块在手表中极难加入。“技术的突破有很多层次,有的是在特别底层算法的突破,有的是把算法去变成一个产品,或者变成一个工具。我们更多还是在这个第二层。”
借着Apple Watch对智能手表市场的开启和引领,出门问问推出的智能手表Ticwatch,销量迅速达到了 30 万台,占据了 30% 的市场份额,第一次实现了技术、产品、商业的闭环。“交互方式的领航者我觉得还是苹果,我们不要太狂妄。Apple watch出来,对整个市场的教育是比较大的。所以那个时候我们去选择智能手表这样的设备,既符合我们推广语音交互的初衷,也看到这个市场是一个可以规模化的场景。”
2016年,在软硬件能力、供应链管理、商业推广和营销能力都大大提升之后,他们又逐步推出了车载、家居、耳机,覆盖更多场景,在更大的规模上循环、迭代。
现在智能手表仍然是他们的主力产品,海外市场占到一半,2018年全球销售目标为100万只。
今年公司目标营收为10亿,李志飞表示如果顺利达到目标,公司就可以实现盈亏平衡,“在AI公司里,这个营收规模可以排到前几位。看第一、第二季度的数据,是可以达到这个目标的,第三、第四季度会更好,对于海外市场来说,是消费电子的旺季。”
对于外界传言的“钱荒”,李志飞很平静,“反正我们目前不缺钱。”“其实一个AI公司要死也没那么容易,少养几个工程师就行了。但是一个公司如果不发展,跟死亡没有区别。”
大家都认为你一个算法公司做智能手表不是一条正确的路,但如果你自己能够认清楚本质,你知道未来大概会怎么演化,就可以做出自己的决定。
在某一个阶段我可以不去关注学术,我可以不关注这个AI在产品里的实现。因为我知道如果明天我的商业化很成功,我要做AI我转身就来啊!这个过程就是理想跟现实的一个平衡。我一直说我没有算法迷信,一直以来我考虑最多的是商业化。
我们公司是一个技术型公司,我的所有诉求还是希望通过一个很牛的技术或者产品去占领市场。我不喜欢讲情怀,而且我特别反感讲情怀。每次新产品发布会我一定要求做DEMO,让大家真正看到产品,而不是打一句话喊口号。
现在传播渠道太发达,特别容易煽动大众的情绪,比如说区块链的时候,大家天天关注,我也研究了一个星期,沉浸在其中,放大自己的想象,觉得这个世界已经变了,或者说马上就会完全不一样了。
但是某一天我下楼,到街上一看,发现这个世界没有任何变化。这种虚拟的情绪特别容易放大,因为它不需要经过物理世界的碰撞跟检验,就脑海里面不停不停地想。
在混沌大学讲课时我在现场做了一个调查,我说,“三年前每天或者每周用过一次语音的举手”,很少,只有一两个人。我又问,“今年,每个星期用过一次语音的举手”,现场有1/3的人举手。这么短短的一两年变化很大,AI变得让更多人能够真切感受到了。
我也很开心AI业界今年发生了变化,无论是各种论坛还是媒体都开始讲场景了,现在大家关心你有多少营收,你在这个场景里边到底怎么做,你主要应用在什么地方?
在这之前的话,还都在拜神阶段,什么深度学习三巨头,什么你的算法多牛,赢了什么比赛,发了什么论文,有几个大牛科学家。以前大部分是讲那些东西。
可能我早就已经move on了,特别不喜欢听那些虚空的东西。我也从来不相信什么五分钟之内在电梯里搞定融资这样的神话,那种论坛我很少参加,如果大家在一起没有认真地分享跟讨论,就看谁的口才好,谁的煽动性强,没有意义。
哪个企业的商业化不复杂?这本来就不是简单的事情,我愿意拿出两、三个小时分享我们的逻辑。今年大家回到场景,来寻找场景,会发现你的场景都是别人掌握的。所以我上次在混沌大学分享时最核心的观点就是“AI商业化的关键是找到可掌控的规模化场景”。
硅谷三年改变我最多
不爱拿算法说事儿,不代表在技术的护城河上吝于投入。出门问问70%的费用投入在研发上,其中核心算法占到了三分之一。对于一个商业模式偏消费电子的企业来说,绝对称得上是高配比。
高投入获得的AI技术能力在To B中得到了充分的价值释放,巨头都在争夺的AI+汽车市场,出门问问已跻身其中,他们的语音交互系统已经进入了大众汽车的前装,“这里面是大量的算法研究跟裁剪优化,端到端能够进行互联网检索,并且要充分考虑到汽车使用时的实景,开车过程中可能会信号不好了,没有网络了,你所有的算法可能都要直接在本地设备上就能够跑。”
“外资汽车出于安全性和品牌的保证,标准比较严格,我们能够达到标准,这是过去一年非常重要的突破。”
李志飞预言未来一两年智能家居市场将会爆发增长,他拿出一个美国生产的智能灯泡,“你看在美国,这种灯泡、插座全都可以通过语音控制,只要芯片能够做得足够便宜,电视机、空调、洗衣机……家里绝大部分设备都会语音化。”
在产品覆盖到了自己所能想到的核心场景之后,他还是会常常问自己,“AI到底用在什么地方?”
当初跟早期投资者描绘的那座美丽山峰,经过五年多的探寻,“雾已经慢慢散了”,“现在已经看得清楚语音交互其实就那么几个场景,别想得天花乱坠。上山就是有这么几条路,旁边有什么障碍,也都比较清晰了,你要做的事就是克服这些障碍,在过程中有老虎、有野兽什么的,就得把它干掉。”
在整个AI产业商业规模还偏小的当下,李志飞能做的是尽量不错过“明显属于我们的机会”,但他也还是有不安,担心某一个天才人物在自己的盲区里破局。“AI是一个基础技术,它的应用有可能在这儿,有可能在那儿。现在没有一个人能够突破全局,可能真的有一个很creative的人出现,他可能突然之间就找到了一个很牛的变现方式,那他就成了,我们就输了。”
我觉得我们做公司,肯定要做正确的事情,要认这个对错,但我们也还是要争输赢。
我最大的改变是在Google工作的那几年。以前我是特别偏学术的,我的论文就是我们那个领域能看懂的也没几个。但是在硅谷不到三年的时间,给我的认知,不是说它早期的算法有多牛,其实它最强大的还是有一个特别牛的商业模式,使得每天就是全公司放假,钱都可以照样进来,就跟印钞机一样,这样它才可以去正向地滚动起来。
他们早期做搜索引擎,产生了一个特别好的商业模式,然后可以做无人驾驶、基因监测、机器人……做各种各样的东西。
拉里·佩奇(谷歌聯合创始人)经常给我们讲尼古拉·特斯拉的故事,这个人跟爱迪生齐名的,一生独立开发并取得专利700种,合作开发的专利1000种以上,绝对的科学狂人、科学强人,最后却死于贫穷。
拉里·佩奇自己也是斯坦福的博士,他一直讲这个故事,这个对我印象特别深刻,他一直强调我们做学术的一定要避免那个悲剧。
做科研出身的,如果创业,你不要过于痴迷自己那个东西,要想着怎么把它商业化,形成一个正向循环,还是那句话,你今天的实用主义、现实主义就是为了明天的理想主义。
(实习记者凌晨亦有贡献)
李志飞
语音搜索应用“出门问问”创始人兼CEO。美国约翰·霍普金斯大学计算机系博士,前Google总部科学家,自然语言处理及人工智能专家,世界主流机器翻译开源软件Joshua主要开发者。