EverString联合创始人汪超:算法早已改变你我的生活
2016-06-15叶丽丽
叶丽丽
大数据是21世纪的石油,算法是提炼它的手段。未来已来,只是尚未流行。
《财经天下》周刊=EW 汪超=WC
EW:能否先用一句话帮我们明确一下这几个概念——数据、大数据、数据挖掘、算法和算法经济,以及它们之间的关系?
WC:数据就是基本的资料,能表达出一定意义的都可以称为数据;大数据最初的含义是海量数据,后来演变成一个生态和方法论,在大数据生态里面,数据挖掘很重要。很多地方提到“大数据是21世纪的石油”,但大数据本身是没有含义的,只有挖掘出数据背后的相关性才能让它有价值,而数据挖掘主要就是靠算法,不同需求使用不同算法,将来各行各业都需要构建算法模型来挖掘海量数据。企业并不需要自建团队来构建模型挖掘数据,可以把这些业务交给特定的算法研发公司来做,这就会形成算法经济。
EW:从数据到算法经济这个演变的过程经历了几个阶段?
WC:从20世纪70年代开始的最初20年,美国的企业级软件服务商主要致力于收集和储存数据,这也是数据利用的开始阶段,进入90年代以后,以Salesforce为代表的公司通过自动化销售来管理工作流程,这就是SaaS(Software-as-a-Service,软件即服务的简称)阶段。大数据流行以后,大概在2000年逐渐开始出现一些分析数据的数据可视化工具,Tableau是当时代表性的可视化数据分析软件,这种数据分析很快达到可以进行预测服务的阶段,随后美国进入预测即服务(Prediction As a Service)阶段,这个演变的过程,数据和算法是其中最重要的部分,进入预测即服务阶段,算法就能够帮助提高决策效率,这也是算法经济得以产生的原因,接下来几年美国企业级服务的目标就是通过人工智能自动化做决策。
EW:算法经济的核心是什么?
WC:简单说,算法经济的核心是算法+数据+商业场景,是使用算法去解决特定的商业问题的一种模式,目的是提高企业在商业场景中的决策效率,把人力资源充分利用起来。
EW:算法现在已经开始流行了吗?将来算法会对生活产生什么影响?
WC:算法早已无处不在,有数据的地方就有算法,手机App背后都有算法。我们使用百度搜索时,都会调用背后的Page Rank算法,这个算法能够将我们需要的信息呈现出来,我们出行的时候,我们用到的百度地图、滴滴打车等,都是算法。算法会让生活越来越便利,人们不用关心背后算法是什么,只要懂得怎么使用就好了。将来可能出现的情况是,人会越来越懒,很多工作机器人能够做好,人只需要提问就好了,机器人负责解决问题,人存在的价值就是能不能提出更难的问题。
EW:在美国当时是怎么开局的?遇到过一些什么困难吗?
WC:创业刚开始肯定是艰难的,尤其是我们这样新的领域。2013年我们拿到徐小平牵头投资的160万美元,在接下来的大半年里,我们几乎每天都在熬夜,去做我们的第一个产品,这个产品主要是针对网上爬取的数据进行分析,为客户提供决策方案,产品上线后无一人买单,没有人看好我们,还有客户直接跟我们说你们的产品毫无用处。我们当时觉得产品没人买,公司没戏了。没有人知道出路在哪里。
在账上只剩下大概10万美元的时候,我们几乎走到绝境,因为我和杨文杰把投行赚的钱也都放进去了,已经没有更多的资金支持我们继续往下走了。大家疯狂找出路,希望能够找到一个对的方向。有一天,杨文杰打电话过来很兴奋的跟我说他找到了方向,说我们不能做数据分析和可视化公司,而应该做成能够预测潜在客户的公司,直接给企业推荐客户。听他的描述我们觉得可行,找到方向我们很兴奋,创业那么久是第一次有庆祝的心情,我们当天晚上在硅谷的瑰丽酒店订了一桌菜,觉得公司有希望了。
但我们依然面临一个难题,我们当时新的产品没做出来,但是我们没什么钱了,所以需要说服客户买单,就要让他们接受我们的理念,我们的第一家公司是一家杀毒软件公司,我们跟他们的负责人说我们能够精准地帮他预测下一个客户是谁,两个月内给出方案,他们付我们五万美元,如果不满意随时可以退出。这是我们第一个客户,我们的方案完全是根据他们的痛点来制定的。
EW:你们是怎么争取到500强公司的订单的?
WC:我们一开始就瞄准了大公司,因为我们提供的服务收费比较高,只有大公司才付得起,我们也能够尽快有收入,还能产生品牌效应,所以世界500强企业肯定是我们最先关注的公司。
但这往往是最难的,即使他们相信我们的产品能够为他们预测用户,也会有很多其他的问题阻碍合作,比如说信息安全。在美国,信息安全是非常重要的,我们需要接入客户的CRM(客户关系管理)系统,这些机密的数据企业怎么能够放心交给我们这种初创的小公司。所以我们拿大客户的订单更难。举个例子,我们是微软创投加速器第三期的成员,但是这层关系作用不大。当时杨文杰每天就跟微软销售部的工作人员一样,每天都去上班,在市场营销员工旁边推荐我们的产品,死磕了两个多月,负责人才同意试一试,我们当时签了一系列的保密协议,我们把他们的数据看的比我们自己的还重要,因为一旦泄露对我们公司都是灭顶之灾。有了微软这个大客户后,我们就能够用这个去说服别的客户,有一些品牌效应,后面的路就好走一些。
EW:你们具体是怎么通过算法来实现营销预测服务的?
WC:首先,我们肯定要有数据,数据是基础。这些数据有三个来源,第一是我们从网上爬取来的,第二是从数据公司买来的数据,第三是企业提供的数据。
我们建立了一个庞大的数据库,包含了1100多万家企业的数据,这些数据是我们从数据公司买的和从网上收集过来的。我们用一些自然语言的处理方式,将这些数据结构化,形成能够描述一家公司的指标,然后去分析公司之间的相关性,我们会把与某家公司有关系的,连接形成一个知识图谱。下一步就是连接我们服务的企业的客户关系管理(CRM)系统,这个系统里面有公司已经合作的客户数据及潜在客户的信息。比如说,一家企业有1万个潜在客户,其中通过公司的努力,让其中的1000个转化成为真正的客户,那么我们所要做的就是,找到转化的客户和非转化客户的差异性,以及转化客户的共同特征,根据这些共同特征,我们帮他们去寻找更多的具有相同特征的客户。
这些共同特征就是我们构建算法模型的指标。在我们原来的大数据库,也就是1100多万家公司中去寻找跟这1000家客户最相似的企业,相似程度越高的,我们给它打越高的分,那么销售在寻找客户的时候,就可以先处理分数高的企业,这极大提高了营销效率。
EW:为什么这能够成为一门生意?
WC:因为寻找客户是每个企业的刚需,如何能够更快找到潜在客户并且提高潜在客户的转化率,是每个企业都要思考的问题。在大数据时代,数据已经成为寻找客户最必要的因素,怎么利用这些数据,就需要有专门的团队去使用算法组建模型。
是否每个企业都有能力去组建这样的团队呢?几乎不太可能。我们称从事这种工作的人为数据科学家,数据科学家需要具备三个特质:第一,他能理解商业问题;第二,他能知道怎么使用算法构建模型;第三,他能够将算法和商业问题结合起来去实现实际的应用。这种复合型人才现在很稀缺,而且很贵,我们公司有60多个研发人员,只有10个是数据科学家,所以普通的企业更没有可能花费大量的成本去组建这样的团队了,企业就会寻找专业的公司来帮他们寻找客户。这就是我们的生意。
EW:刚开始你们的产品不被看好,那么是怎么拿到融资的?
WC:我们在投行待了很多年,认识很多投资人,找认识的人去介绍我们的理念,我们的模式很烧钱,很多投行也会有疑虑。后来接触到徐小平,他对我们的模式很认可,然后2013年初我们拿到天使轮160万美元的融资。
刚开始也不顺利,2013年我们产品失败后进行了转型,大数据不是商业模式,它只是方法论,我们后来提出了EverString场景的方向,这个过程是从0到1的过程,很痛苦。那时候我们的钱都已经花的差不多了,我们只能尽量保证自己生存,每天疯狂加班,钱快没了新产品还没成型,真的很焦虑,只能一边开发新产品一边找客户买单。我们摸索出来的这条新的商业模式是行得通的,渐渐有了客户量,赚了一些钱,让我们活了下来。
2014年8月的时候我们找到了A轮投资人,到2014年的时候,一些其他的初创公司也开始进入这个领域,这种模式虽然刚开始,但投行开始看好这个模式,很多投行也投了其他类似的企业,我们也拿到了A轮融资。之后我们就比较顺利,到B轮的时候,我们的客户已经超过50家,还有一些500强的客户,这个成绩让我们在B轮的时候融到了6500万,这应该是当时企业人工智能领域最大的一起B轮融资。我们现在可能不会进行C轮融资了。
EW:在美国是否有遇到竞争?你们的核心竞争力是什么?
WC:竞争肯定会有,早期跟我们类似的公司有Infor,Six Senses,现在跟我们一起处于第一梯队的是Demandbase和Inside Sales,他们基本上业务跟我们是一样的,这个市场很大,至少有50万家潜在客户,但是我们三家现在的客户量都不超过200家,所以谈不上直接的竞争。
现在存在的竞争是良性的,就是看谁的模型和算法准确率更高,所以我们的核心竞争力就是我们的算法模型,提高模型的精确度是我们努力的方向。随着算法经济的流行,将来我们会遇到更多竞争。毕竟这方面的发展空间还很大,很多传统公司也会延伸进入这个领域,我们扩大业务后也会往外延伸进入别人的生态系统。将来竞争必不可免,只能让我们的模型更快更准,才能获得更多市场。
EW:大数据行业存在哪几种商业模式?你们公司是哪一种?
WC:大数据行业现在的商业模式有四种,第一种是做底层平台架构的,比如说阿里云,他们提供大数据的基本框架。第二种是数据的收集平台,比如专门做数据储存的巨杉数据库。第三种是数据分析平台,比如在平台上提供数据分析和数据计算的方案。第四种就是提供一些预测服务的平台,就是通过已有数据去预测潜在客户等,这也是我们现在在美国做的事情。我们的业务主要是TO B(面向企业客户)的,目前主要以金融和科技公司为主,商业模式是很典型的SaaS模式,按年收费,一条产品线一般是10万美元,当然也看数据量,大概分成三个档次,两万到五万一个档次,五万到八万一个档次,八万到十几万一个档次。
EW:中国的大数据行业这两年发展得如何?考虑进入中国市场吗?
WC:中国的大数据行业发展很快,数据基础、数据环境大多已经和美国同步,在一些应用上已经超过了美国,比如中国的电商领域,在数据、性能和应用上都不会比美国差。在大数据的使用程度上,信息交换成本越来越低,信息对称越来越多,这方面没有太大落后。中国在TO C(面对个人消费者客户)这个层面,很多已经超过美国,但是在企业服务领域,可能会弱一点。
其实刚开始我和杨文杰是想要中国、美国市场一起开始,但后来我们发现,美国市场比较成熟,而中国市场还存在很多问题,产品落地很难。第一,我们公司最重要的是算法和数据。数据这一块,中国的公开数据很少,从第三方数据渠道买也买不到多少,因为很多公司的网站不怎么更新,有效信息很少,那么数据能够发挥的价值很小。第二,我们公司做这个业务,需要一些底层技术的支撑,就是企业得有自己的CRM系统,这个系统是企业本身建立的,有了这个系统我们才能够对接到我们的数据库。第三,在中国,付费意识还不普及,市场还不够成熟,比如我们某个单条产品线收费是每年10万美金,这对于美国很多企业来说很正常,但是对于中国的企业来说可能就是很大的数额。所以现在我们还不打算进入中国市场,接下来应该会将业务扩展到欧洲等英语系国家,但是中国是个万亿级市场,我们肯定是不会错过的,等待更成熟的时机我们就会进入。
EW:你之前也提到说到,中国在算法经济上将会在五到十年内实现弯道超车,赶超美国,为什么有这样的预测?
WC:我觉得未来的五到十年是一个战略性的发展机遇。中国有这个商业基础,也有这个商业需求,其实中国的个人互联网应用做得比大多数国家都好,因为中国人口很多,需求很多,商业场景也很多,只要有需求,很快就能够被满足,所以我觉得速度不是太大问题。
问题在于,中国的商业和企业服务领域跟个人互联网不太一样,这个跟国家的经济战略导向有关,之前美国也出现过中国现在讲的供给侧改革,实际上这就是给企业减负,促进创新,寻找新的增长点,那时候美国鼓励大家去西部高科技,硅谷就是那个时期创建的,很快引领了全球的科技创新。中国现在也处于这种改革的初期,肯定会出现一些问题,但都是小的波折,不阻碍整个浪潮的发展,我觉得以中国人的聪明才智和勤奋,可以在这样一段时间内去催生一些创新的东西。
接下来五到十年,是很大的机会,国内的TO C已经很完善,那么TO B有很大的市场,所有的投资人都在往这里看。2015年被称为国内企业服务的元年,因为去年这方面的投资特别多,企业服务的公司数量增长也很多,媒体报道也很多,可以预见的将来,中国的企业级服务一定是会赶超美国的。
EW:如果像您所说,将来算法经济流行起来,中国也进入这样一个算法经济时代,会给企业和个人带来什么改变呢?
WC:首先就是企业人工智能肯定会往更高级的形态发展,未来的企业级服务会将数据和算法结合,直接作为决策的工具,会思考的SaaS才是未来,终极目标是企业之间可以直接对话,对话的语言就是各种算法。
个人层面,物联网普及以后,物联网上的设备会产生大量的个人数据。举个例子,将来每个人都可以通过健康医疗App收集到自己的健康数据,可以通过算法推荐适合的养生建议,可以指导饮食计划和各种健康服务。将来家里的智能硬件也能够收集家庭生活质量的数据,也能够通过算法来推荐各种服务。
商业层面,当算法可以带来经济效益时,肯定会有第三方专业算法服务提供商的模式出现,现在互联网RTB广告行业算是走在前沿,它通过算法来竞价广告投放,那么将来在其他领域,也会慢慢普及,其实未来已经来临,只是尚未流行。