APP下载

人工智能创业,向需求要效益

2017-06-24姜姝姝

机器人产业 2017年3期
关键词:语音人工智能客户

□文/姜姝姝

人工智能创业,向需求要效益

□文/姜姝姝

姜姝姝

本刊副总编辑

人工智能(AI)创业的外部条件比较有利,但是时机合适不合适还是要看自身。大公司解决人类的大问题,中小公司负责行业内的纵深。用户有需求的地方,就是AI落地的方向。

to C还是to B并非艰难的选择

“它可能是历史上最好的事情,也可能是历史上最坏的事情。”剑桥大学应用数学及理论物理学系教授,当代最重要的广义相对论和宇宙论家史蒂芬·霍金在剑桥大学新莱弗尔梅未来智能中心里这样评价AI。

这并非霍金第一次在AI问题上表态,但这一次霍金肯定了AI的积极影响。“人们可以通过创造智能来进入一个有积极效应同时未知的世界。我们或许可以通过新技术改革的工具来消弭工业化对自然世界的伤害。人类最终需要达到的目的是消除疾病和贫穷。”

与科学家的审慎不一样,产业界盛产的是“野心家”、“冒险者”、技术派的初创团队迅速行动。从全球创新中心的美国硅谷来看,自2011年以来,开发与AI相关的产品和技术并使之商业化的公司已获得超过总计20亿美元的风险投资,而科技巨头更是投资数十亿美元收购那些AI初创公司。在有着一流人才的中国,AI的创业大潮也大规模启动。

“公司的正式运营是从2014年8月开始的,当时投资人和创始人团队都认可智能语音是下一个风口。”极限元联合创始人马骥说,语音是极限元起步时做的第一个方向。一方面,深度学习技术的突破引发了语音技术的新变革,尤其是识别率和合成效果得到了大幅提升,行业中也出现了一些新增需求;另一方面,极限元的创始团队中也有来自中科院以及清华大学的语音技术人才。

人工智能领域,技术创业者如果只定位做技术提供商,而不直接面向用户/客户提供整体解决方案,未来价值会越来越小,不往上游走风险非常大,甚至是死路一条。这是前段时间,迅雷创始人程浩振聋发聩的总结。

和程浩持有相似观点,马骥所在的这家公司创业之初就定位在以需求为导向,虽然在大AI领域并不高调,但是三年来稳打稳扎,成为AI创业公司中明显具备商业化能力的代表。

一开始他们就确立了to B的方向,公司在确定语音前期的产品化和工程化工作大概用了半年时间,2015年下半年,极限元开始交付一些语音技术项目,和语文出版社的合作是最具代表性的一例。

众所周知,在语音智能的领域,前有科大讯飞等“老”公司,也有BAT、搜狗等的抢位,类似极限元这类还有机会吗?“大公司解决人类的大问题。”马骥说,AI的生意在于to B的领域,大公司面向to C的免费模式,和AI领域的创业不一样,虽然深入行业的量不大,但是足以承载这些小公司的业务。

这个观点和创新工场创始人、CEO李开复的说法很像,“人工智能是to B的生意,AI时代工程师和to B的一个协作,不可能快速带来千万的量,所以希望业内不要将人工智能的估值炒得过高。”

以to B的需求为导向,是极限元对自身的定位。这样的定位也决定了极限元能用两年多时间,将语音和视觉等一系列技术应用于教育、电信、电力、娱乐、视频、驾驶等众多领域。

初创公司的数据门槛如何跨越

AI并不是一个新的概念和领域,但是重新火起来,是因为出现了一系列复兴AI研究进程的要素,尤其是GPU、大数据、云计算和算法。

极限元联合创始人马骥

大数据是AI发展的助推剂,这是因为有些AI技术使用统计模型来进行数据的概率推算,比如图像、文本或者语音,通过把这些模型暴露在数据的海洋中,使它们得到不断优化,或者称之为“训练”。无论是吴恩达曾经选择加盟百度还是李飞飞进入Google,一大原因都是要到“数据最大的地方去”。

而从技术发展的角度来看,随着Google TensorFlow等生态系统的成熟,很多领域都会有训练好的模型可以用来参考,创业者只要有足够的数据来训练参数就好了。所以数据的壁垒,似乎成了AI创业中难以迈过的槛。

数据壁垒有两个方面,一个是量,一个是质。马骥说,在数据量上面,BAT大公司天然有一些行业优势,对于创业团队来说,在量上面也是局限所在,而在质上面需要有效性。极限元在这方面设立数据岗位,去获取需要的数据,另外与数据供应商合作,互换有无。“最重要的一点是我们以toB垂直行业的用户定制化需求为主,行业用户本身会为我们提供大量数据。”

BAT的优势在于通用数据,但是在深入的垂直行业中,数据的优势可以掌握在方案提供商手中。

方案提供商其实是有别于单一技术服务的,刚刚开始创业时极限元也跟国内其他一些智能语音公司类似,把语音合成和语音识别技术以SaaS服务的方式部署在云平台上,借此吸引一些移动应用、智能硬件的开发者和创业团队,从而发掘潜在的优质客户。但实际情况并不如预期的顺利,不仅无法获得现金流支持,也不能真正接触到优质客户。

因为有切实需求的客户要的是完整的解决方案,而单一技术只能满足客户局部的技术需求。理清思路后极限元迅速在直播领域找到了突破方向,通俗的说就是“鉴黄”。这套互联网音、视频有害信息监测系统是针对互联网直播平台的涉黄监测技术方案,通过AI图像识别技术发现视频直播中的涉黄信息并给予平台警告,监测系统除图像识别外还加入音频监测技术用以监测语言类直播内容,音、视频双通道监测方案已经在国家网络监管部门成功应用。在这样的方案下,极限元也积累到了真正的行业大数据。

挖掘最有价值的垂直细分行业

对于语音智能、图像识别这样的技术服务来说,基本能服务所有行业,那么如何在其中选一个行业,深入扎进去做产业链的挖掘呢?极限元的想法是,会仔细分析客户所在的行业是否存在同样的技术需求,以及行业内是否有一些普遍存在的行业性难题亟待解决,有针对性的为整个行业用户提供技术解决方案,由点到面,从服务单一客户过渡到服务于整个行业。

这就意味着不仅要完成一个客户的需求,还要发掘行业中类似需求的共性,把成熟方案复制到同行业的其他客户需求上,把自己研发投入的回报率做到最大化。一旦找到了这样的可复制方案的行业,就不仅能在商业上吃透这个行业,还能在技术上通过横向合作不断获取行业数据来夯实技术。

行业解决方案一方面可以不断提升服务品质,保障技术服务能力,另一方面不断将产品线服务的对象延伸到产业上游。马骥说,谁越靠近上游的消费者,谁越接近终端消费者,谁的话语权就越高,“我从华为出来,华为都是只领先半步,不领先一步,因为领先半步是先进,领先一步是先烈。”

深入行业的解决方案也意味着靠近这个行业的用户,从直播行业出发,如何靠近用户?极限元想到了“服务”主播,不仅提供了便于互动的“音视频互动系统”,最大限度地还原人与人面对的场景;为了解决该问题,极限元推出了集美颜、动画特效、水印、人脸道具等视觉特效增强功能。

真正的需求都是来自对行业的深入了解,极限元除了直播领域,还试水了疲劳驾驶检测仪。这是针对交通行业的疲劳驾驶检测智能硬件产品,它可以检测用户在开车时是否存在危险驾驶行为,并进行语音提醒。

但疲劳驾驶检测仪虽然是智能硬件产品,但并非面向C端,而是to B的产品。极限元将产品提供给一些客运、货运、危险品运输公司、保险公司以及交通监管部门,在语音提醒司机正在危险驾驶的同时,还会将图像、GPS、时间、车况、路况等信息传输给大数据平台,为用户提供数据分析服务。

从行业到数据再到用户,这样的闭环,对于AI创业公司,是一个良性的模式。而这一切的出发点,是对真实需求的挖掘。“现在人工智能面临的问题是闭门造车,然后去市场上找对应的客户,这样是不对的。”作为AI领域的从业者、创业者,马骥再次提醒着新入场者,“AI创业的外部条件比较有利,但是时机合适不合适还是看自身,有没有针对行业的解决方案,能不能快速拿出可以真正落地的技术。”

手机扫码阅读

猜你喜欢

语音人工智能客户
微信语音恐惧症
五招教会你做好客户转介绍
魔力语音
Magic Phonetics魔力语音
陪客户喝酒后死亡是否算工伤
2019:人工智能
对方正在输入……
人工智能与就业
数读人工智能
下一幕,人工智能!