APP下载

Orbeus:给计算机一双慧眼

2014-06-06左言

新财富 2014年4期
关键词:图像识别人脸计算机

左言

在图像识别这个大热的计算机细分领域里,创业公司Orbeus抓住Facebook收购Face.com的契机,以开放的API平台填补了市场空白,在积累了海量数据的同时,也为自己招揽了B2B客户。身为CEO的李轶和她的小伙伴们携手打造着计算机视觉技术的一站式服务平台,梦想着“用图像识别技术给生活带来一些改变”。

初见李轶,很难将这枚85后女子与CEO的头衔联系在一起。事实是,她已经和自己所在的创业团队在当今计算机世界最火的图像识别领域里一起打拼了两年多—Orbeus这个名字,虽然对大众来说还相当陌生,但在业内,已经是一块响当当的招牌。

对于这个评价,李轶却表现得相当谦虚:“其实我们本身没有多优秀,或是想法有多独特,只是团队的成员一直都很坚持。坚持着坚持着,对手就倒下或离场了。”作为进入美国顶级孵化器的首个全华人团队,他们的创业故事显然没有李轶口中说得那样轻松。李轶更喜欢将之称为一个“学习的过程”,学习将技术打包成产品,学习向不同的人推销Orbeus,学习把最初的想法一步步变为现实、一步步向商业化推进。

目前,Orbeus的团队已经教会了计算机识别不同的场景、物件和人脸,在2014年3月27日的Macworld/iWorld大会上,它推出了第一款“杀手级应用”—基于iPhone的智能相册App,开始正式进军客户终端。而在完成了近160万美元的种子轮融资后,Orbeus的A轮融资计划也将于2014年5月开启。

从最初参赛的孵化项目到正儿八经的事业,从API开放平台到B2B的授权服务再到终端应用,李轶和她的小伙伴们一起携手打造着计算机视觉技术的一站式服务平台,朝着“用图像识别技术给生活带来一些改变”的愿景努力着。

“赋予计算机神奇的能力”

“我们的目标,是让计算机拥有更好的视觉识别能力,让它特别的神奇。你知道,就像水晶球那样。”李轶笑着说起公司名称的由来,最初,爱玩游戏的男生们想到了游戏里的关键道具:能洞察前世今生的水晶球orbe,又因为是企业成立在美国,于是就有了orbe+us=Orbeus,“后来居然发现这个单词还能拆开谐音成all(or)be us。所以,就是它啦。”

计算机视觉技术,简单说来,就是教会计算机分辨出照片或视频中的元素:这是条狗,那是块表;这是聚会,那是沙滩;这是都教授,那是卷福;这是悲愤,那是兴奋????迄今,Orbeus基于深度学习的图像识别系统已经可以识别出数千多类物体、场景、人脸,当然还包括表情。而最早,Orbeus的创意来自创始人之一的王蒙。

当年在YouTobe实习的王蒙意识到,该网站每分钟上传的视频超过150个小时,但人们对其理解完全不够,广告的投放往往是根据人们的浏览习惯和链接的导向,其中充斥着了大量的错配。如果能教会计算机识别图像,加强人们对海量视频数据的理解,对广告匹配和精准投放都会大有裨益。王蒙的想法很快得到了身边朋友的认同,大家准备一起把项目打包参加创业比赛。

彼时,在美国研究生毕业的李轶已经在一家技术咨询公司工作了一年多,正徘徊在回国工作和自行创业的选择之间。由于人脉广,她受托替Orbeus找一位负责商业拓展的搭档。“我自己就可以啊!”第二天,她打电话给团队的其他成员进一步了解情况,第三天,就买了张机票从波士顿飞到芝加哥。

2012年1月,Orbeus的6人团队正式组建—6个清一色的85后,在硅谷一栋兼做工作室和集体宿舍的别墅里,开始了朝夕相对的创业生涯。“现在,我们有两栋别墅,10个成员。”

深挖API平台的价值

Orbeus的契机出现在2012年中。当年6月,Facebook收购Face.com的举动在业界掷下了一枚重磅炸弹。被收购前,Face.com已经在图像识别领域里耕耘了四五年,拥有一个公开的API开放平台,免费提供给第三方使用。“由于收购后传闻要关闭这一平台,在相关的网络社区和论坛引发了一系列的讨论。这让我们看到了机会。”

在此之前,Orbeus的商业计划案不仅在一系列创业赛中赢得了名次,并且进入了美国顶级孵化器Excelerate Labs。

“孵化的第一个月,每天要与6-7位投资人或是行业领袖进行头脑风暴,细化、修改最初的创意想法。他们每个人都很资深,因为不同的人生和行业经历有很多很棒的想法。”回忆当时,李轶依然有些抑制不住的激动,不觉加快了语速。做加法的确能让人激动,可也得面对做减法的痛苦。

“最后,我们决定维持初心。做视觉识别,包括对图像内容的理解。”由于坚定了方向,扎实做技术研究,因此,当Face.com于2012年6月被收购的消息传出,Orbeus火速跟进。“能收购的都是有钱的主,而一些小公司,譬如一些硬件厂商,前期开发投入很多,它的产品完全是基于Face.com平台开发的,急于寻找替代品。”

2012年7月初,Orbeus开始着手搭建自己的API平台。一个月后,其API平台正式上线。由于填补了市场空白,也因为技术扎实,“在未做任何推广的情况下,就获得了相当大的关注,包括美国不少主流媒体均做过报道”。一些开发者亲身体验后发表的评论或博客,也成了Orbeus打响招牌的免费广告。

如今,这个开放的API平台已经成为了Orbeus商业模式不可或缺的组成部分,它完全向第三方开发者开放,让他们把图像识别技术嵌入到任何可以让它发光发热的领域—社交网络、电子商务、市场营销、图片视频整理等。

“最开始,只是觉得这个平台能积累一定的技术优势,有开发者发现技术上的漏洞,大家会一起想办法解决,一起改进。”然而,随着接触的客户越来越多,李轶发现,API平台的重要性绝不仅于此。

首先,它提供了一个积累海量数据的绝佳场所。“在预定好的程式里,算法可以工作得很好,但在生活中的场景,就未必有那么好,因为它没有专门针对那样的数据进行过调试。再者,像机器学习,算法再好,最终也只能占到整体表现的五成或六成,很大一部分成果取决于海量数据的训练。”李轶的信息管理专业背景此时开始发挥长处。“开放API之后,数据量增长非常快”,这些海量的数据本身就在Orbeus和其竞争对手之间形成了天然的屏障,“要开发一个新功能,有那么多训练库里的数据,包括是和生活接近的数据,都可以拿来学习”。endprint

不仅如此,开放的API平台还为Orbeus的第二块主要业务—B2B授权应用,直接带来了客户。事实上,很多公司客户都是通过API平台知道Orbeus的,甚至他们的技术工程师本身就是API的用户,“个人和企业用户其实是有交集的”。Orbeus的B2B用户分两方面,一是对方需要个性化订制,主要包括视频处理的公司和网站;二是对方需要单开一台专门的网络服务器,“但对我们的运营来说,其实差别不大”。

API平台也提供了审视最初各种想法的另一个视角,“我们可以通过它清楚地知道客户使用了哪些功能,他们的真正需求是什么。之前很多想法都是拍脑袋想出来,看上去很酷却不一定有很大的市场需求”。

开放的API平台还简化了流程,减轻了Orbeus团队的压力。通常情况下,大公司提供个性化服务,一开始就要做测试,而对小团队来说,这种打法不仅难度不小且代价挺高。“如果花费两三个月时间帮对方做集成测试,整个公司的进程就会拖慢很多。”而API平台的存在,可以从一定程度上解决这一问题—“在双方进入真正的商务合作之前,企业客户可以利用API平台自行测试,因为它的标准是公开的。如果测试后,在对精度和其他表现满意的基础上,双方再进一步详谈。”目前,Orbeus的B2B收入有很大部分用来支持研发。

探索生活中的用武之地

对普罗大众而言,Orbeus所掌握的计算机视觉技术离日常生活似乎有些远。李轶笑着解释道:“视觉是相对底层的技术,有很多应用的可能”。过去一年中,Orbeus为Google Glass的开发者推出过支持人脸识别的SDK,向不少App开发者提供了技术支持,还和松下、AMD等厂商达成了合作,一步步让技术落地,走近生活。

由Orbeus提供技术支持的Facebook应用The Hottie Finder,能选出朋友圈男女生中最好看以及最不好看的五名,用户可以发私信通知对方,或在Facebook主页上公开,供朋友间玩笑。甫一推出,就掀起了热潮。

在API平台,Orbeus也尝试推出了“美丽度”功能,除了五官以外,用户上传照片的拍摄角度和光线都会影响系统的评分。这一应用获得了不少相亲网站的关注,包括在业内颇为知名的Match.com、Datingasian.com以及巴西最大的相亲网站都相继采用。虽然有些只提供给付费用户使用,但每家都会提供一个“美丽度”排名,供用户选择,有些还提供结合外表和受欢迎程度的综合排名。

相亲网站也是目前图像识别技术公司主要的合作伙伴之一,最简单的应用就是检测用户上传的头像是否包含人脸。李开复旗下创新工场所投的Face++即为世纪佳缘(DATE.NDSQ)提供人脸搜索及匹配技术,结合海量数据库,寻找与用户上传照片最相似的所谓“夫妻相”异性。其还为图片处理软件美图秀秀提供人脸和关键点检测技术,在图像中精准定位人脸和五官位置,从而进行人像美白、五官美化等处理。

事实上,图像识别服务市场有着非常大的潜力,陆标识别是其中较被看好的一项。英剧《夏洛克》第二季中,大反派戴着一副神奇的眼镜,当他望向一个人时,眼镜上就会显示其相关信息,包括体重、血型、亲属关系,甚至弱点。陆标识别虽没有如此神奇,但也颇有点异曲同工的味道。游客戴着Google Glass去伦敦旅行,当看到某个景点时,相关资料就会直接弹出,告诉游客这是威斯敏斯特大教堂,以及它的背景。

再比如,“今天我觉得你的包包很漂亮,就可以直接拍照上传到网络,某款内置了图标识别技术的App就能按图索骥推荐类似款,或是直接找到这款包包。”试想一下,当计算机能够读懂你在社交网络上贴出照片中的所有信息,知道你的爱好,了解你的口味,熟悉你的朋友,向素食者推荐牛扒餐厅、向未婚青年推送奶粉广告的事儿还会发生么?

“我们先掌握对人脸的识别,再是对物体或场景的识别。当这是谁、在哪儿、干什么这三个要素都齐备之后,才会考虑打包成核心的、面对终端消费者的产品。”李轶边说边打开随身的苹果电脑,展示Orbeus新产品智能相册的demo。

无论是照片还是视频,其实都自带信息,当人们越来越倾向于更多地用图片来记录生活,海量的照片给筛选制造了很多麻烦。因此,李轶口中的这款“杀手级应用”综合了搜索加管理的功能,其最终目标就是让这些照片自动按照人物、自然风光或食品分类,集成至相应的文件夹。

“从iPhone手机端开始,根据用户的反馈进行修改,随后推出PC和安卓版本。之后还会接入各种社交媒体,管理分散在各个网络上的照片。我想这能在很大程度上节约每个人的生活成本。”对于产品乃至Orbeus的未来规划,李轶显然已是成竹在胸。

命系隐私?

不过,对于一家处于起步阶段的创业公司而言,显然还有很多东西不在他们的掌控之中。Orbeus因为涉及人脸识别,隐私保护是个绕不开的话题。

早在2011年,Facebook就在欧洲市场引入人脸识别功能,其扫描了用户上传的数亿张照片,对用户和好友建立了人脸特征数据库。根据这一数据库,用户未来在上传新照片时,Facebook将会自动提示是否根据其中的用户名字标注标签。面对欧盟官员的压力,Facebook最终关闭了这一功能,并删除了针对欧洲用户建立的人脸数据库。Facebook收购Face.com,再度引起了人们对隐私保护的担忧。而谷歌更于近期明确提出,禁止在Google Glass上开发具有人脸识别功能的应用。

这会否给Orbeus的未来发展蒙上一层阴影?对此,李轶很乐观。目前,这并未对整个图像识别技术行业带来直接的负面影响。而且,谷歌的举措应该也只是暂时的。毕竟Google Glass是一款平台级应用,如果不能从一开始就做好监管把控,难保未来不会混杂侵犯用户隐私的应用。长远看,这显然不利于行业的发展。

而且,“人脸识别可以有很多轻量级的应用,不一定要涉及隐私。”李轶介绍道,Orbeus和松下合作,在其大阪商场的产品展区安装了一款摄像头,用来捕捉消费者的表情,在解读为“兴奋”后,一旁的电子显示屏就会自动推送有关这一产品更详细的介绍。这一应用不仅能及时掌握消费者对新产品的喜好,还能搜集类似“25-35岁亚洲女士”这类信息。“如果得以完善和普及,它显然可以代替传统的纸制调查问卷”。

“还有世界上最恼人的闹钟,眼睛必须对着它睁开5秒以上才能关闭铃声,利用的也是计算机对人脸关键点的检测技术。”

李轶和她的小伙伴们显然并不需要这样的闹钟。由于飞机晚点,采访当天的凌晨,她才从北京飞抵深圳,之前则是美国到中国20小时的长途飞行。而“中美商业模式论坛”只是她回国两周行程的第一站,之后还有厦门和北京,排得满满当当,“也许只能趁周末飞回老家看看”。支撑她的或许是种叫作梦想的东西,但李轶说得很轻描淡写,“因为我是在做自己喜欢做的事情”。

李轶和Orbeus的团队正在做的事情,他们的竞争对手也在做,其中包括了Facebook和谷歌这样的大拿。如何面对图像识别技术领域越来越激烈的竞争?

李轶很坦然:“其实,即使再坚定地做一件事,也难免会有小小的动摇,只是我们团队整体上是坚定的,你犹豫的时候别人是坚定的,他犹豫的时候我是坚定的,大家互相鼓励,就这么坚持了下来。”这个看似有些答非所问的回答,也道出了创业企业的二字秘诀:坚持。

至于竞争,李轶引用了当年孵化器里一位导师的话:“不需要去面对竞争,只要做这个潮流的领军者,就足够了。”在一个新兴的领域里,竞争对手发挥着不可忽视的预热市场、教育用户的作用。“站着站着,不是你赢了对手,而是对手走了。”

对于本文内容您有任何评论或欲查看其他资本圈精英评论,请扫描版权页二维码,下载并登录“新财富酷鱼”和我们互动。endprint

猜你喜欢

图像识别人脸计算机
基于计算机视觉的图像识别技术研究
玻璃窗上的人脸
中国计算机报202007、08合刊
人工智能背景下图像识别技术浅析
中国计算机报2019年48、49期合刊
中国古代的“计算机”
智力考场:有趣的图片测试
基于字典学习的正则化鲁棒稀疏表示肿瘤细胞图像识别
图像识别交互系统
“领家系”可爱脸VS“高冷系”美人脸