只做刷脸一件事 成了总理座上宾
2017-05-30廖红阳
廖红阳
1988年出生的印奇,带领旷视科技有限公司,仅用6年时间,凭借先进的人脸识别技术和商业布局,就发展成为中国人工智能领域的“独角兽”公司。在去年底完成1亿美元的C轮融资后,旷视科技已达到20亿美元的估值。
紧盯前沿
85后创业者印奇是一位高材生,毕业于清华大学“姚班”——一个由图灵奖得主姚期智主导创立的计算机精英班。和印奇一样,在旷视科技的团队中,超过80%的员工来自清华园,可谓高手如云。其中80%以上是工程师,30多人至少获得过一项世界级编程比赛奖项,获得国际奥林匹克竞赛金牌的有7人,他们大多数有海外留学和专业机构工作背景。这个由高素质人才组成的智囊团队,为旷视科技提供了强有力的智力保障。
说起创业缘由,不得不提印奇在MSRA(微软亚洲研究院)的工作经历。从大学二年级开始,印奇就在MSRA学习,参与人脸识别引擎的研发,出于对该项技术的热爱,毕业后印奇又在MSRA全职一年。正是在此基础上,印奇决定成立以人脸识别技术为核心的科技公司。很快,他找到同班同学唐文斌,向他提出自己的创业想法。印奇和小唐都是理科出身,一个擅长科研,一个更偏于工程化,能够优势互补,两人一拍即合,并将学弟杨沫也拉拢到他们的创业队伍中来。
2011年10月,旷视科技有限公司正式成立,团队成员最初的想法是从人工智能技术出发,研制出“机器之眼”,并用它读懂世界,这是大胆的设想,更是一次零起点的创业。由于在创业大赛中的出色表现,公司在短短两个月内便获得联想之星几百万的天使投资。
但此时,印奇又有了新的想法。人工智能技术包括硬件和软件两方面,软件背景出身的印奇希望能够补全硬件方面的知识。没过多久,印奇就踏上哥伦比亚大学的求学之旅。他一边在校攻读3D相机方向的博士,一边还要处理远在大洋彼岸的公司事务。尽管明确了视觉识别的方向,但如何让技术落地还有待探讨,在留学期间,印奇一直与团队保持远程视频和通话。
最初他们开发了一款基于iOS移动体感的名为“乌鸦来了”的小游戏,在游戏中,玩家通过摇晃头部,操纵游戏中的稻草人,从而拦截从天而降偷食的乌鸦。背后的技术原理是,用摄像头拍摄玩家的身体活动,通过人脸识别和人脸追踪等视觉识别算法判断人物的运动姿势,从而操纵游戏角色。这款游戏获得了清华大学第三十届“挑战杯”特等奖,一度位居中国区APP Store排行榜前五位。但这一成绩并未给印奇团队带来多少实质性收益,仅仅几千元的盈利收入让他们意识到,以技术起家、不了解游戏市场的他们并不适合做一家游戏公司。此外,Facebook收购以色列人脸识别技术公司face.com这一事件也给三人提了个醒:他们所掌握的人脸识别技术有着巨大的市场空白,市场潜力不容小觑。因此三人重新回归“技术”本位,悉心钻研这一前沿科技。
由于相隔万里,团队交流和公司管理极为不便,2013年,在完成两年的博士学习并达到预期目标后,印奇毅然决定结束学业,回国全职创业。
技术至上
技术理想变为商业现实的创业之途并不平坦,虽然怀揣着人脸识别这一高端技术,但由于人工智能的行业应用市场还未得到充分开发,创业团队又缺乏实战经验,如何使公司商业化运作成为摆在印奇他们面前的一道难题。一開始,他们走娱乐化路线,利用人脸识别技术满足女性对美颜的刚需,使美图秀秀成为公司最初的种子客户,此外,阿里、360、陌陌、Camera360、魔漫相机、世纪佳缘、联想等一批大型图片、社交、设备类企业也相继汇聚到旷视科技的生态进化链条中。
2014年,团队发现人工智能为传统行业赋能的商机,采用了to B(对企业)的商业模式,在互联网、金融、安防、智能零售等领域拓展业务。只要一部智能手机,无论何时何地都可以“刷脸”开户,这样的“开户神器”为券商在竞争中赢得砝码。随之,平安银行、中信银行、江苏银行等纷纷与旷视科技签订合作协议。在完成B轮4700万美元的融资后,旷视科技又聚焦到金融行业的人脸认证、智能监控、智能家居等应用领域。两三年间,数十亿次外部信息的接收,不断优化旷视科技的人脸识别算法,使它的性能和用户量都达到国际领先地位。
被人脸识别技术广阔的发展前景所吸引,旷视科技被马云选择并合作。作为阿里的战略合作伙伴,旷视科技负责为支付宝开发人脸识别模块。2015年3月16日,在德国汉诺威IT博览会上,马云亲自为德国总理默克尔和中国副总理马凯两位贵宾,演示了蚂蚁金服的Smile to Pay扫脸技术,并当场刷自己的脸在淘宝网上购买了一枚1948年的汉诺威纪念邮票。这套由蚂蚁金服与旷视科技合作研发的“刷脸”系统,在购物后的支付认证阶段通过扫脸取代传统的密码输入,其识别率超过99%。
原创“刷脸”
在印奇眼里,过去六年,旷视科技只做了“刷脸”一件事,在人脸识别技术的商业化中,旷视科技完成了从技术研发到产品化再到商业化的过程,目前平台在全球已拥有2.1亿实名认证客户。
要使人脸识别技术顺利实现商业化,技术研发是基础。带有浓厚极客氛围的旷视科技将技术视为核心竞争力,在内部设有专门负责基础研发的研究机构。人脸识别功能的背后技术是深度学习,本质是标准化,因此技术壁垒的堆高需要遵守快的准则。除了与同行竞争发展速度,与黑色产业的赛跑也在所难免。在金融业,犯罪分子通过伪造身份信息或盗取他人身份信息进行诈骗,作为金融业人脸对比和活体检验技术的提供者,旷视科技必须与黑色产业进行正面较量。其市场总监谢忆楠提到,公司员工会潜伏在黑色产业群中,只要群里有人兜售破除人脸识别系统的技术,谢忆楠的同事就会主动买下,以便更好地研究黑色产业所使用的破解技术,有针对性地补上漏洞。
过去,3D假体面具、播放人脸视频等冒充手段或许可以骗过人脸识别系统,但随着技术的精密化处理,这些阴谋现在已经无法得逞了。旷视科技开始做人脸识别签到机时,使用五点来识别身份,分别是两个瞳孔、鼻尖和两个嘴角。因为识别点少,系统识别灵敏度不高,如果识别对象换个发型、戴个镜框眼镜,就可能识别失败。但现在,根据人脸识别系统的算法,旷视科技识别用户面部的特征点已经达到83个,甚至不需要用户配合看镜头,这就为人脸识别技术开拓了另一个可能的应用领域:安防。
印奇认为,一个人工智能创业公司除了掌握技术外,还要走商业化道路,技术平台、商业落地的方向两者缺一不可,唯有如此,才能最终快速实现数据循环。只有在商业模式、数据模式上形成网络协同效应,公司才有可能形成行业壁垒,避免同行的技术赶超。
旷视科技涉及上亿人的刷脸,通过云端平台FaceID.com,旷视科技打通了Smart ID的线上和线下。无论是线上的账号,还是线下的一张卡,一把钥匙,或者一个智能门禁,都可能成为虚拟化的入口。旷视科技比较有代表性的客户包括支付宝、Uber、万科等,万科是旷视科技在线下化的体验,未来会实现一个智能园区。此外,旷视科技覆盖了几乎全部的移动出行领域,用来帮助平台对司机身份进行审核。不难预料,未来在快递、物流行业等越来越多的现实场景中,也需要這样一个刷脸平台,把互联网用户变成高附加值的商业互联网用户。
至于线下刷脸,在我国地铁、飞机场、火车站等人流量较密集的场所,都分布有旷视科技提供的人脸识别系统,可用于交通综合治理或者追捕逃犯等。在安防领域,刷脸技术有更多应用的空间。旷视的“天眼”系统和公安部门合作,搭建了“三逃”人员的身份证图片库,通过公共场所的监控摄像头,进行实时比对。除了确认面部特征外,刷脸系统还会根据身高、体重、步态、穿着等进行综合判断。一旦摄像头中的人脸与数据库相匹配,系统就会瞬间报警,公安部门则会立即响应,进一步确认。不仅是抓捕逃犯,在人脸识别系统的帮助下,安防体系还会逐渐向事前、事中推进。比如,如果一个人在车站的出现频率超乎正常旅客的范围,又非车站工作人员,就要考虑是扒手的可能性。人脸识别技术和遍布的智能化监控摄像头相结合,使得一个“7×24”小时监控的庞大系统成为可能。
综合线上和线下的场景,旷视科技所做的就是用刷脸的方式来结构化物理世界,提取所有商业场景中由人产生的身份和行为等信息,以打通线上线下商业数据、传递商业价值。
事实上,在现阶段,任何一家人工智能公司都不太可能覆盖多个行业。这里涉及到“+AI”和“AI+”两个概念,“+AI”是指人工智能公司实际上并没有深入到任何行业,而只是给一些行业应用者提供了深度学习的能力或者作为某一项技术的外包方而存在;“AI+”是指人工智能公司能够与行业深度结合,并使其成为由AI驱动的新行业,比如新金融、新安防。印奇认为,在过去一年时间里,第一批人工智能公司都在完成自己的商业化尝试,但至少到2018年底,这些商业化尝试的效果才能凸显出来。
旷视三步
自2011年成立至今,旷视科技已由3人的初创团队发展到一个有着70多人团队的“独角兽”公司,规模称不上大,却面临着很多竞争对手。在旷视科技获得1亿美元融资之后,2017年7月,同以人脸识别为主营业务的商汤科技宣布完成4.1亿美元融资。
在印奇看来,激烈的竞争并非是坏事,有竞争,才有进步。他将竞争对手分为三类:一类是近几年在人工智能资本泡沫催生下的新公司,其中不乏在人脸识别垂直领域做得较好的公司,但在短期内不会对旷视科技构成威胁;一类是人工智能技术排在前列的外国公司:谷歌、Facebook、亚马逊;一类是行业内的竞争对手,例如安防行业。印奇表示旷视科技现在规模还比较小,切入点也与那些大公司不同,因此还需要一段时间的沉淀。
除了应对外部激烈的竞争,旷视科技还面临科学技术与伦理道德相互博弈的挑战。近年来,随着技术的不断进步,人工智能领域已经引发了人们对于个人隐私泄露的担忧。在一些国家,在十字路口抓拍违规行为都被视为侵犯隐私。
作为人脸识别技术的研发者,印奇始终坚持主流的“技术中性论”,他认为技术本身没有对错,关键是如何进行使用,法律法规和社会价值观都可以引导人们正确地使用原本中性的技术。此外,他还相信,技术本身的发展也可以打消人们对于隐私泄露的顾虑。比如,一切私人场所的个人数据都需要被当事人授权后,才能被采集和使用。个人数据需要经过脱敏处理才能入库,一张有姓名的照片会被隐去名字,以内部ID号储存,公开数据则依赖于系统自身的训练和提升。印奇认为,与技术本身相比,真正掌握技术的人所选择的方向更为重要。
旷视科技将未来战略分为三步:识人、识图和机器大脑。识人即人脸识别。识图即万物识别,包括人脸、车辆、行人、文字等,这些信息是图像中最有价值的部分。如果能够实现对车辆、行人和交通标志牌的识别与计算,无人驾驶汽车就会呼之欲出。将视觉推而广之,实现更广义的机器思考,就是机器大脑。
提及未来的技术时,印奇预测,未来20年内,人工智能将是最重要的技术,很多科幻片里的场景都可能成为现实。感知型技术也就是语音和视觉技术,成为目前亟待攻克的AI技术,包括视觉的感知与理解、语音交互和自然语言理解,因为这关系着机器能否看懂世界并与人进行交互的重大命题。解决了这两个问题,其他问题都可以迎刃而解。