人脸识别:互联网行业的AI革命
2015-10-12姜红德
文|本刊记者 姜红德
在浩瀚的大海中,机器人塔斯赶在海啸之前营救了由安妮海瑟薇主演的女主角,这个看起来像个冰箱的家伙不仅能听懂人类的语音命令,还能识别被救的对象,也能随机改变自己的外形,以加快速度逃避海啸的袭击。
《星际穿越》成功地再次把人工智能(AI)搬到了荧幕,但是在现实生活中,人工智能和实际科学水平还差的很远。近年来在越来越多的互联网公司的参与下,更多的人工智能研究和应用被开发出来,让机器来模拟人脑的运作原理来识别图片、辨别声音和视频等,应该不是一件难事。
“瞄准”人脸识别
在现实中,机器人或其它人工智能能否识别一个障碍物或者某个具体的物品,并不像科幻电影中那么简单。举例来说,从机器人的眼中来看一个杯子,也许只是一个圆柱体,这样的圆柱体有很多,比如瓶子、盒子等多种容器,怎么能判定它是一个杯子,这就需要通过神经网络及深度学习来完成,这一技术目前在互联网行业中非常热门。
通常来说,通过神经网络机器能够模仿人脑的工作来进行各种活动,之所以能够做到这一点主要是通过以下步骤来完成:把某一物品或动作分解成上万亿的不同参量,然后通过自主学习,把这些不同的零碎化的参量重新组合到一起。
拿人脸识别来说,目前根据不同的原理在科学界及企业界诞生了不同的流派,有专门研究面部表情的高级语义信息,也有采用软硬件结合的方法,通过红外线扫描辅助人脸特征扫描来进行人脸识别,但是这些和通过神经网络来识别人脸的技术还是天壤之别。
以深度学习为基础的人脸识别技术背后有一整套的复杂技术支撑,而完成识别需要完成三部曲来完成:首先是人脸检测,在镜头中确定人脸在哪里?其次是关键点检测。在上一步的基础上找准眼眉、耳鼻等脸部轮廓的关键点;最后基于大数据的人脸识别,弄清楚“这是谁”?
针对这三部曲,国际上有一套公认的评测体系:FDDB评测、300-W评测和人脸识别LFW评测。在刚刚过去的2014年,人脸识别领域不断推陈出新,新的技术开发和应用也不断涌现。在国内成立仅两年的创业团队旷视科技在国际公认的人脸识别LFW评测中,以0.02%的优势击败了社交巨头Facebook摘得桂冠,而在刚刚过去的六个月内,他们已经接连拿下分别针对这三项评测的国际冠军。
据旷视科技负责人印奇介绍,公司由三个“85”后的清华学生创建,一直专注于人脸识别领域的应用开发和平台服务。目前公司核心团队由清华大学、美国哥伦比亚大学、南洋理工大学等顶级技术极客组成的研发团队,从既有的互联网合作基础出发(目前已与奇虎360、美图秀秀、支付宝、Lenovo、阿里云等多家互联网公司合作)进而跨入安防领域,未来更好地服务金融、零售等传统商业领域。
以美图秀秀为例,Face++为他们的App提供诸如:人脸检测、人脸追踪、关键点检测技术,可精准定位人脸中需要美化的位置,实现精准自动人脸美化,但这些仅是人脸识别的初级阶段。而在和世纪佳缘的合作中,用户可根据自己对另一半长相的需求去搜索相似外貌的用户,当然这个搜索需要在数据库中进行,既可以是世纪佳缘的数据库、也可以是社交网络上的数据库、更可以是在通用搜索引擎中。
“以图搜图”的功能自从被百度拿来“作秀”了一次之后,很快在网络上形成了关注,找到更好的噱头无疑正是一些互联网企业想要做的事情。Face++也与360搜索达成了合作,在360的图片搜索中使用到相关的技术,不过目前还没看到360搜索推出“以图搜图”的类似功能。
据了解,Face++的创始团队还曾获黑马大赛的总冠军,并在2012年获得联想之星的天使投资,2013年初又获得创新工场的A轮融资,融资规模约为百万美元,2014年他们宣布再次获得2000万美元以上的B轮融资。在这背后,人脸识别及更加广阔的图像、视频等市场越来越受到重视。
试水城市安防领域
在越来越多的日常场景中,我们看到了人脸识别技术的应用。以今年元旦开业的深圳微众银行为例,作为国内首家互联网银行,其对外宣传的重要口号就是:“人脸识别技术加上大数据挖掘可以作为企业或个人获得贷款的重要依据。” 不管结果是不是真的如此,都表明我们通常开玩笑所说的“刷脸”已进入了行业应用。
1月6日,在北京邮电大学举办的第五届中国智慧城市大会上,旷视科技负责人宣布推出Face++系列产品“Face++Security ”,记者现场也被邀请做了一次体验。据了解这款产品具备人脸识别功能,以智慧城市为目标市场,让搭载该技术的智能设备,能够更好的感知真实的物理世界。
在智慧城市安防领域,人脸识别技术具有很大的市场需求。比如在海防及公安领域,执法人员会让被查人员出示身份证并读取身份证信息,然后通过摄像机拍摄被查人员,再进行照片与读出来的身份证照片做验证,同样更可以用于在人员集中场所通过Face++Security技术实时抓取并匹配识别公安部门公开的危险人员;该技术适应了安防领域最基础的两个需求——验证身份与比对危险人员。
旷视科技安防事业部总经理赵军表示,当智慧安防和智慧交通在不断完善公共安全综合管理的物联网平台时,需要视频监控设备不仅仅能“看的见还要识得对",视频监控系统中海量视频数据如何深度应用具有巨大的挑战,无论视频采集、管理还是应用,未来都将通过智能的人脸识别技术获得广泛应用。
对于智能硬件来说,有了人脸识别技术,就相当于机器人能够认识人,不仅增加了人机交互的方式,更让硬件变得更加智能。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的安防领域,它不但可以提高社会运行的效率,也可以大大增强公民日常生活的安全性。
更多的互联网机会
越来越多的互联网企业已经开始提前在人脸识别这一领域布局,包括百度、谷歌、Facebook等企业也都开始小试牛刀,更多的投资者也开始下注。
据悉,百度在人脸搜索领域早有布局,有消息人士称,该研发团队现在硅谷就绪。在此前火爆过一段时间的软件“百度魔图”中,“PK大咖”的功能就使用到了“以人脸搜索人脸”这样的人脸识别技术。除了上述提到的百度、奇虎360等国内互联网公司(主要是搜索领域)在人脸识别的布局,国外各大科技公司也都在人脸识别领域作了储备。
在社交网络领域,2012年6月,Facebook以六千万美元全资收购以色列脸部识别技术公司Face.com,试图实现不用标注就能自动识别照片中的人物,帮助用户分类。但令人遗憾的是,在被收购后,Face.com关闭了其面部识别API,切断了对开发者的接口支持。
与国内外市场中其它主流的人脸识别技术提供商相比,旷视科技最大的不同就在于从一开始就把自己定位成一家互联网公司。在此之前,Face++平台允许广大的开发者们在规定的调用量之下免费使用API,但在超过配额后开发者必须支付相应的费用。Face++平台的服务器在国内架设于阿里云,在海外则另将服务器架设在亚马逊公司的云服务中,这两大输出端口都需要旷视科技公司支付日常使用费用。
但很快,团队发现他们向开发者收费并不利于人脸识别技术的推广,而且同为创业公司,他们也最能理解创业初期遭遇的盈利难困局。因此团队最终决定不再限制开发者对人脸识别技术API的调用请求,而免费也标志着旷视科技正式完成向互联网公司的完全过渡。
截至目前,Face++平台已经收到超过两万名开发者的调用请求,API累计调用次数则超过了2亿次。这其中不乏一些知名产品和他们建立紧密的合作关系,譬如奇虎360搜索界面中的“识别美女”功能,美图秀秀和美颜相机的人脸器官定位功能,还有世纪佳缘根据审美标准寻找近似的伴侣功能,都是基于Face++人脸识别技术开发出来的。团队预期,越来越多基于人脸识别技术的创新应用还会不断显现。