旷视科技拿了你的人脸数据吗?
2020-09-17徐庭芳
南方周末记者 徐庭芳
人们对个人隐私被侵犯的问题,已从懵然不觉转变为高度敏感。 新华社记者 ❘ 邵瑞 ❘图
人工智能的核心在于数据,算法的形成最终也取决于数据量的大小,可供参考的数据越多,算法也就越精确,人工智能的学习结果就更为准确、高效。
对方仅仅拥有了你的面部信息并无用处,关键是要与你个人形成关联,知道你是谁,把你的银行账户和头像进行匹配,进而造成伤害。
近日,创新工场董事长兼CEO李开复在名为“HICOOL全球创业者峰会”的演讲中提到,曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据。
旷视科技(简称“旷视”)是国内知名的人工智能AI创业公司,与商汤科技、依图科技、云从科技共同被称为国内的“AI四小龙”。李开复的发言似乎验证了公众长期以来的担忧:科技公司正在盗用大家的数据。
蚂蚁集团、美图秀秀和旷视都否认了数据共享一说,李开复也在微博上致歉称发言系“个人口误”,并称合作中旷视提供AI技术给合作方,数据一直存在于客户服务器中,不涉及任何数据共享与传输。
但公众似乎对“口误”一说并不买账。上善若水资产管理公司董事长侯安扬在微博上发起了投票,“关于旷视的数据问题,你觉得李开复是说漏嘴了,还是搞错了?”近6000人的投票中,有93%的人选择了“说漏嘴了”。
早在2019年9月,旷视运用人工智能监控学生课堂一举一动的实验就曾引发网友声讨,称其将人脸识别扭曲为“人身监视”。
人们对个人隐私被侵犯的问题,已从懵然不觉转变为高度敏感。如今,与大数据有关的互联网公司都不免要面对这样的质疑:平台是否擅自收集并使用了用户的隐私数据。
南方周末记者分别向旷视科技和蚂蚁金服发了约访请求,但两家公司均以不方便回答为由拒绝了采访。
人工智能的核心在于数据
旷视科技成立于2011年,是人工智能产品和解决方案公司,2015年推出全球首款基于云端的人脸识别身份认证解决方案,其“刷脸支付”技术入选《麻省理工科技评论》2017年全球十大突破性技术。
人脸识别和刷脸支付,最常用的场景就是手机解锁以及网络支付。
据此前媒体报道,蚂蚁金服曾与旷视科技合作研发“刷脸”系统,用于支付宝内。2015年马云还曾在德国电子展开幕式上刷脸买邮票,那是“刷脸支付”首次在国内成型。创建这套系统是为了让人们在购物后的支付认证阶段通过扫脸取代传统密码。
旷视和美图的合作则是在移动设备上。美图公司回应南方周末记者称,双方仅在人脸解锁方案上有过合作,“旷视科技这个方案是面向整个手机行业的。双方的合作仅限于美图手机”。
据旷视此前发布的招股说明书显示,2016年Face ID解决方案的客户仅为128名,到2018年这一数据已经增加至1044名。根据灼识咨询提供的报告,2018年旷视占据云端人脸识别60%的市场份额,其中超过70%安卓手机搭载旷视的人脸识别解决方案。
除了OPPO、vivo、小米、诺基亚、荣耀、锤子等众多国内手机厂商外,旷视与阿里巴巴、蚂蚁金服、联想、富士康等多个行业巨头也有合作。
就职于北京一家人工智能算法企业的王峰告诉南方周末记者,从逻辑推断,平台(如蚂蚁、美图)将自身数据共享给算法公司(旷视)的可能性很小,“蚂蚁这类大平台,数据是它的核心竞争力,不论是从收益还是合规角度,旷视都不太可能拿到用户数据”。
人工智能的核心在于数据,算法的形成最终也取决于数据量的大小,可供参考的数据越多,算法也就越精确,人工智能的学习结果就更为准确、高效,这使得旷视这类算法公司有了获取数据的“动机”。
据王峰判断,李开复所言的“掌握数据”,大概率可能是系统检验和测试用到的一小部分数据,这些数据一般都做了脱敏,无法和个人真实信息相关联,目的只是为了让AI模型更加准确。“相当于一种数据训练,算法公司即使证明了检测人和账户使用者是同一个人,也无法确切知道这个人的身份。”
对公业务为主流
但这并非旷视第一次站在舆论的风口浪尖。
2019年9月,一段人工智能监控学生课堂一举一动的短视频就曾引发热议。在监视画面上,两位穿着校服正在上课的女学生被贴了多个标签,标签内容是其听课情况,系统检测数据包括趴桌子、玩手机、睡觉、听讲、阅读、举手等行为的次数。图片的左上角标有“MEGII旷视”的字样。
据媒体报道,这是旷视与南京中医药大学的一项合作,大学除了在校门口、学生宿舍大门口、图书馆和实验楼等场所安装了人脸识别门禁外,还在部分教室安装了人脸识别系统,以检测学生和老师的出勤情况,以及学生的上课听讲质量。
被质疑是否侵犯学生隐私后,旷视回应称,这只是旷世的技术场景化概念演示,未落地应用。
旷视曾在公开场合介绍有关视觉AI在教育场景中的应用。这一过程中,旷视科技将自主研发的人脸识别、行为识别、表情识别等技术,集成在考勤及行为分析摄像机MegEye-C3和行为分析服务器中。同时通过对课堂视频数据进行实时的结构化分析,反馈学生行为、表情、专注度、前排上座率等多维度课堂数据,从而辅助教学评估评价。
与上述蚂蚁和美图的案例略有不同,旷视在学校不仅收集了学生的面部数据,而且将这类数据用于学习形成算法模型,并与学生实名匹配。
该学校管理人员对媒体回应称,学校已经询问过公安部门和法务部门,在教室安装人脸识别系统算不上侵犯隐私。换言之,学校成了主动收集信息的主体,旷视不仅为其量身定制了算法服务,还能够获得学生的真实身份信息,这相当于旷视间接获得了学生面部的生物信息。
类似对公业务已经成为国内AI企业的核心业务。
根据旷视的招股书披露,旷视的人工智能解决方案主要有:个人物联网,城市物联网,供应链物联网三个方面。
招股书显示,近3年来,城市物联网解决方案在三项收入中占比最大。2017年、2018年以及2019年上半年,该项收入分别为1.68亿元、10.57亿元、6.95亿元,分别占同期总收入的53.6%、74.1%、73.2%。
“目前的城市物联网,最大的应用领域就是安防。”一位TMT行业资深分析师向南方周末记者解释,人工智能企业最初的赛道集中在个人物联网领域,但由于数据的可采集程度太低,无法形成良好的算法,业务收入也很少,所以在2017后,重心就换到了城市安防上。
具体来看,2016年、2017年及2018年与截至2019年6月30日止六个月,其五大客户合计分別占总收入的41.7%、24.9%、22.0%及34.1%。
旷视介绍,这些客户是中国智慧城市管理解决方案的系统集成商、中国智慧物流解决方案的系统集成商、中国电信服务供应商。在这一领域,旷视已经建立摄像头、边缘服务器、云端服务器三大硬件体系,相继推出三十余款摄像头,用于不同场景。
就在今年,旷视还曾在北京市海淀区以及中关村科学城管委会的统一调度下,试用了“人体识别+外/可见光双传感”技术方案。
这套方案可以通过前端红外相机鉴别人流中的高温人员,再根据疑似发烧者的人体、人脸信息,通过AI技术,帮助各类公共场所(火车站、汽车站、地铁站、机场)等高密度人员流动场景下快速筛查体温异常者。一旦有疑似发热人员出现就会自动报警,结合旷视自研的人体ReID检测检索技术,帮助工作人员快速筛查发热人员位置线索,以进一步确认检测和医学观察。
之后,这套测温系统率先在北京市海淀政务大厅和部分地铁站展开试点应用,南方周末记者在上海观察到,该系统目前也被应用在上海部分影院中。
人脸识别的风险
2019年8月份,旷视宣布即将赴港上市。在这次IPO之前,旷视8年时间融资9轮,融资总额达74.6亿元,估值已经达到40亿美元左右(约合人民币287亿元)。
在城市物联网领域,已经有海康威视、大华股份等行业龙头。旷视2019年上半年的营收为6.9亿元,海康威视2018年营收则为498亿元,二者完全处于不同量级。这导致旷视的财务状况紧张,现金流始终为负。
与此同时,个人隐私信息的保护也越来越被公众所关注。
早在2018年,百度安全实验室就曾公开通过实验,以良性入侵的方式破解了指纹、虹膜等密码,发现了包括人脸识别在内的多项生物识别技术其实都具备“易于伪造”的特质,安全性甚至不如密码。
“关键在于关联性。”王峰解释,对方仅仅拥有了你的面部信息并无用处,关键是要与你个人形成关联,知道你是谁,把你的银行账户和头像进行匹配,进而造成伤害。
数据泄露的消息近年来不绝于耳。先是2018年底,亚马逊音箱被爆出发生重大监听事件,全球智能硬件窃听风云的故事频繁登场。一位德国用户向当地杂志爆料,在向亚马逊讨要自己的个人活动语音数据时,对方发给他1700份陌生人对话的语音。
2019年2月,名叫Vic-tor Gevers的荷兰安全研究员在社交网站上公开表示,中国的 一 家 面 部 识别 公 司SenseNets(深网视界)未对内部数据库做密码保护,导致数百万公民的个人信息数据能够不受限制被访问。
据其介绍,此次数据库内含超过250万人的信息,包括身份证数据、照片、工作信息等。该数据库还可动态记录个人位置信息,仅2月12日至2月13日的24小时,就有超过680万个地点被记录在案。250万人几乎“裸奔”在了互联网上。
法律介入已经刻不容缓了。2019年11月,“中国人脸识别第一案”正式宣判,案件起因是杭州一家动物园强行要求购买年卡的客户进行人脸识别,客户将其告上法庭,最终宣判客户获胜。
如果人脸信息被泄露,加上动物园留存的客户其他身份信息也被盗取,偷盗者完全可以建立起一套关于消费者的身份信息,包括指纹、家庭住址、电话、脸部信息等等,不法分子完全有可能通过这类信息实施伪造、偷盗等活动。
(应受访者要求,王峰为化名)