隐私如何被扒光 解密大数据隐私扒窃
2019-10-30技术宅
技术宅
让人防不胜防的隐私泄露
小一点的隐私泄露,是类似自己的电话号码被恶意外传,导致我们不停地接到各种骚扰电话。严重的则可能包含身份证、实际住址、银行卡号等等,这类信息的泄露会给我们带来更大的麻烦。
我们的这些隐私信息是怎么被泄露的呢?原因之一是由于内部人员或者黑客造成的。比如前段时间网上流出的某某酒店入住数据,就是黑客入侵酒店服务器后导致的泄密,这种类型的泄密,作为用户基本上是无法避免的。而随着大数据技术的发展,另一个让我们防不胜防的隐私泄密原因也逐渐变得常见,这就是一些科技公司通过大数据画像“非法获取”隐私信息(图1)。
①大数据画像
大数据画像如何泄露隐私
日常网络生活中,其实我们经常要和一些大数据分析技术接触,比如使用百度搜索的朋友,会在搜索框下方看到推荐的新闻资讯,这个推荐是个性化的,而且每个人的推荐资讯内容都不相同,它是根据每个网友的兴趣进行推送的(图2)。
②百度新闻推荐
③淘宝商品推荐
百度的这一个性推荐功能,背后就是大数据分析的结果。百度根据用戶的搜索关键字和点击分析出你的喜好,然后再有针对性地向你推荐符合你爱好的资讯。类似的还有淘宝、京东等网站,也会根据你的购物习惯向你精准地推荐商品,同样是基于大数据技术(图3)。这些公司首先海量收集匿名用户的各种网络行为,如搜索偏好、购物习惯等进行群体画像,然后再通过这些信息分析对目标人物进行画像。不过这些还只是人物的粗略画像,从隐私角度来看并不算太过分(图4)。
目标人物画像
而对于一些非法公司,则是通过真实的简历数据对自然人数据还原。比如淘宝是匿名收集某某喜欢购买数码产品,而非法公司则直接根据简历信息搜索张三的真实信息,包括他的生活角色(如婚姻状态为未婚)、社会关系(如父母是张山和李四)、位置信息(如籍贯是西安,在北京某某小区居住)等等,以此实现对自然人的精准画像(图5)。
⑤对自然人数据还原画像
另外随着大家参与的网络活动越来越多,我们还会在网上留下自己的邮箱、微信、QQ等社交ID,这些非法公司会将用户数据和这些社交账号关联,从而实现多个识别ID关联、多种设备关联、跨平台行为关联、线上线下数据互通,将每个人的各种隐私信息一网打尽。
更为恐怖的是,这些公司通过和第三方交换数据获得其他信息,将各种信息综合后再对其他的关联用户画像。比如某公司通过各种手段获得全国2.2亿人的简历数据以及全国10亿个不重复手机号码数据,以其为基础,在获得张三的通讯录信息后,又可以获得张三好友李四的电话号码,再将李四的号码在简历数据库中检索后得到李四的所有信息。如此一来,即使李四没有在该公司投递过简历,李四的所有信息也会被该公司通过聚类分析全部获取(图6)。
非法公司还会将以上信息匹配到平台的简历库,最终得出这些自然人及其周边关系人的收入水平、潜在需求、关系影响等要素。所以,只要提供某个用户的手机号码,此非法公司就可以将其与自有的简历库进行匹配,提取出这些自然人的各种隐私信息,包括年龄、性别、行业、职业、户籍、收入、教育经历、工作经历、关系链等等。而且这些隐私信息会被贩卖给各种需要的机构,导致我们的隐私连环泄露。这也就是为什么很多人从来没有在房地产公司买过房,从来没有参加过教育培训,但是却一直被莫名其妙的房产公司、培训机构的电话骚扰的原因。
⑥聚类分析获取其他用户的隐私信息
隐私保护我们应该这样做
通过上面的介绍我们知道,隐私的泄露很多是由于我们随便在网上留下各种信息,被其他有心公司收集而导致的。特别是对于类似简历、工作经历这些真实信息,大家在参与这些网络活动的时候,尽量选择大型正规的公司投递简历,避免自己的简历被不怀好意的人使用。另外一方面,对于类似网络拉票、各种砍价活动尽量不要参与,因为这些活动的最终目的大多是为了获取我们的微信、QQ等账号信息的。另外,需要注意保存好自己的通讯录,尽量不要使用不安全的在线方式保存通讯录。