APP下载

大数据背景下个人隐私保护路径探析

2018-09-13姚梦晓殷小丽

电脑知识与技术 2018年17期
关键词:个人隐私隐私保护大数据

姚梦晓 殷小丽

摘要:随着“互联网+”战略,人工智能、物联网等高新科技的大力推进,人类社会的数据种类和规模呈爆炸式増长,人们已经步入了大数据(BigData)时代。大数据时代下,人们的生活因科技的改变而越发便利。但拥有大数据的企业越来越多,它们在打造便利生活的同时,网络用户的信息被无限度地加工、分析、处理和应用,这使得用户的人身权甚至财产权时处于潜在的或现实的侵害状态。该文描述了大数据的基本内涵,定义了个人隐私的概念及其在大数据背景下自身特有的特征,提出大数据带来的隐私风险,探析隐私保护的路径对策。

关键词:大数据;个人隐私;隐私风险;隐私保护

中图分类号:TP393 文献标识码:A 文章编号:1009-5039(2018)17-0077-03

近日,微博用户“廖师傅廖师傅”发布自身被某旅行网站索取更多费用的经历后,瞬间引发人们热议。其实网友们平时在网上购买机票、电影票或预订酒店时,经常遭遇此类现象。如今,随着舆论的热度的上升,大数据“杀熟”再次引发关注。网友直呼老用户不如狗!“佛系”电商不杀“生”,只杀“熟”?不可否认,随着互联网科技的高速发展,信息传递加快,人们之间的交流越来越密切,在这种情况下产生的大数据也越来越被人们所依赖。因此,网友在对商家的不道德行为做出无奈谴责的同时,大多数人已经被迫接受了现实:互联网时代,少有个人隐私可言。个人隐私就算瞒得了自身的亲人、朋友,也瞒不过互联网商家,它们比自己还了解自己。那么由互联网产生的大数据究竟是什么?它的应用带来什么样的风险?我们又该怎么预防和处理风险?

1 大数据的基本内涵

大数据(Big Data),可以简单地理解为海量数据或巨量数据,它是在云计算、物联网等新一代信息科技的基础上发展起来的。另外,电子商务、社交网絡、即时通信等互联网应用的大范围普及也推动了大数据的迅猛发展。麦肯锡(美国首屈一指的咨询公司)最早开始研究大数据,它在其报告《Big data: The next frontier for innovation, competition,and productivity》中给出的大数据定义是:传统的数据库无法获取、存储、处理和分析的数据集。同时它也强调,TB(表示信息数量的单位)值并不是特定的限定值。其他互联网企业和相关学者也有给出大数据的定义,但目前对大数据还没有公认的定理。普遍的观点认为,大数据是数据大小无法通过目前的技术、方法和理论,在可容忍的时间内获取、储存、管理和处理的数据。对于企业来说大数据即是在复杂和大量的数据中,迅速获取知识的能力。大数据的核心能力是发现数据背后规律并预测未来的发展方向,从而对客户实现精准营销,实现企业长久发展的目标。

大数据中大部分数据来源于网络用户和传感器,其中用户的上网记录、其在社交平台上的发布的信息和评论、传感器和监视器产生的数据等都包含在内。而从超大规模的数据库中获得有价值的信息成为各大企业争相追逐大数据的主要目的。大数据的基本特征可以用4个V来概括,即Volume、Variety、Value和Velocity,第一个Volume,即数量巨大,从TB级别跃升到PB级别;第二个Variety,即数据类型繁多,不仅包括传统的结构化数据,还包括非结构化的视频、图片、位置信息等;第三个Velocity,即处理速度快,1秒定理;第四个Value,真实性,即大量的不相关信息,不经过处理则价值较低,属于价值密度低的数据。

2 个人隐私的概念及其在大数据背景下自身特有的特征

2.1 个人隐私的概念

个人隐私一般是指个人不愿分享或公开的秘密,平时我们会想到的个人隐私有日记、通话记录、消费账单甚至身高体重、手机号码、邮箱账号等个人不愿公开的敏感性资料,这些都是不愿外人知道和干涉的个人隐私。其实,当人类从懂得使用树叶遮羞时,就开始懂得什么是“隐私”。而“家丑不可外扬”也从侧面反映了人们对于隐私保护的需求心理。美国私法学者沃伦、布兰代斯是最早提出隐私应当被当作一种权利被保护起来的先行者。1890年,他们首次提出隐私权(the right to privacy)的概念,并将“隐私权”作为一项个人权利提出来。他们认为这项权利是个人的避难所,只有人类这项最基本的权利界定下来,个人的最基本的思想,情感等才能得到保障。此后,各国法律也逐渐认可隐私权为公民最基本的权利之一,并保护个人隐私权不受侵犯。

20世纪中后期,随着互联网,云计算等相关技术的飞速发展,计算机存储,处理和应用能力不断提升。现今,监视器、摄像头等遍布整个城市的公共场所,像医院、地铁、学校等;微信、信用卡等消费于整个城市的商业店铺,大到商场,小到商贩摊位都可使用电子支付;政府、学校、大型企事业单位等广泛登记个人电话、家庭成员、邮箱地址等个人信息,各种组织机构通过数据化的形式收集了我们大量的个人信息。基于大数据的迅速发展给公民个人隐私保护带来的危机,本文研究的个人隐私主要集中在电子信息领域下,公民想要保护的,不能够被识别个人信息。大数据下的隐私一方面是指个人享有保护和控制网络空间下个人信息的权利;另一方面是个人拥有决定个人数据状况和范围,根据个人意愿对其进行利用的权利。

2.2 个人隐私在大数据背景下自身特有的特征

由上文隐私的概念可知,大数据时代下的隐私为数据化隐私,除了这一基本特征外,还具有以下四个方面的内容。

个人隐私的商业价值化。两会过半,大数据成了讨论的热门话题。有人称数据是“石油”,成为国家关键的战略性资源。数据的价值性由此可见一斑。现今,海量的数据改变了互联网公司竞争方向,它们各自竞相吸引用户注册量,企业通过收集海量的用户数据,改良产品功能,吸引更多的用户注册,从而产生更多的数据。通过大数据分析,处理,企业提供贴心的营销服务,增加客户黏性,提升营业收入。

个人隐私泄露途径的隐秘化。大数据技术的核心在于利用数据资源,通过数据分析,从表面上看似不相关的数就是据中发现有价值的内在联系,从而实现较为精准的判断与预测。海量的数据中包含了许多有关于个人的信息,有些数据虽然表面上没有包含个人隐私,但是通过对大量具有相关性数据的搜集与处理,就能够分析出含有个人隐私的数据并且能够直接追溯到个人,甚至一些更为隐私的数据都能被挖掘出来,从而导致了非隐私数据的隐私化。

个人隐私可换取个性化服务。大数据极大地丰富了我们的生活,但我们在享受便利生活的同时也将位置信息、手机号码、银行账户以及生活习惯等包含个人隐私的数据提供给了服务商。服务商基于搜集到的数据,把消费者与他浏览过的内容提炼出来,然后对每位消费者实行标签化的管理,在此基础上再对每个人做更加细分的分群管理,之后利用这些数据去分析每位消费者的消费行为与习惯,最后再将分析出的结果以一种个人性服务的方式推送给个人。

个人隐私保护范围的扩大化。随着大数据的日益发展,隐私的范围触及了人们生活的各个角落,个人数据所包含的隐私越来越多,使得隐私保护的范围日益扩大。同时,大数据让很多本来不属于个人隐私保护范围内的个人数据,在通过数据分析处理后也可以得出个人的隐私,这就让隐私的保护范围扩大到了几乎人们生活的每个角落。大数据时代的隐私问题不仅牵涉到了个人信息的利用,同时也将问题延伸到了现实空间中,并且问题还在持续地扩大化与严重化,隐私风险随即而来。

3 大数据带来的隐私风险

近日,中国多家互联网巨头面临隐私侵犯的指责:支付宝利用年度账单悄悄收集用户数据;微信面对“偷看用户微信记录”的舆论质疑;360旗下的水滴直播被控诉偷看用户隐私……这让不少人陷入了“网上裸奔”的恐慌之中。企业在大数据巨大价值的驱动,无限制地挖掘、使用、公开、甚至共享用户信息,这无疑给用户带来巨大的隐私风险,其主要的隐私风险有:

匿名化实现的不可能性。匿名化是指数据挖掘中保护个人信息不被泄露的一种技术方法。企业希望提供高度个性化的服务和解决方案,吸引顾客,提高营业利润,大数据使这一切成为可能;目前,大数据分析技术越来越能够识别网络用户的个人身份,虽然有匿名化技术的保护,大多数企业还是会追踪到各种各样的信息来猜测某人的身份;并且由于互联网巨头的不良带头作用和滥用用户隐私信息的互联网公司激增,对隐私权的尊重感也在减弱,诸如支付宝、腾讯等面临的指责以及AmandaTodd遭遇的网上跟踪、霸凌和骚扰,最终自杀等高调的事件已经导致许多网友和立法者开始关注对网络隐私权的限制。这些趋势都在表明匿名化实现的不可能性。

安全漏洞的扩大性。安全漏洞是指计算机系统的一组特性,攻击者可以利用这一特性在未授权的情况下访问或破坏系统。由于安全漏洞的存在,可能导致大数据分析的结果不准确性,而企业或其他组织依据这一结果采取的行动可能会侵犯相关人员的隐私,导致失误甚至于失业。大型连锁零售Target公司的信息泄露,雅虎公司近30亿用户遭遇黑客攻击,以及office高危漏洞导致垃圾邮件窃取隐私等事件表明,即使是多国知名品牌,其安全隐私保护也往往过于宽松。全国政协委员周鸿祎指出美国的网络安全投入占IT投入10%,而我国只有2%,安全保护不力这是一个严重的问题,因为这些企业存储了大量用户的信用卡号码、地址和其他非常私密的信息。

歧视的普遍性。歧视是社会一直存在的问题,但可拍的是,大数据使它成为更普遍的存在,即一种“自动化”的歧视。例如,银行或其他类型的金融机构基于申请贷款人日常在网上留下的上网痕迹,通过大数据分析,可以推断出申请人的种族或性取向,然后根据获得的这些信息拒绝向个人提供贷款;白宫指出,据调查显示在网络搜索典型的黑人名字,如达内尔等,页面就会出现大量关于犯罪背景查询的广告,这些基于广告的优化投放会让一整个种族置于不利的境地;并且一些销售数据商家在出售数据时,会在数据上贴上“学生”“二类城市的打工者”,以方便营销人员找准自己的目标。这些现象都说明了大数据使得歧视成为更普遍的存在。

个人风险意识和信息保护意识的缺失性。互联网向人们展示了其强大的统治力,公民往往都是在无意识的情况下将自己的个人信息提供给他人,导致个人隐私权益被侵犯。而我们每一个人也不注重对自身隐私的保护,在不经意间泄露自己的信息。例如,在商场里,商家经常让我们扫二维码,注册会员,从而享受优惠活动,之后我们还会收到商家推荐的商品信息,无形之中我们就泄露了自身的隐私。据中国互联网信息中心发布的2016年的调查报告的数据显示,有6.88亿网民因个人隐私泄露造成的经济损失约达915亿元,其个人信息在黑市上泄漏达到65亿条次。而大多数人甚至在接到推销电话、垃圾短信之后,都没有意识到隐私泄露所带来的骚扰。这表明个人的风险意识和信息保护意识严重的缺失性。

4 隐私保护的路径探析

目前,很多手机软件或服务大肆流行,虽说是免费的,但本质是用户在给互联网公司“打工”。无论用户是在用手机聊天、看视频或是阅读任何资讯,只要使用互联网服务,都会产生大量实时的用户数据反馈给互联网公司。目前用户已全方位地暴露于互联网公司之下,如何能在鼓励大数据发展的同时,保护个人信息安全,这是大数据背景下所有企业和广大网民共同关心的问题。

完善相关法律法规。近日,在两会的政府工作报告中,总理提出要取消流量“漫游”费,移动网络流量资费年内至少降低30%,报告随后提及要整治电信网络诈骗、侵犯公民个人信息和网络传销等突出问题,维护国家安全和公共安全。全国政协委员、上海市政协副主席周汉民的提案正是聚焦于大数据和个人信息保护。他建议出台一部详尽的和具有操作性的信息保护法,保护公眾的个人隐私。对于匿名将变得不可能这一问题,周汉民表示可以规范个人身份地再识别,对于数据使用人以任何目的从事身份再识别行为,有足够的惩罚力度,增加违法成本。

加强行业规范与自律性。目前国家工信部已就阿里巴巴,百度等BAT巨头侵犯消费者隐私等事件,对相关涉事企业进行约谈,谴责阿里巴巴,百度等对隐私保护不力。监管部门还表示,任何违规行为都将受到调查和“严惩”,这给予互联网行业一个正确道路方向。行业规范与自律性虽然是无强制性要求但却是十分有效的约束。前车之覆后车之鉴,未来大数据还会更多地融入百姓生活,并为政府、金融等机构服务,互联网公司不能伤了用户的感情,忘记了自己的社会责任。其实互联网公司在“杀”消费者的同时,何尝又不危机整个网络消费行业呢?

提高隐私权的技术保护。大数据背景下,提高隐私权的技术保护能从根本上起到保护网络用户信息安全的作用。从技术层面保护个人信息安全,一方面需要技术人员的专业努力,另一方需要政府及社会各界的大力支持与鼓励隐私保护技术的研发与创新。利用大数据技术预测,分析和保护,我们更容易发现我们的隐私是否被侵犯,以何种方式侵犯,什么人侵犯了以及如何保护我们的隐私,从而在监督、立法和治理层面提供参考和指导。

提高个人的隐私保护和监督意识。360董事长兼CEO周鸿祎说“解决网络安全的关键不是硬件,也不是软件,而是人才”。网络用户要懂安全,注重保护自己的隐私安全,平时要懂得隐私的销毁,加强手机电脑等电子设备系统的安全保护等。同时,用户要拿起现有的法律法规保护自己隐私权利不受侵害,并善于运用知悉权跟踪自己的个人数据信息,监督政府、互联网公司以及其他机构或用户是否侵犯自身个人隐私的情况。

5 结论

我们在享受大数据带给我们便利的同时,也承担着个人隐私被泄露的风险。对于大数据给我们带来的隐私风险,我们应从立法,行业规范,隐私保护的技术手段,个人隐私保护和监督意识等各方面提升个人隐私保护水平,使大数据最大化地服务社会的同时,也使得用户隐私最小化地遭到泄露,从而保护个人利益。

参考文献:

[1] 吴小同.大数据环境下隐私保护及其关键技术研究[D].南京大学,2017.

[2] 顾理平,杨苗.个人隐私数据“二次使用”中的边界[J].新闻与传播研究,2016,23(09):75-86+128.

[3] 刘雅辉,张铁赢,靳小龙,等.大数据时代的个人隐私保护[J].计算机研究与发展,2015,52(01):229-247.

[4] 温爱红.浅谈大数据时代下的个人隐私保护[J].电脑知识与技术,2017,13(19):25-26.

[5] 徐乐.大数据时代隐私安全问题研究[D].成都理工大学,2016.

猜你喜欢

个人隐私隐私保护大数据
针对网络信息系统的个人隐私保护方案
大数据时代个人隐私保护探析
海量数据共享与个人隐私保护