APP下载

大数据时代个人隐私保护策略的研究

2017-12-31

软件 2017年12期
关键词:信息

马 媛

(北京邮电大学,经济管理学院,北京 100876)

大数据时代个人隐私保护策略的研究

马 媛

(北京邮电大学,经济管理学院,北京 100876)

大数据是一种新兴的、能够有效地收集和分析大量实时数据的技术。它的体量大、速率快,能广泛容纳多种类的数据信息。大数据在当下时代正在促使一种新商业模式的形成,该商业模式能够提供巨大的经济收益预期、社会福利预期及文化革新预期。这场由大数据带来的风暴正在改变我们沟通和交流的方式,但是同时也在泄露我们大量的隐私信息。本文从大数据的特征出发,剖析了大数据对个人隐私的潜在威胁,并对大数据时代的个人信息保护策略提出了几点建议。

大数据;个人信息;隐私保护;利益博弈;数据追溯

0 引言

现如今,网络已经成为了我们生活中不可或缺的一部分:我们在线上购物、社交,我们在线浏览新闻、收看自己喜爱的节目,我们在线工作和办理银行业务,一切的便利都已成为习惯。然而,就在我们享受便利的同时,我们在数字世界中所做的一切都在以“数据踪迹”的形式被记录下来。从形式上来说,这种“踪迹”可能是一个购物订单,一次网页浏览,甚至是一次不起眼的鼠标点击。无论我们同意与否,我们在网络中的一切行为都是有迹可循的。

个体们所产生的数据已经不容小觑,更不要提社会这个大系统中各个职能部门运转、各公司贸易往来等等产生的信息了。总之,由于可用数据源的海量存在、数据格式的差异性等因素的存在,如何管理和使用这些数据,便逐渐衍生出一个新的领域——大数据。

1 大数据概述

1.1 何为“大数据”?

大数据作为时下流行的热词,其专业的定义是基于传统数据库技术、前沿数据存储与处理技术及工具之间的处理能力差异(诸如 Hadoop集群、海量数据处理算法BloomFilters及R语言数据分析工具等)的数据量太大,以至于无法使用诸如SQL等传统数据库协议进行分析和处理的信息资产。

现如今,由于可用信息之体量、种类和流转速率的变化呈指数级增长,以及企业需要驾驭的信息复杂性更大等因素带来的问题,是人类在之前的商业经营活动中尚未遇到过的。大数据正在催生巨大变革,我们人类在处理复杂事件、抓取线上交互数据、开发移动计算产品与服务及实时处理很多大数据相关事件等方面的能力急需得到提升。

1.2 大数据的特征

当前,较为统一的认识是大数据有四个基本特征:海量的数据规模(Volume)、数据种类多(Variety)、数据产生速率快(Velocity)、价值密度低(Value),即所谓的“四V”特性。

(1)海量的数据规模(Volume):当下大数据的体量是惊人的,我们生活在一个全世界产生的数据量正以“EB”和“ZB”进行计量的时代。到2025年,据预测互联网上的数据量将超过整个地球上全部人类的脑容量的总和。

(2)数据种类多(Variety):源数据类型的多样化正在随着前沿技术的发展迅速加剧。车载监控反馈的各种性能指标、制造平台的现场测量数据、形形色色的医疗保健设备,以及越来越多的智能电网能源设施,都在产生数据。

(3)数据产生速率快(Velocity):据报道,全世界90%的数据是在最近两年中产生的。随着数据源数量的增加和数据格式的不断多样化发展,数据的产生、获取、处理及输出的流转速率也同样呈指数增长。

(4)价值密度低(Value):大数据本身拥有海量的信息,这种信息从采集到变现要经过一个重要的过程——分析,只有通过分析才能实现大数据从数据到价值的转变。众所周知,大数据虽然拥有海量的信息,但是真正可用的数据可能只有很小一部分,从海量的数据中挑出一小部分数据本身就需要巨大的工作量,所以大数据的分析也常和云计算联系到一起。

2 隐私与安全

现在,如果我们用手机分享照片,手机内置GPS就会随之精准定位照片被分享的地点。我们就算关闭手机上的GPS追踪系统,以保证位置信息不会被知道,但是不论如何,只要是线上操作,他人仍能通过技术手段定位到你。同样的道理,也许你喜欢使用微博、朋友圈等社交产品,所处的位置也能够被追踪到。

我们应该明确这样一个概念:经本人许可的、以及执法机关必需的搜索和追踪行为是在法律允许范围内的,而未经本人许可的搜索和追踪则已经构成违法行为。就目前来说,很多公司和组织的活动已经违背了这种原则:比如在未事先通知用户的情况下,强制发送广告邮件;在用户不知情的情况下将 Cookies安装在他们的浏览器上;采取有争议的行为储存个人数据、在被明确拒绝的情况下将信息共享等等。发达的技术手段正在使这些鬼鬼祟祟的行为变得更容易,而用户想要与时俱进地采取行动来保护自己却无比困难。在大数据时代,我们越深入地了解隐私问题,就越能够拥有塑造和影响数据隐私政策、标准与规范的力量,从而保护所有公民的合法权益。

2.1 数字时代的隐私

尽管眼下所处的数字时代正在大大加快政府、组织及商业团体深入掌握我们信息的趋势,不过隐私的概念却始终没有过时。我们曾经为隐私问题而展开争论,反复改写着隐私的含义,但面对新出现的隐私侵害现象时,我们仍旧会有些措手不及。不论如何,已经是时候为我们当下有着巨大隐患的“隐私”进行新的定义了。《韦氏词典》将隐私定义为“独自一个人或远离视线时的素养或情态表现”,将个人隐私权定义为“免于侵扰的自由”。在此,本文将隐私归纳为以下三种基本类别:

(1)物理性隐私——个人、财产或私人空间免受侵扰的自由,大多数国家针对面向人身或财产的非法搜查与没收行为都有相关的隐私法律保护。

(2)信息性隐私——当个人信息被以数字或其他形式加以收集、存储和共享时,对其隐私性的期望,大多数国家都有相关法律,在某种程度上保护个人的财产隐私、医疗隐私和网络信息隐私。

(3)组织性隐私——政府机构、各类组织和商业团体希望能够就某些活动或机密情况采取保密。例如,公司可能希望保守商业秘密,政府则可能选择对其安全政策采取保密措施,以打击恐怖主义活动。

其中,信息型隐私是大数据时代挑战最为严峻的一类。对于每一个个体来说,他们希望享有隐私权利。在这样一个时代里,我们原本视为隐私的“空间”正在一直被压缩,其中有些“空间”正被不法分子所觊觎或已经被侵害。在此,本文将信息型隐私分为以下几类:

(1)通讯隐私——电子邮件、电话、短信、微信和信件等都具应有私密性。然而,很多国家受数据保存政策制约、技术水平限制及对即时通讯内容的监视(如美国的窃听门事件)导致通讯隐私的保障只能更多地寄希望于他人对我们的私人通讯内容丧失兴趣。

(2)行动隐私——数字时代到来之前,人们在家里家外的行为活动,如买了什么,去了哪儿,去那儿又做了什么,就其本身而言很难被记录和分享。而今天,大部分行为都能以数字化的方式被加以捕捉,并用来预测诸如人们将要买什么,或预测人们是否符合某一特定行为模式。该行为模式可以预测一个个体是不是一个优秀的信贷客户或保险客户,甚至是否符合具有犯罪行为或者恐怖活动潜质的基本特征。对于这种用数据计算来对人们行为进行总结抑或是预测的方式,利弊参半。

(3)人身隐私——即便一个人不想放弃在社会中保持相对匿名化的权利(包括在一天之中的任何时间点我们的喜好与追踪的隐私)。但随着监控摄像技术、数字图像技术(连同通过面部识别功能与其他技术功能来实现数字化人脸识别能力)和位置跟踪技术的不断升级,除非是影视剧里经受过特殊训练的特工,不然的话,彻底的人身隐私保护对于普通人来说是不可能的。

当探讨隐私的时候,我们通常会在不知不觉中跨越多种范畴与边界。例如当我们在使用地图时进行定位时,其实物理隐私空间的设定就已经打破了;当输入目的地时,信息方面的隐私也被侵犯了。像这些我们已经习以为常使用的应用程序,其实正无时无刻的影响到我们保持匿名化(人身隐私)的权利。

2.2 大数据的弊端

大数据时代,我们周围充斥着各种不同的理论、知识、信息和噪音,数据爆炸式增长和科技高速发展所带来的冲击,加大了未来的不确定性。社会团体、政府部门以及法制系统尚不能很好地应对大数据带来的诸如透明性、关联性、聚合性等问题。

2.2.1 弊端一:大数据的永存性(透明性)

大数据通常包含“元数据”,它能增加信息的层次(一层或者几层)这些信息与我们每一个人息息相关,对应着能够反映我们存在的种种客观现实情况,并且它永存的形式是商业领域和社会领域之前从未经历过的。例如:大数据技术与体系结构能实现将你在微博上发状态时所在的现实地理位置关联到每一条微博。并且这些附加的层级具有透明性,它们能够容纳海量的实质上游离于既有财务交易或社交互动记录的附加信息;大数据能重现你遍布全球的任何出行经历;大数据还能有目的地补充必要信息,将人个性的不同方面以我们意想不到的途径关联在一起。大数据作为一套分析理论及工具,本来无可厚非,但相关组织或机构掌握了大量个人信息之后,如果缺乏有效地管控,大数据的社会危害性极大。垃圾短信成堆、诈骗信息不断、魏则西之类的事件频繁爆发等都与大数据的永存性息息相关。

2.2.2 弊端二:大数据的关联性

数据追踪是众多大数据技术相对以往实现对人类行为和活动更广泛、更深入的洞察介入的一个例证。各路开拓创新者已经认识到将这些洞察转化为新的有价值的产品和服务的潜能,然而,大数据所创造的强大功能也会引发各种数据处理方面的问题,带来新的紧迫性——首先随处可见的传感器和摄像头等设备,会监视人们位置等信息。又由于数据之间的关联性,不法分子或唯利是图者通过海量数据分析,便可轻易了解人们的行踪规律,从而可能给人们带来生命和财产安全上的隐患。当数据信息不仅由最初的实际信息源,而且由那些谋求利用原始信息进一步创新产品和服务的人被聚合和关联,人们往往会放弃甚至被剥夺信息一旦脱手之后会怎样被利用的控制权。

大数据强加性的巨大功能正在使商业功能与个人价值观二者之间产生更加紧密的联系。藉由其在绝对意义上的体量大、多种类和高速率,大数据正在推动企业行为更深入、更彻底地介入个人日常生活。购买私人数据在当前的商业模式中似乎是一项正常的业务,所有这些购买和售卖业务都与当今面向大数据处理问题展开争论中的核心主题之一——“精准定向广告投放”直接相关。

2.2.3 弊端三:大数据的聚合性

大数据同样也可以在线上社区里进行聚合,有的社区的注册人数甚至会超过某些国家的总人口数。论坛是最出名的例子:纵横网络的各种线上社区有成千上万,其中每一个都保留着有关其任何一个会员的独一无二细节信息的或侧面的信息。到现在人们才逐渐意识到这一现象给我们的身份、所有权观念、我们如何看待自己和我们的各种关系、可靠性、名誉,以及大量其他有关日常生活中更为传统的自我管理方面所带来的冲击。因为数据常常涉及到人及人的特征和行为,所以数据抓取的应用可能性与滥用可能性会延伸到很多直接利益上。大数据的风险指向并不仅仅局限于作为个体的人,风险同样指向组织,一旦组织和企业的信息遭到窃取,往往会产生巨大的负面影响。

在大数据技术越来越被广泛应用的今天,由每天的正常经营活动所产生的各种危害的风险与日俱增。而这些风险的类型、规模和冲击性都难以预先判定。社会才刚刚开始了解大数据时代的种种含义,有的危险可能源于大数据创新本身的丰厚利益。当大数据的强悍功能驱使数据更加深入地介入我们的组织和个人生活时,平衡风险与创新将成为紧迫需求,我们必须直面这种需求,才能使大数据利大于弊。

3 对网络个人隐私保护的几点建议

3.1 多种隐私监管模式互补

数字时代的到来给隐私权利的争论带来了更大的复杂性,其最本质的原因是数据的无边界性。当我们在我国外旅游的时候,必须要遵守当地国家的法律和规范,因为一旦触犯到该国家的法律,就将受到当地国家司法体系的制裁;当我们购房的时候,需要遵守所在地区房地产交易的相关规章制度;我们的线下活动都受到按照地理边界进行划分的各种管控,但这种管控对于线上活动可能并不适用。

数据就其属性而言,并无国家地区之分,不受任何法律直接管控,可以自由地穿越一切边界。数据可以被安置在“云”服务器中,而“云”又能够使数据物理地映射于全世界任何国家和地区,让人们能够从任何地方瞬间就能检索到,数据可以被复制——全世界接近 80%的企事业组织所存储的数据都是信息副本,数据能被永久保存。世界上隐私监管主要有四种模式:

(1)综合性法律(监管模式):由一般性法律来管控公共和私营部门对私人信息的收集和利用,并且这些法律通常附随于一个监督机构以保证法律的实施效果。

(2)部门性法律(目标模式):国家支持制定用来规约具体事项的特定部门性法律,如针对录像带出租记录或财务隐私等问题,对应的部门性法律的执行是通过一系列机制实现的。这意味着一旦新技术引发出新的隐私问题,新立法就会如影随形。

(3)自律性监管:在这个模式中,自律性监管的多种形式得到使用。企业和行业机构被期望能够从自身出发建立各种实践性准则,开展自我管理。许多公司都致力于面向线上商业活动提供一种安全的认证方式,以证明其达到了“线上隐私的最高标准”。

(4)消费者监管:隐私权力保护由消费者来实现,通过商业性的数字隐私保护工具来完成。目前已经有大量有效的程序和系统能够提供各种不同程度的隐私和安全保护,功能包括邮件发送和代理的匿名化,Cookies的阻断,电子邮件、即时通讯、文档乃至音频信息的安全传送加密,以及多重网络轮换等。

每个国家或地区在推行隐私政策和规章时都可以采用上述这四种模式中的部分或全部。而且每种隐私监管类型的某一部分都可以同时被另一种类型“吸纳”,某些吸纳还可能是互补性的。

3.2 充分认识利益博弈者

现如今,各种设备终端使生活变得更加方便,人们的生活方式已经发生了永久性变化,现在我们习惯于在线工作和娱乐。像所有引发争议的问题一样,围绕隐私问题的讨论也充满了各种你来我往的博弈。各利益博弈者,无论以独立个体形式还是以集体形式存在,其利益全都攸关于相关隐私的监管活动及这些活动如何被监督和执行。

监视隐私保护的团体们意在寻求更为全面和严格的隐私立法;大型的私人数据收集者和持有者们主张自律性的监管;数据的使用者们则需要通过分析数据取得各种结果。

一些国家和地区,及其各自的政府,都有自己的主张,有些坚持认为对隐私的定义应该更加严格,赋予个体对其私人信息更多的控制权;其他有些则试图从其民众那里剥夺隐私权利,进行永久性的监视和监控以限制言论、防止暴乱或识别潜藏的恐怖分子或犯罪分子。

即便在某个单一政府内部,来自不同分支部门或机构的关于隐私的对立观点也并不少见。我们的私人信息处于隐私冲突的核心,被动地陷入了那些形形色色的利益博弈集团和利益博弈者之间激烈的拉锯战。

总之,这些各种各样衡量着人们是否会对当下的隐私状况持悲观或乐观态度的隐私利益博弈者,他们可以被总结为四种不同的类别:

(1)数据采集者:每当你在使用某个个人设备,例如一台个人电脑或者手机的时候,都会产生数据。还会通过各种技术性交互,比如通过无线射频识别标签、信用卡读卡器、闭路电视摄像头等产生数据。所有的这些数据都被某些人出于某种目的而收集,并不顾及是否经过我们的准许。在大多数情况下,这些数据信息随后就会被售卖或者租借给第三方作为有关联价值的数据集同其他数据进行聚合。

(2)数据集市(汇集者):数据集市是一种平台,在上面各类用户(个人、企业及政府机构等)都可以搜索能满足他们需求的特定数据集,并将搜索结果下载下来。

(3)数据使用者:一些通常从各种应用程序(社交媒体监测、零售情况分析、客户关系管理、需求监测、库存管理等方面)那里购买或免费获取数据的个人或组织。

(4)数据监督者:有许多从各种观点视角出发对隐私问题进行监督的机构和组织,还有其他一些参与到针对形形色色的行业和部门制定和执行自律性政策的机构和组织。

尽管对隐私权利的侵蚀可能带来可观的经济利益,每一方都有各自的利益诉求,即实现以最小的成本达到自身效益的最大化。我们可以选择一些新的隐私商业模式,容许消费者掌握关于他们的信息那些是可供获取的,对错误的信息加以纠正,甚至直接来决定他们愿意向广告商共享哪些信息来实现对自己数据的控制权。

3.3 引入政府授权和数据追溯机制,通过技术性

规制提升政府对社会的掌控能力

分享是网络时代的基本特征,而分享意味着放弃:放弃了对已分享事务的所有权和控制权。“互联网+”模式下的个体不希望生活在一言一行都被记录的世界里,更不想生活在受到伤害无法维权的环境里。追溯机制源于生产管理部门,从产品的原材料、生产、运输、销售各环节的历史记录保障产品质量,通过“生产有记录、流向可追踪、信息可查询、质量可追溯”方式实施监管的体系。数据追溯是指在数据的整个生命周期中,从生产、存储、处理到销毁的各个阶段明确记录。

互联网环境下通过杜绝个人隐私披露达到绝对保护的目的是不现实的,网络隐私保护是相对的概念,是指当个体的特征信息未经授权地披露或在披露后能够迅速被发现,并能追溯到信息的源头。如果缺乏信息源机制,可能会直接导致受侵犯的个体无法确认受侵犯的环节,即使追溯到信息泄露的环节也无法确认到具体的责任者。网络行业行政管理体系溯源机制的匮乏还会致使用户取证困难、维权困难,法律法规的保障作用形同虚设。

传统产业与互联网的融合,带动了生产模式、运营模式、管理模式等方面的创新。政府对数据的管控能力在一定程度上反映了政府对社会的管控能力。政府只有参与到企业的网络服务过程中,才能避免对数据的脱管。

既然大数据处理分为采集、存储和计算三个阶段,同时,网络“实名制”将个体的自然属性、社会属性等基础数据集逐一采集,甚至属于人格属性的衍生数据,伴随网络行为在个体不知情的情况下也被一一采集。这类数据具有长久性、唯一归属性、处理无痕性,不会随着时间而消失,可以区分每一个个体,也而且不会随着个体的离开而失效。现代信息安全技术可以保障数据在存储与传输环节的机密性、完整性、可用性、可控性和不可依赖性,却无法杜绝数据在管理环节中的人为的不当共享与管理。例如,网站信息发布中无意的隐私泄露,数据的不合法交易等。大数据计算是数据被技术分析、二次利用的环节,是个人信息在不被告知的情况下被再度利用导致隐私泄露的环节。作为信息供给方的商界,通过个人商业行为特征分析可以精细化地进行个性商业服务的定制与推送,一方面可以提高产业商家的市场竞争力,提高客户对服务质量的满意度,另一方面却侵犯了客户的隐私。

在大数据技术背景下,政府对数据管控职能可以被绕过,技术手段无法解决数据制造者对数据的自主控制权,从而导致中间环节存在无法制约的人为操控因素。数字化数据在转储、复制、计算逐个环节不留痕迹,为数据非法交易、未授权再度计算等侵权行为创造了无法证实的机会。因此,在对行业部门的业务协同监管进行规制的同时,政府需要对企业信息平台建设进行技术性规制。

在现有的网络信息系统体系架构中引入政府第三方授权机制,使企业与客户之间的网络服务数据不能绕过政府的数据中心,从根本上转变政府行政业务范围管理方式,保障政府对企业行为实施长期监管,提升政府对隐私泄露的事后监管和长效监管的能力,提高网民对互联网产业的理性信任度。以保障网络服务质量、信息隐私为出发点,制定大数据处理平台建设的技术标准与规范,在网络服务、数据存储引入数据追溯机制,杜绝数据管理过程中的人为因素导致隐私泄露,从技术上保障人格属性的完整性,提升网民对互联网的理性信任度。

[1] Sullivan C. Digital Identity, Privacy and the Right to Identity in the United States of America[J]. Computer Law & Security Review, 2013, 29(5): 348-358.

[2] Sullivan C. Digital Identity and Mistake International Journal of Law and Information Technology[J]. 2012, (20): 223 -241[3] Hodges D, Creese S. Breaking the Arc: Risk Control for Big Data[C]. Big Data (2013)IEEE International Conference,Santa Clara, USA, 2013.

[4] Van Kleek M, O’Hara K The Future of Social is Personal:The Potential of the Personal Data Store[M]. Social Collective Intelligence: Computational Social Sciences, Springer International Publishing, Switzerland, 2014.

[5] Nissenbaum H. Protecting Privacy in an Information Age:The Problem of Privacy in Public[J]. Law and Philosophy,1988, (17): 559-596.

[6] 吴秉聚. 大数据改变时代[的. 经济日报, 2014, 3(01): 008.

[7] 王秀哲. 我国隐私权的宪法保护研究朋. 北京: 法律出版杜, 2011: 124-126.

[8] 王秀哲. 隐私权的宪法保护M. 北京: 社会科学文献出版社, 2007.

[9] 蒋报. 个人数据的法律保护M. 北京: 中国政法大学出版社, 2008.

Research on Personal Information Protection in Big Data Age

MA Yuan
(School of Economics and Management, Beijing University of Posts and Telecommunications, Beijing 100876, China)

Big data is a new and effective collection and analysis of a large number of real-time data, big data is large, fast, and can accommodate a wide range of many kinds of data, which also contains a large number of easily lead to sensitive data privacy violation. Big data in the current era to promote a new business model gradually formed, the business model can provide huge economic expectations, social welfare expectations and cultural innovation is expected. The storm brought about by big data has changed the way we communicate with each other, but at the same time it gives us more information about ourselves. Starting from the characteristics of big data, this paper analyzes the potential threat of big data to personal privacy, and puts forward some suggestions on personal information protection strategy in big data era.

Big data; Personal information; Privacy protection; Benefit game; Data traceability

TP311.13

A

10.3969/j.issn.1003-6970.2017.12.049

本文著录格式:马媛. 大数据时代个人隐私保护策略的研究[J]. 软件,2017,38(12):249-253

猜你喜欢

信息
信息超市
展会信息
展会信息
展会信息
展会信息
展会信息
信息