大数据时代个人信息保护
2016-03-27徐畅
文/徐畅
大数据时代个人信息保护
文/徐畅
随着大数据时代的到来,个人信息保护面临着新的挑战和困难,厘清个人信息保护面临的不同于传统互联网语境下的新问题是研究的重点。个人信息在大数据时代呈现出动态化、资源化、二次利用和多样化的新特征,也存在着个人信息的不当收集和非法利用、随意共享和交易以及泄露等典型问题,需要从法律制度上对这些问题进行研究和解决。
大数据;个人信息保护
随着云计算和互联网技术的高速发展,大数据(big data)概念从提出之日起就给教育、商业、科技等各个领域带来新的变革和影响。个人信息作为新兴资源,在大数据时代的经济价值和社会价值日益凸显,其带来的潜在巨大利益使其面临一系列新问题和挑战。
一、大数据和个人信息的基本概念释义
●大数据的概念
从亚马逊、谷歌等公司对用户的精准营销到社会管理中对个人信息的收集利用再到频繁曝光的个人信息泄露事件,大数据技术可以说已经渗透到了人们生活的方方面面。从2008年《Nature》推出大数据专栏开始,大数据概念逐渐流行。目前学界并无确切统一的大数据的概念,全球著名管理咨询公司麦肯锡公司将大数据定义为无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。[1]国内学者齐爱民认为,大数据指无法在短时间内用传统IT技术和软硬件工具对其进行收集、处理和分析的数据集合 。[2]综上所述,可以将大数据定义为需要新处理模式对其内容进行收集、管理和利用的,具有海量、高增长率等特征的数据集合或信息资产。
通常认为,大数据时代的基本特征主要有:数据量大(Volum e Big),数据量级已经超出了传统方法和技术的处理能力,数据量已从TB发展至PB甚至ZB;数据类型多样(Variab le Type),除了传统的结构化数据外,非结构化数据如照片、视频、微博等发展
迅速,网络日志、音频、地理信息等数据类型多样,且逐渐成为主流数据;数据处理速度快(Velocity Fast),海量的数据要求快速高效地实时处理,数据处理工具也在快速演进;数据价值密度低(Value High and Low Density),海量的数据中包含了大量冗余的数据信息,有效信息占整体数据的比重不断减小,因此数据价值密度低。
●个人信息的相关概念辨析
个人信息是一切能够识别本人信息的符号系统,包括个人的身份、身体状况、婚姻家庭、财产生活、工作等一系列信息。但是在学界,个人信息与个人数据、个人资料,个人信息与隐私权的界分并不明晰。
一是个人信息与个人数据、个人资料的辨析。在大数据时代个人信息保护的相关研究中,大多数学者使用的是个人信息的概念,但也有部分学者使用个人资料、个人数据的概念,尽管三者表述的对象是相似的,但三者还存在一定区别,因此有必要将三者作出区分。数据主要是一种符号化表示,个人数据是有关个人信息的符号化表示,具有表象性和客观性。个人资料是表示个人特征的信息资料,是具有个人可识别性的符号系统,相比个人数据,个人资料更能反映个体信息,强调的是内容。“信息”除了“数据”“资料”所包含的形式和内容以外,更侧重可传播性、动态性的特征。尤其是在互联网语境下,信息本身就具有动态性、实时性和可传播性的特征,因此使用“个人信息”的概念是更为适宜的。
二是个人信息与个人隐私的辨析。个人信息与个人隐私既有联系又有区别,二者在内涵和外延上有交叉但又不能完全等同。王利明提出了个人信息权的概念,认为个人信息权应属于人格权的范畴,个人信息权与隐私权在权利属性、权利客体、权利内容及保护方式上多有不同。[3]齐爱民认为对个人信息权应采取人格权的保护模式。[4]个人信息与个人隐私并不是完全对立截然分开的两个概念,个人信息的一部分(个人私密的未公开的信息)可以作为隐私保护,二者是有交叉的。即使对个人信息的保护不能将其上升到对个人信息权的保护,个人信息在大数据时代也属于一种兼具人格性和财产性的利益,是可以获得法律保护的。
二、大数据时代个人信息呈现的新特征
●个人信息的动态化
个人信息最初的存在方式是静态的,比如个人的性别、种族、血型、工作、家庭住址等基本信息,这些信息依附在某些载体上,在一定时间内变化并不大。但大数据时代的个人信息动态化特征则十分显著,比如发微博或微信,微博或微信上会自动显示本人所处的地理位置;在亚马逊或唯品会等网站购物,再次打开这些网页时会通过记录下你浏览的商品,购买的商品得知你的喜好,不间断地给你推送个性化的广告服务;手机上也会时常收到垃圾短信。再比如,美国“棱镜”窃听计划可以通过数据挖掘技术从音视频、图片、邮件、文档以及连接信息中分析民众的实时活动。这些信息都是实时性的,传播速度快,可以说个人信息的范围已经从原来的静态的识别性信息扩展到婚姻家庭、社会交往、商业活动等各类动态信息。[5]
●个人信息的资源化
个人信息原本是分散的、独立的存在,每个人的信息都有其独特性;但大数据时代强调的是运用技术手段收集民众的海量数据并加以整合利用,个人信息的集合能够分析挖掘出巨大的经济利益,可以说这种信息集合已经成为当今社会重要的资源,是“未来的石油”和“蓝海”。谷歌、微软、亚马逊、IBM、苹果、facebook、tw itter、VISA等公司都积极利用大数据为其进行商业预测,并创造新的产品和服务。例如,每个人在网页上的浏览内容并不相同,购物喜好,生活习惯都千差万别,但是大数据技术却对我们每个人的这些信息进行数据挖掘,发现浏览数据、购物数据、习惯数据的关联性
并预测出新经济增长点。
●个人信息的二次利用
对个人信息的二次利用或开发也是大数据时代个人信息呈现的新趋势。大数据时代是将分散的个人信息进行二次利用和开发,有的数据即使表面上看并不是个人数据,但经由大数据处理就可以追溯到个人。[6]大量信息聚集后的二次利用开发会产生经济利益和社会效益,但对个人信息安全也会带来威胁。
●个人信息载体的多样化
大数据时代的特征之一便是数据类型多样,非结构化数据在大数据时代占据主流地位。非结构化数据包括所有格式的文本、图片、XML、HTML、各类报表、图像、音频、视频信息等,除了储存在传统的信息数据库,个人信息还能以大量的非结构化数据表现出来。个人信息的载体不断翻新,微博、微信、Facebook、tw itter等社交网络的兴起更是使得个人信息的载体呈现多样化的特点。
三、大数据时代个人信息保护面临的新问题
●个人信息的不当收集和非法利用
大数据时代下个人信息被收集和利用是不可避免的,因为大数据的实质就是对海量的数据进行收集和分析预测,这其中就不可避免地会产生对个人信息进行经用户允许的收集和非法利用的问题。过去的隐私保护是以个人为中心的,数据收集者遵循的是“告知与许可”规则,数据收集者必须告诉个人他们收集了哪些信息,准备作何用途,也必须在收集信息前征得个人的同意,[6]以保证个人对其信息享有的知情权。但大数据时代下个人信息的收集和利用通常不会经过个人的同意,个人信息往往在信息主体不知情的情况下被收集和利用。比如网上搜索或网上购物之后,用户信息被直接存为Cookie,但其实这些信息早已被存为Cookie,Cookie可以保持登录信息到用户下次与服务器的会话,Cookie包含了大量的敏感信息诸如用户名、计算机名、使用的浏览器和曾经访问的网站等,而这些信息的收集和利用往往被个人网络用户所忽视。即使在一开始收集个人信息是合法的,但在之后的二次利用或开发中使用这些信息的目的、方式、范围也可能侵犯了信息主体的有关权益。很典型的例子是互联网公司经常对网络用户的信息进行深层挖掘,将收集的用户信息用作其他商业用途,信息使用的目的或范围与原约定便存在出入。
●个人信息的随意共享和交易
大数据时代下,个人信息进行随意共享和交易已经十分频繁,其主要表现是个人信息数据的买卖,之前早已有新闻曝出对个人信息数据非法买卖的案例。①大数据的共享也屡见不鲜,如2013年阿里巴巴入股高德地图,希望建立起海量的基础地图和生活服务数据库;之后阿里巴巴又入股新浪微博公司,并实现用户信息和交易数据的共享。而且,业内人士可以任意访问或窃取个人信息,并将其出卖给第三方、金融机构等。[7]个人信息的随意共享和交易会带来几个重要的法律问题,其一是这种大数据的共享机制是否侵犯了个人对个人信息享有的权益?个人信息在大数据时代是兼具人格利益和财产利益的权益,个人信息交易而获得的财产利益是该归属于个人还是商家?商家是否有权对这些个人信息的数据集合进行处分和交易?其二是数据共享完成之后,这些商家获得的经济利益是否是恰当的,需不需要给个人以补偿?其三是当个人不愿意使自己的信息被随意共享或交易,该如何寻求法律救济来保障自己的合法权益。对于这些新问题目前学界并没有明晰统一的结论,随着大数据时代的方兴未艾,这些问题也都亟待厘清和解决。
●个人信息的泄露
大数据时代带来的另一个显著问题则是个人信息的泄露,导致个人生活轨迹被曝光,个人领域被侵犯。大数据的核心便是预测,通过收集和个人有关的一系列数据便可以还原一个人大致的生活状态,于何时在何地做何事都能被分析出来,这无形当中就侵犯了私人领域。
海量的数据被收集,个人就会时常处于无隐私的状态,[7]尤为典型的便是“人肉搜索”,扰乱了个人的生活安宁,甚至侵犯了个人的隐私权。随着大数据技术的兴起,个人信息泄露事件也频繁发生。例如,2014年携程网“安全门”事件,大量用户的银行卡信息泄露;2014年12月12306订票官方网站被指流出约13万用户数据,包括姓名、身份证号、手机号、用户名、密码等敏感信息;美国零售巨头塔吉特发生7000万顾客的付款卡和个人信息被盗取的事件等等。②可以预见的是这类个人信息泄露问题在将来会发生得更多。
伴随着个人信息泄露产生的问题便是垃圾邮件和短信、网页广告的侵扰,相信每个人都有收到垃圾短信和邮件的经历,在未经个人同意的情况下推送信息或服务本身就是对个人生活安宁的侵扰。我们的邮箱账号、手机号码等未经个人同意公开,其他主体不得随意公开。而我们会收到垃圾邮件和短信说明这些个人信息已经在未经同意的情况下公开了。一些购物网站会根据用户一段时间的购买记录,对用户进行个性化的广告推送和服务推介,还会不定时地弹出广告网页,这也给个人生活的安宁带来影响。
除了以上列举的典型问题外,大数据时代个人信息的保护还存在着以下问题需要解决。一是个人信息的监管与个人隐私的边界,对个人信息进行监管是必要的,有时基于公共利益和社会治理的考量需要对个人信息进行收集和监管,但这种监管与个人隐私的界限在哪里还需要进一步说明;二是“被遗忘权”的提出,基于大数据时代个人信息出现的新问题,有学者提出“被遗忘权”的新概念,其权利内容和制度建构还需进一步研究;三是该如何从法律制度上对大数据时代个人信息进行保护,我国现有法律框架能否解决此类问题,还是需要单立个人信息权并进行单独立法保护?这些问题都是在大数据时代探讨个人信息保护亟待厘清的重大问题,针对这些问题还有很大的研究空间。
[1]计算机行业大数据(Big Data)专题研究报告:大数据,大市场,大机遇[R].上海:中信证券股份有限公司,2011-12-07.
[2] 齐爱民,盘佳.大数据安全法律保障机制研究[J].重庆邮电大学学报(社会科学版),2015,(3).
[3] 王利明.论个人信息权的法律保护——以个人信息权和隐私权的界分为中心[J]. 现代法学,2013,(4).
[4] 齐爱民.论个人信息的法律保护[J]. 苏州大学学报,2005,(2).
[5] 胡忠惠.大数据时代政府对个人信息的保护问题[J]. 理论探索,2015,(2).
[6] 史卫民. 大数据时代个人信息保护的现实困境与路径选择[J]. 情报杂志,2013,(12).
[7] 宋曦.大数据时代的个人信息保护机制研究[D].重庆大学,2014.
[8] 刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护[J]. 计算机研究与发展,2015,(1).
注释
①参见2012年江苏南京许某等人窃取、收买、非法提供信用卡信息案,上海孙某某等人网上非法买卖个人信息案,“中国电视购物联盟网”非法出售公民个人信息等,http://www.nxnew s.net/zt/system/2012/12/ 21/010485528.shtm l ,2016年1月4日。
②参见http://tech.sina.com.cn/ it/2015-01-16/doc-iawzunex9 055150.shtm l,2016年1月5日。
徐畅,中国科学院大学公共政策与管理学院硕士研究生,研究方向:民商法和知识产权法。
责任编辑 解梅娟
D923
10.13784/j.cnki.22-1299/d.2016.06.008