APP下载

大数据的法律确权研究

2016-04-17涂燕辉

关键词:控制者民法个人信息

涂燕辉

(北京师范大学法学院,北京100875)

大数据的法律确权研究

涂燕辉

(北京师范大学法学院,北京100875)

在信息时代,一切数据都是有价值的,大数据的商业化利用已成必然趋势。大数据商业化利用的前提是大数据的确权。根据其产生和利用方式的不同,可以将大数据分为个体数据和整体数据。个体数据是基于自然人、法人及其他组织等个体在互联网上的行为而产生的数据,属于个人信息,权利归属于个体,商业价值不大;整体数据是海量个体数据的集合,属于民法上的“集合物”,具有极大的商业价值,其所有权归属于信息控制者。整体数据即通常意义上的“大数据”,对大数据的搜集和利用须以不侵犯个人信息权为前提。

大数据;法律确权;集合物;个人信息;信息资产

在数据化时代的浪潮下,每天都有大量的数据产生。“淘宝网每天有超过数千万笔交易在发生,单日数据发生量超过50TB(1TB等于1000GB),存储量40PB(1PB=1000TB)。新浪微博的总注册用户超过了6亿,日活跃用户达到4980万,月活跃用户1.3亿”。[1]这些存储于服务器中的海量数据,通过特殊的处理模式就可以转化为十分有价值的商品,应用到商业、科研、教育服务、军事等各个领域。例如百度利用用户的搜索和浏览数据分析个人的兴趣爱好、上网偏好等,推出精准的网络广告,实现个性化的服务推荐。谷歌则利用其庞大的搜索数据库推出流感预测等公共服务;在信息化时代,一切数据都是有价值的,数据交易市场也初具规模。Infochimps、Factual、日本富士通公司、微软的Windows Azure Marketplace、中关村数海大数据交易等都在构建数据交易平台,进行数据交易。但无论是大数据的使用还是交易,前提都是大数据的确权。只有明确大数据的法律性质是什么,受何种法律保护,数据权利归属于谁,才能明确数据各方的权利义务关系,更好地促进数据的使用和保护。

一、大数据的界定

析概念以辨理,明晰大数据的内涵和外延是分析其法律属性和权利归属的起点。大数据是一个被广泛使用的词汇,经济学、管理学、计算机等多个学科都在定义和分类自己的“大数据”。那么从法律的角度如何对大数据进行定义和分类,才能使其具有法律确权的意义呢?

(一)大数据的定义与特征

大数据(Big data),或称巨量数据、海量数据,目前在法律上对其的定义还没有形成共识。著名产业调研机构Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。IBM公司对大数据给出的4V特征受到学者和产业界普遍认可,即数量大(Volume)、快速变化(Velocity),庞杂内容(Variety)和精确性(Veracity)。他们认为在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等。换言之,从计算机学科的角度而言,大数据是原材料,利用特殊的处理模式和计算方法能够从海量数据中得出有价值的信息,其关注的重点在加工过程及加工后的产品。而在法学上,大数据则指原始庞大的数据库,侧重看大数据的来源和利用方式是否符合法律的规定。

(二)大数据的分类

1.标准化数据与非标准化数据

根据数据呈现的方式不同,可以将大数据分为标准化数据和非标准化数据。这种分类方法可以让我们更好地了解大数据的含义、组成及特征。所谓标准化数据即传统意义上的数据,一般为“数字”信息,也包括利用数字制作的图表、图片等。常见的标准化数据有客户量、业务量、营业收入额、利润额、调研数据等等。非标准化数据则不仅包括数字,还包括文本、图片、音频、视频等多种格式的信息,涵盖范围十分广泛。例如微信、微博、博客、QQ等社交媒体上的文本、图片信息,账号,音频视频分享,通话录音,电子邮件,位置共享,点评信息,交易记录,搜索记录等。在大数据的背景之下,通过互联网进行的一切行为产生的数据都可以构成大数据。因此,较传统数据而言,大数据范围广、数量大、内容杂、变化快,是典型的“大”数据。对利用大数据的企业而言,大数据一般来源于两部分:一是产生于企业内部的运营数据,通常为结构性、标准化的“数字”信息;一部分为存储于自己网络服务器中的庞大数据库,例如用户个人信息、账号、交易记录、搜索记录、支付记录等等。因此,大数据本质上是各种标准化和非标准化数据的简单集合。通过对大数据的分析得出的商业秘密或其他智力成果,则属于大数据的利用成果,而非大数据本身。

2.个体数据与整体数据

从数据产生和利用的不同层面,可以将大数据分为个体数据和整体数据。这种分类方式有助于明确大数据中的法律关系及其权利归属。个体数据是指基于自然人、法人及其他组织等个体在互联网上的行为而产生的数据,包括注册的个人信息,社交网络中的图片、视频,网络浏览记录,电子商务中的购买记录等等。这些数据直接来源于个体的行为,因此许多个体信息都属于个人信息。从微观上而言,大数据是由个体数据构成的,个体数据是组成大数据的最小单元。通常个体数据商业价值并不大。整体数据则是海量个体数据的集合,从宏观的角度而言,大数据就是存储于网络服务商服务器上的庞大数据库。作为整体存在的大数据才是真正意义上的大数据,具有巨大的潜力和商业价值。对于企业而言,数据量越大、来源越广,数据的价值才会越大。因为通过对不同数据的分析利用,可以透视事物的不同方面,以消费客户为例,消费记录信息能透视客户的消费能力、消费频率、消费兴趣点等,渠道信息能透视客户的渠道偏好,消费支付信息能透视客户的支付渠道情况,一般来说,企业用以分析的数据来源越广、越全面,其分析的结果就越立体,越接近于真实。信息控制者即指这些能够实际控制大数据的企业或网络服务商,只有他们才能搜集和真正利用大数据谋取利益。在理论上就相同的“大数据”一词,不同的文章其所指意义也有不同。通常从权利保护方面而言的“大数据”多指个体数据,例如大数据时代下的个人信息保护;从大数据的利用方面而言的“大数据”多指整体数据,例如大数据的商业化利用研究。

二、大数据的法律属性

大数据的法律性质是确定其权利归属和法律关系的前提。我国法律还没有关于大数据的直接规定,因此大数据在法律上应属于人格权利益还是财产权利益,人格利益中是属隐私还是个人信息,财产利益中是属智力成果、无形财产还是有形财产,是动产还是不动产等问题并没有统一的认识。由上文可知,根据大数据的产生和利用方式的不同,我们将大数据分为个体数据和整体数据,其中个体数据侧重于个人信息的保护,而整体数据侧重于其商业价值的利用。由于个体数据直接产生于个人行为,理应属于个人信息,不再赘言。那么作为整体数据存在的大数据,其法律性质为何呢?

(一)汇编作品

有的学者根据大数据“集合性”的特征,认为我国法律上存在与之相关的概念。他们主张将大数据视为“汇编作品”,作为无形的智力成果,权利人可以主张知识产权的保护。[2]对此,笔者认为仍需商榷。《中华人民共和国著作权法》第十四条规定,“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品”。由此可知,汇编作品要求内容的选择和编排要体现独创性,否则不构成汇编作品。而多数大数据的集合仅仅是一些标准化或非标准化数据的简单集合,属于事实集合的范畴,并没有体现独创性。如果用汇编作品的标准来衡量大数据的价值,显然许多应受保护的数据不能得到该有的保护。因此,笔者认为对大数据集合本身,由于其巨大的利用价值,我们理应保护。如果数据的集合还体现了“独创性”,则还可以主张作为汇编作品保护,这二者并不冲突。换言之,对于有独创性的集合数据,可以有双重保护,因为其保护的利益不相同。

(二)信息资产

由于大数据本质上属于信息,利用大数据也主要利用其信息价值。因此有的学者主张,大数据是信息化时代下的一种新型资产,传统财产权的客体无法将其涵盖,应建立信息资产制度,信息本身即是信息资产的客体。在信息化时代,信息就是价值,信息就是财产,信息的保护是财产权制度中不可缺少的一环。信息资产的重要性毋庸置疑,但我们是否真的需要建立信息资产这一财产权客体?在这一制度尚未建立之前,我们应如何保护诸如大数据等信息财产?通过对现有制度的解释是否也能实现对信息财产的保护呢?笔者认为,制度的建立非一日之功,在新的制度尚未建立之前,我们仍应探索现有制度的保护途径。事实上,在当下并非一切信息都值得保护,仅有少部分信息体现出了其巨大的商业价值。对于这一部分信息,通过现有的民法制度,完全可以实现对其的保护。

(三)集合物

笔者认为我们可以退一步从民法的角度出发,将大数据作为民法上的“物”进行保护。如果大数据能够符合民法上“物”的特征,则理所当然能适用物权法、侵权法、债权法等一般民事法律。民法上的“物”指具有使用价值,能满足人的某种需要并能为人所控制和支配的物质对象。其具有以下特征:第一,民法上的物是“有体物”,即具有一定的体态,占有一定的空间,并不要求有形;第二,民法上的物是财产物,具有使用价值;第三,民法上的物能为人类所支配和控制。[3]大数据显然符合这些要求,首先大数据虽然表现为二进制代码,但是其需要占据数据存储空间,尤其在网络空间逐渐成为独立空间的时代,数据就是网络空间中物的体现。其次,数据具有使用价值,能满足人类的某种需求。这点毋容置疑,大数据的适用案例和数据交易的兴起皆是大数据具有使用价值的证明。在大数据时代,数据不仅能满足人类的某种需求,数据甚至能满足人类的各种需求。再次,大数据也能为人类所控制和支配。大数据虽然数量庞大、结构复杂,但是其毕竟存在于人类构建的网络空间中,只要信息控制者愿意,随时可以控制和支配存储器上的数据,用于达到自己的目的。因此,大数据属于民法上的物。

那么大数据属于民法上的何种“物”呢?首先大数据属于一般财产物,而非人人都能享有的公共产品,诸如空气等。因为大部分大数据仍为特定的人享有,例如百度的搜索记录只能为百度公司控制、支配、处理。即使大数据具有可复制性强的特征,边际成本很低,也不能将大数据视为公共产品。其次,大数据应属于民法上的集合物。集合物不是数个独立物的简单相加,而是因其“集合”而产生了新的特征,从而成为了新的物。大数据是无数个体数据的集合,而这种“集合”本身才使得这些数据有了价值。如果仅仅是个体数据,而不具有大数据之“大”的特性,没人会买这样的数据,对企业而言单个的数据也无价值。因此,笔者认为虽然大数据是由无数的个体数据构成的整体数据,但是这个整体数据因其“大”的特征而具有了价值,构成了新的物,即集合物。这种处理个体与群体关系的方法或规律,在社会科学领域广泛存在。①[4]

三、大数据的法律确权

个体数据属于个人信息,整体数据虽由个体数据构成,却具有自己独立的价值,属于集合物。确定大数据的法律属性之后,其权利归属和法律关系的确定便水到渠成了。

(一)个体数据的权利归属

个体数据来源于个人行为,属于个人信息,其权利当然归属提供数据的个人。这种权利即个人的信息自决权,核心体现为对个人信息的控制权。这种控制表现为个人有权了解谁在搜集其信息资料、搜集了怎样的信息资料、搜集这些信息资料从事何种用途、所搜集的信息资料是否客观全面、个人对这些信息资料的利用是否有权拒绝以及个人对信息资料是否有自我利用或允许他人利用的权利等内容。[5]例如,个体的账号信息、浏览记录、购买记录等事实数据的搜集,网络服务商应征得个人同意,个人也有权要求网络服务商消除这些信息。

(二)整体数据的权利归属

整体数据的所有权归属于信息控制者。整体数据不同于个体数据,其价值的取得在于集合了大量不同个体来源的数据。我们无法将整体数据与具体的个人相联系,因此大数据不具有人格利益,是纯粹的财产物。在此基础上,整体数据的财产所有权应归属于信息控制者。主要理由有:第一,大数据实际处于信息控制者的支配之下,只有他们才能真正利用这些数据;第二,作为整体存在的数据实际上不可能为个体分别所有,也不能说每个个体都对整体数据享有什么权利;第三,信息控制者为数据的取得付出了代价,理应获得这些数据中所蕴含的商业价值。网络服务商能取得这些数据的前提是其为个体提供了相应的服务;第四,将数据的所有权归属于信息控制者能简化数据交易的过程,促进市场更好地发展;最后,从已有的数据利用方式看,利用数据的主体都是信息控制者,而非单独的数据个体。因此,作为整体数据存在的大数据应归属于信息控制者。

(三)大数据中的权利义务关系

大数据的法律确权不仅要确定大数据的权利归属,还需确定大数据利用中所涉的权利义务关系,只有明晰的法律关系才能引导数据市场的正常发展,促进数据的利用和保护。由上文可知,大数据所涉的法律关系主要有两个方面,一是在数据的产生和搜集过程中,个体与信息控制者之间的关系,核心内容是个人信息的保护;信息控制者搜集和利用信息必须充分尊重个体的知情权和同意权。如果涉及隐私等一旦为他人知晓就将带来巨大困扰的敏感性信息,即使个体通过默示的方式同意,也不能公开使用。二是在数据的利用过程中,信息控制者与第三方之间的关系,核心内容是财产权的处分。信息控制者对整体数据享有完全的所有权,即享有占有、使用、收益、处分的权利,可与第三方就任何利用方式达成协议并支付相应的对价。协议问题主要适用合同法律关系,数据的转让和共享适用物权法律关系,其他方式皆可参照现有财产法律关系适用。需注意的是,对大数据的利用不得侵犯个体的隐私权等人格权益,但有时为了公共利益的除外。例如,为了研制流感疫苗,而调取利用病人的病历资料等。

结语

随着信息时代的来临,数据的价值越来越大,数据交易也初见规模,数据确权对数据的保护和利用具有十分重要的意义。个体数据来源于个体行为,属于个人信息的保护范畴。大数据是纵多个体数据的集合,构成一个庞大的整体数据,这个数据整体因其本身的价值形成了民法的“集合物”,所有权归属于信息控制者。信息控制者所有权的利用需以不侵犯个人信息权和隐私权为前提。在信息时代下,信息就是资产,一切数据都是有价值的,如何促进信息的利用和保护是互联网治理的重要内容,希望本文的分析能为立法和司法提供一些参考资料。

[1]刘宇晗.大数据时代个人信息的民法保护[J].中国律师,2014(2).

[2]林华.大数据的法律保护[J].电子知识产权,2014(8).

[3]刘凯湘.民法总论[M].2版.北京:北京大学出版社,2008:59.

[4]费孝通.乡土中国[M].北京:北京大学出版社,2012:158-159.

[5]王利明.论个人信息权的法律保护——以个人信息权与隐私权的界分为中心[J].现代法学,2013(4).

注释:

①费孝通先生在其《乡土中国》一书中曾谈到,“群体固然是由一个个人聚合而成,没有一个个人也就没有群体。但是形成了群体的个人,已经不仅是一个个生物体,他们已超出了自然演化中的生物界,而进入了另一个层次,这个层次就是社会界。……社会本身是实体,生物人不能认为是社会的实体,而只是社会的载体。……实体与载体不同,实体有自己的发展规律,它可以在载体的新陈代谢中继续存在和发展。正如细胞与人本身的关系……”。大数据与个体数据的关系,正如社会与群体的关系,大数据的集合本身就具有价值。

(责任编辑:梁念琼liangnq123@163.com)

Study on the Legal Rights of Big Data

XU Yan-hui

(Law School,Beijing Normal University,Beijing100875)

All the data are valuable in the age of information,and commercialization of big data has become the inevitable trend.The premise of application of big data commercialization is the confirmation of legal right on big data.Depending on how it generates and differences of usage,big data is divided into individual data and integrated data.Individual data refers to the data generated on the basis of online behavior of natural persons,legal persons and other organizations,right of which,as personal information,belongs to individual instead of commerce.Integrated data refers to the integration of massive individual data and belongs to"collection"in civil law,which has great commercial value and ownership goes to information controller.Integrated data mainly refers to the so-called big data,and the collection and use of big data is subject to a non-infringement of personal information rights.

big data;legal right;integration;personal information;information assets

D913.2

A

1008-018X(2016)05-0083-05

2016-07-02

涂燕辉(1991-),女,四川乐山市人,北京师范大学民商法学硕士。

猜你喜欢

控制者民法个人信息
如何保护劳动者的个人信息?
个人信息保护进入“法时代”
从“控制者”变身“隐形人”
警惕个人信息泄露
论人工智能的刑事责任能力与追究
浅谈中小学财务人员角色转换的紧迫性
数据控制者的权利与限制
《民法总则》第171条第3款评释
论习惯作为民法法源——对《民法总则》第10条的反思
民法总则立法的若干问题