我国大数据应用的法律问题研究
2019-03-27
(郑州大学法学院 河南 郑州 450001)
一、大数据应用的基本理论
(一)大数据的定义
“数据已经渗入到当今每一个行业和业务智能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大数据这一概念是由美国麦肯锡咨询公司于1998年4月提出的,随着互联网科技的不断进步,2010年维克托·迈尔·舍恩伯格在《经济学人》上发布了长达14页对大数据应用的前瞻性研究,大数据不仅是海量的数据资料,更重要的是在这些big data背后的价值分析和利用。‘大数据’是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性。
(二)大数据的特征
对大数据特征的认识,目前已基本达成共识:1.数据规模大。随着互联网科技的发展,数据规模不断扩大,呈现出数据存储量和数据计算量庞大的显著特征。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量,大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。巨大的存储单位说明了数据存储量的庞大。2.数据种类多。人们在网络上不仅使用文字性的数据,除此之外还有图片,视频,语音等等一系列复杂多样的数据。除了网络数据以外还有商业数据、科学数据等等数据。众多数据呈现出结构化数据、半结构化数据和无结构化的数据形式。所谓结构化的数据,是指数据可以按照一定的标准进行分类,便于采集和搜索的数据。这一类的数据能够比较容易的处理,但是由于数据种类的多样性半结构化和无结构化的数据也越来越多。数据时代越来越多样的数据需要进行处理。3.数据要求处理速度快。谷歌每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源,在电脑高速处理下才能够对流感进行预测。在现在这样一个大数据的时代要求处理数据的速度十分迅速才能适应数据时时变化万千的特点。4.数据价值密度低。研究表明,只有5%的数据是结构化的能够适应传统的数据库,还有95%的数据是非结构化的。比如我们经常会转发微信微博等等,同一条数据信息被转发了很多次,对于整个数据资源的总量来说是增加的,但对于真正有效的数据信息来说价值密度下降。数据的绝对数量激增,数据包含有效信息量地比例不断减少,数据价值密度偏低。
二、我国大数据应用的问题
(一)立法现状与不足
1.没有统一的大数据相关法律
大数据发展如此迅速,可我国目前仍没有统一的大数据立法规定可以适用相关的法律问题,当数据应用发生纠纷仅能通过目前已有的法律法规进行相关规制。当前虽然没有一部统一的系统的大数据相关的法律,但是我国在大数据的法律研究上也在不断地进步。2015年《电信和互联网用户个人信息保护规定》(部令第24号)出台,对用户的个人信息进行保护。2016年3月7日,证券时报两会报道组,报道全国人大代表、青岛大学副校长邵峰晶建议,应尽快研究大数据共享保护机制,尽快启动相关立法,将大数据定义为知识产权的表达形式。2016年12月10日,中国大数据与法律大会第二届大数据时代双创商业模式研讨会在重庆大学召开,就大数据时代的商业模式和信息安全等问题进行了研讨。2017年新的《民法总则》通过,在第110条规定:“自然人的个人信息受法律保护。任何组织和个人不得非法收集、使用、加工、传输个人信息,不得非法买卖、提供或者公开个人信息。”
2.现有的涉及大数据相关的规定缺乏可操作性
据《电信和互联网用户个人信息保护规定》中的“知情、同意、合理、必要”原则可做出基本的、大致的隐私界定,但实践中仍需要做出具体的判断。同样,尽管新《消法》,对于消费者个人隐私的保护已经有了明确规定,2017年新的《民法总则》也对个人信息的保护做出了规定,都展示出大数据时代下,个人信息的保护,但是具体如何操作什么样的收集是非法收集?什么样的使用是非法使用?仍然需要相关的实施细则对其进行界定。
(二)实践情况与问题
1.数据的权属问题
权利是一个法律概念,因此,是否存在权利以及谁拥有该项权利需要依据法律加以界定;多数情况下,数据记录者并非数据内容主体,数据内容主体与数据载体主体的分离及其二元结构增加了数据权利问题的复杂性。有论者主张,将数据划分为专有数据(如个人数据、企业数据、政府数据)、共有数据(无明确主体指向的数据)、原生数据(不依赖于现有数据而产生的数据)、衍生数据(原生数据被记录储存后经过算法加工、计算、聚合成系统可读取的数据),并据此确定数据的权利。根据数据的来源不同将其划分权利,表面十分合理,但是忽略了大数据的现状,大数据现如今已经商业化运作,根据大数据所提供价值的不同来源,确定相关大数据主体,划分相关权利才更加合理。第一种是基于数据本身的主体。这些主体拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。最好的例子就是Twitter,它拥有海量数据这一点是毫无疑问的,但是他的数据都通过两个独立的公司授权给别人使用。第二种是基于技能的主体。他们通常是咨询公司、技术供应商、或者分析公司。它们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的才能。比方说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的主体。Pete Warden,Jetpac的联合创始人,就是通过想法获得价值的一个例子。Jetpac通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于某些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和员工的创新思维,他们又怎样挖掘数据的新价值的独特想法。
基于数据主体的这一分类,我们也可以相应地将与数据有关的权利分为三种:一是数据权利及其方法。此类主体收集拥有一定的数据,且具有一定的商业价值,通过将其拥有的数据提供给他人使用从而获取一定的商业利益,受法律保护。此类收集数据的工作虽然本身并不是一项智力活动,其数据本身并不构成著作权,但如果其收集数据的方法是自己独创的,该方法可以作为著作权并受法律保护。二是数据分析成果权利。此类主体的工作主要是通过其技术专家对数据的价值进行挖掘,从而产生对他人有价值的分析报告。此类主体对数据的挖掘和生成的分析报告,属于著作权的范畴,受法律的保护。此类主体可以通过出让的方式将其拥有的该项权利转让给他人使用,也可以受他人的委托为他人提供分析报告,该项分析报告的著作权的归属由委托人和受托人通过合同约定,合同未作明确约定或者没有订立合同的,著作权属于受托人。三是基于数据的创新权利。此类主体自己提出创意,并通过对相关数据的分析,发现新的问题并提出解决问题的方案。该项权利是典型的知识产权,依法受到法律的保护。
2.数据的取得问题
(1)数据的原始取得
第一,数据的原始获取主体应当具有相关数据的采集资格。公安部《关于禁止开设“私人侦探所”性质的民间机构的通知》中规定,严禁任何单位和个人开办各种形式的“民事事务调查所”、“安全事务调查所”等私人侦探所性质的民间机构。由此可见,这些具有私人侦探性质的机构不可以进行数据取得的相关工作。第二,数据原始取得的行为遵循法律的规定和要求。2009年商务部起草的《关于保护网上商业数据的指导意见(征求意见稿)》规定,在收集网上数据时,收集人应告知数据提供人收集人的真实身份以及收集数据的目的和用途。此外,收集人不得任意修改或歪曲收集到的数据,网上商业数据的收集也不得采用盗窃、欺诈、胁迫、非法访问或其他不正当手段进行。网上商业数据的使用应符合数据提供人认可的使用目的、范围和用途。未经数据提供人同意,不得将其提供的数据公开或者告知第三人。转让网上商业数据,也应当征的数据提供人的同意。
(2)数据的受让取得
第一,关于数据的二次使用问题,目前国内尚无具体的法律加以规定,根据实践来看,数据的受让取得应当遵循法律,符合双方当事人的约定:通过他人转让获得数据的受让人应当拥有该项数据的使用权利,并在转让合同约定的范围内和约定的使用方法内,使用该项数据。因此,数据的交易必须依法进行,并在转让合同中对数据的数量、使用范围、使用时间、使用方式等做明确具体的约定,以保证受让数据达到预想的目的。在数据权利转让的过程中,受让方要审查数据转让方对其所提供的数据是否是合法拥有并依法可转让的数据,如果明知某项数据是转让方以盗窃、利诱、胁迫或者其他不正当手段获取权利人的商业秘密而获取、使用或者披露的,以侵犯商业秘密罪论处。转让方允许他人使用以盗窃、利诱、胁迫或者其他不正当手段获取的权利人的商业秘密的,也要以侵犯商业秘密罪论处。第二,根据大数据产权转让,分为所有权、使用权、收益权三种交易模式:一是大数据使用权交易模式,即数据主要以租赁、检索等形式进行交易。二是大数据收益权交易模式,主要是指大数据购买者对数据使用后得到的利润需要与大数据提供商进行利益分割。三是大数据所有权交易模式,是指数据购买者获得大数据产品的使用权,以大数据的所有权进行交易的产品,一般是形成知识产权的大数据产品。
三、解决我国大数据应用问题的建议
(一)完善大数据应用问题的相关立法
1.采用综合立法的模式
美国和欧盟有很多值得我国学习的地方。美国是相对来说更为看重技术的发展,并没有设立严格的法律来专门规制大数据的相关应用,实践中是通过行业自律来指引大数据相关企业的行为,这样便于市场自我控制和调节,从而更好的促进大数据相关产业的发展,发挥大数据这一新兴产业模式的活力。然而这种模式缺乏强制力,执行性较差。欧盟是采用严格的立法模式来规范网络大数据的市场,这种模式具有一定的强制性,但是也限制了大数据和相关产业的发展。对于我国目前的现状,应当采用两种方式的结合,才能更好地发挥大数据的价值,使其更好地服务于社会。
2.制定大数据应用的专门法律
大数据应用越来越广泛,使得对大数据应用的立法的呼声越来越强烈。加上近来网络侵权方式的多样化,现有的法律规定已远远不能满足需求。应当对大数据应用进行专门立法。我国对于大数据应用的规制,也大多数是在相关法律法规中进行规制。但是,对于大数据权属的界定以及对数据取得合法性问题的规制不能在现有相关法律中找到明确的答案。然而大数据是网络时代的产物,对于跨越时间和空间的大数据而言,其复杂性和多变性要求大数据应用必须出台专门立法才能更好的让大数据发挥其作用。
(二)加强大数据应用产业的行业自律
1.完善自律公约
大数据时代,大数据应用的自律规范应当进一步完善,自律规范的制定者大部分都是数据来源性主体和技术分析型主体,前者拥有数量巨大的用户,并能从这些用户中获取海量信息,后者主要有超群的专业技能,致力于数据分析,并服务于某些大数据公司。因此,制定公约的主体应当包括收集数据信息的主体和分析和应用数据的主体。根据行业的特点和自身情况制定的公约有利于规制大数据的市场,并对多变的大数据应用问题做出及时的反馈。
2.加大对行业自律的监督
大数据产业掌握大量的信息资源,其行业自律组织如果不受监督的话后果十分严重,对于大数据应用相关行业自律组织的监督:首先,可以建立大数据产业自律管理机构的自我内部监督;其次,加强政府对行业自律的行政监管。政府作为国家和社会生活的管理者,应当充分发挥其引导、规范的自身职能,对大数据行业自律做出有效监管这也就要求:第一,构建专门的监管组织。为了避免监管组织的缺失,还有“多头监管”的混乱情况,通过制定相关法律法规,建议独立的行业自律监管机构。同时,保证监管机构的独立性。第二,赋予监管组织专有职权。比如:对相关行业制定关于遵守隐私保护政策规定的监管,鼓励互联网行业制定隐私保护政策,审核可能会造成公民网络隐私泄露的行业,以及相关行业的个人资料系统,并且向公众报告。第三,监管程序透明化。在对自律行业进行监管的过程中,应力求体现行政公开,做到监管工作的透明和公开。
结论
通过本文的分析我们从大数据的权属界定上可以根据大数据所提供的价值来源不同分为基于数据本身的权利,数据技能的权利和数据创新的权利三类。在数据取得方面分为数据的原始取得和数据的受让取得分别进行讨论。接着总结出我国发展大数据应用应该采取的模式,应当以数据立法为主,兼采取大数据行业自律为辅地模式进行。大数据的应用不仅仅是对冷冰冰的海量数据的获取和分析,其巨大的商业价值和利益促使我们想方设法去开发大数据、应用大数据,除了运用法律和制度的手段去规避大数据应用的风险问题以外,我们更需要的是在这个数据信息爆炸的时代,掌握好自己内心的秤杆,用良心和道德合理合法的应用大数据。