APP下载

知识产权对大数据的保护路径探究

2018-09-20程文杰胡建新

职工法律天地·下半月 2018年5期
关键词:知识产权大数据

程文杰 胡建新

摘 要:随着互联网和大数据时代的到来,知识产权在这个背景下的发展变得复杂。一方面是因为大数据时代的迅速发展使知识产权法猝不及防,另一方面,大数据不同于其他传统事物的出现,它的特征和知识产权在一定程度上起了冲突,然而大数据一直没有得到很好的保护,因此在大数据时代下,知识产权对大数据的保护问题亟待解决。

关键词:大数据;知识产权;反不正当竞争

大数据的一个巨大潜力是能够重新组合来自不同来源的数据,并对它们进行比较和分析。这让我们发现了很多新的相关性。比如,这将帮助我们了解社会是如何运作的,以及一个现象如何在另一个社会中起作用。运营大数据所产生的商业模式和利益都指向了两个的事实:一是大多数数据是由别人生成的,二是数据的价值是由他们的使用而增加的,而不是对他们使用的限制。这两点事实对大数据的知识产权保护提出了新的挑战。

一、大数据的特征

大数据的特征常常被业界归纳为4个“V”:

第一个特征是数据量大。一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD①。研究表明,十年前全球的数据量单位用ZB,五年前全球产生的纸质材料数据量单位是PB,而所有的语言信息的数据量单位是EB(其中1PB=1024TB,1EB=1024PB,1ZB=1024EB)。

第二个特征是数据类型繁多。数据不单是常见的数字文字形式,而是变形为多种表现方式,如声音、图片、地理位置信息,浏览记录等。多样化的数据来源正是大数据的生命线,如果说互联网是各种类型信息及行业在线上的横向发展,则大数据就是将这些毫无关联的信息和行业串连起来。

第三个特征是数据价值密度相对较低。海量的数据大爆炸式的出现,甚至包含了方方面面,但其中的有用信息却没有呈爆炸式增长,其价值的低密度性促使信息的使用者对有用信息的摘取出现难度。然而大数据的精髓不在于其精确的表达出某种直接关系,而是通过一种相关性,预测出数据的走向,这种相关性恰恰可以基于大数据这种庞大的样本容量显出其特征。

第四个特征是处理速度快。大数据时代,虽然已有基数较大的数据样本,但对于数据的处理速度较以前大幅提高,加之数据的流动性变化性也很大,对于掌握大数据的企业来说时间就是生命,迅速挖掘分析数据才能发挥数据的价值,否则数据将仅仅只是数据。

二、对于大数据的法律定性

(一)大数据的价值

从业界和学术界对大数据的定义可以看出其价值的体现,目前主流的定义有以下几种:

1.数据本位论

持该观点的学者大多认为大数据的价值在于其广阔的数据类型(Variety),属于数据本身的价值。

2.技术本位论

技术本位强调其价值在于对大量数据进行的检索、提取和分析,虽然存储和处理海量数据的许多技术挑战已经解决了多年,但直到最近才有能力捕捉、存储、处理和提供跨越许多领域的数据,并以这样的速度完全实现。大数据是一种利用庞大数据中某些有用信息作出相关性判断和预测的技术,由于其数据本身价值密度低(Value),若不对数据进行抓取和挖掘,数据背后的潜在价值将被忽略。

3.信息资产论

信息资产论的观点倾向将大数据从狭隘的技术论中抽离出来,侧重于对大数据进行新模式的处理从而将其变成有更强决策力和发现力的经过优化属于某主体的信息资产。将大数据看作资产强调了其权利归属,而产生信息资产满足知识产权对客体属于无形财产的要求。

(二)大数据与知识产权保护的冲突

1.数据共享性对知识产权专有性的挑战

事实上,“大数据”指使用大量数据解决计算密集型问题。由于涉及的成本,大数据最初仅限于政府机构或大型学术机构,这些机构可以获得最先进的计算资源,拥有计算能力并试图解决诸如预测天气模式或绘制DNA测序等复杂的挑战。然而,在上世纪80年代和90年代,某些消费行业,如电话公司和信用卡供应商,学会了挖掘他们庞大的通话记录数据库,以找到“掘金”的信息。微妙的趋势和汇总的统计数据让市场分析人士了解到如何为他们的服务定价,或者预测客户的出行及消费意向。

综上,大数据的产生基于两种情形,一种是基于对自然科学观测的数据,另一种是基于每个人都是数据单独的生产者产生的数据。现如今多国提出把科学数据实现开放与共享,避免了信息不对称带来的停滞,创造出更多的科研价值和经济利益。对于国家和科学机构来说,数据的共享意味着节约成本和双赢,单独的数据本身并不能以公开换垄断的方式获得知识产权。

而对于后一种情形,一般是由各类主体在某一平台完成数据的产生,平台由其与主体之间的协议获取数据,这些数据不属于公共利益的范畴,故在理论上,可以版权权益的方式对其保护。但在实践中,使用版权方法却是行不通的。所有用户生成的数据、在网上公开发布的图片、视频或其他创作都是受版权保护的。但这种版权从未真正使用过,更重要的是,所有用户生成内容的价值在于使用它。用户生成的内容,为了有价值,必须自由地复制和粘贴,创建衍生品,并且,从根本上来说是共享的。這与版权试图实现的一种有限的、受控的发行和复制系统背道而驰。

2.数据分享无国界要求对知识产权地域性的挑战

知识产权具有极强的地域性,只能在授予其权利的国家范围内受到法律的保护,具体体现在权利的取得、诉讼管辖和法律适用等方面。而如今互联网已将地球变为地球村,随着Amazon和谷歌提供的云存储和处理服务的出现,再加上Hadoop等大型开源数据库,极大地降低了捕获、存储大量数据的成本,加快了数据的传播,再加上数据传播范围广、成本低,使得难以准确界定出数据产生的地域归属、传播的范围、受到侵害的程度,也往往很难举证,就更谈不上后一步的法律适用问题。这些特征严重的动摇了知识产权的地域性。

3.数据更新速度快对知识产权时间性的挑战

为了持续的有效性,大数据算法必须不断调整,以具有相关性和业务价值。大数据,顾名思义,就是不断改变其体积、来源、速度和行为的数据。本文所说的知识产权时间性包括,申请保护的时间和保护的周期。大数据分析和算法的动态开发周期可能没法受到专利法的保护。

三、对大数据保护路径的研究

根据《民法总则》第一百二十七条:“法律对数据、网络虚拟财产的保护有规定的,依照其规定”。可见我国对数据保护指向性模糊,只作出了原则性规定,司法实践中常根据案情适用其他法律。然而在具体研究时应考虑到大数据本身的开放性和流动性,不可给予过强的排他权,对大数据产业的发展造成阻碍②。

(一)对大数据的著作权保护

数据是一种信息,著作权保护的是信息的编排方式。如果数据只有一种表述是可能的,那么就没有著作权保护,因为没有创造性的选择,这就是著作权理论所阐述的。从逻辑上讲,这意味着大多数数据将在著作权之外。任何由机器或传感器产生的数据、任何统计或数学数据都不会被著作权所保护。但是大数据是复杂的,是对原始数据进行整合、挖掘、加工后形成的,其获取、处理和应用都不容易被达到。

大数据的处理流程可以分为三个阶段,第一阶段是数据预处理,将未加工的原始数据转化为适合处理和管理的形式,如数据库、数据仓库等,这一阶段的数据内容在司法实践中常用著作权进行保护。第二个阶段是数据挖掘,分析提取数据中隐藏的过去未知的目的信息,目的信息是指进行数据的检索、收集、分析、挖掘时我们意欲发现的事实、关系等,彼此孤立的数据通过服务于同一目的信息而相互勾连成为大数据。被目的信息聚拢的大数据才具有成为法律客体的资格③。第三阶段是数据后处理,将处理后的数据可视化,转变为方便从不同视角探查的形式,其形式可以其特殊的编排或软件的方式体现,通过著作权进行保护。

(二)对大数据的专利权保护

传统的数据库和存储专利通常侧重于硬件(例如,高通量网络存储系统)或用于实现存储和访问数据的事务或分析过程的数据库管理软件系统。但随着企业转向标准的、现成的(通常是开源的)平台和云端供应的硬件和存储,新一代公司创造的知识产权变得更加模糊和难以识别,甚至更难获得专利。

在“大数据”环境中识别潜在的可专利性主题的一种方法是将这个过程分解为三个阶段提取整合、分析和应用。举例来说,一个大型超市,从其销售点、供应链和客户数据库系统收集内部数据,以及来自市场研究公司、社交媒体网站、第三方支付公司的外部数据。每天收集和整理这些数据无疑是一个挑战。无论是通过自定义编程接口,专有数据服务,还是其他自定义数据摄取过程,仅仅将所有数据一次性地放到一个地方,以及允许不同来源的数据一起使用一个格式,都可以成为专利的沃土。因此需要一个系统,测量数据结构,以各种格式和使用各种分析过程生成规范化、结构化的元数据。组织和分析数据涉及的软件都是可能获得专利和版权的,运行这些程序的计算机处理器也可以获得专利。

(三)反不正当竞争法对大数据的保护

根据《反不正当竞争法》,不为公众所知悉,能为权利人带来经济利益、具有实用性,并且权利人采取了保密措施,可以作为商业秘密进行保护。但是若对于大数据没有采取保密措施,同时又不能作为著作权来保护的已经公开的数据,可根据《反不正当竞争法》第二条一般性的条款进行保护。

前不久,某手机向用户提供了诸多人工智能的服务,包括根据微信聊天内容加载显示地址、天气、出行等信息,微信对此举动表示不满,向工信部提出了投诉。这其中涉及的法律问题是:该手机收集用户数据是否合法,有没有构成不正当竞争,甚至是华为的做法是否侵犯了用户的隐私权。

隐私权本文暂且不谈,主要说说前两个法律问题。根据《网络安全法》第四十一条④,如果该手机在收集用户数据时和用户签订了用户协议,且提取的数据是和提供的服务相关的,也没有在用户不允许的情况下将信息提供给第三方使用,那么就可以初步判断出华为收集用户数据是合法的。至于有没有构成不正当竞争可以从以下方面入手:它的做法是否使微信的增值业务受到损害;是否具有正当性。微信可以举证华为损害了其业务的收入,使用户本应从微信上使用的功能下载的软件发生了转移。然而微信似乎没有有力证据证明华为的侵权问题,以至于没有起诉而是向工信部提出了投诉。

企业在通过OpenAPI模式获取用户信息时,应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则⑤。大数据的提取和挖掘需要投入大量人力物力,大数据的开发者为此付出高额时间成本和经济成本,若放任他人不经允许无偿利用这些开发成果,将会形成不良竞争,让企业疲于开发创新,而是坐享其成。不过,在适用反不正当竞争法进行保护时应当注意一定的限度,不可因保护影响到大數据的交易和合理利用,阻碍整个大数据市场的迅速发展。

(四)我国对大数据的知识产权保护展望

在数据中创造新的产权需要认真考虑对创新的不利影响,如所有者和使用者的权利,这将是确保公众对获取和使用数据的必要条件。考虑到快速变化的数据环境,提出数据所有权可能为时过早。这样做很可能造成不确定性,增加交易成本,并对创新和更广泛的公众利益产生不利影响。

“数据”是一个很难定义的概念,我国现今谈到的“大数据”不单单是数据本身,更多应当将其看作一个集合性权利。通过著作权对汇编作品的定义只能保护数据汇编结构无法保护“大数据”的内在价值。而反不正当竞争法和商业秘密保护“大数据”存在其固有弊端,只能起到补充保护数据本身价值的作用。因此针对“大数据”的特点应当更好地完善数据的知识产权法保护模式,在利用反不正当竞争法和商业秘密补充保护“大数据”实质内容的情况下,明确著作权法中“大数据”汇编作品的独创性标准以便充分保护“大数据”的表现形式,同时赋予“大数据”集合特殊权利保护有实质性投入的“大数据”集合内容本身⑥。

注释:

①来自网络http://www.sohu.com/a/125757548_580299.

②刘仁.《大数据呼唤知识产权护航》,《中国知识产权报》,2017年7月28日,第009版.

③王广震.《大数据的法律性质探析——以知识产权法为研究进路》,《重庆邮电大学学报》,2017年7月,第29卷第4期.

④《网络安全法》第四十一条:网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意.

⑤来自网页http://www.sohu.com/a/124906553_608782.

⑥彭敏.《“大数据”时代的知识产权法保护》.《传播与版权》,2016年第6期.

参考文献:

[1]刘仁.大数据呼唤知识产权护航.中国知识产权报,2017(7).

[2]王广震.大数据的法律性质探析——以知识产权法为研究进路.重庆邮电大学学报,2017(7).

[3]邓灵斌,余玲.大数据时代数据共享与知识产权保护的冲突与协调.图书馆论坛.2015(6).

[4]彭敏.大数据时代的知识产权法保护.传播与版权.2016(6).

[5]来自网页http://www.sohu.com/a/125757548_580299.

[6]来自网页http://www.sohu.com/a/124906553_608782.

作者简介:

程文杰,桂林电子科技大学法学院,硕士研究生,研究方向:知识产权法。

猜你喜欢

知识产权大数据
Mesenchymal stromal cells as potential immunomodulatory players in severe acute respiratory distress syndrome induced by SARS-CoV-2 infection
重庆五大举措打造知识产权强市
关于知识产权损害赔偿的几点思考
大数据环境下基于移动客户端的传统媒体转型思路
知识产权为“互联网+”护航
知识产权