“大数据”的法律保护
2017-06-22白帆
白帆
对作为数据集合的“大数据”,不宜作为一般财产和准物权客体进行保护,也难以给予其著作权法保护。在目前缺乏专门立法或特别赋予邻接权的情况下,似通过《反不正当竞争法》对其提供保护较为妥当。
何谓“大数据”
梳理我国现今关于“大数据”的法学研究成果可见,学者的目光多集中于对个人信息和个人隐私等的保护两方面,对作为某种或某些财产权益客体的“大数据”则研究甚少。而厘清“大数据”中所包含的财产权益,不仅能够定纷止争,维护正常社会经济秩序,更能够通过对“大数据”的开发和运用提供有效法律保护,激励和促进行业发展,最终为国家和社会发展提供强劲推动力。
这一研究的前提是对作为分析和讨论对象的“大数据”进行清晰界定。目前国内外关于大数据的出版物很多,对其的描述和定义也丰富多样,确立权威或通用定义较为困难。首次提出“大数据”概念的Gartner、麦肯锡全球研究所、国际数据公司(IDC)、维基百科等“权威”人士和单位给出了不尽相同的定义。
值得注意的是《贵州省大数据发展应用促进条例》1中所给出的定义,即大数据“是指以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。”作为全国首部大数据地方性法规,其对“大数据”的定义较为审慎、切合实际。笔者认为,这一定义中实际上含有对“大数据”的两层理解:一是其为某种数据集合,二是也包含对数据进行采集、存储、分析和传输等的服务行业2。这样进行定义不难理解,《条例》既要规范和促进数据的采集、使用,更要促进行业健康发展;而本文所关注和讨论的对象,则应仅仅指向前者,即可能成为某种财产权益客体的“数据集合”本身。
对“大数据”的法律保护,可以从一般财产权、著作权和反不正当竞争三个角度进行分析,以下逐一论述。
一、一般财产权
对数量巨大、来源分散、格式多样的数据进行采集和存储需要投入大量资金、付出辛勤劳动,而所获得的成果也具有较大经济价值,从自然法角度出发,创造者对其有价值的劳动成果理应享有某种财产权益,至少应受到关照一般财产的传统民法的保护。但是我们会发现,“大数据”类数据集合具有典型的无形性、非独占性特征,权利人无法通过物理上的占有来对其进行垄断和支配,任何人对其进行使用均不影响及排除他人同时使用,且不影响其质量,这也极大限制了其可让与性。这已超越了传统民法上一般财产的范畴,而与智力成果等无形财产极为切合。实际上,由信息构成的成果之所以能够成为法律上的财产,是出于推动科技发展、社会进步和保护某些特定利益的公共政策需要。其能够被承认为财产以及财产权的范围如何,都取决于法律的界定;它的变化与扩张也需要得到法律的确认。3
对“大数据”应交由何种法律规范来调整,是一般财产权或设立准物权,是保护无形财产的特别法,还是另立新法专门赋权,成为立法者需要思考的难题,这也直接反映在近期的立法活动中。在全国人大常委会初次审议的《民法总则(草案)》4第一百零八条第二款第八项中,起草者明确认为“数据信息”是知识产权的客体,并在草案说明中表示这是为了适应大数据时代的发展需要,但在草案二次审议稿直至正式颁布施行的《中华人民共和国民法总则》中却都删除了该项,而改为在第一百二十七条规定“法律对数据、网络虚拟财产的保护有规定的,依照其规定。”根据立法者的说明,在立法过程中对是否规定和如何规定数据存在较大争议,最终民法总则只做了原则性规定,一方面确立了对其依法保护的原则,另一方面则需要进一步深入研究,总结理论和司法实践经验,为后续立法提供基础。5可见,立法者同样认为数据具有不同于一般财产的独特属性,但对其应交由何种法律调整和保护尚不明确。
此外笔者认为,根据《民法总则》第一百二十六条对民事权益的兜底性规定,民事主体享有的其他民事权利和利益也应当由法律规定,结合第一百二十七条对“数据”的专门规定进行体系解释,似乎都意味着通过创设所谓新型“民事权益”而得援引侵权责任法一般条款的方案并不妥当。
二、著作权
(一)狭义著作权
作为数据集合的“大数据”与知识产权中著作权的客体、尤其是汇编作品最为相关,但要成为著作权法意义上的作品,必须具备法律要求的独创性,必须达到一定的智力创造高度,足以反映作者的个性,体现其独特的判断和选择。《著作权法》第十四条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”汇编作品所汇编的对象不需要是作品或作品片段,完全可以是不构成作品的数据,但是作为一种特定类型的作品,其同样需要满足著作权法对作品独创性的要求,即在对内容的选择或者编排上体现出作者的独创性。《与贸易有关的知识产权协定》(Trips协定)和《世界知识产权组织版权条约》(WCT)中也有类似的规定,即认为数据汇编或其他资料,无论采用任何形式,只要由于对其内容的选取或编排而构成智力创作,即应作为智力创作加以保护。“大数据”的形成,往往需要经过数据抓取(采集)、辨析、抽取、清洗(去身份)等步驟,然而数据源中海量的数据使人难以对单个的数据样本给予足够关注,单纯的数据汇集不足以体现对数据的选择或者编排,也难谓其具有独创性,因此仅仅经过预处理的数据集合无法获得著作权法的保护。
那么对数据进一步分析发掘之后呢?想要凭借人工对海量的数据进行分析处理只会是天方夜谭,但随着信息处理和大型处理器等软硬件技术的飞速发展,机器学习、遗传算法、模糊集、神经网络、语义引擎等先进技术纷纷披挂上阵,为数据的分析发掘提供了强大助力,也使基于特定目的对数据进行处理成为了可能,这似乎足以成为对数据的一种选择或者编排。但是,这类选择和编排是机器按照给定条件自动完成的,在相同的要求和环境下,任何人运用同样的工具处理同样的数据,最终基本都能得到同样的结果。因此可以说,这一选择和编排的结果是唯一或有限的,其同样无法反映创造者自身的个性,也不应由某个主体独自垄断,故不能给予其著作权法保护。
此时特别需要注意区分以下三点:一是数据集合中的单个“数据”是否是独立的作品与“大数据”本身能否成为著作权法意义上的作品无关;二是作为数据储存、调用和处理工具的计算机软件,如果符合《著作权法》、《计算机软件保护条例》等法律法规的相应要求,自然可依法取得著作权,这与作为其储存、管理、展示或分析处理对象的数据集合本身无关;三是“大数据”的应用结果,即所谓的“应用层”与“衍生层”,如特定时段数据变化状态的分析报告、对数据分布进行阐述的解说动画等,如符合著作权法的要求,自然也可以取得著作权,这也与作为基础的数据集合本身无关。
此外,对海量数据的处理需要大量的投入,但这并不是获得著作权的当然的理由,独创性才是唯一的判断标准。
(二)邻接权
邻接权是著作权法赋予非作者的权利,因为其往往与作品有着紧密联系,如常与作品传播有关,但并不绝对。邻接权产生的主要原因,就是某些有价值的非物质劳动成果由于“独创性”不足,无法受到狭义著作权的保护。6这与前文对“大数据”的分析相符。因此,如认为有必要对“大数据”提供保护,在著作权法中对其赋予单独的邻接权,或者如同民法总则立法者所考虑的制定专门法律加以规定,都是可选择的路径。
可供参考的,早在1996年,欧洲议会与欧盟理事会便发布了《关于数据库法律保护的指令》(96/9/EC),对包括无独创性数据库和非电子数据库在内的任何形式的数据提供法律保护。指令特别说明,在内容的选择和编排方面体现作者自己的智力创作是判定一个数据库能否获得版权保护的唯一标准;同时,各成员国应为在数据库内容的获取、检验核实或选用方面经证明作出实质性投入的制作者规定一种权利,以防止对数据库内容的全部或实质部分进行撷取与反复利用。这一特别保护的期限一般为十五年,并可设置私人使用、教学科研等例外。7
三、反不正当竞争
(一)一般条款
德国法学家雷炳德教授认为,应当把具有最小限度劳动投入的保护纳入到反不正当竞争法的调整范围之中。8随着经济、社会和科技的飞速发展,不正当竞争行为也不断花样翻新、层出不穷,而这些都是1993年颁布《反不正当竞争法》时所无法预料到的,更不可能将其以类型化的方式固定并写入法律。因此为保证法律的适应性,司法实践中开始灵活适用反不正当竞争法一般条款处理新兴不正当竞争样态,并收到了较好的社会效果。司法政策亦认为,“反不正当竞争法未作特别规定予以禁止的行为,如果给其他经营者的合法权益造成损害,确属违反诚实信用原则和公认的商业道德而具有不正当性,不制止不足以维护公平竞争秩序的,可以适用原则规定予以规制。”9最高人民法院在(2009)民申字第1065号山东省食品进出口公司等与青岛圣克达诚贸易有限公司等不正当竞争纠纷再审案中提出,适用《反不正当竞争法》第二条认定构成不正当竞争应当同时具备以下条件:1、法律对该种竞争行为未作出特别规定;2、其他经营者的合法权益确因该竞争行为而受到了实际损害;3、该种竞争行为因确属违反诚实信用原则和公认的商业道德而具有不正当性。此外,考虑到“大数据”行业在技术形态、交易模式等方面所具有的特殊性,为保障新兴市场业态的自由发展空间,在适用《反不正当竞争法》第二条更应秉持谦抑的司法态度,因此不排除并很有可能在上述三个条件外设置更多的判定条件。
具体分析,开发者在生产“大数据”时必然要投入大量人财物和时间精力,而如果竞争者可以任意无偿使用该成果,则会节约大量研发的时间和费用,甚至可以据此降低交易价格打“价格战”,这既破坏了开发者在市场先占方面的竞争优势,也为竞争者谋取交易机会,挤占开发者的市场空间。竞争者所获得的这一竞争优势明显不具有正当性,并会给开发者造成极大损害,甚至促成恶性竞争,阻碍整个行业健康发展。这种不劳而获、不正当利用他人劳动成果的竞争手段显然违反市场竞争标准和规则,有悖于商业伦理和商业道德,理应受到反不正当竞争法规制,此时应认为有反不正当竞争法一般条款适用的余地。
可供参考的,在北京微梦创科网络技术有限公司与北京淘友天下技术有限公司、北京淘友天下科技发展有限公司不正当竞争纠纷案中,北京知识产权法院认为,淘友技术公司、淘友科技公司(脉脉软件开发运营商)获取新浪微博信息的行为存在主观过错,违背了在OpenAPI开发合作模式中,第三方通过OpenAPI获取用户信息时应坚持“用户授权+平台授权+用户授权”的三重授权原则,违反了诚实信用原则和互联网中的商业道德,故其获取并利用新浪微博用户信息的行为不具有正当性;其未经新浪微博用户的同意及新浪微博的授权,获取、使用脉脉用户手机通讯录中非脉脉用户联系人与新浪微博用户对应关系的行为,违反了诚实信用原则及公认的商业道德,破坏了OpenAPI的运行规则,损害了互联网行业合理有序公平的市场竞争秩序,一定程度上损害了微梦公司的竞争优势及商业资源,故其展示对应关系的行为同樣构成不正当竞争。10
(二)商业秘密
商业秘密作为知识产权的客体之一,受到《反不正当竞争法》保护。根据法律的定义,商业秘密是指不为公众所知悉、能为权利人带来经济利益、具有实用性并经权利人采取保密措施的技术信息和经营信息。11作为交易对象的“大数据”当然会为开发者带来直接经济利益,具有现实的商业价值;而开发者在交易前通常也会对其采取保密措施,在交易成功后方通过提供账号、接口、复制件等方式许可购买者访问,并通过合同约定限制接触。
较难判断的是“大数据”的秘密性,即“不为公众所知悉”。对此,最高人民法院不正当竞争司法解释认为须不为所属领域的相关人员普遍知悉和容易获得,并规定了六种不具有秘密性的情形,包括信息属于一般常识或者行业惯例、已经公开披露、无需付出一定代价而容易获得等。12笔者认为,此时尤需注意单独数据和数据集合的区别。虽然数据集合中的某些单独数据可能通过公开渠道收集,但是一方面通过抽取和清洗等步骤已降低其辨识度和价值,另一方面“大数据”的使用者通常关注海量数据的分布和变化状态,注重数据集合整体使用时所带来的竞争优势,因此构成“大数据”的某一单独数据或者某些数据不具有秘密性,并不能当然否定数据集合作为整体时的秘密性;相反,即使单独的数据可能是公开的,但整个数据集合却往往并非是“容易获得”的。当然这一认识并不绝对,在个案中仍需要根据数据及数据集合的构成和具体使用方式等情况,结合相应证据进行综合认定。根据司法解释规定,原告暨权利人应当对其拥有的商业秘密符合法定条件、对方当事人的信息与其商业秘密相同或者实质相同以及对方当事人采取不正当手段的事实负举证责任。13
结语
综上所述,一方面信息处理的高投入、高产出特性及其对国家、社会发展的巨大推进作用意味着目前对其既有保护的需求也有激励的必要,另一方面其他竞争对手通过不正当手段谋取竞争优势、破坏市场正常秩序的行为具备法律上的可责难性,这两方面均要求我们通过法律对其进行调整。此时较为合适的,是在专门立法或特别赋权之前,为“大数据”提供反不正当竞争保护。通过为“大数据”提供类似禁用权的保护使明晰权属具有了现实意义,更能为其交易和使用提供保障,从而激励和促进行业快速、健康发展。