APP下载

衍生数据作为新型知识产权客体的学理证成*

2022-11-23

社会科学 2022年2期
关键词:权利

高 阳

一、问题的提出

近年来,学界围绕企业数据权益问题展开了深入的讨论。现有研究中,企业数据被当做一个整体,将“原始数据”与“衍生数据”置于同一范畴予以保护,学者从财产权角度对企业数据确权进行了理论上的尝试,如“数据资产权”说、“数据所有权与用益权”的分离说、“数据公开传播权”说、“数据权利块”说等。①关于“数据新型财产权”说,参见龙卫球:《数据新型财产权构建及其体系研究》,《政法论坛》2017年第4期,第63页;关于 “用益权”说,参见申卫星:《论数据用益权》,《中国社会科学》2020年第11期,第117—120页;关于“公开传播权”说, 参见崔国斌:《大数据有限排他权的基础理论》,《法学研究》2019年第5期,第20—23页;关于“数据权利块”说,参见梅夏 英:《企业数据权益原论:从财产到控制》,《中外法学》2021年第5期,第1195页。也有学者从信息自由角度对企业数据赋权提出了质疑,认为企业在既有法律体系内可实现对数据控制的自我防护。②梅夏英:《企业数据权益原论:从财产到控制》,《中外法学》2021年第5期,第1195页。然而,很少有研究关注到“衍生数据”与“原始数据”存在实质区别。

衍生数据是通过网络运营者大量智力劳动投入,运用算法及分析模型将海量原始数据深度加工、分析与提炼生成具有市场价值的数据产品,以揭示未曾被发现的事物之间的关联关系以及相关性,用于预测和指导决策。原始数据是由网络运营者通过传感器、社交网络、移动互联网等方式采集获得各种类型的结构化、半结构化及非结构化的海量数据,是事实和客观现象的数字化记录。③黄源、蒋文豪、徐受蓉主编:《大数据分析:python爬虫、数据清洗和可视化》,清华大学出版社2020年版,第10页。因其数据结构杂乱无序,并伴随着噪音数据、缺失数据等“脏”数据,不具有直接的应用价值。从经济学角度,数据赋权不应采用“一刀切”的方式,需考虑数据开发利用的动态价值链,依据网络运营者不同的价值贡献,数据权利配置呈现动态性差别激励。对于具有价值的衍生数据,应该受到产权保护。①唐要家:《数据产权的经济分析》,《社会科学辑刊》2021年第1期,第102页。而网络运营者采集、汇集的原始数据或经过简单脱敏化加工形成的商业数据集合,数据采集者虽然付出了一定的劳动,仅是对数据的“粗加工”,尚不构成具有价值的数据资产。

目前,理论和司法实践均承认衍生数据具有值得保护的财产性利益,但对于衍生数据的法律属性、保护方式以及权利内涵产生了分歧。学者依据物权法添附理论,承认数据添附者对增值数据的产权。如果是汇编创新性作品,以著作权制度保护;如果是独创性数据集合,以商业秘密形式保护。②朱宝丽:《数据产权界定:多维视角与体系建构》,《法学论坛》2019年第5期,第85页。或者认为数据企业对其开发的衍生数据产品设定新型的财产权,赋予其占有、使用、收益及处分的权利。③沙丽:《数据资源权属判断及司法保护路径》,《人民司法》2020年第10期,第105页。李永明、戴敏敏:《大数据产品的 权利属性及法律保护研究》,《浙江大学学报(人文社会科学版)》2020年第2期,第31页。也有学者认为依据《反不正当竞争法》保护衍生数据,存在将《反不正当竞争法》上规定的不正当竞争行为架空之风险。④张建文:《网络大数据产品的法律本质及其法律保护——兼评美景公司与淘宝公司不正当竞争纠纷案》,《苏州大学学报(哲 学社会科学版)》2020年第1期,第45页。前述观点由于对衍生数据自然属性与法律属性认识不清,未区分有形财产与无形财产之不同,将有体物财产权理论沿用至无体物,难免会出现水土不服。因此,衍生数据赋权模式的选择,厘清其本质特征与法律属性是关键。在此基础上,需要回答以下几点问题:一、衍生数据赋权模式的选择,新型财产权抑或知识产权?二、衍生数据赋予此种专有权是否具有法理基础?三、如何明晰衍生数据实体权利的内涵与边界?因此,本文从厘清衍生数据与相关概念之间差异入手,归纳、总结衍生数据的特征与自然属性,在此基础上明确衍生数据的法律属性以及专有权保护模式,并为此种专有权保护探求法理层面的理论支撑,进而对衍生数据专有权的实体权利构建提出建议。

二、衍生数据本体论

数据,泛指对客观世界的数字化记录或描述。社会应用领域依据主体标准、可识别性标准或公开状态标准将数据划分为不同的类型,⑤数据可分为个人数据、企业数据和政府数据;个人信息数据与非个人信息数据;公开数据与非公开数据等等。数据类型化 的标准具有一定的价值判断,主体标准目的在于指向数据采集的来源;可识别性标准在于判断数据是否构成个人信息以提 供人格权的保护;公开状态标准则是为了认定是否构成商业秘密。这些划分方法,反映的皆是静态的数据集合。然而,数字经济中的数据是动态的,脱离具体的数据商业实践场景来讨论数据的赋权问题,比较大的风险就是走向理论的空洞化。⑥包晓丽、熊丙万:《通讯录数据中社会关系资本——数据要素产权配置的研究范式》,《中国法律评论》2020年第2期,第153页。因此,应依据数据动态价值周期,将数据分为原始数据与衍生数据。通过与相关概念的对比,进一步说明衍生数据与其他数据类型的不同。

(一)衍生数据与相关概念的区别

1.衍生数据与数据产品

数据产品,广义上是指基于数据的各种产品,其产品形态和载体不仅限于数据。⑦朝乐门,卢小宾:《数据科学及其对信息科学的影响》,《情报学报》2017年第8期,第763页。如青岛大数据交易中心将数据源、模型算法、可视化组件等统称为数据产品。⑧青岛大数据交易中心,http://www.qddata.com.cn/index.html#index, 2021-11-01。狭义上则是指市场中可流通、具有产品属性的海量商业数据集。⑨冯晓青:《数据财产化及其法律规制的理论阐释与构建》,《政法论丛》2021年8月,第87页。因此,数据是笼统的上位概念,数据经加工、处理活动形成具有商品属性的数据集合为数据产品。

学者以生产数据产品所付出劳动的不同,将数据产品分为汇集型与衍生型。一般性智力劳动形成的汇集型数据产品,⑩汇集型数据产品是指网络运营商对于原始数据进行简单汇集匿名化加工形成的产品。仅是改变了数据的质量和数量,为数据分析与挖掘提供优质原材料。创造性智力劳动提炼出衍生型数据产品,虽具有数据的外观,但本质上已属于信息或知识的范畴。①高富平:《数据生产理论——数据资源权利配置的基础理论》,《交大法学》2019年第4期,第16页。也有学者将数据产品定义为经特定算法或人工处理、分析、整合巨量用户数据产生的衍生数据产品。②李永明、戴敏敏:《大数据产品的权利属性及法律保护研究》,《浙江大学学报(人文社会科学版)》2020第2期,第31页。事实上,数据市场中可交易的数据产品呈多样化之势。上海数据交易中心约定可交易的汇集型数据产品是进行了去身份、格式化等脱敏处理,描述人、物、群组等的商业数据集合。③上海数据交易中心:《数据互联规制》,https://www.chinadep.com/image/cover1.pdf, 2021-11-01。贵阳大数据交易所则约定可交易的数据不是底层原始数据,而是通过数据清洗、分析、建模、可视化的衍生数据。④参见贵阳大数据交易所:《贵阳大数据交易所702公约》。可见,前述两种数据集合皆为可交易的数据产品,且均已脱敏处理,不可识别数据主体身份,主要区别在于汇集型数据产品为中间产品,尚未产生出新的商业价值与社会价值。⑤如谷歌运用机器学习技术以海量文学艺术作品集合为数据来源,训练“智能回复”(smart reply)应用程序的写作能力。 作品集合即为汇集型数据产品,其中受著作权法保护的作品并未发生权利转让,企业因作品的选取、编排与收集付出了人力、 物力和财力可获得“类汇编作品”的有限保护。若谷歌公司通过对作品集合的分析计算出反映人类书写习惯的衍生数据, 可训练机器写出更符合人类表达的语句,则产生了不同于原作品的新应用价值。狭隘地将数据产品定义为衍生数据与数据市场应用实践不符,汇集型数据产品本质上区别于衍生型数据产品,其赋权路径的选择应有别于衍生型数据产品。本文以衍生型数据产品(下文简称衍生数据)为研究对象,汇集型数据产品不再赘述。

2.衍生数据与原始数据

衍生数据与原始数据存在以下几方面的不同:第一,是否经过智力劳动的深度加工。原始数据是网络运营者基于用户的知情同意,采用数字化采集技术将错综复杂的数据从来源端抽取、汇集,生成机器可读的数据代码,实现客观世界到数据代码的映射。衍生数据则是人类利用大数据分析与挖掘技术而产生的智力劳动成果,具体而言:首先,原始数据经过清洗与预处理形成可建模的数据集合;其次,选择合适的分析模型或算法生成衍生数据;最后,通过可视化技术将衍生数据提炼为“人类可以理解的信息”。⑥数据是信息的载体,参见许可:《数据安全法:定位、立场与制度构造》,《经贸法律评论》2019年第3期,第54—56页。由此可见,衍生数据是海量原始数据经过清洗、分析、挖掘与提炼生成的新数据,是新信息的载体。第二,是否反映事物间的隐藏关系。原始数据是对事实、事件、过程或思想的记录,反映的是客观事实。衍生数据是在汇集海量原始数据的基础上,利用算法与分析模型萃取、提炼生成反映研究对象之间相关关系的数据。例如,美国一家零售商在对海量原始销售数据加工处理得出,每周五下午啤酒和婴儿尿不湿销量同比增加的数据。⑦通过观察发现星期五下班后许多青年男子要买啤酒度周末,而这时妻子又常打电话提醒丈夫回家路上为孩子买尿不湿。参 见黄源、蒋文豪、徐受蓉主编:《大数据分析:python爬虫、数据清洗和可视化》,清华大学出版社2020年版,第4页。发现揭示啤酒与尿不湿相关性的衍生数据之后,零售店邻近摆放啤酒与尿不湿的货架,销售额显著提升。从信息哲学角度来看,⑧信息哲学认为信息是标志物质间接存在性的哲学范畴,是物质存在方式与状态的自身显示。信息作为哲学范畴,是自然界 与人类社会普遍存在的现象,它贯通物质与精神两个世界,是反映整个世界本质联系的最基本概念。在数字经济时代来临 之前,数据未实现海量生产与收集时,信息是人类认识世界的基本方式。信息与数据可以相互转换,信息可以被记录为数据,数 据经过提炼可以生成信息,因此,原始数据从技术层面可以视为自在信息的数据化,本质上仍属于自在信息。原始数据与一个直接存在的事物相对应,作为这个直接存在的事物的显示、反映而存在着,属于自在信息。衍生数据是由人类思维智力活动产生的创生信息,⑨创生信息是以自为信息为原料,通过人脑的主观思维过程创造出来的新信息。属于具有创造性的新信息。⑩周俊强:《无形财产权的类型化与体系化研究——基于信息哲学的分析》,北京大学出版社2018年版,第68—72页。学者指出信息的公共性决定了“信息在人类历史的绝大多数时间都是以互惠利他的方式来进行传播的”,赋予企业数据专有权将造成对社会公共资源信息的“侵占”。⑪梅夏英:《企业数据权益原论:从财产到控制》,《中外法学》2021年第5期,第1200页。但是,现行法律体系中,不乏信息设定专有权的先例。具有创造性的创生信息可以作为知识产权的客体获得专有权的保护,如技术方案、文学艺术作品等。⑫参见周俊强:《无形财产权的类型化与体系化研究——基于信息哲学的分析》,北京大学出版社2018年版,第111—123页。由此可见,信息虽具有公共性,并不能否定创造性信息的可专有性。企业数据专有权应以创造性信息为客体,原始数据与衍生数据区别保护。第三,是否独立于数据主体的个人信息。原始数据来源广泛,其中个人信息数据受控于数据主体。对于个人信息数据强调人格权意义上的保护,各国采用不同机制确保数据主体对个人信息数据的管控。《欧盟通用数据保护条例》从个人对数据的自决权角度赋予数据主体知情权、要求更正权、要求删除权和限制处理权等具体权利。①郑智航:《数字资本运作逻辑下的数据权利保护》,《求是学刊》2021年第4期,第114页。强调隐私保护的美国,分散化立法保护不同场景中的个人信息数据。衍生数据是数据企业在运用脱敏技术剥离个人信息数据中“可识别性”标识符的基础上,通过挖掘相同或类似数据集群提炼出对未来行为、活动、风险预测的新数据。学者从数据与数据主体人格利益相关程度分析,认为数据控制者(数据企业)经过复杂智力劳动推演生成的预测(衍生)数据,其不具有人格利益,因而数据主体不应当也无法基于人格利益主张个体权利。②冯果、薛亦飒:《从“权利规范模式”走向“行为控制模式”的数据信托——数据主体权利保护机制构建的另一种思路》,《法 学评论》2020年第3期,第12页。

(二)衍生数据的自然属性

衍生数据是利用大数据分析与挖掘技术从海量原始数据中获得更具价值的深层次揭示相关性的新数据,③刘双阳、李川:《衍生数据的财产属性及其刑法保护路径》,《学术论坛》2020年第3期,第39页。其沿袭了数据的自然属性。

1.非物质性

数据并非天然存在的,其是由网络终端和传感器等设备通过数字化技术生成的。数字化是指将模拟数据转换成用0和1表示的二进制码,供计算机处理和分析。④维克托·迈尔舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版 社2013年版,第38页。由此,数据摆脱物质性的原子构成,具有非物质性。也有学者认为,数据由电磁流被写在存储介质上,形成了数据文件。数据文件虽无形但却是物理上的存在。⑤纪海龙:《数据的私法定位与保护》,《法学研究》2018年第6期,第76页。更有学者指出,数据有体,质量可计算。⑥许可:《数据权利:范式统合与规范分殊》,《政法论坛》2021年第4期,第87页。前述观点混淆了客体与载体之区别,企业数据财产权益的客体为0和1字符串形成的数据本身,而非数据载体——数据文件。非物质性客体需附着于物质性载体之上方可为人类所感知,如技术方案发明,通过产品载体予以描述。衍生数据具有非物质性,以数据文件为载体实现复制与保存。

2.非竞争性:不发生有形损耗

经过大数据分析与挖掘析出的衍生数据是信息的载体,具有信息的非竞争性特征。“非竞争性”是衍生数据与有体物的最本质的区别,衍生数据的使用并不减损其价值,原则上可以不限次数的被消费。⑦Luciano Floridi, Information--A Very Short Introduction, Oxford University Press, 2010, p.81.换言之,衍生数据可以被多个用户同时使用和分析,其并不会因各种使用行为发生有形的损耗。因此,衍生数据极易被传播与复制,非创造者获取衍生数据的边际成本几乎为零。⑧Kerber,Wolfgang, A New (Intellectual) Property Right for Non-personal Data? An Economic Analysis”, MAGKS Joint Discussion Paper Series in Economics, No.37, 2016, p.3.与之相反,竞争性有体物的占有与使用具有排他性,其他主体获取有体物的边际成本较高。如果无权使用人擅自获取了衍生数据,因不发生有形的损耗而无法适用恢复原状的民事责任。

3.不发生有形控制的占有

衍生数据天然的非物质性决定了其并不能为人力有形地控制和支配,数据企业通过大数据技术手段实现对衍生数据的“准占有”。在罗马法上,为解决“无体物”的占有,创制了“准占有”制度。在现代民法理论上,准占有并非真正意义上的占有,因不涉及特定的有体物,而不具有某种外人所认识的外观。⑨参见江平主编:《民法学》,中国政法大学出版社2007年版,第448—449页。“准占有的意义在于,在不发生有形控制的情况下,对作为客体看待的权利之管领,也视为法律上的占有。”⑩吴汉东:《知识产权基本问题研究》,中国人民大学出版社2009年版,第123页。数据企业通过数据处理技术,实现数据的计算机信息系统读取、存储、传输、加工、删改和分析。这一过程虽不是实在而具体的占据,事实上却形成了对衍生数据的控制与支配。

三、衍生数据既有保护理论评析

随着对衍生数据自然属性与社会应用价值认知的深入,理论与实务界就其财产属性达成共识,但在具体保护路径及权利内涵方面众说纷纭,下文将对既有理论与实践展开一一评述。

(一)行为主义模式的质疑

全国首例数据产品不正当竞争案中,法院认为淘宝公司享有“生意参谋”衍生数据产品的竞争性财产利益,并援引《反不正当竞争法》的一般条款予以保护。①参见安徽美景信息科技有限公司与淘宝(中国)软件有限公司不正当竞争纠纷二审民事判决书,浙江省杭州市中级人民法院 (2018)浙01民终7312号。学者肯定了《反不正当竞争法》对企业数据保护的可行性,并将衍生数据为企业带来的竞争利益视为一种法益,在该法益受到损害时,可适用《反不正当竞争法》予以救济。②梅夏英:《企业数据权益原论:从财产到控制》,《中外法学》2021年第5期,第1206页。但是,不同于侵权法中权益保护模式对专有权(绝对权)的积极保护,《反不正当竞争法》中的法益无所谓保护与不保护。③孔祥俊:《论反不正当竞争的基本范式》,《法学家》2018年第1期,第54页。法益受损仅是对不正当竞争行为认定的一个参考因素,对竞争者自由构成“显著损害”,存在威胁竞争者生存之虞时方可受到《反不正当竞争法》的规制。④张占江:《论反不正当竞争法的谦抑性》,《法学》2019年第3期,第47页。行为主义模式仅在衍生数据受到特定侵害时才能获得法律上的救济,这种消极赋权的方式存在弊端:

第一,难以防止非竞争者对衍生数据的侵害。《反不正当竞争法》是“市场行为法”,约束经营者所有类型的市场行为。⑤Ansgar Ohly, “Interfaces Between Trade Mark Protection and Unfair Competition Law, Intellectual Property, Unfair Competition and Publicity”, Monograph Book 2014, p.34.通常,《反不正当竞争法》调整具有竞争关系的经营者,传统行业对竞争关系的理解一般限于同业间的直接竞争关系。但是,当前互联网环境下行业分工细化、业务交叉重合的现象普遍存在,竞争关系呈现出扩张解释的趋势。即便竞争关系可以理解为非同业竞争,也无法解决不具有竞争关系的社会公众对衍生数据侵权性使用的问题。

第二,弱化法律的指引功能。依据一般条款判断竞争行为是否具有正当性,天然地具有内在不确定性。因数据获取行为是否正当需要考虑目的性,是为了深度创新还是替代原告的产品或模式,区分获取的是原始数据还是衍生数据等因素。形成于传统竞争环境的禁止搭便车理念和规则在数据要素市场中的适用空间有限。⑥刘维:《论网络不当竞争一般条款的价值取向》,《交大法学》2021年第3期,第36页。一般条款的适用只能视为个案特殊情形,不宜成为一种特定的保护模式。

(二)传统著作权模式的检视

学者认为数据企业合法加工原始数据形成新产品的行为适用物权法添附理论,数据添附者享有增值数据的产权,构成汇编作品时以著作权制度保护。⑦朱宝丽:《数据产权界定:多维视角与体系建构》,《法学论坛》2019年第5期,第85页。司法实践认可了传统著作权的保护模式,并扩大了可保护衍生数据的作品类型。如“JCR期刊引证报告”案中,法院认为由JCR期刊引证报告中衍生数据集合构成汇编作品。⑧上海梅斯医药科技有限公司与科睿唯安信息服务(北京)有限公司侵害作品信息网络传播权纠纷上诉案,上海知识产权法院 (2020)沪73民终531号。而在“四维图新导航电子地图”案中,二审法院认为导航电子地图作为地图数据产品,每个图层都需要图形化表达,满足独创性时可构成图形作品。⑨导航电子地图生成原理较复杂,详情请见北京四维图新科技股份有限公司与立得空间信息技术股份有限公司等侵害著作权及 不正当竞争纠纷上诉案,北京知识产权法院(2019)京73民终1270号。但是,无论是图形作品还是汇编作品保护衍生数据均存在诸多问题:

第一,著作权仅保护独创性的表达。衍生数据通过可视化形式予以表达,具有图形作品的外观,但著作权仅保护以衍生数据为基础形成的表达,不保护数据本身。具言之,衍生数据是计算机可读的“0” “1”二进制字符串,同一串数据可以通过不同样式的图形表达,如趋势图、占比图、排行榜等,著作权保护独创性图形,而非构成数据的字符串。同样,依据《世界知识产权组织版权条约》第5条的规定,将衍生数据集合纳入汇编作品的范畴,亦无法对其形成周延的保护。因为汇编作品保护的是数据汇集的整体结构顺序或选择编排的独创性,该保护不延及衍生数据。

第二,著作权侵权判定标准难以适用。在“JCR期刊引证报告”案中,法院认为被告提供的链接中仅含有JCR期刊引证报告中的一项IF影响因子数据,数量较少而不构成侵害原告的信息网络传播权。作品侵权判定中的实质性相似标准具有一定的主观性,需考虑使用作品的数量、程度等因素。衍生数据权益的侵权判定若机械地适用实质性相似标准,因难以具体、精确量化使用衍生数据的数量、程度等问题,则可能形成裁判标准的不统一。

(三)新型财产权模式的不足

学者借鉴有体物的所有权理论与保护模式主张为衍生数据设立新型财产权,赋予数据经营者享有占有、使用、收益及处分的权利。①程啸:《论大数据时代的个人数据权利》,《中国社会科学》2018年5第3期,第121页;沙丽:《数据资源权属判断及司法 保护路径》,《人民司法》2020年第10期,第105页;李永明、戴敏敏:《大数据产品的权利属性及法律保护研究》,《浙江 大学学报(人文社会科学版)》2020年第2期,第31页。然而,从“衍生数据”自然属性来看,其是知识、信息,②莫斐、张睿、芮晟:《从知识发现角度试论面向数据产品的数据生产》, 《数字地方》2020年第1期,第19页。属于无体物。无体物依赖于人类精神生活而存在,是由人类思想添附于有形世界之上而产生的物,它不具有真实形体而是抽象存在的物。③彼得·德霍斯:《知识财产法哲学》,周林译,商务印书馆2017年版,第1页正是由于衍生数据与有体物自然属性之不同,致使所有权或类所有权模式的不适用。

第一,衍生数据的“所有”不产生竞争意义上的“排他性”。不论是不动产还是有形动产,均是由原子组成的物理结构,在任何时间、空间内仅由一个主体所有。因此,有体物的“所有”具有“排他性”。事实上,“排他性”是所有权制度的核心,授予动产或不动产所有者以排除他人使用的专有权。所有权的制度价值一方面在于“定分止争”,解决谁有权基于何种目的使用标的物;另一方面是为了防止“公地悲剧”的发生——标的物的过度使用导致其沦为公共产品。然而,“非竞争性”的衍生数据可以同时被不同主体获取、使用,任何人的使用行为并不减损衍生数据的价值。对衍生数据而言,不存在竞争意义上的过度使用、开发的风险。

第二,所谓的“占有”权能难以实现。占有权能是所有权制度的核心,以所有人对物实际、有形的掌握与控制为基础。所有人的占有被第三方侵害时,其可基于占有权能向侵占人提起返还原物的诉讼请求。④王明锁:《论所有权占有权能与他物权控占权二元制法律体系的构建》,《法律科学(西北政法大学学报)》2009年第6期, 第113页。对于“非物质性”的衍生数据而言,他人未经授权获取衍生数据构成对数据企业管领力的破坏,囿于衍生数据中蕴含的信息一旦被获取便被竞争对手知晓,数据企业主张“返还原物”仅是返还衍生数据的载体,对已知悉的信息无法“恢复原状”。

四、衍生数据设定新型知识产权的正当性

(一)衍生数据法律属性:新型知识产权客体

衍生数据的自然属性决定了有形财产权制度的不适应性,应从无形财产法律制度中寻求解决之道。无形财产权通常运用于三种不同的层面: “ (1)能源无形,即无形财产权指以电、热、光、磁等能源为客体的财产权; (2)知识无形,即无形财产权专指知识产权; (3)权利无形,即无形财产权指以权利为客体的财产权。”⑤周俊强:《无形财产权体系论纲——基于信息及其活动无形的建构》,《法学研究》2018年第3期,第68页。能源虽无形,但可采用现代技术进行度、量、衡,可以像有形物一样成为物权客体。知识无形,是因“知识”属于人们在科学、文化、技术等领域的创造物,不具有实体形态。权利无形,即无形财产权指以权利为客体的财产权,“将有形物的所有权之外的任何权利称为‘无形财产’”。①马俊驹、梅夏英:《无形财产的理论与立法问题》,《中国法学》2001年第2期,第103页。由此可见,无形财产权仅能在“知识无形”上成立。

知识无形是指知识产品是一项无形财产,其是人类在科学、技术、文化等精神领域所创造的智力成果。传统的知识产品表现为发明创造、文学艺术作品、经营性标记等,它区别于物质产品(有体物)的客体范畴。虽然,知识产品存在多种表现形式,其本质含义强调是人类创造性智力成果,客体表现为非物质性及财产属性。衍生数据具有财产属性,②关于衍生数据财产属性在“生意参谋”案中法院已详细论证,参见许娟:《利用爬虫技术侵犯企业数据知识产权法益的司法 解释》,《苏州大学学报(哲学社会科学版)》2020年第1期,第52页。其属于新型的知识产品。

第一,衍生数据不属于传统的知识产权客体。由上文可知,衍生数据不属于著作权的客体范畴。亦不同于识别功能的商标或发明、创造,多有学者认为衍生数据构成商业秘密,③参见刘双阳、李川:《衍生数据的财产属性及其刑法保护路径》,《学术论坛》2020年第3期,第44页。许娟、秦登峰: 《大数据挖掘技术下的企业产权平等保护》,《江西社会科学》2020年第10期,第157页。Barbara Anna Radoń, “Intellectual Trade Secrets Protection for ‘Big Data’: Personal Data as Trade Secrets in the European Union”, Munich Property Law Center (MIPLC) Master Thesis (2015/16), p.3。符合秘密性、价值性、采取保护措施的衍生数据可作为商业秘密获得保护,但并非最佳路径。原因在于:其一,商业秘密不保护公开的衍生数据,对于不公开的衍生数据仅规制不当获取行为,并非“赋权”的积极保护。其二,数据公开对人类社会具有深远影响,表现为提高行政效率,优化市民决策,创造经济机会,解决公共问题等诸多方面。以商业秘密保护衍生数据仅会加剧数据垄断与数据孤岛。为实现社会福利最大化,衍生数据应当在社会公众中充分流动与传播,这也是欧盟、美国致力于研究数据公开机制内在的价值追求。

第二,衍生数据是人类创造性智力劳动的成果,其是数字经济时代新型知识产品。从海量原始数据集合中获取有用信息如同大海捞针,这一过程需要数据分析人员熟知不同算法的优缺点,以及各自的应用场景,面对不同商业目标及问题时,选择合适的算法及模型将结果进行呈现,不同场景下算法模型的选择决定了输出结果的正确与否。④参见顾生宝:《数据决策——企业数据的管理、分析与应用》,电子工业出版社2020年版,第8—11页。人力与机器算力之间的关系可以通过“沙井盖预警”事件予以说明:美国纽约市每年因沙井盖爆炸造成严重损失,负责沙井盖检修工作的爱迪生公司即使年年检修亦很难发现需要检修的沙井盖。爱迪生公司求助于哥伦比亚大学的专家,希望通过历史数据的分析,预测可能出现问题的沙井盖。这是一个复杂的大数据问题,尽管自1880年以来数据保存完好,但从杂乱无章的数据中很难获取有用信息。专家利用数学、统计学原理,创建预测模型,将整理好的数据交由机器进行分析,得出衍生数据——106种预警情况准确率达44%。⑤参见维克托·迈尔舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民 出版社2013年版,第90—91页。大数据预测功能的实现,并非像学者所言类似于工业品的生产过程,衍生数据可由算法自动生成。⑥李永明、戴敏敏:《大数据产品的权利属性及法律保护研究》,《浙江大学学报(人文社会科学版)》2020年第2期,第35页。“数据分析是行业知识和计算技术(算法)的应用,本质上属于创造性活动或智力劳动范畴。”⑦高富平:《数据生产理论——数据资源权利配置的基础理论》,《交大法学》2019年第4期,第16页。

(二)衍生数据赋予知识产权的法理基础

1.劳动赋权理论

劳动具有“二象性”,一类是智力劳动,俗称“脑力劳动”,其中创造性智力劳动是指智力劳动者利用智慧创造出新知识、新的技术方案;⑧何敏:《知识产权基本理论》,法律出版社2011年版,第3页。另一类是体力劳动,非智力性劳动方式,这种劳动仅是为了创造使用价值满足物质需要。洛克的劳动财产权理论认为:每个人对其身体继而对自己的劳动享有所有权。当其将劳动添加于自然物上,人便获得该物的所有权。⑨洛克:《政府论》(下篇),叶启芳、翟菊农译,商务印书馆2008年版,第19页。这一学说最初所描述的财产客体无非是麦子、果实之类有形财产。⑩崔国斌:《著作去法原理与案例》,北京大学出版社2014年版,第8页。洛克的劳动价值论存在一定的局限性:一是局限在直接生产劳动,体力劳动上;二是局限在有形商品价值上。

当“脑力劳动的产物等同于双手的劳动成果”时,人们逐渐意识到,智力劳动产品像有形产品一样,劳动者同样需要享有权利,马克思的劳动价值学说为知识财产找到了合法性基础。“知识价值论”是近代劳动价值论的新发展,该理论认识到劳动的“二象性”,认为商品不仅是物质生产中的实物形式的商品,也包括非物质形式的无形商品。知识产品是智力劳动的产物,智力劳动者应对其知识产品享有财产权。①吴汉东:《知识产权基本问题研究》,中国人民大学出版社2009年版,第93页。衍生数据的生成过程是人类创造性智力劳动的结果,从数据采集时样本数据的筛选,到数据预处理阶段清洗与集成,最后数据分析模型的搭建,每一流程均需要付出智力劳动。因此,数据企业智力劳动生成的衍生数据应该获得财产权的保护。

2.激励创新理论

衍生数据设定新型知识产权还适用从激励创新理论予以验证。激励创新理论和在此基础上形成的经济结构框架,为分析和论证各种类型知识产权保护提供了主要的研究范式。专利、著作权和商业秘密等知识产权保护的首要目的在于促进创新,这也是知识产权制度的经济价值所在。

德姆塞茨指出财产权的主要功能是创建激励机制以实现外部性内部化,其认为当外部性内部化具有经济效率时,方能建立财产权。②Demsetz, Harold, “Towards a Theory of Property Rights”, The American Economic Review Vol.57, No.2, 1967, (2), pp.347—359.将德姆塞茨的理论运用于衍生数据时,情况有所不同,衍生数据的无形性不同于有形的土地和毛皮。对衍生数据而言,虽然不存在“过度使用”的风险,财产权保护的缺失会产生负外部性。信息创造需要资源、时间、人力等成本,囿于其非竞争性和非排他性的特征,信息极易传播且被非创造者使用。非创造者无需任何投资便可直接攫取劳动成果,久而久之,严重打击数据企业开发数据资源的积极性,导致不再产生新信息。数据持有人获得法律对其数据资产权益保护的基础是数据的采集、开发与利用包含了资本投入或创造性智力活动。③唐要家:《数据产权的经济分析》,《社会科学辑刊》2021年第1期,第102页。换言之,衍生数据财产权是对附着于数据之上企业的投资与创造性智力劳动的保护,以维持数据开发、利用和创新的激励。因此,衍生数据设立新型知识产权的必要性在于一方面是对数据企业分析和挖掘产出成果的确认,另一方面激励数据企业为人类创造出更多的信息以增进社会福利。

五、衍生数据权的内涵及权利限制

(一)衍生数据权的权利内涵

《民法典》第123条“开放”地规定了知识产权的客体,符合知识产权客体属性但未明确列明的是“法律规定的其他客体”,该条款为衍生数据纳入知识产权客体范畴提供了法律依据。以衍生数据为客体创设新型知识产权——衍生数据权,具体建构为:

1.权利客体

衍生数据作为无体物,缺少了物理性存在的可被外界感知的焦点,不能清晰的确定权利内容与边界。有体物可通过其外观表征权利的拥有,而衍生数据的原始取得,不能仅凭创造性活动的事实宣示权利的取得与边界。“智力创造是权利产生的‘源泉’,而法律则是权利取得的‘依据’。”④L.Ray Patterson, Stanley W.Lindberg, The Nature of copyright: A Law of User’s Right, The University of Georgia Press, 1991, p.90.衍生型数据产品作为新型知识产权客体,需要具备脱敏性、真实性、实用性。首先,衍生数据是需要在数据市场中流通的数据,基于对个人信息保护的角度,需要剥离可识别性自然人身份的标识进行匿名化处理;其次,衍生数据需是从海量原始数据中分析出真实信息。《数据安全法》中为数据交易方设定的“说明数据来源”义务正是为了确保数据真实性,毕竟品质优良的数据资源是数据价值实现的基础。最后,衍生数据是对原始数据清洗、净化,提高数据治理并确保数据的一致性,具有较高的实用性。

除此之外,数据社会价值的实现依赖于数据公开与共享的程度。加州干细胞研究机构建立的科学数据公开机制为衍生数据的公开提供了参考范本。科学家将研究数据提存给研究机构,由研究机构提供一定期限内的保存服务,在此期间任何人付费下载研究数据,期间经过研究数据进入公有领域可免费下载。①Eisenberg, Rebecca S、A.K.Rai, “Harnessing and Sharing the Benefits of State-Sponsored Research: Intellectual Property Rights and Data Sharing in California’s Stem Cell Initiative”, Berkeley Tech.L.J.21, No.3, 2006, pp.1187-213.以此为鉴,改进与完善数据交易的规则,由交易中心初步审核衍生数据的脱敏性、真实性和实用性,审核通过的衍生数据权利人可通过下载收费的方式获取利益,保护期间经过,衍生数据进入公有领域供社会公众免费获取。

2.权利主体

权利归属是衍生数据权制度的重要组成部分,只有权利人才有资格禁止一切未经授权的利用行为。衍生数据权应依据激励创新理论,归属于数据企业即网络运营者。②《深圳经济特区数据条例》率先回应了企业数据财产权益的问题:“市场主体对合法处理数据形成的数据产品和服务,可以 依法自主使用,取得收益,进行处分。”赋予了市场主体对数据产品类似所有权的权能。《上海市数据条例》也有类似的规定。数据企业作为物资投资者为衍生数据的分析与挖掘投入了大量的人力、物力、时间等成本,赋予数据企业以专有权不仅有效促进其投资创新的积极性,更实现了无形财产权利的分配正义。可参照职务作品或职务发明的相关规定,企业雇佣的数据分析师等从事数据研发工作的员工依“劳动合同”或“集体协议”,在其工作职责或主要利用单位技术条件下分析与挖掘出的衍生数据,原则上归属于企业,另有约定的除外。在原始数据收集者与衍生数据创造者非同一主体时,可参照委托作品或委托发明的相关规则,由委托者与受委托者之间自行协商决定衍生数据权的归属。

3.权利内容:权利束

财产的“权利束”模型是建立在美国法学家霍费尔德的权利分析理论的基础之上。权利最终体现为人与人之间的法律关系。衍生数据权利的特点体现为多元主体与多样权利形成的“权利束”。首先,个人用户在享有数据企业提供的服务时,形成了“先许可,后使用”的数据使用协议,将底层数据的使用权让渡给数据企业,从而使数据企业获得了衍生数据财产权。其次,数据样本足够丰富时可以体现国家基本社会状况,推演出涉及民生与国际利益相关的核心信息。③闫立东:《以“权利束”视角探究数据权利》,《东方法学》2019年第2期,第66页。因此,衍生数据权需要平衡国家、社会公众、数据企业之间的利益关系。

日本学者小岛庸和认为,无形财产权与有形财产的所有权不同,是一种“全新的特殊权利”,它可以分为“独占权”和“禁止权”。④参见小岛庸和:《无形财产权》,日本创成社1998年版,第5页。针对无体物的独特性,其专有权的范围应由法律根据无体物的特性予以分别规定,不能简单套用有形财产规则。例如,无体物上难以设立用益物权,“占有、使用、收益、处分”的权能无法在无体物上圆满实现。⑤李晓宇:《智能数字化机器生成数据权益的法律属性》,《北方法学》2021年第2期,第46页。基于数据市场应用实践及司法案例,笔者将衍生数据权的“独占权”初步设想为:发布权、许可权、转让权、传播权。“禁止权”为:衍生数据不被第三方损坏、不当获取的权利。⑥Kerber,Wolfgang, “A New (Intellectual) Property Right for Non-personal Data? An Economic Analysis”, MAGKS Joint Discussion Paper Series in Economics, No.37, 2016, p.5.囿于衍生数据承载的内容属于人类可以理解的信息,信息一旦公开,极易被复制与传播,可参考著作权权能中的信息网络传播权,赋予衍生数据权人防止未经许可以有线或无线的方式向公众提供、传播数据的权利。发布权是指享有衍生数据权的企业首次向社会公众公开衍生数据的权利,该权利一经使用便用尽。

(二)衍生数据权的权利限制

“没有合法的垄断就不会有足够的信息生产出来,但有了合法的垄断又不会有太多的信息被使用。”⑦罗伯特·考特、托马斯·尤伦:《法和经济学》,张军译,上海人民出版社1999年版,第185页。由上文可知,衍生数据权的“权利束”在构建时既需保障衍生数据权人的利益,激励他们创造出更多的新信息,又需兼顾使用者的利益与公共利益,实现数据开放、数据安全,促进社会进步的目的。

在衍生数据“权利束”中,国家主权应当是多方主体中位阶最高的权利。《数据安全法》中规定开展数据处理活动,不得危害国家安全。由单个用户数据汇集的数据,经脱敏剔除可识别性的数据字段,由个体样本转化为群体样本,深度分析产出的结果,可能反映社会群体、行业或领域等涉及国家宏观战略层面的信息,衍生数据权的行使受到国家利益、社会公共利益的限制,需要衍生数据的生产者确保数据安全,以保证国家数据安全为首要目标。

数据市场对初创互联网企业存在进入壁垒。缺乏用户行为数据难以定位消费者群体,传感器的配备以及安装成本,数据存储与管理成本等因素导致中小型企业在市场竞争中处于劣势地位。为了确保数据企业可以获取竞争必需的衍生数据,打开数据流动与再利用的大门,可参照标准必要专利许可的FRAND原则,建立合理、公平、非歧视数据访问的规则。 《欧盟竞争法》第102条规定了数据企业滥用垄断地位限制数据访问影响竞争秩序时,第三方基于数据已构成“基础设施”,可申请强制访问数据,该条款被誉为FRAND原则的法理基础。①Kerber,Wolfgang, “A New (Intellectual) Property Right for Non-personal Data? An Economic Analysis”, MAGKS Joint Discussion Paper Series in Economics, No.37, 2016, p.6.衍生数据创造者专有权保护的同时,应防止其权利滥用形成数据垄断。

结语

处于数据经济时代的今天,数字空间产生了一种全新的法律关系——衍生数据财产权益。对于兼具非物质性与非竞争性的衍生数据而言,公地悲剧与反公地悲剧可能同时存在。②参见郑佳宁:《数据信息财产法律属性探究》,《东方法学》2021年第5期,第48—49页。一方面,如果完全将衍生数据置于公共空间,产权制度的缺失为非创造者滥用他人劳动成果提供了方便,势必打击数据生产者创造新信息的积极性,最终将导致数据应用领域创新止步不前。另一方面,如果为衍生数据设定排他性权利而完全不限制权利使用,将阻碍信息的传播与共享,最终造成数据封锁,难以实现社会福利最大化。因此,衍生数据产权制度的设计应以实现资源最佳配置和最有效率开发利用为目的。这一目的可通过知识产权制度予以实现,因为知识产权制度在强调保护创造者利益的同时,也需保证社会公众对知识产品的合理利用,以实现“私权神圣”和“利益平衡”为基本法律观。赋予衍生数据以新型知识产权,可解决公地悲剧与反公地悲剧之间的矛盾,在对衍生数据权利人提供专有权保护的同时,其垄断性权利受到权能方面的限制,以此可实现维持数据开放与激励创新之间的平衡。

猜你喜欢

权利
新兴权利的理论证成与线上空间的权利建构
把游戏的权利还给孩子
股东权利知多少(二)
股东权利知多少(一)
关于禁止权利滥用原则含义及认定的思考
权利套装
看清这世上有多少不义
爱一个人
爱一个人
读者的十项权利