物联网语境下数据财产权制度构建
2021-04-07魏露露
魏露露
(北京航空航天大学 法学院, 北京 100191)
一、 问题的引出
随着5G商用和人工智能的普及,物联网(Internet of things)与全景智能(ambient intelligence)正在重塑我们的生活,社会经济将全面进入数据化时代。智能经济就是数据经济,每个人都将因为其使用的智能穿戴设备、智能家居产品、智能出行工具,以及与智能环境设施互动,成为为数据经济贡献数据的人力资源(human stock)。农业、医疗、制造业、服务业等传统行业都将成为潜在的大数据企业。数据就像货币、黄金和土地之于传统企业一样,成为大数据企业最有价值的经济资产类型[1]。数据的经济价值在国民经济中日益显现,欧盟数据经济产值在2020年达到 6 430 亿欧元,占欧盟GDP的3.17%①。2020年4月,中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》首次将数据与土地、劳动力、技术等传统生产要素并列,明确了数据确权与市场机制并重的数据资源整合和安全保护机制,以市场机制提升数据资源的价值②。大数据的价值产生于不断的数据再利用过程,因促进企业大数据的流动与共享而成为各国数据政策的基本导向,对于私人开发和占有的数据而言,市场交易应当是首选的数据流动模式。欧盟委员会在“共同的欧洲数据空间”战略中就指出,数据利用的非竞争性决定了企业越多地与其他企业共享其所拥有的数据,数据的价值就越能够最大化实现③。但数据不确定的权属状态决定了企业数据交易可能面临过高的风险,从而激励企业选择数据的独占开发。欧盟的实证研究表明,商业数据中只有2%是开放数据,20%的数据进行了交易和分享,而78%的数据依然由企业独占控制和开发④。从制度目的来看,合理构建物联网背景下的数据财产权,成为当下培育数据市场的前置性的法律安排,避免权利真空为企业间的数据交易带来了法律上的不确定性,同时消除了数据财产权可能对个人信息保护格局带来的负面影响。从制度具体设计来看,合理的物联网数据财产权制度应当回应在多方参与主体之间合理的分配数据权属,协调数据财产化与个人信息保护的关系,以及构建数据权利的例外和集体管理机制,以达成权利人利益保护与数据流动效率的价值平衡。
二、 设置物联网数据财产权的必要性
(一) 物联网数据生产需要数据产权激励
1. 物联网与物联网数据的法律特殊性
物联网,即万物互联,可以定义为人员、流程、数据及事物的彼此互联,网络连接比以往更具相关性和价值,将信息转化成行动[2]224。在物联网中,人与人、人与物将保持“永远在线”的连接状态,人机交互变得频繁而自然,传统产业实现数据化与平台化整合,智慧城市走进个人生活并深入人心。物联网在带来线上与线下现实深度融合,以数据和平台(智能)重塑产业与生活的同时,也带来了前所未有的数据大爆发。IDC预测,到2025年全球的数据总量将从2018年的33泽字节(Zettabytes)达到175泽字节。物联网数据区别于互联网数据,具备法律特殊性,从而导致现有的法律框架的规制能力不足。
互联网数据与物联网数据生产的技术过程不同,主导主体不同。互联网以信息发布和用户互动等信息服务为本质属性,以媒体和言论为主要面向。互联网数据更多通过用户主动提供和用户线上行为足迹产生,且公开数据占据互联网数据中的较大份额[3]280。而物联网则以网络串联工业生产和社会生活为主要特征,体现其社会和经济面向。物联网高度依赖智能硬件设施、高速网络和智能算法系统的研发与全面部署。无论是智能家居、智慧城市建设还是智能制造转型,都要求具备语境感知能力、更强处理能力甚至自我学习能力的软件和硬件设备。企业将成为物联网数据开发的总发动机,用户贡献被稀释,物联网数据更需要掌握智能制造与算法技术的企业的资金与技术投入。
物联网与互联网数据生产过程的不同,将导致以互联网数据规制为规制对象的现有数据法律体系无法为物联网数据实践提供足够的确定性与激励。例如,由于互联网的去中心化和用户生成内容特征,互联网数据中用户贡献成分很高,数据的个人属性更加明显,现有的个人信息保护法无疑是以互联网数据为规制蓝本。例如,无论是欧盟的《一般数据保护条例》,还是我国的《数据安全法》或中央网信办发布的《数据安全管理办法》,所定义的“数据处理”或“数据活动”均以“数据收集”这一环节为规制起点⑤,凸显互联网数据生成的特点。而物联网数据活动的起点是从实体(物和人的活动)到数据的数据化过程,而实体的数据化首先需要智能设备的部署和连接,这是否属于数据活动并且需要受到个人信息保护法的审视,还有待讨论。再比如,由于网络平台更多承担的是用户数据托管(hosting)的角色,且很多数据属于用户公开发布的数据,而物联网数据更多是通过工业生产、企业运营维护和提供服务所主动产生的数据,在后台运营且不公开。因而,在考虑数据权属和利益分配时,除了需要考虑用户贡献被企业贡献所稀释之外,第三方针对处于不同的技术状态下的数据的获取(accessibility)和利用程度理应有所不同。
2. 物联网数据生产需要数据产权的激励
在现有的学术和政策讨论中,物联网数据的生产不需要财产权激励似乎获得较大共识。例如欧盟的一份工作文件指出,物联网设备数据的产生是企业商业和技术活动的“副产品”,无论有无数据产权的激励,数据均会附随企业活动而产生⑥。物联网数据多为机器自动生成的、非公开的数据,不需要主动收集,因而并不适用于旨在激励数据“收集”活动的“数据库特别权”(a Sui Generis Right)。并且,欧盟1996年《数据库指令》设置的数据库特别权也并未起到激励数据库生产的预期目的。实证证据表明,欧盟内数据库的数量并未因数据库特别权的设置而明显多于美国[4]108。但是,产权无法激励数据库生产的原因也可能是数据技术与市场的缺失。我们必须认识到,物联网数据产权运行的技术和市场环境已在根本上区别于前大数据时代。
新的产权类型总是伴随着人类技术能力的发展而被创造。与物联网伴生的是全景式的人工智能技术与设备市场。数据开发与利用技术的普及,是数据要素市场得以培育和数据产权发挥激励生产效果的前提。数据财产权反过来也会激励创新数据开发技术的研发和应用。缺少数据利用技术将导致数据产权仅停留在纸面上,若大多数市场主体并不具备数据利用的技术能力,数据无法成为生产要素,设置数据财产权并无实际需要。正如上文所提到的,激励物联网数据生产的制度起点,不应是已有数据从一个主体传输至另一主体的“收集”行为,而应当是激励数据从无到有的开发过程,数据大爆炸需要一个繁荣的智能技术研发和交易市场。虽然物联网智能设备的研发成本能够在相应的产品或服务市场得到回报,但是当数据作为生产要素参与利益分配,数据要素市场将进一步提高智能设备研发与交易的收益,形成促进智能技术投资与创新的市场合力。
更进一步讲,数据质量与多样化的数据产品的开发需要产权保障。数据的生产除了“从无到有”,还需要梳理和清洗,实现原数据的结构化或半结构化,实现从数据到信息再到知识的认知过程。数据质量是决定后续人工智能算法输出结果可靠性的关键因素。要确保数据的准确性、完整性、连续性和可靠性,必须依赖企业在数据开发和加工过程中的技术和资金投入。处于不同处理过程的数据都可能作为数据产品进入市场交易,产权作为一种典型的“前合同”的初始利益配置安排,能够为数据开发者提供最稳定的投资数据产品的激励和保障[5]295。现代产权理论证明,产权不仅仅在于解决市场交易相对方基于投资成本对投资方的机会主义和“套牢”(hold-up)行为,避免事后“打劫”也将鼓励投资。在经济学上,产权的实质是对合同中未予以明确的剩余利益的控制权,拥有产权就意味着投资方对所有未来交易合同中可能出现的例外情况的剩余控制权,因而能够有效避免对方“打劫”的出现,为投资者建立稳定的市场预期,从而优化投资的质量和水平[6]23。物联网数据生产过程中拥有复杂的主体协作关系,清晰的数据产权将为不同主体提供确定和透明的市场预期,制度的确定性对于培育数据要素市场和相关大数据技术市场而言至关重要。
我们必须摆脱在前智能时代形成的对数据产权无须也无法激励数据生产的固化逻辑。面对大数据开发和利用技术的全面部署,数据产权将承担激励大数据生产的制度功能。
(二) 现有法律框架激励无法提供充分产权激励
企业数据能够独立交易,是打破数据所有人独占开发、提高数据再利用效率的重要方式。在现有的法律体系中,版权、商业秘密、欧盟的数据库特别权、个人信息保护权对企业数据交易可产生一定的激励或者限制作用,但是均无法为物联网数据交易提供足够的法律确定性。
物联网中的数据可分为用户主动提供个人数据、机器或传感器自动生成数据。首先,作为未经算法加工的原始数据,不具备版权保护的原创性要求,因而难以适用版权制度。并且版权激励内容生产的立法目的也不适用于物联网数据,数据产权显然不应以激励生产或收集更多个人数据为目的,这将与个人信息保护法中数据收集的“必要性”原则冲突。其次,欧盟的数据库特别权也并不适用于保护物联网设备自动生成的数据集。根据《数据库指令》第七条,要获得数据库特别权的保护,数据库的建立者必须在数据库内容获取、验证或展示方面表现出(定性或定量上)“实质性投入”⑦。欧盟法院在2004年通过一系列的司法判例,将企业的数据集合区分为附随于企业主经营活动的“副产品”数据库和经“实质性投入”于数据的获取、验证或展示而建立的数据库,《数据库指令》仅适用于后者[7]。物联网中,除了用户提供数据需要企业在多个数据源的数据收集方面进行投入,机器产生数据是附随智能产品运行而产生的“副产品”,而传感器数据则是从单一数据源中直接生成数据,并非对已有数据的收集或结构化展示,且物联网数据多为非公开数据,区别于网络平台上公开可获取的数据,不属于《数据库指令》所规制的数据集。欧盟2018年对《数据库指令》的二次评估也认为数据库特别权很大程度上不适用于物联网,不会制约数据经济的发展⑧。很大程度上,数据库特别权保护数据收集与展示劳动的立法目的将在物联网数据实践中落空,确立物联网数据所有权应当以激励数据开发与交易为制度目的,并兼顾个人信息保护的需要。
物联网数据多数为非公开数据,因而有学者认为,商业秘密保护可以为其提供充分的法律保护,不需要针对非公开大数据设立单独的数据财产权[8]24。然而,商业秘密同样也无法准确传达数据利益的主要内容。首先,数据并不完全符合商业秘密的定义。如果说企业非公开数据接近满足我国《反不正当竞争法》对商业秘密“不被公众知悉”的定位,却难以满足欧盟《商业秘密指令》中“不被通常接触这类信息的业内人士所熟知或轻易获取”的“秘密性”定义⑨。同一类型的物联网数据可能被不同的参与主体存储或轻易获取,导致数据失去秘密性。以无人驾驶汽车为例,参与提供无人驾驶服务的汽车制造商、传感器制造商、物联网操作系统服务商、汽车车载应用软件提供商等企业,获取并占有无人驾驶汽车在行驶过程中产生的数据并不存在绝对的技术障碍,对构成这一产业链的所有技术主体而言,数据并无秘密性可言。商业秘密保护仍未触及多方参与主体之间的“数据权属”不确定性所产生的数据分享与交易的法律障碍。其次,以商业秘密保护数据并不符合促进数据开放共享的公共政策考量,将数据作为商业秘密是企业拒绝数据交易的重要原因。欧盟2016年针对企业数据共享实践的调研报告《关于公司间数据分享的研究》显示,60%的企业不与第三方企业共享数据,其中33%的受访者出于对保护商业秘密的考量和对他方不当使用其数据的担忧,选择不分享数据⑩。商业秘密恐将激励主体通过合同和技术手段进行数据独占。
从权利的排他性设计目的来看,版权排他是为了保护“原创性”表达,数据库特别权的有限排他性是为了保护数据库生产的投入,商业秘密保护则是出于维护创新的竞争秩序,弱于专利的独占性保护,允许以反向工程等独立研究的方式合法获取非公开信息,旨在促进独立的科研创新,而物联网数据的产生或收集过程的创新劳动属性并不显著,数据经济的创新性主要体现在对数据的后续利用之中,重复的数据生成过程并无社会和创新价值可言。因此,以激励创新性数据生产为目的的版权、商业秘密制度,以及激励对现有数据收集的数据库特别权,均不能准确表达物联网数据秩序中的数据开放与排他的需要。
竞争法的适用有助于企业数据利益的分配,也是目前我国解决企业间数据纠纷的主要司法路径。法院通过对竞争法兜底性条款的解释,论证第三方对他人数据的利用模式是否构成“搭便车”“不劳而获”等违反诚信原则的商业行为。然而,竞争法一般条款更适用于互联网公开数据,物联网中非公开数据的创新利益分配是数据经济带来的新的法律认知问题,需要重新界定商业道德,“搭便车”可能正是物联网数据共享的结果。适用竞争法一般条款只是暂时性安排,正体现出数据产权制度的缺位[9]50,且被认为过于主观,客观类型化不足[10]38,逃避实质性的数据确权问题,向一般规则逃逸[11]33,摈弃产权制度破解创新认知难题的丰富的“结构化经验”等不足[12]118。竞争法的事后调整模式、遵循过往商业习惯和保护既得利益的价值倾向,在减少法律不确定性、兼顾数据创新再利用价值等方面存在明显不足。
尽管欧盟委员会关于物联网数据市场的调研显示,当前市场主体所关注的核心问题是如何安排数据的共享,而非数据所有权问题,合同路径依然是合适的数据流动方式。欧盟委员会因此建议当前以制定标准合同条款的方式引导数据共享合同,并提出了“五大原则”:第一,透明度原则,即明确有权获取数据的主体范围、数据类型、具体程度,以及数据获取的目的。第二,考虑物联网数据价值生成过程中的多方参与性,对于提供产品或服务而产生的“副产品”数据,应当意识到多方主体共同参与了该数据的生成。第三,尊重数据占有者和数据使用者的商业利益和秘密。第四,避免扭曲竞争,确保公开公正的市场竞争。第五,确保最低程度的数据锁定,尽可能保障数据的可迁移性。然而,数据共享协议的达成仍然无法回避数据权属的问题,标准化合同是一种类产权,以自愿遵守为前提的安排。并且欧盟委员会的建议仍然立足于以满足技术和商业运营目的的数据的处理过程,而非直接的数据交易实践,自然更容易得出不需要产权界定的结论。当面对多方主体占有数据的情况,确立数据权的归属方和权利范围,对提高共识基础、降低数据交易合同谈判和执行成本,实现以上五大原则而言是必要的。
(三)小结
综上,面对物联网中设备产生的大量个人数据与非个人数据的利用和利益分配问题,现有法律存在明显的空白。一个全面的“权利”政策框架体系的缺乏,将不利于规制物联网中原始数据的开发和交易,甚至加剧数据的独占开发。很大程度上,合同法和竞争法机制能够作为规制物联网数据流动的法律回应。但是,当权利的边界过于模糊,不同参与主体的议价能力不对等,市场本位的解决方案可能无法保证高效、公平和创新、友好的结果,无法为市场新进入者提供数据获取的便利,无法实现数据锁定最小化。而产权制度为国家干预和市场运作均留出了足够的制度空间。
三、 数据权属的分配规则
在市场主体之间形成“谁应当享有数据财产权”的共识,是实现数据自由交易、减少不合理的合同和技术措施限制的基本前提。在物联网架构中,数据的产生、收集、分析和运用需要多方主体的参与,包括设备制造者、运营者、使用者、信息平台服务提供者、数据分析者等等。各主体之间依据何种标准分配数据财产权,至今并未形成统一理论。
(一) “捕获”或“占有”规则的不足
有学者提出,依据“捕获规则”论证数据从业者的数据所有权,数据的收集者对数据集享有所有权[13]32。“捕获”规则与洛克的劳动赋权理论一脉相承,以产权鼓励劳动投入,任何人通过投入劳动使任何物体脱离其自然状态就可拥有该物的所有权[14]18。类似的,也有学者提出,依据“占有”规则确定数据的权属,将产权赋予能够依靠自身实力对某物体实现最初或者最后占有的主体[15]。但是,“捕获”规则与“占有”规则适用于数据都存在不足。
首先,二者均存在道德正当性的缺陷[16]1。无论是“捕获”还是“占有”规则均倾向于奖励强势者,如果数据的权属简单诉诸纯粹的暴力(force),可能带来赢者通吃的市场局面,不利于打破数据独占。且会激励市场主体过度收集数据,与个人信息保护的逻辑不符。激励“捕获”或者激励“占有”,均无法在应然层面成为数据权属划分的正当理由。
其次,“捕获”或者“占有”过度简化数据形成的复杂过程,主要体现在无法解释数据生成的多方参与性和数据类型的非排他性。“捕获”或者“占有”无法精准激励真正的数据生产者。洛克的劳动赋权证成私有财产权这一自然权利的前提,是私人劳动附加在公共产品之上,如捡起掉落的无主土地上的果实。而能够被用来“捕获”数据的个人或者物体,显然无法简单归于公共产品,如个人数据主体是否应当拥有个人数据所有权。同时,数据的生成往往需要多方参与,多方主体均有捕获能力,均可实施捕获和占有。如在无人驾驶汽车细分场景中,智能设备制造商、车载操作系统提供商及信息平台服务商等企业,均拥有捕获汽车行驶数据的能力。同一类型的数据能够产生多个备份,被不同的主体捕获或者占有。而依据“捕获”或者“占有”规则,每个成功实施捕获的主体均将对同一类型数据产生所有权,承认针对每个数据备份的所有权,将在数据类别上否定数据财产权的排他性。是否承认多方主体针对各自占有的相同类型的数据份额拥有独立的财产权是值得探讨的。针对有形物,如两个相同的纽扣可以产生两个独立的物权,但两份雷同的剧本却无法产生两个独立的著作权。类似于知识产权,原始数据同样属于无形物,存在内容与载体相分离的特性,应当参考著作权的设计,保留数据所有权在类别上的唯一性,避免激励重复劳动,将复制权作为非公开数据所有权的权利组成模块之一,并考虑针对在商业合作中合法获取备份的产业主体的权利例外的具体情形。
(二) 哈特的产权理论与物联网数据生产
1. 哈特的现代产权理论
应当依据什么在多方合作主体之间分配物联网数据集合的产权?哈特的现代产权经济学至少给我们三点启发。
第一,产权界定的必要性不仅体现在交易环节,还体现在实现生产的一体化。由于不完全合同的存在,任何交易都需要成本。科斯将企业选择一体化的原因归结为组织内部交易的成本低于市场交易。而哈特对科斯的交易成本理论做出一定的修正。哈特认为,任何产权界定都会带来投资的扭曲,将对事前投资激励的扭曲降到最低,才是一体化的必要性所在。在多方主体参与所形成的市场协作关系之中,合同权利有两种类型:特定权利和剩余权利。产权就是合作方所购买的剩余控制权,剩余权利是当事人在事前企业决策中无法具体确定的想要从对方资产中购买的权利。由于交易成本的存在,协商确定合同所有的特定权利是一件极耗成本的事情,那么当事人选择购买所有的剩余权利是经济上最优的。一体化可以被视为合同当事人为达成一个有效分配他们之间剩余控制权的合同的努力,是当事人协商如何分配合同剩余权利(产权)的过程。
第二,根据哈特的一体化整合理论,无论如何分配产权,都会带来对当事人生产投资的扭曲。而为了优化投资,产权如何配置,即谁整合谁就至关重要。这一点也是以科斯为代表的交易成本理论家所忽略的。产权应当配置给带来最小化投资扭曲的一方,即对合作产出贡献最大的一方。因为只有这样,才能实现产权配置的收益(稳定贡献最大一方的投资预期从而获得最重要的投资)大于成本(被整合者所受到投资激励减损)[6]23。
第三,在协作生产中,一体化的产权整合与非一体化的市场交易的整合模式应当如何选择呢?哈特鲜明地指出,非一体化的合同交易并非如之前的交易成本理论所认为的那样在经济效益上一定不如一体化的产权交易,相反,二者均会带来对投资的或大或小的扭曲。当事后剩余能够在合作方之间比较平均地分布时,合同交易在经济上是可行的,反而购买全部分的合同剩余权利会造成更严重的投资激励扭曲。例如当企业a购买或控制企业b,企业a就有权通过其剩余控制权来获得大部分的剩余,那么可能造成企业a投资过度,而企业b投资激励不足。因此,当一个企业的投资决策相对其他企业的投资决策而言特别重要时,一体化是最优选择;当双方的投资决策都同等重要时,非一体化是可行的[6]24-25。
2. 物联网数据的产权配置
物联网数据的产权分配可以通过现代产权理论进行更加精准的解读,得出数据产权的配置规则。物联网数据生产需要多方主体的合作,基础设施建设者、硬件设备制造者、软件开发者、运营者,以及终端的用户都参与数据的生产过程,符合多方协作进行投入获得产出的市场模型。通过合同还是通过产权来整合数据资产,就是合作者面临的问题。根据哈特的产权理论,当合同剩余能够在数据生产的参与者之间比较平均地分配时,通过合同足以协商出当事人满意的权利分配格局,从而达成投资激励的优化。而当合同的剩余权利分布并不平均时,应当由贡献最大的一方主体整合其他主体,即以产权整合生产要素。物联网数据的生产过程显然属于合同剩余权利分布不均的局面。因为多方参与主体在数据的开发、获取和占有方面的技术和市场实力悬殊,承担的创新性角色也不同,如硬件制造者可能仅提供智能设备而不主动参与数据收集,用户也不具备进行数据收集和开发的技术实力,数据聚合与开发最终会落在具备大数据技术实力的平台或软件系统运营者之上。因此,通过数据使用授权的合同由于可能面临“锁定”问题,在实现数据资产配置方面并不高效,数据产权应当“一揽子”配置给在数据生产中贡献最大创新性价值的合作者,即对创造数据价值剩余而言非常重要、对其他参与者决策而言非常敏感的一方。不难看出,在物联网数据的协作生产中,智能平台系统运营者显然处于这一核心的市场和技术地位,是数据资源的整合者。允许软件、系统的实际运营者购买数据开发合同中的剩余权利,其他主体则作为数据生产要素的提供者,参与数据生产的协作过程。
2017年,欧盟委员会《关于构建欧盟数据经济的通讯》提出,考虑将数据使用和授权使用的权利赋予“数据生产者”,并将“数据生产者”定义为例如设备的拥有者或者长期使用者(如租借者)。该通讯一方面肯定了确立数据权利对于促进物联网数据开发与交易的现实必要性,另一方面似乎忽略了除了列举的设备用户作为“数据生产者”外,设备系统的运营商的数据生产者地位,也体现出从个人信息保护的视角,将用户与设备交互中生成的数据一律配置给数据主体个人所有的政策倾向。考虑到数据生成的多主体参与属性,以及数据生成过程中不同主体资源整合能力的差异,主体付出劳动的性质存在明显差异,数据财产权的分配规则应当确立激励为数据资产的生成贡献最核心劳动、最具整合能力的一方主体。例如,欧盟《数据库指令》也将数据库特别权赋予在数量上投入最大量劳动或是质量上最核心的劳动的市场主体。
四、 个人数据的财产化
至此,我们讨论的是数据产权配置的经济逻辑,尚未引入个人信息保护这一数据法的道德面向。而数据尤其是个人数据,具有重要的道德和伦理面向。我国《民法典》将个人信息保护作为人格权的一部分。人格权,尤其是“宪法化”的信息自决权,在位阶上高于财产权[17]8。任何财产权都必须以符合公序良俗的方式实施。个人信息保护权是数据财产权的前置权利,是数据产权化的伦理基础。这也是欧盟提议将数据权利赋予“设备使用者”的道德原因。数据产权除了要考虑经济效益,还必须兼顾个人信息保护的需要。以下我们将探讨个人信息保护法律制度对数据产权配置的影响。
数据产权最大的制度功能在于培育数据要素市场,激活数据企业的数据开发和技术创新的动能。而个人信息保护制度旨在恢复数据主体对个人数据的控制能力,从而在大数据时代保有个人隐私、尊严和信息自决。数据产权的企业与市场面向和个人信息保护的个人和规制面向,决定了应将二者作为数据法律制度的两个组成部分,解决不同的数据法律问题。因而我们要讨论的是两种数据法律制度的协调,而非二选一。
(一) 个人数据财产权与个人信息保护制度的协调
上文我们探讨了由最具数据整合能力的实际运营数据开发的企业买断剩余权利、取得数据产权是符合经济效益的。而为了激励数据开发企业对数据资源的产权整合,赋予个人数据以财产权并允许个人数据的自由交易和整合,是符合经济效益的。
但长期以来,欧美学者讨论的重点是通过个人数据的财产权化能否强化隐私保护的目的。个人数据财产权起源于隐私碎片化保护的美国[18]2383。莱斯格就指出,通过赋予个人数据以财产权,个人可以设置隐私许可,实现隐私价值的个性化保护,在帮助个人重拾对个人数据的控制的同时,激励隐私保护技术市场的发展[19]245。然而,正如欧洲学者所提出的,美国式的个人数据财产权讨论是为了弥补美国隐私保护法律制度的不足,对于已有全面的个人信息保护法的欧洲来说并无很大的借鉴意义[20]507。
欧盟法律体系中,个人信息保护是受到政府强监管的公法领域,以法律赋予数据主体有限、具体的数据保护权利(如被遗忘权、数据迁移权、删除权、更正权等)和向数据从业者施加数据保护义务(如透明度义务、风险评估义务、数据泄漏报告义务等)为主要内容。我国《民法典》的个人信息保护制度也初步形成了“列举的个人信息保护权利+信息处理者义务”的人格权保护模式。而产权以市场机制为基础,提倡个人数据自由交易与轻监管,与个人信息保护作为人格权与基本权利的不可让与性、强监管路径天然不同[21]198。
但同时,我们必须面对个人数据经济价值不断攀升的市场现实。培育数据交易市场,构建交易规则,已经成为各国数据经济发展的必然制度方向。因此,平衡个人数据交易与个人信息保护需要从三个方面梳理两种数据制度的关系。
1. 可财产权化的个人数据集合范围应仅限于外围个人数据
防止个人数据交易减损个人信息保护力度,应当合理划定个人数据财产权的客体范围。个人信息保护权作为公民基本权利的地位应当得到体现,但是不应当扩展至全部个人数据。
无论是GDPR还是美国加州的CCPA,均将个人数据定义为一切能够用来识别具体个人的数据,基本上可以包括任何数据。大数据时代,个人数据与非个人数据的区分对于个人信息保护法来讲并无实际意义[22]177。应当考虑将个人数据区分为核心个人数据与外围个人数据。默认规则为针对核心个人数据采取基本权利保护路径,限制数据商业开发的合同自由和商业自由,而对外围个人数据则可以财产化开发,激励数据商业利用。所谓核心个人数据可以理解为无法匿名化的、具备终生唯一性的个人识别信息,如个人的DNA、指纹、声纹等基因、生物统计数据等。核心个人数据无法成为非个人数据,与公民人格权和人格尊严直接相关,占有该数据相当于占有自然人的身份,与现代社会尊重和保障人权的伦理价值不相符合,因而其收集和处理不宜通过财产权路径进行整合[23]1039。在欧洲人权法院的判决中,政府机关对公民NDA数据和生物样本的收集,即使是单纯的保存行为(retention)也构成对《欧洲人权公约》第八条“公民私生活”的侵犯。而在核心个人数据之外还存在大量的、并非绝对的“个人”数据,其包含的信息并不绝对指向特定的个人,如IP地址、GPS数据、cookie数据等,通过适当的匿名化处理和政府对数据处理过程的有效监管,外围个人数据的商业利用不会产生对个人身份和尊严的侵犯,因而其财产化和自由交易符合伦理适当性和经济理性。
将个人数据财产权限定于外围个人数据与GDPR的潜在的数据规制逻辑兼容。对比GDPR第6条和第9条可知,对于一般的个人数据,默认规则是允许数据处理和商业开发,只需满足第6条(a)—(f)所列的条件,包括个人同意和数据控制者的商业利益考量等。GDPR第9条则充分体现了特殊类型个人数据的保护作为基本权利的地位。特殊类型数据包括揭示个人的种族和民族、政治观点、宗教和哲学信仰或者贸易组织成员身份的数据,出于唯一的识别自然人目的的基因数据、生物统计数据、个人的健康数据等。默认规则是禁止数据处理,而根据第9条第二款(a)—(j)项的例外规定,特殊类型数据的数据处理条件,多是基于追求公共利益和自然人的重大利益,个人明示同意也须在法律未明确禁止的情况下有效,出于商业利益开发该类数据的空间非常有限。
核心与外围个人数据的区分,有助于确立个人信息保护法保护个人身份、隐私和尊严,同时促进个人数据流动的二重立法目的。GDPR第2条第二款明确规定,该条例保护自然人的基本权利和自由,尤其是个人信息保护权。第2条第三款规定,个人数据在欧盟内的自由流动不应受到个人信息保护的限制或者禁止,即确立了二者平衡的立法价值。但GDPR的数据保护目的往往被放大,而忽视了GDPR促进数据自由流动的目的。长期以来,有观点强调,隐私保护并不在于强化个人对个人“数据”的控制,而应强调数据主体对个人“身份”的控制[24]270,或者“交往完整性”(contextual integrity)[25]119。笔者认为,至少可以从数据与信息的法律区分来理解。信息由数据组成,数据是有意义信息的素材,但原始数据不等同于信息,仅处于机器可读状态的数据还需要进行恰当的组合结构、算法分析和语义挖掘,才能形成信息,被人类解释和认知[26]。数据与信息的二元分离,意味着隐私保护应当侧重对生成信息的数据处理过程的程序性控制与监管,而非对个人数据流动的限制。正如弗洛里迪对信息隐私的本体论解释(ontological interpretation),信息隐私权作为一项不可让与的基本权利,权利内容是保护个人身份,而本体意义上的个人信息是个人身份的内在构成要素,不适用外在的财产权的私权话语[27]223。总有一些随意性的标签(arbitrary labels)被随机或者习惯性地关联于使用者,如姓名、地址、社会保险账号、银行卡号、密码等等,能够实现与主体身份的分离,不属于本体意义上的个人信息[28]185,195。不可否认,外围个人数据的不当使用会引发信息隐私风险,但信息隐私保护不应当通过限制数据流动速度的方式实现,而是应当加强对构成个人特质的个人信息的保护,以及对数据分析方式的监管。外围数据财产权是确立数据在市场与经济维度的归属,顺应大数据科技发展的潮流,个人数据所有权并非对个人信息随意挖掘,同样道理,不意味着对数据的任意分析,隐私保护更需要落脚于对算法和数据处理过程的监管。另外,应当厘清个人信息保护法的目的是隐私和身份控制,而非对数据的个人控制,从而以政府规制的手段保护个人隐私和身份,以市场的方式促进数据流动,弥合个人数据财产权与个人信息保护的隔阂。
2. 个人数据产权在企业与个人之间的配置
个人数据可以配置为个人财产,但应当与企业的数据财产进行合理区分。功利主义视角的个人数据财产权制度应侧重降低交易成本,激励企业对个人数据的整合。
在民法上,人格权的商业化及财产利益保护久已有之。司法实践业已发展出保护个人感情、思想的隐私权和保护个人特征财产价值的姓名、肖像及公开权的二元并举的格局[17]282。个人数据的财产化也与洛克的劳动赋权理论相一致。但面对多主体参与的数据生产过程,必须依据贡献的大小来区分个人所有或企业所有。数据开发需要对数据进行梳理和清洗,其中理应包括对个人数据和非个人数据的区分存储和处理。
按照数据的生成方式,物联网数据可分为:用户主动提供数据、平台或设备自动生成数据及平台或设备间交互产生的数据。用户主动提供的数据,由于用户是主要创造者,应当归用户个人所有;平台或者设备自动生成的数据,由于平台或设备提供者的运营活动才得以产生,对于个人用户而言只是行为的“副产品”,因而应当归运营该平台或设备的主体所有。GDPR规定的个人数据迁移权仅限于用户主动提供给数据控制者(provided)的数据,不包括用户线上行为所自动生成的数据(generated),这正是按照主体贡献大小分配数据权属的逻辑例证,当然,迁移权并不是个人数据财产权化保护路径的产物。而对于平台或设备之间交互产生的数据,也应当按照主体贡献的大小,将数据所有权分配给主动产生数据的一方,而非被动接收数据的一方。如网站cookie数据、自动驾驶汽车产生的汽车行驶数据、汽车传感器生成的路况数据等,原则上应当由网站运营者、设备和传感器的实际运营者所有,而非机器生产者所有。
必须明确,虽然企业数据集合的产权制度激励企业购买、整合用户的个人数据,但个人信息保护合规是企业进行数据产权整合的制度成本。个人数据与非个人数据的混合数据集是企业大数据的常态,这一事实将提高企业进行数据整合的成本。当个人提供的如密码、指令、个人身份信息等数据与机器生成数据混合、难以区分时,则会提高企业整合数据资源的企业成本,并且需要具体分析。如果被混同的个人数据是可完全匿名化的外围个人数据,那么可以考虑混合数据集由用户与运营者共同所有,企业需要在承担个人信息保护义务的前提下,才能买断用户手中的个人数据产权。个人数据与非个人数据的混合数据集,可能存在“难以区分”和“能区分却未区分”两种情形。这两种情形均会无差别地引起个人信息保护法的适用,但却会带来企业数据整合的成本差异。所谓“难以区分”,可以参考欧盟委员会关于《欧盟非个人数据自由流动条例》的官方指南所定义的混合数据集。个人数据与非个人数据难以区分的情形,包括个人数据与非个人数据的区分要么不可能,要么被数据控制者判断为经济上效益低下或技术上难以实现,以及区分数据集合会极大降低数据集的价值。个人数据与非个人数据难以区分的结果,一是引发GDPR对整个数据集合的适用,二是用户与企业对混合数据集的共同所有权。“能区分却未区分”则是指区分个人数据与非个人数据在经济、技术上对企业而言均为可行,但系统运营企业却未做出应有的区分。在此情形下,企业不仅需要承担个人信息保护义务,还需要承担因数据开发的质量不足而丧失用户信任,从而引起的用户拒绝出售个人数据部分的额外交易成本甚至整合的失败。这也是企业数据实践不合规所造成的市场后果,产权激励也将产生企业数据合规的市场激励。而对于无法完全去除个人隐私、情感和思想属性的核心个人数据则不应财产化,与此类个人数据的混合将导致数据集的非产权整合,只能选择合同授权使用的方式进行数据处理,面对较高的数据整合成本。
(二) 个人数据财产化与个人信息保护的冲突调和的关键在于区分信息与数据
个人信息保护法与数据交易的关系一直模糊不清,并且出现了个人信息保护法否定数据交易合法性的趋势。能够肯定的是,个人信息保护的缺失将直接否定数据交易的合法性。近年来,国内外频繁出现非法获取、买卖个人数据的案例,如国内的大数据企业“数据堂”非法获取个人信息案[29]、英国剑桥分析公司非法获取Facebook用户数据案等[30],充分说明个人数据安全与合规是数据入市交易的基本前提。个人数据交易如何避免造成个人信息保护的风险,需要化解个人数据财产权化与个人信息保护之间的冲突,主要需要解决两个问题。其一,个人数据是否可以被企业一次买断,从而导致个人数据的财产权化与个人信息保护法相冲突;其二,因为个人数据的财产权化将减损个人信息保护的力度,是否应如一些学者所言,应禁止买卖个人信息,只允许授权使用?
首先,针对第一个问题,个人数据由企业整合符合大数据经济效益最大化,但是个人数据财产权利的交易并不意味着个人的信息保护权益的买断或消失,企业应当承担的数据保护义务也不消失。二者是公法与私法的双规制,不应混为一谈[21]179。相反,个人信息保护法运行的市场环境就是企业实际占有用户数据,构成事实上的企业数据财产权。产权的变动不影响个人信息保护权利和义务的后续实施。可以类比的是,著作权中财产性权利的出让并不减损创作者的人身权利及人格尊严等基本权利。例如,用户对个人数据的迁移权就不应随着个人数据财产权的出让而被剥夺。但从实施路径上看,个人信息保护权利是基于个人—企业的二元结构设立的,必须由具体的个人主张,集体主张应当有条件地被限制。单个个人主张数据的迁移或删除并不会对企业数据经营造成过大的影响,且企业数据财产权的客体是数据集合,数据集合的充分匿名化处理,是数据集合能够脱离个人信息保护法限制的必要条件。因此,正如下文将要提到的,引入个人数据财产权的集体管理机制是可行的,但个人信息保护权利作为法定权利类型,不能私人协商[31]487,506。
其次,以GDPR为模板的个人信息保护的权利格局,回避了个人数据交易的合法性问题,因而可能给出禁止买卖、只能授权使用的市场暗示。GDPR仅规制数据处理过程,包括自动或非自动的个人数据收集、记录、组织、结构、存储、修改、回收、咨询、使用、披露、向公众传播、组合、限制、抹除或者毁损,均属于数据控制者作为权利人对数据的积极使用或转授权使用,并未包括个人数据交易。在用户、数据控制者、数据处理者的三方关系中,GDPR以数据控制者和数据处理者的身份定义数据运营企业,数据控制者在法律上承担主要的数据保护义务,同时在事实上获得除了GDPR列出的数据主体的具体权利之外的其他数据经济利益[32]16-17。GDPR默认了数据控制者在与数据处理者的数据处理合同中的包括目的控制在内的相对支配地位,数据处理合同可能成为数据控制者限制数据转授权使用的合法手段,造成数据控制者针对其他数据运营者的事实上的强势法律地位。正如欧盟委员会所指出的,市场主体基于对数据的实际占有和控制,排除个人数据主体和其他商业主体对数据的获取和利用,不合理的数据使用合同造成数据锁定,自愿的数据交易因为谈判成本过高而无法实现。在笔者看来,造成这一现状的原因之一即为GDPR仅确立了个人信息保护权利的体系,而未对个人(混合)数据集合的产权及交易做出规定。
相比之下,2018年美国《加州消费者隐私法案》(CCPA)同样将消费者享有的具体权利之外的数据利益归于数据收集企业,但同时明确了企业个人数据买卖作为企业数据利益的内容之一,包括对所收集的个人数据的买卖、出租、披露、向公众传播等,同时赋予消费者“选择退出”(opt-out)的权利,暗含个人出让数据财产权但保留数据取回权的双轨制逻辑。GDPR与CCPA虽然并没有明确数据的所有权问题,但与企业数据财产权的市场逻辑并不冲突。只是应当明确的是,企业数据财产权的客体是企业的数据集合,而个人数据的财产权应当配置给数据主体。
个人数据承载了公民的基本权利和自由价值,但是我们不能因此而认定个人数据不能自由交易和让与。数据不属于谁的私产只是一种不切实际的幻觉[33]83。数据法制度应当建立起个人信息保护制度和数据的财产权制度的双轨制,兼顾公私法、人格权利与市场的两个面向。
五、 物联网数据财产权的例外及其集体管理机制
数据财产权制度需要平衡企业数据利益及数据自由流动和再利用。因而在确权的同时,还需要清晰的权利例外情形,以提高数据的可获取性,充分发挥数据的社会和经济价值,同时考虑建立个人数据权利的集体管理机制,整合分散所有权,提高企业数据整合的效率。
(一) 数据财产权的例外
OECD根据数据开放程度,将数据分为开放数据(公众可获取)、社群成员可获取数据、利益相关主体可获取数据和封闭数据(仅数据控制者可获取)[34],以适应不同的数据利用的需求。目前,各国的开放数据政策和国家战略主要集中在政府等公共机构掌握的公共数据和公共基金支持的科研数据。如美国、法国、德国、日本等国均制定了开放政府计划。公共数据向全社会开放,能够刺激经济增长和人工智能等创新技术发展,帮助解决医疗和交通领域的社会挑战,增强公共决策科学性和效率,促进公民参与社会和政治决策,提升政府透明度。GDPR明确指出,医疗大数据的融合能够帮助科研人员获得关于心血管疾病、癌症和抑郁症等疾病的医疗状况的重要新知识,覆盖广泛人口基数的医疗数据能够帮助社会科学获取关于社会条件(如失业与教育)与其他生活条件之间的长期关联性,为知识导向性的社会政策提供坚实的科学依据,提升生活质量和社会服务效率。因而,尽管GDPR规定个人健康数据原则上不允许数据控制者进行处理,但是允许出于促进科研目的的个人健康数据处理。
对于私人所有数据,自愿共享和协议开放应当作为数据流动的主要模式,但是,当权利人自愿共享数据的市场激励不足时,需要产权的法定例外情形来促进数据共享,以最大化数据的社会和经济价值。由于数据科技仍处于快速发展过程之中,数据使用的方式还在不断丰富,新的数据利用方式可能催生新的数据权利模块,从正面定义数据权利的全部内容的时机尚不成熟。反其道行之,考虑针对现有的数据使用模式和技术的数据权的法定例外情形更合逻辑,能够及时排除不合理的数据独占。参考规制创新性数据信息的版权制度,版权中的复制权和信息网络传播权,是最能够体现网络信息科技重塑版权作品再利用方式的两大权利模块。同理,复制权和公开权也应该作为物联网数据产权的权利模块,以在数据科技面前保护权利人商业利益。合法地对他人所有数据进行复制或公开,是数据使用的第一步,是其他主体创新数据利用商业模式和技术的前提。一般情况下,对非公开的物联网数据的复制和公开需要获得权利人的授权,但应存在较大的权利例外的空间。如前所述,企业数据财产权应当设计针对出于公共服务和科研目的的数据法定许可制度,促进以科研、医疗、教育和公共服务等为目的的数据融合和数据挖掘。同时,为了促进私主体数据科技创新和商业决策效率,针对产业链中其他合法获得数据备份的主体,设立权利人复制权的例外,但该例外应限于提供相关产品或服务所必需的限度之内。用户作为利益相关主体,出于个人信息保护的需要的数据获取,也应作为企业数据权利的例外,但应以个人信息保护法中数据主体的法定的具体权利为限度。最终以数据权利人的授权与权利例外相结合,构建数据的社区可获取与利益相关主体可获取机制。
对于数据转让后的后续开发问题,除了符合个人信息保护的法定义务,数据权利人不应当对数据买方的数据使用方式和目的进行限制,以免造成数据权利人对数据开发市场的过大的产权话语。欧盟版权法即体现了改革版权制度以顺应大数据技术的发展的需要,2019年的欧盟《数字统一市场版权与相关权利指令》(简称《数字统一市场指令》)设置了版权和数据库特别权的针对使用文字和数据挖掘技术的商业使用的默示许可。对于使用人将合法获取的作品和其他信息用于数据挖掘技术的,可以不受版权人的复制权、计算机软件复制和修改权、数据库特别权和出版者权利的限制。该复制和抽取部分可以依据数据挖掘的必要期限进行存储。作为平衡,权利人可以针对数据挖掘技术,明示保留其复制、抽取数据信息的权利,但权利保留的声明必须以合适的方式做出,如对于公开可获取的线上内容使用机器可读的方式。
(二) 个人数据产权的集体管理机制
通过一个全面的权利框架规制物联网数据的商业开发和交易,还需要对分散状态下的个人数据权利进行整合,降低数据整合成本,构建个人数据财产权的集体管理机制必不可少。“权利”替代“责任”话语是2019年欧盟《数字统一市场指令》中版权制度改革的重点,而权利的集体管理是防止“权利”话语过度制约内容分享平台发展的保护阀。欧盟《数字统一市场指令》将内容分享平台为用户提供的内容上传和分享服务,定义为对受保护作品的“向公众传播”,因而平台在提供内容分享服务时应当取得权利人的授权;当用户内容被侵权时,内容分享服务平台将承担直接侵权责任,“避风港”规则不再适用。预测用户将会使用的版权作品,并提前获得每一位作品权利人的授权,对于内容分享平台来讲几乎不可能。因此为了防止过度负担平台产业,该指令同时规定了版权和其他权利的集体许可制度、利益相关主体之间的对话机制和通过协调机构的协商机制等,成员国有义务积极构建这些利益代表与协商机制,希望通过这些程序性设计,避免分散的版权和其他权利带来的许可难题,引导网络平台产业与内容产业达成协商与合作,提高内容许可的广度和效率。可以想象,数据财产权制度的建立也必须借助类似的集体管理机制,达成权利保护和市场效率价值的统一。
结 论
在个人信息保护权利清单之外,物联网数据开发、整合和交易需要一个“产权”框架进行激励和治理,形成数据法律制度的双轨制。而现有的版权、商业秘密、数据库特别权等“权利”话语,均无法传达物联网数据市场秩序的应有内容,竞争法作为一种“临时安排”也存在确定性不足的问题。在物联网数据财产权的规则构建方面,“捕获”规则与“占有”规则均无法体现数据生成过程的多主体参与特性,物联网数据集合的权属,应当配置给能以最低成本整合数据资源的一方,而其中由个人提供的个人数据应当归数据主体所有,但产权制度安排应当降低企业向个人购买数据产权的整合成本,以激励数据资源整合。同时,为了协调数据财产化与个人信息保护法,应当将可财产化的数据范围限定于外围个人数据,对于核心个人数据依然采取基本权利保护的政府规制路径。数据的开放与共享是数据政策的导向,数据财产权制度需要清晰的权利例外和权利的集体管理制度来化解数据财产化可能带来的数据独占和锁定问题。
注 释:
① COM (2017) 9 final. Communication from the Commission to the European Parliament, the Council, the European Economic and Social Committee and the Committee of the Regions, “Building a European Data Economy”, 2.
② 《关于构建更加完善的要素市场化配置体制机制的意见》提出:“加快培育数据要素市场……研究根据数据性质完善产权性质……”。
③ SWD (2018)125 final. “Guidance on sharing private sector data in the European data economy” , 1.
④ Deloitte, Impact assessment support study on emerging issues of data ownership, interoperability,(re)usability and access to data and liability. First interim report.
⑤ 参见《欧盟一般数据保护条例》第4条,《中华人民共和国数据安全法》第3条,国家网信办《数据安全管理办法》第2条。
⑥ Commission Staff Working Document, Evaluation of Directive 96/9/EC on the Legal Protection of Databases {SWD(2018)147 final},35-37.
⑦ 参见《欧盟数据库指令》第7条第一款。
⑧ Commission Staff Working Document, Evaluation of Directive 96/9/EC on the Legal Protection of Databases {SWD(2018)147 final}, 11-12.
⑨ 欧盟《商业秘密指令》第1条(1)(a)。
⑩ 另外,49%的受访者认为隐私担忧是其选择不分享数据的重要原因,有28%的受访者是出于安全和责任的不确定性而选择不分享数据,28%的受访者则是缺乏数据分享的动力。