数据法治三人谈
2024-04-01孙莹袁曾马斌
孙莹 袁曾 马斌
编者按:本期的“数据法治三人谈”围绕数据产权问题展开讨论。产权制度是社会主义市场经济体制的基石,数据产权是数据法治的“牛鼻子”。2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》明确提出:“探索建立数据产权制度,推动数据产权结构性分置和有序流通,……逐步形成具有中国特色的数据产权制度体系。”由于数据要素在生产、流通等各环节的特殊性和复杂性,如何科学构建数据产权制度成为一个重大的实践和理论难题,这亟需法学理论界的认真研究和积极回应。
对此,孙莹教授、袁曾副研究员、马斌助理研究员三位作者提出了自己的新思考。孙莹教授认为对数据权益客体的识别是数据产权制度的基础性问题, 她对数据权益客体中的基本范畴进行界定,详细探讨了“数据”“数据产品”“数据资源”“数据资产”等概念的内涵与边界。袁曾副研究员关注分配视角下的数据利用规则问题,主张以数据规模化利用为规制标准,构建鼓励全民利用的价值开发模式,确立法定的数据收益再分配机制。马斌助理研究员认为不应将“数据二十条”中涉数据产权内容理解为三权分置,而应以模块原理构建数据产权制度,数据持有权利规范是模块治理的核心。本组笔谈文章富有争鸣性,我们相信各种洞见的碰撞能够成为知识进步的动力。
论数据权益客体中的基本范畴
孙莹
内容摘要:对数据权益客体的识别是数据确权的前提,也是数据产权制度建构中不能回避的基础性问题。对“数据”“数据资源”“数据产品”及“数据集合”等数据权益客体中的基本范畴进行严谨界定,意义重大。作为数据权益客体的数据仅针对电子数据,指向其中的数据符号层。数据资源是指可作为生产资料投入生产之中形成数据产品的数据的总称。数据产品是指原始数据经实质性加工形成的衍生数据以及数据衍生产品,属于数据资源。原始数据产权激励“数据收集劳动”,而数据产品产权激励“数据加工劳动”。数据集合符合实质性加工要件时成为数据产品。数据服务不属于数据产品,应当区分两者并为其建构不同的法律规则。数据商品和数据资产的形成本身并不经过劳动,因而并非数据权益客体。
关键词:数据产权结构性分置 数据权益 数据资源 数据产品 数据服务 数据资产
中图分类号:DF51 文献标识码:A 文章编号:1674-4039-(2024)01-0024-37
引言
《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称数据二十条)提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。其中,分类,是指对数据权益客体进行类型化界分;分级,则是对数据权益的权能效力进行差异化配置。〔1"〕但是,一方面,学界对于数据权益客体是否需要分类存在争议,有学者将数据整体上作为数据权益客体,或认为从民事权利客体的角度而言,没有必要区分数据、数据资源和数据产品,〔2"〕也有学者直接主张从利益角度界定权利而否认从客体界定权利;〔3"〕另一方面,如何对数据权益客体进行分类也有多种观点,例如“原始数据—数据产品”〔4"〕、“数据资源—数据产品”〔5"〕、“原始数据—数据集合—数据产品”〔6"〕、“原始数据—数据资源—数据产品”〔7"〕、“数据资源—数据集合(数据元件)—数据产品”〔8"〕等。在上述不同的分类体系下,“数据资源”“数据产品”及“数据集合”等基本范畴的内涵与外延并不一致,同时,为了契合数据二十条提出的数据产权结构性分置,不同观点对上述基础术语也都进行了再界定。整体而言学界对数据权益客体中基本概念的运用尚不统一,甚至有些混乱。本文认为,对数据权益客体的识别是数据确权的前提,也是数据产权制度建构中不能回避的基础性问题。随着数字经济的发展和学界对数据权益保护研究的深入,梳理并分析现有的数据权益客体表达,尽量对其中的基本范畴进行严谨界定,以凝练学界共识、统一话语体系,意义重大。
一、数据权益客体中数据的界定
研究数据权益客体,首先应厘清“数据”这一概念。数据安全法第2条第1款将数据界定为“任何以电子或者其他方式对信息的记录”。从这一界定出发,需要明晰两个方面:一是数据权益客体语境中的数据是包括电子数据以及非电子数据两类,还是仅仅指向电子数据;二是数据既然是对信息的记录,那么数据和信息两者关系为何。
(一)数据权益客体中的数据仅指向电子数据
数据安全法出台前,学者所言数据往往限于电子数据范畴,亦即“以电子方式对信息的记录”,而且大多是指“比特形式”。但是电子方式绝非仅仅只有比特一种形式,还有“值可以是0、1或0和1量子叠加”的量子比特、“在一定时间范围内可以有无限多值”的模拟信号等其他形式,除此之外,还存在其他进制系统的数字系统(虽然比较少见)。从数据安全法对数据的界定可见,数据安全法中的数据包括电子数据和非电子数据。数据和电子数据的区别包括但不限于:其一,数据外延显然大于电子数据。信息不仅可以通过(电子)数据表达,而且可以通过其他形式表达,例如纸张。其二,紙面数据和信息是割裂的,而电子数据与信息具有高度对应性,例如,有的学者认为(电子)数据兼具信息本体和信息媒介的双重属性。〔9+〕但是,电子数据的这种对应性并不是绝对的,因为明文数据可以加密成为密文数据。
数据安全法出台后,学者在构建数据产权制度时往往直接援用数据安全法的定义,默认数据权益客体乃为数据安全法所指“任何‘以电子或者其他方式对信息的记录”,这一做法也是有待商榷的。这是因为:第一,数据安全法在立法定位上属于公法范畴,它的立法目的除了保障个人数据安全之外,还有保障国家数据安全,甚至后者才是主要目的,由此数据安全法拓展数据外延是意图实现更加全面的数据安全保障。但是,在私法上不必将所有数据都通过财产权制度加以保护。好比知识产权法并不保护所有知识,而仅仅是保护作品、专利、商标等客体,而要构成此种客体又需具备一定要件。第二,电子数据对数据媒介的依附性相较纸面数据而言大大削弱。由于无法分割纸面数据的物理层和符号层,“规范上对物理层和符号层没必要分别设定法学意义上的客体”。〔10#〕相反由于信息技术的发展使数据的独立性大大增强,就电子数据而言,媒介、载体、符号和信息,可以较简便地实现分离,在云计算和分布式存储技术运用以后更是如此。〔11#〕对此,下文将详述。因而我们可以得出结论,如果可以在数据之上配置某种财产权益,也仅仅应当针对电子数据。
(二)应当区分使用数据与信息
就数据与信息两者的关系,有混同论和区分论两种观点。混同论并不区分数据与信息,或者虽然区分两者但是认为两者指向一个客体。例如,有的学者认为,“电子数据通常与电子信息具有共同的意义”,〔12#〕“个人信息的权利与个人数据的权利是一回事”,〔13#〕“信息和数据在数字技术条件下在概念上并没有进行严格区分的必要性”,〔14#〕“数据专指信息的集合体或者集合的信息”,〔15#〕“个人信息与个人数据既无法区分也没有必要区分”。〔16#〕
区分论区分使用数据与信息,认为两者指向不同。本文赞同区分论。理由如下:第一,虽然欧盟《通用数据保护条例》认为“个人数据”是“……的信息”,我国早先法律也存在混用数据与信息的现象,但无论是从民法典、数据安全法等国内立法,〔17#〕还是从数据治理法(Data#Governance#Act)、数字市场法(Digital#Markets#Act)、数据法(Data#Act)等欧盟立法〔18#〕来看,国内外立法者有意区分使用两者的态度愈发明显。第二,数据和信息确实存在区别,数据安全法将数据界定为“对信息的记录”,“对信息的记录”显然并不等于“信息”本身。此种区别体现在,信息未必都被记录成为数据,数据未必真实完整地表示信息,不同形式的数据可能表现同一信息等方面。第三,如果对数据与信息不加区分,那么在数据上“配置排他性的绝对权利”就会导致“其他主体平行开发或获取的相同信息便可被数据权利人排除”。〔19#〕所以笔者之前所言企业数据持有权“绝对排他”〔20#〕并非指排除他人将信息记录为数据,而是排除他人未经授权地从数据中获取信息。例如,一个地理测绘企业将某地地理信息记录为数据并不会排除其他企业再将此地理信息记录为数据,但是将会排除其他企业未经授权地从该企业记录的数据中获取信息。第四,数据权益客体仅为数据而非信息并不会让数据权益人难以利用信息。正如书籍的所有人可以在一定程度上使用作品而不侵害著作权一样,数据权益人在一定程度上可以利用数据所承载的信息而不侵害信息上的权益。
(三)数据权益客体中的数据指向数据符号层
区分论又有单层说和分层说之分。单层说仅仅区分使用数据与信息,分层说不仅区分数据与信息,而且对于数据本身予以分层。例如,有的学者区分处于物理层的“数据载体”,处于符号层的“数据文件”(单纯的数据)以及处于内容层的“数据信息”,而“数据”一词如无特指覆盖数据文件和数据信息两个侧面的含义,并且应在数据文件上设定所有权;〔21#〕有的学者区分语义信息层面的数据信息内容、句法信息层面的数据符号以及实体层面的实体信息,并且认为数据实体层面已受到存储载体所有权保护,而对数据信息内容和数据符号均不应设立数据财产权;〔22"〕有的学者则认为数据包含数据载体部分(电子化符号编码)以及数据内容(数据所能呈现的信息)部分,而数据财产权的客体包括数据载体以及数据内容,并且数据载体可被数据财产权人“准占有”。〔23"〕本文赞同分层说。理由如下:第一,正是由于并非所有信息都会被捕获为数据,被捕获的数据所表达的信息(本文称为“数据信息”)和信息可能并不完全一样。因为记录可能失真失全,就像照片中的信息因受到图片分辨率的限制不能完全还原场景信息一样,所以数据信息的外延并不等同于信息。简言之,数据信息一词并非信息一词的同义反复。第二,固然数据是对“信息的记录”,但是唯有分层才有可能考察具体何为“对信息的记录”,才有可能具体考察劳动赋权理论如何运用到捕获数据的劳动中。第三,只有分层才有可能探究数据各个层面上的现行法律保护现状如何,才有可能具体考察对于“信息的记录”是否存在立法空白。而只有在存在立法空白的情形下才有可能进一步地探讨是否存在弥补此种立法空白的必要。例如,有学者综合考察数据各个层面,得出仅仅应对“数据文件”赋权的结论,〔24"〕或者得出不应赋权的结论,〔25"〕或者得出应对“数据载体”以及“数据内容”赋权。〔26"〕
在综合考察各项标准和既有理论的基础上,本文建议区分为数据媒介、数据载体、数据符号以及数据信息四层。数据媒介,或称数据媒体,是指用来记录并且检索数据的物理媒体,例如磁盘、光盘;数据符号,是指以数据载体记录于数据媒介上,表达数据信息的符号,例如比特亦即二进制数字;〔27"〕数据载体,是指为表示信息而应用于数据媒介的材料,例如墨水、颜料、可磁化层;数据信息,是指用数据媒介储存的信息。仍以地理测绘为例(例如航空拍摄测量),航拍图片所表达的信息即为数据信息,航拍图片的比特形式即为数据符号,储存航拍图片的硬盘即为数据媒介,硬盘上的可磁化层即为数据载体。
在承认数据分层基础上,我们尚需厘清作為数据权益客体的数据指向何层。有的学者认为其涵盖数据符号以及数据信息两个层面,〔28"〕但是大多数的学者认为数据应为符号尤其是指比特。本文认为“对信息的记录”从动态上讲,是指通过数据载体在数据媒介上以数据符号表达数据信息的过程,就原始数据而言亦即捕获信息的劳动,〔29"〕例如,航拍过程之中通过改变可磁化层的磁化状态以比特的形式将地质信息记录于磁盘之中;从静态来讲,是指上述过程所获得的数据符号,就原始数据而言亦即“数据业者捕获信息所获得的战利品”,〔30+〕例如,此次航拍所获得的比特。进一步讲,一次捕获劳动形成一份原始数据这一个数据权益客体。仍以地理测绘企业为例,某一个地理测绘企业A将某地地理信息记录为原始数据后,另一地理测绘企业B又将该地地理信息记录为原始数据,这时即使从信息到符号都较为相似,但因为是不同捕获劳动获取,故而存在两份原始数据,两个企业分别对两份原始数据享有数据持有权,向AB外的其他企业流通数据时遵循“企业—其他企业”一重授权机制,〔31+〕而不必征询对方的同意。但如果是地理测绘企业AB合作收集数据,约定对所获数据共同持有,由于只有一次捕获劳动,故而此时是AB共同享有对这一份原始数据的持有权,此时A或B若向其他企业流转数据则需征询对方同意。
另外有一点需要说明,与混同论对数据与信息不加区分进而导致数据权益客体范围太广不同,有的学者认为即便“信息被分别存储在两台电脑中或同一台电脑的两个不同数据文件”,“但在符号层(数据文件层)上体现为两个独立的数据文件”,〔32%〕如此界分又会导致数据权益客体过窄,同时也有以下弊端。第一,此种界分与实践不相吻合,例如,一般认为分布式存储中存储在不同节点上的是同一份数据。第二,此种界分与其逻辑不符,该观点所称数据文件处于符号层,而复制所得数据文件从符号到信息都与原文件一致,依其界定这应是一份数据文件,而非两份独立的数据文件。第三,如果复制所得文件和原文件是两项独立客体,那么复制所得文件的权利转让以后,出让人就无权再使用复制所得文件。而与实物不同的是,数据极易复制故而受让人又可轻易再转让,这时就会产生较大的外部性,不利于激励捕获信息的数据收集劳动。
二、数据产品与数据资源的识别
在重新阐明何为“数据”的基础上,我们可以进而探讨“数据权益客体”的具体类型。由于数据二十条提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,因此,本文首先探讨的是数据产品与数据资源这两个基本范畴。
(一)数据产品属于数据资源———一种基于解释论的阐述
逻辑学上,根据两个概念外延是否存在共同分子,可将概念外延间的关系分为相容关系和不相容关系,而相容关系又可以分为全同关系、属种关系和交叉关系,不相容关系又包括矛盾关系以及对立关系。〔33%〕对于数据资源和数据产品的关系,主要存在下述三种不同观点:第一,两者属于矛盾关系。例如,有的学者认为数据資源是具有潜在价值的数据,包括原始数据以及经初步加工的衍生数据,以此区别于具有实际应用价值的数据产品;〔34%〕有的学者以及地方规定认为数据资源为原始数据,以此区别作为“数据加工使用产出物”的数据产品。〔35%〕第二,两者属于对立关系。例如,有的学者虽然同样认为数据资源是原始数据,但将数据集合以及数据产品与其并列;〔36%〕有的学者认为数据资源是初步加工的衍生数据,与原始数据、数据产品并列。〔37%〕第三,两者属于属种关系,例如,有的学者认为数据资源是指可供人类利用并产生效益的数据集合,包括原始数据、合成数据、衍生数据以及数据产品;〔38%〕北部湾大数据交易中心将数据资源作为数据产品中的一类进行交易。
本文认为,将数据产品纳入数据资源或许更具有可行性。从语义学的角度来看,此种理解更为契合资源和产品的本义。根据《现代汉语词典》(第7版)的界定,资源是指生产资料或生活资料等的来源,产品是指生产出来的物品。而生产资料是指劳动资料和劳动对象的总和,生活资料又称消费资料是指供人们物质文化生活需要的那部分社会产品。在生产资料中,劳动资料是指人用来影响和改变劳动对象的一切物质资料的总和;劳动对象是指在劳动中被采掘或加工的东西,劳动对象可以是自然界原来有的如地下矿石,也可以是加过工的原材料,如棉花、钢材等。生产物质资料的劳动过程即运用劳动资料对劳动对象进行加工,改变自然界的物质形态,创造出满足人们某种需要的使用价值的过程。从上述界定出发,数据资源的外延是较为广泛的,原始数据、衍生数据以及数据衍生产品均可成为劳动对象,进而属于数据资源。有的学者以原油和石油为类比,认为“能够称之为资源的,不是具体类型的石油产品,而是聚集起来的原油”,〔39#〕进而认为数据资源和数据产品非此即彼,但事实上,《中国统计年鉴》中的石油包括原油及原油经过加工炼制产出的各种产品,石油产品亦是石油资源中的一种。但与石油不同的是,数据具有非实体性、非消耗性,原始数据经加工形成某一数据产品,并不妨碍该原始数据经加工形成另一数据产品, 当然也不妨碍该数据产品再经加工形成新的数据产品,数据的价值正是在不断加工中得到深化的。另外,有的学者认为数据资源就是数据要素,〔40#〕但生产要素指生产某种商品时投入的各种经济资源,由于资源未必投入生产,所以资源未必成为要素。数据作为生产要素亦有其特殊性,亦即具有劳动工具和劳动对象的双重属性。综上,我们可以将数据资源解释为,可作为生产资料投入生产之中,形成数据产品的数据的总称。〔41#〕
将数据产品纳入数据资源,更为契合数据二十条的三权分置体系,也更为契合财政部《企业数据资源相关会计处理暂行规定》等对数据资产的界定。数据资产将于后文详述,此处先就数据二十条中的三权分置体系展开论述。数据二十条第7条将数据资源持有权界定为,数据处理者对依法依规持有的数据进行自主管控的权益。而数据产品经营权经由数据处理者许可他人使用数据或数据衍生产品产生。那么“数据产品经营权”具体意指为何?可以从下面两个方面进行理解:其一是经营权的内容问题。数据二十条出台以前,有些学者认为数据经营权是一种“经营资格权”,〔42#〕但是一般认为数据二十条中的数据产品经营权系借鉴土地经营权而来,〔43#〕故而借鉴民法典第340条、农村土地承包法第37条等规定,可将数据产品经营权界定为“权利人有权在合同约定的期限内持有数据产品,自主开展数据产品经营活动并取得收益的权益”。其二是经营权的客体问题。是否仅在数据产品而不在原始数据上设立经营权? 数据二十条的态度是明确的,亦即“审慎对待原始数据的流转交易行为”,不在原始数据上设立经营权乃其当然结论。
通过上述分析,可以得知数据二十条下的数据产品经营权乃是基于授权而由数据资源持有权分置出的权利。但是,如果认为数据资源和数据产品属于对立关系或者矛盾关系,那么在数据产品上就不可能存在数据资源持有权,进而不可能分置出数据产品经营权。正因如此,秉持此种观点时不可避免对数据二十条所表达的数据权益体系进行了改造,例如:有的学者将数据资源理解为原始数据,将数据产品理解为数据加工使用的产出物,所以在数据资源持有权外另设数据产品持有权,以数据持有者权统合二者,而数据产品经营权是基于持有者授权由数据产品持有权分置出的权利。〔44#〕有的学者认为数据资源是指原始数据,其上存在数据资源持有权;而“海量原始数据经初步加工整理”形成数据集合,其上存在数据加工使用权;数据产品是指“……对数据集合进行深度的分析过滤……的衍生数据”,其上存在数据产品经营权,数据三权均由数据所有权派生而来。〔45#〕有的学者直接否认数据产品持有权派生数据产品经营权,对数据资源和数据产品不加区分,认为数据持有权、数据加工使用权以及数据经营权分别对应数据财产权的不同权能,三者并行不悖,其中数据持有权是排他权,数据加工使用权是许可权,数据经营权是处分权。〔46.〕但此种做法似乎又有悖于数据二十条建立“分类分级确权授权制度”和“数据产权结构性分置制度”的精神。
产品持有权派生数据产品经营权,对数据资源和数据产品不加区分,认为数据持有权、数据加工使用权以及数据经营权分别对应数据财产权的不同权能,三者并行不悖,其中数据持有权是排他权,数据加工使用权是许可权,数据经营权是处分权。〔46.〕但此种做法似乎又有悖于数据二十条建立“分类分级确权授权制度”和“数据产权结构性分置制度”的精神。
此种改造数据二十条表述的做法(姑且称为“立法论”)无疑是一条可行之路,但是在契合资源以及产品本义的前提下,对数据资源和数据产品予以重新解释(姑且称为“解释论”)从而延续数据二十条的权益体系以凝聚共识并保证政策的连贯性或许也不失为一种好的选择。
数据二十条所分置的数据产权除了数据资源持有权和数据产品经营权外还有数据加工使用权,数据二十条第7条将其表述为“数据处理者使用数据和获得收益的权利”。从这一表述来看,数据加工使用权显然可以为数据资源持有权所吸收,因此有观点认为“数据加工使用权不是独立存在的权利”,〔47.〕或者认为“数据加工使用权”应当转型为“许可他人加工使用权”〔48.〕。但是应注意到,数据加工使用权是“依照法律规定或者合同约定”(数据二十条第7条)获取的,所以数据加工使用权亦可是派生出的权利。那么同是派生出的权利,数据加工使用权和数据产品经营权有何不同?从字面意义看,数据加工使用权强调的是“使用”以及“收益”,而数据产品经营权强调的是“经营”。前文已述,数据产品经营权中的“收益”指的是数据产品经营活动而取得的收益,所以数据加工使用權中的“收益”仅指因为使用数据而获得的收益但不包括经营数据产品所获收益,换言之,数据加工使用权,仅仅享有数据的使用价值而不享有数据的交换价值。许可他人加工使用数据同样属于数据产品经营活动的一种,故而数据加工使用权不仅可从数据资源持有权中派生而来,还可从数据产品经营权中派生。
综上所述,数据资源持有权、数据加工使用权和数据产品经营权的权利配置大体存在以下情形:其一,数据资源持有权人授权他人经营数据产品,由此形成“数据资源持有权—数据产品经营权”的二元结构;其二,数据资源持有权人许可他人加工使用数据,由此形成“数据资源持有权—数据加工使用权”的二元结构;〔49.〕其三,数据产品经营权人许可他人加工使用数据,由此形成“数据资源持有权—数据产品经营权—数据加工使用权”的三元结构;〔50.〕其四,数据资源持有权分别授权他人加工使用数据或者经营数据产品,由此形成“数据资源持有权—数据加工使用权”和“数据资源持有权—数据产品经营权”的并行结构。由此可知,数据资源持有权、数据加工使用权的客体是数据资源,数据产品经营权的客体是数据产品。从解释论的角度来理解,将数据产品纳入数据资源,数据产品上亦可配置数据资源持有权以及数据加工使用权。这种理解,既符合当今数据利用的实际,也符合数据二十条提出的三权分置体系。
(二)实质性加工是数据产品的必要条件
如上文所言,从动态上讲“对数据的记录”就原始数据而言,指向捕获劳动,即数据收集劳动。而就数据产品而言,指向数据加工劳动,但此种加工究竟需要达到何种程度才能使原始数据成为数据产品? 对此,数据二十条没有言明,理论和实践上存在较大争议。有的观点认为数据产品应当经过实质性加工,其中淘宝诉美景案是典型代表。〔51.〕另外,《深圳市数据产权登记管理暂行办法》规定“数据产品,是指自然人、法人或非法人组织通过对数据资源投入实质性劳动形成的数据及其衍生产品”。也有学者认为,数据产品可以考虑界定为,网络运营者通过合法手段获取到原始数据,对原始数据采用一定的算法,经过深度的分析过滤、提炼整合及脱敏处理后而形成的具有交换价值和技术可行性的衍生数据。〔52.〕但是,亦有观点认为数据产品不必经过实质性加工,例如有的学者将数据划分为原始形态的数据资源(或称数据要素)和数据加工使用的产出物———数据产品。〔53.〕数据产品应采广义理解,除原始数据外,凡经过合法处理、具有市场价值的数据均属之,并不以投入实质性加工和创新性劳动为要件。〔54.〕还有学者虽然划分狭义数据产品以及广义数据产品,但认为“如果以经过加工的数据为数据产品,那么数据和数据产品的区分就会成为哈特所言的‘头秃问题”。〔55.〕
本文赞同数据产品应当具备实质性加工要件。第一,虽然加工至何种程度可以称为实质性加工有“头秃问题”之嫌,但是去掉这一限制必然会使数据产品的门槛过低,由此可能导致劣币驱逐良币,最终背离设立数据产品经营权以“促进数据要素流通复用”的目的。很显然,如果只要进行简单加工(例如修改几个数值)就能形成一份数据产品,进而为其配置新的数据权益,那么原数据上的权益将会大大虚化。认为数据产品无需实质性加工,目的之一是将经营权配置在尽可能广泛的客体上,但是事实上,即使认为数据产品仅需加工即可,也无法解决经营权不能在原始数据上设置的问题。
第二,完全符合根据劳动赋权理论对数据进行确权的原理。前文已述,原始数据产权激励的是数据捕获劳动即数据收集劳动,数据产品产权激励的是实质性加工即数据加工劳动。对于加工,我国民法典第322条规定了添附制度,就加工物的归属除有约定外,一般认为在不考虑其他条件的情况下以材料主义为原则,亦即加工物原则上属于原材料的所有权人,而仅在“通过加工新增的价值大于原材料的价值”时才例外采取加工主义归属于加工人。与物的加工相同的是,如果数据收集者和数据加工者不同一,那么在不考虑其他条件的情况下,当数据加工者所添附的价值大于原始数据的价值(数据收集劳动所创造的价值)时,数据产品这项独立于原始数据的新的客体便诞生了,数据加工者进而取得数据产品上的权益。〔56.〕换言之,数据权益虽然表面上保护数据,但实质上保护的是数据劳动所创造的价值。〔57.〕但有所不同的是,就物的加工而言,原材料经加工后即成为加工物的一部分,此时仅有加工物一项客体,但是,原始数据经加工后并不灭失,此时并存原始数据以及数据产品两项客体。当然,由此也说明实质性加工并非“头秃问题”,其标准可以是确定的,即“通过加工新增的价值超过原材料的价值”,而加工新增的价值和原材料的价值都是可以通过会计予以衡量的。〔58.〕
关于数据加工参考添附规则,还应注意:第一,由于添附规则本身属于任意性规则,那么参照建立的数据加工规则就必须对当事人间的约定加以考虑,将其置于优先地位;〔59.〕第二,除当事人间的约定外法律规定亦处于优先地位,这就为法律上设立“合理使用制度”“强制许可制度”〔60.〕等对数据权益限制制度留下可能;第三,由于“充分发挥物的效用”只是在“没有约定或者约定不明确”以及“法律没有规定”的情形下确定添附物归属的原则之一,还需要考虑“保护无过错当事人”的原则,因而数据加工人对原始数据的持有是否合法,是否有權对其进行加工也是必须加以考虑的事项。附合以及混合制度亦对数据确权有一定借鉴价值。因为在数据处理活动中,一项新的数据产品的诞生往往并不限于对原有数据的加工,还包括新的数据的引入,此时其添附的价值就不限于加工所新增的价值,也包括捕获新数据的劳动所蕴含的价值。
另外,从数据二十条“保护经加工、分析等形成数据或数据衍生产品的经营权”的表述来看,数据产品包括衍生数据和数据衍生产品两类,两者在形态上完全独立于(原)数据资源,而且企业的劳动在两者成为独立的新数据权益客体过程中起到决定性作用。其中,衍生数据仍然属于数据形态,而数据衍生产品已经过产品化封装,以数据黑箱的形式整体上脱离了数据形态(虽然数据衍生产品仍可还原成为数据形态)。〔61+〕综上所述,本文将数据产品定义为,原始数据经实质性加工形成的衍生数据以及数据衍生产品,其属于数据资源。
三、数据集合和数据服务在数据权益客体体系中的定位
在讨论数据权益客体中的基本范畴时,还必须关注到数据集合和数据服务概念。其中,焦点在于厘清数据集合和数据服务是否属于数据产品,由此明确两者是否为数据权益客体。
(一)数据集合符合实质性加工要件时可以作为数据权益客体
数据集合是探讨数据权益客体时的一个常见术语,其中关键是厘清其与数据产品的关系。对数据集合主要有两种理解:其一,认为仅仅“汇聚”即可形成数据集合,例如全国信息技术标准化技术委员会的《信息技术大数据术语》和《信息技术大数据数据分类指南》将数据集界定为数据记录汇聚的数据形式。又如,有学者认为,数据产品包括汇集型数据产品以及演绎型数据产品,而汇集型数据产品是指网络运营商对于原始数据进行简单汇集加工形成的产品。〔62+〕其二,认为“汇聚+其他”方可形成数据集合,例如,上海数据交易所将数据集合界定为“数据资源经过加工处理后,形成有一定主题的、可满足用户模型化需求的数据集合”。采取类似做法的还有深圳数据交易所、山东数据交易有限公司、合肥数据要素流通平台等。还有学者认为,数据集合由数据元件汇集形成,而数据元件是指根据特定标准(如年龄、收入、学历等)对原始数据进行整理、提炼,同时剔除掉残缺数据、错误数据、冗余数据,对数据进行可信认证,检查数据的真实性、可信性和一致性,最终形成的数据标品。〔63+〕事实上,学界对数据集合和数据产品关系的理解与对数据权益客体分类的认识一脉相承。作“原始数据—数据产品”或者“数据资源—数据产品”分类的认识往往将数据集合纳入数据产品之中,作“原始数据—数据集合—数据产品”“原始数据—数据资源—数据产品”或者“数据资源—数据集合(数据元件)—数据产品”分类的认识则将“数据集合”排除出“数据产品”。
本文认为,两者既非属种关系亦非对立关系,而是交叉关系。从用语的本义来看,集合是指若干具有共同属性的事物的总体,数据集合因而是数据记录的汇聚形式。一方面,量的汇集本身并非加工,自然也不可能是实质性加工,这从数据安全法第3条将加工和传输分列为数据处理的不同类型即可看出。因此,如果原始数据仅仅被汇聚,并不改变其未经加工的性质,所形成的无非原始数据的集合,仍为原始数据这一概念所统摄。另一方面,虽然汇聚即可形成数据集合,但汇聚后再加工亦可改变其性质,即对数据集合的加工亦有可能达到实质性加工程度进而成为数据产品。例如上海数据交易所、深圳数据交易所、山东数据交易有限公司、合肥数据要素流通平台、广州数据交易所、贵阳大数据交易所、北京国际大数据交易所、西部数据交易中心、华东江苏大数据交易中心、苏州大数据交易所、郑州数据交易中心、西咸新区大数据交易所等均将数据集或者数据包作为数据产品中的一种。
结合各项标准、各数据交易所以及学界对数据集合的界定,本文认为,数据集合成为数据产品必须具备以下要件:一是数据清洗,必须经清洗而具有一定质量,此种一定质量具体指向机器可读取性;二是数据挑选,必须经挑选而具有一定主题。其中,数据清洗旨在满足数据的可用性要求,是数据资源预处理的第一步,也是保证后续处理结果准确、科学、有效的重要一环,还是数据去标识化和匿名化处理的前置步骤;数据质量的评价指标包括规范性、完整性、准确性、一致性、时效性、可访问性、可溯源性等。〔64,〕至于数据脱敏并非数据集合成为数据产品的必要条件。这是因为数据的有用性和数据的脱敏程度是成反比的,一味要求脱敏将会有损于对数据的利用。当然如若数据脱敏达到实质性加工程度,自然不妨碍其成为另一数据产品。应注意,机器可读取性和具有一定主题仅为数据集合成为数据产品的最低门槛。同时,考虑到数据集是“……的数据集合”极易引发循环定义的误解,故而本文以“具有一定规模量级”代之。由此,我们不妨将经实质性加工成为数据产品的数据集合称为“数据集”,将其界定为“原始数据经实质性加工形成的有一定主题的,具有机器可读取性和一定规模量级的数据的总称”。〔65,〕在此,特就主张数据集合与数据产品是并列关系的其中一个重要理由予以回应。
有观点认为, 数据集合纠纷涉及的是数据控制者与信息主体之间关于个人信息权益保护的维度,而在数据产品上技术的介入改变了原有数据本身的结构,原始数据中的人格属性不再,数据产品是独立于个人信息、公共数据之外的新型数据。〔66,〕简言之,区分数据集合与数据产品的学者大多认为,数据产品内容已经脱离个人信息。〔67,〕事实上,一方面数据集合未必一定源于个人信息,就如上文所举地质测绘数据并不是对个人信息的记录;另一方面,由于一味要求脱敏会有损于对数据的利用,所以数据产品同样可能包含个人信息,例如“淘宝诉美景案”中的“生意参谋”就包含个人信息,只是“最终呈现给消费者的数据内容已独立于网络用户信息、原始网络数据之外,是与网络用户信息、原始网络数据无直接对应关系的衍生数据”。〔68,〕而且,这一数据可用不可见的状态也非数据产品的常态,甚至有些数据产品的功能就是提供个人信息。〔69,〕
另外需要注意的是,持两者是并列关系观点的学者,对数据二十条所提出的数据资源持有权、数据加工使用权、数据产品经营权权益体系也进行了相应的改造。例如,有的学者认为,应在原始数据上设立数据资源持有权,在数据集合上设立数据控制权,在数据产品上设立产品经营权,其中数据控制权是数据三权外新设的权益。〔70,〕有的学者认为,应在数据资源上配置所有权以及持有权,在数据集合上配置数据加工使用权,在数据产品上配置所有权以及经营权。〔71,〕当然,也有学者未对数据二十条三权分置作出回应,而是认为作为数据源的个人信息的财产利益暂时只能通过人格权救济的方式消极实现,在数据集合上设立有限排他权,在数据产品上设立所有权。〔72,〕如前所述,将符合实质性加工的数据集合纳入数据产品,便可直接契合数据二十条提出的三权分置体系。因此,符合实质性加工的数据集合同时是数据产品,可以作为数据权益客体。〔73,〕
(二)数据服务不属于数据权益客体
数据服务也是谈及数据权益客体必须讨论的。在探讨数据服务前,我们可以先探讨何为服务。马克思认为,服务包括两种形式:一种是纯粹的服务,“它不采取实物的形式,不作为物而离开服务者独立存在,不作为价值组成部分加入某一商品”,“不留下任何可以捉摸的、同提供这些服务的人分开存在的结果”,〔74,〕这种服务在民法上被纳入“提供劳务合同”进行规范,例如运输合同、行纪合同等合同。另外,“某些服务,或者说,作为某些活动或劳动的结果的使用价值,体现为商品”,〔75,〕留下同提供这些服务的人分开存在的结果,这种服务在民法上被纳入“交付成果合同”进行规范,例如承揽合同以及建设工程合同。
那么数据服务究竟属于何种服务? 笔者所见既有规范、标准以及实践大多将数据服务界定为数据处理服务,以上海数据交易所为代表将数据服务界定为“为用户提供满足其特定信息需求的数据处理结果”的服务,二者虽然内涵相同,但本文认为上海数据交易所的界定更为契合数据服务的本质,亦即数据服务属于前文所述的“留下同提供这些服务的人分开存在的结果”的第二种服务。因此,本文将数据服务界定为向数据需方提供满足其特定信息需求的数据处理结果的服务。作此界定,正是因为数据服务虽然名为服务, 但数据服务合同本质并非如同大多数服务合同一样属于提供劳务合同,而是属于交付成果合同,其交付的成果正是数据处理结果。数据采集和预处理服务、数据建模、分析处理服务、数据可视化服务、数据挖掘服务、产品定制开发服务等数据服务均体现此点。如果混淆此种区别就会认为劳务合同与数据服务合同最为接近。〔76,〕此外,与作为交付成果合同的数据服务合同最相近似的其实应为承揽合同,因而可以依据民法典第467条规定的无名合同适用规则“参照适用”承揽合同的规定。也有可能“直接适用”承揽合同的规定,因为和买卖合同中转移标的物的所有权的主给付义务限定于所有权有所不同,承揽合同中交付工作成果的主给付义务并未限制工作成果的性质。
在明确数据服务的性质后,我们可以进一步讨论数据服务是否属于数据产品,是否可以被纳入数据权益客体体系。考察实践后大致存在三类做法:第一,将数据服务纳入数据产品中,例如北京国际大数据交易所、上海数据交易所、华东江苏大数据交易中心、苏州大数据交易所、西咸新区大数据交易所;第二,区别数据产品以及数据服务,但统一将其称为数据产品和服务,作为一类交易标的,例如贵阳大数据交易所、浙江大数据交易所;第三,区别数据产品以及数据服务,且将其作为不同交易标的,例如北方大数据交易中心、广州数据交易所、深圳数据交易所、福建大数据交易所、郑州数据交易中心。本文认同第三种做法,理由如下:
第一,数据服务概念无法纳入数据产品之中。如上所述,我们将数据产品界定为原始数据经实质性加工形成的衍生数据或者数据衍生产品,将数据服务界定为向数据需方提供满足其特定信息需求的数据处理结果的服务。虽然数据处理结果有可能归入数据产品概念,但是,提供数据处理结果的服务行为显然不适宜再被归入产品概念。有观点认为,数据产品和数据服务难以区分,其以数据定制业务为例,认为“在数据定制业务中,数据提供方根据客户的需要为其量身定制采集方案并采集加工数据形成数据模型提供给客户,此时,数据提供方提供的是产品还是服务就很难简单断定”。〔77,〕但如前所述,提供的数据模型本身属于数据产品,提供数据模型这一数据产品的行为却应当属于数据服务。之所以产生这一认识,或许是因为将数据服务合同定性为提供劳务合同,而非交付成果合同。而且,区分数据产品和数据服务的做法亦有实践基础, 比较法上关于提供数字内容和数字服务的合同特定方面的指令、关于货物买卖的合同特定方面的指令、德国民法典也都区分了提供数字内容的合同和提供数字服务的合同。〔78,〕第二,区分数据产品和数据服务是建构不同规則的基础。如上所述纯粹的服务由提供劳务合同加以调整,其他服务则由交付成果合同加以调整,但与产品有关的合同则应由交付财产合同加以调整,例如买卖合同等合同。第三,如果认为数据服务属于数据产品,那么数据服务上就可以存在数据产品经营权。对数据产品经营权大致存在经营资格权、〔79,〕数据处理者的处分权、〔80,〕数据处理者的用益权、〔81,〕被数据处理者授权的人继续处理数据产品的权利〔82,〕等理解,但除非将数据产品经营权理解为经营资格权,否则无法解释如何处分、用益或者继续处理数据服务这一行为。然而,一般认为数据二十条中的数据产品经营权系借鉴土地经营权而来,明显并非经营资格权。因此,数据服务上显然不应该存在数据产品经营权,也再次验证了数据服务不应归于数据产品之列。
四、数据价值链条延伸———数据商品与数据资产的内涵
数据商品和数据资产的形成本身并不经过劳动,因而并非数据权益客体。但是,由于其作为数据价值链条的延伸,对于数据价值释放具有重要意义,也容易与数据产品等概念混淆,故而于此展开论述。
(一)数据商品的内涵
对数据商品内涵的界定较为鲜见,更常见的是对其外延的界定。而在对数据商品外延的界定中最大的问题是数据产品和数据商品的关系为何?我们考察既有实践发现存在以下做法:其一,直接以数据产品作为数据商品,例如北京国际大数据交易所、上海数据交易所、西部数据交易中心、华东江苏大数据交易中心、苏州大数据交易所、山东数据交易有限公司、北部湾大数据交易中心、西咸新区大数据交易所等数据交易所;其二,数据产品只是数据商品中的一种,例如贵阳大数据交易所、广州数据交易所、深圳数据交易所、浙江大数据交易中心、福建大数据交易所、郑州数据交易中心等数据交易所。
马克思主义政治经济学将商品界定为“用来交换的、能满足人的某种需要的劳动产品”,对数据商品的界定也应符合此种逻辑。遵循此种逻辑,本文认为数据产品并不同于数据商品。理由如下:第一,基于数据商品本身并不创造价值,仅仅释放价值,因此,在劳动赋权理论之下,数据商品并非数据权益客体。商品交换本身并不创造价值,其所交换的价值是在物质资料生产劳动中被创造出来的。诚如马克思所言“在商品的交换关系或交换价值中表现出来的共同东西,也就是商品的价值”,而商品价值“只是无差别的人类劳动的单纯凝结”。〔83.〕第二,并非所有数据产品都是数据商品。如果数据产品“并不用来交换”,那么此时其虽是劳动产品,但是并非数据商品。同时,有的数据产品存在禁止交易情形,虽然此种禁止交易情形并不改变其数据产品(原始数据经实质性加工形成的衍生数据以及数据衍生产品)的性质,但是由于其不能用来交换,所以不能成为数据商品。第三,数据商品并不限于数据产品。具体而言:其一,如上所述,虽然数据产品是原始数据经实质性加工的劳动产物,但原始数据亦是经捕获劳动的产物,所以原始数据同样可以成为数据商品。只是数据二十条要求“审慎对待原始数据的流转交易行为”,从“用来交换”的角度对原始数据成为数据商品作出了限制。其二,根据前文对数据服务的分析可以得知,数据服务不是数据产品。但是,数据服务同样可以成为数据商品,因为正如马克思所言,“服务这个词,一般地说,不过是指这种劳动所提供的特殊使用价值,就像其他一切商品也提供自己的特殊使用价值一样”,而“这种劳动的特殊使用价值在这里取得了‘服务这个特殊名称,是因为劳动不是作为物,而是作为活动提供服务的”。〔84.〕至此,我们可将数据商品界定为,用来交换的、能满足人的某种需要的数据资源以及数据服务。
(二)数据资产的内涵
对于数据资产,值得注意的是所见标准以及规范都将数据资产界定为“……的资源”。〔85.〕本文认为,可直接援引中国资产评估协会出台的《数据资产评估指导意见》第2条的规定,将数据资产界定为“特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资源”。理由在于:第一,资产这一概念从财政部出台的《企业会计准则———基本准则》第20条来看,是“企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源”。而这一准则是企业会计准则体系的基础,是现存42项具体准则及其应用指南和16项解释等的制定依据,故而重新界定资产这一概念成本极大。第二,诚然先前对于数据资产可否融入现行核算体系存在争议,〔86.〕但是财政部出台的《企业数据资源相关会计处理暂行规定》已经明确企业数据资源适用于现行企业会计准则,不改变现行准则的会计确认计量要求。〔87.〕在此时修改对资产的界定显然并不恰当。第三,财政部对数据资源亦采广义理解,其所理解的“数据资源”涵盖原始数据、初级产品以及高级产品等层次。因此,如果认为数据资源和数据产品属于矛盾关系或者对立关系,也会导致数据产品从概念上无法纳入数据资产之中。
对其理解还应当注意以下四点:第一,依据《数据资产评估指导意见》第3条,数据资产评估“对评估基准日特定目的下的数据资产价值进行评定和估算”,由此可知数据资产评估并不创造价值,其只是发现数据资产的价值。因而,与数据商品相同的是,數据资产同样并非数据权益客体。第二,符合资产定义未必一定能够列入资产负债表,资产入表需要同时满足《企业会计准则———基本准则》第22条规定的“符合资产定义”以及“符合资产确认条件”两个条件,《企业数据资源相关会计处理暂行规定》亦是重申此点。故而,应当区分数据资产与入表数据资产。本文认为,可以将入表数据资产界定为符合资产的定义和确认条件的,应当列入资产负债表的数据资产。第三,虽然如此一来数据资产似乎仅为一项会计概念,但由于《企业会计准则———基本准则》第22条规定“资产是指……由企业拥有或者控制的……资源” ,也规定“由企业拥有或者控制,是指企业享有某项资源的所有权,或者虽然不享有某项资源的所有权,但该资源能被企业所控制”,所以,数据资产从本质上来讲是产权的概念,如何将产权概念与会计核算中对于数据资源的“拥有或控制”进行对应,的确也是企业需要充分考虑的问题。第四,应当注意区分数据资产以及数字资产两个概念。加密科技和区块链技术是数字资产概念的核心,没有使用加密科技或区块链科技的资产被排除在数字资产范畴之外,没有在任何区块链系统上注册的数字藏品本质上并非数字资产。从数据资产和数字资产现有的概念表述来看,二者区别在于:其一,数字资产通常基于区块链技术,而数据资产通常不依赖于特定的技术框架;其二,数据资产关注的是,是否符合《企业会计准则———基本准则》所界定的资产确认条件,而数字资产这个概念更加强调区块链等数字技术;其三,数据资产的价值往往来自其数据本身的质量和应用价值,而数字资产的价值往往来自市场。
结语
关于数据权益保护,无论是否支持数据确权,都需要首先识别数据权益客体。尤其是在支持数据确权的场合,只有明定客体方有可能确定此种客体之上存在的多元主体及利益格局,及其权能效力差别。〔887〕本文以《数据二十条》《数据安全法》为基准,考察既有理论,结合相应实践,对“数据”“数据资源”“数据产品”“数据集合”“数据服务”“数据商品”“数据资产"等基本范畴进行了全面梳理,以期构建起一套契合《数据二十条》精神,凝聚理论以及实践共识的术语体系,进而助力数据分类分级制度、数据产权结构性分置落地实施。
本文系为国家社会科学基金一般项目“企业数据确权和流转中的登记问题研究”(项目批准号:23BFX075)和国家社会科学基金重大项目“当代中国数字法学基本范畴体系研究”的阶段性研究成果。感谢禹政远、郭轩扬、张旸等同学的贡献与协助,但文责自负。
分配视角下的数据利用规则再造
袁曾
内容摘要:数据是人类生产力跨越式提升后最为重要的战略资源,如何高效利用数据是为社会创造财富并稳步提升综合国力的重中之重。在第三次分配进程中,数据利用规则与收益分配关乎着分配的公平与效率,而当前数据利用规则仍以准确区分数据权属为基点,数据难以从资源有效转为资本。无法解决数据收益分配中的原则问题,成为掣肘数字经济发展的关键难题。为有效解决现实问题以匹配发展要求,有必要针对数据要素的特征重塑数据利用规则调整方向,以数据规模化利用为规制标准,构建鼓励全民利用的价值开发模式,科学设置法定数据收益再分配机制。顺应经济社会数字化转型发展实际,积极推动数据要素供给侧调整优化,发挥数据财富效应的最大价值。
关键词:数据确权 数据权属 共同富裕 数据二十条 生成式人工智能 第三次分配
中图分类号:DF51 文献标识码:A 文章编号:1674-4039-(2024)01-0038-46
治国之道,富民为始。数据是人类生产力水平跨越式提升后最重要的战略资源之一,如何有效利用好数据为社会创造财富并稳步增强综合国力是法学研究的重要方向。我国是数据资源丰富的大国,具有显著的数据规模化优势与丰富的数据场景应用优势,当前学界对于数据确权、交易、使用等形成了一批富有远见的阶段性学术成果,〔1"〕特别是在2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称数据二十条),明确提出“充分实现数据要素价值、促进全体人民共享数字经济发展红利,为深化创新驱动、推动高质量发展、推进国家治理体系和治理能力现代化提供有力支撑”,从战略高度对数据的利用目标导向作了高屋建瓴的总体要求。但是,当前学术研究的领域集中于部分概念性理念的构造,在一定程度上忽视了建构数据整体利用规则体系的应用要素与应然面向,导致数据交易、数据收益等涉及财产权益的数据流转不畅,无法有效发挥数据在国民经济发展中的现有定位及其基础性作用。如何有效发挥数据在初次分配、再次分配后的第三次分配中的作用,是当前数据规则体系再构造的应有之义。
一、第三次分配与数据利用的关系
当前我国初次、再次分配中资源配给不平衡状况凸显,调查显示,我国在进入中等收入发展阶段后已经呈现出贫富差距拉大的现实。收入分配是经济社会发展的重大问题,关系人民群众切身利益,关系改革发展稳定大局。习近平总书记在党的二十大报告中指出,“扎实推进共同富裕,完善分配制度,构建初次分配、再分配、第三次分配协调配套的制度体系”。精确指明了在全面建设社会主义现代化国家新征程中迈向共同富裕的目标任务、改革举措和政策取向。〔2"〕数据资源挖掘及其资本化的要素扩展可以极大丰富第三次分配的财力来源,数据利用规则体系的构建应充分考虑分配制度的深化改革并与之科学匹配。
(一)第三次分配的概念及其扩张
第三次分配是政治经济学上关于分配制度的概念,最早由厉以宁在1994年提出,他认为社会主义市场经济条件下的收入分配应当包括三个层次维度:第一次分配是由市场按照效率原则进行的分配,例如企业主通过生产获得大额利润,再向劳动者发放工资,按照劳动效率进行初次分配;第二次分配是由政府主导,按照兼顾效率和公平、侧重公平的原则,通过税收、社会保障等财政收支等进行的再次分配;在初次分配和二次分配后,社会发展方面依然存在不平衡,就需要在道德的作用下,通过资源捐赠转移财富进行第三次分配。〔3"〕传统理论上,对第三次分配的功能定位是通过个人、企业捐献等形式实现财富转移,以调节对初次、再次分配不足的空白,将第三次分配与慈善事业、产业等紧密结合在一起。〔4"〕第三次分配是我国本土概念及生发的理论,国外无明确提法,但有与之相似的第三部门(the"Third.Sector)提法,指非营利机构、合作与互助组织、社会企业和私人合作等概念,该部门的特点分为三个方面:一是私有的,二是服务于公共目的,三是自由选择而不受强迫。第三部门是分配制度中的重要参与主体,基于资源配置由社会自发形成。〔5.〕
第三次工业革命后社会财富大幅增加,受到道德调节的资源分配更为显著,影响资源配置的要素更为丰富,人类原生的道德、观念、习惯、文化乃至制度成为影响分配的重要动因,即非特定主体间的具有共享互助特征的资源配置活动均可以被纳入第三次分配的范畴。〔6.〕理论概念应当结合实践的发展不断修正,在对第三次分配的概念解释与价值取向上,应当结合生产力与生产关系的发展作进一步的扩大适用,而非仅限于单纯的慈善捐赠。〔7.〕《學习时报》在2020年1月刊载的《第三次分配:内涵、特点及政策体系》中就曾提出,第三次分配并非在时序上一定要发生在初次分配、二次分配之后,实践中三者可以互相交错,第三次分配也可以与初次分配、二次分配同时发生。〔88〕《国民经济和社会发展第十四个五年规划和二○三五年远景目标纲要》明确提出了“全体人民共同富裕取得更为明显的实质性进展”的远景目标,并指出“加大税收、社会保障、转移支付等调节力度和精准性,发挥慈善等第三次分配作用,改善收入和财富分配格局”,将第三次分配所涵盖的形式以“等”的方式加以扩张。即第三次分配对于财富的转移并不仅仅包括慈善捐赠这一种形式,而是将初次、再次分配以外的所有调节资源分配的手段与方式均囊括其中。第三次分配体现的是企业与个人在道德等因素的驱使下,让渡自身部分财富与权益予其他主体,以弥补收入和财富分配的不公。〔9"〕
(二)数据收益分配是第三次分配中的重要财力来源
理论上分析,初次分配注重效率,再次分配主要注重公平,但从改革开放以来的实际状况分析,我国初次收入分配中的城乡差距、地区差距、行业差距不断拉大,以财政转移支付为主的再次分配虽有效发挥了公平的定位作用,但从我国居民实际可支配收入的组成部分看,再次分配所带来的转移性收入比例很小。就当前以慈善捐赠为主要收入调节方式的第三次分配而言,面临着诸多现实问题。一是资金池总额不大。根据《慈善蓝皮书:中国慈善发展报告(2020)》的数据,2019年我国捐赠总规模为3374亿元,仅为美国同期的十分之一。二是参与分配的主体以企业为主,占比超过六成,个人捐赠的比例低。三是未能开征遗产税等新增税种,第三次分配的开展缺少稳定的资金来源。从西方关于分配制度的经验分析,其富人群体的捐赠意愿与慈善社会风尚的形成与同财产挂钩的综合税制等调节机制密不可分。〔10"〕对于缩小我国居民收入差距而言,需要建立更为广泛充分的收入来源与高效完善的第三次分配制度规则。〔11"〕数据作为新型的战略性资源,承载了数字社会建设必需的底层要素价值与基础信息脉络,天然具备财产属性。〔12"〕因此,需要对其利用与收益的规则加以明确,并按照一定的制度设计与价值取向明确其收益的分配机制,使得社会可以分享数据带来的财富。从此维度分析,数据收益分配应当及时纳入第三次分配考量下的机制构建,按照第三次分配所体现的全民共享共用互助的特征并结合数据技术与产业的特点规律,设计相应数据利用收益制度及其细化规则。数据二十条明确提出“建立体现效率、促进公平的数据要素收益分配制度”,同时要求“完善数据要素市场化配置机制,扩大数据要素市场化配置范围和按价值贡献参与分配渠道。完善数据要素收益的再分配调节机制,让全体人民更好共享数字经济发展成果”。
当前,將数据收益与分配制度纳入第三次分配的总体框架之下并按照共享共用的主要导向建构数据利用规则体系,〔13"〕具备极强的现实可行性,主要体现在以下几个方面。一是我国数据规模优势明显,数据利用市场体系初步建立。据国际数据公司评估报告显示,我国数据规模预计将在2026年增长至56.16ZB,具备较好的数据基础优势。〔14/〕中国互联网络信息中心数据显示,截至2020年年底,中国网民规模达到9.89亿,手机网民规模占比高达99.7%,数据应用优势明显。二是移动互联网等完善数字基础设施支撑下的数字社会发展雏形已经形成,但相应数据收益过分集中于互联网平台企业,民众对于数据治理体系与治理能力现代化的诉求日益高涨。〔15/〕中国信息通信研究院2023年8月发布的《中国数字经济产业发展报告(2023)》显示,我国数字经济占GDP比重已超过四成,若将数据收益有效转化为财富,将有效拓展第三次分配的财力来源途径。但现实是,财富在数字经济领域的贫富差距更为明显,数据资源不断集中,越来越少的互联网平台企业拥有越来越多的数据资源,而广大居民在生产、使用互联网应用过程中产生的数据并无法转化为现实收益,使得社会舆论压力不断增大。按照何种导向进行规则设定以使数据财富为全社会共用共享,已经成为理论与实践热点问题。三是数字化转型是解决国家发展中重大问题的战略抓手,诸如人口结构老龄化、土地财政难以为继等实际问题,均需以数字技术的深度应用、提高社会生产效率作为牵引。当前关系国计民生的重大问题解决,亟须借鉴、完善相关理论,将第三次分配的资源做大,鼓励相关主体妥善处理好手中的数据资源及其收益,将数据资源优势、数据质量优势逐步转化为数据收益与利用的优势,加强第三次分配在共同富裕中的重要作用。〔16#〕
(三)激活数据财富要素功能的制度供给短缺
数据二十条明确要求,“充分实现数据要素价值、促进全体人民共享数字经济发展红利”,国家政策的战略定位与第三次分配的制度要求高度契合,第三次分配的目的在于弥补初次、再次分配对于资源调节的不足,通过规则设计有效拓展资源富集主体向资源贫瘠主体转移分配的意愿,实现社会财富的共享共助共用。在数据发展与利用的路径上,数据二十条强调,要形成“依法规范、共同参与、各取所需、共享红利”的发展模式,通过结合数据自身与数据产业的特点,通过数据要素收益分配体制机制的建构,实现对公共利益与相对弱势群体的保护。〔17#〕数据收益分配并不仅涉及收益分配此后置单一环节,而是涉及数据利用的模式、数据主体参与的方式、数据收益获取的范围等基础性的系统性规制设计。但最重要的是按照何种模式进行分配导向,从分配的目标朝向反向厘定前述各类数据利用的基础元规则与细化内容,以期通过整合数据财富要素进一步缩小不同群体间的收入差距,大幅增加分配收入来源。
但当前有关数据利用的立法导向与具体法律框架并不明晰,系统性的法律建构缺位与社会结构急切变化产生的重大需求之间存在巨大空白。〔18#〕民法典仅在第127条中作了“法律对数据、网络虚拟财产的保护有规定的,依照其规定”这一原则性表述。数据安全法第19条规定,“国家建立健全数据交易管理制度,规范数据交易行为,培育数据交易市场”。除部分政策性文件外,现有法律法规仅在原则上对数据相关制度加以规定, 但究竟应当如何按照客观规律做好数据收益分配以实现社会目标,尚待立法者予以完善。制度供给的缺位导致我国数据利用现状存在较大问题,数据财富要素价值无法有效发挥,产生了接续性的现实社会问题。例如,互联网平台企业将数据作为私有资产,私人资本主动追求利益最大化而忽视了个人用户等数据来源者的权益,导致平台企业垄断化发展而个人用户并未从数据利用上分得收入。〔19#〕再如,自媒体平台为“引流”,在客观上鼓励与放任创作者制作各类糟粕视频、文字、图片内容从而巩固与扩大市场占有率,导致“金钱至上”“流量至上”等价值观在网络盛行,缺位的引导标准极有可能造成民众特别是青少年对于正确获得财富的价值观崩塌,不仅不会主动参与第三次分配,反而在“信息茧房”中狂热追逐极端利己的消费主义思维。
二、当前数据利用规则的主要弊端
在第三次分配的导向下,结合数字技术与行业发展规律,〔20#〕有关数据利用的制度建设应当按照有利于分配收益的规则体系构建,以适宜于数据要素价值最大化与全体人民共享数字经济发展红利。但是,现有数据利用规则的构建与理论研究方向尚无法实现将数据财富效应最大化,主要存在如下几个弊端。
(一)当前利用规则以准确区分数据权属为基点
当前法学界关于数据利用存在两种代表性模式:一种是权属厘清模式,〔21#〕另一种是行为规制模式。〔22#〕
权属厘清模式是当前主流观点,该模式的拥趸者认为,数据可以获得收益的前提在于确定权属,通过权属的确定加以流通规则的限定,通过流通等方式产生收益,再将收益分配至权属主体。〔23#〕从数据商品化的角度分析,该学说的确存在较强的合理价值,亦符合一般商品的物权变动模式。但其最大的弊端在于试图厘清数据上存在或附加的各类权属,以清晰的形式(如“权利束”等模式)界定单一数据的权益归属。〔24#〕实践中,这种权属的判定方法极难实现,以当前常用的短视频平台为例,用户注册账户时即开始在程序中产生数据,但大量的数据在使用中产生,诸如用户浏览视频、点赞、关注、评论等。若单独将某个时刻的上述单独数据析出,首先是依据现有规制体系,很难从权属上判定这个数据属于平台还是用户(需注意与个人信息相区分)。〔25#〕其次,即使从保护消费者权益的角度确定该数据属于用户,也无法解决数据权益转化的问题,单独的数据或字节无任何数据利用上的意义。〔26#〕最后,从成本与收益的角度分析,若在使用中严格界定该少量样本的数据权益,对于数据平台企业而言无疑是课以极难实现的义务负担。若接到用户投诉或监管机关核查即需查明其数据库内任意时段的数据来源并确定其权属,对于数据平台企业而言是近乎不可能完成的任务。〔27#〕针对数据确权,数据二十条在“建立保障权益、合规使用的数据产权制度”专章中,提出了“探索数据产权结构性分置制度”,建立以公共数据、企业数据、个人数据为类型化的分级确权授权制度。但数据二十条并未体现该学说所倡导的数据“权利束”等理论,而是以类型化的形式尝试构建数据产权,并非严格区分某一数据上的权属模式。〔28#〕
行为规制模式的倡导者认为,数据权益的保护应采取间接模式,从主体合理使用数据的行为进行评价,放弃对于数据直接确权的模式。〔29#〕这种模式与当前司法实践中的判例较为契合。例如某案中,法院站在市场竞争、商业创新以及数据自由流通的角度阐明,原告享有的权益“并非可以获得像法定财产权那样的保护强度”,原告所主张的“应受保护的利益绝非一项绝对权利,其受到损害并不必然意味着应当得到法律救济”,以其在具体案情中的过错程度划定责任承担与侵权赔偿的依据,实现对用户权益的保护。〔30+〕但该模式的弊病在于对数据权益的保护采用被动触发的机制,无法将数据资源有效转化为数据财富,不利于收益分配目的的实现。
(二)数据资本化规则不明
2023年8月22日,财政部发布《企业数据资源相关会计处理暂行规定》,以规范企业数据资源相关会计处理,企业在编制资产负债表时,应当根据重要性原则并结合本企业的实际情况,分别在“存货”“无形资产”“开发支出”等项目下增设“数据资源”项目,以强化企业会计信息披露。这标志着在实践层面,数据正式迈向资源化,数据要素作为企业无形资产或存货进行会计处理,理顺了数字经济中的计量流程。〔31#〕但从规制引领实务发展的更高维度分析,数据资产化后如何实现资本化加以实现数据定价、交易、流转的功能,才是发挥数据财富效应的关键答案,遗憾的是当前研究暂无较优的理论回应。与此相对应的是,虽然我国数据资源规模总量已位居世界第二,但数据交易市场的规模并不符合我国的体量优势。〔32#〕根据公开数据显示,各地数据交易所数量不断扩容,但交易频次与量级差强人意,以S市数据交易所为例,目前累计挂牌数据产品仅1500个,而2023年8月单月数据交易额仅1亿元。就立法规则而论,当前数据利用规则体系最大的弊病在于仅有个别原则性规定,缺乏总的统筹元规则与细化可执行的系统性规则。不同来源的数据要素如何交易、按照何种标准对不同类的数据进行定价、违规交易应依照何种原则进行处罚,均无明确的规则操作指引。法律规制的落后直接导致数据归集、供给、登记、流通、维权等理论上的期冀无法落地实施,虽然已有“可用不可见、可控可计量”等创新性的数据应用原则与“数据信托”等利用模式创新,〔33"〕但现实是数据资产估值等基础性前置问题均无法解决。以数据消费为例与境外进行比较,美国在数据市场运作中采用数据经纪人的方式开展数据交易,通过经纪人收集数据消费者数据、分类归集整理数据文档,将所收集的数据确定定价的方法并用于销售,并与数据消费者达成协议支付利益。欧盟于2022年5月批准了数据治理法案(The"Data-Governance-Act,-DGA),亦创建了数据中介机构的数据消费模式,将数据中介作为数据共享服务的供应商,通过创设安全的环境以使数据消费者可以在其中共享数据,重点在于解决数据可用性、隐私保护与数据服务质量等突出问题。〔347〕参照国外已有经验并结合我国现实国情,数据有效利用并形成价值效应的基础在于明确可规模化适用的标准化体系,以解决数据交易责任、数据安全、使用与责任分配等扩大数据资本化利用的重大问题。应从整体上考虑如何建构数据利用规范体系,并考虑与我国现有法律法规有机衔接,以期用最小的法律调整成本获得最大的数据规模化利用效益,满足第三次分配的调整导向。
(三)无法解决收益分配的原则问题
针对数据收益与分配的问题,数据二十条第12条明确提出结合数据要素特征,优化分配结构,构建公平、高效、激励与规范相结合的数据价值分配机制,按照“谁投入、谁贡献、谁受益”的原则,保护数据要素各参与方的投入产出收益,依法依规维护数据资源资产权益。从数据要素“投入—贡献—受益”的模型逻辑出发,即需要明确数据相关主体间对于数据产生、挖掘、使用等环节的具体劳动贡献,就涉及将数据技术特点与数据收益相结合以判定数据价值来源的前置问题。〔35-〕以目前常用的打车软件为例,操作者使用打车平台程序预约出租汽车,自其下单时起即开始产生数据,根据目前操作者在注册平台账号时签署的常见格式化协议,基本均对操作者数据权益进行了让渡,在知会操作者平台会合理、安全地使用个人数据后,由企业拥有程序使用过程中产生的数据权益。但继续深入分析,仅在操作下单这一步,此时的数据主体至少又分为三类———操作者(贡献者)、出租车司机(贡献者)以及打车平台企业(投入者)的数据,并非仅有操作者端才产生数据。在此复杂的情况下,如何厘清具体的权益归属及其分配? 同时,数据二十条明确要求审慎对待原始数据的流转使用,若打车平台企业将此类数据归集脱敏再上市交易,按照当前通用的平台格式协议,由于收益权利在初始即被让渡,则操作者与出租车司机实际上作为数据的贡献者,却无法从平台企业的数据收益中获得任何实际意义上分红或提成等价值分配,其对于数据产生的劳动贡献并未得到识别与体现。现行政策与理论研究成果基本将数据划分为个人数据、企业数据与公共数据(政府数据)这三大类,但此三类数据在数据价值与使用价值产生的各环节中的激励机制、回报比例、收益分配模式等均需予以明確规定,通过合理的评级机制确保各类来源的数据权益主体利益获得充分保证,形成促进数字经济发展的正向循环。
三、数据利用规则再造的应然路径
在第三次分配演进的大背景下,如何结合数据要素复杂的权属混同于价值挖掘的现实特点,尽快明确高效、易用的数据利用规则体系架构以尽可能地释放数据财富效应,已成为当前立法研究与规制调整的理论重心。数据二十条明确指出,要探索有利于数据安全保护、有效利用、合规流通的产权制度和市场体系,完善数据要素市场体制机制,促进形成与数字生产力相适应的新型生产关系,特别是要“建立健全基于法律规定或合同约定流转数据相关财产性权益的机制”,为规制调整确定了宏观方向并预留了充足空间。在数据资源需要逐步转向资源化、资本化的现实需求下,结合收益分配的目标导向,确定数据如何用、权属如何定、收益如何分,是数据利用规则在当前形势下再造的应然科学路径。
(一)以数据规模化利用为规制标准
从共同富裕的角度分析,数据及其蕴含的财富要素充分符合充实完善第三次分配的规律特点与功能设计。〔36#〕其一,数据本身具有其独特的技术特点与价值特征,决定了其适宜规模化利用。〔37#〕现代意义上的数据在计算机出现后才产生,是指所有能输入计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。〔38#〕数据以字节为单位存储和处理,也是个人信息等实际内容的载体,但数据不同于个人信息等内容,单个或微量的数据并不具备强大的利用价值,仅有大样本的数据或者形成规模化以后,才具备经济学意义上的高度价值。例如,某个操作者在使用外卖平台单次点单时产生的数据无法完成“数据画像”等功能,但当众多操作者多次点单后形成的数據,可以极容易地产生某地消费者餐饮偏好、商家选择偏好等具备价值属性的样本意义。从此维度而言,小样本的数据价值属性不强,但数字生态链上的众多参与者形成的大样本数据就具有了高度的使用价值与交易价值。〔39#〕
其二,数据来源主体多元且权属界定复杂。〔40#〕数据二十条将涉数据主体分为数据来源者、持有者、使用者、加工者等,以期实现对于数据的分类分层利用。对于不同的数据主体根据其对数据形成的劳动评判相应贡献度符合实际的理论创设,但问题在于数据的产生与使用的过程极为复杂、烦琐,数据在不同的流转过程中亦会产生复杂的权属关系,而对于小样本的数据区分权属既不现实,也无必要。可以通过立法或软法等形式,确定数据权益规模化应用、规模化确权的格式条款,明确数据来源者、持有者、加工者等不同主体的集体权益,按照数据二十条中“投入—贡献—受益”的模型逻辑确定各种类型化权益与收益规则。前文所述之打车软件的操作者、出租车司机等均是数据的生产者或参与生产者,其数据权益在实际中并未激活。可以在收益分配导向的基本原则下,通过新的互联网协议文本明确其享有的类型化数据生产者权益,不再区分个别数据产生了多少收益,而是在明确其数据收益后再将权益整体让渡给数据持有者即打车软件平台公司,由平台公司脱敏后上市交易,取得收益后按照约定的适当比例将收益返还给数据生产者的账户,若操作者或出租车司机正常使用该平台的频次、数量变多,其产生的收益自然更多,避免数据利用陷入既无法实际确权、又无法流转获得收益的财富沉睡困局,同时尽量保证数据质量,尽可能减少在“数据入表”后企业通过数据造假的模式获得高估值或谋取不正当利益。
其三,数据规模化利用是未来数据产业的发展方向。根据马克思主义政治经济学理论,商品的价值与市场实际需求呈直接的正相关联系。〔41#〕数据能否产生或获得持续收益的最大前提在于是否有实际利用需求,若数据没有实际利用价值,则必然无法产生相应收益。就目前已经极为成熟的股票与期货交易市场而言, 其存在与发展的基础在于上市交易的公司与远期货物买卖合约存在真实的商业价值。2023年初,以ChatGPT等大语言模型为代表的生成式人工智能技术正式投入商用,其最大的技术特点在于利用大规模算力对于互联网全域范围内的样本进行计算, 产生了类似人类的理解与推理能力,代表了未来数字技术的发展方向。〔42#〕由于数据在数字时代必须以规模化的样本进行运算方能产生价值,过度追求理清小样本的权属关系与权利性质已无过多的意义,更应契合生产力发展的特点,以数据规模化利用的原则建构数据开放、共享、交换、交易等数据类型化确权与使用的相关标准化规则体系。
(二)确立全民利用的价值开发模式
数据需要转化为财富并且一定可以转化为财富,但是数据利用的开发模式应当符合数据技术及其产业的底层逻辑与发展规律。〔43#〕数据二十条提出推进非公共数据按市场化方式“共同使用、共享收益”的新模式,以此为激活数据要素价值创造和价值实现提供基础性制度保障,其提出的利用模式即明确的以共用共享为价值导向,符合数据价值开发的基本规律。
一是数据是唯一完全由人类活动创造的资源。不同于矿产、天然气等不可再生的天然资源,数据是在科技实现突破后才产生并不断扩大的可再生资源,虽然在形式上是形成于计算机系统上的字节,但其可以通过规模化的利用产生确定的重大效益并形成未来技术发展的能量底座。就定位而言,数据应当属于由国家加以调配、管理、规制的战略资源。
二是数据的产生并非凭空出现,任何数据的跨域流动与规模价值生成均需借助广泛的数字基础设施。〔44#〕数据虽然可由个人、企业等生成,但数据的产生与利用必须借助国家投资建设的电力网络、通讯网络等才可形成,数据的使用价值复用与市场化流通均需要公有市场的建立才能实现。〔45#〕就此维度而言,国家范围内产生的数据从生成时起即天然含有全民投资在内,从投资中收回部分收益符合经济规律。〔46#〕
三是数据的产生需要极其尊重个人与企业的劳动与投资,但需要在登记与利用等具体机制设计中明晰数据权益中全民权益所占的适当比重。法学研究必须结合社会实践并作出前瞻性判断,在人口结构逐步老龄化、新生人口逐步减少的社会形态调整的大背景下以及其关联伴生的房地产需求疲软、土地财政难以为继的现实需求下,高度重视技术对于未来生产关系的发展以及有效利用数据收益增加全民收入来源,是无法回避的现实选择。〔47#〕在区分公共数据、企业数据和个人数据的三维分类后,也需要明确企业数据、个人数据由于其利用国家基础设施的客观事实,科学合理地设计不同主体数据权益中的全民收益部分,以切实补充因人口规模缩减、自然资源减少引发的国家税收下降。例如,在数据登记交易时征收类似股票市场适用的印花税、登记费等。再如,可考虑适时组建国家数据主权基金,由各项数据利用活动中产生的全民收益部分作为基金原始资本来源,收益用于技术再投资以及定向补充养老基金、医保基金等全民支出,实现数据资源共用共享导向下的资本化转向,以规则治理创新为第三次分配的实现奠定坚实收入基础。
四是确定全民利用的数据治理模式有助于数据财富的传承。数据的利用除了首次转让产生的收益外,更重要的是如何从现有数据中不断挖掘、转化形成新的更大价值,在私人资本主导的数据收益规则下,其天然具有逐利的动因,无法从机制体制与发展基础上建构为全民所传承利用的数据权益体系,而私人资本亦不具备国家在抵御经济危机等大周期波动中的客观能力。
(三)法定的数据收益再分配机制
鉴于数据收益的共享共用导向与其作为未来全民收入的重要财源,对于数据收益的分配需要由明确的法律法规进行调整,确保数据收益模式按照“规模化利用—规模化收益—法定再分配”的机制进行,使得数据收益成为各类数据主体可以真正享有的真实权益。
一是数据收益应结合数据主体的风险负担予以考量。第三次分配是共同富裕中的重要制度性安排,但這种收益分配并不是“劫富济贫”,而是通过机制体制设计确保收益可以按照合理的导向进行恰当的流转以实现基本面的总体公平。〔48#〕在数据收益与再分配的具体设定上,应当考虑相关主体对于数据价值生成与转移过程中的收益与风险的具体配比, 扩大相关主体特别是投资主体对于数据收益的投入与再投入的积极性,考虑经济规律的客观存在与繁荣数据市场的现实需求,以法定规则形成鼓励规模化数据利用的多层次综合生态, 将数据收益分配融入国家治理体系与治理能力现代化的体系建构之中。〔49#〕
二是遵循税收法定原则,以稳定的营商环境与明确的税收预期深化收益再分配改革。世界银行发布的《中国优化营商环境的成功经验———改革驱动力与未来改革机遇》显示,得益于营商环境改革的推进,中国已经成为大型经济体中自2005年以来营商环境改善幅度最大的经济体。优良的营商环境得以吸引更多的投资,严格限定的税收规则将提供明确的收益回报预期并反哺营商环境的再优化。通过税收制度的规则修正,可以产生更为积极的收益再分配社会生态。〔50(〕例如,根据慈善法第80条的规定,企业“捐出”的财产可以直接抵扣企业所得税。〔51(〕在经济下行压力加大的前提下,我国的大额捐款依旧保持逐年增加的态势,既培育了企业与企业家承担社会责任的整体价值观,又从捐赠中直观减轻了财务压力,形成了积极的“盈利—捐赠—税收回报—投入—再盈利”的正向闭环。
三是收益应与权利主体的责任义务高度相关,在给予数据利用宽松法治环境的同时,设置与财产利益高度相关的惩罚性机制。数据二十条明确提出,需要“更好发挥政府在数据要素收益分配中的引导调节作用”,立法可以在收益再分配的明确规则下,设定与数据安全、数据质量等高度关联的惩戒措施,突出适用经济杠杆进行调节,确定清晰的违规红线,数据权利主体应享有相应的收益权利,但若在关键问题上主观违法违规即应受到严厉惩处,以确保数据利用过程中的健康市场环境营造。〔52(〕
本文系国家社科基金后期资助项目“人工智能的法律人格与未来发展研究”(项目批准号:22FFXB026)的阶段性研究成果。
分割数据产权的不适性———转向基于模块理论的数据持有权
马斌
内容摘要: 在数据经济时代, 释放数据价值的方式是利益相关者为共同目标而协作使用数据,并非分割数据的使用。因此,不可将数据二十条中涉数据产权内容理解为三权分置,这既不符合财产法原理也不符合数据价值创造和实现方式。就制度设计而言,应以模块原理构建数据产权制度。模块原理是标准化思维的产物,是一种利益相关者协同治理的产权形态,可为各利益相关者和整个数据生态系统创造价值,此为分割产权所不能及。数据持有权是模块结构的应用产物,因其制度设计旨在激励利益相关者治理数据从而生产出可交易数据,与数据价值创造和实现方式相契合。其中,可交易数据的流通是连接整个模块的核心,数据持有权利规范是整个模块治理的核心。
关键词:三权分置 数据持有权 数据生产者 利益相关者 模块结构 数据治理
中图分类号:DF529 文献标识码:A 文章编号:1674-4039-(2024)01-0047-57
引言
纵观我国学界关于数据产权的研究脉络,多数学者一直在援引分割产权的理论框架以架构数据产权,例如以权利束理论切分数据利益,以及“所有权—用益权”模式。中共中央、国务院2022年12月2日印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称数据二十条),多数学者直接将分割产权理论由幕后推向了前台,旗帜鲜明地主张数据产权三权分置。但值得一提的是,仍有少数学者反对数据产权三权分置。〔1%〕
事实上,在我国学者援引分割产权理论来架构数据产权的浪潮中,已然出现了如下问题:其一,什么是财产权?该问题也可等同于合同与产权的边界问题,体现为我国学界对数据使用权的界定。例如,有学者认为数据使用权并非数据财产权而是数据合同。〔2%〕其二,将财产权细分为众多利益束,导致缺乏法律预期的稳定性。〔3"〕其三,分割产权将会导致形同所有权,即权利人可对数据无限追溯支配,“三权分置”模式与“所有权—用益权”模式〔4"〕即为此举。
因此,我国既有数据财产权的研究可反映出两个核心问题。第一,虽然财产权概念是一个古老的话题,但我们仍对其缺乏完整性视角,盲目地套用20世纪20年代特定时期美国财产法主流财产理论(分割产权)和思想,却未关注到该理论所诞生的时代背景、当时的美国国情以及该理论后来的发展。〔5(〕权利束理论固然有其吸引力,但是其在最近20年来受到的批判表明,该理论亦存在着缺陷。第二,未能精准把握数据资源特性及其价值实现方式的特性。分割产权理论之于数据产权存在不适性,故有少数学者以模块理论去构建数据产权,〔6(〕也有学者以标准化思维去建构数据产权。〔7(〕事实上,国际社会正在探索的各种数据权利工具,如数据信托和数据空间,均突出利益相关者社区对数据的协同治理,是一种模块化思维,而这应当是我国数据产权架构的方向所在。
在数据产权立法的关键节点,如何科学地设计数据产权制度,不仅关乎我国数字经济的发展,也关乎对财产权的体系性认知,更关乎财产权对国家意识形态的影响。基于此,本文将以财产法制度为基座,以数据价值实现方式为轴,以阐述为何不能将数据产权制度引向三权分置,进而基于财产权的体系性、完整性视角去架构符合数据经济规律的数据持有权制度。
一、数据产权建构的前提:数据价值实现机制
笔者认为,若将数据产权理解为三权分置,则会扼杀数据价值。若欲清晰界定数据产权,首先应厘清数据价值流向。不同数据控制者掌握的数据经过聚合,形成功能用途不同的数据集和数据库,这才是数据经济最基础的原材料,也是数据价值的流向。因此,数据价值真正的流向路线乃从数据要素化(经治理可用的原始数据)过渡到数据产品化(可社会化利用的数据集)的过程。〔8(〕但值得一提的是,数据二十条中既有数据加工使用权,又有数据产品经营权,两者究竟存在什么关系便成为最大的困惑所在,同时也是学界将其理解为三权分置的关键所在。
首先,在我国既有研究中,数据产品的概念存在不同程度上的界定问题。在实践中,数据产品是“任何与数据相关的资产,从原始数据到模型、代码、API"密钥和指令,都可以组合形成数据产品”。〔9"〕有的产业界人士将数据产品等同于数据服务。〔10"〕值得一提的是,不同学科领域的学者以及相同学科领域的学者对数据产品的界定各有不同,要么界定为信息层,要么界定为知识层。例如,杭州互联网法院曾在某案审理中,将数据产品界定为(准)知识层。〔11"〕而数据产权所调整的应当为经过处理可以不断重用的原始数据(集)的流通利用秩序,而不包括数据算法模型等知识生产工具类数据产品与知识服务类数据产品。〔12#〕如果把数据资源转化为不同形态的可用数据或有价值数据的过程称为数据产品化,〔13#〕那么在流通利用过程中就会形成不断更迭的数据产品持有权(数据产品持有权只是为了区别于数据资源持有权),而数据加工使用则为中间过程。在笔者看来,不应为位于中间过程的数据加工使用阶段单独赋权,数据加工使用权并非独立存在的權利,而是依附于数据的权利,是合法的数据持有者加工使用数据和享用加工使用形成的数据集(数据产品)的权利。而当数据因“加工使用”转变为数据集时,数据资源持有权就演进为数据集(产品)持有权。数据集(产品)持有权是数据资源因加工使用形态变化的自然结果,是对数据加工使用的最好保护。
其次,当数据产品满足标准化、普适性或重用性的要求,并且数据产品的形态和价值固定且具有较长使用价值时,数据持有者可以长期向市场提供(交易)该产品,也可授权他人经销或分销数据产品(数据经纪人或数据运营商)。〔14#〕数据经纪人的数据产品经营权是基于持有者授权或让与,而不是基于加工使用劳动所取得。如此,数据持有者可持续地生产数据(产品),并通过授权运营来实现产品价值;而运营商则基于合法授权,按照授权协议经营数据产品,分享数据产品市场化利益。但值得注意的是,此非赋权,而是授权。授权只是在法律明确初始权利下,数据权利人的处分或权利行使问题,初始权利配置才是法律意义上的数据确权。因此,数据产品经营权不应当为独立存在的权利。
此外,三权分置之举乃源自农地制度改革,解决以身份为基础的家庭承包经营带来的规模化经营的特殊问题。〔15#〕在产权分置的框架下,所有权人必须放弃对资源的使用以为他人创设使用权或经营权,这严重背离了数据的属性。(同一)数据可供多主体(同时)利用与分享/流通。换言之,数据资源持有者当然享有加工使用权,也享有加工使用形成的各种数据产品(数据集)的经营权,同时,资源持有者亦可以授权他人加工使用并取得加工使用形成的数据产品经营权。
基于上述理由,不可将数据二十条中的数据产权理解为三权分置。事实上,数据二十条也并未将其设计为三权分置,因为除了三类权利之外,还有一个“等”字。此外,数据价值的流向也决定了不能将数据二十条中的数据产权理解为三权分置。近几年,境外(尤其是欧盟)发布的一系列关于“data+sharing”的研究报告均指向数据价值的流向,即每个社会主体既是数据提供者,同时也是数据使用者。〔16+〕欧盟随后于2022年在两部法案———数据治理法案和数据法案———中正式使用了Data+holde(r 数据提供者)及其Data#receiver(数据使用者)作为数据流通使用和服务关系的主体,并将data#sharing分为企业对消费者(B2C)的分享和企业与企业(B2B)之间的分享。
这种经济规律乃由data#sharing的演进而生。Data#sharing一直存在于社会活动中,包括企业在内的所有组织之间相互交换数据是一种普遍现象。组织之间的数据交换已有40多年历史,电子数据交换(EDI)即为此举。然而,EDI参与者之间的合作仅限于单纯的数据交换,数据的使用仅限于各利益相关者的内部目的。换言之,传统的data#sharing具有组织边界,数据的交换并未跨越组织边界。数据经济时代的到来改变了传统意义上的data#sharing。数据经济时代的data#sharing(数据分享/流通)指数据价值链上的利益相关者为共同目标而协作使用数据。〔17+〕基于此,国际社会才开始探索支撑该数据经济规律的数据权利工具,例如数据信托与数据空间。因此,数据价值流向并非呈单一的线性方向,换言之,数据需要开源,而非排他。数据二十条中的三类权利主体仅为数据市场中的典型参与者,系不完全列举,而数据二十条中的“等”字涵盖了其他数据经济活动主体,从而共同构成了数据产权主体。从数据科学的角度,数据二十条中所不完全列举的典型三类主体以及“等”字所涵盖的其他数据经济活动主体均为数据生产者。这是因为,沿着完整的数据价值链条推演,虽然会催生出一系列数据参与者角色,但除数据生产者(和数据展示者)之外,数据经济体系中的各层角色将经历边际收益递减的情况。〔18#〕从长远来看,数据经济的特点是参与者不限于数据经济堆栈的一个区域。例如,数据生产者可以是数据呈现者和平台所有者。这将使公司可以直接联系其客户,最大程度地降低成本,并更好地控制其渠道。〔19#〕因此,数据经济堆栈中的其他角色,均在扩展其数据经济体系,以成为数据生产者。
二、以模块原理构建数据产权制度
随着数据及其服务跨越组织和市场边界,传统组织形态的产权模式难以继任,因其天然的封闭性特征不能吸引外部主体加入。与之相反,权利束的财产形态则极端开放,不能形成相对确定的边界。模块结构位于两者之间,可治理数据资源的复杂性。
(一)财产法制度的演进方向:塑造财产的模块结构
纵观财产法简史,在法律层面只承认少数几类分割产权。换言之,分割产权是例外而非常态。分割产权理论均存在着天然的基因缺陷,即只注重经济效率而忽略了法律预期的稳定性,而这恰恰是法律层面上的财产权最根本的意义,也是数据产权建构的关键点。
第一,分割产权容易模糊财产权和合同之间的区别。事实上,分割产权理论多建立在合同之上,而产权只是价值残余的基线。正如科斯自己所承认的,“使用权清单集合的财产概念可以解释当涉及少量索赔人时如何通过合同解决冲突。但是,当人数过多时,这个概念除了要求政府监管外,无法解决协调问题”。〔20#〕卡梅框架同理。正如卡罗尔·罗斯所观察到的那样,驱动卡梅氏框架分析的起点是合同法,而不是财产法。〔21#〕因此,我国学界在援引各种分割产权理论去架构数据产权时,从一开始就有本末倒置之嫌,模糊了财产权和合同的边界。这体现为,虽然有诸多学者提出了数据使用权之概念,但有人认为数据使用权并非数据财产权;〔22#〕也有人认为数据使用权就是数据合同。〔23#〕其根源即在于对分割产权理论的认知混沌。
虽然法律现实主义所推崇的分割产权很好地反映了复杂关系碎片化之现象,但其在无意中瓦解了财产的边界,这也是我国学界就数据产权领域存在各说其词现象的根源所在。正如艾米丽·舍温所观察到的那样:“从霍菲尔德到科斯,很容易说出财产就是权利,而财产原有之意不复存在。”〔24#〕这一概念未能为区分财产权与其他任何权利提供任何连贯的理论依据,因而不仅模糊了财产一词的法律范畴,而且对法院界定财产权也没有实际指导意义。
第二,社会心理学家观察到,随着分割产权中越来越多的主体对某一客体或财产拥有权利,任一权利主体,对该客体本身和其他利益持有者的责任就越分散。〔25#〕尤其在数据财产权研究领域,若无视人与“物”之维度,则存在消解责任之危险。具体而言,分割产权理论框架未考虑到数据流通成本问题,尤其未考虑到义务人数量这一变量因素。数据流通是实时的,往往来不及解释数据流通法律关系中的“人—人”权利义务,因而“人—物”层面在数据产权设计中至关重要。这体现为,需要以一种标准化的方式分配权利和义务, 而这正是数据产权所真正解决的问题, 因为即使不通过立法明确承认数据产权,数据生产者也享有事实财产权,既能自己使用数据,也能许可他人使用数据。换言之,法律赋予财产权真正的意义在于,通过标准化的产权制度设计,明确不同场景下权利和义务的分配。在笔者看来,霍氏的权利束理论更像是法官裁判案件的推理公式,换言之,霍氏理论的生命力仅可服务于司法裁判这一政策目标,不可用于立法论,其很可能是时代背景的产物。因此,无论是权利束理论还是基于权利束理论演化而成的财产经济理论,均无法解决法律预期的稳定性,而这正是财产权创设的本质所在。
第三,分割数据产权建立在对资产和资产使用活动的评估过于简单化的假设之上。自从卡拉布雷西和梅拉米德的文章发表以来,我国法学者和经济学者就一直认为,交易成本高,责任规则更优越;交易成本低,财产规则更优越。〔26#〕例如,在论证数据产权时,多有学者直接将财产规则与责任规则视为数据权利规则的类型,即责任规则也有很大的适用空间,只要支付“法定价格”即可。〔27#〕但事实上,责任规则的适用空间极其有限,这涉及深层次原因———测量成本问题。
在交易成本为正的世界中,数据提供者以及数据使用者均控制着数据资产及其使用活动,并操纵这些信号,使之利于自己。在对数据资产的每个属性难以测量的情况下,与每个属性的使用有关的信号会恶化,因为数据交易双方(或多方)会从事战略行为;并且要测量的维度越多,信号就越有可能恶化。结果为,赔偿责任(数额)将被低估或过度补偿,或者以过高的成本实现测量的準确性。〔28#〕
财产法制度的一个核心功能是提供产权验证机制,保证有效的通知。〔29#〕在所有的产权验证规则中,占有是最原始和最普遍的。〔30#〕尽管还存在其他的验证方式,例如贴标签抑或登记,但贴标签方式徒增成本,后手需要为知晓标签意义而付出努力;而登记制度则尚在探索。〔31#〕反观“占有”,各种技术措施(如去中心化身份验证技术)可降低数据控制的验证成本,并可追溯。例如,在数据流通平台中,可设置标准化验证方式,例如提供是否合法生产的打钩项。倘若同时存在持有权、加工使用权以及产品经营权,则很有可能会创设除占有之外的验证机制以区分三种分割产权,徒增成本。并且在时间是关键因素的B2B数据分享场景下,如果不能及时验证产权,则会滞后于数据的自由流动。
综上,法律现实主义者将财产分解为最小的组成部分,并询问每一部分对相关行为者的激励效果。他们忽视了财产法的基本面向:财产法并没有以这种方式将权利原子化,而是朝着权利的块状结构演进。〔32+〕
(二)模块结构是一种利益相关者协同治理的产权形态
数据产权的模块结构是对权利束结构的积极扬弃,是对权利束的重构。模块结构在维持权利束相对性的前提下,克服了权利束的无限开放性,即不能任意切割权利。相反,权利总是不同程度地标准化,并受相对固定的形态约束。〔33#〕
权利的模块结构源于测量成本问题。史密斯教授认为,由于涉及测量成本的外部性,财产法制度需要提供一种标准化,以降低财产流通成本。〔34#〕控制第三方测量的外部成本的一个方法是强制产权标准化。标准化可以降低衡量权利属性的成本。〔35#〕限制产权形式的数量可使确权成本降低。〔36#〕模块结构即为一种标准化的产权形态。
事实上,既有财产权体系中,无论是有体物产权抑或无体物产权,均呈现出模块结构的财产权面向。〔37#〕财产权的模块结构实际上是以标准化思维去看待财产权谱系。财产权人面对不同的社会交往对象,享有的财产权样态各不相同,特别是在标准化程度上存在差异。〔38#〕具体而言,在相对于陌生人的社会关系中,数据持有者享有“一般财产权”,即不特定的第三人负担不得侵犯之抽象义务;在相对于交易第三人的社会关系中,数据提供者通常会对数据使用者施加数据使用条件、目的和范围之具体义务,这也通常为数据许可使用标准合同所涵盖。总之,无论财产权面对的社会关系范围多大,其总要以一种标准化的处理方式去解决权利人和义务人之间的关系。
模块结构的原理为,当一项资源的多个属性的互补性和相互依赖性很强时,模块是管理这种复杂系统的最佳方法。〔39#〕因此,如果无形资源的属性是高度互补的,且受制于交互性的、不确定的使用,就有理由将这些属性一并归入模块中,而不是为每一个属性创立更小的模块,亦即走向霍菲尔德的极端。因此,模块结构将排他权系统分解为多个中等规模的单位模块,即形成多个去中心化的排他权系统。而数据资源通常是高度互补的,往往需要聚合形成数据集/湖/池才能揭示其价值,因此数据产权亦在走向模块结构。
随着法律关系的复杂化(即义务人数量增多情形),需要更多的专业化,而模块结构可通过其在管理复杂性方面的作用支持专业化。法律工作者可以制定涉及法律内容的标准条款,而标准条款的使用者也不必考虑标准条款所涉及的场景。尤其是在涉及多方协作(如数据分享)的情况下,多方专业人士可提供标准的模块化解决方案。〔40,〕欧盟委员会支持的Data,Pitch计划通过寻找多方专业人士(包括技术、商业与法律)来促成数据分享实践,以解决特定的行业挑战。〔41,〕模块结构可以使专业人士专注于自己的业务,而无须处理合同的全部内容,使得各专业部分之间的交流更加顺畅。由此看出,技术的变革使得通过法律实现标准化的必要性将会有所减少,由市场提供的标准化的程度将会有所增加,因此既有的商业实践也在促成数据产权的模块结构。胡凌教授观察到数据产权中不仅存在要素产权,更需要架构产权。〔42,〕
除了法律标准化,产权的模块结构还需要市场标准化。为了克服数据外部性,或为实现更好地共享共用数据,产业上下游企业、相邻或相同产业之间开始建立数据生态圈,以此形成共享共用的数据生态。根据开放数据研究所的研究,数据生态系统的开放程度包括从封闭到共享再到开放。〔43,〕这样的数据生态就既包括单一组织生态,也包括通过技术(平台)松散联合的非组织化数据生态。其中,后者应是数据生态的主要形态。平台(架构产权)最大的作用是构建跨组织的数据治理。平台能够塑一个完整的数据生态系统。〔44,〕一个运作良好的数据生态系统必须将关键的利益相关者〔45,〕聚集在一起(而非分割),以解决数据治理的各种挑战,包括技术和非技术方面(如法律和伦理问题)。〔46#〕在这方面,数据平台会提供一系列的标准化机制,例如标准化的治理结构及标准条款。根据法经济学视角,这种标准条款以及标准化的法律治理结构也是财产权的一种形态,旨在促成模块结构。〔47#〕欧盟数据空间即为此举。由此观之,数据经济规律决定了数据产权的建构应当走向模块结构,而非其对立面———分割产权。
三、数据持有权制度:构筑利益相关者協同治理的权利块
从法学视角,数据产权的模块结构意指一种标准化的治理结构,类似于知识共享制度,能够以合规合伦理的方式分配权利与义务,最终实现各利益相关者协作使用数据而达成共同目标。而这需要从立法层面明晰各利益相关者享有何种权利和义务,以及如何建构这种标准化的治理结构。
(一)数据权利块的设计原理:激励利益相关者治理数据
虽然笔者一直沿用数据生产者权,易使人联想起欧盟的数据生产者权之提案,〔48#〕但笔者所述的数据生产者权并非像欧盟早先那样设计的排他性权利。在抽象概念上,数据持有权是数据生产者(持有者)权利的简称,乃为基于加工处理劳动而对不同形态的数据享有的使用权,可以定义为依法获取数据的持有者对合法取得和控制的数据享有的使用、分享/流通和收益的权利。因此,权利主体为数据价值链上的所有利益相关者主体。其中,使用和流通两个阶段具有特定的法律内涵,以下分而述之。
首先,数据生产者可自我使用,如加工处理、分析利用。此处的“使用”为对数据的生产性加工处理,是改进或创造价值的数据处理行为。〔49#〕因此,加工使用涵盖了从数据清洗、标注、完善、组合、集成,再到对数据进行剖析分析和挖掘分析等融合计算分析,最终形成知识或智能产品的一系列数据产品化行为,即数据二十条中的“加工使用”。这是承认数据是经过加工处理(使用)而成为生产要素,并在不断加工使用中实现价值的必然之果。
其次,数据生产者享有数据流通/分享的权利,流通则指将加工使用形成的数据产品提供给他人使用的行为。〔50#〕数据分享的是数据的使用,而非数据本身。数据属于边界和价值不固定的非标“产品”,分享是在特定人之间满足特定需求的“交易”,由两个方面组成:其一为特定范围的数据(数据集);其二为特定目的或用途的使用。“特定数据+特定使用”组合在一起构成了数据分享的标的。数据分享标的因主体而异,由交易双方谈判来确定(包括价格)。数据的每一次流通利用结束之后,数据范围都会发生变化。当数据资源持有者将数据提供给他人使用时,不管数据资源持有者采取让与数据(移转原始数据)还是许可使用(仅计算分析,获取结果)的方式,使用者均可以对数据进行加工使用。这意味着,数据使用者因加工使用会再次成为数据(产品)持有者,享有使用、流通和收益数据的权利。
再次,数据是在不断变换场景中不断流通利用而实现价值的。在该过程中,数据本身不断变换形态、呈现不同的价值,由原始数据的计算价值逐渐转变为工具、知识内容价值;由不断汇集利用不固定形态到形成固定形态与价值。基于此,数据持有权乃基于数据价值形成过程(不同数据形态)而分别确权,乃覆盖从数据资源到最终产品,如此可激励原始数据的流通和治理,以生产出更多的智能成果(如ChatGPT)。数据资源和最终的数据产品位于数据产品化的两端,数据持有权制度旨在保护数据产品化过程的劳动(加工处理行为)贡献。
最后,数据持有权建立在数据事实控制之上。数据分享标的依靠数据提供者对数据的描述,以及数据分享参与者对数据使用目的或方式的限定,而这些需要通过数据许可协议固定下来。法律只需要承认数据生产者对数据控制的合法状态即可,而不需要为其赋予法律上有名权利。〔51#〕基于数据事实控制的使用权与所有权的区别在于:由于数据的每一次流通利用,数据范围都会发生变化,其上的“产权”当然也随之变化。因而特定数据上不存在永久的、可公示的权利,以方便交易相对人识别和信赖。进入流通的数据集上的数据持有权,往往一次用尽,但可以不断创制新的数据集,而继续下一次流通。对于这样的非标产品,不可能基于传统的中心化公示原则,将权利与特定客体固定化,创制对世性的权利。对于数据而言,最适合的“公示”权利的方式,便是不断变化(去中心化)的事实控制。因而基于事实控制的使用权是适合数据的产权形式。
(二)数据持有进入法律概念的义务性规范
事实上,为数据赋权,本质为限权,因为数据生产者所享有的数据持有权乃基于事实,而非基于法律。故,法律介入数据产权旨在为数据事实控制披上一层合法的外衣,而境外的一些研究报告〔52#〕以及立法动态(尤指欧盟数据法案)〔53#〕也均指向数据事实控制,在制度设计上强调限权。
1.数据安全义务之于数据持有概念
数据安全概念在既有的法律法规当中, 含义是不同的。《信息安全技术个人信息安全规范》(GB/T#35273—2020)中将数据安全概念界定为保密性、完整性与可用性,侧重于数据静态属性。数据安全法中将数据安全界定为数据控制利用的安全, 侧重于国家战略顶层设计。而我国学界中虽有将数据控制与数据安全联系起来,但也侧重于数据静态属性,或言之,侧重于数据本身的安全。〔54#〕而若在数据持有权的语境下,数据安全应侧重于权益安全,或言之,侧重于数据使用的动态安全。如前所述,数据价值的实现在于数据的使用、分析,取决于数据处理者使用的算法、分析的目的,而不在于数据本身。这也是场景理论的题中之意。〔55#〕而数据的使用、流通会产生并扩大风险,导致数据之上所承载的利益相关者权益处于安全风险状态之下。〔56#〕
以车联网为例,车联网中存在多方隐私冲突问题,非用户的个人信息也有可能通过用户或服务提供者之间的互动而被透露或推断出来。〔57#〕在该示例中,由于数据的不断生产、使用、流通,导致很多个人的信息权益被侵犯。而知情同意原则在面对该问题时是失灵的。除此之外,数据安全还关涉公共利益以及国家安全,因此需要对数据进行分级分类。故,数据持有权语境下的数据安全则应致力于解决动态安全,保护利益相关者的权益。
其一,就私权益保护而言,为了破除知情同意原则的桎梏,基于我国学界研究现状,多有学者提出去标识化解决方案。〔58#〕除了去标识之外,数据生产者更应从产品设计之初就应做到合规。因此,在实践中,数据生产者在产品设计过程中就需要贯彻相关法律法规以及行业性标准的要求。例如,在车联网场景下,处理个人数据(尤其是在车辆外部进行处理的情况下)可能会给数据主体的权利和自由带来高风险,在这种情况下,所有数据处理者应进行个人数据保护影响评估,在推出新技术之前将风险分析的结果纳入设计过程。其二,就公共利益以及国家安全保护而言,盡管在我国整个法律层面,制定了关于数据安全和个人信息保护方面的法律,但是聚焦于具体行业(例如智能汽车行业),依然存在着一些配套的法律法规不健全的问题。智能网联汽车的法律监管涉及范围广、跨度大。
2.数据合规义务之于数据持有概念
数据持有法律概念对于数据持有者企业内部而言,是一个数据治理的过程。数据是高风险资产,防范数据法律风险是企业数据资产化运作的前提,也是数据合规的任务。实际上,数据合规是数据治理的核心。对于数据生产者企业内部而言,在数据整个生命周期内,从收集到删除或归档,均存在很大风险,需要确保合规管理。〔59%〕
合规管理本质上是企业制度和文化建设,要求企业将法律、行业准则甚至道德准则转化为企业各级各类员工的行为规范,并通过技术和管理手段监督实施,确保企业经营和运行符合法律规范和企业的价值观。〔60%〕数据分享的障碍不仅来自企业外部(即企业与企业之间的利益冲突),而且还来自企业内部。如果企业内部都缺失分享数据的文化,企业与企业之间分享数据更加渺茫。在一个企业组织内,每个部门存在部门利益,每个部门通常都设置为在自己的IT基础设施下管理自己的数据,并有自己的数据管理政策。这样,数字化推进过程没有考虑数据相互匹配和整合问题,部门之间或不同计算域之间分享数据的成本高昂甚至不可能。随着不同的组织部门使用不同的解决方案和不同的技术以自己的方式管理数据,数据不可避免地被推入孤岛,从而与其他系统越来越分离。这样的企业文化对于企业内部数据分享是绝对不利的。
3.对外提供数据义务之于数据持有概念
数据生产者在享受数据权益的同时, 更应当承担对外提供数据的义务以确保全社会主体均能获取数据访问权,从而促成数据开源文化。在国际社会,目前关于数据访问权的辩论主要是关于根据请求的数据访问权如何能够克服数据生产者对数据的技术锁定,而这才是真正意义上的数据访问权。基于此,数据访问权可分为一般性访问权以及行业性访问权。〔61%〕一般性访问权主要包括合同法上的数据访问权、竞争法上的数据访问权,以及通过专门立法的数据访问权(如欧盟数据法案)。而行业性数据访问权则是因各个行业而异,例如金融、汽车、医疗等行业。
真正意义上的数据访问权的功能是克服对数据的技术权力,而不要求限制市场权力,也不影响数据生产者与数据使用者之间的协议。在不考虑合同法和反垄断法的情况下,用于克服对数据的技术权力的数据访问权尤为重要。欧盟数据法案代表着此类数据访问权。欧盟数据法案在合同法的基础上,进一步明确了数据持有者提供数据的义务,并要求向用户实时、连续、免费地提供数据,对消费者、小微企业获取数据提供了保护。虽然欧盟数据法案进行了一系列的配套制度设计,以期促进数据分享,但适用上的模糊性并不一定会达成理想效果,这也为我国未来的制度探索提供一些裨益。
根据欧盟数据法案第8条第1款,〔62%〕很难确定数据持有者根据国家立法向数据使用者(接收者)提供数据的义务的确切范围。“向数据使用者提供数据”该术语的范围很广,足以涵盖未来立法对数据持有者可能施加的各种类型的义务。其次,该义务范围的模糊性导致公平性测试(第13条)〔63%〕适用的模糊性。由此产生的问题是,公平性测试如何适用于履行提供数据的强制性义务。第8条第2款〔64%〕提到的(数据持有者和数据使用者)协议,给人的印象是提供数据的义务是强制合同,但这与第8条第1款并不一致。换言之,第8条第1款表述为根据欧盟国家立法提供数据的法定义务,而第2款则将其视为合同;并且,除非在强制合同的背景下考虑,否则公平性测试很难适用于提供数据的法定义务。
除了上述的分类标准之外,还可根据是否跨数据类型与跨行业\部门对数据访问权进行区分。在比较法视野下,大多数法域都规定了类似于《通用数据保护条例》的数据访问权,即均规定了仅限于个人数据的跨部门/行业数据访问权。美国只规定了特定行业的数据保护,主要是医疗保健和银行业。与此形成鲜明对比的是,法国已经建立了意义深远的数据访问权制度,旨在适用于各部门/行业和数据类型。澳大利亚仅在银行部门保证了跨数据类型的数据访问权,但这将扩展到其他部门/行业。2019年8月1日,澳大利亚修订了消费者和竞争法,引入了消费者数据权(CDR),〔65/〕这是针对特定部门但跨数据类型监管的基础。〔66/〕CDR制度旨在为消费者提供对数据的广泛访问,并应导致(消费者)福利的增长。〔67/〕为了消费者福利的目的,CDR授予消费者数据可移植性的权利。〔68/〕该法案将三类参与者界定为“CDR消费者”,其中包括个人或小型企业。CDR消费者享有访问数据持有者(另一类参与者)所持有数据的权利,并指示与经认可的数据接收者(第三类参与者)分享数据。相反,《通用数据保护条例》第20条〔69/〕的目的主要是解决数据市场中与数据保护相关的市场失灵。〔70/〕CDR制度必须宣布适用于特定部门/行业,立法者需要在适用之前为该部门/行业制定具体的法规。因此,CDR制度可以被描述为立法者的横向指导方针,为某些部门/行业的具体监管提供方向。这种具体的监管目前只在银行部门实施,并正在为能源部门制定类似的条例,并将为电信部门制定类似的条例。〔71/〕
借鉴国外的立法经验,结合我国本土国情,在我国未来关于设计“对外提供数据”的法律制度中,是否应秉持“一般性访问权+行业性访问权”双管齐下的路径,还应深入探索。
(三)数据权利块的设计:分配权利义务
数据分享是数据生态中各利益相关者的利益“链接”,在动态的数据分享中明确各利益相关者的权利和义务成为数据生态治理的核心。
1.标准化思维的确权方式
数据权利的模块化源于系统的模块化,包含两个相互交叠的过程,设计者先将系统分解为一系列相对独立、具有特定功能的模块,再通过有意识设计和自发演化实现各模块的联系与统合。〔72/〕鲍德温和克拉克使用“整体设计规则”和“个别设计规则”来描述该过程,前者即各模块都必须遵循的强制性规则,后者即各模块特有的个性化规则(即场景化)。该原理之于数据持有权即为“整体设计规则”意指数据产权架构和普遍适用的一般规则;“个别设计规则” 即权利束式的产权设计, 数据产权因关系而异,不对其他权利模块产生影响的内部规则。
欧盟推出的数据空间战略即为遵循上述原理而设计。数据空间其实是一个数据治理系统,是在特定系统中与数据分享相关的一整套权利和法律规则。〔73/〕数据治理系统可分为通用数据治理系统和特定行业/领域数据治理系统。
因此,数据权利块的设计方法应取决于各利益相关者所欲达成的目标及其范围。不同程度的数据分享代表着利益相关者的不同范围以及在数据分享中面临的风险。在数据流通场景中,存在一对一许可、互为许可和一对多(众)许可,其中互为许可最为常见,治理难度也最大。〔747〕在一对一许可中,不需要标准化产权,因而只受合同法调整。在互为许可和一对多许可中,需要不同标准化程度的产权形态,具体视利益相关者范围以及它们所追求的共同目的而定。
2.促成模块结构之标准化治理结构的探索
正如欧盟数据法案出台之后遇到的解释和适用上的难题,究竟采取合同模式还是法定模式(标准化治理结构),很难通过一部统一的概括性立法阐述清楚。究其原因,数据权利在很大程度上是模块性的,因此合同模式难以涵盖之,这也是欧盟数据法案解释、适用存在困境的原因所在。吸取欧盟数据法案的教训,若促成数据产权的模块结构,还需要创设标准化的治理结构,整合所有的利益相关者,以在所有利益相关者之间公平地分配数据访问权(使用权),以促进大型企业和初创企业或中小型企业之间的数据流动。目前,国际社会正在探索数据信托、数据合作社、数据池、数据空间或B2G数据分享等多种标准化的治理结构,可实现数据的分级授权,促成数据权利块。
从法律角度,这种标准化的治理结构是一种实现利益相关者共同目标的机制。在最高层次上,这些目标为:(1)使数据得以分享;(2)平衡分配利益相关者各自的数据使用权利和义务,以及公共利益目的;(3)确保数据的使用符合道德規范,并符合标准化治理结构所制定的规则;(4)确保数据安全,并且当目标实现后,数据会得到适当的处理(如删除)。《数据信托:法律和治理考虑》〔757〕报告认为,在数据信托模式尚不成熟的情况下,基于目前既有的法律体系,优先推荐合同模式和辅之以合同模式的公司模式。如果分享数据的群体小,则可通过合同法律结构进行管理;如果分享数据的群体大,特别是如果他们的利益并不一致,那么公司模式为合适选择。因此,一种标准化的治理结构的建立可极大减少数据产权协商成本。
本文系第十届“新兴权利与法治中国”征文一等奖获奖作品。