数据分类分级确权对数据要素价值实现的影响
2024-02-28马费成熊思玥孙玉姣王文慧
马费成 熊思玥 孙玉姣 王文慧
(1.武汉大学信息管理学院,武汉,430072; 2.武汉大学信息资源研究中心,武汉,430072; 3.武汉大学大数据研究院,武汉,430072)
1 引言
数字化时代,数据的重要性日益凸显。2019年党的十九届四中全会正式把数据列为与土地、劳动力、资本、技术并列的重要新型生产要素。2020年,《关于构建更加完善的要素市场化配置体制机制的意见》明确提出“加快培育数据要素市场”的要求与任务[1]。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》着重指出要激活数据要素潜能[2]。这些政策不仅引领了我国数字经济发展的新方向,同时也提出了一系列需要研究的重要问题,其中数据要素价值实现成为社会各界关注的焦点。
数据要素在从最初数据形态到参与社会生产经营管理活动并发挥最大价值的过程中,经历了一系列的演进历程。学界普遍采用基于价值链的方法,以数据采集作为起点,通过数据组织、流通交易、利用等环节,最终完成数据价值实现过程[3]。这个递进过程揭示了数据要素价值创造的路径,将其分解为多个相互关联的环节,各环节都涉及不同场景的输入、输出和转换[4]。在这一过程中,许多因素如参与主体的多元性、数据的时变性和高重塑性等[5],使得数据的管理更为复杂,从而影响了数据要素的价值实现。从根本上说,这些因素的管理和协调都可以通过数据确权来实现。数据确权通过为不同的数据要素明确产权和使用权限,规范和简化了数据管理流程,进而提高了数据的可控性和可利用性。
然而,数据的特殊属性使数据确权变得复杂艰难。当前世界各国的法律都尚未完全明确数据的产权归属[6],关于如何实现数据确权仍争论不休。截至2022年底,《关于构建数据基础制度更好发挥数据要素作用的意见》(简称《数据二十条》)提出数据“资源持有权、加工使用权和产品经营权”分置式产权等制度设计思想[7],意在推动“三权分置”的中国特色数据产权制度的建设。在这一政策背景下,数据分类分级确权制度作为一种潜在的解决方案引起了广泛关注。这种机制不仅为建立数据产权制度提供了新的实践思路,还对数据要素价值的实现产生了深远的影响。从数据采集、数据组织到数据流通利用,数据分类分级确权机制的实施都将产生积极的推动作用。
因此,本文通过厘清数据确权相关概念,揭示建立产权体系以实现数据确权的困境,并基于数据价值链,深入研究数据分类分级确权机制对数据要素价值实现的影响。通过对这一议题的深入探讨,希望促进数据要素流通和释放数据价值,进而推动数字经济的可持续发展,同时,为引导数据要素市场高质量发展提供进一步思考。
2 数据确权理论辨析与实践进展
2.1 数据确权概念辨析
数据确权是对数据权内容、权属、权利体系和治理机制等作出明确规范的过程[8]。通过明确划定权利保护范围和行为自由的边界,为他人提供合理的行为预期,有助于确保法律体系的稳定[9],因此,深入研究数据确权显得尤为重要。学术界在数据确权相关元概念的使用方面存在一定的混淆,例如存在数据权、数据权利或数据产权等多种称谓。2010年卡梅伦提出“right to data”是公民在信息社会享有的基本权利。为了更清晰地划分数据权的内涵,肖冬梅等学者[10]将“数据权”分为“公权力”数据权力和“私权利”数据权利两个基础要素。随着“私权—经济范式”的跃迁,“数据产权”作为一种新的概念出现在讨论范围。数据产权是指从法律层面上确认数据权益人,赋予数据权益人排他性使用数据资源的权利[11]。由于数据产权将数据人格要素和数据财产利益统摄在“财产利益”或“经济利益”之中,且未超出私权范畴[12],因此,本研究使用数据产权作为数据确权的元概念。
数据产权具体承载哪些权利,目前也众说纷纭。按照物权体系,数据产权应该包括持有、利用、收益和处分四大权能[13]。参照民事权利,数据产权涵盖数据人格权和财产权[14],其中数据财产权包括所有权、使用权、收益权和转让权四类[15]。权利性质视角,数据产权被认为应该包括积极利用权力以及消极防御权利。其中,积极权利指访问、使用和许可权;消极权利为损害赔偿、恢复原状等[16]。按数据资源的功能方式,申卫星[17]提出数据产权主要包括数据控制权、数据开发权、数据许可权、数据转让权等。根据数据要素流通的不同环节,冯晓青[18]建议可以分别设定相应的数据权利,如数据访问权、数据用益权、数据公开权等。《深圳经济特区数据条例》[19]也特别明确规定了权利人依法对特定数据具有自主决定、控制、处理、收益、利益损害受偿的权利。
综上所述,数据确权相关概念尚未达成一致,这也反映出了数据确权的理论纷争,概念仍存在模糊性[20]。本研究认为,数据确权应该秉持“个人数据具有人格权属性”和“企业投入大量智力劳动形成的数据产品及服务享有财产性权益”的观点,根据数据来源和数据要素价值实现的具体环节,确定谁有权访问和使用数据、谁有权将数据进行交易或转让、谁有权从数据价值中获益。
2.2 数据产权体系建设
在数据确权领域,由于缺乏统一理论认识,建立产权体系以实现数据确权的方法面临诸多困境。一些研究采用单一产权的两分法,将数据产权划分为国家所有或私人所有,其中私人所有包括个人和企业。主张将数据产权归属于国家的观点认为数据具有公共性,应归全民所有,由国家代表人民参与分红[21]。而认为数据是企业投入创造和收集的成果的学者则主张以劳动对数据赋权[22]。然而,这一观点也常受到对个人隐私保护等问题的质疑。另一方面,有研究认为不存在固定的产权配置方案,例如Dosis等[23]根据数据的价值等特征进行分类赋权,对于价值相对较低的数据,可以将产权配置给个人;高价值数据的情形则将产权配置给企业。闫境华等学者[24]强调构建私人拥有源数据所有权、企业拥有数据生产要素用益权的二元权利结构,以保护私人信息人格权,优化数据资源配置。
然而,上述数据产权制度多基于二分法,但由于数据在不同场景和环节具有不同作用,单一标准难以进行统一确权。因此,学界和业界开始倾向于对数据产权进行场景化、类型化、多元化的细分和设计[25]。在这一趋势下,2021年国务院办公厅发布的《要素市场化配置综合改革试点总体方案》指出在保护个人隐私和确保数据安全的前提下,分级分类、分步有序推动部分领域数据流通应用[26]。《数据二十条》聚焦数据使用权流通,淡化甚至放弃所有权概念,创造性提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权结构性分置[27]。这一创新性的数据产权结构性分置重新定义了权益分配方式,引入“共同使用、共享收益”理念,为激活数据要素的价值创造和实现提供了基础性的制度保障,逐步形成了中国特色的数据产权制度体系。尽管如此,数据产权结构性分置在实践过程中仍然处于探索阶段,存在诸多不确定性,如不同类型数据的权利配置需求可能存在冲突[28],各数据相关方可能存在利益冲突等[29]。
因此,为了解决数据要素市场发展中“确权难”的问题,需要根据不同类型的数据采取差异化的策略,充分考虑在开发利用、共享流通和价值挖掘方面的不同模式[30]。建立数据分类分级确权机制成为至关重要的举措,为各类数据和交易过程提供明确的使用规范和权益归属,进一步解决数据产权的复杂性和碎片化,有序推进中国特色的数据产权制度建设。
2.3 数据分类分级确权制度
学界和业界尚未就确权形成一致共识,主要原因在于数据生态系统的复杂性和多样性。不同场景和层次下,数据可能呈现出不同的价值和意义,因而相关权属考虑也就不可避免地多种多样。采用数据分级分类确权的思路,通过对数据进行有序分类和分级,以确保在组织内获得适当的处理和使用权限。这一方法不再过于关注数据衍生的具体权利细节,而更专注于数据在何种程度上能够参与数字平台的生产活动[31]。
按照数据生成来源为标准,数据可分成公共数据、企业数据和个人信息数据三类。数据分类分级确权制度中的分级方式则尚未明确,其具体模式仍待进一步探讨。从市场化数据授权程度方面,戎珂[32]认为可以从“拒绝授权”到“完全授权”不等,划分不同的授权级别。另一方面,从数据的负外部性考虑数据的敏感程度、泄露风险、破坏后对个人权益、组织权益、公共利益、国家安全影响程度的不同,可以将数据分为低风险级、中高风险级以及高风险级[25],赋予数据相应的流通等级。此外,有学者提议在制定分级方式时,可结合数据的负外部性(敏感程度)和正外部性(数据流转可市场化授权程度)等特征[33]。
数据分类分级确权与数据产权结构性分置有着相似的目标,确定数据的权属,进而使数据的使用和共享更具有序性和透明性。但它们在侧重点和操作层次上存在一些明显的不同。产权分置强调在不同实体之间确立明确的权责关系,以防止因所有权不明确而引发纠纷和不当使用。这种方法更着眼于数据的外部关系,即各数据实体之间的权属关系。而数据分类分级确权通过对数据内部的多维度划分,实现对数据的差异化管理。这种方法更加注重数据内部的细化管理,为数据的精细管理提供支持,以适应不同的管理和使用需求。
基于数据分类分级确权的指导思想,目前各行业各地区已经进行了实践操作。以阿里健康为例,作为杭州市健康公共数据授权运营单位,借助浙江省首个通过省级验收的杭州授权运营平台,合法进行了健康领域的公共数据授权运营活动[34]。衡阳市也在这方面取得了重要进展,发布政务数据资源和智慧城市特许经营权的出让项目,成为全国首个公开交易公共数据特许经营权的政府案例[35]。此外,在个人用户知情且明确授权的情况下,贵阳大数据交易所完成了全国首笔个人数据合规流转交易[36]。可见,数据分类分级确权这一制度不仅在明确数据的权属问题方面发挥了关键作用,而且使数据得到了更细致入微的管理。
3 数据要素价值实现路径
数据要素流通市场实践中面临“确权难”等关键难题,阻碍了数据要素的价值形成和实现。数据价值链是描述数据要素价值形成和实现的手段之一。Miller等学者[37]首先提出数据价值链(the data value chain)的概念,来解释原始数据耦合形成数据产品的数据价值创造和实现的过程。学界对数据价值链的研究主要从生产过程和数据形态两种视角进行延伸。前者的相关研究中,刘涛等学者[38]借鉴加拿大统计局、美国BEA的研究将数据价值链划分为数据采集、数据清洗与存储、数据加工三个阶段。马费成等学者将数据要素的价值链划分为数据采集、数据组织、数据流通、数据利用四个环节,受到学界的广泛认可[3]。后者的研究视角下,黄丽华等学者[39]将数据价值链定义为数据从原始数据、数据资源到数据产品、数据资产的过程。相似的,李海舰等学者[40]同样以数据资源化-数据资产化-数据商品化-数据资本化的“四化”环节解释数据要素价值实现的全过程。数据要素的价值依赖各生产环节得到形成和实现,同时以不同的数据形态进行呈现。
目前数据价值链的相关研究多结合数据要素市场的关键问题展开。黄科满等学者[41]以数据治理的价值链厘清数商生态市场的核心主体和职能,为构建数据基础制度提供系统化的分析框架。李清逸等学者[42]总结了数据要素定价面临的困境,并提出基于数据价值链视角的数据要素定价机制。黄丽华等[43]从数据市场的要素流通和形态变化的角度切入,探索了价值链中的数据产权分置途径和实践模式。杨竺松等[14]基于数据价值链的不可合约性,探讨了使用环节的要素投入不可合约、可合约,以及要素投入由单一主体控制三种情形下的数据权属分配方案和范围界定。然而,上述有关数据确权的研究主要针对数据产权体系的配置和模式进行分析,少有研究从数据价值链的各生产环节切入,探究数据确权制度对于数据价值形成和实现的影响。
数据要素流通市场的各生产环节为分析数据确权对于数据价值实现的作用提供了具体场景,其中涉及的多方主体和多种数据类型也便于探讨分类分级的数据确权制度的影响。数据价值链的本质是刻画数据要素价值形成和实现的路径和模式,本研究基于马费成学者[3]的研究,将数据价值链划分为数据采集、数据组织、数据流通、数据利用四个环节。数据采集指将政府、企业和个人等数据来源在各类活动场景中产生的大量基础数据收集起来。该环节是数据要素价值链的源头环节,为数据进入市场流通提供了基础,也在很大程度上影响着流通市场上的数据质量。数据组织对采集后的数据进行整理,涉及脱敏、模型化和AI化等多个步骤[44],将混乱无序的数据转化为结构化的数据。数据组织环节为进一步挖掘数据中包含的信息和知识提供了可能性,数据要素的价值得以初步形成。数据流通指数据要素进入市场被流转和交易,为经济主体的经济活动赋能,在这个过程中数据价值转化为经济效益,数据要素实现作为生产要素存在的价值。数据利用是将数据价值实现和倍增的最后环节,数据要素与其他生产要素进行协同联动,一方面以数据资本促进传统产业转型升级、催生新兴业态;另一方面发挥“赋智”“赋能”力量,推动政府的宏观调控,提升企业决策效率,普惠民生,释放社会效益。
数据价值链涉及的四个环节中,数据采集和数据组织环节使得基础数据转化为结构化的数据,数据价值得以初步形成;数据流通和数据利用环节将数据要素转化为生产要素,释放经济效益和社会效益,数据价值得以实现。然而,数据确权制度的不明确、不完善导致数据价值链涉及的四个环节仍存在一些困境,阻碍了数据要素的价值实现。不同数据来源生成的数据类型不同、风险程度不同,各数据来源采取的数据保护措施和加密手段不同,导致数据采集标准和数据组织方法也大相径庭。缺乏明确确权规则的数据难以被合规、合法地采集和结构化组织,经常导致数据权属争议和隐私泄露担忧,阻碍了数据要素的价值形成。同时,现实市场环境下,数据要素流通和利用环节也存在诸多问题,如数据垄断、不正当竞争、数据安全问题等。数据分类分级确权制度作为解决或规避上述问题的手段之一,对于数据要素的价值实现具有重要意义。数据分类分级确权制度对于数据价值链的各环节存在哪些积极影响?怎样促进数据要素的价值实现?研究期望从这些关键问题入手,探讨数据分类分级确权制度对数据要素价值实现路径的影响,为推动中国特色数据产权体系建设和释放数据要素价值提供参考。
4 数据分类分级确权对数据要素价值形成的影响
4.1 对数据采集环节价值的形成的影响
数据一般来源于公共服务过程、生产经营活动等场景,其作为“副产品”被生产,往往不耗费额外的劳动或资本,但是依托“产品”身份实现市场流通和价值释放却存在很多问题。数据要素价值如何形成?其关键的第一步在于如何激励数据生产方成为市场供方。现实环境下,非法的数据收集、买卖和使用等违法行为正在形成一个繁荣的“黑市”,导致数据买方的支付意愿下降,迫使高质量的数据供方退出市场。数据市场供需结构的失衡致使市场出清难以达到,长此以往将阻碍经济高质量发展。
为了解决这一问题,数据分类分级确权制度旨在为数据采集环节的各方提供有效的数据动力支持和政策保护,有效提升各数据来源方的市场供给意愿。该制度期望将数据采集环节纳入明确的产权框架内,通过持有权激励数据来源进行数据资产登记或供给,并通过使用权和经营权保障采集方的利益[43]。这一举措有效减少了采集环节的权属纠纷和利益冲突,促进了数据要素的价值形成。
不同来源和类型的数据在采集环节涉及的问题存在差异。公共数据为各级政府部门、企事业单位在依法行政履职或提供公共服务过程中产生的数据,该类数据的价值形成依赖于数据的开放和共享[45]。权属界定不清导致数据的开放范围和共享类型难以明确,阻碍公共事务管理和决策活动。数据分类分级确权制度通过对数据进行涉密程度、风险程度等维度的划分,明确各数据来源可以制定的数据公开范围和被采集方案。这一划分不仅有助于清晰数据保护和数据公开的边界,更有效地形成公共数据的价值,还对数字政府建设具有积极意义。
企业作为经营活动主体,具有数据供方和数据采集商的双重身份,更可能涉及数据权属争议甚至司法纠纷。数据采集环节中,数据分类分级确权制度将持有权、使用权和经营权分置,一方面保护企业权利不被侵犯,另一方面保障企业应得的经济收益,给予企业“双重保险”,激励企业积极参与数据采集和价值挖掘活动,从源头上提高了数据要素质量。
个人数据是最具争议的类型,涉及大量个人信息,如姓名、面部信息等,采集环节处理不当易导致权属争端。数据分类分级确权明确个人作为市场供方拥有数据权利,打击不法采集和贩卖数据的违规活动,降低个人隐私泄露风险。贵阳市大数据交易所近期完成了全国首例个人数据合规流转,个人将简历数据交付数据平台交易可以获得利润分成,该类经营模式下个人作为数据市场供方不仅拥有数据权利,还可以获取一定的经济利益,大大提高个人数据流入市场的积极性,激发数据市场的活力。
4.2 对数据组织环节价值的形成的影响
数据被采集后需要经过数据组织环节进行结构化处理,从而将杂乱无章的基础数据转变成具有价值、可以进入流通环节的数据。然而,数据组织环节对敏感数据处理涉及隐私风险,处理过程稍有不当则会损害数据相关方的利益。同时,权利归属不清晰的数据会给算法的模型化过程带来阻碍,掣肘数据形成个性化产品和服务的AI化过程。
一方面,数据分类分级确权制度有助于数据组织方对技术工作进行细分,提升数据服务能力。根据不同类型数据及其权利归属开展脱敏、整合、清洗等具体的技术处理步骤,增加数据产品的可使用性,减少后续数据要素流通和交易环节的供需匹配时间。
另一方面,数据分类分级确权制度为数据组织环节提供合规保障,保护数据来源方的隐私安全。通过确定谁有权访问和使用数据,数据组织方能够获得使用权、加工权等相关权益,明确数据脱敏和资源整合过程中数据使用范围,减少数据来源方的隐私担忧。这有助于进一步增强数据来源方参与市场流通的信心,推动公共数据的公开和共享,整合企业数据和个人数据资源,促进数据要素的价值形成。
此外,进行分类分级的数据确权工作也有助于划分隐私数据脱敏和潜在价值深挖的界限。数据组织过程中,涉及政府机密、企业利益的中、高风险和敏感级别的数据需要谨慎的数据处理和加工手段,数据组织以保障数据来源方权益为首要目标,在此基础上争取发挥该类数据的潜在价值,为公共管理活动、企业智能决策等后续过程提供数据产品。而风险程度和敏感级别相对较低的数据期望最大限度以算法处理进行脱敏和模型化,提供更完整的数据产品和数据服务。
5 数据分类分级确权对于数据要素价值实现的影响
5.1 对数据流通环节价值实现的影响
数据作为新型生产要素,其定价、权属等关键问题仍存在较大的争议和模糊性,因此数据被非法获取、倒卖和使用的行为屡禁不止。数据流通过程中涉及供需方的磋商、谈判、履约、交易等多个行为,数据产品和服务需要多次修改和变更,这一过程很容易对其他相关主体的隐私、名誉甚至商业利益造成负面损失和影响。这种负向的外部效应不仅加剧了社会对数据交易安全的焦虑,也反向抑制了数据的流通,阻碍了数据价值实现。例如,蚁坊公司以北京微梦创科网络技术有限公司拒绝共享数据的行为构成数据垄断为由提起诉讼[46],这是我国首例因互联网平台拒绝数据许可引发的反垄断民事诉讼。
数据垄断行为严重制约了数据交易市场的运行,可能导致数据市场发展萎靡,出现不正当竞争现象[47]。这种外部性问题难以通过市场自发机制进行调节。因此,国家需要通过政策激励或法律管制等手段调整产权归属,进而调节边际成本和收益,使得交易决策双方将社会成本等外部性因素纳入磋商考量,实现外部效应的内部化。在数据市场中,数据分类分级确权制度被视为解决上述问题的一种机制,通过明确的数据权属框架将产权内部化,有效调节负向外部性问题。
此外,新制度经济学家哈罗德·德姆塞茨[48]认为,产权的内部化会使成本降低、收益提高。数据分类分级确权制度通过明确谁有权将数据进行交易或转让,有效减少数据流通环节的风险和不确定性,有助于降低流通交易过程的谈判成本、监管成本以及执行成本。数据流通成本的降低可以激励数据来源方更积极地参与数据产品和服务供给,利于不同主体之间数据资源的交换和流动,促进数据市场的可持续发展。
数据分类分级确权还可以提高整个数据要素市场的资源配置效率,促进数据流通,实现数据价值。尽管科斯定理强调在零交易成本的理想情境下市场机制能够推导出最有效率的经济运行结果[49],但实际市场中,无论是公共数据、企业数据还是个人数据交易都可能涉及交易成本。根据隐私经济学理论,涉及个人数据的交易需要考虑隐私保护成本[50-51],包括技术保障成本、法律合规成本等。信息不对称理论认为,交易环境存在资源分配不均衡的现象,导致交易方需要为获取或使用数据支付更高的成本[52]。除此之外,奥利弗·威廉姆森[53]提出的交易成本理论认为交易环节涉及的信息搜寻、谈判、缔约、监督、履约、违约等行为都存在成本。对于存在交易成本的数据市场,产权明确化成为实现经济效率的关键手段[49]。数据分类分级确权通过法律授予数据权利人对其数据的财产权,为其数据保护提供了明确的、独立的请求权基础[54],为数据交易环节起到定分止争的效果。同时,数据流通和交易市场还存在数据“倒卖”、产权让渡和道德风险等问题,数据分类分级确权与区块链[55]、数据信托机制[56]等技术手段的结合可以在一定程度上监管或规避该类问题。
5.2 对数据利用环节价值实现的影响
数据的价值挖掘依赖于对数据重复利用[25]。数据分类分级确权旨在清晰规定相关方的使用范围和界限,提供合规保障。例如,衡阳市政府将政务数据资源以特许经营权的形式进行出让,杭州市也建立了公共数据授权运营平台,为数据利用环节的确权工作提供了范例。这种明确的数据权属结构给予了数据使用方明确的权利行使空间,使其在数据利用环节能够自觉遵循相关政策法规,从而避免承担法律责任和相应处罚。同时,数据使用方可以定制自身的数据合规和数据资产化治理方案,在数据利用环节更全面地进行数据风险核查、数据合规分析和数据管控活动,充分释放数据的经济价值。
此外,数据分类分级确权制度有助于数据产品价值的再次开发。由于数据要素具备高重塑性和时变性,在不同应用场景下,数据产品具有多样化的价值生命周期。数据产品在不同场景中的组合、整合与聚合,能够呈现新形态与新价值。随着数据产品价值生命周期的演进,数据产品也可能呈现出资产属性,推动传统行业转型,并催生新兴业态。在规范的数据使用环境中,数据利用方更容易进行研究与开发,推动数据的二次加工和创新性利用[57],数据产品和服务的价值得到再次开发,为数据市场注入新的活力。这种创新驱动的数据利用模式依赖数据权属的合规监管稳定运行,一方面有助于数据使用方不断完善数据业务模式,另一方面促进新数据产品的涌现和数据产业的磅礴发展。
综合上述分析,本研究发现数据的分级分类确权制度能有效实现数据要素的价值,明确数据权属,激励原始数据采集,满足数据流通或交易的多样化需求。原始数据在经过脱敏或再加工后,不仅能够保护个人数据隐私,还使得平台企业更合理、合法地获取和利用数据,降低数据交易成本,促进数据要素的畅通流通,最大化实现数据的价值。这一过程实现了数据要素的价值释放,推动数据迅速融入数字经济的生产活动(如图1所示)。
图1 数据分级分类确权机制对数据要素价值实现路径的影响
6 结语
本文梳理了数据确权相关概念,分析了数据确权面临的现实困境和产权体系发展现状,探讨了数据分类分级确权制度与数据要素价值形成和实现各环节的关系。数据分类分级确权制度能够激励数据采集活动,提高数据来源方的市场供给意愿,细分数据产品和服务,在保护隐私的同时最大限度挖掘数据价值。同时,数据分类分级确权有效减少负向外部性,起到定分止争的效果。清晰的权属结构能够降低交易成本,提高数据资源配置效率,推动数据价值重复开发和利用,最终提高数据价值释放效率。研究发现数据分类分级确权制度对于数据要素价值实现各环节具有一定的推动作用。本研究对于有序推进中国特色的数据产权制度建设和数据市场发展具有重要意义。然而,研究的实证性有待进一步提升,未来研究可以进一步结合数据确权的实践活动展开分析和论述。