论我国大数据交易的现实困境和破解路径
2023-01-06陈金春
陈金春
(安徽大学法学院,安徽 合肥 230601)
1 问题的提出
作为新时代经济发展的“石油”,数据的交易问题一直是数字经济发展中的重点和难点。我国自2014年开始尝试在北京和香港分别建立大数据交易平台,2014—2016年间,国内先后成立了19家大数据交易中心,大数据交易平台的建设进入爆发期。但建设的大数据交易平台促进数字经济繁荣的效果并不理想,大数据交易平台自身的经营状况也未能达到预期。时至今日,最初成立的19家大数据交易平台中已有14家停止营业或已查找不到运营网站。2020年4月,中共中央、国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》,明确提出要“引导培育大数据交易市场,依法合规开展数据交易”,国内开始了新一轮大数据交易建设的浪潮。大数据交易平台建设计划的重启将大数据交易的相关问题重新引入人们视野,为什么大数据难以进行交易,如何破解大数据交易的困境,相关问题仍未解决。
2 大数据交易的过程及类型
与石油、煤炭等一般意义上的资源不同,大数据不存在实在的形体,其产生、交易的过程均发生在虚拟的网络空间中,这为大数据的相关研究带来了不小的困难。
2.1 大数据交易的过程
目前国内外对于大数据交易的过程仍缺乏权威性的认定,结合欧盟2020年颁布的《欧洲数据价值链战略报告》[1],笔者认为大数据交易的过程主要包括以下几个部分。
数据的产生。数据的产生是指将数据保留并记录到现有的存储介质中。数据无时无刻不在产生,人类可以主动产生新的数据,自然界自身的运行也可体现为无穷的数据,非人类可观察、可记录的数据虽现实存在,但不属于数据产生的范畴。当前数据的产生大致已经历了三个阶段。第一阶段可称为运营式系统阶段,体现为数据库作为一种重要的运营工具嵌入到企业的经营管理中,如银行的收银系统、医院的病例系统等,通过相关运营工具的使用为企业节省了大量的管理成本。运营式系统阶段的特点在于数据伴随着企业的经营而被收集,数据只是企业自身经营的副产品,企业并未意识到数据中潜藏的巨大价值,数据产生的效率也较低。数据产生的第二阶段是互联网系统阶段,该阶段的特征在于互联网的普及使得每个互联网用户都可以成为数据产生的源头,网络用户的数据被大量收集,数据总量呈指数性增长。互联网系统阶段所产生的数据大多与用户的个人信息密切相关,具有重要的价值,人们逐渐意识到数据的重要性,也使得个人信息、数据权利等相关问题成为理论学说研究的热点。数据产生的第三阶段是感知式系统阶段,体现为技术的发展使得各类感知系统可以自动地收集存储数据,如各类观察、监控系统的出现。感知系统的出现使得数据的产生由主动迈入自动阶段,各类信息被24小时不间断地记录下来,所产生数据的内容涉及人们生活的方方面面,使得数字化的未来真正成为可能,数据的价值全方位地得以体现。
数据的搜集。数据的搜集是指将具有关联性的相关数据予以抓取并保存。搜集阶段是决定数据价值的关键,为提高数据价值,企业必须不断优化算法工具,提高数据抓取的关联性和广度。搜集阶段也是当前有关大数据交易争议最大的一个阶段,尤其是关于数据搜集的合法性和权属问题一直未得到妥善解决。
数据的加工。数据加工是指数据企业对已收集的数据按照相关政策法规、技术标准的要求进一步进行处理,如数据清洗、数据提纯等。数据加工的目的在于保证数据符合两方面的标准:一是法律层面的标准,如针对个人信息数据,企业需通过加工保证数据的匿名化和去识别化。二是行业或合同层面的标准,通过数据加工,使数据符合进入市场流通的标准化的需求,或根据销售合同的约定,对数据进行加工使其满足客户系统的需要。
数据的货币化。数据的货币化是指数据企业将加工处理完毕的数据投入市场进行交易或以数据为基础为客户提供服务。数据的货币化是数据企业商业模式的核心,通过数据获得盈利是数据企业维持运行的关键。数据的货币化包括数据的直接出售和数据服务两部分,从实践的角度来看,当前主流数据企业盈利的方式在于提供数据服务而非直接出售数据,原因在于数据与传统商品不同,数据具有非排他性和非竞争性,数据价值链主要集中于服务端而非销售端,数据交易中向客户销售的产品不是经处理完毕的数据本身,而是以数据为基础体现用户交互能力的服务或产品[2]。
2.2 大数据交易的类型
当前我国大数据交易仍处在快速发展变化的过程中,形态并不固定,综合来看,主要包括以下三种类型。
一是基于数据搜集而进行的数据交易。基于数据搜集而进行的数据交易是指企业通过数据搜集、汇总后形成相关数据库,基于搜集的数据为客户提供查询、预测等数据服务。此类数据交易强调企业搜集数据的广泛性和准确性,数据企业大多在行业内具有一定的优势地位,以保障数据的权威性,数据企业通过收取会员费和增值服务费维持运转,典型的如知网、万方等网站。该类数据企业当前面临的矛盾在于,为了占据市场优势地位企业必须投入大量的资金以不断扩充数据库的广度和深度,但客户往往只需要数据库中的部分数据,并不愿意为整个数据库付费。目前解决的方式主要是通过技术手段对客户的权限进行限制,客户只能查询数据库中的部分数据,进而降低收费,但仍有部分数据库存在数据不可分割的问题。
二是基于数据加工而进行的数据交易。基于数据加工而进行的数据交易是指数据企业根据客户的需要对数据进行清洗、标记、提纯等处理,为客户提供数据或服务。此类交易体现为“数据+服务”的交易模式,其中服务是交易的核心,数据企业自身可能缺乏完善的数据库,其强大的数据处理能力是市场竞争的关键。此类交易的对象主要是科技企业,如自动驾驶、语音识别、人脸识别等企业,这些科技企业需要大量的数据以供自身算法工具学习,数据需要进行加工以嵌入其算法。同时为避免算法歧视的出现,科技企业还需尽量保障数据的完整性和关联性,因此对数据的质量要求极高,数据的加工服务必不可少。数据加工服务处于整个数据价值链的上游,相较于纯粹的出售数据,加工服务对企业技术能力的要求更高,回报也更为可观。目前国内大型数据企业大都同时经营数据的出售和加工业务,但随着我国科技水平的不断发展,科技企业数量不断增加,未来数据加工服务将成为数据企业发展的主要方向。
三是基于数据通道而进行的数据交易。基于数据通道而进行的数据交易是指数据平台将自己的数据通道作为标的进行的数据交易,数据平台并不直接提供数据,而是提供数据通道的接口,典型如网络平台、APP等为特定产品所做的广告。数据通道交易属于广义上的数据交易范畴,数据平台自身虽不产生、收集数据,但通过其提供的数据通道,仍可以获取部分用户的信息数据。数据通道交易对平台自身的影响力有着较大的要求,数据通道的价值与平台用户的数量紧密相关,技术的发展使得数据平台能对自身的数据通道进行进一步细分,如针对不同用户推送不同产品的广告,数据通道已成为获取数据流量的重要途径之一。
2.3 小结
通过上述关于数据交易过程和类型的分析,我们可以看出,当前已进入数据爆炸的时代,不同类型的数据相互组合,为数字时代的到来打下了基础。对于数据而言,其价值体现在特定的场景中,数据需要与特定的算法相结合才能解析出其中的价值。数据虽被称为一种新的资源,但单纯的数据交易附加值极低,对于大数据交易而言,其未来发展的方向在于“数据+服务”的交易模式。
3 我国大数据交易面临的现实困境
当前我国大数据交易市场并不繁荣,主要原因在于我国大数据交易面临如下困境。
3.1 确权难
《民法典》第127条明确了数据的财产性质,数据作为一种财产应当受到法律保护,《数据安全法》第8条也指出,个人、组织等的数据权益受到国家保护,但都未明确数据的权属主体。数据权属及其分配规则不清,已成为数字经济发展的最大制度障碍[3]。目前相关法律法规中都回避了数据的权属问题,主要原因是理论、实践中都未能明确数据权益的主体和客体范畴。对于数据的权属主体而言,数据交易的不同过程可能由不同的数据主体完成,同一过程中还可能存在进一步的分工合作,交易过程的改变可能导致了数据权属的变化。尤其是针对个人信息数据的权属问题,目前法律的规定主要强调企业对收集的个人信息需进行匿名化、去识别化处理,从相关法条的表述上可推定认为企业对收集的个人信息进行处理后数据归企业所有。但企业相关的匿名化、去识别化处理都依赖于各自的算法工具处理,目前已出现不少针对各大算法工具的破解程序,能够重新识别出数据中的个人信息,算法技术的发展可能导致部分已建立起的数据归属体系崩塌。对于数据权益的客体而言,随着数据收集进入自动化时代,可收集的数据进一步扩大,数据种类涉及生活的方方面面,难以进行完善的分类。对于数据的内涵而言,《数据安全法》第3条将数据定义为任何以电子或者其他方式对信息的记录,该定义未能明确数据的特征,通过该定义仍难以将数据与个人信息、个人隐私等概念进行区分。此外,数据所固有的非排他性、非竞争性等问题仍然存在,为数据的确权问题提出了极大的挑战,因此部分学者主张应重新考量数据的财产权理论[4]。
3.2 定价难
公开透明的价格是构建商品交易市场的前提和重要基础,但对大数据而言,其难以形成统一的市场定价。前文已经提到,数据的价值体现在特定的场景之中,单纯的数据本身没有价值,需要结合其使用场景予以确定。以人脸数据为例,同样一组人脸数据对于不同的科技公司、科研机构而言价值并不相同,同一家科研机构对不同地区的人脸数据需求程度也可能不相同。对于数据企业而言,其所掌握数据的价值需要点对点地与不同客户之间协商确定。同时,与石油、煤炭等标准化的资源不同,标准化资源一经流入市场基本不存在后续服务问题,如发电厂购买煤炭后便可直接使用,煤炭公司只需保障煤炭质量,不存在其他服务的问题。而对于数据企业而言,因大数据缺乏统一的行业标准,不同客户的算法口径也不完全相同,数据企业出售数据后往往还需协助客户对数据进行处理,以嵌入目标系统。因此数据公司出售数据的收费可能还包含了后续服务的费用,而服务的收费因客户不同有所差别,这也给数据的定价带来了困难。此外,标准化的市场定价对商品的流通量有着极高的要求,低流通量的商品难以形成公开透明的市场定价,我国目前大数据交易整体处于起步阶段,交易总量较少,且很多发生于场外,缺乏足够的定价分析样本。
3.3 互信难
数据交易的互信难题在于数据交易中存在双重的信任困境,对于数据买方而言其需要在交易前了解数据的具体信息以确定数据的价值,而对于数据卖方而言一旦在交易前将数据展示给卖方就可能导致数据的泄露[5]。破解这一信任困境的根本途径在于进一步演化算法技术,使得数据企业能在确保数据不被泄露的情况下还能向买方展示数据的价值,但这一能力在当前的算法技术水平下难以实现。目前较为可行的解决方案是通过数据交易平台或数据经纪人等交易第三方的设置,由第三方作为中介担保,保证交易的公平公正。对于数据交易平台而言,目前我国大数据交易平台自身缺乏专业的数据价值评估能力,评估价值机制模糊,平台数据交易仍需委托第三方评估机构进行价值评估,不仅交易成本较高,消耗的时间也较长。且当前大数据交易平台缺乏明确的入场标准,对于部分数据企业而言难以进入场内进行交易。对于数据经纪人制度而言,我国仍处于探索阶段,目前仅在珠海市进行了试点,未来能否进行全国推广仍有待观察。
3.4 监管难
大数据交易作为新兴的数字产业之一,在很长一段时间内处于监管的空白状态。直至2021年《网络交易监督管理办法》出台,才明确由市场监督管理部门承担大数据交易的监管责任。但当前我国工商管理部门职能主要集中在传统工商经营范围内,对于大数据交易而言其缺乏监管所需的专业能力,难以认定进行中的大数据交易是否合法。并且大数据交易全程发生于虚拟的网络空间中,工商管理部门也缺乏对应的监管手段,只能采取停业整顿或罚款等传统的执法方式,难以真正发挥出监管应有的效果。此外,《数据安全法》第6条规定,各地区对本地区的数据负责,即由各地区市场监督管理局对地区内的数据交易进行监管。但当前大数据跨市、跨省交易属于常态,按照行政部门的执法规则,对于跨区域案件应当由共同的上一级进行执法或由上一级指定执法机构执法,因此对于大数据交易的监管责任将主要由省市场监督管理局或国家市场监督管理总局承担。而在我国不断推行数字战略的背景下,未来我国大数据交易量将不断增加,大数据交易的监管责任也将越来越重,由省部级部门来主要负责大数据交易的监管显然是不合理、不现实的。
4 我国大数据交易困境的破解路径
当前我国针对大数据交易的规定大多集中于顶层设计层面,对于大数据交易发展而言具有宏观的促进作用,但缺乏具体的可执行和可操作性。对于上述大数据交易面临的具体问题,本文认为可以从如下几个方面解决。
4.1 明确数据权属
首先应当回答的问题是:是否应当赋予数据主体以数据财产权?本文认为答案是肯定的,数据收集的过程中数据企业付出了相应的时间、金钱等成本,肯定其财产权有利于保障资源的有序开发利用。立法中虽未明确有数据财产权的表述,但也表达了对数据主体财产性权利的肯定。从实践的角度看,前述数据交易的三种类型中,基于数据加工的数据交易和基于数据通道的数据交易,其性质可认定为是一种承揽合同。由数据企业为客户提供数据服务,但对于基于数据搜集的数据交易而言,其只能认定为一种买卖合同,数据是买卖合同的标的,不为人类所拥有的物无法进行买卖,作为合同标的的数据必须有着明确的财产归属,应当肯定数据企业对数据的财产权。对于数据的权属主体而言,考虑到数据交易需经历的产生、收集、加工等过程,应当首先明确数据收集者对数据的权利,原因在于数据的生产者对数据拥有完全的所有权,其权利义务十分明确,而数据的加工、货币化等环节权利义务继受于数据的收集者,因此明确数据收集者的权利是数据交易中的关键。对于数据收集者的权利,法律有明确规定的,如关于收集个人信息,应当从其规定。对于法律尚未规定或规定不明的,可参照既有法律的规定,同时适用著作权保护、反不正当竞争的相关规则,综合确定其权利义务。对于数据加工者而言,应当以加工技术为标准,区分技术手段,认定加工者享有完全的数据权或基于数据权产生的用益物权[6]。对于数据权属的内容而言,数据权应当包括占有、使用、收益的权能,对于数据的处分应当严格遵守国家相关法律法规的要求,坚决维护国家安全。
4.2 明确大数据交易平台的权利义务责任
国家大力推动建设大数据交易平台的目的在于促进数字经济发展、维护数字交易安全。对于大数据交易平台而言,其首先应当发挥出平台的中介作用,积极促成大数据交易。数据企业与客户之间存在一定的信息壁垒,科技公司、科研机构等都对数据有着大量的要求,但可能难以寻找到合适的卖方,对数据企业而言,其所拥有的某些数据虽价值独特亦有可能无人问津。此时可以通过在大数据交易平台上发布广告的方式,或直接由平台帮助寻找、咨询合适的交易对象,以促成交易的达成。针对大数据交易中的定价难问题,市场化经济体制下企业有着定价的自由,但大数据交易平台可以给予数据企业定价建议,帮助数据企业更快地售出拥有的数据。对于场内交易的数据,大数据交易平台可设置一定的等级分类,按照不同的等级确定一定的价格幅度范围,数据企业可按照对应的产品等级进行定价。针对数据交易的互信难问题,可通过大数据交易平台数据认证功能解决,通过大数据交易平台对数据进行认证,让数据买方对数据价值有初步的了解。目前国内已尝试建立数据认证体系,如上海数据交易中心的xID技术体系,未来随着技术的发展,数据认证功能的准确性和可靠程度将进一步提高。
4.3 完善监管体系
我国大数据交易产业仍处于起步阶段,为避免其野蛮生长,适当的监管必不可少。对于大数据交易监管而言,传统工商监管部门缺乏监管能力和监管手段,故应当设立专门的数字监管部门,吸纳专业技术人才,设立专业的数据交易标准,由数字监管部门对大数据交易中的相关问题进行统一监管。数字监管部门可不按行政区划设立,对于跨区域的数据交易,可由数字监管部门进行联合监管,或采取技术优先原则,由技术水平较高的监管部门进行管控。同时,应当针对数据交易全程虚拟化的特征,创新执法技术和执法手段,研发针对性的执法工具,避免数据企业通过技术手段逃避监管。应当建立行业监管和政府监管并行的双重监管模式,数据企业和大数据交易平台应当定期汇报数据安全情况,对于风险企业,应当采取技术手段进行实时监控,避免系统性风险的发生。最后,应当建立健全大数据交易的准入和退出机制,明确大数据交易的退出标准,将严重违法市场交易秩序、侵害国家数据安全的数据企业及时予以清退。
4.4 完善权利救济途径
目前大数据场外交易十分普遍,场内交易缺乏充分的监管,因大数据交易引发的纠纷屡见不鲜,完善大数据交易的救济途径确有必要。就权利救济的途径而言,目前实践中数据纠纷均以诉讼途径解决,缺乏其他维权手段。故应当扩充数据纠纷的维权途径,首先由主管部门领导,尝试设立数据纠纷的投诉、调解机制。同时,可以依托现有的大数据交易平台,建立大数据纠纷的仲裁机制,减轻当事人诉累。对于诉讼阶段而言,应当不断完善有关电子证据、电子送达、网上诉讼等制度性规定,减轻当事人的程序性负担。就请求权基础而言,除有合同约定外,当事人还可以选择著作权侵权或反不正当竞争两种请求权,但从实践角度看,相关案例中以反不正当竞争提起诉讼不仅胜诉的可能性更高,赔偿的数额更是超过著作权侵权的几十倍[7]。但目前相关数据反不正当竞争案中均以《反不正当竞争法》第2条基本原则作为裁判依据,致使法律的稳定性和可预见性大幅削弱。为此,建议在《反不正当竞争法》明确数据不正当竞争行为的类型,以避免基本原则的滥用,同时为企业的经营提供指引。
5 结语
技术的发展为社会治理带来了一些困境,未来也必将随着技术的发展而被解决。目前我国大数据交易领域仍处于探索发展阶段,大量问题有待解决,对此应当坚持以下几点原则:一是必须以国家政策、法规为指引,以国家战略为导向,促进大数据交易市场有序发展。二是必须坚决维护国家数据安全,坚决维护公民的个人信息、个人隐私不受侵犯。三是必须切实保障数据企业的权利,营造良好的数字科技环境,鼓励科技企业不断创新,形成完善的数字经济体系。