数据流通的反垄断法律保障
2021-07-08杨成广
杨成广
(云南大学 法学院,云南 昆明 650504)
当前,人类社会已步入数字化时代,典型特征是互联网的普及和人工智能自主学习能力的提高,数字资源成为现代市场竞争的重要资源。2020年国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》指出,数据已成为第五大生产要素,对社会经济的发展具有重要作用,只有保障其流通才能发挥其最大价值。然而,以数据为驱动的企业在经营活动中积累了大量数据,在数据市场中享有优势地位,为保护其优势地位,可能会实施数据垄断行为。针对数据能否构成垄断,学界还未达成共识,一种观点认为数据具有非竞争性,在数据资源的收集、利用过程中,在位企业不能阻碍其他企业收集、利用数据,因此数据资源不具有垄断性[1];另一种观点认为数据资源虽具有非竞争性,但数据市场具有双边市场特性,在位企业可以通过杠杆行为将垄断力传导到其他市场,因而可以构成数据垄断。然而在现实中,数据垄断行为早就屡见不鲜。遗憾的是,研究者虽关注到数据治理问题,但大都从数据保护的角度出发,甚少关注到数据垄断问题。在司法实践中,一些数据垄断案件,并没有通过反垄断路径解决,而是通过其他的法律途径进行规制。因此,有必要重塑反垄断法制理念,具体分析数据领域的反垄断问题,切实保障反垄断法律制度的实施。
一、数据流通的困境
数据本身是一个抽象的概念,是对客观事物或现象的逻辑归纳,本质上是对事实、活动进行观察和分析后形成的数字化记录,其存在目的是探究被记录事实、活动的内在规律[2]。数据特征具有多样性,代表性观点有“3V”特征(规模性、多样性和高速性),“4V”特征(增加了价值性),“6V”特征(增加了准确性和有效性)等。广义上的数据包括市场主体采集、分析、处理、利用的一切数据,狭义上的数据仅包括原始数据。要想厘清数据垄断问题,应从数据的价值属性出发,以市场竞争为核心进行多元分析。
1.数据流通的价值冲突
数据集合本身并不产生价值,只有基于特定商业用途进行数据存储、价值分析、技术处理后才能发挥效用[3]。数据价值具有多元性,针对不同主体,具有不同的价值属性,对于个人而言,通常具有人格权属性,与隐私保护相联系;对于市场竞争者而言,通常视其为生产要素,与市场竞争紧密相连;对于政府而言,通常把数据视为管理要素,与政府职能相联系。由此可知,数据流通中存在多元价值冲突,因此应如何利用数据满足各方需求值得研究者高度重视。
对于个人而言,数据价值主要体现为经营者为其提供专业化服务。但在个人数据商业化使用的今天,一方面,企业投入大量成本获取和保存各类数据,这些数据包括大量的个人隐私数据;另一方面,公众越来越重视个人隐私数据的保护,导致经营者与用户之间存在价值冲突。在数据争夺事件中,经营者关闭数据接口后,可能会直接影响到用户正常的消费需求,侵害其合法权益;另一方面,双方在争论中都以保护用户数据安全的名义指责对方,往往会引发社会关注。数据市场多呈现寡头垄断格局,有学者收集分析手机应用软件市场的数据后发现,2019年度大概1%的数据收集者掌握了约92%的用户数据[4]。这有可能会限制市场竞争,最终通过传导效应把不合理的成本附加给用户,侵害用户的合法权益。由此可知,用户的数据价值需求可分为两类:一是对个人隐私数据的保护,包括对个人数据隐私权的保护和个人数据财产权的保护;二是用户正常的消费需求,即用户提供免费数据是为了获得更好的服务。
对于企业而言,数据价值主要体现在两方面:一是为维护和强化竞争优势。数据蕴含的商业价值是企业,特别是超级企业开展跨界竞争、多边竞争以及未来竞争的核心构成要素[5]。企业通过数据分析用户行为,改进产品和服务,满足用户需求,积极开拓新市场。二是推动技术进步与创新。大数据已成为创新的重要来源,创新也是许多企业发展大数据的初衷[6]。如果一个企业通过数据的收集和利用而获利,那么当这个企业收集到大量数据后,它的市场份额将会变得相对稳固,为维护市场地位,其又会进一步进行新产品的研发,促进创新。当然,一些企业也可能会利用数据优势消除潜在的挑战者[7],从而在某种程度上抑制创新。如通过限制、禁止数据流通、收购等多种方式扼杀规模较小的竞争对手,或提高市场准入门槛来抑制创新。但总体而言,大数据有助于推动技术进步与创新。
综上,数据流通的价值冲突主要体现在两方面:一是用户个人隐私数据的保护与市场主体数据利用之间的价值冲突。经营者可利用其市场支配地位,对用户附加不合理条款,不当或过度使用用户数据,限制甚至忽视隐私数据的保护。以“知情同意”为核心的传统个人隐私数据保护模式,已不符合数字经济发展的要求,既无法实质性保护用户的隐私数据,又成为数据开发的障碍[8]。二是同类企业市场竞争间的价值冲突。具有优势地位的企业,可能会滥用市场支配地位,限制或阻碍数据流通,甚至会进行“抄袭式开发”或企业并购。对于中小企业或刚进入业界的企业而言,其处于弱势地位,数据资源的天然劣势限制了其进一步发展,为维护自身利益,当然也不愿流通自身所掌握的数据。倘若企业认为在数据流通中无法平衡支出与收益,那么数据流通的驱动力不足也就成为必然了。
2.数据市场竞争现状
数据作为市场竞争的主要资源,从诞生以来就扮演着重要角色,随着现代科技的发展,其在被进一步开发利用的同时,角色定位也发生了一定的变化。
在信息时代,数据价值通常以产品化的形式表现出来,即信息产品,主要用来解决市场信息数量不充足、信息分布不对称、信息质量有错误等问题[9]。如部分电商平台,最初提供商品的数字化信息,连接卖家的供给信息和买家的消费信息,使得市场资源可以跨区域流动。这时的数据价值多以信息产品或服务的方式呈现出来,最终目的是为了实现市场信息的对称,是对数据的初步利用,只要求经营者掌握大量的数据,而无须进行识别加工。随着现代技术的发展,特别是人工智能的进步,机器学习能力大幅提高,数据的价值又得到进一步发掘。到了大数据时代,数据利用已不仅仅停留在信息共享层面,通过机器学习、算法分析等手段,企业可对留存的信息进行收集、加工和价值再造,挖掘新价值,最终满足用户的多样化需求。如对用户消费信息、购买习惯的分析,可为其提供更好的个性化服务,也可利用这些信息进行推销,从而提高用户信息的商业化价值。同时,数据之间的关联性也在不断提高。企业通过提供个性化产品或服务,满足不同群体的用户需求,最终锁定用户,提高了自己的市场支配力。
由此可知,数据市场的竞争核心已由产品竞争变为用户竞争,在掌握庞大数据的基础上,还需对数据进行分析加工,挖掘其背后存在的价值,最终增强用户的锁定效应。虽然用户可通过多个企业来获得相似或相同的服务,但基于用户习惯、转移成本等问题,即使用户有多个选择,通常也会以其中的一家为主。在这种情形下,用户对于特定商品仍会有一定的黏性,当经营者不断改进产品或服务后,便可形成用户锁定效应。所以,现阶段数据市场竞争的核心不再是数据产品的多寡,而是用户的满意度,用户满意度越高,黏性越强,越有利于维护企业的垄断优势地位。
二、数据流通的特征
消费是社会生产的最终环节,数据价值也要通过消费来实现,为满足消费者的多样化需求,必须促进市场生产要素的流通。有研究表明,流通效率的提高对消费升级具有十分重要的作用[10],“大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用”[11],“大数据一切具体应用的不二法门是开放与共享”[12]。但我国目前并没有针对数据流通出台专门的法律,多以指导性文件为主,因此当前数据流通规则的制定多以企业为主。
1.市场主导下的数据流通规则
数据流通是基于市场消费需求而进行的数据共享,通常而言,主要分为三个步骤,如图1所示。
图1 数据流通示意图
根据用户协议来看,在①过程中,用户为免费使用产品而签订用户使用协议,授予企业个人数据使用权,企业完成数据的基本收集,但这时的用户协议多属于格式条款,用户并不能进行实质协商。在②过程中,经营者通过对数据的分析、整理为用户提供个性化服务,用户被动接收数据,并不能主动干预经营者的数据选择。在③过程中,经营者把数据流通给第三方,并不需要用户的许可,用户与第三方并不能直接协商。由此看来,数据流通的规则是在经营者主导下完成的,用户和第三方虽在一定程度上参与了规则的制定,但对具体实施细则却没有决定权,只能被动地接受。
2.数据流通对象集中、内容限定
如图1所示,数据流通的最终对象是用户和第三方。用户作为数据的提供者,为经营者提供了原材料,经营者分析加工后又把新数据返还给用户,为其提供专业化服务,用户无须付费。但数据流通规则又规定了未经经营者许可,用户不得超出用户协议范围使用数据,使得用户只能成为数据成果的享受者,而不能成为所有者。因此,数据流通对象的决定权掌握在企业手中,数据流通范围受经营者掌控,具体情况如表1所示。
由表1可知,市场中的数据流通除法律规定的必要流通和用户被授权下的流通外,经营者的数据大都流向与本企业有着密切经济联系的第三方,且数据流通的范围仅限于业务往来。
表1 数据型企业的数据流向表①数据来源于当前各数据型企业的用户协议,经整理后总结为四类典型模式的数据流通规则。
综上,现阶段我国的数据流通规则由经营者主导,用户与第三方并无直接的磋商空间,流通对象主要局限于与经营者有着密切经济联系的第三方,流通的范围有限。经营者是数据的所有者,在市场中占有绝对的优势地位,其通过合法行为获得的市场支配地位本身并不违法,但其获得方式,如果属于非法行为,则应受相关法律的制裁。获得支配地位后,如果为了巩固自身的市场势力,排除或限制竞争,滥用其支配地位,阻碍数据的正常流通,也应受到相关法律的规制。
三、数据流通的垄断实证研究
数据垄断可以从数据收集、控制、流通、分析、保护等多阶段进行分析,一般是指少数几家经营者掌控大量数据资源,利用其排除、限制市场竞争的行为。从实践来看,流通领域涉及的垄断行为主要有三类:其一是数据与算法叠加产生的垄断协议,其二是数据驱动型企业的经营者集中,其三是滥用数据市场支配地位。
1.数据流通垄断协议
数据流通垄断协议是指两个或以上经营者达成的排除或限制其他经营者获得相同或相似数据的协议,通常表现为统一定价、限定出售、拒绝交易等行为。需要注意的是,数据流通垄断协议更具隐蔽性,很多垄断行为都是在不经意间完成的。一方面,数据产业多以平台经营为主,企业具有双边市场特性,经营者往往以免费服务换取用户资源,在短期内就能集聚起大量的数据资源,占据市场优势地位,后进入者难以复制这种成功。经营者为保障优势地位,相互之间更易达成合意。另一方面,现代科技的进步让经营者之间更易达成算法合谋,依据市场数据的变动,动态地调整垄断协议。同时,随着机器和计算机技术自主学习能力的不断提高,算法可能进化到拥有自主学习和自主执行能力的地步。算法合谋的多样性、隐蔽性导致垄断协议难以证明。例如,谷歌与苹果达成长期协议,谷歌成为苹果系统浏览器Safari及其他苹果搜索工具上的唯一默认搜索引擎,一定程度上阻止了其他经营者从苹果公司获得相同或类似的数据。同时,谷歌让其搜索引擎在移动设备、网络浏览器和其他搜索入口上获取优先权利,形成一个持续的、自我强化的循环。
2.经营者集中
从实然来看,数据资源几乎无所不在,数据的可获取性很高,但正如格鲁内斯和斯图克教授所言:“如果个人数据可以像阳光一样免费获取,公司就不会花费大量的资金提供免费服务来获取和分析数据,以保持与数据相关的竞争优势。”数据收集需花费高昂成本,市场优势企业为了快速掌控数据资源,最简单的方式便是进行企业兼并。数据资源具有时效性,旧数据的价值低于新数据,为保障支配地位,优势企业可能会进行兼并。对于弱势企业而言,为了防止兼并,可能会实施“经营者集中”的策略,发挥规模经济的效用应对市场资本的冲击。这可能会导致数据资源掌控在少数几个市场经营者手中,不利于数据流通,进而间接侵害到用户的合法权益。例如,Facebook收购WhatsApp①See Case No COMP/M.7217-Facebook/WhatsApp.案中,欧委会最初认为此次合并不会给合并各方提供独特的、不可复制的优势,因数据来源具有多样性,相关的竞争企业可以通过多种途径获取数据,但却忽略了规模效益和传导效应的作用。Face⁃book收购WhatsApp后,收集到大量的数据资源,率先抢占了一定的市场份额,用户的锁定效应又进一步导致竞争对手难以获得与Facebook相媲美的用户资源,使得Facebook迅速巩固了市场地位。又如Google收购ITA②See U.S.V,Google Inc.And ITA Software Inc.,Civil Case No.1:ll-cv-00688.案,美国司法部认为Google在搜索引擎市场具有支配地位,收购ITA后,将会掌控美国的旅游信息网站,限制了竞争对手获得航空数据资源的途径,不利于市场竞争,因而叫停收购。
3.滥用市场支配地位
滥用数据市场支配地位的垄断行为主要表现为:一是数据垄断企业直接采取措施限制或禁止其他市场主体获得自己的数据,二是采取措施限制或禁止其他市场主体数据的流通。前者的垄断行为主要针对交易相对方,采取的方式包括拒绝交易、不合理的价格、附加不合理条件等。后者的垄断行为主要针对潜在的竞争对手,阻碍其获得数据资源,垄断手段包括禁止交易相对方合理转移数据、垄断高价出售、阻止用户数据流通权利的实现等。如hiQ诉LinkedIn案③See hiQ Labs,Inc.v.LinkedIn Corp.,2017 U.S.Dist.LEXIS 129088.,LinkedIn主要从事社交业务,用户众多,积累了庞大的数据资源;hiQ是一家数据分析公司,其分析业务完全依赖使用爬虫技术从LinkedIn抓取数据进行分析,LinkedIn允许hiQ访问并使用数据持续多年。但在微软收购Linke⁃dIn后,LinkedIn向hiQ发出了“停止侵权函”并采取技术措施阻止hiQ抓取数据。又如PeopleBrowsr诉Twitter限制访问数据案,④See PeopleBrowsr,Inc.v.Twitter,Inc.,Case No.C-12-6 120 EMC.Twitter公司主要从事社交网络服务,该企业网站储存了大量用户的数据资源,Twitter公司利用这些资源与第三方进行交易,PeopleBrowsr公司便是其中的主要合作方。但自2012年起,Twitter公司突然切断了PeopleBrowsr公司的访问权限,阻碍了数据的正常流通。
综上可知,对于大数据市场而言,传统的反垄断法制理念难以适用,平台企业具有双边市场特性,市场边界逐渐模糊,市场势力可以延伸到“不相关市场”和“未来市场”,经营者的市场势力难以界定。如hiQ诉LinkedIn案,LinkedIn允许hiQ访问并使用数据已持续多年,但在微软收购后,才禁止数据流通。微软收购LinkedIn看似不产生排除、限制竞争的效果,但从实际来看微软收购LinkedIn后,市场势力已经延伸到社交网络市场,阻止了Linke⁃dIn公司原本正常的数据流通。此外,市场支配地位和“滥用”行为难以界定。爬虫技术是一种常见的数据抓取行为,被企业、研究人员广泛利用,让大数据支配企业享有爬虫技术的支配权是否符合公益,还有待商榷。
四、建立数据流通的反垄断保障体系
数据资源只有在流通中才能发挥其最大价值,但当前数据流通的能动性不足制约了大数据产业的发展。为了激发市场活力,保障用户的合法权益,有必要对数据流通的垄断行为进行规制。保护市场竞争机制,规制企业市场力量的滥用,是反垄断法的应有之义[13]。
1.明晰二元动态价值平衡
为激发数据流通企业的市场活力,营造一个良好的流通环境,有必要对流通中的价值冲突做进一步梳理,即解决用户数据保护与企业数据利用之间的价值冲突和企业不愿进行数据流通的问题。
在数据开发过程中,掌握数据的组织可能出于公共秩序、经济福利、社会安全等利益的考量,依法披露个人的隐私数据。实际上,什么是数据的隐私权,并没有明确的法律界定,随着大数据时代的到来,原有的隐私权体系面临着严重的挑战,如姓名、肖像、收入等是否属于隐私,还有待商榷。并且,隐私保护也并非数据流通的对立面,而是对数据流通的边界进行设置。因此,对于用户而言,应当允许正当的数据流通,但也要防止企业以其他不正当的目的使用数据,如未经用户同意,以营利为目的出售数据等。对于企业而言,应当明确市场竞争的核心是用户,用户的满意度是衡量企业市场地位的重要因素。因此,一方面要深挖用户的数据价值,为用户提供更好的专业化服务;另一方面也要保护好用户的隐私数据,除必要的数据流通外,不得未经用户同意,随意泄露用户的隐私数据或用作他途。数据保护应是数据流通的应有之义,保护为前提,高质量的保护有助于激发用户流通数据的意愿。其次,对于垄断企业而言,应明确数据虽有价值,但却不是恒定不变的,只有流通才能创造出更多的价值。一方面,数据价值具有时效性,随着时间推移,价值会逐渐降低,并且数据市场具有动态竞争的特点,市场资源的流动性更为突出。尽管垄断企业可在短时间内掌握大量的数据,但随着时间的推移,若不进行数据流通,剔除老旧数据,其价值将会逐渐降低,优势地位将不复存在。另一方面,数据具有多归属性,垄断者并不能完全掌控整个市场的数据资源,用户可以同时使用多个具有相同或类似功能的产品,第三方或新进入者可通过多种方式获得用户数据,如通过支付对价、爬虫技术等方式获得垄断企业的数据资源。由此可见,在大数据时代,市场主导者可在短时间内垄断数据资源,但如果不进行数据流通,其垄断地位可能很快会被其他市场主体所取代。因此,为了企业自身的发展,巩固和强化竞争优势,市场主导者应积极主动地促进数据流通。
2.微观层面的技术调整
数据应该流通,但并不是无限制地流通,数据的过度开发同样也会带来新一轮的数据滥用,特别是在当前数据保护制度还未健全的情况下,我们需要对数据的流通保持警惕。经营者作为流通规则的制定者,在数据流通中居于核心地位,如何发挥好它的能动性是我们当下要解决的难题。
首先,经营者应正确认识反垄断法、反不正当竞争法等竞争法制的作用,自觉遵守相关法律的规定,避免利用垄断地位排除、限制竞争,阻碍数据的正常流通。通过对数据流通垄断行为的实证分析发现,很多垄断者并非不知法,而是心存侥幸,认为可以逃脱法律的制裁,或认为阻碍数据流通的收益远大于守法成本,故铤而走险,违规操作,影响数据的正常流通。针对这一现象,市场主体应加强对相关法律的学习,法律并不禁止市场主体正常优势地位的获得,而是禁止其滥用优势地位[14]。同时,要加强数据治理人才的培养。现阶段仍是数据治理的初级阶段,经营者对数据治理的认识不够,缺乏主动性,无法深挖数据价值。而数据治理人才是实现数据价值再造的关键,没有治理人才的保障,数据价值的挖掘难以持续。其次,保障用户的知情权,合理制定数据流通规则。经营者作为数据流通规则的制定者,往往会存在不正当的竞争行为,例如Facebook利用其优势地位,迫使用户签订不合理的用户隐私授权条款等。为解决这一困境,需经营者承担起相应的责任,可以采取听证、民意调查等多种方式,通过消息推送、短信、多媒体通知等多种途径与用户协商,制定合理的流通规则。同时,可以拓宽数据流通渠道,扩大数据流通范围,充分发挥数据生产要素的作用。经营者在取得用户的授权许可后,可通过市场调研,了解市场动态,通过普通许可、排他许可、独占许可等多种方式扩大数据流通对象。为保障用户的隐私数据,可以附加合理的交易条件,如禁止泄露用户的隐私数据、限制非法用途等。当然,涉及核心利益的数据确实难以基于某种合作而实现互通有无的,可不进行流通。
3.加强宏观层面的顶层设计
大数据的来源和形态错综复杂,如果无法对零散数据进行有效分析,企业就很难借助数据资源进行更好发展。同时,由于数据标准不统一,经营者往往按自己企业内部的要求确定数据采集标准,各自建立数据库,又加大了数据治理的难度。因此,单靠市场主体难以完成数据治理任务,需要发挥国家宏观调控的指导作用。
首先,需完善数据流通治理的系统设计。数据治理涉及方方面面,需从实际情况出发,从统领全局的高度深化顶层设计,建立一套中央统筹、地方落实的管理办法。中央部门可以在资金、技术、政策等方面创造条件,加强工作指导;省级部门可以结合实际情况细化政策措施,因地制宜,推动政策精准落实。
其次,政府要构建数据中心技术框架,将数据标准、元数据、主数据统一起来,形成数据管理平台。当前法律虽设计了分级保护的数据框架,但对于市场主体而言,依然不明确哪些数据应给予什么级别的保护。如在数据流通中,哪些数据可以流通,流通范围的界定等问题还没有明确的法律规定。学界对此也展开了深入研究,按用途的不同,数据可分为生产要素、价值商品、策略性资源;按来源的不同,数据可分为个人数据、产业数据、公共数据等,依不同的分类,可以具体化相关的数据流通规则。
再次,解决数据确权问题,需国家从立法层面给予回应,即对数据的所有权和使用权进行明确划分。从当下看,需借助先进的互联网技术确定数据的源代码,明确数据的所有权,以法律的形式将之合法化。对于原始数据而言,用户作为提供者,当然享有所有权,其使用应受用户的控制。对于经营者通过搜集、分析、加工后的二次数据,因经营者付出了相应代价(提供免费服务、进行数据加工劳动等),经用户授权后可享有所有权。
最后,要引导建立完善的监督管理体系。对于政府而言,主要的措施是建立专门的监管平台,培养专业化的数据治理人才,制定合理的监督评估制度。如对于流通规则的制定,政府应发挥监管作用,保障制定程序和制定内容的合法,“对于经营者以数据专享为名实施排除、限制市场竞争的行为,影响数据共享的,则应予以规制”[15]。对于行业协会而言,应积极发挥引导作用,培养专业化人才,协调解决数据流通中的一般性冲突,制定合理的行业标准,促进数据资源的流动。对于个人而言,要加强相关法律制度的学习,敢于和侵权行为作斗争。只有建立这样一套“国家—行业协会—个人”的监督体系,才能充分激发市场活力,保障数据的正常流通。