论数据构成必需设施的标准
——兼评《关于平台经济领域的反垄断指南》第十四条之修改
2021-11-26李世佳
李世佳
(中国政法大学 民商经济法学院,北京 100088)
从美国LinkedIn拒绝hiQ访问其数据一案开始,数据访问限制行为逐渐进入了反垄断视野。在此案中,作为数据分析公司的hiQ通过采集整理职场用户的数据为有需求的用人单位做分析报告。LinkedIn平台上活跃着庞大的职场用户群,关于职场用户的数据,有着其他经营者无法比拟的数据数量和质量。但面对hiQ访问其用户数据的行为,LinkedIn以保护用户隐私为由选择了拒绝。hiQ无法从他处获得同等数量和质量的职场用户数据,陷入了运营困境。最后,hiQ提起诉讼,认为这是LinkedIn滥用市场支配地位的行为,要求其开放用户数据,法院予以支持①See hiQ Labs,Inc.v.LinkedIn Corporation,273 F.Supp.3d 1099(2017).。其后,在我国发生的顺丰与菜鸟之争、新浪与脉脉之争均属于此。
数字经济中,最活跃的经营者主体是互联网平台,而互联网平台的核心特性是数据性。互联网平台的核心生产要素是数据,互联网平台的商业运作模式围绕数据展开。在数字经济时代,数据就像农业经济时代的水源和工业经济时代的石油一样,其重要性不言而喻。由于网络效应、转化成本和规模经济等因素的存在,率先掌控了庞大数据的互联网平台经营者占尽竞争优势。“数据寡头”控制着数据市场中的绝对百分比,以移动互联网为例,前10%的数据控制者持有着市场内99%的数据[1],后进入者往往难以在短时间内获取同量同质的相关数据开展业务。以数据为核心驱动力的平台经济模式自诞生之日起便天然携带“垄断基因”,优势平台通过早期数据积累诞生的“数据霸权”进行垄断行为的案件不胜枚举[2]。其中,最典型的就是拥有先发数据竞争优势的互联网平台经营者对其他平台经营者采取的数据访问限制行为,使得关系到整个行业生存的数据尽归己有。由此,对数据访问限制行为的规制势在必行,而其中最关键的一环就是对经营者开放义务即数据构成必需设施的认定。
一、既有规制:核心要件的缺失与垄断层面的混淆
通用技术的“创造性破坏”是社会更迭的原因。通用技术是指具有通用和普适的功能,具有超越特定产品或者产业、辐射到整个社会的技术。信息技术作为引领数字时代到来的通用技术,凭借互联网和数字化的辐射与渗透能力:微观上,将个人身份数据与活动数据进行数字化编码,形成较之以往更为容易传播、采集、处理和使用的数字符号,使得数据成为新的核心生产要素;宏观上,产业的生产流程、组织形式发生了巨大变化,互联网平台成为生发、串联数字经济下商业帝国的组织形态[3]。物质生产力的发展定然催生社会规则的重构,从农业社会到工业社会,法律历经了从以土地为中心到以市场为中心的秩序更迭。而今,人类社会发展到信息社会,法律必然要围绕数据开展新一轮的厘革[4]。
从域内看,2020年11月10日,国家市场监管总局发布《关于平台经济领域的反垄断指南(征求意见稿)》(以下简称《指南(征求意见稿)》),致力于多角度规制平台经济中的垄断行为,其中第十四条规定数据在一定标准下可以被视为必需设施①这里的“必需设施”意指世界各国反垄断立法与实践中的“Essential Facilities(Doctrine)”一词,该词主流中文翻译为“必需设施”。另有学者称为“基础设施”,均为同一英文短语的不同翻译。如冯然:《竞争约束、运行范式与互联网平台寡头垄断治理》,《改革》2017第5期,第106-113页。为统一用词,考虑到《关于平台经济领域的反垄断指南(征求意见稿)》与《关于平台经济领域的反垄断指南》的称谓,本文全文均使用“必需设施”一词。,即“具有市场支配地位的平台经济领域经营者”如果“控制平台经济领域必需设施”并“拒绝与交易相对人以合理条件进行交易”,可能构成拒绝交易行为;如果某类数据达到“数据本身参与竞争不可或缺,数据获取渠道唯一,数据开放可能且对数据控制者不会造成不合理影响”的标准,可以视为必需设施。2021年2月7日,国务院反垄断委员会正式印发《关于平台经济领域的反垄断指南》(以下简称《指南》),对数字经济时代公平竞争市场环境的营造、平台经济垄断行为的预防和制止有着重要意义。但遗憾的是,第十四条删掉了相关内容,最终规定“认定相关平台是否构成必需设施,一般需要综合考虑该平台占有数据情况、其他平台的可替代性……因素。”除了上述《指南(征求意见稿)》和《指南》外,2020年4月9日,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,要求加快培育数据要素市场,提升社会数据资源价值,加强数据资源整合和安全保护;12月11日与16日,在中央政治局会议与中央经济工作会议上,“强化反垄断和防止资本无序扩张”被再三强调,剑指平台企业垄断;紧接着,2021年1月31日,中共中央办公厅、国务院办公厅印发《建设高标准市场体系行动方案》,要求培育发展数据要素市场,建立数据资源产权、交易流通等基础制度和标准规范,推动数据资源开发利用。
从域外看,2020年1月24日,德国《反限制竞争法》第10次修正草案公布,修改集中在第19a条,包括互联网平台的市场力量评估、滥用市场力量行为的因果分析方法等方面,并明确指出自我优待、限制数据携带权和跨界传导市场权力等行为违法。同年7月1日,英国发布《在线平台与数字广告》调研报告,提出建立“数字市场部”并确立了一系列规制互联网平台反竞争的措施,如包括处理数据访问限制、平台之间的用户数据转换限制行为在内的数据相关干预措施等。从2020年11月开始至12月,欧盟委员会接连下发三项规制数字经济中法律问题的文件:11月25日,《数据治理法》(Data Governance Act)发布,要求建立数据共享框架,实现欧盟“单一数字市场”的宏愿;12月15日,《数字服务法》(Digital Services Act)和《数字市场法》(Digital Markets Act)发布,前者重在强调互联网平台经营者提供商品或服务时需保障用户权利,后者则重在规制达到一定营业额或市值标准的“守门人”(互联网平台)的不公平竞争问题,如卖家可以自由选择在一个或多个电子商务平台上进行销售等。
各国剑指数字经济反垄断,并着重施墨于平台与数据。从既有文件可以看出,在规制理念上,世界范围内已经基本达成一致:作为数字经济时代组织形态的互联网平台进入反垄断视野并被重视,作为数字经济时代生产要素的数据在一定条件下需要开放,对数据访问限制行为的规制是大势所趋。但在规制细节上,对如何认定数据访问限制构成垄断行为却存在两个方面的问题:第一个问题可以说是共有问题,缺乏核心认定要件的设置,即限制对何种类型数据的访问需要反垄断力量的介入?针对这个问题,本文认为,理应引入必需设施作为评价标准;第二个问题则是我国《指南》中存在的问题,《指南(征求意见稿)》肯定了数据在互联网平台经营者参与竞争中的重要作用,规定可以将数据视为必需设施,建立起“认定经营者市场支配地位—认定数据为必需设施—认定为拒绝交易行为”的分析思路。尽管对数据构成必需设施的认定标准仍需完善,但明文将数据视为必需设施是反垄断系列法律法规对数字经济发展在世界范围内里程碑式的回应。但是《指南》第十四条却删除了将数据视为必需设施的专门规定;且将数据占有情况与平台必需设施两个不同层次的概念混为一谈,统一规制于平台必需设施之下。随之发布的相关解释性文件亦未阐明第十四条中关于数据必需设施规定的删改原因①2021年02月07日,与《指南》同日发布的《国务院反垄断委员会办公室负责同志就〈国务院反垄断委员会关于平台经济领域的反垄断指南〉答记者问》《促进平台经济规范有序创新健康发展——〈国务院反垄断委员会关于平台经济领域的反垄断指南〉解读》,以及2021年2月8日发布的《一图读懂|促进平台经济规范有序创新健康发展——〈国务院反垄断委员会关于平台经济领域的反垄断指南〉解读》三个文件均未做说明。。笔者猜测,删除对数据构成必需设施的单独规制,或许主要原因是对数据的非排他性的考量,但数据的非排他性并不意味着所有平台都有能力去收集同等数量与质量的数据。由此,本文认为,应当明确辨析数据作为必需设施与平台作为必需设施分属不同的垄断生发层面,二者不可混为一谈,回归《指南(征求意见稿)》将数据作为必需设施的内容专款规制。
遵循此逻辑,本文将首先通过平台对数据的商业运作模式来辨析平台与数据需要分开作为必需设施规制的原因,其后再进一步论证如何设置数据构成必需设施的标准。
二、关系理顺:依靠数据运转的平台
《指南》第二条中规定,平台意指互联网平台,即相互依赖的双边(多边)主体依靠网络信息技术,在特定载体提供的规则下交互,从而共同创造价值的商业组织形态。在数字经济体系中,平台是组织基础,数据是生产要素。如果把互联网平台比作树,那么数据就是树的脉络。
(一)概念厘清:何为“数据”
学界对“平台”一词的定义并无太大争议,但在对数据竞争问题的探究中,却往往模糊了“数据”一词与“大数据”一词的含义,较为随意地混同使用这两个语词。关于“大数据”一词的定义,学界还没有达成一致的说法。有学者认为,大数据可能有以下三方面的含义:一是指一种探索真理与事物之间的相关性,核心在于预测的方法论;二是指一种利用各种工具对数据进行分析的过程;三是指一种能够速度、准确地采集和分析数据的能力[5]。有学者认为,从微观层面看,大数据是一种采集、处理数据的技术;从宏观层面看,大数据是一种通过采集、处理数据来分析趋势,寻找事物的发展规律的思维方式[6]。艾瑞网指出,大数据是指传统软件工具在其运行的时间能力内,无法捕获和分析的数据集,它具有数据规模大、数据流转快、数据类型多、价值密度低四个特征[7]。从法律角度上看,无论是理论界还是立法与司法实务界,都避免正面赋予“大数据”定义,在大多情况下,使用较为主流的类似于艾瑞网“4V”标准来对其进行描述性的界定,即“规模性、高速性、多样性、价值性”,将“大数据”定义为“海量数据(普通数据)的集合”。法律的抽象程度与其解释力呈正比例关系,这样的定义存在一定的优点,就是更容易让普通人理解;与之对应的是,法律的抽象程度与其可用性呈现出反比例关系,这样的定义使得在绝大多数人的理解里,“大数据”和“数据”在本质上是相同的,从而造成了二者的混同[8]。
“大数据”的应有之义众说纷纭,但并不在本文的研究范畴内。上述讨论只是为了明晰本文研究对象中的“数据”,与“大数据”一词概念并不相同。通常认为,数据是指以数字、图形、图像或者录音等形式表达的客观事实,是信息的表现方式[9]。信息和数据两个语词同样也存在混用行为,即使是新颁布的民法典也没有做明确区分,究其本质区别,两者应当分属信息本体和媒介范畴[10]。一般在研究互联网平台的商业运作模式以及引发的反不正当竞争、反垄断问题时采用“数据”一词,在研究消费者隐私时采用“信息”一词,因而本文研究采用“数据”一词。本文探讨的数据范围界定为在线数据,平台竞争是在线数据之间的竞争,线下数据不在竞争范围之内。互联网平台采集的数据类型多种多样,分类标准也很多。欧盟在2020年11月25日新出台的《数据治理法》中,将“数据”一词的内涵定义为:行为、事实或信息的任何数字表示或者其他任何此类行为、事实或信息的汇编,包括声音、视觉或视听记录等形式。这样看来似乎过于抽象,本文拟以数据的获得方式为划分标准,将数据大致分为三类,以明晰本文“数据”一词的外延。第一类是“主动赋权型数据”,比如当用户使用某个App时,页面可能会弹出提醒:“允许此App访问您的位置信息吗?”并且附带三个选项:始终允许;仅应用使用期间;不允许。当用户选择了允许,便赋予了App经营者采集其地理位置信息的权利,其他诸如个人头像、性别、年龄等数据亦多会在此阶段采集。第二类是“行为追踪型数据”,比如当用户在使用搜索引擎查找信息时,搜索引擎运营商会记录下该用户的浏览记录。第三类是“计算分析型数据”,比如说搜索引擎运营商通过对用户浏览内容的分析为其建立行为习惯的数据库,以推荐该用户感兴趣的内容。本文的“数据”是指互联网平台经营者采集的“主动赋权型数据”“行为追踪型数据”等相对初级的数据。同时,根据常识可以认为能够在这样的数据市场中采集大量数据并产生垄断威胁的互联网平台具有将其计算、分析产生“计算分析型数据”的能力。因此,本文的数据是较为广义的数据,指代“主动赋权型数据”“行为追踪型数据”等初级数据和提炼之后出来的“计算分析型数据”。
(二)运作分析:数据作为平台商业模式的核心生产要素
数据是互联网平台经营者提供商品与服务的必要原材料。有学者指出,尽管数字经济发展的万千脉络错综复杂,但与传统经济相比,在本质上更加单纯统一,所有环节皆由同一种行为——“数据相关行为”演化而成,并形成一个在逻辑上递进的系统性模式,即关于数据的“采集—计算—服务—应用”的商业运作模式[11]。“数据相关行为”这个概念极其精妙地揭示了数字经济的本质,但是最后形成的系统性模式用循环系统模式来展示会更为形象,因为数据的采集、计算、服务等环节是反馈循环的[12],另外,“应用”一词可以包含在广义的服务之中,即依靠数据,互联网平台经营者建立起数据“采集—计算—服务—采集”的商业运作模式。
1.平台商业模式中的三种数据相关行为。“数据相关行为”是互联网平台经营者对数据的具体商业运作行为。以数据运作阶段为划分依据,可以将互联网平台经营者对数据的具体商业运作行为分为三种:分别是数据采集行为、数据计算行为和数据服务行为。数据采集行为是平台经营者采集数据尤其是用户数据的行为。数据计算行为是平台经营者对数据进行分析,以待进一步服务的行为。数据服务行为,一是指平台经营者利用数据作为原材料提升既有商品与服务水平、创造新的商品与服务的行为,这是最核心的数据服务表现,也是网络平台经营者得以做大做强的最重要一步;二是指平台经营者直接将数据作为商品出售的行为,这只是极其次要的数据服务表现,本文重点探究的是第一种行为表现。经历了数据“采集—计算—服务”的全过程,互联网平台经营者的商业规模进一步扩大,采集信息的总量大幅扩张,由此形成“采集—计算—服务—采集”的良性循环系统。
2.平台对数据商业运作模式的具体阐释。本文以搜索引擎平台为例,具体阐释数据的商业运作模式。在“数据采集”流程中,根据数据获取的时间点不同,“主动授权型数据”又可以细分为两种:一种是“无目的主动授权型数据”,另一种是“有目的主动授权型数据”。当用户打开某个搜索引擎查询自己所需的信息时,搜索引擎运营商会弹出询问窗口,是否允许获得位置信息,此时一部分用户已经将自己的位置信息授权给了该搜索引擎平台。这个时间段的授权是没有特别目的的,所以称之为“无目的主动授权型数据”。接下来,用户在使用搜索引擎平台时,可能会涉及其他功能,比如首页的“天气”功能,或者路线查询的“地图”功能,这些功能也会涉及用户的地理位置信息,由此又会有一些用户在使用过程中完成授权。这个时间段的授权是有特别目的的,所以称之为“有目的主动授权型数据”。与此相同的还有手机号、微信号及头像、昵称,性别、生日等个人信息。在打开搜索引擎平台时,界面会弹出注册登录提醒,用户可以通过手机号注册登录,这时平台会获得用户的手机号码信息,用户也可以选择使用微信号直接登录,在此平台会请求授权获得微信头像、昵称等信息。在新注册登录之后,平台还会请求用户完善个人信息,有时会附有一定的奖励如平台币等,这就导致用户可能会授权平台更多的个人信息。这些都是“无目的主动授权型数据”。其后,用户在使用搜索引擎平台的过程中,可能会对某则新闻和消息感兴趣,此时用户可能选择“收藏”,这时未注册登录的用户就会收到网页提醒,需要注册登录之后才可以拥有账号作为收藏基地;另外,用户在使用搜索引擎平台的过程中,可能会进行消费,而消费亦需要注册登录之后才可以完成。这些都是“有目的主动授权型数据”。
平台在反馈给用户搜索结果的过程中,也会采集相关的数据,例如用户搜索的关键词、结果呈现后点击的链接、点击的时间,如果是使用手机App进行的搜索,甚至还会获取用户的地理位置等,这些便是“行为跟踪型数据”的采集。采集完初始数据之后,搜索引擎平台经营者会通过算法进一步提炼这些数据,这就是“数据计算”流程,从而产生“计算分析型”数据。比如通过组合在用户身上采集到的数据,为每个用户创建单独的搜索偏好档案等。
数据的采集与利用对平台经营者的商业运作具有重要意义。在“数据服务”流程中,通过利用采集与计算得来的数据,平台经营者可以以多种方式改进既有商品和服务,并开发全新的商品和服务。例如,搜索引擎平台经营者可以使用从用户搜索和点击中获得的数据来提供更相关、高质量的搜索结果[13]。从用户角度来看,搜索结果的相关性是用户选择某个搜索引擎平台的重要原因。一方面,通过对平台本身算法的改善,使得搜索结果在一般意义上更符合用户的需求;另一方面,通过对用户搜索历史数据的整合建立起个人的特色数据库,使得对具体用户的搜索反馈结果更加个性化,从而不断吸引用户。从广告商角度来看,搜索引擎平台经营者利用广告招商来获得收入,主要包括竞价排名、网页固定位置静态广告投放和针对性定点对人动态广告投放等几种形式。此时,广告的反响程度与用户需求的相关性起到了重要作用。平台本身算法的提升和对用户个人特色数据库的建立使得搜索引擎平台能够更好地完成“一般+定点”的广告投放业务,既自身获利、又使得广告商推销成功的机会增多,进而吸引更多的广告商,获得更多的收益。“媒体平台向消费者传播一些有价值的内容,如音乐……该内容往往伴随有利用消费者自身数据投放的有针对性的广告”正是一种具体体现[14]。这就是“数据服务”的核心流程。
(三)平台与数据:生发垄断的两个不同层面
平台与数据并不是一个层次上的概念或形态,由此生发的垄断行为亦应当分开讨论。数据层面生发的垄断行为突出展现为数据访问限制行为,包括前文提到的hiQ诉LinkedIn案、顺丰与菜鸟之争等。相比于数据层面,平台层面生发的垄断行为展现形式更多,平台之间的竞争与博弈日渐白热化,比如“二选一”、算法合谋、扼杀性收购等行为[15]。2021年2月发生的“互联网反垄断第一案”:抖音诉腾讯案就是典型的平台垄断行为。抖音诉称,腾讯在旗下的社交网络平台限制用户分享、播放源自抖音的视频近三年之久。当前,即时通信平台已成为互联网领域的基础应用,微信、QQ庞大的既有用户群体配合网络效应,使得用户更换平台的概率极低,没有其他平台能够与其竞争,由此腾讯方行为是典型的滥用市场支配地位的行为[16]。
界定相关市场是评估市场力量和分析滥用行为的起点[17],对平台与数据生发的垄断行为分属不同层面的分析,可以溯源到垄断行为所在的相关市场去讨论。相关市场理论源自1962年美国最高法院对布朗鞋案①See Brown Shoe Co.v.United States,370 U.S.294(1962).的判决,自此之后,界定相关市场成为各国适用反垄断法律评价竞争行为时的一个重要前提[18]。评价某种行为是否构成垄断时,存在两种价值衡量标准,一种是“本身违法原则”,另一种是“合理原则”,两种标准的不同适用主要出于对该行为是否明显严重地损害了竞争的考量。对于适用前种标准的行为,比如典型的价格卡特尔,出于其对竞争的严重损害性,对其是“存在即垄断”的处理方式,无须再通过其他分析来判定是否构成垄断。对于适用后种标准的行为,则需要通过其对竞争影响后果的考量来判定其是否构成垄断,而判断对市场竞争的影响,适用反垄断法律来进行合理性分析,就需要界定相关市场,遵循“界定相关市场—判定是否垄断”的逻辑链条。在各国反垄断法的实施过程中,适用前种原则的案件是少数,适用后种原则的案件占了绝大多数[19]。
当下,不管是平台还是数据层面生发的垄断行为,“本身违法”程度的垄断已经几乎不存在,因此均需界定相关市场。数据访问限制行为,是数据控制者滥用相关数据市场的市场支配地位,在数据对接层面予以的封锁;代表平台之间竞争的抖音诉腾讯案,则是滥用了在即时通信平台市场的市场支配地位,是平台层面出现的问题。由此观之,可以明晰平台与数据二者生发的垄断行为从源头上就是不同的,分属不同市场。因此,当评价二者是否构成必要设施时,理应分款讨论。
三、理论证成:数据何以构成必需设施
数字经济的生产与创造之源是数据,但数据本身是非竞争性的,同一个或者同一组数据被一个人或一群人使用不会有损数据本身的价值,甚至在一定程度上会激发更好的社会价值。由此,共享数据是促进竞争和推动创新的重要基础。尽管数据本身是非竞争性的,但在数据采集、处理过程中形成的无与伦比的先发竞争优势却是平台维持自身垄断地位和打击对手参与竞争的强大力量。一般而言,平台本身并没有向他人开放数据的积极意愿,反而具有极强的数据封锁倾向。因此,规制数据访问限制行为成为数字经济中的反垄断重点[20]。而引入必需设施原则是评价数据访问限制行为的关键要件。
必需设施原则用于规制掌控市场“要道”经营者的排除、限制竞争行为,并从实体领域进一步引入到与互联网和知识产权有关的垄断中[21]。基于数据竞争先发优势的难以企及性和数据的社会公共性,在达到“要道”的情形下,数据应当被视为必需设施,向其他经营者开放。
(一)数据竞争:先发优势的难以企及
数字经济的典型特征就是,如果把所有的经济活动做“约分”,那“约分”到最后都是数据,而这些数据在本质上都是用户数据。这样的经济模式使得市场竞争模式发生了翻天覆地的变化,“跨界竞争”达到了从未有过的竞争维度,运用“传导效应”使得在原市场(核心市场)的竞争优势的触手伸向不相关市场甚至未来市场。手里控制着大量数据的互联网平台经营者通过其在某个原市场积攒的市场力量,可以井喷式地在其他看似毫不相关的市场创造竞争增点,形成体系庞大的商业帝国式闭环生态链。最终,平台经营者凭借生态链力量可以采集更多的数据,从而形成强大的数据采集循环系统,并设置与其数据相关市场的进入障碍。
数据市场上的先发优势是后来者很难企及的,这主要体现在数据数量和数据质量两个方面。从数据数量上看,新进入者无法获得同等数量的数据。出于网络效应、转化成本和规模经济的考虑,新进入者就无法与拥有市场支配力量的老牌互联网平台经营者相抗衡。以社交互联网平台为例,从用户方的网络效应和转化成本来看,腾讯系旗下微信与QQ①以微信、QQ作为例证并无针对性,仅做说明用途。锁定了庞大的社交用户,在相当一段时间内不会有同等能力的App出现采集这些数据,因为新进入的社交软件必须能够吸引用户。由于网络效应和转化成本等因素,中国绝大多数的用户都被“粘”在了腾讯系软件之下,新进入者根本无力吸引用户,也无法获得社交软件数据市场的用户数据,这是差异化创新也达不到的。网络效应来源于消费环节,也被称为需求方规模经济。当消费者从一种商品消费中获得的效用随着购买该商品的人的数量增加而出现时,网络效应就会出现,在这过程中产品或服务随着用户数量的增长而变得更有价值,比如使用微信的用户越多,微信的价值就越高,由此使用的人会更多。转化成本指的是用户前期在某个平台上的时间、金钱等资源的投入使得其难以转向其他平台,比如用户在微信上添加了大量的好友,建立起属于自己的朋友圈,如果转移平台,除了好友需要重新添加(甚至很多好友在其他平台并没有账号),朋友圈里分享、记录的内容或者说回忆也无法带走,因此就被牢牢“粘”在了微信上。另外,从互联网平台经营者一方来看,由于规模经济的存在,用户规模越大的互联网平台,吸引额外用户的成本就会越小,发展新的业务、扩展新的客户群就越容易,这就使得新进入者靠新业务吸引用户的可能性更小。所以,极有可能出现相当一段时间内,新进入者也无法获得同等数量数据的情形。
从数据质量上看,新进入者也无法获得同等质量的数据。同样以社交互联网平台举例,腾讯系旗下的微信与QQ采集到的数据质量远非其他小型社交互联网平台采集到的用户数据质量可比。同样仅以用户黏性为视角,一个用户可能同时使用微信、QQ与另外几款社交软件,但绝大多数用户在微信与QQ软件上的活跃度无疑是最高的,分享数据包括位置信息等必然是最频繁的,腾讯系软件在社交软件数据市场获得的用户数据一定是最丰富、质量最高的[22]。
(二)二元属性:数据兼具平台私人性与社会公共性
数字经济的迅猛发展使得数据的意义和价值超越了私人领域——数据不仅仅是传统意义上的某个人或某个经营者的私产,更是关系着国家安全、社会公共利益、行业整体创新等诸多公共领域的关键要素。数据的保护与权属配置仅仅遵循私法逻辑,已经很难完整地回应数字经济发展带来的数据共享问题,有必要以国家权力介入,运用竞争法来规制数据共享问题[23],实现保护创新、促进竞争、提升效率的目的。
关于数据权属于谁,首先应当根据互联网平台对数据运作流程中数据的存在阶段来分情况讨论:一种是“初始数据”,指代用户(或者说自然人)未提供给互联网平台的数据;一种是“流转数据”,指代用户提供给互联网平台的数据。以将数据提供给互联网平台为节点,节点前的数据权利归属问题可称之为“初始数据权属问题”,节点后的数据权利归属问题可称之为“流转数据权属问题”。关于初始数据权属问题,即用户本身持有的、未提供给互联网平台的数据权属,理论界较少有争议,均认为此类初始数据权属于用户本身。关于对初始数据的保护,意见也较为统一,即赋予用户以合理范围内的数据权利,使得个人数据权利保护与数据商业活动的法律范围达到平衡。并且,应当为用户提供救济措施,当用户的个人数据权利受到侵害如被非法采集、利用时,能够依据法律来捍卫自己的权利[24]。关于流转数据权属问题,即用户将自身数据授权提供给互联网平台经营者之后由互联网平台经营者所持有的数据权属问题,理论界主流意见是互联网平台经营者所持有的数据归平台所有。本文认同这一观点,但认为除平台私人性外,流转数据还具有社会公共性。
有学者提出,社会公共性需要从四个维度去理解:范围、属性、宗旨与实现手段,与此分别对应“社会性”“公共性”“公益性”与“干预”[25]。从范围上看,社会公共性的范围是社会性的,社会性指的是普遍性、全局性和大众性,而非特殊性、局部性和个人性;社会制度、基础设施和资源协调等都具有社会性。从属性上看,社会公共性的属性是共有性的。共有性与私有性相对应,指的是共享性、共同性,而非排他性、差异性。可以以主体、权利(力)、决策和生产分别举例说明,在社会公共性领域纯粹的私人主体与公共主体共同活动、私人权利和公共权力共同运作、私人自治与公共决策共同存在、私人物品和公共物品共同生产。从宗旨上看,社会公共性的宗旨是公益性的。从利益所属、利益分配、利益本位和利益分配来看,公益性分别对应公共性、公平性和社会性,而非私人性、独享性和个人性;收入分配、社会秩序和环境保护等都体现出公益性。从实现手段上看,社会公共性的实现需要干预性,除了内在自发、市场调节和私人自治,还需要外在干预、国家权力和公共决策;主要包括从立法、司法和行政三个方面的干预[26]。只有同时符合“社会性”“公共性”“公益性”与“干预性”,才具有社会公共性。
毫无疑问,数据的采集是“普遍性、全局性和大众性”的。作为一种生产要素,当数据成为某个行业赖以生存的关键来源时,便不仅仅是互联网平台运营者的私产,理应由“国家干预”而获得“共享性和共同性”,实现“公共性、公平性和社会性”,而这种干预便是反垄断法的介入。当某个互联网平台运营者独占了涉及整个行业运营秩序的某类基础性数据,却不合理地拒绝使用或拒绝访问,对行业竞争秩序产生重要影响时,则需要进行规制。因为此时,数据并不是两个经营者之间的私人交易,它不仅仅用于个体服务于个体,更是个体服务于整个行业和社会,数据已经不再是传统意义上的私产,它兼具平台自身利益和社会公共利益的二元属性。反垄断法在面临经济领域中经济秩序与经济增长的社会公共利益时[27],需要使独占了涉及整个行业运营秩序的某类基础性数据的互联网平台运营者,负有交易的义务。
这也正是为什么一个生产成本接近于零的经济时代需要反垄断法的原因,不仅与“一切都或多或少是免费”的直觉相反,随着经济发展朝着零成本生产的方向前进,对反垄断的需求实际上可能会更大。反垄断法应当更新并专注于两个目标:打击运用私人市场力量排斥降低成本创新的行为;打击使用国家权力来维持或创造“人为稀缺”的行为。而对数据构成必需设施时的开放规制,正是属于第一种[28]。另外,跨出反垄断,面向其他领域,在数字经济时代,通过帮助解决一系列复杂的社会问题,数据有望为社会公益带来变革性的资源传送,然而数据尤其是商业网络平台持有的数据常常被限制访问[29]。虽然涉及公益事件的数据的开放认定与本文探讨的行业发展中的垄断数据不尽相同,但可以看出,对相关数据的开放成为时代发展中的重要问题。
四、标准设置:数据构成必需设施的应然条件
评价数据访问限制行为时,必需设施原则是核心要件。必需设施原则是在工业经济时代确立的竞争规则,最初适用于铁路、电网等实体存在,之后在漫长的法律实践中逐渐将适用范围拓展至虚拟领域,如知识产权、资讯等。随着数字经济的发展,平台生长成型并成为基本组织形式,数据成为平台得以运转的血液。平台在某些情形下对其掌控的数据负有开放的义务,用户隐私保护不能成为其拒绝数据访问的借口。面对数据访问限制行为,全部判以开放是不合情理的,由此设置必需设施标准,将符合标准的数据认定为必需设施并赋以经营者开放的义务不失为一个良好的路径选择[30]。
(一)必需设施理论:源起、发展与应用探讨
必需设施理论源于1912年美国政府诉终点铁路集团案。终点铁路集团收购了所有路易斯安那州的铁路桥和转运场,并且拒绝竞争对手使用。法院判决其为竞争对手提供相关设施的共同所有权;如果竞争对手不想成为共同所有者,终点铁路集团必须在合理条件下提供相关设施的使用①See United States v.Terminal Railroad Ass’n,224 U.S.383(1912).。此后,第七巡回法院认为某个设施的垄断者可能会利用这种优势地位对其他竞争者进行限制,因此阐明过必需设施原则的适用情形:首先,需证明垄断者控制了这项必需设施;其次,需证明竞争对手没有办法复制创造出这项必需设施;再次,需证明必需设施拥有者拒绝竞争对手使用这项必需设施;最后,需证明必需设施拥有者有提供这项设施的可行性②See MCI Communications Corp.v.American Tel.&Tel.Co.,464 U.S.891(1983).。
欧盟委员会在Magill案中将必需设施原则从实体存在领域延伸到知识产权领域。在爱尔兰,电视台一般会制作本台每周节目预告并提前在报纸上发布。Magill公司想要建立一个包含所有电视台节目在内的观看指南,包括没有制作节目预告的三家电视台,三家电视台以版权保护节目列表为由拒绝了Magill公司。法院认为:首先,电视台是节目列表基本信息的唯一来源;其次,节目列表是制作全面的每周电视指南不可或缺的原材料;最后,这种禁止行为阻碍了一种潜在的消费需求所指向的新产品的出现。基于此,法院认为三家电视台构成了市场支配地位的滥用③See RTE v.Commission,[1991]ECR II-485 and T-76/89 ITP v.Commission[1991]ECR II-575.。
2005年,在ATR诉英国赛马委员会一案中,必需设施理论进一步被适用于数据领域[31]。ATR诉称英国赛马委员会通过互联网、电视和其他视听渠道提供英国赛马播报,同时还向各种客户提供英国赛马的相关赛前数据。ATR原为赛前数据的购买者,但现在不能以可接受的条件与赛马委员会达成新的数据购买协议。但赛马委员会垄断了英国赛马的赛前信息数据库,该数据库不可复制,是提供赛马互联网节目、电视节目和合法博彩业务的下游经营者所必需的原材料。最终,法院认为英国赛马委员会控制的赛前数据构成了必需设施,其缺乏拒绝提供给ATR公司赛前数据的正当理由,滥用了市场支配地位④See Attheraces Ltd.v.British Horse Racing Board,[2005]EWHC 3015.。
但在数字经济中,在立法界,《指南(征求意见稿)》是迄今为止唯一明确规定了数据构成必需设施标准的文件,遗憾的是未能落地。归纳而言,《指南(征求意见稿)》设置的标准如下:数据本身参与竞争的不可或缺性;数据获取渠道的唯一性;数据开放技术的可能性;对数据控制者可能造成的影响。在学术界,已经有一部分学者提出了初步框架设计,大致可以将标准总结为以下几点:控制数据的垄断者在技术上具有开放的可行性,但拒绝开放;竞争者要求访问的数据在其提供商品或服务的过程中不可或缺,且无法通过自己获得;数据保密级别、数据访问用途等问题不影响控制数据的经营者的合法权益。如果数据访问并非不可或缺,那么反垄断力量不需要介入,此时更多的是经营者之间意思自治。何为不可或缺?举例说明:数据访问以提升AI算法为目的时,反垄断力量不宜介入;数据访问以提供售后或配件为目的时,则应从法律上保证数据的合理访问[32]。
(二)数据构成必需设施的标准:兼对《指南》第十四条的完善
正如有学者指出的,在一定程度上,我们应当将必需设施原则摆在一个重要的地位,以帮助监管需要开放访问的资产,必需设施理论所讨论的设施是一种“投入”,它可以创造大量的下游正外部性,由此开放获取制度是符合社会大多数人希望的。并且,必需设施理论应当涵盖更广泛意义下的各类“投入”,将反垄断领域内的狭隘争议与私法领域内各类财产开放问题联系起来,成为一种调节两种截然不同的法律和社会愿景之间的制度[33]。在数字经济领域,《指南(征求意见稿)》已经提供了将数据视为必需设施的基本规制框架,为数字经济中的重要资产数据的开放拟出了初步章程。本文拟在《指南(征求意见稿)》第十四条的基础上,结合域内外判例实践与学术探讨,设计出数据构成必需设施的标准,并对《指南》第十四条关于数据构成必需设施的规制部分,进行包括适用除外等情形在内的完整规制设计。
在数据构成必需设施的标准设置上,需要符合以下条件。一方面,从数据本身看:第一,相关数据是某种商品、某类服务甚至某个行业的基本生产要素,如果不能获得此类数据,那么某种商品无法生产、某类服务不能提供乃至某个行业面临瘫痪,即“没有数据无法竞争”;第二,其他任何数据都无法在性质或功能上完全替代这些数据来完成商品生产、服务提供或行业运转,即“其他数据不能替代”。另一方面从数据的控制条件看:第一,某个互联网平台经营者是控制相关数据的唯一经营者,即“相关数据一人所持”;第二,其他任何互联网平台经营者不能通过自身的劳动来开发或者复制获得这些数据,即“开发复制均不可行”[34]。换言之,在《指南(征求意见稿)》第十四条设置的“没有数据无法竞争”和“相关数据一人所持”两个要件之外,再加上“其他数据不能替代”和“开发复制均不可行”两个要件,这样就完成了对必需设施标准的完整阐述。
欧盟委员会在认定过程中的“潜在的消费需求所指向的新产品的出现”一项,本文认为,这不是构成必需设施的必需要件。原因有二:一是阻碍了现有商品和服务的正常生产与竞争已经构成了对竞争的排除和限制;二是在数字经济时代,用户数据是所有经济活动构成的基本元素,所有新商品与服务的出现都需要基本的用户数据作为生产要素,由此,不同于传统的经济领域,在数字经济中探讨数据是否阻碍了潜在需求的新产品的出现并无太大意义。
此外,《指南(征求意见稿)》第十四条设置了平台经营者拒绝交易的适用除外情形,可以归纳为:客观的不可抗力;交易相对人信用有风险或无视平台规则;控制数据的平台经营者利益不当减损等。本文认为,应当将《指南(征求意见稿)》第十四条中设置的数据构成必需设施标准中的“数据开放技术的可能性、对数据控制者可能造成的影响”要件提取出来,作为数据构成必需设施时的适用除外单独规制,因为除拒绝交易时通用的除外情形外,数据构成必需设施时有自己的考量情形。一方面,将二者从构成要件中提取出来作为适用除外要件,是因为其与数据是否构成必需设施并无关系。数据只要满足不可或缺、不可替代、来源唯一和不能开源就可以成为必需设施。技术开放只是一个外在的途径,是一个工具而非必需设施的认定要素;对数据控制者可能造成的影响是评价开放影响的因素,同样与数据是否构成必需设施本身无关。另一方面,除却评价拒绝交易时通用的适用除外情形,数据构成必需设施时有特殊的考量情形,上升到通用层面较为困难。虽然“控制数据的平台经营者利益不当减损”一定程度上也是“对数据控制者可能造成的影响”,但其他条件却不宜通用。除数据开放技术的可能性之外,请求访问数据者提出的对价不合理和相关数据涉及公共安全层面等情形也需纳入适用除外的考量:数据是互联网平台经营者辛苦经营获得,必然要有合理对价才可以交换;数字经济的发展使得数据的采集越来越广、越来越深,大量敏感数据的集合可能涉及国家安全与社会稳定层面,这类数据的开放需慎重。
因此,建议《指南》第十四条回归《指南(征求意见稿)》第十四条的设置,明确单款设置数据构成必要设施的标准,并附以适用除外的情形,即:认定相关数据是否构成必需设施,一般需要综合考虑数据对于参与市场竞争是否不可或缺,数据是否可以被替代,数据是否由某个平台单独控制,数据是否存在其他获取渠道等因素。数据构成必需设施,可能存在以下拒绝开放的正当理由:尚无相关数据的开放技术;开放相关数据使得控制数据的平台经营者产生自身利益不当减损甚至引发生存危机等影响;请求访问数据者未付出合理对价;相关数据涉及公共安全层面;能够证明不适宜开放的其他正当理由。
五、结论
互联网平台经营者在数据竞争方面的先发优势是后进入者极难企及的,但数据作为数字经济中的核心生产要素,兼具平台私人性与社会公共性,已经不完全是平台私产,数据访问限制行为进入了反垄断法的视野。《指南(征求意见稿)》第十四条建立起对数据访问限制行为的规制思路,明确提出可以将数据视为必需设施,是回应数字经济中出现的法律问题的历史一跃。《指南》第十四条应当继续明确规定数据可以视为必需设施,并沿用单款规制的做法。通过将某类参与竞争不可或缺、没有其他数据可以代替、控制渠道唯一、他人无法开发或复制获得的数据视为必要设施;将技术可行性、开放数据对平台的影响、对价是否合理以及数据是否涉及公共安全等考量纳入适用除外,完成对数据构成必需设施的完整规制。