互联网企业间数据不正当竞争的规制路径
2018-01-30薛其宇
薛其宇
(华侨大学法学院,福建 泉州 362021)
数字经济时代是一个以数据为核心竞争力、资源共享的时代,数据资源的取得与利用成为这个时代极为重要的一种资源配置。特别是对互联网企业而言,数据逐渐成为其生存和发展的重要要素。伴随而来的数据竞争则给法学和经济学研究带来了诸多问题和挑战。国内外已经产生了大量与数据相关的争议。如,2015年的新浪微博诉脉脉非法抓取使用微博用户信息案、2016年的大众点评诉百度案、2017年的华为与腾讯的数据之争、顺丰与菜鸟的数据之争以及国外的hiQ诉LinkedIn案等。这些案件或争议都与数据的抓取或分享相关,不仅共同凸显了数字经济时代企业对数据资源的重视与争夺,更显现出数据竞争中共同的法律争议、利益冲突。在现有的互联网商业模式下,用户数量是互联网企业经营之根本。本文结合新浪诉脉脉不正当竞争案探究互联网企业数据使用行为的规制路径。
一、数据不正当竞争缘起
(一)数据资源的经济特征
在大数据时代随着数据重要性的愈渐凸显,有学者称其为“企业提升竞争力的核心资产”,对数据权属的争论如火如荼。数据资源具有体量大、动态性和多样性三个特征,经过算法的计算,数据资源可以产生巨大的商业价值。与以往的数据资源相比,大数据技术与数字经济背景下的数据资源,具有如下新的特征。
1.海量性。互联网领域数据的海量性,系由大数据时代互联网数据搜集的便捷及数据分析与加工的多方面、多层次所导致。互联网领域的数据不仅包括用户单独的个人信息,还包括浏览记录、发表的动态、评论等用户行为产生的衍生数据,这些数据与个人信息数量相比更为客观;并且,海量原始数据经算法分析、加工,又可产生出与初始数据迥然不同的全新数据。
目前理论界,有学者将数据的权利分置为个人信息权与数据权,将个人信息与其他数据区分,[1]也有学者依据是否匿名化将数据分为三类:含有个人信息的底层数据,不含个人信息的匿名化数据以及经数据清洗、算法加工后的衍生数据。[2]不过笔者更赞同依据获得数据时付出的成本的分类方式,即在数据保护中以获取方式的不同,可以将互联网领域的数据主要分为以下三类:一是直接获取的个人信息;二是依群体行为产生的衍生数据;三是原始数据经加工后产生的全新数据。前二者系获得的直接数据,最后一种系间接获得的数据,其中获取数据付出的成本投入依次增加。依不同获取方式对数据加以分类,可以区别经营者在获得数据时付出的成本,在数据保护中更具意义。
2.脱离原始主体。互联网领域的数据是集中在互联网企业手中的,而现有的关于数据的不正当竞争纠纷亦是因企业而起。从互联网企业角度而言,数据之争涉及的是不正当竞争问题,因其涉及的是经个人同意后搜集的个人信息及其衍生信息以及经加工后的全新信息。互联网企业所拥有的个人信息系经个人同意获得,由互联网企业进行管理与使用,与信息的原始主体分离,而在此基础上获取的衍生数据及经加工后的全新数据自不待言。这就是为何个人信息与数据资产存在区别[3],前者从个人角度出发,后者则从互联网企业角度出发。
然而,正是因为互联网企业所拥有的数据与原始主体分离,才导致数据的权属之争。互联网领域的数据是属于原始主体还是数据控制者?互联网企业经个人同意后是否就可随意处置所获数据?这些均无定论。这也是互联网领域数据不正当竞争的根本缘由。
(二)数据对互联网企业的意义
互联网企业的商业模式是双边市场①“一边对普通消费者提供低价甚至免费服务,以吸引庞大用户;另一边则是收费较高的特定对象,如广告商。”,始终要以庞大的用户群为基础。比如饿了么与美团的价格补贴战,其目的便是为增加其用户数量,但数量达到一定程度之后,互联网运营往往并不局限于用户本身的消费,还依赖于对用户数据的分析与利用。比如购物平台不仅会满足用户搜索商品的需求,还会利用用户的浏览痕迹所得出的数据为其推荐相关商品,此种手段既能刺激用户的消费欲望,也能为平台带来广告的收入。
近年来发生的无论是违反robots协议非法抓取信息,还是对数据的过度复制的案例,均涉及互联网企业间数据争议问题。数据是互联网企业竞争的核心因素之一。以新浪微博为例,其用户数据是其吸引用户、赖以盈利之根本。并可以利用算法对微博数据加以分析,得出用户群的偏好,并以此确定企业将来的调整方向,或者调整对用户的推荐内容。
总体而言,数据是互联网企业运营的核心之一,在其运营中具有举足轻重的地位,在互联网企业中,谁能具备数据优势,往往就能在互联网企业竞争中先人一步。数据在互联网企业竞争中举足轻重,加之数据权属不明,互联网企业数据的处分及流通问题至今未有定论。致使近期互联网企业间数据不正当竞争问题层出不穷,而数据的海量性及与原始主体分离等特点又决定了其保护方式需区别于以往对单独的个人信息的保护方式。如何解决互联网企业间的数据不正当竞争问题,是理论与司法实践均亟待解决的问题。
二、新浪诉脉脉不正当竞争案的分析
笔者将以“北京淘友天下技术有限公司等与北京微梦创科网络技术有限公司不正当竞争纠纷案”②北京淘友天下技术有限公司等与北京微梦创科网络技术有限公司不正当竞争纠纷案,(2016)京73尾终588号判决书。(以下简称“新浪诉脉脉案”)为例对互联网企业间数据不正当竞争的司法实践的做法加以探析。新浪诉脉脉案开启了我国数据不正当竞争的先河,也被称为“数据不正当竞争第一案”。其中关于数据不正当竞争部分颇具研究意义。
(一)案件梗概
在新浪诉脉脉案中,新浪与脉脉达成合作并签订《开发者协议》,其中规定“用户数据是指用户通过微博平台提交的或因用户访问微博平台而生成的数据。”且其是微博的商业秘密。根据该协议,第三方开发者获得微博上的用户数据时需取得用户同意,且在与微博合作结束后必须立即删除其从微博获得的数据。据此,新浪与脉脉合作期间,允许脉脉获取新浪微博平台上的用户名称、性别、头像、邮箱等相关用户信息,结束后须立即删除。然而,在合作期间,脉脉非法抓取了不在协议范围内的用户的职业、教育信息;合作结束后,脉脉仍然从新浪平台上抓取数据并显示在脉脉平台上。故此,新浪控告脉脉存在四项不正当竞争行为,其中与用户数据相关的有两项:一是非法抓取、使用用户数据,二是非法获取并使用脉脉用户手机通讯录联系人与新浪用户的对应关系。
对此,一审法院首先认定双方存在竞争关系。其次脉脉未经用户同意获取用户数据并使用,而在合作结束后又未依协议删除从新浪微博平台所获得的用户数据。尽管脉脉辩称所获取的超出协议范围的职业、教育信息系通过协同过滤算法获得,但法院根据脉脉远高于协同过滤算法的精确率反驳了该种说法。故最终依据《反不正当竞争法》第2条认定,脉脉违背了诚实信用原则及商业道德,构成不正当竞争。二审法院则在不正当的认定上,从OpenAPI开发合作模式出发,依据《开发者协议》归纳得出在该模式中,第三方获取用户数据时应遵守的“用户授权”+“平台授权”+“用户授权”三重授权原则,得出脉脉违反三重授权原则,故而违反了诚实信用原则和互联网行业的商业道德。
(二)案件评析
从新浪诉脉脉案中可以看出,数据作为一种重要商业资源已然得到法院认可,数据对互联网企业竞争的重要影响亦不容忽视。两审法院均首先认定新浪与脉脉的竞争关系,再依违背用户同意角度及平台授权出发,推论脉脉违反诚实信用原则及互联网商业道德,进而得出脉脉构成不正当竞争行为。不过二审法院较之一审法院更进一步归纳得出“用户授权+平台授权+用户授权”的三重授权原则。本质上均是从用户同意及平台授权角度出发,均未承认新浪微博所持商业秘密说,尽管二审承认用户数据是一种商业资源,但其与商业秘密相去甚远。
由此可见,在新浪诉脉脉案中,从根本上而言,法院在审判该案时,系以个人信息保护以及合同法为基础,遵循的是一种民法上的私法自治原则。依据我国《消费者权益保护法》等相关法律规定,经营者收集用户信息须明示收集、使用信息的目的、方式和范围,并经其同意,①《中华人民共和国消费者权益保护法》第29条规定:“经营者收集、使用消费者个人信息,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式和范围,并经消费者同意。经营者收集、使用消费者个人信息,应当公开其收集、使用规则,不得违反法律、法规的规定和双方的约定收集、使用信息”。《关于加强网络信息保护的决定》第2条规定:“网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式和范围,并经被收集者同意,不得违反法律、法规的规定和双方的约定收集、使用信息”。在该案中,法院严格遵循法律规定,由于法律对数据交流共享的具体方式缺乏明确规定,法院以个人信息保护及合同法为基础,从用户同意角度出发并结合本案双方签订的《开发者协议》,创造性地提出三重授权原则。由于法律规定不明确,倘若无双方协议,仅依法律规定的个人信息收集时需用户同意结合诚实信用原则及商业道德,无法得出数据流通、共享的具体规则。
新浪诉脉脉案中法院在确定竞争关系的前提下,结合诚实信用原则与互联网商业道德,并结合市场主体间协议判断不正当竞争行为的逻辑思路,无疑为判断数据不正当竞争行为提供了一种可供借鉴的路径。而新浪提出的商业秘密亦不失为数据之争的又一种解决路径。两审法院对数据在互联网企业竞争中的重要作用以及对数据流通、共享的认可,也使得互联网企业间的数据之争大有可能。但以个人信息保护结合合同法对数据不正当竞争加以规制的方法是否可行,还有待进一步探讨。
(三)司法实践中数据不正当竞争判定的逻辑理路
从新浪诉脉脉案,可以看到我国司法实践对数据不正当竞争行为规制的逻辑思路,即首先确定竞争关系的存在,再以《反不正当竞争法》第2条作为大前提,结合个案分析是否造成实际损害,是否违反商业道德与诚实信用原则。对互联网数据是否具有商业价值并非当然确定,而需结合互联网企业的成本投入,一般而言,足以引起纠纷的数据大多具备商业价值,尤其在大数据时代。而商业道德与诚实信用原则的确定则需结合个案具体分析。比如新浪诉脉脉案中依据对双方约定的违反确定其违背诚实信用原则。
三、数据不正当竞争规制的可能路径
数据不正当竞争逐渐兴起,但一直以来由于数据权属不明,对互联网企业间的数据不正当竞争如何规制问题尚不明确。从新浪诉脉脉案中,可以总结出规制互联网企业数据不正当竞争的几种规制路径,即商业秘密、个人信息保护及反不正当竞争法规制路径。
(一)商业秘密的规制
在新浪诉脉脉案中,新浪作为数据获取者提出用户数据属于其商业秘密,借此规制该数据不正当竞争行为。两级法院对用户数据是否属于商业秘密问题采取了回避态度,并未加以探讨。我国新修订的《反不正当竞争法》第9条对侵犯商业秘密行为进行了明确规定,若能证明互联网领域的数据属于商业秘密,便可直接据此加以规制。那么,数据是否符合商业秘密的特征呢?有学者认为数据符合商业秘密的三性,仅因其与立法、司法旨意相抵牾,故法院方不予讨论,笔者不赞同这种观点。笔者更赞同的观点是:法院不予支持商业秘密的说法并非因立法与司法的原因,而系由于数据本身不完全符合商业秘密的特征。
依照我国法律规定,商业秘密具有秘密性、价值性和保密性特征。①我国现行《反不正当竞争法》第9条第3款规定:“本法所称的商业秘密,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息和经营信息。”随着数据在互联网企业经营中的重要性日益凸显,加之互联网企业在收集数据时的经济投入,数据的价值毋庸赘言,但其秘密性及保密性仍有待商榷。在互联网企业运行模式中,用户的数据有一部分是公开的,任何人都可以看到的。这种可见性意味着互联网企业难以做到保密性并保持其数据的秘密性。比如新浪微博的用户数据,其中与用户身份有关的电话此种私密信息具公开性,但此类信息属于隐私权范畴,互联网企业并无公开使用的权利。但昵称、头像等此类个人信息以及其赖以经营维持所涉及的用户行为数据如微博动态更必然具有一定公开性。当然,也有部分数据具有秘密性,比如经大数据技术加工处理后的全新数据,往往由互联网企业内部控制,但此类成果依然具有创造性,与其说是商业秘密,毋宁说是创作性劳动成果,属于知识产权调整范畴。诸如此类公开作为吸引用户、促进交易机会的数据绝不符合商业秘密的特性,故而用商业秘密作为规制不正当竞争的手段无法实现对数据的全面保护。
(二)个人信息保护
个人信息保护是针对数据不正当竞争的又一种规制思路,在新浪诉脉脉案中,法院确立的“三重授权原则”,即系结合个人信息保护及合同法对数据的保护。在对数据的三种分类中,用户的直接个人信息及由用户行为产生的衍生数据是与个人密切相关,即便是经大数据技术分析加工得到的全新数据,也需以前两类数据作为基础。若直接从隐私权出发,则直接从源头解决数据流通共享中的问题,如在三重授权原则中,缺少了一重用户授权,则证明脉脉的数据使用行为缺乏正当性。故而,个人信息权保护也是数据不正当竞争的一种规制方法。尤其随着《中华人民共和国民法总则》颁布,个人信息保护进一步得到重视,这种规制方法难免引人注意。
但是个人信息权保护的规制方法存在难以规避的问题。首先对单独的个人信息而言,此法无疑是一个很好的规制思路,但是,在新浪诉脉脉案中涉及的个人信息是一种海量个人数据的集合体,其自用户同意由新浪使用其信息开始,已经成为一种与原始主体脱离的商业资源,成为一种与个人信息相区别的经营者信息[4]。在此种情况下,在互联网企业进行数据流通共享时,要求取得用户的再次同意无疑忽视了这种特性,将单独的个人信息与作为商业数据的个人信息混为一谈。最后,数据不正当竞争往往发生在互联网企业之间,若从个人信息角度出发加以规制,尽管可以从源头解决,但战线拉得太长,反而会令此种规制缺乏动力及张力,也背离了维护竞争秩序的目的。加上我国法律并未规定在数据流通使用时需用户再次同意,此类规则系互联网企业自己设置,用户在现实中对此知之甚少,故而依据个人信息权设立的三重授权原则缺乏实质意义。
因此,个人信息保护规制的方法缺乏可行性及可操作性,难以有力规制数据不正当竞争行为。并且混淆了单独的个人信息与作为商业资源的个人信息的区别。因此,新浪诉脉脉案中的三重授权模式在数据不正当竞争的规制中并不合适。
综上所述,作为商业资源的互联网数据缺乏足够的秘密性,又不具排他性,无论是利用商业秘密保护路径,还是依个人信息保护的路径,或多或少缺乏足够妥当性。因而要规制互联网企业间的数据不正当竞争行为,还需要寻找其他更合适的方式。
四、数据不正当竞争规制的路径选择——一般条款规制
新浪案最终选择《反不正当竞争法》一般条款①也有学者认为《反不正当竞争法》第2条不是一般条款,但司法和学术界中多将之称为一般条款,笔者在此处暂不讨论该问题,将其视为一般条款。的规制路径,在目前数据权属不明,对数据使用、流通缺乏具体法律规定的情形下,充分利用反不正当竞争法一般条款的兜底功能,并结合具体个案对数据不正当竞争行为加以规制,不失为一种可行的选择路径。但目前法律规定较为模糊,仅有一个一般条款可供利用,具体如何适用还需进一步明确。
(一)数据不正当竞争的行为规制进路
前文已经论述,无论是从商业秘密保护角度,或是以个人信息保护为基础,均或多或少存在不妥当性。并且这两种规制方式均是以数据作为立足点。由此可见,以数据为立足点规制数据不正当竞争的路径难以施行,因此可以以不正当竞争行为作为立足点,探究数据不正当竞争行为的规制路径。此外,在互联网领域有关数据的不正当竞争案件出现伊始,多数学者关注的对象是数据,试图从数据本身出发,寻求突破。然而,《反不正当竞争法》规制的是不正当竞争行为,其是一种行为规制法而非对象规制法,就如同经济法规制的是经济行为而非其他对象[5]。故而,对数据不正当竞争行为的规制,不应以数据为中心,而应当以不正当竞争行为认定为立足点。
在新浪诉脉脉案中,法院在认定数据不正当竞争时,就是从行为的正当性角度出发。尽管在新浪诉脉脉案中,曾涉及商业秘密及用户同意问题,但法院只是以此作为不正当性的认定基础。故而在对数据不正当竞争行为认定时,其重心应放在“行为”而非“数据”上,在法律适用中完全可以先将数据归属问题置于一侧,利用一般条款,从不正当竞争行为认定方面入手。
(二)数据不正当竞争行为构成的认定
从新浪案中,可以看到司法实践对数据不正当竞争的竞争法规制逻辑,遵循一般互联网不正当竞争的规制路径,又具有其独特性。具体包括以下几个方面:(1)双方具有竞争关系;(2)法律无特别规定;(3)存在实际损害;(4)违反诚实信用原则或商业道德。最后三点是适用《反不正当竞争法》一般条款的条件[6]。在互联网数据不正当竞争的判断中,还需将这几项标准再进一步明确化。
1.竞争关系的确定。对于是否以竞争关系作为不正当竞争规制的前提,目前有少数国家不再使用竞争关系加以考虑,但多数国家仍坚持以竞争关系为前提。[7]笔者认为在数据不正当竞争规制中对一般条款的适用,应以存在竞争关系为前提,而一些以违反一般条款反推存在竞争关系的做法有违法律适用的一般逻辑[8],竞争关系的判断理应在一般条款适用之前。在新浪诉脉脉案中,法院首先以存在竞争关系的论证作为逻辑展开。
对互联网领域的数据不正当竞争应如何确定其是否存在竞争关系?首先,互联网领域的竞争具有跨界性、全网络性的特点,一个互联网企业往往经营多项业务,互联网经营模式的双边性特点更使得同行业判断极为困难,以往依“同行业竞争”等判定竞争关系的标准难以适用。其次,对互联网中的数据竞争而言,其必然涉及流量携带问题,若从流量竞争角度而言,几乎所有互联网企业都存在竞争,若从此种角度界定竞争关系,无疑太过宽泛。流量截取可以作为一种不正当竞争效果,但不能作为竞争关系判断标准。
判断互联网经营者之间是否存在“竞争关系”不应该以身份为标准,而应着眼于行为;从具体行为出发,判断互联网经营者之间是否具有经营性、竞争性。而其行为的目的就是对用户的争夺。比如脉脉不正当使用数据是为吸引更多用户关注,本质上是对用户的争夺。
互联网中数据的竞争背后是对用户的争夺,故而将相同用户群作为数据不正当竞争中竞争关系的判定标准,既符合数据不正当竞争的实质,又使得竞争关系的判断更为明确。
2.诚实信用原则和商业道德的具体化。从司法实践来看,因法律无具体规定,对互联网数据竞争的不正当性判断通常依照一般条款,以违反诚实信用原则和商业道德为判断标准。不仅本文提到的新浪诉脉脉案,其他涉及的案件,法院亦均采用该标准,依一般条款确定数据不正当竞争的不正当性亦与立法目的相符。但由于一般条款的模糊性,如何将商业道德与诚实信用原则具体化还需继续探究。
首先可以依据协议判断。在数据权属未明的情况下,一般而言,经营者会针对数据使用及处分制定相关协议,确定数据使用及处分方式,而这种协议通常经过用户同意。此种情况下,无论数据权利归属于用户还是经营者,此种协议均会对数据使用及处分产生约束效力。这种情况下,只要经营者告知第三方后,第三方知道或应当知道依据协议其不能未经同意使用相关数据,则可以认为各竞争者之间达成了协议,若第三方竞争者在此种情况下未经经营者同意擅自抓取并使用经营者的数据,构成对诚实信用原则的违反,具有不正当性。如新浪诉脉脉案中,脉脉在结束与新浪的合作后,明知未经同意不能抓取并使用相关数据,但仍旧擅自抓取并使用新浪用户数据,就属于明知但故意违反的情形。即便此前双方并无合作,只要新浪作出了声明通知第三方不得抓取并使用新浪用户的数据,同样违反诚实信用原则,具有不正当性。
其次还可依成本投入判断。互联网企业对其控制支配的数据往往付出了较多的时间及经济成本,不劳而获的行为往往会损害这种经劳动投入所获得的成果,影响经营者的积极性。而第三方几乎未付出任何据成本,仅仅依靠简单的技术抓取即获得其他经营者的劳动成果,并据此在竞争中获得竞争优势,无疑违反了合理公正的商业交往规则。故此在司法实践中可以将严重损害他人劳动成果,并据此获得竞争优势,争夺他人交易机会的行为认定为违反商业道德,具有不正当性。
总体而言,不正当性的判断需结合具体案件,以违反诚实信用原则和商业道德为基础,结合违法性问题,综合认定互联网企业间数据竞争行为的不正当性。
3.实际损害。存在实际损害是互联网数据不正当竞争判断的另一要件,只有行为对经营者造成反不正当竞争法所指的损害,法律才有规制的必要,否则会造成干预过度的问题。互联网数据不正当竞争的实际损害后果往往包含两种,一种是直接后果,一种是间接后果。直接损害后果是对流量的截取,间接后果是交易机会的减损,其中交易机会的减损才是不正当竞争法规制的根本原因。
数据在互联网中流通的表现形式就是流量,流量的多少表明互联网企业受到的用户关注度,而这种关注度影响着互联网企业的价值。数据不正当竞争最直接的后果就是对流量的截取。流量背后是用户关注,这种关注间接地影响着互联网企业的交易机会,关注度越高交易机会越多,反之则越少。由于竞争者对数据的不正当利用,导致流量被截取,无形中交易机会间接减损。而这种间接减损往往难以证明,但这却是互联网数据不正当竞争的本质,若无法证明对交易机会的损害,则无需由竞争法规制。故此,笔者认为,认定数据不正当竞争的损害,须先证明竞争者对数据的不正当利用存在流量截取,并以此切入点,结合经营者的营业模式,探讨是否对交易机会产生减损,若存在交易机会减损,则属于反不正当竞争法所指的损害。若仅有流量减损而无交易机会减损,则需判断流量是否为经营者的主要营业方式,若是,则属于由不正当竞争造成的损害,否则,不属于不正当竞争法所指的损害,如新浪诉脉脉案则属此类。
故而对互联网数据不正当竞争实际损害的衡量,既要考虑直接的流量损失,又要考虑间接的交易机会损失。若仅有流量损失而无交易损失,判定是否属反不正当竞争法所指的损害时,还需结合经营者的营业模式分析。
综上所述,互联网数据不正当竞争行为的规制应当选择竞争法规制路径,以确定相同用户群为判断标准确定竞争关系,结合诚实信用原则、商业道德与违法性判断数据竞争行为的不正当性,并根据直接的流量损失与间接的交易机会损失确定竞争者对经营者的损害,据此依《反不正当竞争法》一般条款对数据不正当竞争行为加以规制。