数据爬取行为的司法治理：裁判模式、治理困境与完善路径

2023-08-02宋佳宁母紫薇

贵州省党校学报 2023年3期

宋佳宁母紫薇

摘要：数据爬取行为是大数据时代下的产物，主要通过网络爬虫技術获取数据资源，它为市场经营者提供便利的同时也存在违法的可能性。反不正当竞争法视角下对数据爬取行为的司法治理因法律规制的空缺陷入多重困境，本文通过对案例的分析阐明司法实践中所面临的认定数据爬取行为的标准不明晰、不正当竞争行为的性质分析不全面、司法裁判思路单一等问题，以数据爬取行为不正当性为切入点，结合《反不正当竞争法》第二条，提出细化数据爬取行为的认定标准、全面分析不正当竞争行为的构成要件、优化司法裁判思路等有针对性的解决途径。

关键词：数据爬取；反不正当竞争法；司法实践

中图分类号：D922.294文献标识码：A文章编号：1009 - 5381（2023）03 - 0118 - 11

一、引言

随着大数据时代的到来，数字经济的发展越来越受到市场重视，因数据而产生的强大经济推动力和市场竞争力不可小觑。数据作为数字经济发展的基底与推动力，往往具有巨大的潜在商业价值，通过网络爬虫（Web Scraping）技术对公开数据进行爬取的行为也应运而生。数据爬取能够使经营者快速从庞大的数据库中获取对应的用户或数据产品信息，开拓新兴产业初期发展的道路，因此也成为各大企业筛选有效信息、提高经营效率的首选方式。同时，数据爬取行为存在着侵犯个人隐私、破坏市场竞争秩序、非法获取利益等违法可能性。例如，许多市场经营者通过技术、规则等手段，将部分公开数据隐藏或禁止他人通过数据爬取行为获取这些关键信息[1]，以此获取非法利益并对市场秩序造成严重破坏。

针对上述问题，目前我国尚未出台专门的法律法规对数据爬取行为进行规制。在司法实践中，数据爬取行为一般由《反不正当竞争法》《反垄断法》《数据安全法》《著作权法》等进行规范。正因如此，存在裁判者对于数据爬取行为的违法构成要件认定标准不一的情况，由此导致同案不同判的现象时有发生，数据爬取行为在立法与司法层面的问题亟待解决。相较而言，反不正当竞争法以市场竞争为视角，通过剖析数据爬取行为的合法性边界，形成具有指导意义的案例作为解决数据爬取纠纷的重要突破口，在立法和司法上都更具有重要的借鉴意义。

二、司法裁判中数据爬取行为的违法认定——以“车来了”App为例

由于专门性立法的空缺，面对数据爬取行为纠纷，法院通常依据《反不正当竞争法》第二条来对违法行为进行定性。首先，经营者应遵守法律和商业道德，遵循公平、诚信等基本原则。其次，《反不正当竞争法》第二条还明确了不正当竞争行为的基本概念，总结出不正当竞争行为的具体构成要件，为认定数据爬取行为是否违法提供大致框架与指导。下文通过对解决数据爬取纠纷的司法模式进行分析，阐明数据爬取行为违法性的表现形式。

“车来了”App不正当竞争案是数据爬取行为违法认定的典型案例。“车来了”App是武汉元光公司研发的一款提供公交车运行时间和位置的实时信息服务软件。2013年，武汉元光公司为了丰富数据信息并提高市场竞争力，在未取得深圳谷米公司同意的情况下通过利用网络爬虫技术爬取了该公司“酷米克”App中大量有关公交运行时间及位置等数据信息，应用于“车来了”App之中。深圳谷米公司认为，“车来了”App与“酷米客”App属于同种类服务类型的软件，二者提供的服务信息相同或类似。被告武汉元光公司在未经他方同意的情况下大量爬取并直接使用原告深圳谷米公司“酷米客”App中的数据信息，侵犯了原告方的商业利益。深圳市中级人民法院认为，“车来了”App与“酷米客”App之间存在竞争关系，公交车运营路线及时间是通过人工收集、数据分析等手段与公司软件相配合使用的数据，具有一定商业价值。而武汉元光公司大量爬取和使用相关数据于本公司的运营软件之中，属于“搭便车”的行为，可能削弱“酷米客”App的竞争优势，进而造成该App客户流失、品牌价值降低等不良后果。[2]据此，法院判定武汉元光公司的数据爬取行为构成不正当竞争，并承担相关赔偿费用共计50万元。该案的裁判要旨在于，大数据经过经营者的收集、加工、整理后被赋予一定的商业价值，可以为经营者带来竞争优势。他人未经允许利用网络爬虫技术将数据爬取并使用属于不劳而获的行为，违背诚实信用原则，同时也扰乱了市场公平的竞争秩序，因此构成不正当竞争。“车来了”App不正当竞争案的重要意义在于其不仅是我国将数据爬取行为纳入法律规制的首个案例，更多的是作为指导性案例引导司法实践在此基础上形成更为严谨与完善的司法治理模式。

三、《反不正当竞争法》规制下数据爬取行为的司法裁判模式

判断数据爬取行为是否具有正当性是理顺司法裁判思路的关键。裁判者结合实际情况对个案中数据爬取行为的正当性与违法性进行分析，从而形成不同的裁判思路与裁判模式。在大多涉及不正当竞争的案例中，法院都以《反不正当竞争法》第二条为裁判依据，即将数据爬取行为的性质归属为违反“诚实信用原则”或“商业道德”的行为。但是，《反不正当竞争法》第二条只是一般性条款，并未专门规定数据爬取行为的构成要件，这一界定具有较大模糊性，因此仍然无法解决同案不同判的问题。实践中，法院一般以数据被爬取方遭受的竞争损害作为判断数据爬取行为正当性的主要标准。以此为基础，可总结出以下三种司法裁判模式，具体包括优先保护经营者私益模式、优先保护市场竞争秩序模式和关注多元利益模式三种。

（一）优先保护经营者私益模式

优先保护经营者私益模式是基于侵权法的思路对数据爬取行为持消极态度。[3]该模式认为，只要数据被爬取者的商业利益受到侵犯，并且损害后果与数据爬取行为存在因果关系，即可认定数据爬取行为具有不正当性。适用此种裁判模式的典型案例是大众点评诉百度不正当竞争案。在此种裁判模式下，数据被爬取方因爬取行为遭受的客户流失、数据信息泄漏等商业利益损失是法院认定数据爬取行为违法的主要根据。当数据爬取行为有损害事实，并且与损害结果存在因果关系，即可判断数据爬取方的行为存在不正当性。[4]

在大众点评诉百度不正当竞争案中，上海知识产权法院判定百度公司数据爬取行為不具有正当性的依据主要基于以下两方面：一是汉涛公司是否因百度公司的数据爬取行为受到损害；二是汉涛公司与百度公司之间是否存在竞争关系。首先，在损害行为认定方面，百度公司通过网络爬虫技术，将汉涛公司经营的大众点评网上的商品详情、用户评价等相关信息直接运用于其经营的百度知道、百度地图等软件中，直接损害了汉涛公司的商业利益。大众点评网是依靠收集用户对商品及服务的真实评价向用户提供较全面、真实的商品信息，帮助客户进行消费选择、提供团购服务，商家也能够从用户评价中进行营销策略的调整和改进。商品及用户点评信息是汉涛公司花费大量成本及时间的运营成果，也是其获取商业利益的主要运营方式。百度公司的网络爬虫行为一定程度上减少了大众点评软件的用户流量，并且依靠这样的方式推销自己的团购业务，这样不劳而获的行为不仅破坏了竞争秩序，还会打击市场创新性，抑制经营者创新动力。[5]其次，在竞争关系认定方面，百度公司抗辩称百度知道以及百度地图都是搜索引擎类软件，与大众点评这样的“城市消费生活平台”并非同一行业，不构成竞争关系。法院认为，竞争的本质是对交易对象的剥夺，并不限于同一行业之中。百度公司与大众点评网之间存在重叠的客户群体，实质上也造成了大众点评客户群体的流失，构成了对交易对象的剥夺，因此二者之间存在竞争关系。综上，百度公司利用网络爬虫技术爬取并直接使用汉涛公司大众点评软件中商品、客户评价等信息的行为违背了诚实信用原则和商业道德，构成不正当竞争。

无独有偶，在此案判决之后的新浪微博诉字节跳动不正当竞争案中，一审法院也以造成商业利益损失为由判定字节跳动的数据爬取行为属于不正当竞争。基于此，在优先保护私益的裁判模式下，法院更偏向于套用侵权法的思路分析数据抓取行为是否具有正当性。此种模式的缺陷在于裁判思路过于单一，难以针对个案的不同细节进行全面考虑，致使大多持此观点的法院对数据爬取行为抱有“一刀切”的否认态度。

（二）优先保护市场竞争秩序模式

优先保护市场竞争秩序裁判模式实质是在优先保护经营者私益模式的基础上，加入了衡量市场竞争秩序关系的考量因素。该模式认为，在当前自由开放的竞争市场中，经营者难免会因竞争而产生利益损失，数据被爬取方需要把损害结果视为一种竞争后果给予一定程度的容忍。[6]除此之外，法院也会采取对损害结果是否达到司法救济的程度进行权衡的方式，协调经营者私益与市场竞争秩序间的冲突。优先保护市场竞争秩序的司法裁判模式实质上是对数据爬取行为持中立的态度。相较于优先保护经营者私益的裁判模式而言，优先保护市场竞争秩序模式更偏向于一种竞争法的裁判思路[7]，即将视角从侵犯了何种权益转换到以市场竞争秩序优先。适用优先保护市场竞争秩序裁判模式的典型案例为奇虎360诉百度不正当竞争案。

在奇虎360诉百度不正当竞争案中，北京市高级人民法院认定百度在线公司通过设置Robots协议限制360引擎进行数据爬取的行为损害了奇虎公司的合法权益，增强了自己的市场竞争优势，构成不正当竞争。在数据信息爆炸的时代，Robots协议设置的初衷是为了过滤无用信息，使搜索引擎能够快速精确地提取有效信息，进而形成高效率的信息共享机制。而百度公司通过Robots协议设置数据允许抓取数据的“白名单”搜索引擎，以保证自身数据占有的优势。百度公司表示，360引擎在Robots协议“白名单”之外，其对百度进行数据爬取并使用的行为明显不当。法院认为，在信息共享的时代，大多网站都对搜索引擎持开放的态度，搜索引擎能够为网站提供更多浏览量，吸引更多用户使用网页，由此形成各引擎、各网站之间竞争排名的商业模式。百度公司利用Robots协议设置“白名单”，并认为限制360搜索引擎进入百度网页，限制了数据与信息的流通，违背了Robots协议设置的初衷。另外，百度网页利用相关技术使用360引擎爬取的信息自动跳转至百度网页的行为，影响了360搜索引擎用户的体验感并引导用户流量向自身倾斜。该行为名义上的目的是遵循规则和保障数据安全，实质却是带有针对性、垄断可能性地利用规则限制数据流动来增加自身竞争优势，已经扰乱公平的竞争秩序，违背了诚实信用原则和商业道德，故而法院认定百度公司的行为构成不正当竞争。

可以看到，法院在判定数据爬取行为是否具有正当性时，不仅考虑了该行为是否具有侵权的性质，还将鼓励自由竞争、允许不同商业营销模式等因素看作竞争法中的应有之义，允许自由竞争中存在一定程度的“损人利己”现象。优先保护经营者私益与优先保护市场竞争秩序两种裁判模式的侧重点不同，因而导致司法实践中相似的案例却出现了两种截然不同的裁判结果。以《反不正当竞争法》为视角解决数据爬取纠纷案件无疑需要裁判者实现从保护权利到鼓励竞争的一个逻辑转换[8]，在此基础上，后者是更为合理的裁判模式。

（三）关注多元利益模式

适用关注多元利益的司法裁判模式的典型案例是新浪微博诉脉脉不正当竞争案。该模式是司法裁判机关为增强《反不正当竞争法》第二条对于数据爬取纠纷具体性与适用性的一种探索和发展。此种模式不仅关注经营者的合法权益和有序的市场竞争，还综合考虑消费者权益、市场竞争环境、社会公共利益等多重因素。该模式认为，需要在《反不正当竞争法》第二条对数据爬取行为定性的基础上，结合多元主体利益以及市场整体性等要素去判断数据爬取行为是否具有正当性。

广受学者关注的“海带配额案”为这一裁判模式的实践奠定了基础。之后的新浪微博诉脉脉不正当竞争案中，法院通过援引海带配额案表明互联网中的竞争模式不同于传统行业，对《反不正当竞争法》第二条的适用更应秉持谦抑态度，并增加了三个关于判断数据爬取行为是否构成不正当竞争的考量因素：消费者权益、行为引发恶性竞争的可能性和行为正当性。有鉴于此，新浪微博诉脉脉不正当竞争案主要从五个方面阐明对不正当竞争行为的认定：第一，从损害结果角度看，原告微梦公司研发的新浪微博兼具社交网络平台与向第三方提供接口开放平台的身份，其用户信息的积累是多年经营的成果。而脉脉则是淘友公司研发的一款提供职场招聘信息、人脉管理等信息的软件，用户信息同样是其重要商业资源。淘友公司未经微博平台和微博用户的同意采用网络爬虫技术爬取用户信息用于脉脉平台，显然恶意截取了微梦公司的商业资源，造成了直接的损害结果。第二，从商业道德角度看，关于淘友公司是否违反商业道德，法院将本案中商业道德解释为两层含义。第一层是《开发者协议》中所要求的诚实信用原则；第二层是获取和使用用户信息必须要用户知情且同意。淘友公司的数据爬取行为同时违反了上述两个要求，属于违背商业道德。第三，从商业模式和技术手段的正当性角度来看，在互联网行业兴起的今天，不同商业模式和技术手段层出不穷，但无论何种形式的竞争，都应建立在尊重创新和追求进步的基础上。若突破了公共利益的底线，那么就不能称之为正当。[9]第四，从竞争秩序角度来看，数据信息是互联网行业重要的竞争“武器”，淘友公司通过“搭便车”行为剥夺了微梦公司的数据资源，破坏了公平的竞争秩序。第五，从消费者权益角度来看，本案将对消费者权益的保护纳入行为不正当性的参考标准。基于上述理由，法院最后认定被告淘友公司的行为属于《反不正当竞争法》第二条所规制的不正当竞争行为。

同时，新浪微博诉脉脉不正当竞争案确立起数据授权的“三重授权原则”。顾名思义，三重授权原则指的是在企业的数据爬取过程中，需要经过三个不同层面的授权与许可。开放平台获取用户数据信息需要经过用户授权，这是第一重授权。第三方应用从开放平台间接获取用户数据信息需要经过平台授权，这是第二重授权。同时，还需要告知用户爬取数据的目的及用途，这是第三重授权，即用户再次授权。数据本身具有流通性强、容易获取等特点，三重授权原则能够保证个人信息主体及数据收集主体的信息控制能力，防止因数据爬取行为造成个人信息过度扩散或者数据用途不可控的情况。另外，相较于通过商业合作进行数据交易或交换的方式，数据爬取的方式因成本低、效率高更受企业青睐。但是，企业在数据爬取过程中往往无法兼顾平台意志与用户授权，三重授权原则的司法适用能够在数据获取方式多样性的前提下，保证数据爬取行为的合法性；在新浪微博诉脉脉不正当竞争案中，为法院判定数据侵权行为是否构成不正当竞争提供依据。需要强调的是，三重授权原则因其苛刻的标准在一定程度上消减了法律风险，保护了用户隐私，但也引发众多学者的质疑：如此高标准的规则会阻碍数据流通，减损经济效率。如何调整三重授权原则使得用户数据权益与市场经济效率相契合，是《反不正当竞争法》亟待解决的问题。

综上所述，相较于前两种裁判模式，关注多元利益模式更能弥补一般性条款作为裁判依据的模糊性，但当需要考量的构成要件增加时，也会掺杂更多主观因素。

四、反不正当竞争法规制下数据爬取行为的司法治理困境

总结数据爬取行为案件司法裁判模式存在的问题，能够更加清晰地反映出司法裁判依据《反不正当竞争法》解决数据爬取纠纷案件时需要调整的方向。

（一）认定数据爬取行为违法的标准不明晰

根据《反不正当竞争法》第二条，数据爬取行为违法性的主要认定标准是行为不符合商业道德。同时，数据保护与利用的边界也是影响数据爬取行为违法性认定的重要因素。但是，模糊宽泛的认定标准往往成为违法者利用法律漏洞谋取不正当利益的温床，也导致同一或相似案件裁判结果大相径庭的状况发生。

1.一般性条款中“商业道德”认定标准不一

在以《反不正当竞争法》为依据规制数据爬取行为时，法院通常以该法第二条中“遵守商业道德”作为认定标准，但作为一般性条款的弊端是其具有模糊性，商业道德本身也是边界模糊的概念。从多數案例中可以看到，法院一般将“是否未经授权爬取数据”以及“是否符合行业惯例”作为判断数据爬取行为是否符合商业道德标准的判断依据，由此又衍生出不同的问题：如何定义未经授权的范围？行业惯例的正当性如何认定？首先，案例中大多被爬取的数据实际上已经属于经营者公开的数据，既然已经向社会公众公开，何谈未经授权呢？其次，并非所有行业惯例都符合正当性标准，例如在奇虎360诉百度不正当竞争案中，百度利用Robots协议设置“白名单”制度，有针对性地将360搜索引擎排除在外，以此形成数据垄断。主观恶意往往隐藏在行业惯例的庇护之下，反而助长某些行业垄断的势头。总的来说，目前司法裁判模式中对商业道德的认定标准尚有较大出入，同时也无法满足对复杂商业竞争环境的精确判断。因此，还需在司法实践中对商业道德的标准进行规范。

2.数据保护与开发利用的界限不清

数据的基数巨大，类型与种类更是不计其数，厘清数据的保护与开发利用间的界限是解决数据爬取纠纷的关键。在司法实践中较为常见的两种矛盾是个人信息保护与促进个人信息开发利用的矛盾、数据财产权益的保护和数据开放和利用间的矛盾。[10]就前者而言，互联网通信技术的突飞猛进发展以及网络数据的受众群体日益增长，往往需要将个人信息公开或者储存于网络系统之中，许多网络软件还需以个人信息的收集与利用作为运营的主要途径，由此产生一系列个人信息泄露、网络电信诈骗，甚至人身安全受到威胁的问题。部分涉及刑事犯罪的法条中较为详尽地列举了侵犯个人信息违法的具体情形，但较之于复杂多变的数据发展趋势，法律无法穷尽所有情形。就后者而言，一方面对大量公开数据的收集、整合与利用能力通常能够体现经营者的核心竞争力，为此付出大量人力、财力与物力，由此得来的数据具有独特商业价值，经营者往往要求对这部分数据享有排他性权利。另一方面，促进数据流通与共享是互联网领域的初衷与追求。如上文所提到的海带配额案中，一审法院更倾向于数据财产权益的保护，认为被告并没有证据证明是通过合法手段来获取商业机会，直接造成了原告公司的财产损失。二审法院以及最高院的判决给出了另一种答复，即对离职员工利用技能和经验为竞争单位服务的行为并不能简单认定为不正当竞争。易言之，这两份判决的矛盾在于数据保护与开发之间的界限不明晰，法院的侧重点不同即可能出现大相径庭的结论。因此，厘清数据保护与开发利用的界限是解决数据爬取纠纷的理论基础。

（二）对数据爬取不正当竞争行为的性质认定分析不全面

将数据爬取行为认定为不正当竞争需要对该行为在市场竞争中对应的表现形式进行分析。一般而言，不正当竞争意味着在一定程度上会扰乱公平自由的市场竞争秩序，具体表现在通过不正当的竞争手段截取他人的竞争优势，造成他人交易机会流失，损害他人核心竞争优势。公平自由的竞争秩序是建立在诚信、合法合规的基础之上，而非不择手段、损人利己。

1.实质性替代关系的分析依据不足

实质性替代关系的分析常被用于认定不正当竞争行为的司法实践中。就涉及数据的不正当竞争纠纷而言，实质性替代关系是指当事人利用数据或信息提供的产品或服务之间具有替代关系，其通常作为判断不正当竞争行为是否造成损害后果的要件之一。

在大众点评诉百度不正当竞争案中，法院通过认定大众点评中的用户评价、商品信息具有商业价值，而百度公司通过数据爬取将这类数据直接运用于百度知道、百度地图等软件中，内容与功能上都具有实质替代性关系，来判定百度公司的数据爬取行为造成了竞争损害。由此可见，实质性替代关系的分析首先是基于对相关数据商业价值的认定，其次才是对竞争关系及竞争损害的分析。司法实践中普遍认同数据通过加工利用后具有商业价值，但数据中的部分财产权益的界定却没有明确依据。[11]在大众点评案中，用户点评信息作为公开数据既然能够被消费者反复获取查看，那么百度利用数据爬取行为获取这些数据为什么不能等同于消费者查询数据的行为呢？现行立法并未对这些数据的权属进行规定，因此我国司法实践对实质性替代关系的分析虽然合理但部分要件缺乏相应依据支撑，实际上涉及的是数据的性质及权属争议等诸多问题。

2.数据爬取行为的竞争效果分析不足

对数据爬取行为的竞争效果进行分析及权衡是判断行为是否违反《反不正当竞争法》的关键步骤。数据爬取行为本身只是作为一种获取信息的技术，并无消极与积极之分，但该种行为在市场竞争中可以引起积极竞争效果和消极竞争效果。在有限保护经营者私益裁判模式中，法院只考量数据爬取行为带来的消极竞争效果，即引起了损害后果，而没有与行为所带来的积极竞争效果进行权衡得出结论。另外，也有部分学者认为，数据爬取行为虽然本身并无好坏之分，但其并不会创造新的或者更优质的产品，反而会破坏市场竞争秩序，降低市场效率，因此具有不正当竞争行为的可能性。[12]在司法实践中，数据爬取者会以其数据爬取行为产生了积极效果，例如实质上增加了数据被爬取者的网页浏览量、为用户搜索信息提供新的渠道为由进行抗辩，更准确地说，这些观点其实都是竞争法视角下对效率的衡量。此时，法院忽视任何一种竞争效果得出的判决都将是片面的。

（三）司法实践中裁判思路单一

随着数据爬取纠纷案件类型的多元化发展，司法裁判的思路也逐渐清晰和灵活，但许多疑难问题仍普遍存在。总的来说，我国数据爬取纠纷相关案例的裁判思路仍以《反不正当竞争法》的侵权法属性为主导，且竞争法的裁判模式在应对复杂多变的案情时也略显单一，数据爬取的多元化治理意识有待加强。

1.传统侵权认定的裁判思维固化

以侵权法思维适用审理案件的逻辑起点在于对权利的保护，但对于数据爬取行为的不正当性认定而言，仅有侵权结果是无法全面评定不正当竞争行为的。前文所述的传统侵权认定的裁判思维是将经营者的商业利益视为不可侵犯的权益，却没有考虑到商业利益目前并不在法律明文规定的利益保护类型之中。以关注多元利益裁判模式为例，法院在判定数据爬取行为构成不正当竞争时综合考虑了竞争秩序、消费者权益以及其他经营者的权利边界等因素。也就是说，相比于传统侵权认定的裁判思维，关注多元利益无疑更能适应数据纠纷发展的大趋势。当前，更多学者提倡对数据爬取行为的裁判思维应该由从私法保护的行权逻辑转向行为正当性识别的行为逻辑，从数据保护转向数据竞争。[13]总体而言，传统的侵权认定思维是把复杂的行为要件看得过于简化，既是对数据爬取行为的全盘否定，也忽视了现代信息技术所带来的益处。[14]在当今鼓励多部门、多领域协同治理的背景下，更需要注重突破传统思维的藩篱，摆脱陈旧固化的司法治理路径。

2.数据爬取行为竞争法治理模式单一

数据爬取行为本身具有隐蔽性、技术性的特征，且发展速度非常之快，一直处于动态环境中。总结相关案例可以看到，当数据爬取纠纷发生在市场份额占比较高的企业时，经营者普遍存在利用其所占有的资源和市场地位来限制数据流动并扩大竞争优势。换句话说，无论是数据爬取方还是数据被爬取方，都有可能借助自身的市场支配地位来限制竞争。例如，近年发生在美国的HiQ v. Linkedln案中，就出现了对数据爬取纠纷中经营者滥用市场支配地位的认定。当数据爬取行为涉及经营主体滥用市场支配地位甚至形成垄断时，必然会造成数据流动受限，各类因数据而起的纠纷呈井喷式增长，单一的竞争法治理模式也会难以广泛适用于未来数据爬取纠纷的各类情形。

当前我国的司法实践中还并未涉及数据爬取行为的反垄断纠纷，但相关行为的性质已经涉及反垄断法的治理模式。个案中对当事人市场支配地位的界定以及对数据爬取行为反竞争效果的分析都是解决纠纷的突破口。当然，无论是借鉴反垄断法中关于竞争效果的权衡、市场支配地位的分析方式抑或是将反垄断法直接适用于数据爬取行为，都需要识别清楚《反不正当竞争法》与《反垄断法》之间的差别，以便于发挥各自的优势之处。

五、反不正当竞争法视角下数据爬取案件司法治理的完善路径

结合当前我国对数据纠纷案件的研究现状，对数据爬取纠纷案件司法模式面临的困境提出相应完善建议。探索反不正当竞争法视角下数据爬取案件司法裁判的完善路径需要细化法律法规的认定标准，并强调原则对实践的指导作用，实现理论指导与司法实践相结合的目标。

（一）细化数据爬取行为的认定标准

1.规范一般性条款中“商业道德”认定标准

对商业道德的认定不仅要依据现有的案例作为指导，还要在符合时代发展的大背景下对其作出概括与具体化。一般来说，商业道德的判断应依据商业活动中客观的或实际的做法、惯例。[15]通说认为，Robots协议属于国际互联网领域确认的商业惯例和行业规范，是网络纠纷案件中商业道德的认定标準之一。然而，Robots协议主要针对的是网页，而互联网领域不止限于网页一种商业模式，需要制定更加具体的行业规范来确定商业道德标准。从上文案例中可以看到，Robots协议并非司法实践中的唯一标准，《互联网搜索引擎服务自律公约》也在新浪微博诉脉脉不正当竞争案中被作为认定商业道德的标准之一。基于商业道德内涵及本质的丰富性与抽象性，无需对商业道德这一概念在法律上的标准、具体构成要件作出界定，因为对商业道德的标准进行规范是为了增强这一概念在司法实践中的适用性与操作性，而非以固定的标准去衡量法律行为。[16]具体而言，可以从两方面来规范一般条款中“商业道德”的认定标准。

一方面，将行业惯例作为认定是否符合商业道德的重要参考依据。行业惯例是某一行业长期以来形成的、被普遍认同并遵守的规则，表现形式一般为制定规范性文件。除上文所提及的Robots协议、《互联网搜索引擎服务自律公约》外，许多案件中法官也将行业惯例作为认定商业道德的标准之一，例如，在奇虎360诉百度不正当竞争案中，法院将《搜索引擎行业自律公约》作为行业共识，认定该公约能够在一定程度上反映商业道德的内涵。[17]因此，内容明确、公信力强、行业认可度高的行业惯例更能具化商业道德的认定标准。另一方面，在审理案件的过程中应当以利益权衡为指导，以实践经验为范本。行业惯例作为参考要件能够对商业道德的内涵进行合理阐释，但同时存在的问题是广泛性并不等同于合理性，还需认识到问题的根本。一般性条款在司法实践中往往是通过权衡各方主体的合法权益来认定损害与分化责任。因此，对商业道德内涵的阐释还需法官充分发挥主观能动性，合理权衡市场竞争这把双刃剑带来的利与弊。

2.司法实践中应强调“三重授权原则”理论

三重授权原则在新浪微博诉脉脉不正当竞争案中被确立为解决数据保护与利用矛盾的公认裁判准则，其从根本上认可了数据的商业价值，并兼顾到企业与个人的数据权益，从而达到维护市场竞争秩序的目的。

剖析三重授权原则的内容能够总结出其具备的重要价值。就用户而言，数据第三方获取数据的整个过程需要经过用户的双重授权，并告知用户收集数据的目的、用途，保护用户对个人信息获取与使用的知情权。数据的流动性强，经过多次开发和利用可能会使得用户丧失对数据的掌控权，最终导致个人信息泄漏，最后的用户授权也是个人信息保护的最后防线。尊重用户的意思自治，充分协调了数据保护与利用的矛盾。就数据被爬取方而言，三重授权原则的本质是维护数据持有者的竞争利益，维护数据持有者的数据安全。在新浪微博诉脉脉案中，法官将新浪微博长期以来积累的客户信息视为重要商业资源，以此得出脉脉平台的数据爬取行为直接造成了新浪微博的竞争优势被破坏、数据权益受损的结论，这实质上也是三重授权原则运行的逻辑内核，即在认可数据商业价值的基础上保护用户及数据被爬取方的数据权益，明晰数据开放性的前提与边界。另外需要明确的是，三重授权原则是针对企业间获取数据而制定的较高标准，并非所有数据获取行为都需要经过该原则的约束，对于公开数据的流动一般不适用该原则。司法裁判中适用该原则前应对数据的公开性与否进行判断，区分原则的适用情况。针对合规情况下的数据爬取行为，允许企业使用、获得数据信息；而在不合规的情况下进行数据爬取，则可适用三重授权原则，化解用户数据权益与市场经济效率的冲突。

总的来说，三重授权原则能够有效解决数据保护与利用的矛盾，也为数据爬取行为正当性的认定树立起标杆。通过完善法律条文或制定相应规范性文件的方式进一步强化三重授权原则在司法实践中的应用，能够有效填补当前《反不正当竞争法》对数据爬取行为规定的缺失，使得司法实践有法可依。

（二）全面分析数据爬取不正当竞争行为的构成要件

1.明确实质性替代关系的认定要件

首先，实质性替代关系认定的前提是当事人之间存在竞争关系。市场主体之间存在竞争关系则会产生商业利益的冲突，分析上述案例可以看到，法院推导出商业利益受损的基础是当事人双方的产品或提供的服务存在竞争关系。在司法实践形成的共识中，竞争关系不仅局限于相同或类似的商品服务的替代性关系，还是市场竞争中损害与被损害的关系[18]。若不正当竞争案中，当事人以产品或提供服务之间不相类似、不存在替代性关系为由主张不具有正当关系的，人民法院不予支持。

其次，实质性替代关系认定的关键是判断数据的权属。我国当前没有明确法律规定数据的权属问题，可以借鉴域外司法实践中的相关经验。辛勤原则是美国在司法案件中所确立的具体适用于《著作权法》中判断作品权属的法律原则，但其逻辑原理仍能够被数据的权属界定所借鉴。辛勤原则的内容是作者因为付出的劳动而获得著作权，将其应用于数据爬取纠纷的案件，即能够解释“经营者付出大量精力所收集和整理的数据理应享有数据所带来的商业利益及竞争优势”这一裁判理由。[19]数据本身是以零散的状态呈现，在网络平台中往往通过数据持有者的加工与整理出现在大众视野，也正是如此被赋予了更高的商业价值。当数据爬取方不劳而获使用这些数据以提升自身竞争力时，数据被爬取方原有客户流失、自身优势被削弱，数据权益也因此受到损害，此行为即可认定为具备实质性替代关系。

再次，实质性替代关系的认定需要具备损害结果。市场竞争中的“替代”可以理解为在竞争关系中的一方提供同质化的产品或服务，全部或部分替代了他方提供的产品或服务，从而造成对方交易机会流失。换言之，在实质性替代关系的认定中，数据被爬取方的商业利益受损，是由数据爬取方的不正当竞争行为引起的，二者之间互为因果关系。因此，判断当事人双方是否构成实质性替代关系，需要不正当竞争行为造成一定的损害结果。

2.全面评估数据爬取行为的竞争效果

全面评估数据爬取行为的竞争效果是分析数据爬取行为正当性的必要步骤，也是权衡数据所带来的市场效率与市场价值的利器。

在面对数据权益类不正当竞争案件中，应当运用比例原则来综合权衡数据爬取行为的竞争效果。所谓比例原则，又包含适当性原则、必要性原則和狭义比例原则三个子原则。适当性原则是一个“目的导向”的要求，只要行为人实施的行为有部分有助于其目的的实施就具有适当性。而实践过程中企业对于数据的爬取行为的目的通常都是为了有助于自身的发展和盈利，此时就应当考察必要性原则，又称为最小侵害原则，指的是在多个达成目的的方式中采取损害最小的那一种。狭义的比例原则是指一种行为所造成的利益损害应该和收益相匹配。[20]HiQ v. Linkedln案的判决思路即体现了比例原则的运用。对比HiQ v. Linkedln案与我国的大众点评诉百度不正当竞争案，二者都是法院在权衡行为竞争效果的基础上作出的判决，都具有积极的指导作用。HiQ v. Linkedln案因数据被爬取者后进入市场而被认定其以反竞争的目的阻碍数据流通，数据爬取者则创造了新的市场价值，总体提高了市场效率；大众点评诉百度不正当竞争案由于数据爬取者后进入市场，且其直接将数据用于同一市场中，并未增加新的市场价值，属于不劳而获的“搭便车”行为，并对数据被爬取者的商业利益和市场优势造成负面影响，降低了市场效率。

因此，在企业数据权益保护的问题上，应当综合分析爬取企业数据的行为，运用比例原则分析比较如数据流通、数据市场的繁荣之类的社会公共利益和企业竞争自由的经营者利益以及维护数据隐私之类的消费者的利益，不能片面地从爬取数据行为是否对经营者的利益造成损害来判定是否构成不正当竞争，比较此项数据爬取行为在整体竞争效果评价后对整个竞争秩序的维护是正向还是负向的作用。

（三）优化数据爬取案件的裁判思路

1.完善认定数据爬取不正当竞争行为的思维路径

考察数据爬取行为是否合理是完善传统侵权认定思路的一个重要突破点，法律对数据权益的保护同样具有一定限制。特殊情况下，某些数据爬取行为可能会破坏市场秩序，但因其能够产生较大的公共利益而被认定为具有正当性。[19]另外，部分数据信息本身具有公共属性，对此类数据信息的流通过度保护不但会阻碍获取数据的便利性，同时也将对市场经济效益产生负面影响。因此，在数据关乎公众需求、公众的安全或健康等利益时，可将其作为数据爬取行为具有正当性的合理理由进行考量。例如在奇虎公司与百度的不正当竞争纠纷中，奇虎公司提出其在百度网安装警示插标的行为是为了保护网络用户免受挂马网站的侵害，虽然奇虎公司提出维护用户权益的抗辩，但未能举出有效证据证明。如若奇虎公司能够证明其在百度网站安装插件的行为是以公共利益为导向，那么其爬取数据的行为可能并不属于不正当竞争。

总的来说，认定数据爬取行为是否构成不正当行为不能仅依据传统固化的侵权思路，应将经营者利益、消费者权益、社会公共利益等不同主体的利益需要纳入考量行为正当性的裁判框架下，打破单一的侵权认定思路，形成全面评价各主体竞争行为与竞争利益关系的裁判模式。从反不正当竞争法视角来看，首先需要确定行为是符合商业道德、诚实信用原则等基本原则，其次考察竞争行为产生的效果，是否创造了新的价值，提高了经济效率，并全面衡量各主体的利益得失，再次需要判断行为是否具有合理理由，弥补以效率为导向的传统思维缺陷。

2.拓宽数据治理多元模式下的裁判思路

在数据爬取纠纷案件逐渐重视多元主体利益的裁判模式引导下，不同主体的利益需求以及影响案件裁判结果的多重因素越来越受到重视。拓宽数据治理多元模式下的裁判思路是符合数据爬取纠纷案件发展趋势的选择。

法律是治理数据纠纷的工具，工具的多样化同样能够提高办案效率。《反垄断法》针对数据保护与数据垄断的平衡问题，强调了司法裁判需要从数据获取的难易程度、公开性以及用户意愿等因素进行综合考虑。[20]另外数据爬取行为也涉及《个人信息保护法》《数据安全法》等相关领域，例如《个人信息保护法》强调以平台为基础，对个人信息的收集和使用都需要严格的监管与规则约束。同时，明确了个人信息处理者在收集、使用个人信息等阶段的权利与义务，丰富数据信息纠纷的裁判依据；《数据安全法》同样强调对数据多元共治的鲜明理念，其中第二十一条明确了各行业数据保护的基准，第三十二条指出了数据的获取和收集应在法律法规或者原则的规定之内进行。

拓宽数据治理多元模式下的裁判思路能够跳出反不正当竞争法视角下裁判思路的局限，为司法裁判提供强有力的指导和依据。司法实践同样需要跨出部门法的局限，以不同的思维和角度看待数据纠纷，总结出数据爬取纠纷案件的个案经验，以达到科学高效治理数据爬取行为的目标。

参考文献：

[1]翟巍，刘一诺.反不正当竞争法视角下公开数据爬取行为的合法性边界[J].价格理论与实践，2021（8）：69-73+149.

[2]祝建军.利用爬虫技术盗用他人数据构成不正当竞争——广东深圳中院判决深圳谷米公司诉武汉元光公司不正当竞争纠纷案[N].人民法院报，2019-05-23（7）.

[3]李兆阳.《反不正當竞争法》视角下对数据抓取行为规制的反思与修正[J].暨南学报（哲学社会科学版），2021，43（6）：65-76.

[4]陈兵.保护与竞争：治理数据爬取行为的竞争法功能实现[J].政法论坛，2021，39（6）：18-28.

[5]孔祥俊.论反不正当竞争法的竞争法取向[J].法学评论，2017，35（5）：18-31.

[6]刘艳红，杨志琼.网络爬虫的入罪标准与路径研究[J].人民检察，2020（15）：26-31.

[7]许可.数据爬取的正当性及其边界[J].中国法学，2021（2）：166-188.

[8]丁晓东.数据到底属于谁？——从网络爬虫看平台数据权属与数据保护[J].华东政法大学学报，2019，22（5）：69-83.

[9]王磊.法律未列举的竞争行为的正当性如何评定——一种利益衡量的新进路[J].法学论坛，2018，33（5）：126-136.

[10]刁云芸.涉数据不正当竞争行为的法律规制[J].知识产权，2019（12）：36-44.

[11]苏青.网络爬虫的演变及其合法性限定[J].比较法研究，2021（3）：89-104.

[12]龙卫球.数据新型财产权构建及其体系研究[J].政法论坛，2017，35（4）：63-77.

[13]蔡川子.数据抓取行为的竞争法规制[J].比较法研究，2021（4）：174-186.

[14]冯术杰.“搭便车”的竞争法规制[J].清华法学，2019，13（1）：175-190.

[15]孔祥俊.论新修订反不正当竞争法的时代精神[J].东方法学，2018（1）：64-80.

[16]李生龙.互联网领域公认商业道德研究[J].法律适用，2015（9）：57-61.

[17]蒋巍.恶意数据爬取行为的刑法规制研究[J].学术论坛，2020，43（3）：48-54.

[18]孔祥俊.知识产权强国建设下的反不正当竞争法适用完善——基于行政规章和司法解释征求意见稿的展开[J].知识产权，2021（10）：82-101.

[19]陈兵.“数据垄断”：从表象到本相[J].社会科学辑刊，2021（2）：129-136.

[20]赵婕.擅自获取使用他公司数据构成不正当竞争[N].法治日报，2021-09-28（3）.

Judicial Governance of Data Crawling Behavior：Adjudication Model，Governance Dilemma and Improvement Path

——Based on the Analysis of Article 2 of the Anti-Unfair Competition Law

Song Jianing，Mu Ziwei

（Tiangong University，Tianjin 300387，China）

Abstract：Data crawling behavior is a product of the era of big data，which mainly obtains data resources through web crawler technology，which provides convenience for market operators and triggers the possibility of illegality. Through the analysis of cases，the judicial governance of data crawling behavior from the perspective of the Anti-Unfair Competition Law has fallen into multiple difficulties due to the lack of legal regulation，and through the analysis of cases，it clarified the problems faced in judicial practice such as unclear standards for determining data crawling behavior，incomplete analysis of the nature of unfair competition behavior，and single thinking on judicial adjudication. Taking the illegitimacy of data crawling as the starting point， and combining Article 2 of the Law of the People's Republic of China on Anti Unfair Competition，the paper proposes targeted solutions such as refining the identification criteria of data crawling， comprehensively analyzing the constituent elements of unfair competition， and optimizing judicial judgment ideas..

Key words：data crawling；Anti-Unfair Competition Law；judicial practice

責任编辑：余爽悦