搜索引擎处理个人信息的法律风险及其应对
2023-03-10杨志琼
杨志琼
(东南大学 法学院,江苏南京 211189)
引言
数字经济时代,搜索引擎作为数据流通的重要“守门人(gatekeeper)”,在个人信息获取和利用方面日益重要。但受商业利益驱动的搜索引擎的负面影响不断暴露,对个人信息权利、民众信息选择权等造成诸多侵害,如2017年魏则西事件、2018年今日头条诉百度纠纷案、2019年谷歌泄露用户信息事件、2020年韩国最大搜索平台Naver操控市场案等,引发全球范围内监管当局以“搜索中立”名义对搜索引擎处理个人信息正当性的声讨。新兴法律和监管问题在传统的“搜索中立”与“搜索偏见”争论下更广泛地涉及搜索引擎处理个人信息的风险防范与技术创新的平衡。(1)参见Urs Gasser, Regulating Search Engines: Taking Stock and Looking Ahead, Yale Journal of Law and Technology, 2006,8. p.201.如2022年欧盟通过的《数字服务法》《数字市场法》都对包括搜索引擎在内的个人信息处理者提出了公平性、透明性和可问责制等多项要求,并尝试建构具有特别化、前置化、动态化特质的规制体系。(2)参见李世刚、包丁裕睿:《大型数字平台规制的新方向:特别化、前置化、动态化——欧盟〈数字市场法(草案)〉解析》,载《法学杂志》2021年第9期。与此同时,近年来各国互联网行业和监管层逐渐意识到搜索引擎背后“监视资本主义”(3)监视资本主义(surveillance capitalism)意指由大数据技术力量和资本物化力量相结合的新型资本主义,通过对收集的个人信息进行加工、转卖、社会筛选等商业处理来获取巨额利润,并监视、影响、操纵民众的社会生活。参见唐庆鹏:《大数据时代监视资本主义及其政治经济学批判》,载《当代世界与社会主义》2021年第5期。带来的负面影响,对搜索引擎的治理逐渐形成了市场约束范式、技术修复范式、机构监管范式三种不同模式,但在制度构建、技术逻辑和治理效能上均存在问题而亟需反思。对此,我国《个人信息保护法》要求搜索引擎平台在处理个人信息时必须遵循“合法、正当、必要和诚信”等原则,并在第58条专门规定了搜索引擎平台作为特殊个人信息处理者的“守门人”义务,彰显了我国对搜索引擎产业发展与个人信息流通共享的新法律关切。在此背景下,梳理并反思各国搜索引擎处理个人信息的法律风险、治理范式,探索符合我国产业利益结构的搜索引擎业态治理模式,对促进当前我国个人信息保护和利用极为重要。
一、搜索引擎处理个人信息的法律风险及其挑战
搜索引擎服务的实质是网络服务提供者运用特定的计算机程序向用户提供的通过关键词等检索方法进行网上信息查询的服务。在技术逻辑上,搜索引擎通过对分布零散、体量庞大的网络个人信息进行汇总、排序并向用户展示,已然成为社会信息传播的枢纽,具有显著的“公共性”,但由私人投资、控制且具有商业偏好的搜索引擎不可避免的成为“私权力”,二者之间的巨大张力加剧了其法律风险和治理难题。(4)参见赵鹏:《搜索引擎对信息传播的影响及其法律规制》,载《比较法研究》2018年第4期。
(一)搜索引擎处理个人信息的法律风险
搜索引擎作为信息经济的“守门人”和推动者,通过流量限制、付费优先权机制以及信息过滤、控制等,在经济、文化、政治等领域都带来了机遇和风险,对个人信息权利、民众信息选择权等产生破坏作用,并形成无处不在的“监视资本主义”。
1.权利风险:搜索滥用侵害网络用户信息权利。用户使用搜索引擎的信息权利包括用户个人信息安全和搜索内容的保密需求,典型的是用户公开信息和用户上网痕迹呈现的个人数据痕迹。但近年来,随着搜索引擎处理和交换数据能力的急剧扩大,其数字跟踪技术在获取、泄露用户信息方面带来侵害风险引人担忧。(5)参见Amy Kapczynski ,The Law of Informational Capitalism, Yale Law Journal, 2020,129.p.1462.根据我国《个人信息保护法》的规定,搜索引擎可以在合理范围内处理个人自行公开或者其他已经合法公开的个人信息。但搜索引擎具有强大的信息汇聚功能,能将所收集的信息与特定主体的其他信息汇集并形成特定的人格画像,(6)参见丁晓东:《用户画像、个性化推荐与个人信息保护》,载《环球法律评论》2019年第5期。相关操作可能侵害特定主体的人格尊严与人格自由发展。尤其是部分搜索引擎可能超出合理范围收集个人信息,或者在存储期限已过后仍存储相关个人信息。(7)参见王利明:《论个人信息删除权》,载《东方法学》2022年第1期。此外,有效的搜索要求用户披露有关其兴趣和意图的信息,这种记录用户网络活动踪迹的数据痕迹包括用户自己产生的“自生型数据痕迹”和其他用户产生的“他生型数据痕迹”,也存在权利侵害风险。(8)参见温昱:《搜索引擎数据痕迹处理中权利义务关系之反思——以两起百度涉诉案例为切入点》,载《东方法学》2020年第6期。如在朱烨诉百度案中,百度利用cookie技术收集朱烨的“自生型数据痕迹”引发了隐私权侵权争议;(9)参见江苏省南京市中级人民法院(2014)宁民终字第5028 号民事判决书。在任甲玉诉百度案,百度处理任甲玉“他生型数据痕迹”的行为引发了被遗忘权侵害争议。(10)参见北京市第一中级人民法院(2015)一中民终字第09558号民事判决书。对此,当前国内外主流搜索引擎均未充足履行用户信息收集的告知义务和用户信息使用的提醒义务,而搜索引擎精心起草的服务条款将在很大程度上使自己免受用户隐私诉讼。(11)参见阳雪雅:《论企业违反网络隐私政策的违约责任适用》,载《法学论坛》2021年第5期。这源于搜索引擎算法对用户干预缺乏透明性以及用户缺乏规避搜索操纵的能力。由于搜索引擎存在“算法黑箱”以及围绕搜索引擎算法的商业秘密、知识产权保护需求,导致搜索引擎操作高度不透明且拒绝对外透露。同时,用户无法知晓搜索引擎以何种标准呈现搜索结果,既无法避免搜索引擎的强大功能,也缺乏对抗搜索引擎算法的防御能力。(12)参见张欣:《算法解释权和算法治理路径研究》,载《中外法学》2019年第6期;金梦:《立法伦理与算法正义——算法主体行为的法律规制》,载《政法论坛》2021年第1期。
2.价值风险:搜索控制侵蚀民众信息选择权。互联网是一个开放、平等、互动的网络公共领域,各种信息有益都能进入公共领域得到宣传、讨论、认可;所有社会成员都能公开、平等地参与信息分享、交流,从而不断提升信息生态系统的社会功能。但搜索引擎运营商通过歧视、过滤某些信息来控制信息流动,削弱了数据信息的多样性,最终威胁到互联网作为公共表达体系的开放性和多样性。当搜索引擎选择性地、不受制约地提供搜索结果时,基于这些片面信息而形成偏好、采取行动的用户很难说是意思自治的。(13)参见赵鹏:《搜索引擎对信息传播的影响及其法律规制》,载《比较法研究》2018年第4期。因为网络用户的意思自治意味着存在各种有意义的选择、获取并评估现有信息的能力以及作出选择的能力。当搜索引擎突出或抑制关键信息时,就是以塑造或约束他人选择的方式来限制了用户的自主权。如在魏则西事件中,百度基于商业利益提供的搜索结果在相当程度上影响到魏则西及其家人对疾病的治疗决策。这主要源于搜索引擎对功能强大、资金充足或者商业化的内容提供商内存的结构性偏好,如搜索引擎排名算法依赖于排名网站的链接数量,将更多权重分配给了知名度高、受欢迎或者与其有合作关系的网站。因而搜索引擎排名在很大程度上是“自下而上”的信息“过滤系统”的产物,这种由搜索引擎决定哪些内容能到达用户的特定干预结果可能会有损互联网自由、开放和多样化表达的精神。(14)参见Oren Bracha &Frank Pasquale, Federal Search Commission? Access, Fairness, and Accountability in the Law of Search, Cornell Law Review, 2008,93.pp.1172-1173.
3.技术风险:搜索操纵下监视资本主义的兴起。搜索引擎通过数据和算法架构,将数字化和资本主义结合起来,形成了无孔不入的监视资本主义。这种监视资本主义通过对用户个人信息进行萃取、分析并构建评价规则,来预测、调整和引导用户行为,(15)参见张凌寒:《算法权力的兴起、异化及法律规制》,载《法商研究》2019第4期。其结果是牺牲人性为代价而换取数字经济利益。以谷歌为例,谷歌最初利用网络用户产生的在线数据将搜索引擎变成一个“循环学习系统”,以不断改进搜索结果。后来,谷歌意识到将网络用户的在线痕迹进行结合和分析可以产生新的数据集,于是通过将网站链接、点击率和显示兴趣的数据输入到页面排名算法中,从而为网络用户提供更准确的搜索结果。此后,谷歌又创新了销售定向广告盈利模式,通过收集用户数据用以预测用户的行为来定性投放广告而获利。为了提高预测的准确性,谷歌需要更多的用户数据,并将数据收集从网络世界转向了现实世界。如通过投资智能家居设备、智能可穿戴设备和自动驾驶骑车,以尽可能获取用户跟踪数据,并与用户浏览器、手机中手机的数据相关联,来预测用户的习惯、健康等信息,从而有针对性地投放广告。在这种监视资本主义之下,用户不再是搜索引擎平台寻求服务的对象,而是数据“原材料”被提取和征用的对象,最终实现对用户无处不在的干预、行动和控制。搜索引擎上述操作的特点在于:它不是民主授权的;它排除了技术和物质意义上的不服从;它通常几乎不可抗辩,因为它的运作基本上是无形的、不透明的。(16)参见Amy Kapczynski ,The Law of Informational Capitalism, Yale Law Journal , 2020,129.p.1462.凭借持续可得的数据流、算法架构和监控能力,谷歌和Facebook等公司可以每天进行数百万次秘密测试,以优化其盈利能力,同时监控并改变用户行为,最终形成了由机器驱动的“集体主义”新威胁。
(二)搜索引擎处理个人信息带来的治理挑战
搜索引擎在个人信息领域的操纵和滥用引发了公平性、可获取性和问责制等法律治理难题,并在搜索引擎技术创新的掩饰下形成“破坏性创新”,对各国提出了重大治理挑战。
1.治理目标的调和难题。搜索引擎历来存在搜索中立(search neutrality)和搜索偏见(search bias)之争。搜索中立被视为搜索引擎业态的理想情景,要求运营商平等对待内容提供服务商和用户,维护网络信息的多元化。但搜索中立管制在各国面临两难困境:如果放任搜索引擎运营商的流量限制、付费优先权等差别对待行为,会损害平等、非歧视以及言论自由等互联网基本精神;但如果过度监管,则会损害搜索引擎运营商升级网络服务的积极性,最终损害消费者的整体利益。(17)参见吴亮:《网络中立管制的法律困境及其出路——以美国实践为视角》,载《环球法律评论》2015年第3期;管洪博:《数字经济下个人信息共享制度的构建》,载《法学论坛》2021年第6期。当前对搜索中立和搜索偏见的平衡难题已延伸为搜索引擎效能与功用的协调难题。如在开放式搜索与基础设施安全之间、隐私保障与内容控制、透明度和竞争效率之间都存在抉择难题,需要监管者进行权衡取舍。(18)参见Viva R. Moffat, Regulating Search, Harvard Journal of Law &Technology, 2009, 22.pp.493-494.以美国为例,奥巴马政府对搜索中立管制深表赞同,相关政策对当时美国搜索引擎行业产生了抑制效应,但特朗普执政后则宣布美国放弃网络中立,又极大促进了美国搜索引擎产业的发展。
2.治理内容的位优难题。搜索引擎的技术逻辑和利益结构涉及内容提供商、搜索引擎服务商、用户等多个群体利益关切,逐渐形成了各国监管层关注的三大领域:(1)对内容服务商的监管,主要考察信息内容是否违背未成年人保护、能否促进法治下的言论自由等;(2)对搜索引擎运营商的监管,主要考察是否存在搜索垄断、不正当竞争,以及商标、版权侵权等行为;(3)对用户的权利保护难题,主要考察搜索引擎是否在业务中存在个人信息泄露风险、算法歧视、误导消费等。如何对上述利益关切进行排序,既确保各方利益的最大化,又不致损害其中一方的核心利益,需要监管者进行综合考虑。尤其是监管过程中各利益集团之间存在博弈,监管重点将是哪一领域仍是各国监管层面临的难题。(19)参见Urs Gasser, Regulating Search Engines: Taking Stock and Looking Ahead, Yale Journal of Law and Technology, 2006,8. p.201.
3.治理体系应对技术变化的难题。网络空间创造了一个瞬间即逝的技术环境,导致搜索引擎监管面临技术创新与监管演进同步的挑战。数字技术改变信息流通的社会条件,引发对信息资本所有权和控制权的新社会冲突。搜索引擎极大地扩展了个人参与信息发展和传播的可能性,从而极大地扩展了实现信息民主文化的可能性,但同样的技术也产生了限制信息民主文化参与的新控制方法。搜索技术的日新月异展示了新技术力量重新分配搜索引擎运营商的市场力量。(20)同①。因此,必须通过技术设计、对技术的监管和立法来保护信息社会的民主价值观——互动性、大众参与以及改变信息环境的能力。(21)参见Oren Bracha &Frank Pasquale, Federal Search Commission? Access, Fairness, and Accountability in the Law of Search, Cornell Law Review, 2008, 93.pp.1166-1167.但相关技术问题可能导致政府直接干预搜索引擎得不偿失。因为一旦监管部门决定干预搜索引擎算法,就面临将规制方案与技术革新同步的巨大挑战,其结果要么是监管要求无法实际执行,要么是监管要求束缚了技术创新。(22)参见赵鹏:《搜索引擎对信息传播的影响及其法律规制》,载《比较法研究》2018年第4期;储陈城:《以利益衡量作为网络领域刑事治理的原则》,载《法学论坛》2021年第5期。
二、当前各国搜索引擎业态治理的基本范式及其反思
近年来,搜索引擎在促进信息传播、公众辩论、经济交易等方面具有重要意义,其产生的系统风险也可能会对各国产生严重的负面影响。(23)参见刘颖:《我国〈个人信息保护法〉中的“守门人”条款》,载《北方法学》2021年第6期。值得关注的是,搜索引擎处理个人信息所引发的诉讼浪潮都与特定的技术进步(如关键字搜索)和商业模式(如付费排名)发展紧密相关。(24)参见Urs Gasser, Regulating Search Engines: Taking Stock and Looking Ahead, Yale Journal of Law and Technology, 2006, 8.p.201.为化解上述搜索引擎操纵与滥用所导致的个人信息侵害风险,各国互联网产业和监管层基于不同的网络架构、产业利益、政策背景进行了多种尝试,最终形成了市场约束范式、技术修复范式和机构监管范式。三种范式并非绝然不同或者排斥,而存在交叉适用,但在具体治理主体和治理策略上又有所倚重,体现了不同治理主体对搜索引擎业态治理的差异化理解和多元价值定位。
(一)市场约束范式及其反思
市场约束范式的支持者认为,对搜索引擎进行法律干预是没有必要的,因为市场纪律已经控制了滥用搜索引擎的行为,而且比任何监管制度更有效。如果一个搜索引擎试图以对用户不利或不可接受的方式操纵其结果,用户将会简单地迁移到竞争对手的搜索引擎上。由于担心用户和市场份额被竞争对手抢走,搜索引擎会避免滥用它们的权力。如谷歌就通过向用户承诺不会在广告销售过程中因为搜索偏见而影响搜索结果,最终打败像Overture之类对付费列表进行系统优先排序的搜索引擎。因此,解决搜索引擎垄断和搜索歧视的最佳结构性补救办法是增加竞争,并降低进入该领域的门槛。(25)参见Jack M. Balkin, Digital Speech and Democratic Culture: A Theory of Freedom of Expression for the Information Society, New York University Law Review, 2004,79.pp.9-10.市场约束范式的治理逻辑是通过市场竞争来实现搜索行业的优胜劣汰,从而督促搜索引擎运营商尽可能避免搜索偏见带来的恶害,以解决搜索领域最棘手的问题,即搜索结果中排名靠前的“赢家通吃”效应。近年来国外通用搜索市场几乎是谷歌一家独大,引发了全球搜索行业对谷歌垄断、不正当竞争以及搜索偏向等问题的声讨,倒逼谷歌做出一系列促进公平竞争的承诺,并对自身业务作出多次调整。如从2010年2月起,法国法律搜索引擎Ejustice.fr、英国价格比较网站Foundem和微软在德国的比价网站Ciao等19家单位先后对谷歌滥用其市场支配地位向欧盟委员会提出指控。谷歌不得不随即采取一系列整改措施,包括对出现在搜索结果中的自身产品服务进行清晰标示,以及相应地增加竞争对手的网页链接在搜索结果中的权重,并且承诺不阻止竞争对手使用谷歌网络关键技术的核心专利,将谷歌自身垂直搜索服务和其竞争对手公司的搜索服务在搜索结果中同等条件显示等。(26)参见邓元宏:《搜索中立和搜索偏向在美国的争论和理论分析》,载《新闻界》2016第15期。
但搜索引擎行业具有锁定效应、双边平台、网络效应等不同于传统行业的特征。(27)参见邵晨:《搜索中立与搜索引擎平台的博弈》,载《法律适用》2020年第4期。这导致市场约束范式成立的两个关键前提——搜索引擎市场的强劲竞争和用户对搜索滥用行为的过激反应,都难以成立:(28)参见Oren Bracha &rank Pasquale, Federal Search Commission? Access, Fairness, and Accountability in the Law of Search, Cornell Law Review, 2008,93.pp.1180-1184.第一,搜索引擎市场“垄断”结构具有反竞争性。搜索引擎的固定成本非常高,边际成本相对较低,这就导致搜索引擎市场不太可能出现强劲和动态的竞争,反而具有垄断的市场结构。这源自于:(1)搜索引擎算法的专享。搜索引擎的核心竞争力和成功关键是其搜索算法。有效的算法受到保密措施和各种知识产权的保护,可能永远不会进入公共领域,其结果是新进入的竞争者不能轻易地采用现有算法。(2)提高搜索响应能力的网络效应。一个引擎获得的搜索越多,它就越能锐化和完善其算法,其结果是每增加一个用户,就会为所有后续用户降低了提供更好服务的成本。因此,拥有大量用户的老牌搜索引擎服务商相对于较小的后来进入者而言拥有巨大的优势。第二,用户过激反应短缺。由于“信息鸿沟”的存在,现实中用户反应很难与搜索引擎滥用行为步调一致。这源于:(1)用户的价值偏好与搜索操纵侵害的社会价值之间并未完全重叠。搜索操纵可能排除那些不受欢迎的网站,从而对受排除网站造成毁灭性打击,但对用户影响却很小。用户习惯于使用熟悉的搜索引擎,对搜索引擎操纵所侵害的公平竞争秩序通常无动于衷。(2)用户缺乏检测搜索操纵或确定搜索偏见的动机和能力。搜索引擎的自动化搜索具有相当程度的可信度,因为看似是机器而不是人做出了至关重要的判断,搜索引擎似乎绕过了任何人类媒体固有的结构性偏见和歪曲的数据表示形式。加之搜索引擎运营商注重保密性,用户几乎无法验证搜索结果是否受到操纵。在上述因素作用下,搜索引擎的垄断市场结构将导致少数垄断企业能继续保持市场优势并形成进入壁垒,这就意味着单纯依靠市场竞争来治理搜索引擎操纵难以奏效。(29)参见刘云:《互联网平台反垄断的国际趋势及中国应对》,载《政法论坛》2020年第6期。
(二)技术修复范式及其反思
在意识到市场约束范式的上述不足之后,技术修复范式的支持者认为,搜索引擎技术发展将解决任何市场约束范式无法解决的规制难题。因为搜索引擎的技术结构不是一成不变的,而是可塑的信息媒介,可以进行各种模式和程度的重塑,使以前无法想象的控制和监视成为可能。(30)参见James Boyle, Foucault in Cyberspace: Surveillance, Sovereignty, and Hardwired Censors, University of Cincinnati Law Review, 1997,66.p.177.以往涉及搜索操纵或调整搜索结果的各种批评通常是在“搜索歧视”的语境下被提及,即对某些用户或网站提供不平等待遇或完全拒绝服务。因此,以“技术治理技术”是上佳策略。如埃里克·高德曼(Eric Goldman)认为,搜索引擎会继续发展其“排名算法”以提高搜索结果的相关性,这种技术演进将使搜索引擎偏见的大部分问题得以解决。(31)参见Eric Goldman, Search Engine Bias and the Demise of Search Engine Utopianism, Yale Journal of Law and Technology, 2006,8. pp.198-199.为解决“搜索歧视”的技术难题,各国政府和行业协会对搜索引擎算法规制进行了诸多尝试。如美国联邦贸易委员会技术研究和调查办公室对算法透明度进行了专门研究,并向FTC消费者保护调查员和律师提供有关算法透明度的培训和技术专业知识。(32)参见John Frank Weaver, Artificial Intelligence and Governing the Life Cycle of Personal Data, Richmond Journal of Law and Technology, 2018,24. pp.2-9.美国圣克拉拉大学马库拉应用伦理中心联合各媒体、平台和机构代表,设计了一套面向搜索引擎的可信度评价体系。(33)参见汝绪华:《算法政治:风险、发生逻辑与治理》,载《厦门大学学报(哲学社会科学版)》2018年第6期。上述算法技术标准的制定和推广为规范搜索引擎算法运行、避免搜索引擎算法歧视起到了积极作用。
然而,无论遵循何种技术路线,都无法消除搜索引擎算法的主观判断和价值分歧。(34)参见赵鹏:《搜索引擎对信息传播的影响及其法律规制》,载《比较法研究》2018年第4期。为了满足用户需求并保持相对于竞争对手的竞争优势,搜索引擎会不断优化其算法并操纵搜索结果,将相关网站从搜索结果中屏蔽,或将其降至较低的排名。但选择将哪些因素包括在排名算法中以及如何对其进行加权,本质上仍是搜索引擎对信息流中有价值之处作出了编辑判断,因而其公正性和透明性受到质疑。以往个性化搜索曾被视为规避、对抗搜索偏见和搜索操纵的关键屏障,其技术创新可能会提高搜索的准确性并使用户受益。因为个性化搜索不再局限于“一刀切”的搜索结果,而是根据每个用户的特征和兴趣定制搜索结果,每个查询将会有多个排名。被索引的实体将不再被锁定在零和博弈中,拥有少数利益的搜索者将不再遭受次优结果的折磨。(35)参见Eric Goldman, Search Engine Bias and the Demise of Search Engine Utopianism, Yale Journal of Law and Technology, 2006,8.pp.198-199.然而,从现实技术逻辑来看,个性化搜索非但不能解决问题,反而增加了搜索操纵的风险和诱惑。因为针对特定用户特征的个性化搜索使得更精细的操纵成为可能,并增加了搜索结果中每一项干预的潜在效应。与针对整个用户群进行概括操纵不同,个性化搜索对于同一关键词可以根据用户个人资料呈现不同搜索结果,这将提高搜索操纵的有效性和可能性,导致搜索引擎拥有一种更精细的力量来塑造不同用户搜索结果,因此将会受到更强烈的内部诱惑和外部诱惑来使用这种力量。加之用户识别、理解和检查搜索操纵的能力有限,可能会导致搜索引擎对搜索结果进行更多针对性的干预。(36)参见Oren Bracha &Frank Pasquale, Federal Search Commission? Access, Fairness, and Accountability in the Law of Search, Cornell Law Review, 2008,93.p.1188.
(三)机构监管范式及其反思
不同于市场约束范式和技术修复范式通过激发搜索引擎行业的内部活力来实现自治,机构监管范式是依靠行政机构、专家和公众对搜索引擎进行外部监督的问责机制。由于搜索引擎业态具有传统公用事业的特征,是信息社会必不可少的基础设施和承运人,控制着新兴信息经济秩序的重要资源和关键瓶颈,形成了“准公权力”并对公众产生重要影响,引发了一系列社会、政治和法律冲突,如搜索操纵引发的搜索歧视和“隐性营销”。因而不少支持者认为应对其进行机构监管,这对于增强信息的多样性和普及率、抑制搜索偏见和促进民主至关重要。兰克·帕斯夸莱(Frank Pasquale)是机构监管理论的倡导者,认为搜索引擎对搜索结果的编辑和排序受商业利益驱动而具有明显的主观性,因而主张强有力的政府规制来迫使搜索引擎披露干预搜索结果的原因,这就要求对搜索引擎进行更集中和更严格的监管。(37)参见Oren Bracha &Frank Pasquale, Federal Search Commission? Access, Fairness, and Accountability in the Law of Search, Cornell Law Review, 2008,93.p.1207.对搜索引擎市场采取严格市场监管的典型是欧盟。多年来,欧盟遵循保护个人数据权利的司法传统,使得谷歌在美国采取言论自由的辩护策略在欧洲普遍受挫。如2017年6月27日,欧盟委员会经过7年的调查,以谷歌利用搜索算法偏袒自有服务、影响正常竞争为由,向谷歌母公司Alpha做出罚金24.2亿欧元的处罚,并要求谷歌进行技术调整,体现了欧盟反垄断执法机构对搜索引擎平台的严格监管倾向。欧盟2019年6月19日通过的《平台和商户间公平性和透明度法》第5条规定明确要求搜索引擎运营商向公众披露算法参数,以实现对搜索平台权力的有效规制。2020年欧盟《数字服务法提案》和《数字市场法提案》都对包括搜索引擎在内的大型在线数字平台规定了处理个人信息时特别化、前置化和动态化义务。(38)参见李世刚、包丁裕睿:《大型数字平台规制的新方向:特别化、前置化、动态化——欧盟〈数字市场法(草案)〉解析》,载《法学杂志》2021年第9期。
但如果将机构监管所做的决策以及所带来的潜在社会成本,包括配置、产出、效率损失以及补救措施所需的执行成本等进行计算,就会发现单纯的机构监管存在效率低下、扭曲市场、抑制创新等弊端。(39)参见席涛:《市场监管的理论基础、内在逻辑和整体思路》,载《政法论坛》2021年第4期。1.机构监管效率低下。由于搜索技术、搜索商业模式和用户行为都在快速更新,机构监管的执法能力和资源难以有效跟进搜索行业或技术变化。(40)参见Wendy Seltzer, The Broadcast Flag: It's Not Just TV, Federal Communications Law Journal, 2005, 57.p.209.因为搜索结果通常是动态的,搜索信息也不断变化,用于搜索的技术和标准也定期变化。即便受害用户或内容提供商向监管机构投诉,投诉的特定问题可能在数周或数天内就会过时,监管机构不太可能在如此短的时间内做出回应。2.机构监管的标准制定可能“锁定”有利于特定行业或实体的次优标准而重蹈“搜索偏见”。由于技术鸿沟的存在,监管机构难以及时有效地提出一套客观的标准来评估搜索引擎结果的适宜性并规避搜索偏见。政府机构和私人机构一样,很可能会创造出有偏见的搜索结果,而且效率会更低。一个由约翰·霍普金斯大学运营、美国国际开发署资助的生殖健康数据库将“堕胎”作为搜索词屏蔽,用户输入“堕胎”时没有得到任何搜索结果,但用户并不知道数据库中是否没有关于“堕胎”的文章或者这个词被屏蔽了。这证明了一个准政府机构能在没有通知或解释的情况下,以完全不透明的方式影响搜索结果。这件轶事很难让人们对政府控制搜索结果的优越性产生更大的信心。(41)参见Viva R. Moffat, Regulating Search, Harvard Journal of Law &Technology, 2009, 22.p.492-494.
综上可见,市场约束范式试图通过推动搜索引擎市场竞争来消除搜索操纵的负面影响,但未能正确捕捉搜索引擎市场结构的垄断特征和用户对搜索操纵的冷漠反应,导致治理效果不彰。技术修复范式试图通过提升搜索引擎算法规制来解决搜索歧视难题,但这只是基于支持者的主观判断而非网络技术规律来制定治理策略,与搜索引擎的技术逻辑并不吻合,无法有效解决搜索操纵、滥用等问题。而机构监管理论更是基于公共利益需求而非技术激励做出治理策略,难免陷入低效、低能的尴尬境地。上述不同尝试表明,单纯依靠市场、技术或者机构并不能彻底解决搜索操纵、滥用带来的个人信息侵害风险,只有同时调动搜索引擎业态的内生动力和外部问责机制,在技术化与规范化之间进行融合,才能形成稳定、有效的治理机制。
三、《个人信息保护法》实施后我国搜索引擎业态治理的具体机制
搜索引擎业态治理的终极目标是受搜索引擎影响的多种法益与自由利用搜索技术之利益的平衡。要调和搜索引擎这种“公共性”和“私权力”之间的张力,必须重视搜索引擎运营商、内容提供商、监管部门等利益相关主体在业态治理中的作用及其协同效能。为贯彻习近平总书记提出的“共建共治共享”的社会治理理论,《互联网信息服务算法推荐管理规定》和《关于加强互联网信息服务算法综合治理的指导意见》都强调形成“多元协同、多方参与的治理机制”。这种“多元共治”的治理机制强调政府、网络企业在网络治理中的主体功能范围和相互作用关系,并形成多主体的搜索引擎治理结构。
(一)自律机制:提升搜索引擎运营商或行业协会的自我约束
有效的搜索引擎业态治理机制需要关切搜索引擎作为信息控制者的内在动机,培育激励相容的内生机制。(42)参见周汉华:《探索激励相容的个人数据治理之道——中国个人信息保护法的立法方向》,载《法学研究》2018年第2期。这种内生机制强调通过搜索引擎运营商或者搜索行业协会的自我调节、自主管理等自组织能力来积极消除搜索引擎的负面影响和潜在危害。由于搜索引擎平台与网络用户之间的信息不对称以及平台组织的封闭性、变化性,导致网络用户通过私权来保护个人信息或者政府利用公权力来穿透式监管搜索引擎平台的成本都极高,因而通过加强搜索引擎平台组织的自治和合规,督促其履行对网络用户的忠实义务和注意义务等义务,能更好的保护个人信息。(43)参见吴伟光:《平台组织内网络企业对个人信息保护的信义义务》,载《中国法学》2021年第6期。对此,2012年1月中国互联网协会发布的《互联网搜索引擎服务自律公约》提出搜索引擎服务商应主动加强行业自律;2016年8月施行的《互联网信息搜索服务管理规定》也提倡搜索引擎行业组织应当建立健全行业自律制度和行业准则,指导互联网信息搜索服务提供者建立健全服务规范,督促其依法提供服务。但“百度莆田事件”“魏则西事件”“马蜂窝抄袭评论”等事件暴露了当前我国搜索引擎平台自我管理机制的不足。对此,未来我国搜索引擎运营商及行业协会应基于行业特点,积极发挥专业技术优势进行内控式自我规制。
1.搜索引擎平台应加强个人信息处理的合规建设。当前大型搜索引擎平台已成为个人信息处理的关键环境,为个人信息处理提供通道、空间、技术等资源。根据控制者义务理论,网络服务提供者对其管控的网络空间负有适度管控和注意义务,尤其是对具有强大控制力和影响力的信息“守门人”,应对其支配的个人信息进行特殊保护和管理。(44)参见张新宝:《互联网生态“守门人”个人信息保护特别义务设置研究》,载《比较法研究》2021年第3期。对此,我国《个人信息保护法》第58条明确要求大型搜索引擎平台按照国家规定建立健全个人信息保护合规制度体系。企业数据合规是以有效改善内部控制和自我约束能力为核心的企业自律行为,(45)参见赵万一:《合规制度的公司法设计及其实现路径》,载《中国法学》2020年第2期。这是各国治理搜索引擎最有效的手段。根据《个人信息保护法》的规定,今后我国搜索引擎处理个人信息处理时应履行如下义务:(1)对可能侵犯网络用户的色情、暴力等内容进行初步的自我过滤;(2)主动或者应用户要求删除侵犯人格权或其他权利的内容链接,如欧盟法院的裁判已承认搜索引擎也属于用户删除权的请求对象;(46)参见András Koltay, Privacy and Online Gatekeepers, Mississippi Law Journal, 2020,89.p.645.(3)为用户或内容提供者提供行使数据携带权的便捷渠道;(4)对涉及个人信息的查询、点击和查看数据进行匿名化处理;(5)建立允许个人或者实体通知存在违规处理个人信息的机制;(47)参见刘颖:《我国〈个人信息保护法〉中的“守门人”条款》,载《北方法学》2021年第6期。(6)不得为了自身或他人利益而操纵搜索结果等。
2.从技术上提升搜索透明度,以维护用户信息权利。从法律的角度来看,增加搜索引擎算法透明度的核心动机是使数据主体了解算法决策背后的原因,并防止歧视性或法律上不合规的决策。(48)参见M Brkan, Do Algorithms Rule the World? Algorithmic Decision-making and Data Protection in the Framework of the GDPR and beyond, International Journal of Law and Information Technology,2019,27.p.112.2012年欧洲委员会在有关搜索引擎保护人权的建议方面指出,为保护网络用户的隐私权和个人信息权,搜索引擎应提高搜索结果的透明度,说明哪些内容被搜索及其原因、点击排名背后的原因等,以确保呈现内容的多元性和多样性。(49)参见András Koltay, Privacy and Online Gatekeepers, Mississippi Law Journal, 2020,89.p.623.但技术障碍和法律限制,尤其是算法的保密性,都可能妨碍公众对搜索引擎算法的理解。(50)参见张凌寒:《数据生产论下的平台数据安全保障义务》,载《法学论坛》2021年第2期。由于搜索算法的“黑箱子”和围绕搜索引擎商业保密需求,搜索引擎操作高度不透明被视为信息不对称问题的潜在响应。搜索引擎运营商倾向于限制公众、政府对其算法的了解,因此可将透明度作为一种机制,用来减轻法律或政策对搜索引擎施加的内容过滤要求的影响。今后搜索引擎平台应将个人信息保护的政策法规嵌入算法设计中,提高搜索引擎算法的透明度,这对于用户信息自主有巨大意义,可提升用户对搜索引起算法的信任和接受算法决策的意愿,同时也可方便政府和用户对搜索引擎进行监督。搜索引擎平台提升搜索透明度的一个重要举动是将付费广告与未付费广告区分开来,并对其予以适当的标记。如《互联网信息搜索服务管理规定》明确要求搜索引擎区分自然搜索结果与付费搜索信息,对付费信息逐条加注显著标识。我国《电子商务法》第40条也要求电子商务履行搜索类算法和竞价排名商品或者服务的明示义务。但对于“显著”的具体解读还值得进一步推敲,如可以在不同于自然搜索结果的其他区域单独标注,或者采用不同于自然搜索结果的颜色加以标明等。(51)参见Andrew Sinclair, Regulation of Paid Listings in Internet Search Engines: A Proposal for FTC Action, Boston University Journal of Science and Technology Law, 2004,10.p.371.
3.积极扩建网络基础设施,以扩大访问信息的渠道。搜索引擎应保证对服务的访问、服务的多样性以及内容的公正对待。(52)参见András Koltay, Privacy and Online Gatekeepers, Mississippi Law Journal, 2020,89.p.623.搜索引擎应在非歧视性条款下最大程度地为用户和内容提供商提供访问渠道,减少网络堵塞、网络屏蔽。从搜索基础架构的角度而言,访问渠道对用户至关重要,因为这是实现信息自主、信息多样和信息质量的先决条件。只有更广泛的访问渠道才能让用户自由、高效地从不同角度对公共问题展开讨论。如果一些信息不被获悉、讨论,则讨论结果会偏向同质、中庸,缺乏批判性。(53)参见吴亮:《网络中立管制的法律困境及其出路——以美国实践为视角》,载《环球法律评论》2015年第3期。如2020年11月,百度搜索引擎封杀《财新周刊》杂志揭露赌博黑产如何渗透互联网全产业链的报道《洞穿网络赌博》,侵害了公众对网络黑产的知情权而引发公众不满。因此,搜索引擎运营商应着眼于创建一个倾向于增加对搜索基础设施访问的生态系统。在这样的环境中,用户不再是信息的被动接收者,而是日益活跃信息生态系统的贡献者,能真正促进信息多元化和民主化。(54)参见Urs Gasser, Regulating Search Engines: Taking Stock and Looking Ahead, Yale Journal of Law and Technology, 2006, 8.p.201.对此,可借鉴美国《维护互联网开放性指令》中的“禁止屏蔽”原则,即禁止搜索引擎对特定用户进行封堵或者截流,尤其是防止搜索引擎擅自筛选内容或者阻碍网民获得合法信息。
(二)他律机制:加强政府机构的外部监管
他律机制强调政府功能的有效发挥,尤其是在国家主导下优化治理结构,是一种外部监管机制。《互联网信息搜索服务管理规定》明确了国家互联网信息办公室负责全国互联网信息搜索服务的监督管理执法工作,地方互联网信息办公室负责本行政区域内的监督管理执法工作。未来我国各级互联网信息办公室应积极吸收域外搜索引擎业态治理经验,在规范我国搜索引擎服务的同时促进个人数据流通共享。
1.在政策法规上为搜索引擎平台处理个人信息配置合理的权责义务,尤其要加强对搜索引擎平台处理个人信息违规行为的提前干预。传统竞争法、刑法对搜索引擎平台违法行为采取的是事后救济的规制路径,难以及时、有效地应对搜索引擎平台侵害个人信息的行为。(55)参见刘艳红:《民刑共治:中国式现代犯罪治理新模式》,载《中国法学》2022年第6期;劳东燕:《个人信息法律保护体系的基本目标与归责机制》,载《政法论坛》2021年第6期。对此,欧盟《数字市场法》采取了前置化的事前规制路径,对搜索引擎平台规定了基础性的开放义务、披露义务等,以干预其在个人信息处理中的实施的数据混同、推行统一身份识别、“搭售”其主要服务等行为;以及协商性裁量义务,如为用户提供数据访问、数据使用和数据可携带权等义务。(56)参见李世刚、包丁裕睿:《大型数字平台规制的新方向:特别化、前置化、动态化——欧盟〈数字市场法(草案)〉解析》,载《法学杂志》2021年第9期。我国《个人信息保护法》第58条也明确规定了搜索引擎平台等在个人信息维护上的各项义务,包括审查义务、停止提供服务、报告义务等。未来我国对搜索引擎业态的治理应积极借鉴欧盟《数字市场法》,将《民法典》和《个人信息保护法》中关于个人信息处理所应遵循的合法、正当、必要和诚信原则、目的原则等通过行业标准或者规范性文件等进一步落实,并强调搜索引擎平台对个人信息保护活动予以配合和协助,以克服机构监管的“技术短板”。(57)参见刘艳红:《人性民法与物性刑法的融合发展》,载《中国社会科学》2020年第4期。
2.在技术上慎重干预搜索引擎的算法设计和手动调整结果,以促进信息产业发展。算法黑箱引发的搜索歧视导致监管者对算法透明度及其问责制的高度关注。但从技术逻辑来看,某种程度的算法保密既符合搜索引擎知识产权的保护需求,又符合公众对高质量搜索结果的要求;与之相反,高度透明的搜索结果反而可能降低搜索结果的质量,过多的算法披露会损害用户的隐私保护和信息可获得性等。因为公开搜索算法会使不法分子趁机对搜索引擎展开攻击或者通过与搜索引擎进行算法博弈来操纵搜索,而且剥夺搜索引擎直接调整排名的功能会限制其惩罚黑客以及违法网站的能力。因此,美国联邦贸易委员会虽然督促谷歌对其市场搜索行为做出公平竞争承诺,但同时对于其搜索算法并不深究,体现了监管部门既支持网络公平竞争,也尊重公司商业秘密和技术创新的基本立场。(58)参见邓元宏:《搜索中立和搜索偏向在美国的争论和理论分析》,载《新闻界》2016第15期。此外,鉴于在法律上很难将算法更改与手动调整加以区分,且二者都是通过类似技术手段来帮助用户找到最相关的答案,当算法由于某种原因而失败时,针对特定站点和排名的算法进行手动调整可以纠正相关性问题。(59)参见Marvin Ammori &Luke Pelican, Competitors' Proposed Remedies for Search Bias: Search "Neutrality" and "Other Proposals", Journal of Internet Law, 2012,15.p.21.因此,监管机构同时应谨慎干预搜索引擎的手动调整结果。
3.合理使用结构性规制,以确保信息多样化。各国政府规制搜索引擎旨在实现两项公共利益:一是在经济层面促进数据信息流通共享,推动数字经济的长远发展;二是在非经济层面,促进信息自由流通,维护民主协商和文化价值多元化,尤其是对稀缺传播资源的合理分配和有效使用。(60)参见吴亮:《网络中立管制的法律困境及其出路——以美国实践为视角》,载《环球法律评论》2015第3期。但搜索引擎受商业利益驱动,偏好商业性的信息,却对教育、文化、学术等信息形成了系统性歧视,这对信息社会的民主生态建设产生负面影响,最终影响到整个社会的知识建构和偏好。因此,应通过结构性规制来纠偏这种歧视,通过法律授权对搜索引擎施加一定的公益性约束。(61)参见赵鹏:《搜索引擎对信息传播的影响及其法律规制》,载《比较法研究》2018年第4期。如在魏则西事件之后,监管部门明确要求百度严格限制商业推广信息的比例,每页不得超过30%。对搜索引擎的结构性规制能确保各类教育、文化、卫生等公益信息能被用户及时、公开获取,这对维护网络信息的多元化和促进公共福利至关重要。
结语
搜索引擎作为信息社会的网络基础设施,控制着网络信息的分流并引发了搜索滥用、搜索歧视等风险,已成为当前全球共性法律治理难题。(62)参见刘艳红:《网络犯罪的刑法解释空间向度研究》,载《中国法学》2019年第6期。为确保搜索引擎在处理个人信息时的公平性和透明性,各国互联网产业和监管层纷纷探索了符合本国信息文化和网络资源结构的法律治理模式,如市场约束范式、技术修复范式和机构监管范式,但因与搜索引擎的市场结构、技术逻辑、监管体制等不符而难以奏效。我国在网络领域立法历来强调多元治理,如我国《个人信息保护法》第11条规定国家“推动形成政府、企业、相关社会组织、公众共同参与个人信息保护的良好环境”。作为全球互联网服务接入人数最多的国家,未来我国搜索引擎在处理个人信息时应及时总结现有治理经验的得失利弊,通过搜索引擎运营商和行业协会的内部推动来建构自律机制,通过政府外部监管来建构他律机制,通过法律治理与技术治理、行业自律与政府监管的融合来建构互律机制,最终形成多元化、规范化、系统化的搜索引擎业态治理体系。