温和的被遗忘权主张
——基于权利的信息伦理视角
2020-12-01胡晓萌
胡晓萌
互联网、大数据和人工智能等信息技术,突破了人类记忆能力的限制,延长了记忆时限,甚至使记忆成为永恒。从前有些犯过错的人换个陌生的地方就可以重新开始,而在信息技术方便检索、全球可达的今天,这种过往历史被遗忘的情况变得不再可能。这正如《纽约时报》的一个文题所言:万维网意味着遗忘的终结。
正是敏感于数据的永久记忆,担忧其可能危害个人的隐私和安全,欧盟通过了《通用数据保护条例》(以下简称为GDPR),明确赋予个人被遗忘权(Right to be forgotten)。被遗忘权①,指个人作为个人数据②的数据主体,享有被互联网遗忘的权利,因而可以要求数据控制者删除其在互联网上可依法删除的个人数据。但是,以维纳和弗洛里迪为代表的信息伦理学家则对数据遗忘持有相反看法,他们认为删除信息是一种熵增行为,该行为是不道德的。
本文梳理、分析了上述两种观点,认为它们都有失偏颇,尝试提出一种中立的观点,实现数据开发利用和数据隐私保护之间的平衡、个人数据权利和机构数据权力之间的平衡。
一、大数据“永久记忆”的消极影响和被遗忘权的源起
互联网、大数据和人工智能记录了人们的一言一行,甚至包括每一次目光注视、手指触摸。同时,数据挖掘、搜索等技术可以通过整理(organise)和集聚(aggregation)将个人的碎片化数据组合成其数据画像。这使得人们网络上的行为在过去数年后仍然有迹可循,人们想要被遗忘变得不可能。人们因为被大数据“永久记忆”而遭受隐私侵犯、网络暴力和数字身份侵害等各种危害。因此,人们想要拥有被遗忘的权利。
1.大数据“永久记忆”的消极影响
互联网、大数据和人工智能等信息技术使“永久记忆”成为现实,个人的言行将以数据的形式被永远记录下来,他们的行为则可能因为这些数据会被数据控制者利用而受到支配。因此,控制个人过去的数据实质上意味着一种权力关系。数据不仅有关记忆,更是有关权力[1]。这就对个人造成了很多直接威胁。大体而言,这些威胁可归纳为以下三个方面:
(1)“永久记忆”加剧了对个人的心理操控。通常人与人之间的信任建立在对彼此过去的了解、拥有的共同记忆之上。由于大数据用户画像使计算机比个人更了解自己,因而,基于个人完整数据开发的个人性化推送算法就可以实现对个人行为的操控,如Facebook 数据泄露影响美国大选事件。近年来,大规模的数据泄露事件频频发生。个人数据泄露也为不法分子利用个人完整数据进行电信诈骗提供了的机会。
(2)“永久记忆”使人肉搜索、网络霸凌更泛滥。很多人都会依据他人过去的行为对其进行评判、打标签。借助“永久记忆”,不怀好意者可以更轻易地进行人肉搜索,挖掘他人过去的“黑历史”,进行网络霸凌。更糟糕的是,利用公众人物的黑历史照片、视频等数据进行碰瓷、敲诈勒索成为了一种牟利手段。
(3)“永久记忆”使个人丧失了对其数字身份的控制。个人在网络空间留下的数据可整理集聚成为个人的数字身份。由于“永久记忆”,个人的历史数据可以持续影响个人的社会评价,进而对现实空间中的生活、学习和工作造成实质影响。个人想要被遗忘的数据无法得到遗忘,所以个人无法通过控制个人数字身份来应对“永久记忆”的负面影响,正如美国的史黛西·施奈德因为一张戴着海盗帽子的“黑历史”照片而丧失了成为教师的机会。
2.被遗忘权的源起和发展
维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger)是最早基于数字技术和网络全球化背景提出“被遗忘权”的学者。他说:“我们要开始思考减少我们的数字足迹:不是通过戒掉互联网,而是通过塑造互联网及其服务,以使得数字信息能够真正在一段时间之后被渐渐遗忘……我会乐观地号召所有人,要在大数据时代始终记得遗忘的美德。”[2](P6-8)舍恩伯格的研究得到了社会的支持和响应,2009 年法国启动了“被遗忘权在社交网络和搜索引擎中实施”的议案[3]。
欧盟因其隐私保护传统而在个人数据隐私保护方面处在世界领先地位。在认识到数字技术“永久记忆”可能带来的种种危害后,欧盟的官员很快接受了被遗忘权。2010 年,欧盟委员会副主席薇薇安·雷丁在关于修订《欧盟95 数据保护指令》的发言中表示:“用户必须能有效地控制他们的网络信息,并且能随时更正、撤销或删除它们,欧盟希望赋予数据主体一项新的权利,即‘被遗忘权(删除权)’。”2012 年,欧盟委员会提交了GDPR(2012 年建议案),被遗忘权第一次被写进了法律文件中。
被遗忘权真正进入公众的视野,源自2014 年的西班牙谷歌案[4]。2009 年,冈萨雷斯要求西班牙《先锋报》删除其因欠缴社保而房产被强制拍卖的相关信息,同时要求谷歌删除指向相关信息的搜索链接。他指出,拍卖事件已经过去很多年了,但是在谷歌上搜索他的名字时仍会显示相关的拍卖公告,这对他的声誉造成了负面影响。西班牙信息保护机构要求谷歌撤回此类数据,并要求搜索引擎的经营者禁止对此类数据的访问。这一裁定最终也得到了欧盟法院的支持。欧盟法院指出,虽然1995 年的《个人数据保护指令》没有明确提出被遗忘权,但是根据指令第12 条规定,数据主体有权“更正(rectification)、擦除(erasure)或屏蔽(blocking)不符合《个人数据保护指令》所规定的处理的数据”,由此可推导出被遗忘权。依据该判例,欧洲居民可以向搜索引擎申请在搜索结果中删除有关个人的不恰当的、不相关的、过时的、多余的网页链接。随后,谷歌方面执行了判决,并发布了在线申请程序,正式接受欧盟用户行使被遗忘权的申请。
2018 年,欧盟GDPR 正式生效,第17 条即是被遗忘权(又称为删除权)。条文规定,数据主体有权要求控制者无不当延误地删除与其有关的个人数据,并且在下列理由之一的情况下,控制者有义务无不当延误地删除个人数据,其适用的情形包括六种:(1)数据收集、使用的目的不再必要;(2)撤回同意或期限届满,没有任何法律基础支持数据继续处理;(3)反对,即数据主体根据“新草案”第21 条反对数据的处理,除非数据的处理对保护主体的根本利益至关重要或是为了公共利益等原因;(4)个人数据被非法处理;(5)为遵守控制者所受制的联盟或成员国法律规定的法定义务,个人数据必须被删除;(6)个人数据是根据第8 条第1 款所提及的信息社会服务的提供而收集的。
二、被遗忘权:欧盟的保守主义与信息伦理学的激进主义
欧盟GDPR 赋予个人被遗忘权,规定个人有权要求数据控制者无不当延误地删除相关的个人数据。GDPR 以一种保守的方式保护个人的尊严和权利,但是过于保守的法律监管不利于技术和产业的发展。而信息伦理学的激进主义则强调数据的价值,认为任何导致数据减少的行为都是不道德的行为。数据主义则走向极端,将数据流最大化作为第一诫命。这过于激进,会导致个人权利的消解。
1.被遗忘权:欧盟的保守主义路径
欧盟具有注重个人隐私保护的传统,认为隐私权关系人格尊严,是一项“基本权利”,因而将隐私权写入了《欧盟基本权利宪章》。基于此,欧盟赋予个人相应的数据权利,使个人获得更大的数据自主权,让个人能够有效控制其个人数据,而被遗忘权有利于个人数据自主权的真实落地。但是欧盟过于保守的做法会造成以下两种不良后果:
(1)被遗忘权对个人过于保守的保护不利于数据自律
谷歌接收的欧盟用户行使被遗忘权的申请中,不乏“严重犯罪”“公众人物”等类型的申请,尤其是一位英国医生的请求,他要求删除过去不良医疗处理有关的50 条链接。公众对此表示愤慨,指出删除此类信息可用于操纵,并可能导致无辜的人们做出不明智的决定。Google 回应了公众的愤慨,表示其删除内容时,既考虑了个人权利,也考虑了公共利益[5]。
被遗忘权赋予人们数据自主权,对个人的隐私和人格尊严进行了有效保护。但是,一旦政府过于保守地赋权,过分强调个人的自主权,则会造成不良后果。首先,一个人过去的信息是知识和真理的一部分,其他人可以根据这些信息在交往中合理地定位这个人,形成对这个人行为的稳定预期。这是社会合作的基础。有学者指出,若个人行使被遗忘权,使与其自身有关的信息被遗忘,而想要被遗忘的信息是公众知情权的组成内容,这会造成被遗忘权与公众知情权之间的冲突;并且遗忘行为本身就足以造成对公众知情的巨大损害,是一种“极不道德(deeply immoral)”的倒退[6]。个人有时候会刻意隐瞒、掩饰或美化自己,被遗忘权为此提供了更多可能性,因此应当保护社会公众(尤其是与之打交道的人)的“识别权”[7]。其次,人们对自己的行为负有道德责任。如果人人都可以轻易地抹掉过去,这会损害公民的道德责任感,阻碍人们形成应有的道德自觉。人们无法从内对自己的数据行为进行规范,难以形成数据自律。现在市场上出现的“付费删帖”服务,即是个人进行名誉管理、洗刷个人数据历史污点的一种行为。社会应对这种趋势提高警惕。
(2)被遗忘权限制了技术和产业的发展
GDPR 被称为史上最严格的数据保护法。产业界认为,数据是数字经济的“石油”,过于严格的数据保护监管会限制欧盟的数字经济发展。作为世界最发达的区域之一,欧盟的互联网行业发展却相对滞后。《中国互联网行业发展态势暨景气指数报告》列举了2019 年全球互联网上市公司30 强名单,其中,美国企业17 家,中国企业10 家,巴西、韩国、日本各一家,欧洲则没有一家[8]。
被遗忘权增加了企业的合规成本。2017 年普华永道调查显示,在被调查的500 家美国公司中至少有68%的公司为了满足GDPR 的合规预计花费100 万到1000 万美元成本,有9%企业的预算超过1000 万美元[9]。2018 年谷歌发布报告称,在过去3年7 个月内收到了近240 万个链接删除请求[10],给企业造成了很大负担。巨大的合规成本显然不利于初创信息科技企业的发展,也抑制了产业的发展。因此,被遗忘权被某些学者视为欧盟对抗美国大公司的尖端武器(cutting Edge Weapon)[11]。从网络经济竞争的角度看,这实际上是欧盟利用数据保护主义(data protectionism)抵制美国互联网企业的垄断地位[12]。
被遗忘权破坏了技术创新。大数据、人工智能依靠数据的喂养,因此数据优势被认为是技术创新的重要优势之一。2018 年美国“数据创新中心”(CFDI)在一份研究报告中认为,GDPR 的实施会对人工智能技术的发展造成重大负面影响,其中数据遗忘权会损坏人工智能系统[13]。AI 系统通过数据集的训练建立规则,如果AI 系统被删除支撑其行为关键规则的数据,数据集的完整性被破坏,那么AI 系统的准确性就会降低。如果AI 算法的训练数据集被删除的数据较多,就会破坏算法模型的重要规则,甚至破坏整个系统,对用户的使用造成损害。
2.激进主义路径:信息伦理学和数据主义
数据的价值已经成为全社会的共识,大数据技术促进了国家治理、产业经济和公共服务等方面的发展,以数据为基础的人工智能也在经济社会发展智能化、公共服务和城市管理等方面发挥越来越重要的作用。
基于数据的价值,以维纳和弗洛里迪为代表的信息伦理学家对删除数据持否定态度。控制论创始人维纳根据热力学第二定律提出信息伦理学的熵增原理。他认为熵增可被视为一个威胁着人类所珍视的一切的“自然的邪恶”[14](P16)。弗洛里迪也认为,熵是“自然的祸害”,它能损害或毁灭任何一个可能有价值的事物。因此,对两位思想家而言,不必要地增加熵是一个无理地产生邪恶的行为,任何维持或增加信息的行为可以被解释为善的。
弗洛里迪的信息伦理学认为,信息具有内在价值,因此促进熵的减少(意味着信息的增加)是每个理性存在物的义务;而任何导致熵的增加(意味着信息的减少)的行为,都属于恶。他列出了四个基本道德原则:(1)不该在信息领域中导致熵增;(2)应该在信息领域防止熵出现;(3)应该从信息领域清除熵;(4)应该通过增加信息的量,提升信息的质和丰富信息的多样性这样一些改善信息环境的途径来促进信息福利。据此,一个行为在道德上是错误还是正确的,一般取决于这一行为是减少还是增加了信息[15]。
数据主义将这一立场发挥到极致。数据主义最重要的一条诫命就是,数据主义者要连接越来越多的媒体,产生和使用越来越多的信息,让数据流最大化。第二条诫命就是,要把一切连接到系统,就连那些不想连入的异端也不能例外。对数据主义来说,信息自由是最高的善[16](P347)。依据这两条诫命,个人就应该形成“记录-上传-分享”数据的行为习惯,即“如果你体验到了什么,就记录下来。如果你记录下了什么,就上传。如果你上传了什么,就分享”[16](P352)。在数据主义看来,人生的价值在于数据的价值,数据的价值在于分享,而不在于单纯拥有体验。体验不分享就没有价值,不能转化为数据或转化的数据没有分享的人生是毫无价值的[18]。
但是,遗忘权希望赋予人们删除自己上传分享的数据的权利,以及要求他人删除上传分享有关自己数据的权利,以实现被遗忘权的目的。这显然与数据主义的立场相悖。在数据主义看来,数据分享就是数据互联,数据互联就是人际互动,随时随地的连线或在线是数据人生的常态,掉线或失联意味着数据人生的休克或终结[17]。因此,数据主义反对数据被遗忘权,反对删除数据的行为。它认为,删除数据会违反数据流最大化的诫命,造成熵增,违背了信息自由这一最高的善,是一种不道德的行为。
信息技术重镇美国接受了数据主义的立场,对被遗忘权持拒绝态度,其主要理由是被遗忘权违背了基本权利——言论自由。美国的一些媒体和互联网企业批评被遗忘权限制了其表达自由权。在数据主义来看,言论自由正是信息自由。但是言论自由包括“说的自由”,也包括“不说的自由”,两者构成言论自由的整体,缺一不可[20]。言论自由的权利主体是人,信息自由的权利主体则是数据,在数据主义这里人是为信息自由而服务的,因此信息自由并不是美国所信仰的自由主义。正如美国学者认为,如此过分强调互联网搜索服务提供商的表达自由权,“让私营部门继续在博弈中占据主导地位”不是明智的做法[21]。
信息伦理学和数据主义把信息社会的价值标的从人替换为信息,这消解了人权。正如赫拉利指出的,在21 世纪,数据主义可能从以人为中心走向以数据为中心,把人推到一边。有学者担忧如果推崇数据流最大化和信息自由是至善,让数据主义不受限制地发展下去,则可能出现“数据巨机器”,进而压抑人的自由[22]。因此,信息伦理学和数据主义对被遗忘权的批判和排斥太过激进。
三、温和的被遗忘权主张:基于权利的信息伦理
为了避免GDPR 过于保守以及信息伦理学和数据主义过于激进所带来的不良后果,本文尝试通过基于权利的信息伦理提出温和的被遗忘权。基于权利的信息伦理主张赋予个体应有的数据权利,包括被遗忘权。但是,该遗忘权主张较于欧盟立法是温和的,它提倡有限制的、不能被滥用的被遗忘权,避免使遗忘权成为数字经济发展的阻碍。同时积极倡导构建行为准则和技术标准,在不删除数据的情况下保证数据开发利用和数据权利保护之间的平衡,对数字记忆给人类生活带来的诸多威胁进行有效消解。区块链技术的发展为这一理论提供了现实可行性。
1.个人应基于权利享有有限的被遗忘权
用户无法获知其个人数据有多少被收集使用、哪些数据流向了何处,企业开发的算法对于用户而言更是一个黑箱,因此用户数据权利与企业数据权力处在失衡的状态。数据和算法赋予了企业巨大的数据权力,用户则无法获得对等的地位。在此背景下,数据泄露、数据滥用等恶性事件频发。这不仅损害了用户的权利,还成为阻碍数字经济健康发展的大数据之困。从欧盟相关法案中被遗忘权、删除权、个人数据自主权等相关权利的逻辑关系来看,被遗忘权的初衷就是为了限制搜索引擎公司与数据控制公司,而不是针对所有对数据有控制权的人[23]。基于目前数据权力远胜于数据权利的现状,我们应当提倡基于权利的信息伦理[20]。
基于权利的信息伦理主张应当赋予个人被遗忘权。正如有些学者认为,被遗忘权是调整网络用户与网络公司力量悬殊的重要砝码,它是为了消弭网络时代数据主体和数据控制者的不平等而设定的[25]。在企业无法履行保护用户个人数据、数据合理使用等职责的时候,被遗忘权给用户提供了兜底的退出机制,用户可以注销账号并要求企业删除其所有有关的个人信息。这可以倒逼企业主动尊重用户的数据权利,加强对用户个人数据的保护,对用户数据进行合理开发使用,最终实现用户数据权利和企业数据权力的平衡。
但是,被遗忘权应是有限制的。我们不能让权利被滥用,应该避免滥用删除行为导致的信息封闭[26]。被遗忘权应当充分考虑个人数据的公共属性,并以此为界限。如果仅因为处于公共领域的数据与个人存在联系或具有识别性,即赋予个人对个人数据的排他控制权,使个人数据“私有化”,这有失正当性,甚至与人类社会进步发展的制度基础相悖[7]。另外,从英国法官马克·沃比(Mark Warby)经手的两起被遗忘权案件以及我国被遗忘权第一案“任甲玉诉百度案”可以看出,涉及公共利益时,保障公民知情权也是一个重要考量。
数据之于数字经济的价值不言而喻,所以应重视数据价值。我们应该衡量被遗忘权行使中要求被删除的数据的价值。推广并完善谷歌的遗忘权申请审查机制,既能保护用户正常行使被遗忘的权利,又能避免用户滥用权利的风险,进而最大程度上保护数据的价值。曾有学者呼吁,谷歌等企业在处理用户的删除数据申请时,应公开审查规则,这不仅可以避免任意处理行为,还可以让用户了解规则后避免不适当的申请,同时减少用户对处理结果的不信任感[28];也有学者提出个案决定透明化、政府监督等完善建议[29]。
2.温和的政策法律保障被遗忘权顺利落地
要想有限的被遗忘权顺利落地,我们必须制订并逐步完善温和的政策法律。
第一,某些场景中,更正权比被遗忘权更具适用性。过去信息的重要性,会随着时间的推移而逐步减弱。而互联网上保留的个人信息往往脱离了当时的语境,会带来误解。我国《网络安全法》规定,个人发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正。因此在一些场景中,个人对于信息的更正权比被遗忘权更具适用性。
第二,屏蔽、断开链接等处理方式优于从根本上删除数据。欧盟GDPR(2012 年建议案)中提及不适用情形时提出,数据控制者无需删除,但需以一种不能被任何人通常获取、收集和改变的方式来限制数据处理。但是,这一条文在最后正式发布的文本中被删掉了。我国《侵权责任法》第36 条第2款中有对于侵权信息的删除、屏蔽以及断开链接的规定。屏蔽、断开链接,使个人信息不再被浏览访问,已经可以达到被遗忘的目的,而且技术实现的门槛较低,降低了企业履行法律义务的成本。对于AI 系统而言,如无需删除数据,而是采取有效的脱敏技术等手段使数据断开与个人的链接,无疑会更有利。
第三,建立“后悔期”机制。目前所有的互联网服务都需要以个人数据为基础,用户行使被遗忘权就是拒绝相应的互联网服务,如用户注销其淘宝账户,就无法再使用淘宝的服务,这无疑会造成数字鸿沟。而且,个人会随时间、环境改变,对过去的行为心生悔意。因此,互联网服务为用户设置“后悔期”十分必要。2017 年京东对其隐私政策作了更新,明确了用户查询、更正和删除其个人信息的方式,增加了用户账户的锁定∕解锁和注销功能,并提供给用户注销后30 天悔期。“后悔期”机制对企业和用户双方都较为温和,企业在“后悔期”内断开对用户个人数据的访问,如用户反悔再进行恢复。
3.通过技术创新和建立技术标准保护个人数据权利
基于权利的信息伦理主张,以个人数据权利为前提,进行技术的研发、创新和使用,实现数据的开发利用与个人数据权利保护之间的平衡。
技术从来不是中立的,而是价值负载的。隐私保护设计(Privacy by Design)便是将隐私保护和用户数据权利保护等价值负载到技术和产品的设计之中,这已经成为行业共识。被遗忘权则是奠基于个人自主性,强调每个人都能够自己做出决定并对自己的行为负责。欧盟GDPR 赋予个人的数据自决权、控制权、被遗忘权等都是保护个人自主的体现。而区块链技术正是将个人信息自主权和隐私保护设计理念相结合的一项技术。
万维网之父伯纳斯·李不满于现今互联网的异化发展,希望借助区块链技术重构或再造互联网,使其回归原本的价值观上去。他认为,区块链技术可以使个人牢牢掌握其个人数据的控制权。他开创了区块链项目——固体(Solid),希望帮助用户自由选择数据所在的位置以及允许谁访问数据,将个人数据与应用程序本身分离。由于应用程序与它们生成的数据分离,用户将能够避免服务商的锁定,可以在不丢失任何个人数据和社交关系的同时,实现应用程序和个人数据存储服务器之间的无缝切换。互联网服务商将不再可能通过用户数据来捆绑用户,只能通过不断地创新服务来争取用户,这会使企业机构的数据权力和用户的数据权利达到平衡。
实际上,区块链具有不可篡改性,无法任意删除数据,与被遗忘权的理念相悖。但是,区块链给个人充分的数据自主权,间接达到了被遗忘权的诉求,同时在信息伦理学的意义上保留了数据的价值。比如区块链引起的身份验证领域的革命,让个人的数字身份只被自己拥有,仅在需要行使权利时对某些信息作选择性披露。
四、结语
被遗忘权作为个人数据权利的重要组成部分,对数字经济发展造成深远影响。围绕被遗忘权,国际社会分为两个阵营,一方基于保守主义立场支持保护个人的数据权利,包括被遗忘权;一方迎合信息伦理学和数据主义的理论逻辑,反对被遗忘权。但是通过分析发现,两者均不符合我国数字经济发展和基于权利的信息伦理的基本诉求——数据价值开发与个人数据权利的平衡和统一。因此,应当秉承基于权利的信息伦理主张,建立温和的数据被遗忘权机制。
[注 释]
①在GDPR 中,也被称作“删除权”(Right to delete)。虽然被遗忘权与删除权因提出时间不同而表述不一,但两者却意指同一权利。被遗忘是意图达到的目的,而删除则是达成目的的手段。
②本文不区分个人数据与个人信息。