APP下载

论我国超大型互联网平台算法的法律规制

2022-03-13

关键词:规制个人信息法律

胡 玲

(安徽财经大学 法学院,安徽 蚌埠 233000)

数据和算法已成为数字经济发展的助力器,各国都在致力于通过数据和算法提升经济运行效率、社会治理效率以及人民的福祉。但是,现实中,算法逐渐定义着人们诸如能力资质、信用状况、价格选择等多方面[1]。利用数据和掌握算法的超大型互联网平台正以压倒性优势赢得商业成就。2021年10月29日,市场监管总局公布《互联网平台分类分级指南(征求意见稿)》(下称《分类分级指南》)和《互联网平台落实主体责任指南(征求意见稿)》(下称《主体责任指南》),根据以上指南,超级平台和大型平台将迎接更严监管。实践中,脸书、谷歌、苹果、亚马逊、京东、阿里巴巴和腾讯等都属于此类平台。当前,世界各国都在完善数字经济和对大型互联网平台的监管规范,如欧盟的《数字服务法》(TheDigitalServicesAct)和《数字市场法》(TheDigitalMarketsAct),我国《分类分级指南》和《主体责任指南》的出台有着国际国内双重意义。算法是超大型互联网平台更了解用户和维持竞争优势的重要手段,但是,算法也挑战着人类决策的自主性、威胁个人隐私与自由且容易引发歧视和偏见[2]。超大型互联网平台算法的本质是以商业化利益为最终追求目标,对其的法律规制就显得尤为重要。算法的使用应坚持以人为本原则,切忌本末倒置,使人成为算法精准设计下的工具。

一、问题的提出:超大型互联网平台算法运用带来的挑战

随着数字经济的加速到来,在技术的加持下,掌握着海量数据的互联网平台巨头逐渐在市场上形成了垄断优势。算法已成为超大型互联网平台企业获得更大利润的重要手段,其不仅能降低产品/服务的定价成本,且能提高价格进而增加利润。与此同时,数据和算法的局限性也不断凸现出来。可以说,市场失灵很大程度源于信息不对称或信息偏差[3]。

(一)算法概念、本质及生命周期

1. 算法的概念和本质

计算机在许多领域都具有变革性,它们能极速执行命令并可以处理大量数据,信息技术为提高连接性和交易速度提供了基础。算法是解决问题时需要遵循的一个过程和一组规则,通常是一个结构化的过程。算法会导致自动决策(或算法决策),即其本质上是决定某些事情的代码。实践中,算法(以及数据或信息)成为许多事物的核心,包括社交媒体、信用评分系统、自动决策系统、机器人和自动驾驶汽车等。Google搜索算法决定了信息与搜索词的相关性和重要性,即PageRank的排名系统,其有能力控制在搜索平台上发布的内容,并且更改网站以匹配用户[4]。EdgeRand则是Facebook用于确定应在用户的新闻提要中显示哪些文章。可以说,算法的重要性在于:算法无处不在;拥有计算思维;可以非常精确地在计算机、智能手机和其他设备上实施。现如今,算法、算法治理以及在创建或使用算法时应遵守的法律法规将变得越来越重要。

2. 算法的生命周期

超大型互联网平台公司纷纷认识到开发算法以帮助他们开展业务的重要性。随着来自传感器、智能设备、社交媒体等数据量的激增,投资算法成为这些平台企业的优先战略选择。事实上,由于汇集了海量数据,这些平台企业难以管理和处理已聚集的数据流,算法就成为了实现数据价值并根据该数据做出明智且及时决策的关键。那些有效创建、管理和部署算法的公司无疑将抢占市场先机,开展挖掘客户需求、数据清理和数据存储等业务。算法的生命周期具体可以分为以下几个阶段。首先是数据采集、存储阶段,人工智能设备往往未经信息主体同意,便将获取的个人数据进行算法分析。其次是算法运算阶段,当人工智能设备收集了海量数据,会进行黑箱运算、数据清洗。最后是结果输出和应用阶段,通过算法形成的数据分析结果的可视化呈现可以为企业提供决策支持,并将数据分析成果转化为具体的应用融入业务流程中。

(二)超大型互联网平台算法的应用场景及其影响

有学者认为平台生态系统主要由“数据+算法”及其之间的联动展开[5]。我们正处于数字经济新时代,平台所有者似乎正在发展比早期工业革命中的工厂所有者更强大的力量,平台经济或数字平台经济涵盖着越来越多的商业、政治和社会互动中的数字化活动。而算法革命和云计算构成了平台经济的基础,平台经济的繁荣关键在于它们为广泛的用户提供了一组共享的技术和接口,使得用户可以在稳定的网络基础设施上构建他们想要的东西。这些平台往往通过重置进入壁垒、改变价值创造和价值获取的逻辑、进行监管套利和重新定位经济体系中的权力来扰乱现有的经济活动。平台对算法的运用主要存在以下目的和场景。

1. 构建用户画像

通常,用户想要免费便捷使用超大型互联网平台的服务,只能点击同意“用户使用协议”,用户授权的数据会被平台一一记录(诸如设备ID、手机号码、姓名、浏览行为等),并处于持续被收集的状态。通过算法和大数据,将用户标签化并形成画像,为后续的个性化推荐、差异化定价等奠定基础。

2. 差异化定价

现实中,数字鸿沟和算法的隐蔽特性使得算法进行差异化定价成为可能。超大型平台通过算法研发,可以准确识别用户的价格期待,对不同消费者给出不同价格。由于定价算法具有隐蔽性和复杂性,这使得大数据杀熟难以被觉察[6]。可以说,在依赖历史数据对不特定群体进行分类基础上,为新输入对象自动匹配算法身份,不同的电子设备、操作系统和手机账号都有可能构成合理差别对待的理由[7]。

3. 精准推送

超大型平台对聚集的海量数据进行深度挖掘和分析,实现信息内容和用户精准匹配,从而识别出用户喜好而为其推荐可能喜欢、感兴趣的产品或服务,而往往平台推送的这些产品或服务背后都有广告商赞助。

4.个性化服务

超大型平台为了增强用户的黏性,实现长尾效应,会通过算法更了解用户,并通过为用户提供最为关联的信息,大大节约用户的检索时间,并改善用户的网络体验。

在资本和技术的加持下,超大型互联网平台在市场上对用户数据的掌控处于明显优势地位,直接关涉用户的信息安全和利用。随着用户数据的日益丰富和算法技术的更新迭代,平台的算法使用场景越来越多,随之而来的安全问题也愈发凸显。在对算法的法律规制层面,我国尚未有统一的相关法律,厘清算法治理的法律准则和完善算法治理的相关法律规则成为当务之急。

二、我国超大型互联网平台算法的法律规制现状和不足

目前对算法的法律规制并未有统一的法律,散见于《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)、《中华人民共和国电子商务法》(以下简称《电商法》)和竞争法等法律中。

(一) 我国超大型互联网平台算法的法律规制现状

1. 以数据安全和保护为基础的法律

网络安全法和数据安全法为市场上的数据使用安全提供了方向性指导和奠定了制度性基础。《个人信息保护法》明确规定了不得过度收集个人信息、大数据杀熟,对人脸信息等敏感个人信息的处理作出规制,规定了通过自动化决策方式向个人进行信息推送、商业营销,应提供不针对其个人特征的选项或提供便捷的拒绝方式。这对现实生活中存在的算法歧视进行了回应,以实现个人信息保护和个人数据利用的平衡。

2. 规范市场公平竞争的竞争法及其相应规定

超大型互联网平台聚集了海量的用户流量,在资本和技术的助力下,占据了很大市场份额,且往往处于市场强势地位,容易压缩既存中小企业的发展空间,同时也会抑制新兴创新企业的进入,最终损害消费者权益,不利于数字经济的健康有序发展。《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)和《中华人民共和国反垄断法》及配套规定、指南等则在一定程度上规制了超大型平台对市场的绝对掌控力。前者侧重规制不正当竞争的行为,后者侧重规制限制竞争的行为。

(1)《反不正当竞争法》及其相应规定。市场监督管理总局在《反不正当竞争法》基础上发布了《禁止网络不正当竞争行为规定(公开征求意见稿)》,该意见稿对数据和算法驱动下的不正当竞争行为进行了具体规制:不得实施流量劫持、干扰和恶意不兼容等行为不得通过算法给交易条件相同的相对方提供不同的交易信息。

(2)《中华人民共和国反垄断法(修正草案)》(以下简称《草案》)及其配套指南。2021年2月7日国家市场监督总局官网发布《国务院反垄断委员会关于平台经济领域的反垄断指南》(以下简称《指南》),该指南的出台是为了预防和制止平台经济领域垄断行为,维护市场公平竞争,促使平台经济规范有序创新健康发展,维护消费者利益和社会公共利益。为了促使互联网平台的规范化健康发展,全国人大常委会于2021年10月23日发布《草案》,在滥用市场支配地位章节新增了针对平台经济和互联网方面的规则,规范了互联网平台企业滥用数据、算法、技术以及资本优势、平台规则排除竞争、限制竞争的问题。

3.保护消费者权益的相关法律

电子商务法、消费者权益保护法和价格法是我国维护市场公平交易和消费者权益法律体系的重要组成部分。尤其在算法引起的大数据杀熟下,这些法律为规制价格歧视、维护消费者权益提供了重要依据。

(二)我国超大型互联网平台算法法律规制的不足

首先,算法的法律规制零散、冲突,缺乏内部协调机制。当前法律对算法的规制散见于数据安全和保护相关法律、竞争法以及《电商法》等,规则林立,难免冲突,尤其在具体法律适用是时常造成混乱。比如,在大数据杀熟规制上,《个人信息保护法》《电商法》《中华人民共和国消费者权益保护法》(以下简称《消费者权益保护法》)和《价格法》都有相关涉及,但又各有侧重。其中,《个人信息保护法》对个人信息的界定侧重在“可识别性”上,实践中,大数据杀熟涉及的数据远不止具有明显人格特征的个人信息,还涉及大量用户行为数据,更精准地“刻画”用户画像,从而精准杀熟;《消费者权益保护法》则未将大数据杀熟明确纳入规制,消费者只能依据知情权、公平交易权和消费欺诈的相关规定维权;《电商法》则规定了不得针对个人特征进行信息推送和商业营销算法,侧重点在尊重和平等保护消费者合法权益;《价格法》中规定的价格歧视针对的是其他经营者,而大数据杀熟主要针对消费者。因此,当个人受到大数据杀熟侵害时,具体应该通过何种法律手段保护才能达到最佳保护存在法律适用的困难。其次,对算法透明性本身规制不足,算法的运行机制难以被人获悉,处于“黑箱”状态,过度的规制如采用无过错责任归责方式又会阻碍开发者的创新,但是完全搁置,显然会给市场和个人带来不小的挑战和问题。比较有效的方法是建立算法运行的全过程风险管控机制。其中《个人信息保护法》对自动化决策做了相应规定,但是并未直接规定算法透明性的具体要求。最后,对算法设计者和拥有者缺乏规制。算法“黑箱”运行机制似乎成为相关责任人逃避责任的利器。而对算法设计者(开发者)及所有者设定相关责任,则能更好地避免算法带来的危害。

三、超大型互联网平台算法法律规制的域外经验借鉴

欧盟和美国对算法的治理主要体现在个人数据保护、算法本身和算法相关责任人的规制上。欧盟以保护所辖域内公民的个人数据为核心,严格落实数据经营者的违法违规责任制度。美国则从数据和算法两个层面进行风险控制,尤其在算法的规制上主要依赖行业自律。

(一)欧盟

欧盟出台的《通用数据保护条例》(GDPR)旨在以个人数据保护为价值追求,严格规制个人数据的采集和使用。《通用数据保护条例》针对算法歧视,规定了“数据清洁”,要求清除数据库内包含歧视意义的数据内容,防止通过利用数据主体的“敏感数据”而损害数据主体的利益。《通用数据保护条例》对算法设计者的法律责任进行了规定。首先,要求算法设计者保证数据痕迹可查,防止“算法黑箱”造成的透明度缺失。其次,要求算法设计者阐释算法涉及的部分技术原理,防止“不可解释性”带来的算法偏见。最后,规定算法设计者应对自身主观偏见而嵌入歧视性程序承担相关法律责任。可以看出,GDPR提出与算法直接相关的两个问题:非歧视权和解释权。这是人类干预算法决策的要求,对算法设计提出了新要求。总之,从事基于算法处理的控制者都应认可GDPR的价值,并采取负责任和以风险为导向的方法,才能使算法不仅可以做出更准确的预测,而且可以提供比人类同行更高的透明度和公平性。

欧盟出台的《数字服务法》和《数字市场法》,前者规定某些在线平台有义务接收、存储、部分验证和发布有关使用其服务的交易者的信息,确保为消费者提供一个更安全、透明的在线环境,该法案为平台提供者如何审核内容、广告和算法流程设定了更高的透明度和问责标准。后者将大型在线平台认定为所谓的“守门人”(gatekeeper),旨在确保这些平台在网上公平行事,法案中的公司应满足以下条件:拥有强大的经济地位,对内部市场影响显著,活跃于多个欧盟国家;具有强大的中介地位,即其能将庞大的用户群与海量业务连接;在市场上拥有(或将拥有)牢固地位。该法案下,这些守门人需做到以下:允许第三方在特定情况下与自身服务的互操作性;允许平台用户访问自身生成的数据;允许平台上经营者在平台外报价并签订合同等[8]。两法是欧洲数字战略的核心组成部分。

(二)美国

美国《消费者隐私权利法案》(ConsumerPrivacyBillofRights, 以下简称CBPR)赋予了消费者对自身数据更多的掌控权,并对经营企业设定了具体的义务。2017年美国计算机协会发布了七项原则,即保持警惕、补救机制、问责制、可阐释、审查数据、可审计性和验证及测试,为算法治理指引了方向[9]。2019年美国提出一项旨在规范算法的法案,即《2019年算法责任法案》,该法案指引联邦贸易委员会要求特定商业实体对涉及个人信息或做出自动化决策的高风险系统进行评估,例如使用人工智能或机器学习的系统。这就迫使大公司评估他们的算法,以确保不会产生不道德和歧视性的结果[10]。

以上欧盟和美国对算法的相关法律规定为后续完善我国超大型互联网平台的算法规制提供了很好的立法和实践经验借鉴。

四、我国超大型互联网平台算法治理法律准则的构建

算法决策者已经开始主宰我们生活的方方面面[11],算法的偏见可以分为人为因素和数据因素[12]。如果我们想要规范人和组织如何创建和使用算法,在制度构建和完善时必须考虑以下因素:尽可能自由和公平;提高透明度和问责制;监管应奉行原则为基础。在构建算法法律治理准则时,应坚持以下原则。

(一) 坚持数据质量优先为中心

超大型互联网平台以数据创造业务价值为核心,数据本身的质量往往被忽视。然而,随着业务的深入开展,数据的质量受到了前所未有的重视,高质量的数据能直接产生经济效益,成为平台的核心竞争力。糟糕的数据质量往往带来低效的数据开发和利用,生成不准确的数据分析,最终导致错误的业务决策。哪怕记录的原始记录正确,数据组也可能包含隐藏的偏见[13]。因此,数据质量应成为超大型互联网平台数据治理的重要一环。

(二)坚持三元主体协同治理理念

(1)政府层面应不断创新完善监管模式。一方面,对超大型互联网平台的经营资质落实严格审查机制,该审查机制不仅体现在准入前,还应贯穿平台经营生命周期,采取准入前严格审查和准入后定期核查的机制。另一方面,指导和助力超大平台优化数据安全基础设施建设,完善相应技术安全标准,并为超大型互联网平台提供数据治理的准则和相应范本。在规制超大型互联网平台的同时,也应重视超大型互联网平台对数字经济的价值和贡献,避免不合理限制超大型互联网平台参与自由竞争和创新的动力。此外,超大型互联网平台通常会抗议公开访问其所拥有的算法、模型或数据,理由是这严重损害了它们的知识产权。因此,对算法的访问权限仅存在适当的技术监管机构,且需符合法律规定和监管目的。监管机构需要明确为私营部门提供知识产权保护是为了换取公开,带动创新,最终促进公共福利。因此,应该促使技术监管机构能够积极主动地进行执法和调查,比如监管机构可以在受控、保密和自动化的实验中通过黑匣子访问底层模型来发现是否存在信用卡额度性别歧视。

(2)企业层面。应构建一套适用于超大型互联网平台算法的操作步骤。首先,创建一个由IT、财务、销售、市场、HR等为代表的算法管理委员会。其次,盘点现有算法并确定改进优先级。再次,内部培养或雇佣以数据驱动,拥有系统化思维的算法人才。

(3)个人层面。私营和公共部门越来越多地转向人工智能 (AI) 系统和机器学习算法用于决策过程。数据的大规模数字化和使用它们的新兴技术正在扰乱大多数经济部门,包括运输、零售、广告和能源等领域。人工智能也对民主和治理产生影响,因为正在部署计算机化系统以提高政府职能的准确性和推动客观性。算法正在利用大量宏观和微观数据来影响人们在一系列任务中的决策,从制作电影推荐到帮助银行确定个人的信誉。具体可以做到以下:创建强密码保护;谨慎使用公共免费Wi-Fi;避免过度在网上(尤其社交媒体)分享个人信息,尤其是能直接识别身份的信息;给硬件设备进行上锁;开启隐私浏览。

(三)坚持算法公平、公正和透明原则

算法的法律规制应坚持公平、公正和透明的原则。以算法技术为前提,以利益为驱动的算法黑箱成为算法权力异化的根源[14],而合理披露算法黑箱的信息在某种程度上可以缓解公众与算法操控者之间的信息不对称[15]。算法信任是算法社会的基石,而信任则依赖算法的可信度[16]。透明度已被提议作为减轻自动化决策可能产生的不良结果的解决方案[17]。算法的透明可以让用户更了解算法的运行逻辑,从而对算法产生信任。但是算法的透明公开并非是公开所有算法内容,而是将直接和数据主体相关的部分进行浅显易懂地展现。

五、我国超大型互联网平台算法治理法律规则的完善

一方面,应构建以数据安全法、个人信息保护法、竞争法以及电子商务法等算法治理的内在法律协调机制。另一方面,重视完善涉及算法公平、公正和透明的具体法律规则。

(一)算法治理内在法律协调机制的构建

(1)重视网络安全法、数据安全法和个人信息保护法的相关规定为算法治理奠定制度基石的作用,并细化相应安全机制。首先,网络安全法和数据安全法为算法治理提供了基本的安全制度保障。其次,个人信息保护法为算法歧视规制提供了原则指引。该法构建了以“告知-同意”为基础的个人信息处理的一系列规则,尤其对敏感信息作出严格限制。《个人信息保护法》的出台规制了互联网平台通过大数据手段定制“用户画像”,从而开展精准广告推送、个人化定制服务,甚至进行差异化定价的实践,用户往往需要“被迫”同意授权超大型互联网平台收集用户个人信息以换取免费、便捷的平台服务/产品。平台在前述收集的信息基础上,结合用户在互联网平台的各种浏览痕迹(诸如转、评、赞等行为),逐步刻画出“精准用户画像”,将这些数据深度融入算法后,给用户精准推送产品/服务和进行差异化定价。可以借鉴域外立法经验,细化风险评估过程和结果告知机制以及优化动态场景治理模式。同时,明确平台有义务阐述算法的运行机理。

(2)重视竞争法规制超大型互联网平台通过算法实施不正当竞争行为或滥用市场支配地位的作用。当超大型互联网平台掌控了海量数据和先进算法时,会出现主导市场,限制或排除竞争,最终损害消费者利益。大型互联网平台往往通过先发优势形成数据垄断地位,从而在新开拓市场快速立足,且将竞争对手排挤出去[18]。应充分发挥反不正当竞争法规制不正当竞争行为和反垄断法规制限制竞争行为的价值。

(3)将《电商法》《消费者权益保护法》等作为算法歧视监管细化的法律手段。虽然实践中通过算法进行差异化定价难以被界定为“价格欺诈”,但是《中华人民共和国价格法》及其相关规定依然为日后规制这样的行为留有了空间。《电商法》分别对差别推送和违法提供个性化搜索结果的处罚进行了相应规定,《消费者权益保护法》规定遭遇算法歧视可以进行维权。考虑到消费者对算法歧视的维权难度和平台的优势和强势地位,在现行规定下可以做到:首先,应将举证责任进行分配,如将算法未造成歧视的举证责任分配给超大型互联网平台。其次,充分发挥消费者协会对超大型互联网平台算法的监督职能和为维护消费者权益而提起诉讼的权利。总之,随着大数据技术和各类应用的飞速发展,《电商法》和《消费者权益保护法》应细化监管细则,完善电子化监管手段和路径,对算法责任承担问题作出具体的专项规定。

总之,鉴于算法问题的复杂性以及法律规定存在的模糊性、歧义、冲突以及法律与现实的差距,一方面,政府需要积极参与所有利益相关者的对话,以便统一认知和有效地制定技术应对措施。另一方面,算法相关法律制度应加强内在一致性和有效性,以应对算法产生的信任危机并预防风险。

(二)算法治理其他法律规则的完善

为实现算法的公平、公正和透明,在法律规则完善上,具体可以做到以下几个方面:

(1)剔除敏感数据或进行匿名化处理。敏感数据的泄露往往会对个人信息主体造成重大的影响,为保障个人信息主体的权益,确保数据开发利用的合法合规,在通过算法分析利用数据时,应剔除敏感数据或对其进行匿名化处理后再行使用。

(2)实施算法运行全过程风险防范机制。实践中,企业和机构的数据隐私实践很大程度上依赖于不可信的“匿名化”或“去标识化”的个人数据,以期从敏感数据集中删除姓名、身份证号或其他类似唯一标识符。但是这样的假设是建立在该数据集是世界上唯一的数据集,当各数据集关联,则面临“去匿名化”攻击。之前美国就发生将匿名的医疗记录与公开可用的选民登记数据相结合,以唯一识别特定个人医疗记录的案例。匿名技术的神话正在被打破,这是因为现实世界存在大量难以预料的额外信息,正在被攻击者交叉引用。因此,量化和评估算法可能造成的不同类型的危害就显得格外重要,这也使得公众可以审核算法和预测模型以了解这种危害不平衡的情况。可以修改法律,迫使所有公司和政府机构更广泛地告知组织决策将通过算法进行的事实。但这种方法只会有助于提高透明度,对规范实际的算法过程无济于事。因此,对监管的关注需要转移到算法的输入和输出上。对算法的全过程评估机制需要坚持以下步骤:详细描述;确定个人信息隐私和安全风险;阐释为尽量减少这些风险所需采取的步骤。

(3)算法设计者和所有者的伦理要求与责任。经营者往往滥用数据、算法技术手段来实现商业利益[19]。算法决策通常是黑箱操作,因此逐渐脱离人的控制和预测。在算法的不透明性与难解释性的情形下,不少平台罔顾商业伦理,频繁调整算法套路。从算法的设计到具体运用都不免带着设计者的价值取向,甚至偏见。需将“善”的道德取向融入设计全过程,将相关伦理机制通过程序内置来监控算法是否违背伦理:算法设计者应对因初始设计歧视、重大疏忽等造成的损失承担相应法律责任;算法所有者应对算法运用造成的歧视等承担相应法律责任。总之,好的算法应具备以下特征:正确性、高效率和可理解性,技术人员应将法律规则融入产品设计[20]。

六、结论

算法是每个企业未来的关键组成部分,几乎所有未来的商业洞察力和决策都将由数据驱动。毫无疑问,对任何希望快速扩展其产品和服务的组织来说,对算法的投资都会带来回报。鉴于算法比人类更加客观、可扩展和灵活,这对致力于推动指数增长的组织来说也至关重要。社会总是期望人们在受托作出重要决定时尊重某些社会价值观,但是越来越多的算法和某些自动化流程正被纳入重要决策流程。哪怕这样,也应该要求重要决策保持公平、安全和透明。由于算法在应用中产生了诸如算法偏见和歧视、黑箱运算及公共决策不透明等问题[21],无论执法还是司法都强调平衡“数字鸿沟”以及抑制算法权力[22]。因此,必须对算法及算法技术人员等进行相应约束,并辅以算法全过程风险评估机制方能优化算法法律治理路径。而优化对算法的法律规制也是保障算法能更好地实现以人为中心的目的,从而保障超大型互联网平台的经济效益,最终促使我国数字经济持续健康发展。

猜你喜欢

规制个人信息法律
如何保护劳动者的个人信息?
个人信息保护进入“法时代”
主动退市规制的德国经验与启示
法律解释与自然法
警惕个人信息泄露
保护与规制:关于文学的刑法
论《反不正当竞争法》的规制范畴
让人死亡的法律
“互助献血”质疑声背后的法律困惑
让法律做主