APP下载

从“孤岛”到“共享”:公共数据法治化的逻辑进路*

2023-01-26颜运秋王玥玮

深圳社会科学 2022年6期
关键词:公共数据孤岛个人信息

颜运秋 王玥玮

(1.浙江农林大学文法学院,浙江 杭州 311300; 2.广东财经大学法学院,广东 广州 510320)

回应现实生活中个人信息被侵害的严重事实,学理上对个人信息保护方面有非常多的研究,立法上出现了相对完善的个人信息保护立法成果。但是,在大数据时代,公共数据所发挥的作用非常巨大,公共数据相对于个人信息而言,有很多个性化特征。如今,公共数据孤岛现象和信息壁垒不仅存在于各部门之间,也存在于公共数据管理部门与社会公众之间。而且,过于强调个人信息的保护,就会进一步加剧信息孤岛现象;而重视公共数据的开放,就能够促进数据的共享、开发和利用,从而提高全社会公共福祉,推动社会经济进步和发展。

传统私法保护进路将数据作为一种权利客体对待,习惯用传统私法的理念和制度去解释和保护数据,过于强调从所有权角度强调数据的可支配性。但这样一来,数据的公共性、可复制性和可分享性等就极易被忽略,并且数据分享的价值未被充分考虑。因此在私权化的进程中频频伴随着数据分享的干扰。[1]所以,近年来,学界出现了一些研究数据开放的学术成果,但是依然重点关注的是从个人信息保护角度出发,重点针对政府数据开放的问题予以探讨;而且,有学者对于数据开放过程中的政府法律责任及其救济机制持怀疑和否定态度,这将不利于公共数据的开发、开放和保护。

如何准确分析公共数据的特有属性,如何客观检视我国数据开放的程度,如何将危害公共数据的可能违法行为类型化,如何构建科学合理的公共数据的法律保护机制,如何理解公共数据开放过程中违法行为的可诉性,如何有效确保公共数据从“孤岛”到“共享”,为数据充分开发和利用并确保增值创造条件,是一个非常值得关注却又缺乏深入系统论证的重大理论课题和现实难题。这一系列问题,遵循的是“是什么—为什么—怎么样”的思维逻辑,实际上反映和揭示了公共数据法治化的基本逻辑。

一、公共数据的基本属性:公共数据法治化的逻辑起点

人们在长期的社会生产生活实践中,越来越清晰的认识到数据的重要性,因为,仅仅用语言、文字和图形来描述客观事物远远不够,而且很不精确。“有根据的数字”简称“数据”。数据是描述经验事实的定量或定性的符号表示(数字、字母、算法、空间等)。数据是具有和石油、矿产相同开发潜质与重要价值的新兴资源。[2](P194)大数据具备多量、多元、快捷和价值高等特点,大数据分析的独特吸引力就在于“通过交叉复现,直抵事实的真相”。[3](P30)在2013年《开放数据宪章》(G8 Open Data Charter)中,对于开放数据的定义是:兼具必要的技术和法律特征,无论是谁都可以不受时间和空间的限制,利用、再利用或分发的电子数据。我国地方立法对公共数据有一些基本的定义。①例如,《上海市公共数据和一网通办管理办法》(正文中简称《上海市管理办法》)第3条将公共数据定义为各级行政机关以及履行公共管理和服务职能的事业单位在依法履职过程中,采集和产生的各类数据资源。《北京市公共数据管理办法》(征求意见稿)第2条第2款将公共数据定义为行政机关和公共服务企业在履行职责和提供服务过程中获取和制作的,以电子化形式记录和保存的数据。《成都市公共数据管理应用规定》第2条将公共数据定义为政务部门在依法履职过程中产生和管理的,以一定形式记录、保存的文字、数据、图像、音频、视频等各类信息资源。2021年11月14日国家互联网信息办公室会同相关部门研究起草《网络数据安全管理条例(征求意见稿)》规定,公共数据是指国家机关和法律、行政法规授权的具有管理公共事务职能的组织履行公共管理职责或者提供公共服务过程中收集、产生的各类数据,以及其他组织在提供公共服务中收集、产生的涉及公共利益的各类数据。从学理上概括而言,公共数据,也可称广义的政府数据,国家机关和其他公共部门(如事业单位、团体组织、科研机构等)在分别依法履行管理职能和公共职能过程中采集生成的电子化数据资源,当然是公共数据;同时,那些关系到重大公共利益的,由个人和企业支配的数据也是公共数据。[4]但是,学界对公共数据的法律属性和法律特征并没有系统深入的论述。公共数据除了具有可复制性、跨时空性、快速性、多样性和低耗高效性等一般数据共同的特点,自不待言;还具有公共性、共享性、开放性、累积海量性、间接性、脱敏性、无需授权免费使用性和普惠价值性等特有属性。

(一)公共性

公共数据是相对于私人数据而言的。私人数据是从公民或者企业的个人信息提炼而来,并由其独自享有和利用的数据。相反,公共数据是政府或者公共部门出于履行社会公共事务管理职能的目的,面向全社会收集和公开的数据信息。公共数据的“公共性”,体现在四个方面:第一,数据收集对象具有“公共性”,政府或者公共部门为了实现社会管理的需要,有权依法面向全社会收集相关数据信息;第二,数据收集目标的“公共性”,政府或者公共部门进行数据信息收集的出发点是提升自己的公共服务水平;第三,公共部门因履行公共职责而获取和形成公共数据的经费来自公共财政资金;第四,公共数据属于典型的公共物品,拥有非排他、非竞争、共享的三个特性,这是公共数据“公共性”的自然延伸和必然结果,公共数据被共享使用不会破坏其整体性,从而降低被他人共享使用的机遇和成效,反而会产生连锁式更复杂、更高级、更高端的增值效用。[5]其他有形的公共产品或者准公共产品具有有限的共享性、非排他性和非竞争性,而公共数据的这三个特性则是无限的。可以不夸张的说,公共数据是最好的可以实现按需分配各取所需的生产生活要素。

(二)累积海量性和间接性

公共数据主要是将私人数据信息进行收集、汇总和处理的产物,像滚雪球一样会越来越大,是典型的大数据。大数据就是巨量海量数据,是传统数据库工具获取、存储、管理或分析功能难以望其项背的数据集。[6](P21)公共数据与个人信息联系紧密也存在区别,公共数据虽然来源于社会各方面提供的原生数据,但是又不是对原生数据的简单加总,相对于原生数据而言具有间接性。此外,和其他公共资源特别是与有形的国有资产不同,公共数据价值的实现依赖于人们结合具体的生产生活实体活动而产生价值的增值。也就是说,公共数据本身不能直接增值,只有结合实体活动通过开发利用公共数据资源,才能产生经济效益和社会效益。所以说,公共数据的价值具有一定的间接性。取之于民的数据放之于民,为民所用。公共数据本身并没有价值,只有被利用后才具有价值。公共数据的取得、开放、利用、再利用等行为只是一种手段或工具,而不是目的。数据必须和实体活动有机联系起来,才能实现数据的价值。所以,任何脱离实体来研究虚拟数据的现象是对数据功能的过分夸大。

(三)无需授权免费使用性

有学者认为,为了弥补政府进行数据开放花费的成本,国家推行付费形式的数据开放是有必要的。因此,主张政府应该对科学研究、教育和经处理后的公共数据无偿信息公布活动(这类活动是向社会供给公共产品,无特定受益人)免费开放数据。而对于有特定受益人的,并且公共数据是被用作商业用途,政府应该让他们支付必要的费用,这也可以在一定程度上约束数据的商业化用户无限制地使用公共资源的行为,更深入地思考、探索公共数据的价值,从而实现社会效益的提升。[7]其实,公共数据作为一种公共资产,只需关注其可不可以开放,至于能不能收费不应在考虑范围之内。[8]即使免费,也要开放应予开放的数据;就算付费,也不可开放不应开放的数据。[9](P36)有学者认为,当政府或者公共机构在进行数据收集时,纳税人已然为拥有无偿获取这些信息的权利付出了代价(税款)。[10]](P26)其实,这个理由并不充分,我们对很多公共产品的消费是要付费的,并不会因为纳税人已经履行了纳税义务,就可以绝对的免费使用公共产品。但是,公共数据和其他有形的公共产品具有明显的低成本甚至是无成本的特殊性,所以除公共数据基础设施建设投资巨大以外,公共数据一旦形成即可无穷、低廉甚至是无成本的复制和利用,这就表明公共部门向公众无偿开放其掌握的数据是理所当然的,不论是谁都可以自由、平等、无需授权许可、无偿地使用,并遵行“创造孳息者为其所有者”的规则。[11]

(四)开放性

数据具有公共性,并不表明一定具有开放性。开放性是相对于保密性而言的。一般来说,公民的个人数据具有较强的保密性,企业的商业秘密更具有鲜明的保密性。政府数据中关系到国家安全的数据,其严格的保密性自不待言。但是,排除了个人隐私、商业秘密和国家安全因素的公共数据,就应当具有开放性。所以,公共数据属于非敏感数据,是敏感数据经过加工转化而成的衍生数据,是通过“清洗”手段将其进行匿名化和特定对象去识别化处理之后,不涉及机密信息且无法恢复原状的脱敏数据。所以,其拥有可开放的特质。《上海市管理办法》对公共数据作了以下分类:无条件开放数据、有条件开放数据(具有较高标准的数据安全等级和处理性能的公共数据)和非开放数据(与个人隐私、商业秘密和国家安全相关的数据)。该管理办法将公共数据予以三分,其实是混淆了公共数据与商业秘密、个人隐私以及涉及国家安全的数据三者之间的界限。公共数据源自社会公共领域,被民众共同知晓且所有的数据,彰显着社会公共利益。结合上述对公共数据开放性的分析,我们可以推导出和解释数据开放的基本原则。2013年《开放数据宪章》提出了政府数据开放应当遵循六项原则:第一,默认状态应为开放。政府需开放除非开放数据之外的所有数据,并将非开放数据不能开放的原因予以说明。第二,即时和详尽。政府须竭尽所能的、及时全面开放一手的且未被“加工”的数据,这是实现数据价值的决定因素。第三,能够获得和利用。切实保证数据是能“机读”的,便于获得和利用。第四,可对比和互操作性。数据的乘数效应决定其质量越高,越利于使用者相互之间的数据交流,进而越有助于数据价值的实现,因此关键在于适用通用的数据标准。第五,集中精力改善治理和公民参与。开放数据可以增进公民对公共事务的了解,信息透明度一旦提高,公共服务质量也就随之提高。第六,集中精力进行包容性发展和创新。开放数据对于促进包容性的经济发展、提高生产效率、应对气候变化和使创业者获利大有裨益。这六项原则非常中肯和全面。有学者也表达了几乎同样的观点,认为,数据开放应当坚持以下八项基本原则:第一,开放的。坚持开放是常态,不开放是特例。除非开放数据外的所有数据都应当开放。第二,原始的。开放收集到的原始数据而不是经“加工”处理的数据,尽量保留数据的初始纯度,此外,也要注意筛选出其中的非开放数据。第三,及时的。为了实现数据价值,数据应在第一时间迅速发布。第四,便于获得的。加强拓宽开放数据的受众面,丰富其使用目的。第五,可机读的。通过计算机自动对数据进行合理的结构性处理。第六,平等开放的。数据开放面前无歧视,所有人都无需登记。第七,非排他的。数据存在的形式并非排他的,因此任何个体都不能独占。第八,无需许可的。除有合理的隐私、安全或特殊情况限制的之外,版权、专利、商标或商业秘密规定的桎梏对数据而言并不起效。[9](P30)这种观点是非常全面到位的。

(五)公共数据的权利属性

公共数据的权属是公共数据资源的利用与保护的前提,公众为什么可以免费获取公共数据?其基本前提应当是公众对公共数据享有所有权。大体上,公共数据分为两类,一类是非个人数据,起初就与个人不相干或不发生联系,如关于环境、交通、气象等信息;另一类是“去识别化+无法恢复原状”的数据,其前身为个人数据,但经过技术“加工”后失去识别特定对象功能。前者排除了数据主体权利的约束,所以在符合合法性原则的条件下,它的可流通性几乎毋庸置疑。只要数据掌控者所获数据是合法的,未被法律限制或禁止流通使用,不侵害他人财产权益(如个人隐私、商业秘密),数据掌控者就有权许可他人使用数据。对于涉及个人信息的公共数据的权利归属问题,有学者认为,为了保护个人数据安全、维护人格尊严和私法自治,仍应赋予个人数据主体对该公共数据的所有权。[12]但是,我们认为,身处“智能+”时代,从公共数据包含的个人数据中识别出性别、年龄、消费习惯、财务状况等个人信息,并进行开放推送等,对个人信息无害。经过匿名化加工的公共数据的所有权人应当是社会全体公众而非个人数据主体。[13]私人数据隶属“私财产”,相反,公共数据理所当然归类为“公财产”。根据国有财产概念,有学者指出,可将不同用途作为公共数据的分类依据,如果用于内部公务时,是“公用物”;如果向公共开放,是“公共用物”;如果用于商业化运营,则是“国有私产”。为使公共利益免受政府角色混同和职能错位引发的危害,需对公共开放和商业化运营应予以制度上的明确界定。[14]但是,由于数据易复制的特性,这些不同使用状态可同时并存,供内部公务使用时固然不可以商业化,但一旦政府数据开放之后,到底是否为商业化经营需要,其认定是非常复杂的。所以说,数据开放后,社会主体对数据的再利用并使价值增值,是劳动创造的结果,应归属于创造者,没有必要对开放了的数据及其使用目的再进行细化,只要审查公共数据使用目的的合法性就已经足够。

概括而言,分析公共数据的特有基本属性,是研究公共数据法律问题和构建公共数据法律制度体系的逻辑起点。因为2021年8月20日全国人民代表大会常务委员会通过的《中华人民共和国个人信息保护法》重点在于规范个人信息的处理、个人信息的跨境提供以及通过明确个人在个人信息保护活动中的权利和个人信息处理者的义务,明确履行个人信息保护职责部门的职责,从而有效保护个人信息权益。对公共数据的开发、利用和保护,实际上是没有涉及的。2021年6月10日全国人民代表大会常务委员会通过的《中华人民共和国数据安全法》(以下称简《数据安全法》),尽管在立法目的之中提到了促进数据开发利用,也专门规定了政务数据安全与开发,但是,其侧重点依然在于保护个人和组织的数据安全权益,强调的是数据的安全性,而不是数据的开放性。所以,从现有立法而言,无论是个人信息保护法,还是数据安全法,对公共数据的开发、开放和保护都是不全面和不完整的,全国性的公共数据法律制度体系是非常缺乏的。虽然很多地方制定了公共数据的规范性文件,但公共数据毕竟不受地域限制,可以跨地域共享、开放和使用,所以地方性立法有其局限性。

二、我国公共数据的开放、开发与利用:公共数据法治化的现实逻辑

数据的开放是数据开发、利用、再利用的前提。如果公共数据不得以充分开放,那么其开发和利用的程度就非常有限。同时,数据开放又不是终极目的。利用、再利用,并确保数据增值才是数据开放的真正目的。公共数据的政策立场对公共数据法治具有引领和指导作用。虽然伴随着大数据时代的加速到来,社会对公共数据资源的强烈需求,党和国家多次强调要加快建设和推动公共数据资源的开放、开发和共享,并且制定了一系列的相关政策,但是,我国公共数据的开放程度并不高,开发和利用的效率也不高,并且存在危害公共数据的多种违法行为。所以有必要阐述我国党和政府对公共数据开放的基本立场,也有必要准确揭示我国公共数据开放的程度,并对公共数据开放、开发和利用过程中可能出现的危害公共数据的违法行为予以分析,这些内容构成了我国公共数据法治化的现实基础和逻辑前提。

(一)我国政府对于数据开放的基本立场

鉴于我国政府数据开放程度偏低,而大数据时代的快速到来,引发了对于数据开放的强烈需求。2015年8月,国务院印发了《促进大数据发展行动纲要》,纲要提出“在依法加强安全保障和隐私保护的前提下,稳步推进公共数据资源开放,加快建设国家政府数据统一开放平台”“逐步实现……民生保障服务相关领域的政府数据集向社会开放。”针对长期以来我国开放数据的不完整性、不准确性、不可读性以及不及时性等问题,2017年2月,中央全面深化改革领导小组审议通过了《关于推进公共信息资源开放的若干意见》,指出要保证开放数据的“完整性、准确性、原始性、机器可读性、非歧视性、及时性”,以方便公众在线检索、收集和利用。2017年5月,国务院办公厅印发了《政务信息系统整合共享实施方案》,对向社会开放政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集,做出了具体要求。2017年12月习近平总书记在中共中央政治局第二次集体学习时强调,要加快完善数字基础设施,推进数据资源整合和开放共享。2018年1月,中央网信办、发改委及工信部联合印发了《公共信息资源开放试点工作方案》,试点地区需要“明确开放数据的完整性、机器可读性、格式通用性等要求”。根据2019年全国人大宪法和法律委员会对第十三届全国人民代表大会的议案审议结果,《公共数据资源管理法》将在条件成熟时列入立法规划。2020年3月发布的《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》,提出要推进政府数据开放共享,提升社会数据资源价值,并建立规范的数据管理制度。2021年6月10日颁发的《数据安全法》,对政务数据安全与开放提出明确要求,提出按照规定及时、准确地公开政务数据;国家制定政务数据开放目录,构建统一规范、互联互通、安全可控的政务数据开放平台,推动政务数据开放利用。我国第十四个五年规划和2035年远景目标纲要,提出加强公共数据开放共享的规划和纲要,要求扩大基础公共信息数据安全有序开放。2021年11月14日为落实《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律关于数据安全管理的规定,规范网络数据处理活动,保护个人、组织在网络空间的合法权益,维护国家安全和公共利益,国务院会同相关部门研究起草了《网络数据安全管理条例(征求意见稿)》,国家正将目光聚焦到助力公共数据的开放共享,鼓励对公共数据合理开发使用和对公共数据进行合法的监管上来。《数据安全法》第1条提到的四个立法目的应当是递进的关系,即保护个人和组织的数据权益,维护数据主权安全和数据发展利益应当是此法最根本性、最终的目的。保护数据安全是前提,促进数据开发利用是手段。对于个人数据而言,保护个人和组织的数据权益是天经地义的,但是对于公共数据而言,维护国家数据主权数据安全和数据发展利益,则是至高无上的。所以,公共数据作为最好的可以实现按需分配各取所需的生产生活要素,要在保证个人隐私、商业秘密、国家安全不受侵犯的前提下,最大程度地开放公共数据。这一系列关于公共数据开放的政策性文件的出台,充分表达了党和政府对数据开放的决心、信心和能力。

(二)我国数据开放的程度

根据多方权威组织发布的数据公开指标和指数,我国数据开放的程度并不高。自2013年到2016年,万维网基金会开展了全球性“开放数据晴雨表”评估,评估范围不断扩大。2013年到2014年,中国的总体得分升高,中国的数据开放水平有所提高,但之后中国的总体分数有所下降。[15]无独有偶,开放知识基金会也在全球范围内开展了“全球开放数据指数”评估,“全球开放数据指数”所评估的国家和地区每年都有所增加,但中国的排名一直较低,且得分逐年下滑。[16]开放数据指数分别对交通时间表、污染物的排放、邮政编码、立法、地图、公司登记等多个方面的数据集就以下内容进行打分:是否存在、是否数字化、是否具有公共性、是否在线、是否免费、是否可以机器读取、是否可以批量读取、是否需要开放许可、是否及时更新等方面。中国内地被开放的政府数据,机器可读性较差。[17](P279)由于自2016年以来我国并没有被纳入到评估之列,所以无法取得我国后期的打分和排名指数。

(三)公共数据的开发与利用的基本要求

藏而不露是对公共数据的埋没。怎样促进创新发展,增强政府进行数据开发的动力,消除数据壁垒,保护公众数据权利,提升公共数据服务能力,达到社会、企业、公众多主体携手起来合作共赢的效果,是一个重大课题。开放数据的目的在于促进有效数据的共享,使之在数字技术的应用下创造社会价值,开放数据的真正价值实现是数据能够得到再利用。(P25-50)对于不危害国家安全,也不侵害个人隐私或企业商业秘密的关系重大公共利益的数据,不必要实行更加严格的管控制度,而应当开放为社会利用、再利用。《数据安全法》第41条规定,除依法不予公开的数据外,国家机关应当按照规定及时、准确地公开政务数据。从这一条的表述来看,似乎只有政务数据才有公开的可能。其实不然,非政务数据同样也存在需要公开和事实公开的必要和可能。所以,现行《数据安全法》对数据开放和开发、利用、再利用,实际上是轻描淡写的,或者说是非常忽略的和相对狭隘的。《数据安全法》的立法理念和制度设计中,重数据安全而轻数据开放和开发、利用、再利用。这与大数据时代的背景是不完全吻合的。数据是能低价复制的,因其价格上无限接近零且普遍存在而最有价值的东西。[19](P61-73)企图通过技术手段实现数据私有化的概率微乎其微,这一点应与其他传统公共品区别开来。客观上,想将数据私有化存在着无法跨越的现实鸿沟:一是数据的价值和目的是通过分享实现的,若将其私人独占,则其价值难以实现,倘若与他人进行共享,其独占性将荡然无存;二是将数据私权化缺少实际的法律来加以保障,实现暂时性的数据独占的传统方式是自己守口如瓶,而在网络时代则仰仗技术手段来加密。数据法秩序是以分享为先决条件的,如今身处这种秩序中,想要保护实际的个人信息、知识产权和企业数据资产,就要少费功夫在数据私权化上。[1]

(四)危害公共数据的可能违法行为

数据开放既能创造巨大的公共价值,也可能带来潜在的风险。有学者认为,这些风险主要包括:1)开放数据本身或者被关联分析后,有可能泄露国家秘密、商业秘密和个人隐私;2)开放数据被误用或者滥用会损害公共利益或者第三方利益;3)开放数据的质量问题会给数据用户和社会带来损失。[9](P21)也有学者认为,这些违法情形可能会发生在进行数据开放时:1)不合规地打造开放平台;2)收集、储存、更新数据不合规,编制、更新、集中和上报资源目录不合规;3)开放数据在三个维度(真实度、准确度、完整度)上存疑;4)数据系统接口或数据库的不合规开放;5)不规范地执行数据安全保护措施等。[20]这些对数据开放过程中可能出现的违法行为的精辟论述,只是角度的不同,但已经不同程度地反映了该过程中的一些具体问题。概括起来,我们认为,有下面这些典型的危害公共数据的可能违法行为。

第一,有可能泄露国家秘密、商业秘密和个人隐私。开放数据不能危及国家安全、商业秘密和个人隐私,否则不但不会增强公共利益,还会损害公共利益。然而,由于公共部门缺乏组织保障、专业人员和严密的管理流程,在数据筛选和准备过程中,有时候并不能准确判断和决定,哪些数据应当公开,哪些数据不应当公开。而且,由于公共部门经常将信息系统建设和运维工作外包,使得政府工作人员对储存在外包的信息系统中的信息并不熟悉,造成数据开放的安全性要求与公共部门的专业性能力之间存在一定程度的不匹配,从而将一些本不应该开放的数据在无意中开放出来。另外,虽然技术公司在技术条件上领先于公共部门,但由于对公共管理运作过程的一知半解,加剧了开放不应开放数据的风险。[9](P21)

第二,拒绝免费开放数据。免费开放公共数据是一项原则要求,但对于一些公共部门来说,迈出这一步难度很大。一些公共部门将数据看作是该部门的资产和权力的来源,是与其他部门进行利益协商或者交换的资本,甚至将数据收费所得作为部门的收入来源,这些部门担心数据免费开放会降低部门收入和话语权。数据被誉为大数据时代的“石油和金矿”,在这种环境下,一些公共部门将其所掌握的数据视为己物,进一步为开放数据平添障碍。[9](P175)

第三,数据造假。当我们拥有数据,仿佛就可以先入为主认为拥有无可辩驳的正确性。其实不然,大数据分析的结果也存在被不同的人基于不同的思维进行解读、被颠倒歪曲、甚至被人为操控的可能,“使数据自主发声”的理想与现实相隔甚远,对大数据也应理性看待,客观分析,正确使用,切忌胡为乱信。[21](P214)我国实行科层制不可避免的滋生出“官出数字数字出官”的潜规则,一些官员大行其道,乘伪行诈,张大其事,虚报浮夸(虚大或虚多)数据,在数据上借题发挥已成为他们规避丢失“乌纱帽”的政治风险的无奈之举。[3](P77-80)海量的数据并不意味着准确的数据,虚假的数据将导致扭曲的大数据现实画像,从而影响决策的准确性或最终结果的有效性,甚至可能对社会造成更多伤害。现实世界中大量存在着刻意伪造或凭空捏造的数据,大数据本应让人们更好地了解现实世界,但是虚假数据则会让大数据偏离求真的轨道。[21](P55)数据的生命在于真实可靠,不真实的数据是不符合质量的数据,数据质量违反法律法规的规定,应当受到法律的制裁。

第四,数据壁垒和数据垄断。大数据的有效运行,需要整合公共数据,打破数据壁垒。国家提出的建立服务型政府、平台型政府、智慧型政府、开放政府、数字政府、阳光政府等要求,在很多地方迟迟没有有效落实,既有由于财政不足无法确保公共数据开放的技术基础设施建设到位的问题,更有因为缺乏有效的公共数据协调共享机制的问题。[3](P36-37)为使不同主体掌握的公共数据互联互通和对全社会开放共享,需消除政府各部门间、政府与市场之间、政府与公众之间的数据壁垒;同时为了让广大民众不受地域之限制,共享公共数据,也需消除不同地区之间的数据壁垒,这样一来才能充分挖掘数据的深层价值。破解公共数据垄断问题是公共数据开放的必经之路,这要求必须了解公共数据垄断的全貌特点,继而厘清反垄断法干预路径。政府等主体垄断公共数据是对其履职等原因而掌握海量公共数据的事实状态进行的描述,这种情况不受我国反垄断法的禁止。而当政府等主体该开放而不开放公共数据、歧视性开放公共数据以及仅向特定主体转移海量公共数据时,才属于违法行为。经营者基于公共数据而实施垄断行为,这些行为中也包括与政府等主体进行合谋而实施或受政府等主体的强制而从事垄断行为,当然受到我国反垄断法的规制。面对公共数据的特点及其垄断问题的复杂性,反垄断法必须完善其干预的思路与方法。公共数据在获取、分析与使用层面上的竞争秩序需要竞争法治予以维护,反垄断法当为公共数据的开放使用保驾护航,同时反垄断法要在新业态、新模式和新技术的市场环境下不断进行自我审视、自我完善和自我发展。

三、公共数据公益诉讼机制:公共数据法治化的司法逻辑

公共数据领域可能存在拒不公开、拒不免费、数据造假、数据壁垒、数据歧视等情形,需要探求相应的法律保护机制,实现公共数据真正从“孤岛”走向“共享”。现行数据权利保护模式主要是参照著作权和商业秘密权利的维度进行的,这对个人数据或企业数据可能是有效的;但是,对于公共数据的保护,却是无效的或者是行不通的。因为,公共数据不具有排他的属性,不能按照私权保护方式予以确权和保护。具有交易性质的交换往往会给社会带来总体福利的增加,但若这类交换失去了此种性质,那样一来被制定出来用于保护交易的法律机制就会因缺失保护对象而丧失正当性。[22](P515)数据一旦被开放成为公共数据之后,就成为可以免费使用的公共产品,就不存在交易的性质,传统的规范交易关系的法律机制对公共数据的来说就缺乏正当性。也就是说,纯粹的私法机制无法满足公共数据保护的客观需要,应当求助于公法机制。行政法学界对于公共数据的公法保护机制,特别是行政救济程序有一定的研究,而且行政法立法规定对公共数据的保护可以发挥较大作用。有鉴于此,本文的重点不再重复探讨公共数据行政保护和行政救济机制,而试图结合当前学界对“政府数据开放过程中违法行为不可诉”的观点作出回应,并对公共数据公益诉讼机制特殊制度安排提出建议。

(一)公共数据开放司法救济程序的强化

任何个人和组织开展数据处理活动,无论在我国境内还是在境外,无论损害了个人和组织合法权益,还是损害了我国国家安全和公共利益的,都应当依法追究法律责任。《数据安全法》第12条只规定了投诉和举报制度,规定任何个人和组织都有权对违反数据安全法规定的行为,向有关主管部门投诉、举报,有关部门应当及时依法处理。这依然强调的是行政追责机制。尽管行政追责的机制可以及时有效地发挥作用,但是它毕竟不是最终的追责机制,需要有司法追责机制作为补充,只有行政追责机制和司法追责机制有效结合,才可以充分发挥作用。所以,本文的重点不在于重复既往行政追责机制已有研究成果,而是重点对司法追责机制予以探讨,特别是基于公共数据的客观属性及其对公益诉讼的制度需求予以展开。公益诉讼制度像法律的毛细血管一样,已经渗透到了很多有关国家利益和社会公共利益保护的法律制度当中来。[23]在数据处理活动损害国家利益和社会公共利益的时候,如何启动司法救济机制,在数据安全法中确立公益诉权很有必要。公共数据开放的一大缺点是缺乏具有公益属性的私人诉讼,这可能导致公众想要寻求重要数据信息时,遭受极度的困难和挫折。没有公益属性的私人诉讼,数据法制依然是无牙的老虎。所以,要开放具有公益属性的私人诉讼。公益诉讼制度的创新探索不仅赋予权利人诉权、规范行政机关干预,对疏解以少额多数受害为特征的数据权益纠纷也益处良多。[24]从权利救济理论可知公共数据开放的过程中少不了司法救济程序的保驾护航。[25]应当向社会开放的公共数据,若行政机关不予开放或拒绝开放,此时公民、法人或其他组织可以向法院提起诉讼,通过司法救济程序强制要求其开放。当政府部门实施了不规范的数据处理行为时,权利人也可以获得相应的司法救济。

(二)对“政府数据开放过程中违法行为不可诉”的质疑

有学者认为,政府数据开放法大部分是促进型立法,所以政府违反数据开放义务的法律责任在法条中并没有得到体现。公众想要利用诉权来实现规制政府不开放数据行为是举步维艰的,规制仅能通过内部投诉机制、行政复议或民主参与渠道来进行。政府不仅对使用者因其开放数据不当行为而受到侵害不担责,而且对于由其不予开放数据行为引发的纯粹经济损失也不负赔偿责任。[11]我们认为,这些观点值得商榷。其实,有学者提出,若政府直接公开的数据导致社会主体信赖利益受损或遭受直接损失,那么其须承担以过错为裁量标准的行政责任或民事责任。[26]事实上,我国地方立法针对政府违反数据开放义务的法律责任作出了相应规定。①例如,《贵阳市政府数据共享开放条例》第30条规定:“违反本条例规定,行政机关及其工作人员有下列行为之一的,由其上级机关或者监察机关责令限期改正,通报批评;逾期不改正的,对直接负责的主管人员和其他直接责任人员依法给予处分……”。《上海市公共数据开放暂行办法》第42条规定了数据开放主体的责任:“数据开放主体有下列行为之一,由本级人民政府或者上级主管部门责令改正;情节严重的,依法对直接负责的主管人员和其他直接责任人员给予处分……”。《浙江省公共数据开放与安全管理暂行办法》第42条规定:“公共数据开放主体及其工作人员有下列行为之一的,由本级人民政府或者上级主管部门责令改正;情节严重的,由有权机关对直接负责的主管人员和其他直接责任人员依法给予处分;构成犯罪的,依法追究刑事责任……”。在大数据时代,政府开放公共数据是其法定职责,而不是一种政府恩惠。所以,政府数据开放法被归为促进型立法是极为不妥的,政府违反数据开放义务的法律责任需在其法条中予以规定。如果政府开放公共数据过程中存在违法行为,从有权利必有救济的角度看,不管是否给使用人造成损害,都应当保留权利救济的基本途径。诉讼是最终的维权机制,所以不能只停留在内部纠错机制环节,而应当充分赋予民众相应的诉权,发挥司法追责和纠错机制的保障作用。

有学者认为,政府开放法中规定的政府数据开放义务或职责不是具体意义上,而是抽象层面的。[11]其实,这也是一种误解。政府开放数据是一种经常性的具体事务,而不是一种抽象的义务或者职责。有学者认为,政府数据开放义务或职责保障的对象并非是个别主体获取数据的权利,而是公众特别是这其中创业者的发展权。想要通过诉讼等途径给予发展权这种新型权利保障并非易事。[11]其实,发展权是否具有可诉性,我们不能主观武断地否定。包括发展权在内的新型权利的司法救济问题,是很多学者高度关注且由新型诉讼得以不断实践的新现象。

有学者认为,政府数据无偿对使用者开放,即便有偿,使用者支付的不是对价而是成本,政府对使用者因其开放数据不当而受到损害不承任何赔偿责任,并且这也是国内外政府数据开放一贯的做法。[11]该观点认为,诉讼在政府不担责的情况下是多此一举的,换而言之,政府的这种行为不被纳入被起诉的范围之内,具有不可诉性,由此来规避凭空事端的打扰。[11]该学者没有详细梳理政府数据开放与使用人损害之间因果关系的具体情形。公共数据可以为使用人生活、生产活动提供便利和效益,如果由于使用人自身的原因造成目的失败,那是市场风险,当然不需要政府承担赔偿责任。但是,如果是政府开放的数据不实而造成的损害,政府就应当承担相应的赔偿责任;即使不承担赔偿责任,也不排除政府应当承担的其他责任。我们不能因为是免费使用政府开放的数据,而否定使用人诉权之存在,更不能认为诉讼是一种无端的滋扰行为。

有学者认为,政府开放数据的目的是保障公共利益而非特定的私人利益,个人从开放数据中获取的是客观利益,或者说是反射利益,个人即相对人并不能从中获得起诉权,因此这种行为不具有可诉性。[11]这种观点将公共利益和私人利益绝对的割裂开来。其实,公共利益实现了,个人利益也能得以充分实现。政府数据公开,最终的受益者是全体民众。再说,反射性利益是不是一定就不能受司法保护,也是值得探讨的。公益诉讼更多的就是保护扩散性的反射性的公共利益。对于扩散性的反射性的公共利益,虽然现行我国法律没有规定个人的起诉资格,但是并不排除法律规定的有关组织和检察机关对于政府数据开放领域损害公共利益的行为有起诉权。针对政府数据开放领域缺乏私人诉讼的事实,Beth Simone Noveck 有着相同的顾虑:政府数据开放法相比信息自由法而言,存在着私人诉权的缺乏以至于无法强制政府披露数据的问题,公众在检索重要信息时或许会因此寸步难行,《政府数据开放法》中的私人诉讼只是“虚有其表”。[27]其言外之意,不是要否定私人诉权的存在,而是要强化私人诉讼的作用。

还有学者认为,侵害个人信息权益扩散开来就是对公共利益的侵害,所以,基于诉因及诉讼标的立场出发,个人信息保护可以归入公益诉讼的保障之下。[28]亦有学者认为,实力上,个体信息使用者与网络运营商不可同日而语,对于个人信息保护,民事私益诉讼如盲者得镜。所以,依法建立针对信息保护的行政公益诉讼制度,是寻求个人信息保护缺失困境的破解之道的一次尝试。[29]其实,民事私益诉讼的功能局限,只能靠完善民事诉讼特别是确立民事公益诉讼制度来予以弥补,而不可能指望行政公益诉讼来克服民事私益诉讼的局限性。再说,个人信息权益领域是否有扩散性侵害,是一个值得探讨的问题。个人信息都是特定化的,不存在扩散性侵害,充其量只有违法行为人对众多个人信息权益的侵害现象。即使是众多的个人信息被侵害,那也不能简单理解为公共利益,公共利益并非由众多个人利益进行简单相加的结果。所以,这种情况下,充其量可以由代表人诉讼得以解决,不需要启动公益诉讼制度,代表人诉讼制度与公益诉讼制度,在性质上有本质区别。但如果将公益诉讼援引到公共数据保护中来,将是顺理成章的事情,公共数据是全民可以共享的数据,因此而产生的利益属于典型的公共利益范畴,其司法保护机制必然是公益诉讼。

(三)公共数据公益诉讼机制的特别制度安排

在数据领域,目前已有学者对个人信息保护公益诉讼制度进行探讨。[28-31]其实,公益诉讼制度在个人信息保护领域并不典型、不普遍,只是因为目前个人信息大规模、大批量受到侵害的现象,让人们不由自主联想到公益诉讼制度的作用。其实,在很多场合,个人信息保护可以通过私益诉讼和代表人诉讼得以解决。但是,基于公共数据的公益属性,公益诉讼制度必将成为公共数据司法保护的重要手段,公共数据的司法保护与公益诉讼制度存在天然的契合性。随着公益诉讼立法不断走向成熟,[32]公益诉讼案件范围的不断拓展,[33]在数据法治领域,已经有地方立法对数据公益诉讼作出了制度安排。比如,2021年《深圳经济特区数据条例》第98条规定,检察院和法定组织可针对数据违规处理侵害国家或公共利益的行为,在民事方面提起公益诉讼;检察院还可针对职权滥用或者不作为而侵害国家或公共利益的行政单位,提出检察建议或者启动行政公益诉讼。但是立法规定比较粗糙,而且没有上升到国家立法层面,没有结合公共数据的特殊性对公共数据公益诉讼设计出具体的、行之有效的规则体系。

我们认为,公共数据公益诉讼除了要遵循公益诉讼的基本原则、制度和规则之外,还需要结合公共数据司法保护的特殊要求,在以下几个方面做特别的制度安排:第一,建立诉前异议机制。成立诉前异议审查机构,如类似韩国的开放数据协调委员会,由具备专业知识和技能的人员组成的专门机构,专门负责解决公共数据的各类纠纷。这样可以高效地解决纠纷,避免经历复杂的诉讼程序,充分运用当下互联网审理案件的便捷性、高效性解决纠纷。第二,成立互联网法院和建设跨庭室专业合议庭。在此基础上,组织具有数据纠纷审判实务经验的资深法官,专门审理集中管辖的涉及个人数据、企业数据、公共数据等数据处理及数据安全的案件。广州互联网法院在2021年组建了国内首个与数据纠纷有关的专业合议庭。此院成立后,对数据纠纷进行全面、深入研究,先后审理了600多件与虚拟财产、个人信息保护等问题有关的热点案件,积累了丰富审判经验。广州互联网法院围绕诉讼标的、数据主体、使用场景和处理环节这四方面内容进行“四维识别机制”的创建,对智能化的立案甄别系统进行搭建,将数据纠纷方面的审判空白尽快填补起来。可相应在我国北京、上海、杭州等多地互联网法院建立涉数据纠纷专业合议庭。第三,构建专家陪审员参审机制。涉数据纠纷专业合议庭将邀请政府机关、科研机构、高等院校、网络科技公司等,推荐一批具有较高专业权威、良好职业操守和实践经验丰富的专家、学者、专门技术人员担任人民陪审员,并对以上人员的学历、意愿和从业经验等因素进行全面考量,择优组建专家型人民陪审员队伍。发挥专家陪审员的专业优势,针对与案件事实有关的问题进行发问,深化和完善涉数据纠纷的事实查明机制。

四、结论

公共数据作为新兴的社会资源,只有向社会开放,并被社会不断开发、利用和再利用,才能发挥其资产的增值效能,而公共数据的从“孤岛”走向“共享”的开放过程,需要法治提供保障。公共数据具有和个人信息、商业秘密以及国家安全信息相区别的公共性、共享性、开放性、累积海量性、间接性、脱敏性、无需授权免费使用性和普惠价值性等特有属性。基于公共数据这些特有属性,法律制度的安排就不能简单套用数据安全法中个人信息保护、商业秘密保护和国家安全信息保护的相关规定,应当构建其独特的法律保护制度体系。这是公共数据法治化的逻辑起点。目前,我国公共数据的开放程度并不高,并且在公共数据开放、开发、利用过程中会出现泄露国家机密、商业秘密和个人隐私,以及拒绝免费开放、数据造假、数据壁垒和数据垄断等违法行为。所以,我国政府强调要加快建设和推动公共数据资源的开放、开发和共享,并制定了一系列的相关政策。我国公共数据开放的基本状况以及我国政府对数据开放的基本政策立场,构成了我国公共数据法治化的现实逻辑。建立健全公共数据相关法律制度,只是公共数据法治化静态制度层面而已。公共数据有效开放、开发和利用,离不开健全的法律保障机制。原有的私法机制无法满足公共数据保护的客观需要,应当求助于公法机制。行政程序特别是行政救济程序在公共数据保护领域固然可以发挥积极作用,但是那些认为对于数据开放过程中所出现的违法行为不可诉的观点,是从根本上否定公共数据司法保护机制的观点,实际上值得商榷。我们除了要进一步完善公共数据开放、开发和利用的行政救济程序,也要不断强化公共数据开放、开发和利用的司法救济程序,并结合公共数据的特有属性,构建具有中国特色的公共数据公益诉讼机制。

猜你喜欢

公共数据孤岛个人信息
防范电信网络诈骗要做好个人信息保护
公共数据授权运营机制探索
个人信息保护进入“法时代”
公共数据治理中的价值实现机制
公共数据归属政府的合理性及法律意义
不再是孤岛
《岛上书店》:与书相伴,没有谁是一座孤岛
公共数据开放许可的规范建构
主题语境九:个人信息(1)
警惕个人信息泄露