大数据时代公共数据的公用性实现机制研究
2021-12-03陈家宁
陈家宁
(西南政法大学民商法学院,重庆 渝北 401120)
引言
目前社会正处于大数据变革时代,数据涵盖了经济社会发展的各个领域,已成为重要的生产要素。由此产生的革命性影响也将重塑生产力发展模式,而对数据的有效利用是提升国家治理现代化的重要环节之一。2016年《“十三五”国家信息化规划》中提到,到2020年,要实现民生保障服务等领域的政府数据集向社会开放,构建全国信息资源共享体系,稳步实施公共信息资源共享开放,规范数据共享开放管理。2020年6月,《数据安全法(草案)》提出适应电子政务发展的需要,建立政务数据的开放利用规则,推进政务数据资源开放与利用。各地方政府陆续出台了地方性政府公共数据管理办法。因此对于公共数据利用的机制设置十分重要也十分迫切。然而,目前公共数据开放和使用仍面临诸多挑战,大部分政府部门的数据基础还很薄弱,存在数据分类标准不清、数据质量参差不齐,各领域数据出现孤岛化,阻碍了数据开发使用。
公共数据的性质如何界定,以何种方式进行保护,这是公共数据立法乃至整个数据立法都必须回答的,也是最基本的问题。总体而言,有关公共数据开放与利用的理论基础尚未达成共识,其法律性质与法律定位不明确,相关制度设计过于简单化。本文主要以公众对公共数据的使用为中心,探讨公共数据的公用性实现机制,以期助力公共数据法律规范的完善。
一、公共数据及其公共性分析
(一)公共数据是一种公共信息资源
1. 公共数据的范围。 目前我国公共数据地方立法中,对于公共数据的来源机关主要有三种不同的范围限定,一是小范围的规定,即数据仅来源于政府部门。二是中等范围的规定,即公共数据的来源包括政府部门以及履行公共管理职能和服务职能的事业单位。中等范围的公共数据包含三种层次:行政机关或具有公共职能的机关在管理国家公共事务的过程中收集的数据;给予行政机关授权而获得公共事务管理权限的机构在行使公共职能的过程中收集的数据;在有公共利益的领域内与公共利益有关的数据。三是大范围的规定,即数据的来源不仅包括政府部门和事业单位,还包括具有一定公共管理和服务性质的社会团体和企业。大范围的公共数据不仅包括政府以及公共部门所掌握的数据,还包括外部机构为公共部门所创建的数据,以及由外部机构掌握但与政府履职与服务相关的、具有重大公共利益关切的数据。笔者认为,公共数据既作为一种具有公共性的信息资源,其来源不应当仅限定在公共机关,只要具有重大公共利益关切,其存在有着公共目的性,就应当属于公共数据。
2.公共数据是一种公共资源。 按照萨缪尔森在1954年发表的《公共支出的纯粹理论》一文中的理解,公共物品是指“每个人对这种物品的消费,都不会导致其他人对该物品消费的减少”。公共资源是具有很高非排他性的公共物品,是“属于人类社会共享的自然资源与社会资源”,不仅有矿产、土地等有形自然资源,还包括了科技、文化等无形社会资源。数据可以以极低的成本复制,在经济上具有较强的非竞争性,这一点与数据蕴含的信息资源相似。因此,数据——特别是具有公共利益性质的数据,是公共资源的一种。党的十九届四中全会将数据作为新的生产要素。公共数据作为公众使用的信息资源,公众可以在不妨害他人利用的情形下,按照公共数据的使用规则,依照目的性用途进行使用。
3.公共数据与政府信息公开的关系。 应当明晰两者的关系。政府信息公开指的是行政机关在行政管理时取得的信息。笔者认为,两者存在三点区别:首先,数据来源的主体不同。政府信息公开的主体是行政机关和履行公共管理职能和服务功能的事业单位,而公共数据的来源主体不仅包括以上机构,还包括进入公共领域的其他数据来源。其次,两者的产生方式不同。政府信息公开中的信息主要在履行职能的过程中制作或获取;而政府公共数据除了制作或获取,还包括通过特许经营、购买服务等方式开展信息化建设和应用所产生的数据。再次,两者的表现形式不同。政府信息公开强调数据的公开状态,主要以原始数据为主;而政府公共数据更加重视数据的可用性,所以更多地表现为经过一定程度加工的数据产品,例如可视化数据或信息分析应用。
综上,政府信息公开的量一般较小,使用方式以供公众阅读为主,而公共数据的量远大于政府信息公开,在形成数据集后,使用方式也脱离了简单的信息获取,而是通过对大量数据的分析形成数据产品,产生新的使用价值。因此,笔者认为,政府信息公开与公共数据的外延并不等同。地方立法对此也有区分,例如《无锡市公共数据管理办法》第三十八条:“政府信息公开按照《中华人民共和国政府信息公开条例》等法律法规执行,不适用本办法。”
(二)公共数据公用性的二元性
其一,公共数据的存在本身具有公共目的性。公共数据集充当着“推动数字经济、数字社会发展”的作用。美国《开放政府数据法案》也提到“发挥政府公共数据为社会创新与政府决策的积极作用”。公共数据存在本身直接与社会和人民的利益相关联。因此,公共数据所有权的权能并不能完全等同于私人所有权。作为无形物的数据,不可能被某一特定主体独占,具有非独占性或共享性的特点。无论是公共数据的掌控者还是处理者,都无权像私人所有权人那样任意对公共数据进行收益和处分。
其二,公共数据的使用具有公用性。公共数据作为一种公共资源,一旦被提供,公众均有权对其主张权利,任何人都不应当被排除在外。因此,公共数据应为不特定公众使用,其使用本身也具有公用性。
二、公共数据公共目的维持机制的整理与反思
根据我国公共数据各地方立法及草案、征求意见稿来看,现行公共数据的公共目的性维持与监督机制主要由以下五个制度组成:
第一,依法收集制度。各地方立法对公共数据的收集作出了原则性的限制,一是数据收集的目的限制,即数据的收集须按照使用目的在目的范围内进行收集。二是一数一源,不得重复采集,各公共数据持有者之间可以通过共享获得的数据,不得再向数据主体重复采集。三是尊重数据主体意愿,信息主体对个人信息的使用享有同意、拒绝、删除等权利。在收集法定职责范围外的数据时应当征得数据主体的同意。但是,对于数据主体的哪些行为可以被视为同意,没有细化的规定。
第二,信息保障制度。所谓信息保障制度,是指公共数据持有者应当保障信息的可公开性、真实性、完整性和及时性。信息保障制度不仅对信息质量本身有着要求,对信息的流通也有制度化需求。各地方立法对信息保障均有规定,例如要求各单位应当依据公共数据开放目录对本单位公共数据进行定期评估和审查。《无锡市公共数据管理办法》第二十二条规定了数据的校核确认义务:“市级责任部门应当按照多源校核、动态更新的原则,对本系统公共数据进行逐项校核、确认。”此外,信息保障制度不仅要求在公告数据开放前进行校核,还要求对公共数据开放后的可用性等定期进行评估。
第三,管理监督制度。公共数据的监督管理主要分为主管部门的监督和社会监督。主管部门监督是指由主管部门指导、规范和促进公共数据的开放、利用并定期考核。《北京市公共数据管理办法(征求意见稿)》设置了主管部门考核:“市经济和信息化部门会同市政府办公厅每年对市级行政机关、各区的公共数据管理情况进行考核,……。考核结果纳入市政府绩效考核。”社会监督是指由公众通过提出意见建议的方式对公共数据的开放和数据质量进行监督。如公众可在数据开放目录不符合规范、数据存在错误或遗漏等情况出现时,向主管部门提出意见。
第四,非歧视制度。非歧视制度也称为技术中立制度,意味着立法不应当设立某种信息技术,使得某一群体相对于其他群体,在公共数据的获取和使用上处于劣势地位。《浙江省公共数据开放与安全管理暂行办法》第十六条规定:“公共数据开放主体应当向社会公平开放受限类公共数据,不得设定歧视性条件。”在非歧视制度下,不特定公众对公共数据的获取和使用都应当是同样便捷的。技术中立主要通过数据获取方式的技术设计,避免算法歧视或算法黑箱,但是对于受到算法歧视是否可以通过申诉或诉讼进行救济,没有明确的规定。
第五,法律责任制度。法律责任制度主要针对公共数据持有者和数据利用者,通过责任制度的设置,保障数据持有者依照法律对公共数据进行管理,避免数据利用者利用公共数据侵犯他人合法权益。各地方立法对于数据持有者——即公共数据管理部门的法律责任规定较为完善,但对于数据使用者的权利义务没有细化规则。
笔者认为,在公共数据目的性维持于监督机制的构建中,首先应当将维护数据安全与数据主权放在首位,建立多元化的公共数据分级分类机制,完善数据主体的知情同意,设置个人数据再识别风险的处理机制,同时,强化政府的数据责任,赋予公众更多的数据使用权救济。
三、公共数据公众使用机制的建构
数据作为公共资源,即为公众使用,特定或不特定的公众均可以在不妨害他人利用的情形下,按照使用规则和目的性用途下进行使用。自然人和法人、其他组织均有权以合法方式和手段创建、收集、聚合、储存、处理、分析、营销、分配、使用和重复使用信息。笔者认为,应当通过使用的类型化建立公共数据的公众使用机制。
(一)自由使用
1. 公共数据的自由使用与限制。 公共数据的自由使用是指在不妨碍他人使用的前提下,任何人都可以在目的性用途范围内无需许可地使用公共数据。自由使用意味着除非法律基于对特定利益的保护而作出限制,任何自然人和法人无需许可或付费,均可以直接且便利地获取并使用公共数据。公共数据的自由使用并不具有绝对性,而应受到目的性用途的限制。例如,利用自由使用的公共数据爬取个人信息,利用技术手段去匿名化,非法获取他人个人信息甚至侵犯他人隐私,这类侵权行为不能因自由使用而豁免。对于获取公共数据行使知情权,或数据自用的主体,可不受数据经营权限制,但公共数据从业者应该基受公共利益和个人信息与隐私保护的限制,依据法律授权或者行政特许等方式,管理并监督其数据活动。
2. 自由使用的性质。 对公共数据的自由使用是否可以作为个人在法律上可以主张的权利?换言之,行为人在其使用的需求被否定或侵犯时,可否依照侵权责任救济机制寻求诉讼法上的救济?按照耶林的观点,并不是所有旨在保护利益的法律都能赋予利益人以主观意义的权利,即法律请求权,使用人通过自由使用获得的利益并不属于严格意义上的权利,而是一种反射利益。因此,这一问题的实质是,公众对公共数据的使用利益是否属于权利?权利化的观点将自由使用作为法律利益,着眼于向使用人提供救济。其中接受较为广泛的是公共信托理论。公共信托理论源自于罗马法,共用物由国家基于主权进行保护。萨克斯(Sax)认为公共信托财产不能仅为了公共目的而使用,还必须满足一般公众的使用需求。耶利内克认为公用物的所有权主体是有着自由使用权的公众,而国家作为公益代表人,对所有权的行使是为保护公众的自由使用。非权利化的观点认为因自由使用而享有的利益不是严格意义上的权利,因而不应获得司法救济。
笔者认为,若将公众对公共数据的使用利益作为反射利益,断绝使用人通过司法手段进行救济的可能性,没有体现在公共数据开放使用领域中国家和公民之间的平等关系。公众对公共数据的使用利益虽然不属于类型化的权利,但也不应被视为反射利益而排除法律上的救济。
3.自由使用的数据种类。 公共数据应当以自由使用为原则,许可使用或特许使用为例外,因此自由使用的数据应当是范围最广、数量最大的。在保障信息安全与个人隐私等价值追求的前提下,最大程度地促进公共数据的公开与使用,更好地实现信息公开与数据价值的利用。欧盟《PSI修正案》第八条第一款提到了公共部门资料再利用:“公共部门可以允许无需任何条件的资料再利用,如有需要可以设置许可条件,但是这些条件不能对再利用的进行形成不必要的限制,且不可用于限制竞争。”因此,公众对公共数据的非排他、非营利性利用应皆自由。
(三)许可使用
1.许可使用的概念。公共数据的许可使用与自由使用并无本质上的区别,应当看作是自由使用的特殊类型。公众对许可使用的数据不可取得排他的使用权。许可使用在一些地方立法中也被称为有条件开放。许可使用的数据一般为申请开放,通过开放平台向保存该数据的部门提出开放申请,并说明利用目的、保密条件等。
2. 许可使用的法律性质。 公用物的许可使用是何性质,学界仍有争议,有人认为是管理机关的行政自由裁量行为,有人认为是羁束性行政行为。若将公共数据的许可使用看做行政自由裁量,则在许可使用的场景下,公共数据主管机关或其授权的数据平台有权对许可使用的数据类型、许可使用方式、限度和使用目的作出自由裁量。若将公共数据许可使用看做羁束性行政行为,则在公共数据规则制定时,就应当明确自由使用和许可使用的数据类型,开放流程,不同数据种类的使用、开发程度等。这样可以在立法的阶段就统一数据许可使用的落地流程,统一数据许可使用规则,一定程度上避免权力滥用,保障公众的数据权益。但是,数据是海量的、数据的新种类出现很快,数据库和数据平台的更新迭代也是一夜之间可能发生的事情,若立法规定地过于详细,不赋予数据管理者一定的自由裁量权,在个案中反而无法更有针对性地适应数据使用者的需求。
笔者认为,公共数据的许可使用应当被看作是行政自由裁量行为。理由如下:第一,许可使用是为了平衡特定数据敏感性和公共利益,但使用人对特定数据的使用情况复杂,法律难以详细、穷尽规定。第二,许可使用是特殊情况下的自由使用,所以许可使用的性质应当在自由使用的性质的项下讨论。第三,公共数据管理机关对许可使用的自由裁量并不意味着不受限制,仍需依照公共数据的使用目的和规则管理与授权使用。
3. 许可使用的数据种类。 公共数据的许可使用即作为自由使用的特殊类别,许可使用的数据种类是自由使用数据种类的延伸,是具有一定敏感性的公共数据,若直接公开可能会引起对公共利益或个人信息的不利影响。公共数据的开放共享并不表示可以对一切数据进行无限制地开放,如果涉及个人信息与隐私,公共数据控制者应当采取必要匿名化措施,防止数据主体权益受到侵害。另外,出于对数据准确性、可读性和安全性的考虑,对处理要求较高或时效性强的数据,也应当设置获取条件。
(四)特许使用
1. 特许使用的概念。 特许使用一般是指管理机关在不妨碍公共财产公用性的前提下为特定人设定的排他性使用的权利。然而,数据公共资源与有体性公共资源的占有和使用方式不同,有体性公共资源无法实现多人共同开发,只能采取诸如通过特许经营的方式对公共资源进行开发利·和交易,并将获得的收益上缴国库,最终实现全民共享。与传统公共资源不同,数据资源可以同时授权多个主体开发使用。此外,授权开发使用的实质是使用权的授予,而不是所有权的转移。因此,公共数据的特许使用应当是指一般不予开放,只有特殊情况下依申请审查后才可获取,并在利用目的范围内有限使用。
2. 特许使用的性质。 在我国,通说认为特许使用权是一种用益物权。公共数据的特许使用与传统的特许使用权不同,数据本身可以无限复制的特性与传统有体物需要占有才能使用完全不同,严格程度甚于许可使用。自由使用在公共数据原本的目的性用途之中,所以没有赋予使用人其他权利,只是使其获得了因该类公共数据目的性用途设定而产生的反射利益,而特许使用则超越了该原本目的性用途,赋予了使用者继续使用的特别权利,因此公共数据的特许使用没有设置排他性使用权能的必要,且公共数据的特许使用一定要在目的性用途之下。
3. 特许使用的种类。 特许使用的数据一般涉及公共利益或他人权益,不得随意开放。《浙江省公共数据开放与安全管理暂行办法》对禁止开放的数据进行了列举:国家秘密、商业秘密、个人隐私、以及开放后可能危及国家安全、公共安全、经济安全和社会稳定的数据,以及基于合同约定和知识产权保护不得公开的数据。另外,公共数据涉及个人敏感信息的,也应当列为特许使用的数据。《个人信息保护法(草案)》第二十九条提到,对敏感个人信息的处理应当有特定的目的和充分的必要性。因此,禁止开放的数据并非无法获取,而是需要根据申请、评估后在目的范围内获取,或将该类数据进行匿名化或脱敏、脱密处理后向公众或特定主体开放。
结语
数据是信息社会的“钻石矿”,其体量之大、范围之广、价值之高,若不充分利用,则对社会与经济发展无益。公共数据是数据资源的重要组成部分,公共数据的开放与使用,有利于盘活公共机关的数据资源,“取之于民”的公共数据通过使用的类型化以及公共目的性维持与监督机制的建设,能够更好地“用之于民”,充分发挥出公共数据的经济价值、社会价值与政治价值。