论公共数据的规范含义
2021-09-02郑春燕唐俊麒
郑春燕 唐俊麒
摘要:我国中央层面的立法尚未对公共数据的概念进行界定,陆续出台的地方立法主要通过主体要素、目的要素和行为要素划定公共数据的内涵与外延,但各地标准并不一致。公共数据概念作为技术型概念,从其创制的目的出發,当以“公共利益”确定公共数据的内涵,以公共管理与服务的目标划定公共数据的外延。学理上对公共数据概念的理解,并不能与公共数据立法的适用对象简单划上等号。立法者应根据公共数据立法所处阶段,通过多元立法机制设计,为不同类型的公共数据量身打造相应的规范框架。
关键词:公共数据 立法数据 治理公共管理与服务 公共利益
一、引言:争鸣中的公共数据界定
随着数字技术的飞速发展,公共数据已经成为信息时代国家治理体系与治理能力的重要基础。现行法规范主要以“政府数据”①“政务数据”②“公共数据”③作为概念分析工具讨论数据的共享、开放、利用、安全保障等。然而“政府数据”“政务数据”的概念已经不能完全涵盖包含社会公共部门信息的“公共数据”。学界的研究也逐渐跳脱出“开放政府”的概念范畴,从公共数据所蕴含的社会价值、经济价值、政治价值,或者是融合的民生价值出发,讨论公共数据的治理问题。④
十三届全国人大《关于2020年国民经济和社会发展计划执行情况与2021年国民经济和社会发展计划的决议报告》明确指出,要加强公共数据开放共享,建立健全国家公共数据资源体系。公共数据将成为数据资源体系建设的核心,也是数据开放共享的重点。但究竟何为公共数据?我国中央层面尚未出台专门的公共数据立法,《中华人民共和国电子商务法》《中华人民共和国网络安全法》《中华人民共和国电信条例》等三部法律法规使用了“公共数据”的概念来讨论数据的联通、数字资源的共享开放利用;而当前唯一通过的数据专门法案——《中华人民共和国数据安全法》(以下简称《数据安全法》)仅规定了政务数据的安全与开放。部分地方虽以地方性法规或地方政府规章形式出台了公共数据法案,然而基于地方公共数据治理实践的进度不同,“公共数据”被赋予了不同的规范内涵。
在数据被确定为新生产要素后,作为与数字经济、数字社会、数字政府建设息息相关的公共数据需要一个更贴合数据治理实践、更顺应时代发展的内涵。为此,本文将对当下法规范文本进行梳理,诠释不同法律规范中公共数据的认定要素;协同社会实证调研结果,分析公共数据的理论含义,进而从创制目的出发探索符合公共数据立法目标的内涵与外延,明晰公共数据概念在整个数据理论体系中的地位。
二、立法者言说:现行规范上的公共数据
公共数据概念既然出自于政府治理实践,其界定需要从实践中汲取经验,明确所涉多方主体之间的法律关系。但作为规范上的概念,不能止步于实践的总结,还需结合公共数据理论的进展,以使立法具有面向未来的涵摄能力。
(一)规范上的概念嬗变
立法者起初建立的数据共享开放体系更多以政府数据、政务数据为核心,前期的“政务信息”“政府数据”“政务数据”等概念,也成为之后划定“公共数据”内涵与外延的重要参考。为区别于政府信息公开,国务院最初选择“政务信息”作为概念工具讨论政府共享开放信息资源,典型的如2016年国务院出台的《政务信息资源共享管理暂行办法》。该办法第2条对“政务信息资源”定义如下:“政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源,包括政务部门直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等”,并将政务部门限定为政府部门及法律法规授权具有行政职能的事业单位和社会组织。这个定义与《中华人民共和国政府信息公开条例》对政府信息的定义趋同。⑤地方各省市也开始选择以“政务信息”作为主概念探讨政务信息资源的共享开放,如《河北省政务信息资源共享管理规定》《昆明市政务信息资源共享管理办法》《广州市政务信息共享管理规定》等;《湖南省政务信息资源共享管理办法》《北京市政务信息资源管理办法(试行)》还在附则中提出承担公共服务职能,与人民群众利益密切相关的学校、医院、供水、供电、供气、供热和交通等公共企事业单位的政务信息资源管理工作“参照适用”。
随着信息和数据概念的逐渐厘清,“信息的本质意义是对事件特定性的确定,存在于这个世界对确定性的描述与量度,都可以成为信息”⑥,而“数据只是信息表达的一种方式,除数据外,信息还可以通过其他方式来表达”⑦。数据作为最容易保存和传递信息的手段,计算机技术的发展和成熟使得数据成为包含信息最多的载体。大数据时代的到来,数据量激增,发现和挖掘数据之间的关联性成为数据创新的主要任务,数据与人工智能等具有应用价值型算法的关联度强化,数据的社会价值超越了信息。数据的来源和生产机制的改变也使得数据价值的实现不再依托于信息,数据逐渐取代信息成为数据资源共享开放的主概念。交通运输部发布的《交通运输政务数据共享管理办法》、文化和旅游部发布的《文化和旅游部政务数据资源管理办法(试行)》即选择政务数据作为主概念。地方各省市的立法者也逐渐选择“政府数据”“政务数据”作为主概念,并尝试打破共享开放的讨论范畴,建立政务数据的系统体系,逐步发展和完善概念的涵摄范围。如在地方性法规层面,山西省人大出台的《山西省政务数据管理与应用办法》对“政府数据”的界定不再沿袭“政务信息信息”的界定,将主体要素扩张至“政务服务实施机构”,并将“履行职责”拓展至“履行职责+通过特许经营、购买服务等方式开展信息化建设和应用”。⑧地方政府规章层面的规范文件则大多采用“政务部门在依法履行职责过程中制作或者获取的,以一定形式记录、保存的各类数据,包括直接或者通过第三方依法采集、管理和因履行职责需要依托政务信息系统形成的数据”;⑨亦存在将主体要素扩张至“国家机关、事业单位、社会团体或者其他依法经授权、受委托的具有公共管理职能的组织和公共服务企业”,并将“履行职责”扩展为“履行职责+通过特许经营、购买服务等方式开展信息化建设和应用”的情形⑩。
在政府数据、政务数据之后,随着政府数据开放范围的进一步扩大,公共数据逐渐成为地方立法青睐的新概念。地方政府首先开始了公共数据专门立法的探索,其中最早采用公共数据概念的是浙江省政府2017年出台的《浙江省公共数据和电子政务管理办法》(以下简称《浙江省公共数据管理办法》)。该规章将“公共数据”界定为“各级行政机关以及具有公共管理和服务职能的事业单位,在依法履行职责过程中获得的各类数据资源”,并在附则中规定水务、电力、燃气、通信、公共交通、民航、铁路等公用企业在提供公共服务过程中获得的公共数据的归集、共享和开放管理“适用”本办法。?上海市、吉林省、四川成都市、山东济南市、广西南宁市等地方政府也相继出台公共数据管理办法,划定不同的公共数据范围。?根据2019年宪法和法律委员会对第十三届全国人民代表大会的议案审议结果,《公共数据资源管理法》或《大数据管理法》将在条件成熟时列入立法规划、年度立法工作计划,或在相关法律的制定或者修改等工作中统筹考虑。?其后各地人大相继将公共数据的资源管理作为立法计划的重点,相关立法逐渐以公共数据取代政务数据,规定公共数据不再局限于政务部门的数据,如《浙江省数字经济促进条例》(以下简称《浙江省数字经济条例》)《河北省信息化条例》(以下简称《河北省信息条例》)《安徽省大数据发展条例》(以下简称《安徽省大数据条例》)《深圳经济特区数据条例》(以下简称《深圳数据条例》)等。
(二)嬗变背后的立法者意图
就当前数据相关立法来看,立法者对概念的择定因数据治理实践不同而相异,并未赋予公共数据一致的规范含义。公共数据虽与政府信息、政务信息、政府数据、政务数据有千丝万缕的联系,但并不等同于其中某一概念。在“信息”与“数据”的抉择上,以“政府信息”“政务信息”为名的规范文件通常具有“政府信息公开”的特定含义。当前政府数据公开与政府信息公开之间的关系尚存在多种认识,不过政府对数据的处理活动不同于政府信息公开已成为共识。因此,考虑到“数据”与“信息”概念上的自然区别,且为避免使用相同的概念造成数据处理活动与政府信息公开的混乱,立法者开始有意以“数据”取代“信息”。投射到数据治理的学理研究上,学者进一步明确了二者概念使用的区别:“政府信息公开”为“政府数据开放”在法律层面奠定了基础?,是政府数据开放的前提,而开放政府数据则是政府信息公开在大数据时代的延伸和跃进,在开放的深度和广度上都达到了新的水平。?政府数据、政务数据并不同于旨在保护公民知情权的政府信息,强调价值挖掘和开发利用的数据研究不再适宜用“信息”作为概念工具。因此,立法者与学者逐渐以政府数据、政务数据作为数据治理规范体系中的主概念。
为推进国家治理体系和治理能力现代化,政府在打造开放政府的同时,愈加关注通过数据实现政府治理的一般目标。打破部门数据壁垒、提升行政效能的政府数据共享,与整合公共数据资源向社会开放、促进数据增值利用和创新应用的政府数据开放成为大数据时代的热门课题,地方政府相继推出政府数据共享与开放的专门法案。对于“政府数据”“政务数据”二者的区别,有学者在研究政府数据的开放时将“政府数据”定义为“行政主体在依法履行职责过程中制作或者获取的,以一定形式记录、保存的各类数据资源”?;而将“政务数据”界定为“与政府存在状态相关的数据,政务运作过程中产生的数据,政府运营和实施管理过程中经过采集、生产或转换而形成的数据”?。因此,一般认为“政府数据”与“政务数据”概念含义一致?,但也有学者认为“政府数据并不限于行政主体在业务范围内产生的政务数据,但小于具有公共管理和服务职能的企事业单位所管理的公共数据”?。此外,由于政府依旧是数据管理体系中的核心主体,常言之“政府数据共享、政府数据开放”更多指的是数据共享与开放行为由政府做出,并非意指共享开放的内容仅为政府数据。因此,相比于具有执行含义的“政府数据”,“政务数据”不仅包含了履行职责的职务含义,而且作为规范概念用词也更适合用于划定法规范的适用对象范围。如此,“政务数据的共享开放”与“政府对数据的共享开放”可以更为明显地区别开来。与立法者对规范概念的抉择一致,含义更为明确、不易与其他概念混同的政务数据更常被用作研究政府数据共享开放的主概念。政务数据的界定也依旧主要沿用了国务院对“政务信息资源”的概念界定,将数据控制者?限定为“政务部门”,即行政机关以及法律法规授权具有公共管理和服务职能的组织在依法履行职责过程中制作或者获取的数据。
2016年第十二届全国人大批准公布的《中华人民共和国国民经济和社会发展第十三个五年规划纲要》,首次从中央层面提出“加快建设国家政府数据统一开放平台,推动政府信息系统和公共数据互聯开放共享,强化公共数据资源的安全评估与保护”。自此,公共数据专门性立法进入了新篇章,立法者逐渐选择以“公共数据”作为数据立法的主概念。由于公共数据平台作为政府“用数据治理”的基础设施,数字政府的建设需要更广范围数据的加入;且国家政府数据统一开放平台、数据资源的充分开发利用也需要更多数据被纳入政府管理数据的范围,因此公共数据被期待赋予广于政务数据的含义。数据治理理论体系研究伊始,公共数据乃是作为学者研究数据共享与开放的附属性工具概念。但随着数据资源的管理突破政府面向进入数据治理体系的搭建,政府开始从关注数据的内部共享到重视数据利用的外部开放,数据资源的利用推动政府共享和开放的数据范围拓宽,公共数据逐渐取代涵摄范围明确却过于狭小的政务数据,成为数据治理研究的主概念。
但学界对公共数据的含义却莫衷一是。有学者直接将公共数据等同于政务数据,“政府在履行公共管理职责和提供公共服务过程中形成的非专属于行政相对人的数据”21;或者从数据权益的角度将“公共数据”“政府数据”“政务数据”视为完全相同的概念,认为都是一种具有经济、政治、社会价值的公共资源。22有学者则认为公共数据的范围大于政务数据的含义,政务数据仅指公共数据中由政府部门保存和管理的数据,公共数据则属于由国家或者地方自治团体所控制和管理的资源;23而政府发挥公共服务功能并不仅仅依靠自身,大量非政府公共机构乃其主要载体,而这些机构积累的大量数据也是宝贵的国家资源,也需要充分开发利用,才能挖掘公共数据最大的效用,从而将公共数据界定为“全部或者部分使用财政性资金的国家机关、事业单位、团体组织及科研机构等公共机构在依法履行公共职能过程中生成、采集的,以一定形式记录、保存的各类数据资源”24。也有学者认为“公共数据包括政府部门委托授权特定私营部门或个体行使特定公共职能过程中收集的数据,以及公共属性的领域或空间中,并非依赖政府职责产生的、涉及公共利益的数据”25;还有学者尝试从公共性和内容出发,认为公共数据除了包含政务数据,还包括与民生息息相关的医疗数据、交通数据及电力数据、与经济相关的交易数据等,26从而在公共利益、公共资源等广义层面讨论公共数据。27
数据作为信息时代的重要资源,其管理最先始于政府为推动政务系统、提升治理水平的信息资源共享,逐渐发展到开发利用数据资源的政务数据开放,之后是强调数据安全的数据管理,再是建设数字政府、数字经济、数字社会的数据治理。局限于政府掌握的数据之“公共数据”概念已不再适应时代的发展,数据治理实践已然超出了政务数据的外延,“公共数据”应当被赋予更广范围的含义。观察公共数据立法进程中社会各主体对公共数据概念之认识,以“浙江省公共数据条例”立法的前期调研为例,被调研的政府机关、企业或个体提出了各自的实践观点:有政府部门认为“行政机关履行职权过程中采集到的所有数据都属于公共数据,但与民众个人隐私、国家安全等相关的信息不能纳入公共数据”“与医疗相关的公立医院、民营医院、药店等相关企业数据或许也有必要纳入公共数据”“人大、政协、法院、检察院、纪委、监委、行政机关等国家机关在依法履职过程中获取的数据是公共数据”等;部分大型国有企业则认为“通信数据与个人隐私紧密相连,只需依法报送或调取数据,不宜直接被纳入公共数据”“公用企事业单位的企业细节数据纳入公共数据或许会影响企业发展”等;部分社会企业认为“政府机关、国有企业、事业单位等获取的有关公益的数据都属于公共数据。社会企业加工处理后的数据可能具有公共价值,从而具有公共属性,也有曾服务于政府决策的情形。但不应过于约束与公共利益相关的企业数据,考虑企业控制的数据与公共数据的关系时要兼顾大数据产业的发展和数据安全”“公共数据的含义界定应当从两方面考虑:公共利益角度,把与公共利益相关的所有数据都作为公共数据;公权力角度,把公权力部门履职相关的数据作为公共数据”等。28
由此观之,数据治理的实践已然突破传统政务数据的范畴,其他主体所控制的数据在操作和意识上都已有被纳入公共数据的情形。在公共数据概念得到了学理研究的进一步丰富和完善后,立法者也开始参照政府信息、政务信息、政府数据、政务数据等先有成熟概念,逐渐发展公共数据的内涵与外延。需要注意的是,虽然社会各界都在探讨数据治理主体的多元化,但从数据治理实践来看,公共数据的共享、开放的主体仍旧是政府,而利用则依赖政府行为,公共数据立法的安全保障责任也更多置于政府身上。因此数据的治理,亦或公共数据的治理,仍旧以政府为主要治理主体,以政府对数据采集、共享、开放、利用、安全等的管理为主要内容。从公共数据现行立法来看,由于地方政府规章的层级局限性,大多以政务数据划定公共数据范围。但也有一些规章制定者尝试以“参照适用”的方式,将其他主体控制的数据纳入公共数据的外延之中,如《吉林省公共数据和一网通办管理办法(试行)》第3、51、52条之规定。法规制定者则直接突破数据控制者为政务部门的限制,除了《吉林省促进大数据发展应用条例》(以下简称《吉林省大数据条例》)依旧以“行政机关与法律法规授权组织在依法履行职责过程中,采集或者产生的各类数据资源”(同于一般政务数据)界定公共数据外,其他地方性法规确定的公共数据范围相较于政务数据,明显拓宽。
概述之,立法对公共数据概念的界定将直接划定政府管理数据的范围,影响数据所蕴含利益的流转。立法者前期更加倾向于将公共数据界定在政府可以管控的范围内,但随着释放数据红利的需求,社会发展与数据关联度进一步增加;政府治理能力对数据依赖程度的提升,使得数据治理的范围拓宽;伴随着学者对公共数据概念研究的深入和完善,立法确定的公共数据内涵也逐渐发生变化,公共数据的规范含义扩张成为当前立法的趋势。由此观之,政府数据治理实践所形成的社会环境与建设数字经济、数字社会、数字政府的需求作为外部影响因素,与数据资源的重要程度与学理研究的推动效用作为内部影响因素,成为立法上公共数据概念形成和嬗变的双重动因。
三、回应立法者意图的公共数据三要素体系
从界定公共数据概念的法律条文来看,其法律含义延续了政府信息、政务信息、政府数据、政务数据的界定方式,表现为,公共数据是“特定主体+特定目的+特定行为”获得的数据资源,即通过目的要素、主体要素和行为要素划定公共数据的内涵与外延。但立法者对究竟包含一个或多个要素、各个要素的范围如何厘定等问题的理解并不一致。公共数据概念的确定应当根据其产生环境、实践需求等作出统一的认定,立法应当对公共数据三要素作出更加充分的考量,从而划定公共数据治理的边界,为立法提供指引,实现数据良善之治。
(一)目的要素的共识与辨析
立法是一种法律规范与生活事实的轨迹,一种当为与存在对应、同化的过程。29公共数据概念的界定应当从数据治理实践中汲取其核心意义,并应当具有包容性,从而能够应对实践的发展,能成为代表特殊与普遍、事实与规范的构造物。公共数据的目的要素在现行法规范中主要体现为“履行职责”“提供公共服务过程”“生产经营活动”等。“履行职责”在过去一直是政府信息、政务信息、政府数据、政务数据等概念界定中唯一的目的要素。然而随着行政任务的多元化,单以履行法定职责划定目的要素范围明显过小,公共数据概念的界定也逐渐突破职权履行的要求。就现行有效的规定来看,《贵州省大数据发展应用促进条例》(以下简称《贵州省大数据条例》)《银川市智慧城市建设促进条例》(以下简称《银川智慧城市条例》)《吉林省大数据条例》《河北省信息条例》《安徽省大数据条例》《上海市公共数据开放暂行办法》(以下简称《上海公共数据开放办法》)等仅以“履行职责”限定公共数据的目的要素;而《浙江省数字经济条例》《深圳数据条例》《济南市公共数据管理办法》等则认为目的因素应包括“履行职责与提供公共服务”;《南宁市公共数据开放管理办法》认为目的要素要求的职权应当是“依法履职与生产经营活动”。从公共数据的来源看,目的要素与行为要素一起划定数据的产生环境,目的要素同时也限定了行为要素。
聚焦《深圳数据条例》的制定过程,从两次征求意见稿与最终通过版本的比较来看,公共数据立法实践也在随着数据治理实践的变动不断修正条文表述。2020年7月推出的第一次征求意見稿规定公共数据是“行政机关及授权组织+公共企事业单位”为履行职责或提供公共管理和服务过程中收集和产生的各类数据;2021年6月推出的第二次征求意见稿则修改为“国家机关及授权组织+提供公共服务的组织”为履行公共管理与服务职责产生、处理的各类数据;最终通过的版本则延续了第二稿的界定,只是将“为履行公共管理与服务职责”的表述修改为“履行公共管理职责与提供公共服务”。条文表述的变动与修改实际上扩大了公共数据的范围,试图将更多的数据纳入公共数据以促进公共管理与服务目标的实现。这种不断放大的公共数据内涵,也同样体现在学理研究上,同时与国家倡导发挥数据红利的要求相贴合。“公共管理与服务”目标具体表现在立法目的之中,在“政务数据”的专门立法中,立法目的更多强调“规范数据使用、促进资源共享、提升政府治理能力”。而在“公共数据”的立法阶段,立法目的则从“规范数据使用、促进资源共享开放、提升政府治理能力”,转向“规范数据使用、促进数据资源的开发利用、提升政府治理能力(数字政府)、推动数字经济、数字社会发展”。
立法目的揭示了公共数据是一种具有公共性的资源,目的乃是为了社会公益;同时,其变化也展现出时代发展中数据资源重要性的不断提升。公共数据不再只是被政府使用的资源,而是一种需要不断加快流动、加快开发利用,从而为社会整体发展提供助力的生产要素。从政府治理实践来看,层出不穷的公共安全事件往往涉及大范围的数据,政府及时高效的能动性离不开国家机关、公共企事业单位,甚至是社会主体掌握的数据的支撑;数据治理目标的实现必然需要整体具有“公共性”的数据作为核心动力。作为源自计算机技术的技术型概念,数据处理一定会随着技术的进步而变化并对社会产生不同的影响,数据治理实践与立法联合创制的公共数据概念应当从法律规范的目标出发进行界定。公共数据之所以能促进公共管理与服务,究其根本在于“公共性”。“公共性”使得公共数据被治理现代化所需要,同时又为数据控制者划定了利用的界限。需要注意的是,我们所说的“公共性”并非指向数据主体的公私属性,也非数据的公用或私用,而是指数据包含信息内容是否涉及公共利益。
作为政治学、法学与经济学等学科中的常用概念,公共利益的具体含义却未有统一的认识。30从我国当前立法来看,诸多法律选择使用“社会公共利益”概念,并将其与国家利益、他人合法权益并列,如《数据安全法》《粮食流通管理条例》等;《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》还将其与群体利益并列。司法实务与理论界对公共利益的含义探讨颇多,一般认为,公共利益是指不特定社会成员的利益。但对于成员的范围,有人认为公共利益是指人们的共同利益,包括每一个公民的自身利益31;也有人认为公共利益不可能涵盖社会所有人的利益,而是指不特定多数社会成员的利益32。鉴于公共数据支撑公共管理与服务的面向,公共数据中的“公共性”应当作广义理解,即数据的内容将关系不特定多数人的利益,包括国家利益。至于国家秘密、个人隐私、商业秘密等,只是公共数据所含信息内容的分类,并非划定概念需要厘清的前提。依此,党务数据虽具有特殊性,但其本身也具备公共性;将党务数据排除在外,难以实现党对数字化改革的全面领导,有必要将其纳入公共数据的范畴。
(二)主体要素的分歧与取舍
公共数据的主体要素在现行规范中有五个表现:一是限于“政务部门”,即政府部门及具有公共管理职能的事业单位和社会组织,吉林省人大、浙江省政府、上海市政府、成都市政府、南宁市政府即采用此种主体界定。对于公共企事业单位的数据资源管理是否适用公共数据资源管理的规定,《浙江省公共数据开放办法》要求的“参照适用”替换了《浙江省公共数据管理办法》要求的“适用”,上海市、成都市则继续沿袭“适用”;二是国家机关与法律法规规章授权的具有管理公共事务职能的组织,《浙江省数字经济条例》采此规定;三是“政务部门”+“公共服务企事业单位”,即增加供水、供电、供气、供暖、公共交通、运输、通信、教育、医疗、康养、邮政和其他承担公共服务职能的企事业单位,河北省人大与济南市政府即采此规定;四是“公共机构”+“公共服务企事业单位”,即包含全部或者部分使用财政性资金的国家机关、事业单位和团体组织与提供公共服务的供水、供电、燃气、通信、民航、铁路、道路客运等企业,安徽省人大、贵州省人大、银川市人大采此规定;五是国家机关、事业单位和其他依法管理公共事务的组织,以及提供教育、卫生健康、社会福利、供水、供电、供气、环境保护、公共交通和其他公共服务的组织,《深圳数据条例》采此规定。主体要素是当前界定公共数据中最多考虑的要素,其核心在于:是否只限于政务数据概念中的行政机关与具有行政管理职能的组织?需不需要考虑包含人大、政协、监察委、检察院、法院等国家机关,以及提供公共服务的国有企事业单位,甚至進一步囊括社会企业?
界定公共数据主体要素的目的是划定范围,将之与非公共数据区分开来。那么公共数据与非公共数据究竟如何区分?在公共数据的常见分类中,基于欧盟的经验,从主体层面可将数据分为个人数据、企业数据和政府数据,其中“政府数据包含政府收集、储存和处理的数据,包括信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等领域的公共数据,也包括涉及军事、外交、国防领域、国家安全的秘密数据”33。由于实践中一个数据集可能包含上述多种类型的数据,不同的数据类型之间经常交叉和转化,此种分类与实践并不相符。有学者根据掌握数据的主体不同,将数据分为个人数据、企业数据、国家数据与公共数据。34也有学者根据主体作出不同的分类:公共数据、科学数据、商业数据和个人数据。35数据产权的界定近年来成为法学研究的高热领域,有学者从数据的产权及持有角度,将数据类型分为个人数据、企业数据、政府数据及公共数据。36然而由于个人、企业、国家与公共数据之间并不存在静态的绝对壁垒,数据所包含信息的相互流动实际上很难仅根据主体去判断某一种数据究竟属于其中哪一类。
虽然依据主体划分数据种类有利于确定权利主体,然而此种方式与公共数据治理的目标却并不相合。选用公共数据概念的目的并非厘清数据权利、划定各方利益范围,而是在促进数据流动、发挥数据资源的要素作用的同时助力社会治理能力的提升。将公共数据与个人数据、企业数据、国家数据等同于非此即彼的关系,将引起数据类别认定的混乱。如有学者认为“公共数据是由零散的个人数据聚合而成”37,也有学者认为“个人数据与公共数据是相对的概念”38。纳入公共数据的其他种类数据并非意味着原数据控制者将失去控制的地位,而是影响数据的管理。因此,公共数据与个人数据、企业数据、国家数据并非同一层次的概念分类。相对于“公共数据”的,是“非公共数据”,不论何种主体控制的数据,只要能促进公共管理与服务目标的实现,具有“公共性”,都可以纳入公共数据的讨论范畴。
根据《国务院关于印发促进大数据发展行动纲要的通知》的规定,推动公共数据资源的开放应当通过政务数据公开共享,引导企业、行业协会、科研机构、社会组织等主动采集并开放数据。公共数据资源的开放主体呈现出多元倾向,不再限定为政务数据概念范畴之内的“政务部门”,包含了社会各个主体。从实践中政府获取公共数据资源的来源看,可分为两部分:一是公共部门,包括政府和具有公共性质的事业单位、国有企业获得的海量数据;二是互联网行业的民营企业、跨国公司、媒体平台在日常运营中获取的海量数据。39与政务数据的数据管理主体与来源主体都为政务部门不同,虽公共数据的管理主体因公共数据汇聚到统一数据平台而限定为政府,但公共数据的来源主体包含了国家机关、企业、社会组织等。二者一并控制着公共数据:管理主体因数据被纳入公共数据而获取数据控制者地位,而来源主体作为天然的数据控制者,其对数据的控制将会因数据被纳入公共数据而受限。公共数据的主体要素强调对数据的掌握,对应的概念为数据的控制者,其范围划定以“是否从事公共管理与服务”为指引,进而可区分为依法具有公共管理与服务职能(委托亦属依法)、实际从事公共服务(具有公共服务的能力)、仅从事私人事务三种情形。根据现行规范与现有理论,从公共数据治理的目标出发,公共数据的界定是为了更好地治理公共数据,以实现公共管理与服务的目标,公共数据的主体要素应当指实际从事公共服务(具有公共服务的能力)的主体。立法中公共数据的主体要素可从三个层次进行考虑:一是从公共管理服务职能出发,即国家机关、具有公共事务管理职能的企事业单位、社会团体为履行职责所控制的数据;二是指公共机构(全部或者部分使用财政性资金的国家机关、事业单位和团体组织)在提供公共服务过程中所控制的数据;三是社会其他主体所控制的与公共利益密切相关的数据。
(三)行为要素的厘清与划界
公共数据的行为要素在现行规范中将根据条文使用的词汇划定公共数据的范围。“政务数据”的概念中大多使用“制作或获取”作为行为要素,仅有《福建省政务数据管理办法》别具一格选择将“通过特许经营、购买服务等方式开展信息化建设和应用所产生的”与“采集和获取”并列,但对于具体获取的对象、方式、渠道等未作限制。对公共数据进行界定的条文中,最多使用的依旧是“制作或获取”,如《河北省信息条例》;抑或使用与此含义类似的“制作或收集”“采集或产生”等,如《安徽省大数据条例》《吉林省大数据条例》;而《浙江省数字经济条例》仅使用了“获取”一词。“获取”仅能表达从别处获得或者作出某行为得到,并不能完全包含“制作与产生”之义,自然沉淀的数据或被排除在外。《贵州省大数据条例》则新增了“使用”一词,将非因目的要素产生、获取的数据部分包含进来;《深圳数据条例》使用了“产生、处理”,并明晰数据处理的含义为“数据的收集、存储、使用、加工、传输、提供、开放等活动”。相较于其他规范条文,深圳市人大常委会试图将数据治理的相关行为都纳入行为要素当中,拓宽公共数据的外延。法规范皆未选择“占有”一词。究其缘由,或许除了“占有”自身具有民法意义外,更多表现的是一种状态,而并非一种行为,立法者更倾向于通过外感知性更强的行为来界定公共数据。
综合来看,法规范中界定公共数据的主体要素、目的要素和行为要素都应当与“公共管理与服务”的目标相贴合。承继于目标的目的要素应以“履行职责”为核心,综合考量纳入其他与此相合的“提供公共服务”。因此实践与理论中“履行职责与提供公共服务”实际都可纳入公共管理与服务的含义之内,而追求自我利益实现的“生产经营活动”则过于宽泛,超出了该含义。对于限定主体行为的行为要素而言,因其只需体现在公共管理与服务过程中所为之合法行为,使得数据处于行为者的控制之下,故行为要素無需作过多限制,只需选择一个适宜的法学概念标识行为即可。根据《数据安全法》的规定,相对于数据安全的规范用词是“数据处理”40,对此,或可选取“处理”以包含数据的收集、存储、使用、加工、传输、提供、开放等活动。
四、三要素在公共数据立法中的安排
数据作为一种生产要素,只有在社会中流通才能发挥其公共价值。“如果要形成足够大、满足各种使用目的的数据集,各个主体必须利用他人掌握的数据同时也要让他人利用自己的资源,即实现数据的社会化利用”。41数据控制者在公共数据的治理中处于核心地位,受限于治理技术,将所有公共数据进行等同化管理并不符合数据治理。因此,在数据立法体系搭建之初,公共数据立法应当以发挥数据红利、提升政府治理能力、推动数字经济与数字社会发展为立法目的,依据数据控制者划分公共数据种类,选定符合时代发展的立法适用对象,进行特殊的机制设计。
(一)选定符合时代发展的适用对象
立法具有滞后性,公共数据以“公共利益”为判断标准,实际上使得公共数据的范围具有一定的时代发展性。公共利益属于不确定法律概念,其内涵在现行立法中一直处于不断变动的状态,在不同的规范中存在差异化的表述。因此,界定公共数据,需要把公共利益与具体的业务场景、案件事实等紧密地联系起来,在具体个案中作出明确而详细的阐述。数据作为一种生产要素,在其权属界定尚不清晰,数据法律体系处于初步探索的阶段,公共利益概念的模糊性,可以为公共数据概念的适用提供广泛的适应性。
立法要面向未来,又要立足当下。信息流动是信息社会的命脉,法学研究要转变传统的法律思维模式,42科技立法同样也要转换传统的立法进路。考虑到除政府、法院、检察院外,其他国家机关的数字化治理,大多处在起步阶段,公共数据的治理在未来很长一段时间内都将由政府主导(近年来各地政府相继成立专门的数据管理部门),公共数据的流动主要依赖政府平台。而公共数据所涉数据控制主体不仅包括政府,还囊括人大、政协、监察、公检法等国家机关,供水、供电等公共企事业单位,提供公共服务的社会组织、私营企业等,甚至还将包含党务机关。43考虑到数据安全,部分国家机关可能并不愿意将自己控制的数据交由统一平台管理;若直接将具有公共性的企业数据界定为公共数据,还可能会引发产业界的数据权属质疑。立足于当前的数据治理实践,过于宽泛的公共数据范围,并不一定能实现立法原初的宗旨。
此外,公共数据立法尚未厘清概念界定与机制设计之间的关系,公共数据在不同法案中被赋予不同的含义,导致法律系统内部概念的不协调。而某一数据一旦被认定为公共数据,数据控制者将产生诸多法律责任,如《深圳数据条例》第38条要求“公共管理和服务机构应当按照有关规定保存公共数据处理的过程记录”、第41条“共享为原则,不共享为例外”、第46条“最大限度开放”等规定。作为公共数据治理的基础设施,政府建设的公共数据统一平台的搭建,以及如何基于平台汇聚、管理政府以外其他国家机关数据、党务数据、企业所控制的数据等特殊类型的数据都需要一定的时间予以尝试和完善。由此,立法需要做的不仅仅是在某部法案中界定一个恰当的公共数据概念,还应根据立法需求在公共数据概念范围内选定规范适用对象的范围,即在明晰公共数据概念的三要素的内涵后,立法者在制定公共数据法规范时,应当考虑实践情况,平衡各方利益关系,通过特殊的立法机制设计综合选定符合时代发展的适用对象,采用合适的概念界定体例。
(二)适用数据控制者分层纳入的条文安排
当前虽仍有立法文本以政务数据划定公共数据范围,但实践中使用公共数据的主体已经超出狭义的行政部门范畴,包含了来自党委、政协、人大、交通、水利等其他国家机关和公共服务单位。根据数据治理实践的不同,结合主体要素的三层次表现,数据控制者可表现为五个方面:(1)各级行政机关以及具有公共管理和服务职能的事业单位,作为依法履行公共管理职责的主体,其所控制的数据属于第一层次的公共数据;(2)人大、政协、监察、公检法等国家机关行使国家权力、履行公共职责,运行经费同样来自于财政性资金,其所控制的数据属于第一层次的公共数据,系第一层次的公共数据;(3)公用事业运营单位(如供水、供电、燃气、通信、民航、铁路、道路客运等)运营基础性公共资源、提供公共物品,具有非营利性、非排他性等特点,其所控制的数据系第二层次的公共数据;(4)公共服务企事业单位(如提供教育、卫生健康、社会福利、环境保护等公共服务)本身具有公益性质机构的数据为公共服务所需要,涉及公共利益,系第二层次的公共数据;(5)信息时代大型数字企业掌握了许多关乎公共利益的基础数据,系第三层次的公共数据。
在理论层面,三层次的数据控制者皆可纳入公共数据主体要素的考虑范畴,放入同一个法条中予以规范。然而学理是愿景式的,立法则需要在当前实践与未来发展之间衡量,择定符合当下的规范体例。从前期立法实践来看,政务数据法律规范体系中仅包含第一层次中行政机关以及具有公共管理和服务职能的事业单位所控制的公共数据,但考虑到对公用事业运营单位、公检法、党委政协等主体所控制数据的需求,通过在附则中设计“参照适用”条款纳入其他主体所控制的数据,如《湖北省政务数据管理办法》规定“水务、电力、燃气、通信、公共交通、民航、铁路等公用事业运营单位涉及公共属性的数据资源的应用与管理,参照适用”44。在公共数据的专门立法中,当前浙江省、上海市、成都市等大多数政府规章沿用了政务数据的规则设计45,但济南市采取了在界定公共数据之时将主体扩张至“供水、供电等承担公共服务职能的企事业单位”46。而在地方性法规对公共数据的界定中,涉及公共数据界定的浙江省、贵州省、安徽省、河北省、深圳市、银川市等六部地方性法规都已突破政务数据的范畴,将第一、第二层次的公共数据纳入规定之中。
由此来看,立法者已然意识到公共数据主体要素的三层次需要不同的条文设计,需要作出特殊的机制安排,从而实现主体要素之间动态的平衡。立足于数据治理实践,拙见以为公共数据立法应对适用对象做分层处理,采用“总则”与“附则”联合规定的形式:以第一层次和第二层次的数据为主体在总则中加以规定,如“本法所称公共数据,是指国家机关等受财政性资金保障的机关和单位、公用事业运营单位在履行职责和提供公共服务过程中控制的涉及公共属性的各类数据资源”;在附则中规定第三层次数据予以“参照适用”,为其他社会主体掌握的公共数据进入规范范围内预留融入空间,如“其他社会主体控制的对社会公共利益有重大影响的数据,参照适用本条例。法律、行政法规另有规定的,从其规定”。
(三)嵌入特殊类型数据的配套机制
立法应当以公共管理与服务为目标,以实现公共利益为中心价值,并以三要素为核心内容框定公共数据的范围。但公共数据的三要素可能引发不同的数据规范机制,如不同主体控制的公共数据将会因数据所含内容涉及个人隐私、商业秘密、国家安全等差异化内容,从而受到个人信息保护、国家安全等相关专门法律的限制。尽管公共数据概念包含了主体要素中的三个层次,可是并不意味着纳入公共数据治理范围的所有数据都应当适用相同的规则设计。倘若要将党务数据、企业数据等特殊类型的数据归入公共数据,就需要在立法规范中设计特殊的机制,量身打造相应的规范框架。
1.党务数据的特殊共享开放机制
公共数据治理应当坚持党的全面领导,并把党的领导贯穿到收集、共享、开放、利用、安全等各个环节,同时注重划类而治。将党务数据纳入公共数据,不仅有利于实现国家治理能力现代化、提升政府公共服务和公共决策水平、推进社会治理精细化,还利于“反腐倡廉、提升党执政能力、保障个人信息安全”47。当党务数据、政务数据等归集到一体化、智能化公共数据平台上,数据自身的属性将影响后续的共享和开放。因此,除涉及国家秘密、个人隐私的数据应当遵循相关法律、行政法规的规定共享和开放外,建议公共数据立法应当区分党务数据与政务数据,设计特殊的共享开放机制:
第一,共享机制设计上,对于政务部门的数据,应当以共享为原则,不共享为例外(不共享应当依法说明理由)。但对于党务数据,内部共享应当实行双轨制,即以社会管理为对象的党务数据仍以共享为原则,以组织内部工作为对象的党务数据,则应赋予党委机关更多的裁量权限,由其根据实际情况决定是否共享(或可考虑党内法规作为不共享的依据)。
第二,开放机制设计上,公共数据开放属性分为禁止开放类、受限开放类、无条件开放类。在遵循分类分级开放的要求下,党务数据分类分级的标准应当根据党务工作的特殊性做更为严格的认定。如党委宣传部门对敏感词的判断与把握,就不能等同于新闻出版部门的许可审查标准;党委组织部的人才信息,也不能简单视为政务部门的人事信息。
需要注意的是,虽然从学理和愿景上希冀以公共利益界定公共数据,但立法需要考虑到机构能力、社会接受度等现实基础。鉴于除政府以外的党委机关、部分国家机关,在数字化改革的基础设施、内部共享、外部开放等环节尚处在起步阶段,一刀切公共数据的管理要求可能存在落地困难。因此,公共数据立法若确定将党务数据纳入其中,或许可通过附则以参照适用条款单独规定党务数据。48
2.第三层次公共数据的补偿机制设计
2020年中央明确指出要加快培育数据要素市场,推进政府数据开放共享,提升社会数据资源价值。为提升数据综合治理能力,有必要授权政府获取上述社会数据,通过多源数据融合分析,满足经济社会治理需求。“国家作为公共数据的主要监督者和使用者,负有实现公共数据价值的责任。”49社会数据的整合和利用将成为加强数据资源整合和提升政府治理能力的重要一环。社会数据主要表现为企业所控制的数据,而企业所控制的与公共利益密切相关的数据属于第三层次的公共数据。由于公共数据兼具非竞争性与非排他性,当某些企业数据被纳入公共数据范畴,其法律保护也当做新的考量。数据作为附着了社会关系的生产要素,投射了各方主体对数据的权益,虽然其权属问题被视为数据资产化、数据交易的前提性问题,但就当前来看,以财产权为核心的数据权利仍难以定位到某一主体上。“公共数据应当确立法律保护,但不宜采取财产权路径,根据其性质适于采取管理化路径。”50纳入公共数据的企业数据将被汇聚至统一数据平台,这虽并不意味着企业数据转为国有资产属性,但实际效果上会影响甚至限制企业数据的使用,从而影响企业对数据资源的利用。考虑到企业在数据采集、处理过程中付出的成本,应当对企业数据的“公共使用”设计合理的补偿机制,并区分以下情形:
(1)应急状态的补偿机制应增强企业的社会责任。政府在判定是否将企业数据纳入公共数据外延时,除了应当严格遵守“与公共利益密切相关”的标准外,还要进一步判断国家或特定地域是否进入应急状态。在應急状态下,政府需要迅速反应,在最短的时间内调动各种资源以满足应急防控需求。此时企业的社会责任面向增强,数据的“公共性”更加突出,“参照适用”的辐射范围应适当予以拓宽,辐射更广的企业数据。考虑到应急措施的社会公益性、紧迫性、临时性,必然蕴含着公权力对私权利在紧急时期进行权利克减来达到维护总体利益的目的,企业财产权的实现需要合理限制,此时可以考虑适当降低补偿标准。
(2)非應急状态需要综合数据规模与使用方式等具体应用场景来建构补偿机制。当需要高频次或大范围地调用企业数据时,考虑到数据承载着企业人力物力的投入,“公共使用”意味着限制,甚至剥夺企业赖以生存的竞争资源,此时的补偿标准需充分考虑数据规模对应的市场价值。此外,数据的“公共使用”方式也将影响企业的义务内容,如要求企业提供源数据和仅提供“数据沙箱”处理后的结果、常态化提供和偶发性提供、数据处理结果是否向公众公开等。建议立法时区分企业数据资产、运营维护成本等的受影响程度,并结合数据质量(数据的清洁度、颗粒度等)、企业性质(国有独资企业、国有合资企业、私营企业) 等因素,对企业数据适用不同的补偿标准,具体操作上可部分参考企业间数据交易的对价机制。
五、结语:开放包容的数字立法理念
数据立法属前沿科技立法领域,需要有一个开放包容的立法理念,以更好应对技术日新月异之发展。公共数据概念自身的不确定性使得其可根据时代发展被赋予不同的内涵,从而弥补立法的滞后性,以公共数据为核心概念的数据立法相较于传统政务数据立法更具包容性和开放性。公共数据规则体系的建设应当与我国市场定位和发展趋势相匹配,以重塑国家在信息时代的竞争优势、构建数据强国,推进我国治理能力提升、数据产业体系成型为目标,达至以数字法治推动数字政府、数字经济、数字社会的进一步发展。就当前公共数据立法实践来看,立法者与学者虽然依然意识到公共数据概念界定的重要性,然公共数据内涵的研究还不够深入和系统,对于公共数据的认识定位却并未达致统一,对公共数据治理与公共服务之间的关系缺乏广泛而全面的研判,致使公共数据立法缺乏行之有效的理论指导。基于此,文章以规范文本分析为中心,结合公共数据治理实践,探索以公共数据的目的要素、主体要素、行为要素厘清公共数据的内涵与外延,并尝试立足当下实践对公共数据概念体系的相关规则设计作出思考,希冀为如火如荼进行的公共数据立法提供一点思路。
Abstract: China's central legislation has not defined the concept of public data. The successive local legislation mainly defines public data through subject elements, purpose elements and behavior elements. But local legislation standards are not consistent. For the legislative intent, the concept of public data as a technical concept, should be based upon "public interest" and be designated the extension within the goal of public management and service. The theoretical understanding of the concept of public data is not directly the same as the applicable object of public data legislation. According to the stage of public data legislation, legislators should design multiple legislative mechanisms to create corresponding normative frameworks for different types of public data.