论有偿使用制度推动公共数据开放发展
2023-07-29刘语,曾燕
刘 语,曾 燕
中山大学 岭南学院,广东 广州 510275
随着数字经济发展,数据日益成为国家战略性资源。政府在提供公共服务和政府治理的过程中会产生大量关键性和基础性的公共数据,这些公共数据蕴含巨大的社会价值和商业价值。在保障国家安全、商业机密和个人隐私的前提下,充分有效地利用公共数据,有利于激发创新活力,推动数字经济发展。例如,黄益平等[1]指出,公共数据开放可以降低数据要素获取成本,提高数据要素使用率。同时,公共数据开放还能够提升数字政府治理能力,促进数字经济发展[2]61-63。
中国当前公共数据开放发展迅速,部分地区成果显著。截至2021年底,中国已有80.65%的省份和51.30%的城市(1)包含直辖市、副省级与地级行政区。上线了政府数据开放平台,覆盖范围和深度都有所发展(2)参见《中国政府开放数据利用研究报告(2022)》,http://imd.ccnu.edu.cn/info/1046/12620.htm。。截至2020年底,全国各地方政府数据开放平台开放的有效数据集有98 558个,2017—2020年增长超10倍。部分地区公共数据开放取得了显著成果,例如,北京市政务数据资源网提供了超过100个部门的10 000个数据集,包含44万个数据项和57.10亿条数据。
虽然中国公共数据开放取得了长足发展,但是仍旧存在诸多问题,更重要的是阻碍中国公共数据开放发展的主要因素并未得到详尽分析和准确认知。现有文献大多仅分析了中国公共数据开放面临的问题,仅有少量文献分析了阻碍其发展的因素[3-4]。然而,这些因素并不能全面地解释中国公共数据开放的现状和面临的问题。无法准确判断阻碍发展的主要因素,就难以解决真正的核心问题,依据其提出的政策甚至可能会对后续发展形成阻碍。因此,只有准确认识阻碍中国公共数据开放发展的主要因素,才能提出具有针对性的政策建议,从而有效地推动中国公共数据开放发展。
本文基于发展视角,将公共数据开放视作一个发展变化的过程,更详尽地分析影响其发展的各因素之间相互影响和相互制约的关系,具有理论和实践两方面意义。在理论方面,为研究公共数据开放提供了一种新视角。现有文献更多关注中国公共数据开放发展现状和外部影响因素,本文对公共数据开放发展整体进行了更为全面和准确的分析,运用辩证法对影响公共数据开放发展的因素进行了梳理,找出阻碍中国公共数据开放的主要因素。在实践方面,本文不仅考虑到当前公共数据发展现状,还考虑了政策在后续阶段对公共数据开放发展的影响。
一、公共数据开放的定义、现状和问题
(一)公共数据开放的定义和特点
公共数据和政府数据、政务数据等相关概念区分模糊,时常被混用[5],且缺乏明确的、公认的定义。现有文献对公共数据概念存在三种不同的定义[6]:第一,政府机构在公共治理过程中收集的数据;第二,政府和具有公共管理服务职能的事业单位在公共治理和提供公共服务过程中收集的数据;第三,对社会大众或集体产生影响的数据,包含政府机构、事业单位、企业和个人收集的数据。前两种理解是从数据采集和归属的角度对公共数据进行定义,而后一种则是从数据用途和数据影响的角度对公共数据进行定义。本文主要内容为公共数据开放,被开放数据的所有权均归属政府和事业单位所有。因此,参考《上海市公共数据和一网通办管理办法》,本文采用第二种定义,即“公共数据为政府机关和事业单位在政府治理和提供公共服务过程中,采集和产生的各类数据资源”。
公共数据开放主要有两方面特点。一方面,公共数据的所有者是政府机关或事业单位。相比于企业和个人,政府机关和事业单位需要承担更多的社会责任,在决策上应更多考虑社会福利,而非自身经济利益。但是,地方政府和事业单位的利益仍旧会影响其行为,从而影响公共数据开放相关政策的落实情况。另一方面,公共数据具有公共属性,这决定了公共数据开放是非排他性的。公共数据具有准公共产品的特点,因此政府可以设定公共数据开放标准,但是不能单独限定某一企业或个体使用或不能使用公共数据。
(二)国际公共数据开放现状
公共数据开放已成为全球重要国家提升国家竞争力的引擎,全球重要国家均在推动自身公共数据开放。本文选择最具代表性的美国公共数据开放作为国际公共数据开放典型案例进行介绍。美国公共数据开放现状可以总结为以下三个方面:
第一,美国公共数据开放起步早,政策和法律体系完善。美国于2009年开始逐步推动公共数据开放,成为公共数据开放的领先者。2009年1月,美国政府发布《透明开放政府备忘录》,提出建立透明、开放、合作政府。同年5月,美国政府数据开放网站上线,要求各部门在60天内公布开放政府计划,并把首批开放数据上传到网站上。2013年,美国通过《政府信息公开和机器可读行政命令》确立了公共数据开放的基础框架。该命令确认了在无其他规定情况下,默认政府信息和数据资源应当处于开放和可机读的状态。2019年,美国通过《开放政府数据法》,建立了公共数据的质量反馈和评估体系,进一步强调对公共数据的质量管理。美国政府制定了元数据质量评估体系,开发了“仪表板”系统(PODD),评估和监测各联邦机构数据开放工作执行情况。同时,美国政府定期发起调查,举办数据圆桌会议,邀请数据应用企业和机构,调查本国数据使用需求,并评估开放成效。政府部门也定期收集使用反馈,完善数据开放平台的功能和数据资源[7]。这些政策和法律构成了美国相对完善的公共数据开放体系。
第二,美国公共数据开放数据量大、数据可利用性强,取得了显著成果。美国政府数据开放网站具有数据量大、主题丰富、检索方便等一系列特点,是美国最大的公共数据开放平台。截至2022年9月,该平台上一共有335 221个数据集,并提供了不同类型的数据和不同接口以便于使用。除此之外,美国商务部、统计局等部门的公共数据平台也相对成熟。这些平台的数据丰富、数据可利用性高,对美国社会治理和经济创新提供了巨大动力。
第三,虽然美国公共数据开放起步早,成果丰硕,但是其发展仍旧面临一些问题。其中的主要问题是美国地方政府公共数据开放平台发展缓慢,导致地方数据缺失。截至2022年11月,美国50个州中仅有18个州建设了统一的公共数据开放平台。在美国政府数据开放网站上,虽然有40个州公布了数据集,但是大部分仅提供了政策文件或地理数据,并未提供州一级的详细数据。
(三)中国公共数据开放现状
相比于美国公共数据开放,中国公共数据开放起步较晚,其主要发展现状可以总结为以下两点:
第一,陆续出台公共数据开放相关政策,政策法规逐步完善。2015年7月1日,国务院办公厅印发《关于运用大数据加强对市场主体服务和监管的若干意见》,提出进一步加大政府信息公开和数据开放力度。2015年8月19日,国务院常务会议审议通过《关于促进大数据发展的行动纲要》,这是中国促进大数据发展的第一份具有顶层设计意义的纲领性文件。该文件要求“加快政府数据开放共享,推动资源整合,提升治理能力”。此后,《政务信息资源共享管理暂行办法》和《中华人民共和国数据安全法》等陆续出台,加强了公共数据开放领域的法律体系建设。2018年1月,中央网络安全和信息化委员会办公室、国家发展和改革委员会、工业和信息化部联合印发《公共信息资源开放试点工作方案》,确定北京市、上海市、浙江省、福建省、贵州省为公共信息资源开放试点地区。2021年6月,国务院办公厅发布《要素市场化配置综合改革试点总体方案》,提出“探索建立数据要素流通规则”要从四个方面展开,即完善公共数据开放共享机制、建立健全数据流通交易规则、拓展规范化数据开发利用场景和加强数据安全保护。
第二,中国公共数据开放发展速度快,部分地区取得了一定成果。随着中国各级政府逐步推动公共数据开放,已开放的公共数据成为中国当前最大规模、覆盖范围最广的数据分类。截至2020年,中国各地方政府开放的有效数据集总数为98 558个,2017—2020年间增长10倍(3)参见《2021年政务数据开放利用研究报告》。。截至2022年10月,中国已有208个地级及以上政府上线了数据开放平台或数据开放版块(4)参见《中国地方政府数据开放报告:省域指数(2022年度)》。。在能够计算数据容量的平台中,超过29个平台提供的数据容量超过1亿个(5)数据容量是指一个数据平台真正的数据总量,计算方法为平台的数据量(行数)乘以数据项(字段数),单位为“个”。,其平均数据容量接近20亿个(6)参见《中国政府开放数据利用研究报告(2022)》。。以深圳市为例,2021年政府数据开放平台官网浏览量超过9亿次,下载量接近1 500万次。
(四)中国公共数据开放面临的问题
虽然中国公共数据开放取得了一定成效,但是与美国公共数据开放现状相比,中国公共数据开放仍旧面临诸多问题。王晓冬[7]将中国公共数据开放工作面临的问题总结为数据质量不高、平台功能不完善和数据安全保障较弱。李涛[3]指出数据质量不高和平台功能不完善的主要原因是公共数据开放的局部性、随意性、差别性和杂乱性四个因素。国家信息中心发布的《政务数据开放利用指南(2021版)》中明确指出,中国政务数据存在数据质量问题、供需衔接问题和标准规范问题。综合相关文献,结合美国公共数据开放情况,本文将中国公共数据开放存在的问题总结为平台覆盖面不足、数据可利用性差和地区差异巨大三个方面。
第一,中国政府数据开放平台尚未完全覆盖,部分地区仍未建立数据开放平台。虽然中国近年来地级及以上的政府数据开放平台数量迅速增加,从2017年的20个增加到2022年的208个,但是平台整体覆盖率仍旧不高。《中国地方政府数据开放报告:省域指数(2022)》数据表明,经济相对发达省份的数据开放平台建设情况明显优于其他省份。西藏、云南、吉林和辽宁等省份数据开放平台建设情况明显低于其他省份,其中部分地区仍未建立数据开放平台。在同一省份内,地市级行政区的数据开放平台覆盖率远落后于省级和副省级行政区。截至2022年10月,中国74.07%的省级行政区、86.65%的副省级行政区都建设了数据开放平台,而地市级和县区级建设政府数据开放平台的比例仅有57%和15.5%。大部分的地市级平台仅存在于地方政府网站的政府栏目中,并未整合进入上级行政层级的专有式平台,导致公众难以获得行政层面更微观的数据。
第二,中国大部分政府数据开放平台的数据可用性较低,难以产生社会价值和商业价值。首先,部分政府数据开放平台提供的数据集较少。部分政府数据开放平台存在“有目录无数据”的情况,甚至部分数据开放平台仅提供新闻发布内容和政策解读,没有提供完整数据集。其次,政府数据开放平台提供的数据质量较差,缺乏利用价值。据《中国政府开放数据利用研究报告(2022)》显示,约有34.00%的地方政府数据开放平台数据更新频率为一年,只有4.65%的地方平台数据更新方式为一周。同时,部分数据集存在元数据缺失、数据可读性差等问题。例如,67.40%的政府数据开放平台未提供数据名称,90%以上未提供数据处理方式和数据集时间范围(7)参见《中国政府开放数据利用研究报告(2022)》。。这导致数据时效性差、使用障碍多,严重限制了数据价值的释放。再者,公共数据下载渠道缺失或单一,获取成本高。截至2021年,尚有诸多政府开放数据接口(API接口)数量为0,甚至有47个地区存在数据应用数为0的情况。仅有2.40%的地方平台提供了数据请求功能且公开了用户的数据请求,仍有37.80%的地方平台尚未允许用户提出数据请求。此外,政府数据开放平台提供的数据格式单一,不利于数据的开放和再利用,部分平台甚至无法保证数据集的开放格式,仅保证机器可读。很多平台需要注册登录后才能下载,部分数据需要经历复杂漫长的申请后才能获得下载权限。最后,政府数据平台孤岛现象严重,难以产生聚集效应。地方政府的部分数据统计口径和标准不一,严重影响了不同政府数据平台数据的流通和使用[3]。随着中国公共数据开放发展,地区性的数据标准逐渐统一,但是不同省份的数据标准仍旧存在差异。在主体分类、数据格式、元数据标准等方面各地均有不同标准和文件,这极大阻碍了数据之间的流通和整合。同时,不同平台之间缺乏联系和整合,用户收集和整理不同平台数据的成本较高。各地区政府数据开放平台独立运营,未能形成数据网络,严重影响了数据价值释放。
第三,中国不同地区数据开放平台发展水平差异极大。从政府数据开放平台的数量和覆盖情况看,中国各地区数据开放平台数量差距明显。截至2021年,中国华东地区(8)地区分类依据为中国地理七大分区,具体为华北地区(北京、天津、河北、山西、内蒙古)、华东地区(上海、江苏、浙江、山东、安徽、江西、福建、台湾)、东北地区(辽宁、吉林、黑龙江)、华中地区(湖南、湖北、河南)、华南地区(广东、广西、海南、香港、澳门)、西南地区(四川、重庆、贵州、云南、西藏)和西北地区(陕西、甘肃、新疆、青海、宁夏)。有245个政府数据开放平台,而东北和华中地区仅有30和47个,存在明显的地区差异。从数据集数量、质量、下载量等方面看,各地发展水平差距更为明显。例如,山东公共数据开放网的平台数据集为 146 231个,其中山东省省级数据集为949个,其他为所属地级的数据集。而河北省的政府数据开放平台数据集不足20个。在有明确提供数据浏览量和数据下载量的86个平台中,下载量最高为1 500万次,而漯河市、福建省和芜湖市的下载量为0。这些都充分说明各地区数据开放平台发展极不平衡。
二、辩证法视角下阻碍中国公共数据开放的主要因素
中国公共数据开放面临诸多问题,只有分析造成这些问题的根本原因,找到阻碍公共数据开放的主要因素,才能准确解决核心问题,切实推动中国公共数据开放发展。
(一)现有文献对阻碍中国公共数据开放因素的分析和研究
现有文献大多列举了中国公共数据开放的问题,但是较少尝试分析阻碍中国公共数据开放的因素。李涛[3]分析并指出公共数据质量不高和平台功能不完善的主要原因是公共数据开放的局部性、随意性、差别性和杂乱性。门理想等[4]基于公共价值(9)公共价值是公众对政府期望的合集[8]50。的视角,认为政府对公共价值的忽视是诸多问题产生的重要原因。他们将公共数据开放中公共价值分为两个维度:从公共数据开放中获取怎样的价值以及怎样获取价值。然而从实践来看,这两个维度都没有得到满足。一方面,公共数据的数据质量、开放维度都低于预期[7,9]。另一方面,公共数据的开放过程中未能重视其他市场参与者并形成市场规范[10]。
然而,上述因素并不能全面、有效地解释中国公共数据开放所面临的问题,因此可能并不是阻碍中国公共数据开放的主要因素。政府对公共价值的忽略确实会阻碍公共数据开放发展,导致公共数据可用性较低,但是难以解释政府数据平台覆盖不足和地方发展差异大的现象。公共数据开放局部性等因素更是如此。因此,这些因素客观上确实阻碍了中国公共数据发展,但是并非主要因素。
(二)基于辩证法分析主要因素
只有正确分析和认知阻碍中国公共数据开放的主要因素,才能对症下药提出有效的政策建议,从而真正推动公共数据开放,促进中国数字经济发展。结合中国和国际公共数据开放实践现状,地方政府对公共数据开放积极性不足是阻碍中国公共数据开放发展的主要因素。在发展视角下,本文将从三个方面进行论证:首先,地方政府积极性对公共数据开放起决定性作用;其次,地方政府积极性是影响公共数据开放发展的内因;最后,地方政府积极性不足能够全面、完整地解释中国公共数据开放发展的问题。
(1)地方政府是公共数据开放的主要参与者和推动者,地方政府积极性对公共数据开放发展有决定性影响。一方面,地方政府是中央的文件和政策的具体执行者。在数据权属缺乏明确规定的情况下,各地方政府需要厘清公共数据的权属、管理、责任等方面,出台相应的政策和规划,以落实中央的文件和政策,并制定对应的考核机制和评价体系。另一方面,地方政府承担公共数据收集、整理、管理和开放工作,是公共数据的提供者,也是部分环节最主要甚至是唯一的参与者。在数据收集阶段,地方政府部门需要根据需求制定数据收集方案和标准,包括元数据信息、数据字段、数据格式,甚至需要提供数据样例。在数据整理阶段,各部门会将已经收集的数据进行整理,包括数据清洗、数据脱敏、数据分级等。在数据管理阶段,地方政府需要将各部门整理后的数据汇集到政府数据开放平台进行存储,同时还需要确保数据安全以及及时更新数据。在数据开放阶段,地方政府需要提供下载渠道,确保数据集能够被安全、快速下载,提供搜索或检索方式等。因此,地方政府深度参与公共数据开放的各个环节,在政府数据开放平台建设、公共数据的质量和可利用性等方面起到决定性作用。
(2)地方政府积极性是影响中国公共数据开放发展的内因,技术和制度等因素是外因。一方面,地方政府积极性不足是阻碍公共数据开放发展的根本原因,而技术和制度等客观因素仅会延缓公共数据开放发展。当前,中国已经有部分地区在公共数据开放方面取得很好成果。截至2021年底,中国数据集数前十名的公共数据平台如图1所示。从排名上看,除去贵州省省级平台,其他9个平台均属于山东省。数据接口数前十名的公共数据平台如图2所示。可以看出,前十名中有9个平台属于山东省,这表明在经济发展水平、互联网技术水平、政策扶持力度都不具有明显的相对优势情况下,山东省公共数据开放发展整体水平显著高于其他省份。这意味着,若地方政府具有积极性,当前技术水平和制度不完善等客观因素形成的困难是可以被克服的。与之相反,在技术条件和制度因素具有相对优势的地区,若地方政府积极性不足,则公共数据开放也会受到阻碍或陷入停滞。部分城市政务数据开放平台的数据集数、数据接口数和数据应用数以及全国政务数据开放平台的平均值见表1。可以看出,泰州市公共数据开放发展良好,而其他三座城市公共数据开放发展明显落后。淮安、盐城和泰州均是江苏地级市,相距不到200千米,其技术和经济因素不具有明显差异,在全国均属于经济发达地区。杭州市生产总值和互联网企业技术水平均显著高于泰州市,技术条件和制度条件更为成熟。然而,除了泰州市,其余三座城市的公共数据开放发展水平明显落后于全国平均水平。这表明若地方政府积极性不足,即使外部因素条件具有优势,公共数据开放发展也会面临阻碍。因此,这些客观因素对中国公共数据开放发展的影响虽然不可忽略,但是其并不是影响公共数据开放发展的根本原因。另一方面,地方政府积极性直接影响公共数据开放发展,而技术和制度等客观因素则是间接影响因素。当地方政府积极性不足时,在公共数据开放方面会投入更少的精力和资源,从而直接影响公共数据开放发展。当技术水平有限或制度不完善时,推动公共数据开放需要更多成本和精力,或公共数据开放后产生更低收益,导致地方政府积极性下降,从而阻碍公共数据开放发展。这意味着,地方政府积极性直接影响公共数据开放发展,而技术和制度等客观因素先影响地方政府积极性,再间接影响公共数据开放发展。由于技术和制度等客观因素并不是阻碍公共数据开放发展的决定性因素,因此技术和制度等客观因素是外因。
图1 数据集数前十名地区情况
图2 数据接口数前十名地区情况
(3)地方政府积极性不足可以有效解释当前中国公共数据开放面临的主要问题。首先,地方政府积极性不足会导致政府数据开放平台建设投入不足。地方政府需要投入资金和精力执行中央和省级政府的政策和管理办法。虽然其资金要求、管理能力和技术水平并未超出地方政府承受能力,但是当地方政府积极性不足时,其投入就会降低,政府数据开放平台建设进度将会放缓或暂停。其次,地方政府积极性不足会使得公共数据可用性下降。由于公共数据的收集、整理和管理都需要地方政府深度参与,当地方政府积极性不足时,公共数据的数据量、数据质量都会下降,进而导致公共数据可用性下降。在数据收集阶段,积极性不足的地方政府仅收集必需的数据,并不考虑后续数据整理、数据可用性等方面的需求。这不仅对后续工作造成困难和阻碍,还会降低数据完整性和数据可信性。因此,在没有其他利益驱使或者压力的情况下,地方政府会更倾向减少公共数据开放的数据量、数据类型,甚至仅开放不重要或不完整的数据集,从而导致数据可用性降低。最后,地方政府积极性不同是造成中国各地公共数据开放发展差异的主要因素。地方政府积极性对公共数据开放发展起到决定性作用,因此,地方政府的积极性差异必然会导致公共数据开放发展差异。现有研究表明政府在面临压力或具有公共数据开放动力时,其政府开放数据平台实施水平会更高[11]。截至2021年,中国仍有部分省份尚未制定或颁布政务数据开放的相关办法,这必然导致这些地区公共数据开放发展缓慢。由于省级政府在公共数据开放方面并不积极,这些省份的地方政府在公共数据开放方面积极性更差,未有任何地市级政府数据开放平台上线。
三、发展视角下有偿使用制度对地方政府积极性的影响
地方政府积极性不足是阻碍中国公共数据开放发展的主要因素,因此有效调动地方政府积极性能够促进公共数据开放发展。
(一)建立公共数据有偿使用制度能够调动地方政府积极性
在理论层面,行政手段和市场激励两种方式均可以调动地方政府积极性。根据中国改革的经验和教训,市场激励方式会更加有效且成本更低,而行政手段可能会在落实过程中面临更多问题。因此,本文倾向采用市场激励方式调动地方政府积极性。
作为中国改革开放以来最重要的、影响最大的、通过市场激励方法调动地方积极性的制度,土地出让金制度能为建立公共数据有偿使用制度提供借鉴和启示。自1978年以来,中国进入土地所有权和使用权两权分离的弱管制时期[12]。随着深圳市政府1987年首开国有土地使用权有偿出让先河,1988年《中华人民共和国土地管理法》修正案设立了国有土地出让制度,土地出让制度对中国城镇化和城市经济发展产生了重要影响[13-14]。土地出让制度调动了地方投资当地基础设施的积极性,促进了地方政府招商引资,并为地方政府提供了城市化的资金,为经济发展提供了动力[15][16]205-210。因此,采用合理的市场激励手段可以调动地方政府积极性,解决或缓解中国公共数据开放面临的主要问题。
建立公共数据有偿使用制度能够从两个方面调动地方政府积极性。一方面,公共数据有偿使用制度可以进行数据价值的再分配,从而提高地方政府的积极性。在社会价值方面,中国不同地区的数字技术水平存在差异,部分地区数字技术人才缺乏,当地政府利用公共数据的能力不足,使得公共数据在当地产生难以释放社会价值。例如,欠发达省份的计算机人才少,互联网行业就业环境相对不足,地方政府需要更多的政策才能吸引到相关技术人员。而当地缺乏计算机人才也会导致地方政府利用数据能力低,公共数据开放在当地产生的社会价值不高。在商业价值方面,地方经济结构差异会导致地方企业利用公共数据的能力不同,使得公共数据开放在不同地区产生的商业价值存在差异。例如,深圳市有许多高科技和互联网企业,公共数据能在当地释放出巨大的商业价值,对当地经济发展起到重要作用。而西藏缺乏高科技企业,公共数据对当地企业的商业价值几乎为0。若西藏地方政府开放其公共数据,其公共数据更多是被深圳市的高科技和互联网企业所利用,对西藏当地的经济发展影响较小。然而,中国高科技企业集中在部分省份,而全国大部分地区高科技企业数量较少。根据《财富》2021年数据,中国内地世界500强企业有126家,其中北京就有60家,而四川、重庆、河南和湖南等省份一家世界500强企业都没有。中华全国工商业联合会发布的《2022年中国民营企业500强调研分析报告》显示,中国各省份民营企业500强企业数量前五名分别是浙江、江苏、广东、山东和河北。前四名省份共有约300家500强企业,有20个省份500强民营企业数量低于10家。因此,全国部分地区公共数据开放在当地产生的社会价值和商业价值较低,这些地区的地方政府积极性也就不高。
在建立公共数据有偿使用制度后,企业在政府数据开放平台上使用数据需要向地方政府支付费用,这实际上形成了跨区域的数据价值再分配。在该制度下,其他地区的企业利用公共数据所产生的商业价值会通过数据使用费的形式部分转移到当地,从而提高了地方政府积极性。
另一方面,公共数据有偿使用制度可以提高地方政府财政收入和融资能力,缓解财政压力,促进公共数据开放可持续性发展。公共数据的归属权是各级政府和事业单位,其数据来源大部分为政府进行社会治理和提供公共服务过程中采集、整理后得到的数据,其成本由财政承担。公共数据免费开放会增加地方政府财政压力。同时,地方政府财政限制会导致公共数据质量不高、供给不足等问题,降低公共数据可用性、社会价值和商业价值。例如,2021年黑龙江省研发经费不足195亿元,而广东省为4 002.2亿元,超过黑龙江省全省全年财政支出的3 932亿元。若仅考虑省级政府财政支出,2021年广东省科学计算支出978亿元,黑龙江省为43.5亿元,相差约20倍。同时,黑龙江省在民生方面的财政支出就已经占据财政支出的87.1%,这意味着黑龙江省政府能够投入在政府公共数据开放平台上的财政能力相当有限。在这种情况下,财政收入低的地方政府难以维持高水平、高质量的公共数据开放平台。
建立公共数据有偿使用制度可以为地方政府提供财政收入,缓解财政压力,并刺激地方政府积极性,进一步提高公共数据可用性和数据价值,促进公共数据要素可持续开放。例如,土地出让金制度为地方政府带来了大量财政收入,并成为地方政府的财政支柱[14]。因此,随着数据要素的重要性进一步增加,公共数据有偿使用制度也会增加当地政府的财政收入,并逐步成为地方政府的重要财政收入之一。这部分收入将为公共数据收集、整理、管理和开放提供资金来源。
(二)对公共数据有偿使用制度争议的回应
第一,政府是否有权向公共数据使用者收取费用。部分学者认为政府应当无条件免费开放公共数据,其逻辑基础是政务信息应当无条件免费开放。但现有文献指出,政务信息公开和公共数据开放的法律基础是完全不同的[17]。政务信息公开的法律基础是公民知情权和行政监督权,而公共数据开放的法律基础是公共资源使用权。其原因在于二者提供的内容是不同的,政务信息公开提供的是信息,而公共数据开放提供的是数据[18-19]。公共数据开放的核心目的是充分释放公共数据的社会价值和商业价值,从而推动数字经济高质量发展。其核心在于公共数据的使用权,而非知情权。因此,公共数据开放不仅仅在于开放,还在于保障公共数据的数据质量和可用性。不同的权利基础和法理逻辑也使得公共数据开放制度不能照搬政府信息公开制度。在公共资源使用权的法律基础下,政府对使用资源的个体或企业收取费用是合理且正当的。
第二,公共数据开放是否应当是政府应该且必须提供的公共产品。若公共数据开放是政府必须提供的公共产品,则其费用和成本应当由财政承担,且需要向公民和企业免费提供。然而,在实践中,由于公共数据的使用存在门槛,并非所有个人、企业和组织均能够利用公共数据并从中获益,因此,能够利用公共数据并从中获益的个人、企业和组织是公共数据开放的特定受益人[20-21]。此时,公共数据开放并非纯公共产品,而是一种准公共产品,应遵循公共经济学和行政法理论中“受益者负担”原则,即以特定事业受益为依据,要求特定受益人负担与受益程度相应的一定费用[20]。该原则的基本精神是保证社会负担和收益的公平。在有特定受益人的情况下,若仍旧由财政或全民负担成本,则有失公平。
第三,公共数据有偿使用制度是否会阻碍公共数据释放价值。当公共数据从免费使用转变为有偿使用时,企业是否会减少公共数据的使用?新兴企业或中小企业是否会无力承担使用费用?这些是否会导致公共数据难以产生商业价值和社会价值?合理的定价机制可以避免公共数据有偿使用制度降低经济效率。一方面,地方和中央政府可以制定部分政策以降低公共数据有偿使用制度对经济效率的负面影响。例如,对公共数据进行分级,对高商业价值和细颗粒度数据进行收费,而对于基础数据和低商业价值数据免费开放。同时,地方政府可以制定扶持新兴企业和中小企业的公共数据开放政策,降低其公共数据使用费用。另一方面,公共数据有偿使用制度会提高政府积极性,从而提高公共数据可利用性,增加公共数据的商业价值。以英国和德国为例,英国标准协会建设了标准购买网,以每条100~500英镑的价格出售英国国家标准的文本信息及相关数据[20]。德国标准化协会也有类似网站,其出售价格为每条100~400欧元。根据公布数据,标准有偿供给提供的收入占英国标准协会总收入的15%,而对于德国标准化协会,该比例为60%。由于是有偿供给,因此企业和政府的合作更为紧密,政府在收集、整理、管理和开放的过程中需要考虑企业需求,使得标准信息更容易被应用。这反而支撑了英国和德国的标准化事业。因此,合理定价机制可以促进公共数据开放的发展。
第四,当公共数据出让金成为地方政府财政收入的主要部分时,是否会出现地方政府财政过度依赖公共数据出让金。引入私有数据参与数据要素市场,推动数据要素市场供给多样化,可以避免地方政府财政过度依赖公共数据出让金的问题。在土地出让金制度下,中国地方政府的财政收入过度依赖土地出金,形成“土地财政”现象。这导致房地产行业对地方政府的财政收入和负债偿债能力有着决定性影响,迫使地方政府制定部分政策或采取行政手段以维持地价和房价。然而,公共数据有偿制度难以产生类似现象。“土地财政”的基础是地方政府对土地要素的垄断。随着中国土地征用制度的发展,农村土地必须通过地方政府征用后才能转变为建设用地,从而进入土地市场[12,14],导致地方政府在一定区域内完成了对土地要素的垄断。然而,地方政府难以垄断数据要素供给。一方面,数据要素和土地要素不同,地方政府无法完成公共数据要素垄断。不同地区的公共数据虽然有差异性,但是在一定程度上可以相互替代。因此,地方政府并不能够完全垄断公共数据要素的市场供给。另一方面,随着数据要素市场发展,私有数据进入数据要素市场,数据要素市场的供给会逐步多元化,地方政府难以垄断数据要素市场。此时,地方政府即使能垄断某一地区的公共数据供给,也无法垄断该地区的所有数据要素供给,从而无法形成财政过度依赖公共数据出让金的现象。
四、建立公共数据有偿使用制度框架的政策建议
在发展视角下,公共数据开放发展是一个过程,这要求在提供政策建议时,不仅要考虑如何解决当前阶段的主要问题,还需要考虑其后续阶段可能面临的问题,以及政策实施后在未来发展阶段可能导致的负面影响。因此,本文从四个方面提出公共数据有偿使用制度框架和具体建议。四个方面的政策建议形成一个整体,共同促进公共数据开放健康发展。
1.建立公共数据分级制度,为公共数据有偿使用制度提供基础
当前,中国公共数据开放制度基于数据开放条件和数据获取成本对公共数据进行分类。中国公共数据按照涉及隐私程度分为无条件开放、有条件开放和不予开放三类。从数据获取成本看,中国大部分数据开放平台现阶段免费,小部分平台不限时免费或不明确。
结合数据开放条件和公共数据价值两方面的因素,建立公共数据分级制度。根据公共数据开放条件和数据价值建立多层次的分级制度,确定不同信息含量、不同数据颗粒度、不同场景和领域的公共数据开放程度、脱敏标准、交易方式和定价机制,从而有效推动公共数据开放,并使得公共数据具有更强的可用性。
多层次的公共数据分级制度可以更精确、更灵活地开放公共数据,将公共数据精准开放给需要的行业和企业。一方面,部分公共数据不需要也不适合开放给所有公民、法人和其他组织,进行适当筛选和授权可以有效避免国家机密、个人隐私等数据泄露问题。另一方面,不同领域和数据颗粒度的公共数据所具有的商业价值不同,其需求群体、适合的交易模式和定价机制也会存在差异。因此,公共数据分级制度可以使公共数据满足不同群体的数据使用需求。
2.建立公共数据有偿使用制度,合理分配公共数据收益
数字基础建设发展的成本巨大,中央政府和地方政府需要投入大量资金。公共数据收取的费用可用于维持或维护数字基础建设,降低中央和地方财政负担,从而使得数字基础建设可持续发展。
公共数据收取的费用可以部分作为地方政府的财政收入,并基于公共数据收益建立公共数据资产化体系。当公共数据具有稳定现金流时,公共数据就具备了“数据资产化”的基础。地方政府可以将该现金流资产化,从而在金融市场上进行融资,为城市发展和数字基建提供资金。当高质量的公共数据可以为地方政府提供财政收入且成为地方政府重要资产时,地方政府必然具有积极性维持或提升公共数据质量,从而促进数字经济发展。
3.建立数据要素市场供给体系,推动数据要素市场供给多元化
公共数据开放不仅可以提高数据供给,还能规范数据交易市场,完善数据要素定价机制,推动数据要素市场和数字经济发展。公共数据开放可以缓解当前私有数据供给不足的现状。公共数据有偿使用制度规范数据要素市场交易机制和定价机制,为私有数据参与数据要素市场奠定基础,推动数据要素市场供给多元化。
政府应基于有偿使用体系建立并完善数据要素市场供给体系。企业可以参考公共数据分级制度,为其私有数据定级,并确定交易和定价模式。政府可以根据私有数据的商业机密和商业价值规定私有数据的私有年限。在数据使用时间达到私有年限后,企业可以将数据归属权转移给政府,变更为公共数据,并获得对应补偿。
4.完善数据要素市场监管机制,建立数据要素市场价格调节机制
随着数字经济发展,数据要素作为生产要素的地位将越来越重要,对数据要素市场的监管和宏观调控是保证数据要素市场健康发展的基础。当前,中国处于数据要素市场发展初期,其监管体系尚不完善,中央和地方政府缺乏有效的宏观调控手段。
基于公共数据有偿使用制度,完善数据要素市场监管体系和宏观调控机制。政府通过调整相关公共数据使用费用、授权企业数量等方式间接或直接提高或降低某一领域的数据要素投入量和成本,从而达到投资引导的目的。制定和完善数据要素市场监管体系,完善数据要素交易管理办法,评估数据泄露、数据垄断等风险并制定相应的监管措施。