政府数据与政府数据整合
2020-04-22李广乾
【提 要】“政府数据”是一个不断演进的概念,与技术变革紧密联系在一起。在这个过程中,“政府数据”先后与如下几个问题联系在一起:信息公开、政府专题数据库建设、业务系统整合、大数据产业发展、数据管理体系建设、政府数据资产管理。与此同时,实现政府数据的内部共享与对外开放一直是电子政务与政府数据发展所追求的目标。根据当前数据管理知识体系的发展趋势、借鉴国内外政府数据发展实践,要实现这两个目标,我们必须对政府数据的相关方面进行整合;政府数据整合是实现其共享、开放的技术基础;只有解决了整合问题,共享、开放才能得以有效进行和展开。政府数据整合包含四个方面的内容:架构整合、业务整合、数据整合、系统整合。
【关键词】 政府數据;共享;开放;整合
一、认识“政府数据”
目前,人们对于“政府数据”尚无权威统一的定义。一般来说,政府数据是指各级人民政府及其职能部门以及依法行使行政职权的组织在其管理或提供公共服务过程中制作、获得或拥有的数据。不过,在政府文件与学术文献中,与“政府数据”相近的概念有“政府信息资源”“政务信息资源”“政府信息”“政务信息”“政务数据”等,因此有人甚至认为,“政府数据”与“政府信息资源”或“政务信息资源”含义基本一致,可以等同使用。从这个意义上讲,我们可以采用《国务院关于印发政务信息资源共享管理暂行办法的通知》(国发〔2016〕51号)对政府信息资源的定义,即“政务信息资源是指政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源,包括政务部门直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等”。因此,我们也可以此作为“政府数据”的具体定义。
尽管如此,“政府数据”与“政务信息资源”等说法之间仍然还是存在着一些细微的差别的。这种差别来自这样几个方面:
首先,“数据”与“信息”之间存在着一个梯次关系,如图1所示(图1也被称为DIKW模型)。图1所示的递进关系,表明“数据”比“信息”更为根本,“数据”强调“信息”的一种更加原始的状态,保留了更多原始的“信息”,人们通过“数据”可以挖掘更多的“信息”。《德国开放数据行动计划与展望——G8开放数据宪章的实施》就认为,“信息”是所有数据的集合,“数据”是纯粹的“事实”,具有无修饰的、独立的性质,通过上下文和周围环境的相互作用,这些“数据”(或“事实”)在一个具体的、特定的背景环境下,进行释义后成为人类所定义的“信息”。
从这个意义上讲,相较于“政府信息”,“政府数据”更适合作为大数据的开发利用对象。因此,当前强调从政府信息公开向政府数据开放转型,就是强调由公众的“知情权”向政府数据的开发利用转变,要让社会公众能够应用更加基础的政府数据。
G8《开放数据宪章》明确了政府数据开放的五大原则,特别强调数据质量和数据通用性,要求尽可能多地支持各种数据格式,支持多类型用户的广泛、无障碍的使用。
其次,“政府信息”和“政府数据”往往指向不同的内涵。“政府信息”强调一种更加直观、提供给人们的行政管理内容。如各种各样的政府文件、规章制度等。这些跟人们的权利义务密切相关,因而必须直白明确。而“政府数据”则强调基于上述“政府信息”而进行的行政业务处理的条件、依据、过程、结果的数字化材料。例如,加拿大《开放政府指令》就认为,“开放数据”中的“数据”指结构化的数据,“开放信息”中的“信息”则指非结构化的文档和多媒体素材等。
再次,大数据丰富深化了“政府数据”的内涵。大数据具有“4V”的特征,即数据规模大(Volume),数据种类繁多(Variety),数据处理速度快(Velocity),数据价值密度低(Value)。近年来,人们将大数据应用于政府行政管理及其数据处理工作,这也使得更多政府业务过程被数字化并被纳入“政府数据”的范畴。
第四,近来“政府数据”被大量使用,也与当前流行“数字经济”“数字化转型”的说法有密切关系。
因此,我们在认识“政府数据”的具体含义时,在认识到其与“政府信息资源”等相关概念的相同之处时,也应该注意到这些细微差别。
二、“政府数据”的演变
我们只有通过“政府数据”的演变历程,才能够真正地看清其实质内涵。
(一)“政府数据”的发展阶段
近年来,如何认识、处理政府数据成为全球其他各国的政治、行政管理以及电子政务建设的重要问题,政府数据引起人们的广泛关注。同时,人们对其也有着各种不同的说法和理解。例如,就我国的情况来看,人们常常将政府数据与“开放”“共享”联系在一起,有时甚至是将政府数据与“开放共享”统一在一起。这些不同的要求给人们带来很多困惑,也给电子政务建设带来一些困难。但实际上,政府数据本身是一个特定历史时期的概念,其历史并不长。从各国发展实际来看,政府数据经历了以下几个阶段:
1.信息公开。在互联网出现之前,政府数据最初是以“政府信息公开”的面目出现的,主要是美国等西方经济发达国家在“知情权”“透明政府”“阳光政府”等诉求、要求下而提出的一项政策措施;在互联网逐步得到应用之后,政府信息公开得到进一步强化,并被赋予更多的功能要求。
2.政府专题数据库建设。随着信息化的深入发展和电子政务的日益普及,政府信息公开工作日益深化并逐渐成为电子政务建设的一个重要内容,从而使得政府数据库系统建设成为一项基础性工作,成为支撑政府行政管理的重要内容,政府数据日益成为一个独立的关键内容受到人们的关注。在这个阶段,各政府职能部门开始基于各自的职能业务,建设与其电子政务业务系统相对应的专题数据库。
3.业务系统整合。职能业务部门的电子政务建设在改进服务社会公众效能的同时,也带来诸多新的问题,例如重复建设、数据烟囱、信息孤岛等。这些问题让人们意识到业务系统整合的重要性。
整合重点包括两个方向:首先是试图通过政府门户网站去整合各职能业务系统。政府门户网站是指一级政府在各部门的信息化建设基础之上,建立起跨部门、综合的业务应用系统,使公民、企业与政府工作人员都能快速便捷地接入所有相关政府部门的政务信息与业务应用,使合适的人能够在恰当的时间获得恰当的服务。因此,从政府门户网站的这个定义,我们可以看出其整合的方向是各职能业务部门的电子政务建设系统。其次是基础信息资源的整合。在电子政务发展初期,为了解决信息孤岛问题、提高电子政务业务系统的效率,人们提出了建设所谓的基础数据库的思路。但是,在如何认识、建设、管理、运维基础数据库的问题上,一直未能找到有效的理论认识和操作方法。
从这个过程来看,业务系统的整合与政府数据的整合是两回事儿,不能混为一谈。政府数据本身并不是凭空出现的,而是伴随电子政务业务发展的需要而出现、并在发展过程中慢慢地独立出来的。因此,我们不能只顾着政府数据谈论政府数据,而必须将其置于电子政务发展的大环境下去分析、对待。从这个意义出发,我们所谈论的政府数据,应该是电子政务顶层框架下的政府数据。因此,电子政务顶层设计就成为我们认识政府数据属性的一个基础要素。
尽管如此,政府数据的独立性也日益凸显。因此,一些国家建立了专门的数据公开网站。
4.大数据产业发展。政府被认为是掌控全社会数据资源最全面的对象,所以政府数据一直被人们寄予更多期望。但是,对于如何进行深入开发利用,国内外有着不同的认识和做法。国外的做法是建立专门的政府数据开放网站;我国的做法则比较曲折,最初有专门的所谓“信息资源开发利用”的计划,并出台了专门的文件,但是并没有得到很好的实施、更没有取得有效的成果。
大数据的发展给各国政府数据的应用发展方向带来了巨大转变。这也使得政府数据真正地超越了政府业务系统本身,而成为推动产业发展的一个重要因素。在这种情况下,我们思考政府数据,又多了一个维度,即大数据产业发展。
然而,政府数据的大数据产业化发展,不仅面临传统的政府部门协调问题,也遇到了严峻的法律、政策与技术等多方面的障碍,例如隐私保护、网络安全、产权归属等,这也使得政府数据的大数据产业化举步维艰。
5.数据管理体系建设。政府数据的大数据产业化路径也给政府数据共享和开放问题提供了科学的理论方法和实现路径,特别是数据管理知识体系为人们破解政府数据的整合共享问题提供了最为有力的指导工具。
长期以来,尽管人们一直强调政府数据社会化开发应用的巨大价值,但却一直无法从技术上落实、展开。虽然美国在其联邦政府组织架构(Federal Enterprise Architecture,FEA)中,专门安排了数据参考模型(Data Reference Model,DRM),但是DRM所采用的技术方法却无法解释诸多业务问题,因而其实效并不显著。我国也在政府数据的体系架构建设方面进行了诸多的努力,早在2002年就提出了电子政务四大基础数据库与电子政务信息资源目录体系与交换体系,试图从技术、标准上规范统一政府数据的共享应用,然而将近二十多年过去了,很多核心问题仍然存在。
出现这些情况的主要原因,在于我们没有深刻认识政府数据的数据属性、没有建立科学合理的数据管理体系。可喜的是,近些年来,随着有关数据属性相关的理论、技术和信息系统架构的成熟,有些内容甚至是建立了相应的国际标准了。例如,多年前已经建立了比较系统完善的元数据标准,自2008年开始有关数据质量管理特别是主数据管理的国际标准(ISO8000)体系开始陆续发布。一些国际专业机构(如国际数据管理协会,DAMA)和大型IT企业(如IBM等)也逐步地建立起规范、系统的数据管理(或数据治理)知识体系。虽然这些技术标准并不针对政府数据共享开放问题,但是却为我们构建政府数据的数据管理体系提供了科学的数据管理理论和方法论。
6.政府数据资产管理。要真正地促进政府数据的整合共享,还必须解决数据责任与数据归属权的问题。近年来,国内围绕政府数据共享、开放而展开了数据资产确权问题的讨论。尽管已经具备了政府数据管理知识体系,但要实现政府数据资产管理,仍然还存在很多的技术、制度障碍。这成为当前人们大数据产业化研究的一个热门话题。
随着人工智能、区块链技术的深入发展,政府数据在加强政府行政管理、促进大数据产业发展等方面将进一步发展重要作用;同时,数据智能的应用也将带给政府行政管理以更多的创新、发展,并将进一步带来国家治理体系的深刻变革。
(二)“政府数据”的演变特征
首先,从上述演变历程来看,“政府数据”的内涵与技术变革紧密联系在一起。互联网出现之前,“政府数据”是以纸面的文字出现的,政府信息公开是政府政策文件及行政记录的公开;有了互联网之后,“政府数据”的内涵变得更加丰富,不但是形式上包含纸质和电子方式,而且内容上也要求共享更多的原始政府数据如空间地理信息、各种数据统计表格、视频音频数据等;而大数据的出现,则给政府数据的管理带来挑战,要求从元数据、主数据管理等技术层面加强政府数据管理,并在此基础上逐步建立完善的政府数据管理体系。
其次,不同的国家在“政府数据”的发展方式和过程上存在显著的不同。美国政府在纸质时代的“政府数据”建设上经历了较长的时间,形成了系统、完整的政府信息公开制度体系,因此在互联网时代以及大数据时代,其政府数据的整合共享以及对外开放方面相对比较完整地经历了上述发展历程。我国从2008年开始发布实施政府信息公开条例,但是近年来我国大力推进大数据发展战略,政府数据被看作是大数据产业发展的重要推动力量,因而近年來我国在推动政府数据整合共享方面进展迅速,出台了一系列政策文件,也取得了令人瞩目的成绩。
第三,“政府数据”往往以多重表现形式出现。例如,尽管根据DIKW模型,数据和信息之间存在递进关系,但在平时的表述中,政府数据往往与其他概念交叉使用,在政务公开场合用“政府信息”、在其他一些场合又用政府数据,人们对此似乎并没有严格的区分。
三、政府数据的整合:共享、开放,治理、管理
如何充分发挥政府数据(信息)的价值,一直是个重大问题。在信息化之前的时代,该问题只牵扯政治和行政层面,人们所在乎的是政府数据或信息的公开、开放;但在进入信息化时代后,这个问题变得更复杂了,不再仅仅是个政治或行政效能的问题,还牵扯到更为底层的技术实现问题;而且,从实践上来讲,如果不解决这些技术问题,政府数据或信息的开放就无法有效实施或高效运行。为此,近年来人们提出了很多的概念、说法和期望。从当前的情况来看,我们可以將这些说法和愿望划分为以下两组情况。
(一)政府数据开放、政府数据共享、政府数据开放共享
从国外的发展情况来看,政府数据开放是政府信息公开深入发展的产物。因此,世界银行在2012年发表的《如何认识开放政府数据提高政府的责任感》报告认为,政府数据开放是指政府产生、收集和拥有的数据、在知识共享许可下发布、允许共享、分发、修改,甚至对其进行商业使用,并强调政府数据具有三个特性:非专有性(非歧视性)、机器可读性和开放授权性(自由使用、重复使用、操作和传播)。
从我国的发展情况来看,2008年5月1日颁布实施《中华人民共和国政府信息公开条例》之后,随着2015年8月31日国务院印发《促进大数据发展行动纲要》(国发〔2015〕50号文),“政府数据开放”便受到人们的高度关注。同时,长期以来所使用的政府信息共享也相应地转变为“政府数据共享”。
而且,人们往往将“政府数据开放”界定为政府机构向社会开放政府数据;而将“政府数据共享”界定为政府机构之间的数据提供。根据《促进大数据发展行动纲要》,数据开放是指,在依法加强安全保障和隐私保护的前提下,稳步推动公共数据资源的开放,开放主体是政府部门和事业单位等公共机构,开放对象是社会公众,开放目的是为了保障民生、释放商业增值潜力。而关于数据共享,这份文件规定的是政府部门数据共享,侧重政府各部门之间,主要是金税、金关、金财、金审、金盾、金宏、金保、金土、金农、金水、金质等信息系统之间的数据共享和交换,目的在增强政府公信力,提高行政效率,提升服务水平。再比如,《贵阳市政府数据共享开放条例》便认为,政府数据共享是指行政机关因履行职责需要使用其他行政机关的政府数据或者为其他行政机关提供政府数据的行为;而政府数据开放,是指行政机关面向公民、法人和其他组织提供政府数据的行为。因此,依据《贵阳市政府数据共享开放条例》,“政府数据开放”应该是“政府数据对外开放”,“政府数据共享”应该是“政府数据内部共享”。
尽管上述法律法规或政策文件对于“共享”“开放”规定了诸多的差异性要求,但是这些差异性要求都必须落实到具体的技术架构层面去解决和实现。这种思维为我们深入思考政府数据的开发利用路径提供了新的支点,即寻找能够支撑政府数据共享、开放的底层整合架构框架。
(二)数据治理、数据管理
为了明确政府数据治理、政府数据管理的具体含义和区别,我们有必要先明确一下数据治理、数据管理的含义和区别。
从当前我国的相关语境来看,人们对于“治理”一词有着相对特别的偏好,例如“国家治理体系与治理能力现代化”是人们惯常使用的一个宏大论述中的常用词,而“管理”一词因为实在是应用得太普遍了,反倒不被人们所喜好。而且,目前,人们普遍认为,“治理”主要强调政府放权,发挥企业、市场等各方面的积极性,强调政府与其他利益主体之间的互动性;而“管理”则是强调政府对于企业、市场的单方面的行政作用。
然而,“治理”“管理”在应用于数据资源领域时,其含义和关系则大为不同:数据管理包含数据治理,数据治理是数据管理的一个组成部分。国际数据管理协会(DAMA,Data Management Association International)在2009年发布的数据管理知识体系(DBMOK1.0)中,将数据管理界定为10个管理职能,即数据治理、数据架构管理、数据开发、数据操作管理、数据安全管理、参考数据和主数据管理、数据仓库和商务智能管理、文档和内容管理、元数据管理和数据质量管理,数字治理是其核心内容;我国的数据管理能力成熟度评估模型(DCMM)(GB/T 36073-2018)将数据管理能力定义为数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期8个核心能力域,其中就包含数据治理。因此,DAMA认为,数据管理是规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据和信息资产的价值;而数据治理是在数据管理和使用层面上进行规划、监督和控制。
(三)政府数据的整合
政府数据管理特别是DAMA的数据管理知识体系(DBMOK1.0)、数据管理能力成熟度评估模型(DCMM)(GB/T 36073-2018)为我们探寻政府数据实现共享、开放的底层整合架构框架提供了很有价值的技术参考与实践方法。
尽管如此,在应用这些技术和方法时,仍然还有许多需要我们结合政府业务、政府数据的独特性进行修改完善、融合深化之处。实际上,上述方法和标准,都是围绕一个独立的企业或机构而展开的,但就政府而言,其边界则过于庞大和复杂;而且,就政府数据而言,除了自身的数据属性分析、数据架构构建外,还必须充分地与电子政务总体架构相统一。就我国的电子政务和政府数据建设来看,其中的很多基础工作仍然不够充分,一些认识问题也没有得到统一。例如,就电子政务和政府数据建设而言,目前各级政府都在强调所谓的顶层设计,也都设计类似的内容。这显然是一种不合理的状态。实际上,根据Zachman框架,针对一个复杂的信息系统,不同的利益相关者应该分工处理不同的问题,而不是各层级主体都关心同一个问题,特别是都去关心最核心、最基础的问题。
因此,参考上述有关数据管理知识体系,并结合我国电子政务和政府数据建设现状,要实现政府数据共享、开放,必须构建电子政务总体架构框架、政府业务参考模型、政府数据参考模型等并在此基础上进行相应的政府业务信息系统整合。也就是说,共享、开放是我们实现的两个目标,而要实现这两个目标,我们必须对政府数据的相关方面进行整合;只有解决了整合问题,共享、开放才能得到有效地进行和展开。政府数据整合是实现其共享、开放的技术基础。
政府数据整合其实应该是信息化时代的产物。在传统的纸媒时代,“政府数据”并不存在所谓的整合问题。然而,从制度建设上讲,纸媒时代的政府信息公开的各类相关配套法律法规等为大数据时代的政府数据共享开放提供了基础性制度依据和参考,是确保政府数据得到正确合理应用的重要条件。
四、美国政府数据整合实践
美国政府开展政府数据管理建设的时间相对最长、也最为系统完整,一些探索和做法为世界很多国家所效仿和学习。不过,目前国内外专门分析阐述美国政府数据整合实践的材料很少,更多的是分析和介绍美国政府信息公开、政府数据开放共享等。在这里,我们根据“整合”的要求,去梳理美国政府开展政府数据整合的做法和经验。
我们可以从以下三个阶段去认识美国政府的数据整合实践。
(一)政府信息公开
作为移民国家,美国最早开展了政府信息公开活动。美国宪法很早就要求公开政府信息;1789年颁布《管家法》,要求各政府部门发布政务信息;1946年通过《联邦行政程序法》,要求联邦政府机关必须让社会公众能够获取政务信息和行政资料。不过,由于这些早期的政务信息公开规定相对简单、粗糙,效果并不明显。
1966年之后,政府信息公开的这种初级状况开始得到改观。这一年通过了《信息自由法》,在信息公开的立法上有不少的创新发展,例如提出了“以公开为原则、不公开为例外”“任何人享有平等的公开请求权”和“司法救济原则”等。该法第一次从成文法上提供了公众获得政府信息的权利,是美国当代行政法中有关公民知情权的一项重要法律制度。为弥补《信息自由法》的不足,1974年又通过了《隐私权法》,其宗旨是限制政府机构在公开政务信息时泄露个人隐私,为此《隐私权法》规定,任何个人都可以查看联邦政府保存的有关其本人的信息,联邦政府机关保存的个人信息必须准确、全面、及时、合理相关;联邦政府机关必须直接从信息的主人处获得相关信息。1977年开始实施的《阳光下的政府法》将政府信息公开的范围扩大到政府会议公开,允许任何人观看和旁听政府会议。
上述的《信息自由法》《隐私权法》和《阳光下的政府法》构成了一套相对完整的美国联邦政府信息公开制度体系,不仅将法律法规、政府文件和政府会议都纳入政府信息公开范畴,而且注意维持信息公开与隐私保护之间的微妙平衡。这些制度安排为后来的政府数据整合提供了制度保障。
(二)电子政务总体架构设计
首先是构建美国联邦政府的电子政务顶层设计框架。
为此,美国总统办公厅管理和预算办公室(OMB)于2002年提出了“Federal Enterprise Architecture,FEA”,并从2006和2007财政年度开始,将其用于美国联邦政府的预算编制。FEA已经成为联邦政府行政管理的日常工作内容与操作工具。
FEA是一种基于业务与绩效的、用于某级政府的跨部门的绩效改进框架,它为OMB和联邦政府各机构提供了描述、分析联邦政府架构及其提高服务公民的能力的新方式,其目的就是确认那些能够简化流程、共用联邦IT投资及整合政府机构之间和联邦政府的业务线之内的工作机会。FEA由5个参考模型组成(如图2),它们共同提供了联邦政府的业务、绩效与技术的通用定义和架构。如果政府机构要建立理想的组织架构,这些参考模型将可以作为系统分析政府的业务流程、服务能力、组织构件与所用技术的基础。这些模型也是专门用于帮助跨部门分析、发现政府的重复投资与能力差距、寻找联邦机构内部与联邦机构之间的协作机会。为了从技术上进行联邦政府的数据整合,FEA在其5个模型中专门设立一个数据参考模型(DRM)。
其次是建立统一的政府门户网站。
在1993-2000年间,美国政府的电子政务建设获得快速发展,同时也带来很大的问题。因为每个政府机构都独立地建设自己的网站,有的甚至是每个政府机构的每个业务都建立一个网站,因而政府网站数量立即膨胀,一度达到2万多个。这些政府网站的内容非常丰富,页面数量多达几千万,一般的公民很難通过网络搜索来准确快捷地获得政府服务。这就需要政府门户网站进行整合和引导,为此克林顿政府于2000年9月开通其超级电子政务网站(www.firstgov.gov)即美国联邦政府门户网站。
(三)基于统一门户的政府数据开放阶段
1.基本情况。当前人们对于欧美国家开放政府数据的动机提出了诸多观点和解释。例如,国外有人认为,“一个是出于政治考量,植根于民主和信息自由的精神,另一个则是站在经济利益的角度,以此拉动信息市场增长”;国内有学者甚至是从更细、更广泛的角度去解释,认为“扩大民主参与,推动政府治理变革;鼓励创新,扩大信息再利用,促进经济发展;增进信息共享,加强执法,提高政府工作效率;抑制腐败,冲击保密文化,增强政府公信力”。看来,这些观点都没有考虑到美国等国家在开放政府数据之前所开展的电子政务顶层设计和建立统一的政府门户网站对于整合政府数据的基础性作用。
在这些基础性作用下,美国的奥巴马政府于2009年颁布《开放政府指令》(US Open Government Directive),要求政府在网上开放更多的数据,明确政府数据开放的三原则“透明、参与、协作”,并启动建设统一的政府数据开放门户网站(www.data.gov);2012年发布《数字政府:构建一个21世纪平台以更好地服务美国人民》的报告,指出开放政府数据应成为电子政府的支撑,要以信息为中心、以用户为中心、保障安全和隐私,建立一个21世纪的共享平台。此外,美国政府每两年发布一次“开放政府数据计划”,要求不断扩大政府数据开放领域。
2018年12月24日,美国会正式投票通过《开放政府数据法案》,将向公众开放“非敏感”政府数据。该法案要求联邦机构必须以“机器可读”格式,即以方便公众在智能手机或电脑上阅读的数据格式,发布任何不涉及公众隐私或国家安全的“非敏感”信息。该法案还要求各联邦机构任命一名首席数据官来监督所有开放数据的工作。实际上,早在2012年,美国纽约市就通过了《开放数据法案》,这是美国历史上首次将政府数据大规模开放纳入立法。该法案要求,到2018年,除了涉及安全和隐私的数据以外,纽约市的政府及分支机构所拥有的数据必须对公众实施开放,市民们使用这些信息不需要经过任何注册、审批的烦琐程序,使用数据也不受限制。
2.具体的整合做法。从加强政府数据整合来讲,美国政府构建了统一的美国联邦政府数据开放门户网站。在开通、建设美国联邦政府电子政务门户网站之后,时隔九年又开通美国各联邦政府机构的统一的政府数据开放网站。各联邦政府机构将数据、数据库从后台上传到Data.gov网站,该网站再将所有的政府数据进行集中、整合,公众浏览Data.gov网站,可以找到所有联邦政府的数据,包括经济数据、交通数据、农业数据、医疗数据等。从这个意义上来说,Data.gov是美国联邦政府统一集中的数据发源地。这个政府数据门户网站,让公众可以非常便捷地查找各类政府信息、数据。
五、其他一些国家的政府数据整合实践
自从2009年美国率先建立政府数据开放门户网站之后,政府数据开放(Open Government Data,OGD)作为一项运动开始席卷全球,受到各国与国际组织的重视。英国、加拿大、澳大利亚、新西兰等国家也相继建立政府数据门户网站;2011年9月,巴西、美国、英国等8个国家联合签署《开放数据声明》,建立“开放政府合作伙伴计划(Open Government Partnership,简称OGP,也有人将其称为“开放政府联盟”)。根据相关决议,新加入OGP的国家必须签署《开放政府宣言》,制定国家数据开放行动计划并征求公众意见,并且就行动进展定期提交独立报告。2013年6月17-18日,美、英、法、德、意、加、日、俄召开G8峰会,发布G8《开放数据宪章》。目前,全球已经有75个国家加入这一计划,既包括美国、英國、德国、法国、奥地利、西班牙等西方发达国家,也包括印度、巴西、阿根廷、加纳、肯尼亚等发展中国家,联合国、欧盟、经合组织、世界银行等国际组织也加入了开放数据运动。因此,政府数据开放已经成为一项国际共识。
为深入认识和理解国际政府数据开放运动中的政府数据整合情况,下面具体介绍英国和“开放政府合作伙伴计划”(OGP)的发展情况。
(一)英国为推进政府数据开放而开展的政府数据整合实践
在政府数据开放方面,英国一直紧跟美国步伐,走在国际前列。根据“开放数据晴雨表”(Open Data Barometer)和“全球开放数据指数”(Global Open Data Index)两项权威指标2013-2014年的排名结果,英国的数据开放程度位列世界首位。
英国在政府数据开放方面的这种成绩,与其电子政务和政府数据整合有密切的关系。具体内容如下:
1.电子政务总体架构建设。在美国进行电子政务顶层设计的同时,英国也开始了电子政务系统的整合,并且采取的是与美国不同的技术路线。在2005年,英国政府内阁办公室电子政务组(e-Government Unit)就发布了电子政务互操作框架(e-Government Interoperability Framework,e-GIF)第6.1版,已经建立了相对完善的电子政务互操作框架(e-GIF)。比较美国的FEA和英国的e-GIF(电子政府互操作性模型),可以发现,两种方法各有特点,前者注重业务流程整合及共享,后者则注意从技术上保证电子政务的互操作性。
2.政府数据整合。早在2009年,英国政府就提出建设一站式政府数据网站(data. gov.uk),以集中公开健康医疗、公共交通、天气、公共支出等方面的数据。作为开放数据合作伙伴联盟的创始国之一,英国政府分别在2011年、2013年和2016年连续发布了三个政府数据开放国家行动计划,制定了一系列政府数据开放的政策措施。为促进政府数据开放,英国还于2012年5月建立了世界上首个非营利性的开放数据研究所ODI(The Open Data Institute)。这些政府数据开放的政策实践,也有力地推进了英国政府数据的整合共享。
(二)“开放政府合作伙伴计划”(OGP)成员国的政府数据整合实践
目前已经有众多国家加入OGP计划,这些国家都被要求按照OGP的政策开放政府数据。OGP不仅仅是一个由诸多国家发起的多边合作倡议,也是一个成员国之间的对话交流平台和改进机制。
对一个国家来说,政府数据开放都是一项长期复杂的系统工程,不仅是一项政治、政府改革运动,也是一项非常具体的公共管理业务深化与信息化技术应用。因此,无论是对经济发达国家还是对发展中国家来说,都是一项巨大的挑战。
实际上,就发达国家的实施情况来看,各国的表现仍然参差不齐。美国和英国因为在电子政务建设方面具备比较充分的技术、行政管理基础,在开展政府数据整合上积累了比较扎实的基础,在政府数据开放方面走在其他成员国的前列。在开放政府国家行动计划方面,美国已经发布了两次,英国发布了三次,而德国一直到2015年才发布第一次国家行动计划。
就发展中国家的实施情况来看,情况却远不如声明中所期望的那么理想。就这些发展中国家的整体来看,政府数据开放仍然处于较低层级。多数发展中国家仍然停留在政府信息公开层面,还没有迹象表明开放政府数据已经在发展中国家创造出多大的企业价值和经济社会价值。多数国家制定了开放政府数据战略框架,但是却较为松散,而且相应的制度体系相对笼统单一。发展中国家的政府数据开放运动仍然任重道远。
六、我国政府数据整合存在的问题
加强政府数据整合一直是我国电子政务建设的重要工作。在这个过程中,党中央、国务院及有关部门都在相关文件中对此提出了明确的要求,初步形成了有关政府数据整合的政策体系。根据这些政策要求,一些地方比较好地开展了政府数据整合工作并发展出比较成功的建设经验。这方面,江西省走在全国的前列。从2009年开始,江西省就开始了全省数据共享交换平台的建设,在思创数码科技股份有限公司的技术支持下,最早在全国规划建设省市县三级交换平台。到2018年底,初步建成“江西省政务数据共享和开放平台”:从业务系统对接情况来看,共有22个单位的49个系统与共享开放平台实现了“系统通”;从数据资源汇聚情况来看,人口库汇聚了公安厅、人社厅、民政厅和司法厅等库表数据共计1.4亿余条,法人库汇聚了司法厅、交通厅和信用平台等库表数据超过2000万条,初步实现了“数据通”;从支撑政务服务应用情况来看,“赣服通”实名用户累计总数超过320万户,累计上线赣服通事项为514项,初步实现了“应用通”。
政府数据整合是一项系统工程。从这个意义上讲,我国国家层面的政府数据整合工作还面临着很多不足,存在不少问题。具体情况如下:
(一)原有的信息化认知管理体系日益失去其应有价值和功能
虽然我国早在1997年就从理论上提出了科学合理的信息化认知框架,并构建了适合中国特色的信息化管理体系,为支撑我国经济社会信息化发展提供了重要的基础保障;然而,大概从2010年开始,我国原有的信息化认知体系和信息化管理体系受到诸多挑战和困扰,特别是由于没有明确信息化与诸如大数据经济、“互联网+”、数字经济、(新型)智慧城市等概念的关系,我国多年前行之有效的信息化认知管理体系日益失去其应有功能和价值。
这也给我国各地的电子政务规划建设带来诸多困扰。一些基础性工作没有得到应有的重视或坚持,如基础信息采集与标准化建设、云计算中心的规划建设、数据治理体系建设、重硬件建设轻信息资源与环境建设,等。这些问题阻碍了政府数据的高效整合,使得我国政府数据共享开放问题无法取得实质性的进展。
(二)缺乏顶层设计直接阻碍政府数据的有效整合
当前,无论是整个国家信息化建设还是国家电子政务建设层面,都缺乏相应的顶层设计,政府数据整合面临更加复杂的局面。特别是大家对于如何认识新一轮信息化条件下的电子政务总体架构仍然存在着很多不同的认识,例如全社会对于“互联网+”就有着“千人千面”般的观点和看法,这也使得人们对于认识、理解和应用“互联网+政务服务”存在着各种各样的认识和做法。
(三)政府数据整合缺乏有效的理论和技术方法
这些问题主要表现在以下两个方面:
首先,我国没有建立统一的电子政务数据参考模型,没有构建明确的政府数据架构。美国、英国等电子政务先进国家都已经尝试建立了自己的电子政务数据参考模型及其相应的政府数据架构。
其次,对于基础数据库建设没有相应的评判标准。我们在2002年就明确要建设基础数据库(基础信息库),但一直没有建立相应的标准规范和评估体系,在实践中表现为随意性较大。因此,无论是地方还是一些部门,随意确定各自的基础数据库建设;即使是在国家规划层面,我们对于基础数据库的建设,其内容也一再變化(除了人口、法人和空间地理三个基础数据库)。
第三,我们还没有建立相应的政府数据管理(治理)体系。建立数据治理机制并在此基础上建立更加系统完善的数据管理知识体系,是保障数据质量、改进和提高数据管理效能的基础性工作,这已经成为数据管理科学的重要共识,也是促进大数据产业发展的必要条件。在这方面,国际上也已经建立了一些相应的标准和规范(例如,国际数据管理协会所制定的数据管理知识体系),而且近年来越来越多的行业、企业开始应用这些标准规范加强自身的数据管理。毫无疑问,这些数据管理标准和规范在应用于政府数据管理(治理)时,还必须根据我国的政治和行政管理体制特点进行必要的修改完善。
(四)缺乏相关的法律法规与制度
无论是实现政府数据共享,还是实现政府数据开放,都必须进行相应的制度体系的整合。就内部共享来说,相对比较好处理;但就政府数据的对外开放来说,制度建设的内容就比较多,也需要花费比较长的时间。就政府数据开放问题来说,这方面的制度建设问题表现在以下几个方面:
1.法律法规尚不健全。政府数据开放比政府信息公开的要求更高,问题更复杂,需要在法律法规层面提供细致全面的保障。但我国在这方面所面临的法律问题仍然较多:首先,虽然我国在2008年颁布实施了《政府信息公开条例》,但是就政府数据开放来说,《政府信息公开条例》是远远不够的。其次,我国对于个人隐私和商业秘密的保护面临来自互联网的严峻挑战。欧盟和美国都就网络时代关于个人隐私和商业秘密保护制定了具体的法律制度,如欧盟的《通用数据管理条例(GDPR)》。这方面我国尚没有专门的法律法规,相关规定只是散布在《网络安全法》《电子商务法》等条款当中。2018年5月1日实施的《信息安全技术个人信息安全规范》(GB/T35273-2017)虽然在架构上借鉴了欧盟GDPR的立法框架,但这仅仅是一个推荐性的国家标准,并不具备强制性。第三,关于数据权属,目前也无法律规制,这对政府数据开放是个巨大的阻碍。
2.我国还没有制定专门的政府数据开放战略。开放政府数据要比公开政府信息来得复杂,牵扯的内容更加广泛,务必规划清楚。从美国、英国等国家的政府数据开放实践来看,这些国家都制定了相应的政府数据开放战略与实施路线图,并配以相应的政策体系作保障。
我国虽然在多年前就在相关文件中要求开放政府数据,但还没有制定专门的国家政府数据开放战略与实施路线图。而且,从一些文件来看,我们在对于政府数据开放的路径选择上,还没有形成统一认识。此外,我国在政府数据开放方面的组织体系建设和必要的技术标准规范方面仍然没有建立、完善起来。因此,虽然有关文件确立了要求在2018年底前建成国家政府数据统一开放平台的目标,然而由于很多基础工作没有完成,我国的政府数据开放仍然任重道远。
七、加强政府数据整合、实现共享开放的政策建议
实现政府数据的开放共享,需要我们超越政府数据本身去规划政府数据,从多方面进行整合,统筹考虑、协同推进。这些不仅包括网络、硬件设施与业务系统的整合(硬整合),也包括业务分类、业务规范的数字化、标准化,以及基础数据资源与业务数据资源库的整合(软整合)。为实现这些整合,需要我们在技术、理论和政策上进行创新,探索适合我国实际的政府数据共享开放模式。
(一)基于轻装信息化,重构和创新信息化建设格局
长期以来,包括电子政务在内的我国信息化建设实践常常受到各类新名词、新概念、新说法的冲击,使得我国20多年前所建立的科学有效的国家信息化认识体系即“信息化七要素论”无法得到深入发展。为此需要我们在充分融合新一代信息技术的基础上,进行信息化的理论创新。
新一代信息技术的快速发展已经实现了信息化由重装向轻装的转变。与重装信息化相比,轻装信息化在基础设施(物联网、云计算等)、网络(移动宽带)、大数据以及行业门户网站治理等诸多方面都日益表现出多樣化特征,需要我们加强研究,从不同层面完善、丰富轻装信息化的理论与实践。当前,尤其要以轻装信息化去综合认识新一代信息技术对信息化建设的各种新作用、新现象、新业态、新形式,并根据轻装信息化要求优化我国的信息化建设管理体制。为此,可以考虑以轻装信息化为理论基础,以“互联网+”为政策总纲,以数字经济为发展方向,构建科学合理的信息化政策框架。
(二)加强电子政务和政府数据的顶层设计
这方面包括诸多的建设、改进、完善的建议。就当前的情况来看,主要包括如下若干方面。
1.采取有效措施强制推进国家政务外网建设。电子政务外网是国家电子政务的核心基础设施,长期以来一直是各类信息化和电子政务发展政策、规划文件的重要内容,但就当前情况来看,电子政务外网的发展并不尽如人意,从中央到各省的带宽只有155M,直接影响到其网络使用效益,无法发挥其统合业务专网的作用和功能。
今后应该明确定位电子政务外网地位,并将其应用纳入各部门电子政务建设的考核内容;增加其带宽和网络功能,促进各职能部门将更多业务专网向外网迁移;完善外网应用机制,为应用部门提供更多服务权限。
2.研究规划政务云中心建设。政务云中心建设是未来电子政务和政府数据整合的基本方向,在规划政务云时,必须注意到如下几个方面的关系:与政务外网的统筹;与地方政务云建设的关系;与“互联网+政务服务”平台体系和全国一体化的国家大数据中心的统筹;研究起草可信政务云建设与应用管理规范。
3.围绕全国一体化在线政务服务平台建设,简化优化相关内容。省级及以下地方政府的政务服务平台,应该依托本级政府门户网站统筹建设,并与各级办事大厅(行政服务中心)紧密结合,形成统一高效的电子政务前台—后台服务体系,实现政府门户网站与行政服务中心的线上—线下的充分融合。
4.基于行政法和行政管理逻辑关系,构建我国的电子政务业务参考模型。从实现国家治理体系和治理能力现代化出发,根据职责、职权、管理手段之间的行政逻辑关系,研究构建适合我国国情的电子政务业务参考模型,并以此修改、完善《政务信息资源目录体系第4部分:政务信息资源分类》(GB/T 21063.4-2007)及其相关标准规范。并在此基础上,结合“放管服”改革,研究构建科学合理的国家政务服务事项库和公共信息资源开放平台的开放数据集。
5.综合应用合适的技术方法构建我国的电子政务数据参考模型。
应用主数据管理的理论和方法,指导我国的电子政务基础数据库建设,构建国家主数据,完善我国电子政务基础数据库和基础信息资源库建设运维管理机制。基于元数据和主数据的理论和方法,构建小数据认识框架,深化我们对于大数据的认识和理解。
(三)建立完善我国电子政务数据管理知识体系,实现政府数据管理的体系化、规范化、标准化
数据管理知识体系的最大特点,就是推进数据管理的体系化、规范化、标准化;建立我国电子政务数据管理知识体系,将深化我们对于政府信息资源的认识和理解,有助于加快我国政府数据管理的标准化、制度化建设,为政府数据共享开放提供科学合理的理论与技术支撑。总之,数据管理知识体系是我们开展电子政务顶层设计和总体规划的重要的技术方法。
当前我国已经在建立我国的电子政务数据知识体系,陆陆续续地开展了一些工作。今后应该应用当前正在发展的有关数据管理(治理)的理论、技术与国际标准规范;结合电子政务业务参考模型、数据参考模型的建设,梳理、完善我们正在和已经开展的电子政务基础数据库、政府信息资源目录编制、国家数据共享交换平台、公共信息资源开放试点等建设工作。
(四)明确政府数据(公共信息资源)开放战略路线图
如前所述,政府数据开放是一个需要具备诸多条件做支撑的发展目标。一些先行国家和发展中国家在政府数据开放方面的实践,为我们提供了有益的经验和教训。尽管如此,我国也没必要加入“开放政府合作伙伴”计划,我国的政府数据开放实践仍然必须着眼于我国电子政务建设实践和大数据产业发展需要、服务于国家治理体系和治理能力现代化,协同推进,统筹发展。
当前,首先是必须明确和统一我们在这个问题上的认识,明确和统一政府数据(公共信息资源)开放的说法、概念、内容。在此基础上,研究制定具有中国特色的政府数据(公共信息资源)开放战略及其路线图,并发布相应白皮书;明确政府数据开放战略的发展目标、战略实施步骤、开放原则、开放内容、开放机制等,要以政府数据开放门户网站建设,引领各方面工作;要明确多层次的政府数据统一开放平台及其门户网站的建设路径、政府数据的社会化使用规范;明确要求通过政府数据的开放,推进国内大型互联网(电子商务)平台的数据开放进程。
当前,尤其需要加强对一些地方政府开展的政府数据开放建设实践与公共信息资源开放试点工作的指导、总结,并在此基础上建立推进政府数据开放的一整套组织管理制度。
(五)加强制度建设
为加强政府数据整合、推进政府数据开放共享,我们还必须在现有制度建设的基础上,推进如下三个方面的制度建设。
首先是促进发展类制度建设。例如,政府信息公开法及推进政府数据开放、促进大数据产业发展的相关法律法规、政府数据开放战略及其配套制度如首席数据官制度等。
其次是规范支撑类制度建设。例如,有关公民信息知情权、隐私保护、数据跨境流动、数据开发机构认证、数据资产权属规定等。
第三是技术保障类制度建设。围绕政府数据生命周期管理,建立完善一整套的标准规范;围绕政府数据管理知识体系,研究起草、建立完善全面、系统的制度体系;建立政府数据开放相关的信息网络安全管理制度等。
参考文献
[1] 邓崧、葛百潞:《中外政府数据开放比较研究》,《情报杂志》,2017年第12期。
[2] 丁念、夏义:《发展中国家开放政府数据战略的比较与启示》,《电子政务》,2015年第7期。
[3] 季统凯等:《政府数据开放:概念辨析、价值与现状分析》,《北京工业大学学报》,2017年第3期。
[4] 李广乾:《建设政府门户网站,全面深化电子政务》,国务院发展研究中心《调查研究报告》,2013年第57号(总1906号)。
[5] 李广乾:《电子政务前台—后台服务体系与地方电子政务顶层设计》,国务院发展研究中心《调查研究报告》,2005年第223号(总2493号)。
[6] 陆健英、郑磊等:《美国的政府数据开放:历史、进展与启示》,《电子政务》,2013年第6期。
[7] 邵国安等:《协同发展国家政务外网与业务专网》,《信息化建设》,2018年第12期。
[8]王芳、储君等:《跨部门政府数据共享:问题、原因与对策》,《图书与情报》,2017年第5期。
[9] 夏义:《开放政府数据战略的国际比较与中国的对策选择》,《电子政务》,2017年第7期。
[10] 许超彬、蔡鹏:《基于FEA的电子政务顶层设计思路研究》,《中国新通信》,2014年第10期。
[11] 中国行政管理学会课题组:《我国政府数据开放顶层设计研究》,《中国行政管理》,2016年第11期。
[12] 周大铭:《我国政府数据开放现状和保障机制》,《大数据》,2015年第2期。
[13] DAMA International著、马欢等译,《DAMA数据管理知识体系指南》,清华大学出版社,2012年。
[14] Janssen K., “The Influence of the PSI Directive on Open Government Data:An Overview of Recent Developments”,Government Information Quarterly,2011:28(4).
(責任编辑:王艺璇)
李广乾,国务院发展研究中心信息中心研究一处处长、研究员。