当前中国政府数据开放平台建设存在的问题与对策研究
——以北京、上海政府数据开放网站为例
2015-09-13黄思棉张燕华广西大学公共管理学院南宁530003
黄思棉,张燕华(广西大学 公共管理学院,南宁 530003)
当前中国政府数据开放平台建设存在的问题与对策研究
——以北京、上海政府数据开放网站为例
黄思棉,张燕华
(广西大学 公共管理学院,南宁 530003)
大数据时代,政府数据公开日益受到各界关注。笔者分析了北京、上海两市政府数据开放网站建设和运营情况,针对网站存在的开放数据范围窄、更新周期长、含金量及利用率低等问题,提出促进政府数据开放平台建设的有关对策。
政府;数据开放;平台;大数据
大数据时代,政府作为最大的公共数据资源拥有者,有责任和义务通过数据资源开放,提升政府治理水平、促进透明政府建设,推动整个社会挖掘政府数据的巨大价值,以增加民众福祉。从2009年美国政府提出“开放政府计划”并建设政府数据公开平台Data. gov网站起,包括英国、法国、加拿大、澳大路亚、新西兰和新加坡等国家也陆续制订和实施了具有本国特点的政府数据开放计划。中国政府也逐步意识到大数据时代所带来的机遇和挑战,正采取措施积极应对。2013年8月,中国国务院发布的《关于促进信息消费扩大内需的若干意见》中明确提出,要加快政府职能转变和管理创新,促进信息资源开放共享和企业公平竞争,推动市政公用企事业单位、公共服务事业单位等机构开放信息资源。目前,中国国家层面的政府数据开放平台尚未开始建设,但是部分信息化建设和政务公开的先进城市,例如北京、上海、青岛、杭州等城市已尝试开展政府数据开放的工作。
1 国内数据开放平台建设的基本情况
从全球经验来看,政府数据开放平台往往采用专门数据网站的形式,以满足社会公众对数据访问和下载的需求。目前,中国政府数据开放方面宣传较多、影响面较大的城市有北京市和上海市,这两个城市均是直辖市,且社会、政治、经济和文化发展均走在全国各省区的前列,有典型示范作用。通过这两个网站的建设与服务情况分析,可以了解中国政府数据开放的实施情况和存在的问题。为此,笔者根据网站公开的信息收集了有关数据(数据截至2015年4 月10日),对数据项个数、应用程序个数、下载量、更新时间和频度进行了统计。
1.1北京市政务数据资源网建设基本情况
北京市政府数据资源网(www.bjdata.gov.cn)由北京市经济和信息化委员会牵头建设,北京市各政务部门共同参与,于2012年10月开始试运行。据笔者统计,该网站汇集了36个政府部门的313个数据项,数据文件下载格式有CSV、DBF、SHP、SHX、TXT等几种,累计数据下载26 754次。该平台目前仅有7个App可供下载,无下载量显示,总关注量为7 230次。企业、科研机构和个人只要在该网注册,同意网站免责声明的用户都可以在数据资源网下载和上传内容。该网站最大的亮点是免费提供大量的地图API、搜索API及其开发样例。据其介绍,用户可根据自己的需求创建自己的地图应用程序,可在自己的网站中构建操作简单、功能丰富的地图应用。数据项的更新情况见表1。
1.2上海市政府数据服务网建设基本情况
上海市政府数据服务网(www.datashanghai.gov.cn)由上海市人民政府办公厅、上海市经济和信息化委员会牵头建设,相关政府部门共同参与,于2014年5月正式开通。2014年11月,在中国智慧政府发展年会上,该网站荣获本届政府网站特色评选“数据开放实践领先奖”。据笔者统计,该网站汇集了35个政府部门的466个数据项数据,数据文件下载格式为XLS,目前累计数据下载35 353次。在这个数据平台上,可供下载的应用程序目前有15个App,185次用户下载。目前,该网注册功能尚未完善,外地IP地址用户还不能够顺利下载数据。数据项的更新情况见表2。
表1 北京市政务数据资源网数据更新时间情况统计表
表2 上海市政府数据服务网数据更新频度统计表
2 当前政府数据开放平台建设存在的问题
从北京市政务数据资源网和上海市政府数据服务网的数据下载次数、应用情况及用户体验来看,笔者认为这两个网站还远远未达到其推动信息惠民和社会化开发利用,更好地满足社会信息消费需求的目标。这两个数据开放平台主要存在如下问题。
2.1开放数据的范围太窄,数据规模小
政府数据涉及到民众的方方面面,种类繁多,形式多样,规模巨大。有研究认为,中国政府掌握着社会80%以上的数据资源。因此,获取政府数据是大数据技术能广泛应用绕不过去的一道至关重要的门槛。然而,北京市政务数据资源网2012年10月开始运行迄今,可公开的数据项只有313个,应用工具7个;上海市政府数据服务网从2014年5月运行至今,可公开的数据项也才466个,应用工具15个。在这两个平台网站的公开数据项中,较多的是统计数据、简单的单位地址数据以及经过简化后的审批数据,均不具有与民生相关的实时交通、物价、天气和经济运行等数据。相比之下,美国Data.Gov于2009年5月上线发布,到2011年12月,就开放了原始数据3 721项(注意是原始数据),汇集了1 140个应用程序和软件工具、85个手机插件。由此可见,这种差距是相当巨大的。
2.2更新周期过长,影响数据的使用价值
数据时效性是数据的生命所在,数据价值随着时间的推移将逐步贬值。时效性是大数据可用性的重要指标,信息集合中每个信息应在合理的周期内更新,以确保使用效能。例如,某数据库中的用户联系方式在2011年是正确的,但在2013年未必正确,即数据过时了。据统计,商业和医疗信息库中平均50%的用户信息在2年内可能过时,而过时信息将会导致严重后果。根据笔者统计,北京市政务数据资源网上,2013年12月以前的数据项有256个,占总数据项的82%;而上海市政府数据服务网更新频度3个月以上的数据项有367个,占总项数的79%。很显然,缺乏及时有效的更新机制,严重滞后的数据、时效性不强的数据,是难以获得公众的关注和青睐的。
2.3数据含金量不够,缺乏研究和挖掘的价值
在这两个平台网站开放的数据项中,相当多的是单位地址数据和政府审批统计数据,据笔者粗略统计约占总数据项的85%以上。其他的数据也主要是经过简化后的审批数据,不具有较高信息量的行政管理数据和与民生相关的实时交通、物价、天气以及经济运行等原始数据。例如,北京市政务资源网上公开的星级酒店数据项,该数据是北京市旅游发展委员会登记注册的北京市星级饭店信息,内容只包括名称、星级、区县、地址、电话和邮编等属性字段,没有各类客房数量、客房空置率以及房价等方面的关键内容。另外,各部门间提供的数据彼此间缺乏关联,没有参照项,单个数据项的记录数基本上在1 000条以内,无法挖掘其内在价值。政府数据开放的目的是促进数据的综合应用,挖掘数据的内在价值,但信息蕴含量如此“贫瘠”的数据难以实现信息的增值服务。
2.4数据实际利用率低,主动服务意识淡漠
据笔者统计,北京网站数据下载总量是2.67万次,上海网站是3.53万次,另外,这两个网站可供下载的应用程序的数量合在一起也不超过30个,应用程序的下载量更是少得可怜。这一方面是数据内容、含金量的问题,很多数据下载后并无多少挖掘的价值;另一方面也是网站服务意识淡漠、宣传推荐不够导致的。以笔者体验上海市政府数据服务网的用户注册功能为例,经反复尝试始终无法实现用户注册(可能是限制了外地IP地址注册,但没有任何说明),另外,该网站也没有提供任何反馈技术故障、提供服务咨询的联系方式。以这种敷衍和不负责的态度开展数据开放工作,难以获得社会认可,也达不到数据开放的实际效果。
3 促进政府数据开放平台建设的措施
从当前北京市政务数据资源网和上海市政府数据服务网的应用情况看,所谓数据资源网,资源不足;所谓数据服务网,服务不到位,这与当前社会各界对大数据应用的热切展望形成了非常大的反差,令人深思。笔者认为,要促进政府数据开放平台的建设,需认真分析其问题产生的原因,采取有针对性的措施。
3.1提升信息公开的法律地位,为公开数据提供法律保障
当前《政府信息公开条例》的法律效力低于《保守国家秘密法》《档案法》等以信息保密为立法取向的法律,限制了政府数据公开的深度和广度。目前我国政府数据公开还处于起步阶段,考虑到公开的数据可能会涉及到公民的个人隐私、国家安全等重要领域,过于谨慎地防范数据侵权安全风险,制约着政府数据公开的实施。数据公开造成的法律风险远大于数据不公开的法律风险,从这个角度看,北京市和上海市有关部门在数据公开方面的谨慎态度也是可以理解的。为促进政府数据公开的快速可持续发展,政府应考虑在法律顶层设计方面充分改进制度框架,将《政府信息公开条例》提升为《政府信息公开法》以加强信息公开的法律地位,建设相关的配套地方法规和部门规章,进一步明确哪些数据必须面向公众开放,哪些数据可以对特定公众开放,以及数据更新的频度,同时对数据开放中出现的特殊情况制定免责条款,给予一定的制度容错和救济。针对数据开放方面,可适当放松政府行为的管束,以促进政府数据公开;而对数据的利用,可以考虑给予数据使用者较严格的限制和规定,以保护国家秘密、商业秘密以及个人隐私。
3.2以攻坚克难的工作态度和担当精神,积极推进数据开放
政府数据从理论上来讲都是财政投入产生的,除涉密数据以外都应公开。另外,根据《政府信息公开条例》的规定,医疗卫生、教育、供水、供电、环保以及公共交通等与社会公众利益密切相关的公共企事业单位在提供社会公共服务过程中制作、获取的信息均应主动公开。可事实上政府部门普遍不愿意开放数据,主要是基于以下几点考虑。一是把数据资源看成是本部门的权利资源,垄断数据有可能给部门或下属企事业单位带来巨额利益;二是开放数据将把政府部门的决策和管理过程进一步置于公众的监督之下,将大大限制政府部门的运作权力和办事效率;三是开放数据有可能引起公众针对数据的大量咨询和质疑,也涉及到后续的数据更新和维护,大大增加工作量,本着多一事不如少一事的本位主义,不愿意开放数据。而政府管理的公共企事业单位为维护其垄断地位和所谓的商业秘密,其拥有和掌握的数据资源更难开放。由于政府数据开放工作牵涉的部门众多,事项繁杂,各种利益纠结其中,光靠某一部门牵头负责,在现有的管理体制下,同级机构之间没有隶属关系,协调难度大。由此可见,数据开放实际上是一个管理课题或政治课题。因此,政府数据开放要真正重视和推动起来,就要以政府为主要领导牵头,将其列入年度“民办实事”的事项之中,对各部门的数据收集和整合做好全盘统筹协调、制定详细的实施进度,明确责任追究办法,才能取得实效。
3.3充分依托现有信息系统,以备份或链接方式实现数据开放
我国经过20多年的电子政务建设,政府的管理信息系统及数据的采集处理几乎覆盖各业务部门和主要公共服务,各个部门的业务信息系统建设都卓有成效。北京市、上海市各个政府部门的门户网站都建设得非常好,网站公示给社会公众的信息种类和信息数量,要远远大于提交给政府数据开放平台的数据。由此可见,很多政府不是没有数据,也不是不能公开数据,而是愿不愿意将这些数据单独提交出来供社会研究与应用。因此,当前亟需进一步破除部门分割的数据壁垒,以便政府数据能及时、有效地面向社会公开。笔者认为,现阶段可以通过以下两种方式实现政府数据公开平台的数据收集和整合工作:一是对政府各部门的业务信息系统进行改造和升级,特别是针对其后台数据库系统以数据备份的方式将数据同步到政府数据公开平台上,再由数据平台提供给社会访问;二是规范数据接口的访问方式,将数据平台上的数据项访问条目直接连接到相应的政府各部门政务网站上,由政府部门的门户网站提供需要的数据。这样可用极少的代价和很短的周期实现政府数据开放平台的功能,取得政府数据开放的实效。
3.4推动社会评议制度建设,加强对数据开放的绩效考核
数据开放本质上还是政府信息公开的一种形式,因此,完全适用《政府信息公开条例》中指出的要建立健全政府信息公开工作考核制度、社会评议制度和责任追究制度,定期考核评议的要求。但在实际执行过程中,考核往往流于形式。一方面,相关责任人在考核评议过程中,认识不到位,搞形式主义;另一方面,信息公开是一项专业性较强的技术行为,由于大量的非专业人士参与考核导致监督缺乏专业性,从而使得体制内的监督难以达到应有水平。笔者认为,政府数据开放工作既然是直接面向社会公众,为社会公众服务的,就应该摒弃之前政府自我执行、自我监督的弊端,倡导、推行社会评议的方式。数据开放工作做得好不好,满不满足社会实际需要,不能由有关部门自说自话,应由社会公众来评价。这就要求政府转变思维模式,从传统的统治型和管理型转为服务型,在征集社会评议上以服务水平、服务效率以及服务实效作为设立评价指标的出发点,具体实施中要明确评议的范围、实施流程和具体落实方式等。另外,还要将社会评议的结果与对部门的考核及干部的选拔任用和奖罚结合起来。这样可促使政府部门及其负责人更加重视数据开放工作,不断提高数据服务意识,得到上级和社会的肯定。
4 结 语
对于大数据应用而言,政府数据获取是一道绕不过去的门槛,数据开放也已成为各国的共同趋势。目前,我国政府数据开放步伐较落后,国家层面的政府数据开放平台尚未开始建设,而北京、上海等城市的数据开放平台建设遇到的困难也警示我们,政府数据开放工作任重而道远。数据开放工作是个政治课题,需要破除部门壁垒,斩断利益纠葛,中国政府进行数据开放平台建设必须要有担当精神、服务意识和惠民意识。
主要参考文献
[1]李建中,刘显敏.大数据的一个重要方面:数据可用性[J].计算机研究与发展,2013(6).
[2]申灿,闫利平,张宝来.大数据时代地方政府信息公开的现状[J].法制博览,2015(2).
[3]中国信息产业网.英美:数据公开、社交互动成潮流[EB/ OL].(2015-05-20)[2013-07-30].http://www.cnii.com.cn/ thingsnet/2013-07/30/content_1193700.htm.
10.3969/j.issn.1673 - 0194.2015.14.134
D63
A
1673-0194(2015)14-0175-03
2015-05-02