APP下载

开放政府数据何以成功?
——生态关系理论视角的跨国实证研究*

2020-08-12吴金鹏

图书馆论坛 2020年8期
关键词:公众水平政府

吴金鹏,韩 啸

0 引言

自2009年美国政府推出第一个开放数据平台以来,开放政府数据在全球范围内迅速扩散,已有79个国家加入开放政府伙伴关系[1]。2013年,八国集团发布开放数据宪章,承诺开放政府数据并提高开放数据的质量、数量和再利用[2]。开放政府数据已成为各国在公共卫生、财政、教育等政府部门采纳的主要创新之一[3],能实现提高政府透明度、加强公众问责[4]、商业创新[5]等效益。尽管各国重视开放政府数据建设,投入了大量资源,开放政府数据仍面临政治障碍、财政压力、数据质量欠佳、隐私泄露等挑战。各国政府开放的数据集,只有不到10%数据以机器可读形式发布,大量重要数据处于“休眠”状态①;数据来源呈现极端化,3%政府机构贡献99.37%数据集,大多数政府机构不愿开放数据[6]。由于发达国家和发展中国家之间存在严重的数字鸿沟与技术鸿沟,因此这些挑战在发展中国家更严峻。2017年“开放数据晴雨表”数据显示,开放政府数据排名前30位的国家中有26个是高收入国家,存在严重的发展不平衡现象。联合国将“数据革命”作为推动实现全球可持续发展的重要手段[7],如果无视各国在开放政府数据发展水平上的差距,将继续扩大国家间发展的不平衡。

现有研究认为,开放政府数据发展主要受技术能力和经济发展水平制约[8-9]。然而透过对现实情况的观察,可以发现一个国家的开放政府数据发展水平并不必然随着信息技术基础和经济发展水平提升。比如,捷克信息技术水平全球排名22位②,开放政府数据水平位于第31位③,大大落后于信息技术水平第42位的巴西(开放政府数据排名第18位)。再如,卡塔尔人均GDP位列第一,而开放政府数据排名第73位,菲律宾经济发展水平(排名第80位)虽然远远落后卡塔尔,但开放政府数据排名第22位。可见,既有研究并未能很好地揭示开放政府数据发展水平的影响因素与作用机制。开放政府数据既不纯粹是技术问题,也不是单一的资源问题,只从某一维度进行观察无法为开放政府数据跨越发展障碍提供帮助,需要综合审视影响开放政府数据发展的关键因素。因此,本文从生态系统理论视角,采用大样本和多变量分析各国开放政府数据实践的驱动因素和障碍,并提出改善策略,缩小各国开放政府数据发展差距,促进开放政府数据可持续发展。

1 文献综述

开放政府数据根源可以追溯至数百年前政治学“开放政府”理念[10]。关于开放政府数据发展水平的实证研究,可以分为3 种观点:组织视角、环境视角和生态系统视角。组织视角源自斯隆学派关于技术与组织在社会环境中互动的观点[11],认为技术的执行会受到组织形式、制度安排和行政过程等影响[12]。组织支持、组织兼容、公平创新的组织文化正向显著影响政府大数据能力,权力集中的组织结构与政府大数据能力呈负相关;权力距离在集权的组织结构与政府大数据能力的关系中起反向调节作用,信息架构在组织支持与政府大数据能力的关系中起正向调节作用[13]。制度规范是影响开放政府数据绩效的关键因素[14],政府部门拥有的数据、基础资源、组织安排和技术能力显著正向影响开放政府数据的水平[15]。环境视角的理论基础来源于塞尔兹尼克对组织制度化的研究,组织的外部社会环境是构成组织制度化的外部成因,作为一种社会构成,组织嵌入在社会环境之中,因而组织行为是建立在“适应环境,生存发展”的目标基础上[16]。在开放政府数据中,数据开放方和数据利用方都受到环境因素的影响。既有研究发现,地方经济实力和信息产业发展水平正向显著影响开放政府数据平台发展程度[17];社区、企业与媒体需求正向显著影响政府开放数据行为[18]。而经济结构越单一,政府开放程度越糟糕[19]。还有研究发现,公众压力、上级压力可正向调节制度能力与开放政府数据质量之间的关系[4]。生态系统视角将开放政府数据视为一个不断适应、成长的互动系统,不仅描绘出现有情况,还阐述人们可能试图创造的条件,激发人们对培育开放数据生态系统的思考,增加实现政策目标的可能性[10]。Dawes等基于社会技术系统理论,将开放政府数据视为一种社会技术现象,提出技术与组织在社会环境中共同演化的观点[20]。Harrison等提出开放政府数据工作是一个包含行动者、组织、基础设施、关键资源的相互依赖的社会生态系统[10]。郑磊从数据生成、开放、利用、产生效果等角度构建了动态循环的“生态系统”[21]。

总体而言,既有研究存在两点局限:(1)理论模型的解释力受到挑战。学界对开放政府数据发展水平的解释存在较大差异。既有研究对同一变量使用不同的测量方法或代理指标,使得研究结果出现不一致。例如,有研究指出来自领导层的支持对实现开放政府数据的目标至关重要[13],而在其他研究中却没有得到证实[14,17]。这表明一方面某些因素的影响机制存在不确定性,需要进一步研究确定;另一方面已有研究大多使用问卷调查、案例分析等进行研究,研究样本的局限可能影响了研究品质。因此,需要扩大研究样本的来源范围以检验变量的稳健性。(2)理论研究有待进一步深化。目前的研究虽然分析了社会经济环境、法律制度与政策、科技等对开放政府数据发展水平的影响,但缺少共识性解释。既有研究集中讨论作为数据供应者的政府所具有的功能与作用,忽略了数据利用和公众参与对开放政府数据发展的重要意义。鉴于此,本文引入生态系统理论,以开放政府数据供应、创新与消费3个过程为基础建构理论模型,利用115个国家在2013-2016年的跨国数据,实证检验影响国家间开放政府数据发展水平的关键因素。

2 理论模型与研究假设

生态系统被定义为在特定的本地环境中由人、实践、价值和技术组成的系统,系统各部分相互依赖、相互调整,使系统在运转中实现平衡[22]。很少有人尝试将生态系统隐喻的全部组件映射到政府中,大部分研究者选择将生态系统的部分术语应用于开放政府数据研究中,如探索数据生产者和用户之间的互动过程[23-24]。开放政府数据要实现良性发展、创造公共价值,仅仅开放数据是不足的,必须促进不同利益相关者的参与,更好地了解公众需求,促进数据利用和再利用[25]。本文从开放政府数据生态系统价值创造过程的数据供应、数据创新与数据消费入手构建模型,以解释开放政府数据良好发展的动力。具体而言,数据供应涉及政府机构,是参与者网络的中心行动者,掌握着公开数据开放进程和策略的主动权,并通过政策制定和组织实践促进生态系统的创建和发展。数据创新涉及拥有处理复杂数据能力的公司、非政府组织等机构,以创新的方式促进数据增值。一方面可以开发原始数据,以有偿或无偿的方式,将数据处理结果或更易使用的格式向社会公众发布;另一方面可以开发用于查找和使用数据的工具。数据消费主要涉及社会公众,使用开放政府数据进行决策、参与公共事务等。价值创造过程嵌套在更大的经济、社会、法律、技术环境系统之中,受到环境系统的影响。据此,提出以下研究假设。

2.1 数据供应

政府数据的开放主体是政府,政府需要充足的资金和人力应对开放政府数据挑战。治理能力指一个国家有序行使权力的过程和制度的集合,反映了政府制订、执行和健全政策的能力[26],政府数据治理能力决定了开放政府数据的绩效[27]。创建和运行开放数据需要借助政府强大的治理能力实现,有效的治理可以确保公众需求的及时响应、公共服务的有效供应。因此提出假设:

H1:政府的治理能力正向影响开放政府数据发展水平。

启动和维持政府数据开放需消耗大量的财政资源与人力资源。资源依赖理论指出,松弛的资源状况是组织行动的重要条件,丰富的资源为组织行为提供保障[28]。地方政府是否具有丰富的资源是开放政府数据工作能否启动、运行与发展的主要影响因素。因此提出假设:

H2:政府资源正向影响开放政府数据发展水平。

2.2 数据创新

信息与通信技术(information and communications technology,ICT)基础设施代表了一个国家的硬件平台、软件支持和计算机网络水平,是数据利用、转化、创新的技术基础。拥有良好的ICT 基础设施可以提升开放政府数据的可及性,降低公众或组织获取、使用成本,助力数据创新的实现。Relly等面向122个国家的实证研究发现,ICT 基础设施与政府透明度呈显著正相关[29]。因此提出假设:

H3:ICT基础设施的建设水平正向影响开放政府数据发展水平。

国家创新能力反映了一国产生新的技术和非技术知识,将创意转化为新产品和新服务的能力。开放政府数据需要通过创造式利用,才能给不具有复杂数据分析能力的公众带来使用价值。国家创新能力越强,对开放政府数据的需求和数据转化利用能力越强,越会推动开放政府数据的发展。因此提出假设:

H4:国家创新能力正向影响开放政府数据发展水平。

2.3 数据消费

公众参与对开放政府数据实现成功具有重要作用[30]。公众参与度越高,政府与公众之间的互动越强。Girish 等基于国际比较发现,政府绩效、问责、监管质量等重要指标与公众参与密切相关[31]。提升政府绩效、政府透明度以及加强公众问责是开放政府数据致力实现的目标。基于此,公众的参与可以实现诉求的及时传递,为政府快速响应公众需求,为公众参与公共事务、监督政府行为提供信息与知识。这种良性互动将促进开放政府数据发展。因此提出假设:

H5:公众参与度正向影响开放政府数据发展水平。

人力资本指国民受教育的程度,所拥有的知识和能力是数据使用的技能基础。既有研究指出,受教育程度越高的公众,关心公共事务的意愿与能力越强,对开放政府数据的需求越高[32-33]。政府为回应公众需求,将进一步推动开放政府数据发展。因此提出假设:

H6:人力资本正向影响开放政府数据发展水平。

3 研究设计

笔者选择万维网基金会发布的“开放政府数据晴雨表”中各国开放政府数据发展水平的评估数据作为因变量“OGD(OpenGovementData)”,原因在于:一是2013-2017年开放数据晴雨表已开展5次评估,是时间跨度最长的评估项目,可以提供较好的观测数据;二是唯一经过同行评议专家调查的国家比较指标,被学界采纳较多。由于2013-2016年开放数据晴雨表各国得分数据是相对值(0~100分),而2017年数据得分计算方式不同(得分绝对值)且仅报告排名前30位国家的数据。为保证研究质量,采用开放政府数据晴雨表中2013-2016年的开放政府数据得分作为因变量的取值,共获得370个研究样本。

自变量治理能力“governance”采用世界银行发布的世界治理指数(WGI)作为代理变量进行测量。政府资源“resources”选择遗产基金会每年发布的经济自由报告中的政府开支指标进行测量。该指标衡量对政府支出的限制,政府支出越低,得分越高,是负向指标。国家创新能力“innovation”使用世界经济论坛“全球竞争力指数”中的“创新”指标测量;ICT 基础设施“ICT_ infrastructure”使用“全球竞争力指数”中的ICT基础设施水平作为代理变量。采用“全球竞争力指数”的“高等教育和培训”指标测量一国人力资本“human_capital”,该指标包括教育质量和数量,涵盖工作人员培训。使用联合国电子政务调查报告中的电子参与指标对各国的公众参与“participation”水平进行测量。

将各国经济发展水平和区域位置作为控制变量。经济发展水平“GDP_PC”指一国经济发展的规模和水平,按购买力平价(Purchasing Power Parity,PPP)计算的人均GDP(现价国际元)测量,以10 为底进行对数处理。区域位置“region”根据世界银行(2018年)的分类,将各国分为7类,即北美、拉丁美洲及加勒比、欧洲及中亚、东亚及太平洋、南亚、中东及北非、撒哈拉以南非洲[34]。由于大规模收集跨国一手数据难以实现,因此使用来自不同国际机构报告的二手数据,但这些机构声誉良好、遵循严格程序和准则收集数据,资料具有较高的可信度。

具体分析方法的选择,出于3点考虑:(1)研究使用的分析数据均来自研究报告、统计年鉴等公开资料,其发布时间与评估对象不固定,如因变量来自2013-2016年的开放政府数据晴雨表报告,每年评估的国家不完全相同④,可判定数据属于独立混合横截面数据[35]。(2)参考国内外研究对此类数据的处理方式,如Kittel等对福利国家与全球化关系[36]、王霞等对企业环境信息披露[37]和周建等对创新型企业公司治理结构与绩效关系[38]等研究使用最小二乘法(OLS)模型对此类型数据分析的做法。(3)对数据进行计算,满足高斯-马尔可夫定理进行线性回归分析的假定先决条件,即均值为零、同方差、相互独立以及与自变量之间线性无关[39]。因此,选择OLS模型对数据进行分析。为降低变量间关系反转的可能性,将自变量的来源时间定为t-1年,即比因变量滞后1年[40]。构建的多元回归模型如下:

4 研究结果

4.1 描述性统计

表1是各变量的描述性统计分析。以因变量为例,各国在开放政府数据发展水平的均值为33.17,仅为满分三分之一,表明总体发展水平较低。2016年只有21%国家得分在50分以上,50%以上国家低于当年均值32.5。在推断性分析前,对自变量进行共线性分析,结果显示方差膨胀因子(VIF)均小于5,不存在共线性问题。为降低回归结果偏差,使用相关分析、T 检验、Wilcoxon Z检验、多元回归分析,逐步递进地检验了各自变量对开放政府数据发展水平的影响。

表1 研究变量的描述性分析

表2显示开放政府数据发展水平与自变量之间的相关系数矩阵。治理能力、政府资源(负向指标)、ICT基础设施、创新能力、公众参与和人力资本均与开放政府数据发展水平呈显著的正相关关系,6个研究假设得到初步支持。

表2 相关系数矩阵

本文的自变量和控制变量中,除区域位置外,均为连续变量。为进一步检验各变量对开放政府数据发展水平的影响,本文将自变量和控制变量中的连续变量按中位数分组,以检验不同分类标准的两组样本中开放政府数据水平的差异,结果如表3所示。对组间均值差异进行的T检验结果显示,所有的检测变量均显著,且与预期方向一致。使用Wilcoxon Z检验对组间中位数做进一步的差异检验,结果显示所有的检测变量统计显著。差异性比较分析进一步支持了本文的研究假设。

表3 开放政府数据发展水平的差异性比较

4.2 回归分析

采用逐步回归法依次构建7个模型,检验自变量与因变量关系的稳健性(见表4)。模型1检验了数据供应主体治理能力和政府资源对开放政府数据发展水平的影响,模型2检验了数据创新中ICT基础设施和创新能力的影响,模型3检验了数据消费中公众参与和人力资本的影响。模型4是模型1和模型2的合并分析,模型5是模型1和模型3的合并分析,模型6是模型2和模型3的合并分析,模型7将模型1、模型2和模型3中的8个变量进行汇总检验。表4显示,7个模型都在0.01的显著性水平上显著;在基线模型依次加入新的变量之后,模型的R2逐步增加,模型的解释力不断提高。模型7的调整后R2为0.761,表明研究模型可以很好地拟合数据,具有较强的解释度。就7个模型中的变量关系而言,治理能力在所有模型中均达到0.001 水平上的显著性,因此,可以判定假设1通过,这与既有研究发现一致[15,41]。政府资源在模型1和模型4中与因变量的关系没有达到显著性水平,虽然在模型5和模型7通过显著性检验,但稳健性不强,因此假设2不通过。这一发现对强调资源作用的环境视角提供了强有力的反对意见。变量ICT基础设施在模型2、4和6中通过检验,在模型7未通过,该变量具有较好的稳健性,假设3得到通过,与现有研究发现一致[33]。创新能力在所有模型均通过0.01水平上的显著性检验,假设4通过,这在我们的知识范围里是首次通过经验研究证实了国家创新能力会正向影响开放政府数据的发展水平。公众参与在所有模型中与因变量的分析数值均达到0.001水平上的显著性,假设5通过,这一发现印证了公众参与理论强大的解释力。人力资本在模型3 通过检验,但在模型5、6、7 均未通过,假设6未获得支持,这与一些实证研究的结论相反[42]。综合上述内容,研究提出的假设1、3、4和5通过了检验,假设2、6未通过检验⑤。

表4 回归模型分析结果

5 结论与讨论

本文借鉴生态系统理论,构建“数据供应-数据创新-数据消费”理论框架,实证检验影响各国开放政府数据发展水平的关键因素,这对中国政府正在进行的实践以及其他国家缩小在该项目上的发展差距,具有重要的理论与实践意义。研究发现,治理能力、创新能力、公众参与是促进开放政府数据发展的关键因素,ICT 基础设施对开放政府数据发展有一定的影响力,政府资源和人力资本的影响力较弱。

5.1 理论意义

本文通过对以往开放政府数据发展研究的梳理,引入生态系统视角,深化和拓展了开放政府数据的研究,具有理论意义。

(1)目前研究集中在环境、组织与技术因素对开放政府发展水平的影响,大多从供给侧考察影响开放政府数据发展的因素,忽略了需求侧,如数据利用与社会力量参与的作用。开放政府数据的未来将由提供数据的政府、公众和私营部门之间的关系来推动,政府开放数据能力与社会公众数据利用能力相互匹配、相互作用才能发挥出最大的社会经济价值。本研究从生态系统理论入手,构建“数据供应-数据创新-数据消费”理论框架分析开放政府数据系统的利益相关者及其相互依赖关系。实证结果表明,数据供应、创新、消费均影响开放政府数据发展水平,因此促进开放政府数据的发展,必须要识别并促进数据供应、创新、消费过程中各利益相关者的参与和使用。

(2)本文首次检验了国家创新能力对开放政府数据发展的影响。创新能力突出了社会力量的作用,如企业会从商业机会的角度来处理政府数据,在企业提供数据产品时,政府、公民和创新者会产生互动,从而使数据、信息和技术被转化为创新产品[10]。实证结果显示,创新能力对开放政府数据发展具有显著影响,这一方面表明开放政府数据并非任何人都可直接使用,其价值的创造并非自动产生,需要有良好的数据转化能力,才能被公众所理解和利用,产生知识积累。另一方面,创新者与政府、公民相互作用,促使新数据标准的产生,以及信息系统设计、技术平台等创新,才能推动开放政府数据发展。

(3)ICT基础设施对开放政府数据发展具有较大影响力,但没有达到预期的显著稳定水平,因为随着其他变量的加入,ICT基础设施的影响力逐步减弱。不应该忽略信息通信技术的基础性作用,它是数据供应和数据消费的桥梁。但如果只考虑技术因素,那么开放数据发展则会遭遇瓶颈。需要注意的是,ICT基础设施发挥作用的方式受到政府与社会、政府间以及更大的社会背景的影响。一些拥有高水平ICT基础设施,开放政府数据发展水平却较低的国家,应该制定促进其他利益相关者参与和协作的措施,加强环境支持。

(4)本研究发现政府资源、人力资本影响力较弱,这与一些实证研究的结论相反[15,33,42]。本研究中,政府资源只有随着公众参与和人力资源变量的加入时,其影响力才逐步显现,说明政府只有在感受到公众需求和压力时,才会把政府资源用于发展开放政府数据。结合公众参与的显著影响力来看,人力资本影响力较弱的原因可能是当下全球开放政府数据建设还处在“让数据开放起来”的起步阶段,这一阶段主要由政府来主导,仅有愿意参与政治的部分公民发挥了促进开放政府数据发展的作用,大部分国民还未意识到政府数据的价值或未能参与开发数据。因此,公众的教育和培训水平并不会产生直接影响。

5.2 实践意义

本研究结果在一定程度上为各国实践提供了方向,为制定促进开放政府数据发展的措施提供参考。目前开放政府数据发展处于初期阶段,各国需要在实践方面做出努力,推动开放政府数据发展,具体包括:(1)政府应该承担起优化数据质量、搭建技术平台、提高数据管理效率等与数据供应直接相关的责任。(2)资源和技术在开放政府数据发展中存在瓶颈效应,而治理能力、创新能力、公众参与则是开放政府数据发展的关键因素。这意味着开放政府数据不是密集投资型的改革,不能仅仅投入资金和技术,也不能仅仅把开放数据作为电子政务的一部分去建设,而是需要重建公共部门流程,改变或补充现有电子政务实践中的机构设置和法律建设,才能实现良好治理。(3)开放政府数据强调通过开放政府所拥有的数据来鼓励创新,这不是一个政府部门可以单独完成的问题,不能仅仅将公民作为服务对象,而要提供全面参与的渠道,将公民的声音和能力纳入开放过程。政府应激发社会活动家、科研工作者、通信技术从业者和社会公众等重要利益主体的数据使用兴趣并提供政策支持,利用政策工具使数据资源在经济、社会发展中产生更大效益[27]。(4)在各国财政紧缩、预算有限的环境中,政府不能一味投资ICT基础设施,还需要建设开放平台、协作平台,促进国家数据创新能力发展,从而使数据运转利用起来。(5)在数据利用过程中,政府还需要承担起协调、监督数据使用的管理者责任以及促进数据生态健康发展的政策制定者责任。再者,公众、企业、社会组织等其他利益相关者,要在利用数据创造价值、创新数据利用方式和工具的同时,向政府反馈数据需求,倒逼政府提高开放数据的质量和方式;并通过数据创新,助力政府解决一些治理难题,实现社会进步,推动开放政府数据的生态系统持续运转。

5.3 研究局限和未来展望

本研究局限在于:(1)数据供应、创新、消费3个维度中存在未被检测的其他变量,如政府开放意愿、媒体自由程度;(2)未讨论政治因素(政体差异、政治周期、领导人意愿等)对开放政府数据发展的影响。未来研究除改进上述局限外,还可从以下方面展开讨论:(1)将国家分为不同收入阶段或者不同开放数据发展水平进行比较研究;(2)把文化作为控制变量或调解变量,衡量不同权力距离、不确定性规避背景下,开放政府数据发展水平的影响因素;(3)对数据供应、数据创新、数据消费的交互作用进行实证检验,研究变量之间的交互影响。

注释

① 数据来源:2018年开放数据晴雨表。

② 数据来源:2016年世界治理指标。

③ 数据来源:2017年开放数据晴雨表。

④ 2013年数据包括77个国家,2014年包括86个国家,2015年包括92个国家,2016年包括115个国家。

⑤ 控制变量“经济发展水平”和“区域位置”的回归系数为负数。经济发展水平并非与开放政府数据发展水平为负相关关系,而是呈曲线相关关系:Y=1.64X2-16.69X+41.79(R2=0.47)。在初始阶段,开放政府数据发展水平随着经济发展水平的提升而显著提升,但经济发展到达一定程度后,同一经济水平的国家数据开放水平呈现显著差异,其他变量对开放政府数据发展的作用增加。区域位置为分类变量,与因变量负相关,不具有实际意义。

猜你喜欢

公众水平政府
张水平作品
公众号3月热榜
公众号9月热榜
公众号8月热榜
公众号5月热榜
作家葛水平
加强上下联动 提升人大履职水平
知法犯法的政府副秘书长
“政府信息公开”观察
做到三到位 提升新水平