开放政府数据的生态系统能力:模型建构与发展路径
2022-08-06彭勃吴金鹏韩啸
彭勃 吴金鹏 韩啸
(1.上海交通大学,上海 200030;2.清华大学,北京 100084;3.电子科技大学,成都 611731)
在国家加快培育数据要素市场的改革背景下[1],整合、开放、共享政府数据成为一项重要的公共服务创新。随着“棘手问题”的增加和信息技术的发展,公共服务创新的研究焦点从组织内部转向组织间关系,公共服务组织嵌入在生态系统中,需要与其他外部组织共同发展来实现目标[2]。开放政府数据服务的创新导向也经历了“由内到外”的转变,从关注单一政府(数据供给者)作用转向关注开放数据生态系统的作用,即数据本身不能创造社会价值,而是通过政府、企业、公众等多元参与者对数据的开发和利用来实现数据社会价值。数据生态系统可以被建构、培养和管理,以实现系统有效运行和治理目标[3]。其中,哪些因素会影响数据生态系统的有效发展和目标实现是本议题关注的焦点。
“能力”被视为公共服务创新的焦点和来源,通过提供必要的知识、管理、技术和资源的过程实现其目标[4]。“能力”亦为驱动数据开放共享的重要因素,但以往研究主要考察政府的数据开放能力。赵玉攀等探讨了政府根据特定要求向社会提供其持有的数据的能力[5],樊博等分析了政府制度能力、组织安排、技术能力对开放政府数据质量的作用机制[6]。现有研究越来越强调“开放数据生态系统”的重要性[7],研究者的注意力也应该从单一政府组织的内部能力转向多元参与者的内部驱动能力和外部协调能力的层次性能力组合,即开放数据生态系统能力。因此,本文探索“能力”因素对开放数据生态系统发展的作用,提出一个解释假设:开放数据生态系统有效性是系统各组成部分能力组合的实现结果,不同的能力配置和互动关系具有不同的治理绩效。力图在以下方面做出贡献:全面而公允地描绘我国地方政府数据开放生态系统发展现状;从能力理论出发构建数据生态系统模型,识别数据生态系统有效发展和治理所需的结构性能力;通过定性比较分析(QCA)挖掘何种能力配置构型有助于提升开放数据发展水平,即高水平数据生态系统的多元发展路径。
一、我国地方政府数据开放生态系统发展现状
国家高度重视数据资源整合和开放共享工作,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》将培育数据要素市场作为要素市场化配置改革和经济体制转型的重要举措,“推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护”[8]。建设开放数据生态系统,提高开放数据社会价值和预期收益,成为发展数据经济、实现数字红利的关键问题。评估是促进开放数据发展的有效工具,世界各地已经开发了许多开放数据生态系统评估框架,如“全球开放数据指数”(Global Open Data Index),“开放数据晴雨表”(Open Data Barometer)[9]。目前国内最权威的开放政府数据评估项目为复旦大学数字与移动治理实验室自2017年开始推出的《中国地方政府数据开放平台报告》①。该项目定期对我国政府数据开放水平进行综合评价,助推我国政府数据开放生态体系的建设与发展。“开放数林指数”每半年公布一次,其评估指标体系不断优化,从“数据层”(2017年上半年)到“数据层+平台层”(2017年下半年),“数据层+平台层+准备度”(2018年上半年),“数据层+平台层+准备度+利用层”(2019年),逐步形成了完善的开放数据生态系统成熟度评估体系。
对《中国地方政府数据开放平台报告(2019下半年)》中所报告的84个地级市政府“开放数林指数”进行分析,以描绘我国地方政府开放数据生态系统发展现状。表1显示了我国地级市政府数据开放发展综合指数与四个分项指数,在各个发展等级中所占的比例。由表1可知:(1)我国地方政府开放数据发展的总体水平较低。综合发展指数均值为29.76,不足满分(100分)的三分之一。84个地级政府中,高度发展程度(综合指数51-75)的地级政府占4.8%,处于创新领先状态;中等发展程度(综合指数26-50)的地级政府占60.7%,处于稳步推进状态;低度发展程度(综合指数0-25)的地级政府占34.5%,处于亟待发展状态。(2)准备度、平台层、数据层、利用层四个分项指数发展不平衡。各地级政府在使数据集开放、可用、及时、持续等数据层面发展最好,70.2%的地级政府处于中等发展程度;在数据获取、互动反馈、技术发展等平台层面发展次之,46.4%的地级政府处于中等发展程度。政策法规、组织执行、标准规范等准备度层面,75.0%的地级政府处于低度发展程度。在数据开放利用、取得社会经济价值方面,95.2%地级政府处于低度发展状态,这可能是由于影响力的取得需要一定的时间差、政府开放的数据集并非社会所最需要的以及政府与社会互动不足造成的。需要不断扩大行动规模,提高数据质量,加强与社会互动合作,促进市场主体和社会主体参与数据重用,改善影响和绩效。(3)各地级政府开放数据发展不平衡且差距扩大。发展程度最高的贵阳和深圳综合指数得分分别为67.72和61.93,而发展程度最低的徐州和宿迁综合得分仅为3.62。一些地级市呈现稳步前进的趋势,如哈尔滨、惠州、临沂;一些地级市呈现停滞甚至后退的情况,如湛江、无锡、雅安。总体而言,我国开放政府数据实践目前还处于初步发展阶段,总体发展水平较低,地级政府间发展差距较大。其原因可以总结为政策执行“重硬轻软”与“重短轻长”。“重硬轻软”指政府更加关注开放数据门户、基础设施等硬件项目,忽略提升数据质量和范围,忽略提高社会参与有效性和持续性[10];“重短轻长”指多以上海开放数据应用大赛SODA等项目式竞赛的形式激励公众参与,短时间竞赛开发的应用程序往往很快被抛弃,难以产生长远价值。有效管理和协调开放数据生态系统,促进开放数据的可持续发展正当其时。
表1 我国地级市政府数据生态系统水平等级分布图
二、开放政府数据生态系统模型构建
(一)开放政府数据生态系统研究综述
为了理解开放政府数据实践的复杂图景,从生态系统理论入手研究开放政府数据的重要性逐渐增加,目前研究可以总结为以下三个方面:第一,政府数据生态系统的治理目标和影响效应。建立或发展政府数据生态系统的目标包括提高开放数据透明性和操作性,促进数据的使用和创新;促进数字经济发展和经济体制转型;改善公共服务质量,加强社会信任[11]。政府数据生态系统建设还面临着技术障碍、缺乏有效参与等挑战,数据资源的力量尚未被充分利用来改善人类[12],如何发挥数据生态系统功能,实现数据公共价值成为下一步研究的重点。第二,政府数据生态系统的定义和要素。OECD报告指出,需要建立一个开放政府数据参与者生态系统,识别包括公民、私营部门、技术人员、学者和社会组织在内的各个类型的参与者,制定相应的政策和措施,促使参与者的使用和反馈[13]。Zuiderwijk指出数据生态系统由多个参与者组成,每个参与者都有自己的角色,并通过相互协作和竞争关系来促进数据生态系统[14]。Harrison认为开放数据生态系统至少包括政府、用户和创新者三个主体,同时强调环境因素的重要性,将生态系统比喻为提供者、用户、数据、基础设施和机构之间相互关系的概念[15]。目前,“政府数据生态系统”还未形成统一定义,但研究者在系统要素和属性方面形成了一定程度的共识,包括多元参与者的角色和资源、参与主体与环境之间的依赖关系、参与主体通过协作和竞争促进数据生态系统。第三,政府数据生态系统的影响因素和作用机制。多元促进因素及其相互作用的过程是政府数据生态系统形成发展和目标实现的关键因素。一是通过数据流动、反馈的周期实现数据价值,开放数据形成一个数据周期和闭环系统,政府向公众提供数据,通过用户使用的应用程序创造社会利益;当社会感知到开放数据的好处,政府就会被生态系统推动开放更多的数据,从而产生更多的价值创造[16]。二是通过各类型参与者之间的协作以及功能和资源的发挥催化价值,外部环境因素可以刺激参与主体的行动[17]。三是由参与者和活动构成的价值链创造价值,吴金鹏等将开放数据生态系统中价值创造过程分为数据供应、创新与消费三个阶段,共同影响着开放数据发展水平[18]。总结而言,政府数据生态系统相关研究仍处于早期发展阶段[19],未来还需要在多元理论和丰富实践中加强对政府数据生态系统定义、结构、作用机制的研究,为开发和管理数据生态系统提供方法和策略。
(二)开放政府数据生态系统能力模型
模型可以通过描述数据生态系统基本要素、评估数据生态系统功能和成熟度、探究生态系统有效性的影响因素来管理和优化数据生态系统。本研究将能力方法(capability approach)与生态系统相结合,构建开放政府数据生态系统能力模型,旨在识别实现数据生态系统有序运行和治理目标,需要哪些与生态系统相关的结构性要素及其能力。能力方法将资源使用和目标实现相联系,即个人或组织能够在多大程度上自由地利用现有的资源从事有价值的活动、实现管理目标。能力方法是评价个人福利、社会安排、政策设计的一个规范框架,在发展研究方面的应用尤其突出,如社会创新、服务创新[20]。随着生态系统思想的广泛应用,将能力方法与生态系统的关系系统化,将为社会经济服务的生态系统视为增强社会经济发展能力的生态系统[21],探究生态系统能力及其影响效应的研究逐渐增加,包括生态系统服务功能[22]、商业服务创新[23]、社会创新[24]等领域。
开放数据生态系统能力指将数据的潜在价值转换为交付价值,实现系统目标的能力。为构建开放数据生态系统能力模型,本文首先对“开放数据生态系统”进行概念界定和要素分析,即在特定区域范围(如国家、城市),数据、数据主体、数据环境等生态因子动态交互,构成开放的自适应系统。其核心要素包括多元数据主体及其角色,数据主体间的互动协作关系,数据主体与环境之间的连接和作用。其次,将能力方法与开放数据生态系统核心要素一一映射,构建起数据主体与数据环境两个层面的生态系统能力模型。数据主体指开放数据生态系统的行动组织或个人,扮演着一个或多个特定的角色。数据主体能力通过各自的动机、职责、行为得以体现。根据开放数据的使用过程,可以将数据主体划分为供应者(政府)、中间消费者(第三方组织)、最终使用者(社会公众)三类。根据三类主体在数据开放过程中扮演的角色和发挥的功能,将数据主体能力界定为政府数据制度能力、第三方组织数据开发能力和公众信息利用能力。政府制度能力指以制度建设推动数据开放共享的能力,政府的支持、关注和参与是推动数据开放与共享的关键。但政府行为不能仅限于提升数据质量,而是要进行制度建设,为数据开放共享提供制度合法性,降低了参与者机会主义行为发生的概率,促进数据主体之间的有效沟通与互动关系[25],持续性地推动数据开放利用。第三方组织数据开发能力指企业、社会组织、个人等多元主体利用开放数据创造新产品、新服务的能力。比如在抗击新冠肺炎疫情过程中,丁香园、阿里巴巴、腾讯等第三方组织和专业人士利用政府发布的疫情数据,开发出可视化的时空疫情地图、确诊患者同行程查询工具、迁徙数据的地理信息分析等应用,并从多方面审视和解读疫情分布格局和发展态势,为社会公众提供生动直观、专业多元的数据服务,也为政府提供了信息参考和决策支持。公众信息利用能力指社会公众对开放数据及其衍生产品的需求和利用能力。社会公众的支持和认识对开放政府数据的成功发挥着至关重要的作用[26]。公众对数据的需求越高,对政府开放数据诉求越高,对第三方组织发布的数据分析结果越关注,政府和第三方组织越有压力和动力有效开放利用数据,进而有利于开放数据生态系统的数据主体之间的互动协作。
“能力”概念可以分为“拥有的能力”和“实现的功能”,社会和制度环境影响主体偏好以及主体是否选择实现功能[27]。在开放数据领域,拥有数据分析能力的组织或个人并不一定付诸实践,而是受到组织环境的影响。数据主体嵌套在经济、制度、技术环境系统之中,数据环境能力通过影响(鼓励或阻碍)数据主体行动来发挥作用,数据主体也可以反作用于外部环境,适应环境变化,调用环境资源。环境能力可以分为操作性能力和支撑性能力两方面。操作性能力指特定区域内部可以控制、支配的资源,进一步将操作性能力划分为科技能力和财政能力。科技能力指采集、储存、利用海量数据所需要的科技基础。技术突破一直是我们经济历史上许多生产率提高的基础,开放数据与高新技术的结合从高精度的城市地理信息应用到智慧城市建设,无不降低了政府、企业、社会管理和使用信息的成本,便利了大众生活,推动开放政府数据的进一步发展。财政能力指启动和维持许多数据开放共享项目及主体协作所需要的财政和经济基础。财政资源越丰富的行政区域,经济发展水平越高,越有能力支撑数据开放平台建设和项目持续。另一方面,大多数研究发现经济资源水平和透明度水平之间存在正相关关系[28],具备良好的财政收入的政府更有可能采用开放政府运动。支撑性能力指来自特定区域外部,支持、促进区域内开放数据发展的情境和资源,进一步划分为上级政府支持和外部社会支持。上级政府支持指地方政府所属的上级政府对开放数据的重视程度。采纳、执行开放政府数据政策涉及建立一个新的组织架构、业务流程、应用程序,任务复杂,执行难度大。我国属于“压力型体制”,通过上级政府向下级政府下达指标、分解任务、量化考核的方式推动政策执行[29]。外部社会支持指地方辖区社会环境的开放、包容程度。开放政府数据行动具有扩大公民参与、增加政府透明度、减少腐败的治理目标,出于有限理性和自利性动机,地方政府主动推动数据开放的动机不强。现有研究表明,地方政府开放性越强,政策采纳的动机越强[30]。综上,本文构建起了数据主体与数据环境两个层面、七个具体指标的生态系统能力模型。
生态系统的模式具有多维性,开放数据生态系统发展水平的差异可能是由系统能力差异造成的,特定的能力配置更有可能实现高绩效的数据生态系统。实证研究是有助于理解数据生态系统的运作方式和作用机制,识别如何实现“最佳实践”。因此,文章下一节采用定性比较分析(QCA)方法,探究能力视角下实现高发展水平数据生态系统的多元路径,即何种能力组合或配置有利于开放政府数据优质发展,模型如图1所示。
图1 开放数据生态系统能力作用机制模型
三、能力视角下开放政府数据生态系统的多元发展路径
(一)研究方法
本研究采用模糊集定性比较分析(fsQCA)方法,主要出于以下几点考虑:第一,观察我国开放政府数据的发展实践,可以发现不同背景的地方政府具有相同的开放政府数据发展水平,议题符合“多种复杂并发因果”的特征。以贵阳、深圳、哈尔滨和济南四个城市为例,其经济发展水平、科技创新能力、区域位置、市场发育程度均存在较大差异,却成为全国开放政府数据发展水平最高的四个地级市,呈现“殊途同归”的特征。第二,单因素净效应分析或两两变量交互作用分析,难以衡量众多“因素组合”的共同作用。定性比较分析超越了线性关系假设和单一的因果关系,可以识别前因组合(因果复杂性)可以导致相同的结果(相等性)的多种路径,评估特定组合解释结果变量的程度[31]。数据生态系统发展的影响因素是多元的、非线性的,采用组态视角研究多元因素之间的相互作用与组合效应成为有效路径。第三,QCA利用布尔代数将每个案例表示为一组因果关系,并对这些关系进行系统比较,达成多个条件变量组合构型,且无需对跨层变量做特殊处理[32]。从集合关系的角度解释主体、关系和环境因素的相互关系,使本文所提出的开放数据生态系统能力模型具有可操作性。第四,QCA方法适用于中小样本量(10-100)的研究。本文分析样本为我国84个地级政府,样本量未达到“大样本”水平,难以通过回归分析得到稳健结论,也不适用传统的多案例手动比较分析。第五,常用的QCA方法包括清晰集(csQCA)、模糊集(fsQCA)、多值集(mvQCA)、时序性(TQCA)四种形式。我国地方政府开放政府数据发展水平千差万别,往往介于高水平与低水平之间。Ragin为避免二分数据的任意性,引入了隶属度②的概念,开发了一种能够解决集合隶属问题的模糊集定性比较分析方法。因此,本文采用模糊集定性比较分析(fsQCA)方法。
(二)变量设定
条件变量和结果变量直接影响研究的准确性。本研究结果变量毫无疑问是我国地级(含副省级)政府数据生态系统发展水平,采用《中国地方政府数据开放报告(2019下半年)》中“数林指数”的“综合指数”来测量。为降低由于时间效应导致变量因果关系反转的可能性,将自变量的来源时间选择为t-1年,即比因变量滞后一年[33]。采用政策数量测量地方政府制度能力,收集地方政府出台的开放数据相关的政策法规和工作报告的数量,时间截至2018年12月。我国地方政府对中央政策“响应差异”,基于地方资源、地方性知识形成差异化的政策输出[34]。不同地方政府开放数据的注意力配置和制度建设不同。采用《中国城市统计年鉴2018》中“规模以上企业数量”测量地方政府第三方组织数据利用能力。现有数据并没有直接测量第三方组织数据利用能力的指标,因此采用大企业数量作为代理变量,理由如下:数据利用和创新依赖于第三方组织的研发投入,创新的基础研究期具有投入大、收益低、外部性大、不完全排他性的特点,对小企业的吸引力较小[35]。另一方面,组织规模越大,商业成熟度越高,越需要分析政府开放数据,以指导组织决策,调整公司战略,寻找新的发展机遇。采用《中国城市统计年鉴2018》中“互联网宽带接入用户数”测量居民信息利用能力。网络技能是居民使用开放数据来获得更多的信息和参与。因此,在互联网发展程度越高的地方,居民对开放数据的需求越高。采用“财政依赖度”指标测量地方政府财政能力,计算方法为地方财政预算内支出减去地方财政预算内收入,再除以地方财政预算内支出,财政能力属于负向指标。数据来源于《中国城市统计年鉴2018》。“财政依赖度”一方面展示出地方财政能力和经济水平,另一方面展示了对上级政府财政转移支付的依赖。采用《中国城市统计年鉴2018》中“人均专利拥有数量”测量辖区科技能力。现有研究一般采用科技资金投入和科技成果产出测量科技水平,本文以掌握辖区科技现有水平为目的,资金投入更多强调政府对科技发展的重视程度,因此采用“人均专利拥有数量”。采用地级政府所属省级政府数据开放水平测量上级支持,数据来源于《中国地方政府数据开放报告》。上级政府采纳、执行开放数据政策为下级政府提供了执行压力、行政合法性与实践经验,促进下级政府采纳执行开放数据政策。现有研究一般采用上级政府出台政策数量测量上级压力[36],但上级政府执行开放政府数据政策对下级政府的影响大于仅制定政策[37]。因此,本文以代表上级政府政策执行情况的“数据开放水平”,而非上级政府出台“政策数量”作为代理变量。采用《中国城市统计年鉴2018》中国“人均实际使用外资金额”测量城市外部支持。现有研究多采用国际友好城市数量或外资利用水平测量地方政府开放程度。开放数据可以降低区域信息成本与交易成本,吸引外资注入。外商投资可以引进先进技术和理念,有利于经济总量扩大及经济结构转型;通过知识外溢、技术外溢[38],提升区域创新精神,减少发展新事物所遇到的阻力;促进区域开放数据的发展。因此,本文认为“人均实际使用外资金额”指标更加符合研究情景。替换使用“国际友好城市数量”测量外部支持,对发展路径分类结果并无影响。受篇幅限制,真值表(Truth Table)并未在正文列出。
(三)数据校准
数据校准是将变量原始值归一化为0-1区间的模糊集数据。清晰集将原始数据转化为0或者1,模糊集则可以转化为0到1之间的任何数。研究者首先应该选择哪种方法构建模糊集,常见方法包括四值集(0,0.33,0.67,1)、六值集(0,0.2,0.4,0.6,0.8,1)与连续集(任何≥0且≤1的值)。本文条件变量与结果变量原始取值均呈现连续变化的特征,因此本文采用连续值校准数据。其次设定三个定性断点:目标集合中完全隶属于集合(模糊值0.95)的阈值,目标集合中完全非隶属于集合(模糊值0.05)的阈值和交叉点(模糊值0.5)的阈值。使用fsQCA3.0软件将原始数据转化为模糊集分值,得到各变量的隶属度。
(四)数据分析结果
1.必要条件分析。定性比较分析首先要对单个条件变量进行必要条件分析。一致性阈值一般设置为0.9,即如果某个条件变量的一致性大于90%,则该条件变量是结果变量的必要条件[39],意味着单一变量就对结果变量具有决定性解释力,不需要在条件组合分析中纳入此变量。表2为必要条件分析结果,结果显示单个条件变量一致性均小于0.9,不存在必要条件变量,所以七个条件变量均需要纳入条件组合分析中进行进一步的分析。政府制度能力的一致性与覆盖率均处于最高水平,说明政府部门的政策制定与执行能够有力推动辖区开放数据发展。
表2 单变量必要条件分析
2.组合条件分析。构型分析前,需要建立模糊集真值表。真值表是由案例和数据构成的配置表,显示了条件的可能组合。为获取更多的核心条件组合,本文将一致性阈值设置为0.85③,即构型一致性等于或大于0.85的模糊子集编码为“1”;频率值设置为1,消除没有任何观测值的构型。选择“标准分析”进行条件组合分析,并选择“中间解”方案④,得到九种地方政府数据生态系统高发展水平的能力构型,如表3所示⑤。对九条因果路径深入分析,首先可以按照政府是否发挥主导作用,分为政府主导型(包括路径1、2、3、4、5、6、8)以及社会主导型(包括路径7、9)。其次,根据政府行动逻辑可以将政府主导型进一步划分为认同应变型、自发变革型、上级支撑型。
(1)认同应变型的两个条件组合分别为:“政府能力*公众能力*~财政能力*科技能力*上级支持*外部支持”(路径5)和“公众能力*第三方能力*~财政能力*科技能力*上级支持*外部支持”(路径6)。两条路径的原始覆盖率均处于较高水平,说明认同应变型路径具有典型性,代表性城市为贵阳市与深圳市。认同应变型可以解释为在本地财政资源、科技资源充足⑥,并得到上级政府支持和外部社会支持的情况下,当地政府会积极主动推行开放数据实践;由于第三方组织具备良好的数据开发和分析能力,社会公众具备信息需求和消费能力,进而有利于数据主体形成协作关系,促进数据资源流动与整合,共同促进我国地方政府数据生态系统的发展。
(2)自发变革型的两个条件组合分别为:“政府能力*公众能力*第三方组织能力*~财政能力*科技能力*~外部支持”(路径4)和“政府能力*第三方能力*~公众能力*财政能力*~科技能力*~上级支持*外部支持”(路径8)。其中,路径4的原始覆盖率在所有因果路径中最高,能够在38%的程度上解释结果的出现,代表性城市为青岛市、成都市。路径8覆盖率相对较低,仅存在宣城一个案例。自发变革型可以解释为即使在没有上级政府经验支撑与压力驱动下,本地政府也会基于本地资源和知识,积极推行开放数据政策。在本地财政、科技资源丰富,第三方组织发展良好,社会公众信息化水平较高的情况下,政策执行可以取得良好绩效。
(3)上级支撑型的三个条件组合分别为:“~第三方能力*~公众能力*财政能力*~科技能力*上级支持*~外部支持”(路径1)、“政府能力*~第三方能力*财政能力*~科技能力*上级支持*~外部支持”(路径2)和“政府能力*~公众能力*财政能力*科技能力*上级支持*~外部支持”(路径3)。代表性城市为湛江市、铜仁市、潮州市。上级支撑型可以解释为在地方政府依赖于中央财政时,当地政府会紧随上级政府步伐,在上级政府的支持下推行本辖区开放数据实践。在此模式下,第三方组织和公众数据能力、科技能力、外部支持并不重要,反映了上级政府对地方政府执行开放数据政策的重要推动力。
(4)社会主导型的两个条件组合分别为:“~政府能力*~公众能力*~第三方能力*~财政能力*科技能力*~上级支持*外部支持”(路径7)和“~政府能力*第三方能力*公众能力*财政能力*科技能力*~上级支持*外部支持”(路径9)。社会主导型两条路径的覆盖率在所有因果路径中最低,且分别仅对应一个案例:马鞍山市、淮安市,解释力较差。社会主导型可以解释为在政府缺乏发展开发数据注意力时,在科技资源和外部支持的情况下,第三方组织和社会公众以需求倒逼供给,促进当地开放政府数据发展。
总结四种模式,可以发现:第一,以地级市数据生态系统发展水平排序,四种模式的效果排序为认同应变型>自发变革型>上级支撑型>社会主导型。社会主导型的代表城市马鞍山市与淮安市在地级市开放数据发展中排名较低,说明政府注意力配置和制度建设对开放数据发展具有核心影响作用。第二,上级支撑型模式效果不及认同应变型与自发变革型,说明在发挥了政府的主导作用,但未能充分调动其他数据主体的主动性以及社会资源的情况下,开放政府数据并不能充分实现价值共创。这与随着电子政府发展程度越高,行政命令的作用逐步减弱,需要从需求端出发设计政策的研究结论相符合[40]。第三,认同应变型、自发变革型两种模式可以有效推动开放政府数据优质发展,且发展效果相差较小,是本文追求的最优路径。两种模式的差别在于是否具备外部支撑能力,却能取得相同绩效,也说明内部操作性能力促进开放数据发展的作用大于外部支撑性能力。
表3 组态分析结果
四、研究发现与讨论
(一)研究结论
开放政府数据生态系统有利于促进数据创新和价值创造,需要加强对数据生态系统的开发和管理才能更好地实现治理目标。本研究从能力理论出发构建开放政府数据生态系统模型,并运用模糊集定性比较方法(fsQCA),分析数据生态系统能力的多元构型及作用路径。本研究结果表明:(1)开放数据生态系统治理绩效和服务创新是生态系统各组成部分能力发挥的结果,特定的能力配置可以实现高水平的系统目标。(2)开放数据生态系统的能力配置存在多种形态,主要包括认同应变型、自发变革型、上级支撑型、社会主导型四种模式。其中,认同应变型和自发变革型模式是实现数据生态系统发展的最优路径。(3)任何单一因素都不能有效促进开放政府数据的发展。生态系统能力体系具有层次性与互补性,数据主体能力和环境能力共同发挥作用,才能有力推动我国地方政府开放数据的发展。(4)生态系统各个部分对开放数据发展的影响力不同。在我国目前开放数据发展进程中,政府以其权威性和强大的整合动员能力,成为我国开放数据发展的核心条件。内部操作性能力代表了数据主体可以控制利用的各类资源,其作用大于外部支撑性能力。
(二)理论意义与实践价值
本文的理论贡献包括两方面。首先,本文从能力视角建构开放政府数据生态系统的概念模型,并将其操作化为数据主体能力和数据环境能力两个层次,再将数据环境进一步划分为操作性能力和支撑性能力。模型具有层次性和结构性特征,开放数据发展能力体系从单一政府能力向复杂系统能力转变。实证研究验证了“能力的动态组合可以提供比单个能力更大价值”的命题;并发现开放数据生态系统具有“参与者主导”的特点,数据主体通过资源利用和能力开发创造共享利益,是价值数据实现的核心过程。从能力方法出发探究开放数据生态系统的组成部分和作用机制,丰富了数据生态系统领域的研究。其次,从生态系统视角研究开放数据的研究逐渐增多,但对其生成逻辑和作用机制的关注很少。将组态分析方法应用于开放政府数据生态系统研究,有助于识别生态系统因子之间的依赖关系,揭示生态系统中主体、技术、组织和环境因素有效合作促进开放数据发展的作用机制。
在完善要素市场化配置的国家战略背景下,本研究为政府培育数据要素市场、制定开放数据发展战略提供了实践启示。我国开放数据生态系统呈现政府领导型形态,即政府是数据生态系统的中心行动者,掌握着数据开放的主动权。开放数据发展需要政府的领导和推动,才能实现发展目标。政府作为开放数据生态系统的主导者,必须承担起协调、优化系统的职责,根据本辖区的优势和劣势,基于现有资源制定发展策略。可以从鼓励正反馈与限制负反馈两方面着手,包括建立共同目标和多元渠道,吸引多元主体参与;协助多元参与者沟通、互动,建立合作关系;加强自身能力建设,提升数据和数据平台的质量,促进数据利用与创新;发挥监管作用,加强数据安全,避免数据滥用、隐私泄露。另一方面,开放数据的优质发展离不开第三方组织的数据创新与社会公众的数据消费,只有数据主体之间形成良好协作关系,才能“培育数字经济新产业、新业态和新模式”[41]。第三方组织和社会公众作为数据价值实现的关键主体,其数量和规模是生态系统健康的重要标志[42]。在建设共建共治共享社会治理背景下,公共管理者要认识到开放数据系统相互依赖和相互作用的性质,培育、动员、提升多元数据主体数据利用的机会和能力,鼓励开放数据生态系统从集中型走向分散型网络形态,通过赋权的方式调动各数据主体能动性,促进数据生态的良性发展与社会价值的充分实现。
(三)研究不足与未来展望
本研究还存在一些局限:首先,由于QCA方法变量选择的局限性,本文仅选取了7个条件变量检验生态系统能力模型,未能涉及居民教育水平、官员特质、府际竞争等变量;需要检验其他变量影响开放数据的可能性和影响程度,增加理论饱和度。其次,本文基于2019年横截面数据进行分析,但我国地级市采纳开放政府数据政策的时间各不相同,需要持续跟踪分析纵向数据和面板数据。第三,对文中提炼的四种模式的代表性案例未能进行深入分析,可以采用单案例或多案例比较分析,对具有代表性的城市进行深描。未来还可以从以下方面加强开放政府数据发展研究:第一,现有开放政府数据研究多为理论研究,实证研究较少,未来研究必须在方法上更加多样化与严谨化,如采用模拟仿真、双重差分等方法。第二,充分利用国家、国际层面的数据,并结合国家级与国际级数据,进行比较研究与结果印证。第三,现有研究多将政府视为一个整体,并未区分各部门开放数据的动机和利益,可以研究单一部门或者进行部门比较研究,如服务性部门与监管性部门的区别。
注释:
①数据来源:http://www.dmg.fudan.edu.cn.
②隶属度表示不同情况属于某一集合的程度。“1”表示完全属于某一集合;接近“1”表示强烈但不完全从属;小于“0.5”但大于“0”表示小于某个集合但属于该集合的弱集合;“0”表示绝对不隶属于某一集合。
③一致性阈值一般大于等于0.75,fsQCA软件默认为0.8。在案例样本较为丰富,对所有样本细节并未完全把握时,可以选择调整一致性阈值,最高标准为1。本文案例数量大于50,低于100,因此将一致性阈值设置为0.85。
④“标准分析”会产生三种解决方案:复杂解、简约解和中间解。当没有使用“逻辑余数”时产生复杂解,拒绝违背任何案例事实;当使用所有“逻辑余数”时产生简约解,存在违背事实的风险;中间解只包含简单反事实案例的逻辑余项,一般被认为是最佳选择。
⑤符号“*”代表条件连接符,“~”代表“非”,未在构型中出现的条件变量代表对结果无关紧要。一致性(充分性)衡量解决方案是结果集合的子集的程度,覆盖率衡量解决方案在多大程度上解释结果的出现。
⑥财政能力为负向指标,“~财政能力”表示本地财政资源充足,不依赖于上级财政。