地方政府数据开放水平的驱动因素与提升路径研究*
2022-09-28上官莉娜夏本倩
上官莉娜 夏本倩
(武汉大学政治与公共管理学院,武汉 430072)
1 问题的提出
大数据时代背景下,政府开放数据已成为各国责任政府和透明政府建设的重要战略之一。所谓政府数据开放是指政府将其拥有的数据无条件向社会开放,从而使所有人都可以自由地访问、获取、使用并分享政府数据[1],这不仅能够提高政府自身透明度,还有助于实现公众赋能、促进社会创新。上海是我国第一个对数据开放进行探索的城市,在2012年建立了国内首个地方政府数据开放平台,其后各省市纷纷效仿推进,政府数据开放至此进入蓬勃发展阶段。到2021年底,我国共有173个城市建立了政府数据开放平台,呈现出数量多、覆盖面广但发展不平衡的特点。然而,当前学界多聚焦于省级层面的政府数据开放研究,地方平台的探究有待丰富与完善,探讨地方政府的数据开放水平驱动因素和提升路径具有一定的理论价值和现实意义。
《中国地方政府数据开放报告(城市)》(2021下半年)[2]对我国173个城市的政府数据开放平台建设情况进行评估并排名,在排名前50的城市中,山东省所属的城市数量最多,16个地级市均上榜,其中青岛、烟台、济南、临沂、日照、潍坊6个城市位居前10,德州、威海、济宁和聊城4个城市位居11~20名,滨州、东营、枣庄、泰安4个城市位居21~30名,菏泽和淄博分别位居第31名和33名。在同期省级政府数据开放水平排名中,山东省位列全国第二,相较于其他省份,山东省政府及其下辖的地方政府数据开放水平整体较高。这16个城市在行政级别分布上,除了青岛和济南属于副省级城市之外,其余均属于地级市,同一级别的城市异质性不高,同一省份内的城市受省级层面因素的影响差异不大,这些城市的政府数据开放水平差异更多的是受其自身因素的影响。那么是哪些因素驱动了这些城市的政府数据开放?提升地方政府数据开放水平的路径有哪些?本文尝试做出回答。
当前学界关于政府数据开放水平驱动因素的研究,主要集中在单因素分析和多因素分析两方面。在单因素研究中,有的学者专注于讨论政府政策、公民需求、公众参与等单一因素对政府数据开放水平产生的影响,例如:Zuiderwijk等[3]考察了荷兰7项不同级别的政府政策对政府数据开放的影响;Piotrowski等[4]探究了公民对政府透明度的需求是如何影响地方政府数据开放的;陈朝兵等[5]研究了如何通过不同的公众参与模式驱动政府数据开放水平提升。但有学者认为单因素不足以解释各地政府数据开放水平存在差异的复杂性,进而基于不同的理论视角,从制度逻辑[6]、历史性-能力性-外源性因素[7]、资源基础理论[8]、TOE理论[9]等视角出发,综合考虑制度、法律、财政资源、社会环境等复合因素对政府数据开放水平产生的影响。例如:Yang等[10]从技术、组织、法律和环境4个角度探讨我国台湾地区政府数据开放的影响因素;汤志伟等[11]从政府创新扩散理论出发,围绕“政治-经济-社会”三要素构建模型对我国18个省级、副省级和地级政府的数据开放平台进行研究,解释地方政府数据开放发展存在差异的原因;韩啸等[12]基于TOE框架对115个国家的政府数据开放水平进行实证研究,结果表明,ICT基础设施、政府能力以及全球化在政府数据开放中发挥着关键作用。但这些视角多是从静态角度展开,集中于讨论数据供给侧的政府作用,而忽略了数据需求侧,即多元社会主体对政府数据开放同样具有重要意义。政府数据开放实际上是一个动态的生态系统,该系统围绕数据资源这一核心要素运转,政府在其中发挥着关键性作用,同时公民、企业、社会组织等也发挥着不可缺少的助推作用,各个要素在复杂的环境中进行互动,共同影响着政府数据开放的整体建设水平。基于此,本文引入数据开放生态系统理论,该理论能够较好地契合政府数据开放运转过程,以此构建地方政府数据开放水平驱动因素的分析框架,有利于凝聚学界共识,拓宽研究视野。
综上,本文以山东省下辖16个城市的地方政府数据开放平台为研究对象,基于数据开放生态系统理论,采用定性比较分析方法(Qualitative Comparative Analysis,QCA),探究地方政府数据开放水平的驱动因素及其组合,以期为国内其他城市提供借鉴与参考,从而提高我国地方政府数据开放整体水平。
2 理论基础和分析框架
2.1 数据开放生态系统理论
生态系统最初是一个生态学概念,指的是生物与其所处的环境彼此作用,共同构成的一个稳定有机整体。随后这一概念被应用到其他学科,例如,在信息管理学中,Davenport等[13]提出了信息生态系统概念,即在特定的环境中,由人、实践、价值以及技术构成的复杂系统[14]。我国学者在此基础上将其定义为由信息自身、生命体与周围环境相互联系、相互作用构成的复杂有机整体[15],包含信息、信息人以及信息环境三大基本要素[16]。Pollock[17]于2011年提出数据开放生态系统概念,为相关研究提供了新的方向。郑磊[18]进而提出包含政府、数据开发者、社会公众、环境等要素在内的政府数据开放生态系统。Reggi等[19]认为数据开放生态系统包含政府、媒体、非政府组织和公民用户四类关键行为者,其中政府发挥着核心作用。王卫等[20]通过文献编码研究,构建了包括利益相关者、数据流、价值实现、内外部环境等要素在内的政府数据开放生态系统。综上,本文将政府数据开放生态系统定义为由数据、数据人以及数据生态环境三大基本要素构成的复杂有机整体。其中:数据要素,即整个系统正常运转所围绕的核心;数据人要素,即参与政府数据开放过程的所有个体或组织等主体性要素,基于数据生命周期理论并借鉴Ponte[21]对数据开放主体的划分,将其具体化为数据提供者、数据利用者和数据消费者;数据生态环境要素,即影响政府数据开放发展的相关环境。
2.2 分析框架
根据以上分析,本文认为地方政府数据开放水平的驱动因素主要包括六方面。一是数据资源。我国大量有价值、可开发利用的数据都掌握在政府手中,政府开放数据就是把这些数据资源尽可能地向公众开放,因此政府所提供的数据资源的丰沃程度对数据开放水平具有关键影响作用。对外开放的数据越丰富,越能够驱动政府数据开放水平的提升。二是数据提供者的供给能力。数据提供者在我国主要是指政府等公共部门,其承担着数据开放、平台建设等职责,政府的信息服务能力反映了政府对数据开放的响应、推进与供给能力,因而将其视为政府数据开放水平的重要驱动因素之一。三是数据利用者的开发创新能力。数据利用者是指从事政府数据二次开发利用的科技企业、专家学者、社会组织等个体或群体,通过开发移动应用、Web应用、参加数据开放创新大赛等推动地方政府数据开放纵深化发展,整个社会的开发创新能力能够反映政府数据的利用情况,因而能够对政府数据开放水平产生驱动影响。四是数据消费者的数据需求程度。将数据消费者聚焦于社会公众,政府数据开放的最终目的是为公众服务,因而必须考虑消费者的数据需求。公众的需求一方面体现了数据的潜在价值,另一方面也能够促使政府按需扩大数据供给,因而被视作政府数据开放水平的主要驱动因素之一。五是政策环境。我国地方政府数据开放平台的建设以及数据开放项目的开展是上级政府高位推动的结果,政策环境在其中发挥了重要作用。有研究表明政治环境中的法律政策因素对政府数据开放水平的影响程度最深[22],因而本文将地方政府所拥有的政策支持程度视为政府数据开放水平的重要驱动因素。六是经济环境。数据开放作为政府创新活动之一,会受到经济环境的深刻影响,地方经济发展水平越高,越能促进政府数据开放的高水平发展。
据此,本文将数据资源、政府信息服务能力、社会开发创新能力、公众数据需求程度、政策支持度以及经济发展水平确定为影响地方政府数据开放水平的驱动因素。
3 研究设计
3.1 研究方法
QCA是由拉金提出的一种超越传统定性和定量分析的新的社会科学研究方法,是一种根据条件和结果之间集合关系进行因果逻辑判断的集合分析方法,认为条件变量不是独立的、单方面对结果产生影响,其意义和作用取决于与其他条件变量的组合[23]。就研究方法而言,国内外学者对政府数据开放水平的研究多集中在定性描述或定量研究。例如:曾月[24]采用扎根理论研究方法对政府数据开放水平的动力因素和阻力因素进行探究;门理想等[25]、曹慧琴等[26]采用最小二乘法(OLS)回归分析,通过定量方式探讨我国地方政府数据开放建设成效的影响因素。定性描述多基于学者的理论知识对数据开放现状、存在问题等进行分析阐述,客观科学性有待考量,而定量研究通过单一的线性关系进行因果推断,可能无法充分解释政府数据开放的复杂运行机理。而QCA方法弥补了定性和定量分析的不足,也整合了二者的优势,一方面可以通过组态视角,识别出高水平政府数据开放的核心因素,对因素间的不同排列组合进行讨论,能够更好地解释政府数据开放系统运转的复杂因果关系;另一方面该方法在数据处理上不受样本量限制,对大、中、小样本分析均具有适用性,因此能够较好地处理本文16个小样本量。QCA方法按照其处理的数据类型可具体分为清晰集、多值集和模糊集定性比较分析。基于数据开放生态系统所探究的地方政府数据开放水平驱动因素是复杂多样的,且多是连续变量,无法简单进行二分处理,故本文采用模糊集定性比较分析方法(fsQCA)。
3.2 样本选择
本文选取山东省下辖16个城市的地方政府数据开放平台作为样本,主要基于以下考虑:其一,地方政府主要是依托本地的数据开放统一平台开展相关工作,平台研究能够客观地反映各地政府数据开放的实际情况;其二,以往的研究多以省级政府数据开放平台为主,面向省级以下地方政府层面的研究尚显不足;其三,在观察各地政府数据开放建设成效时,发现山东省地方政府数据开放水平普遍较高,因此本文以山东省地级市平台为重点,同时考虑青岛和济南两个副省级城市,探讨地方政府数据开放水平的驱动因素。
3.3 变量设计及校准
3.3.1 结果变量
本文以山东省16个地方政府数据开放水平为结果变量,数据源自2022年初发布的《中国地方政府数据开放报告(城市)》中的“开放树林综合指数”(见表1),该报告由复旦大学数字与移动治理实验室发布,能够较为科学地衡量我国地方政府数据开放的实际水平。
3.3.2 条件变量
根据本文的分析框架,共确定数据资源、政府信息服务能力、社会开发创新能力、公众数据需求程度、政策支持度、经济发展水平6个条件变量,具体变量描述及数据来源见表1。
表1 变量测量及数据来源
3.3.3 数据校准
数据校准,即赋予案例集合隶属分数,基于布尔代数理论,所有校准后数据的隶属度在0~1。校准的核心在于确定3个定性锚点,即完全隶属、完全不隶属和交叉点。本文运用直接校准法,将样本数据的95%和5%分位数设为“完全隶属”和“完全不隶属”,50%分位数设为“交叉点”,运用fsQCA3.0软件中的校准函数calibrate对原始案例数据进行校准,校准后的结果见表2。
表2 变量校准
4 实证结果分析
4.1 必要条件分析
必要条件分析即检验结果集合在多大程度上能够构成条件集合的子集,根据QCA分析逻辑,将一致性高于0.9的条件变量视为导致结果产生的必要条件。表3是对6个条件变量进行必要性分析后得出的一致性和覆盖度数值,结果显示:只有政策支持度的一致性高于0.8,但未达到0.9,说明该变量构成高水平政府数据开放的充分非必要条件;所有条件变量的一致性均低于阈值0.9,意味着能够对结果变量产生直接影响的必要条件不存在,地方政府数据开放水平的提升是由诸多因素共同决定的,因此需要进行组态分析。
表3 必要条件分析
4.2 条件组态分析
组态分析旨在揭示不同条件组合与结果之间的充分性关系。首先根据样本量确定案例频数阈值,本文只有16个地方样本,故将频数阈值设为1;组态的充分性可用一致性衡量,将其确定为0.80;考虑PRI一致性可避免矛盾组态的出现,参考Greckhamer[27]做法,将PRI临界值设为0.65。基于以上数值的确定,最终得到3种解,即复杂解、中间解和简约解,从中选取方案简洁、合理有据的中间解作为结果输出。如表4所示,地方政府实现高水平数据开放共有5种不同条件组态,每个组合的一致性均高于0.900,表明其能够很好地解释结果变量;解的一致性为0.959,说明在符合这5种组态的地方政府数据开放案例中,有95.9%的政府开放数据平台呈现出较高的开放水平;解的覆盖度为0.695,意味着这5种条件组合可以解释69.5%的具有高水平政府数据开放的案例。通过组态分析得出的一致性和覆盖度数值均高于最低临界点,说明得到的是有效的分析结果,可进一步将这5种驱动政府数据高水平开放的条件组态归纳为全要素驱动型、政策支撑型和需求-供给联动型3种具体类型。
表4 地方政府数据开放水平的驱动因素组合
(1)全要素驱动型,对应表4中的组合1和组合2。这种类型表明,对于数据开放政策环境较好的地方政府而言,拥有丰富的数据资源再加上有着较为积极的数据相关方,数据利用者主动开发应用,数据消费者积极使用反馈数据,就可以取得较高的数据开放水平,而政府的信息服务能力高低以及地方的经济发展水平等因素并不是实现政府数据高水平开放的必备因素。组合1的一致性是0.983,可以解释35.0%的地方政府数据开放案例,典型代表城市是潍坊。潍坊市2021年人均GDP排名全省第七,经济实力和科技实力与其他城市相比不具备显著优势,却有着较高的政府数据开放水平,主要是该市政府数据开放生态系统全要素共同发挥作用的结果。2019年1月27日潍坊市大数据局正式揭牌成立,为数据开放工作的开展提供了组织机构上的保障,此外政府还通过制定公共数据开放年度工作计划、发布数据标准规范为数据开放给予政策法规支持,鼓励社会组织、企业以及公众使用开发政府数据,并对数据申请开放情况予以公示,及时回应公众需求,通过多方互动交流,该市的政府数据开放水平得以提升。组合2的一致性是0.985,可以解释41.5%的政府数据开放案例,城市代表有济南、青岛和烟台。这三大城市包含两个副省级城市和一个GDP排名全省第一的地级城市,在推进政府数据开放建设方面具有明显的政策环境、经济基础和数据资源等优势,以其强大的城市基础吸引了大量的科技从业人员,城市创新能力居全省前列。其中烟台市数据利用者共开发出98个创新应用,在数量上遥遥领先于其他城市,数据的潜在价值得以充分发挥。三大城市在省政府的高位推动下,积极响应大力推进本市的政府数据开放建设,加之公众主动向政府申请公开所需数据,促使政府按需开放更多、更优质的数据,在多方协同互动下实现高水平政府数据开放。
(2)政策支撑型,对应表4中的组合3和组合4。在该组态中,政策支持度起到了核心作用,其他要素发挥补充性作用,这说明拥有数据开放政策环境支撑的城市,辅之具备较高信息服务能力的政府,就可以实现地方政府数据高水平开放。组合3的一致性是1,该组态能够解释22.9%的政府数据开放案例,代表城市是日照市。山东省高度重视大数据的发展,将数据开放提升至全省战略地位进行考量,出台《数字山东发展规划(2018—2022年)》《山东省数字政府建设实施方案(2019—2022年)》等规划举措,推动本省政府数据开放纵深发展。日照市政府不仅积极转发省政府的政策文件,进行政策解读,还主动印发《日照市关于支持数字经济发展的若干政策》《数字日照暨新型智慧城市发展规划(2020—2023年)》等系列政策法规和实施细则,为提升本地的政府数据开放水平提供了有力的政策支撑。组合4的一致性是0.976,可以解释25.2%的高水平政府数据开放案例,代表城市是临沂。临沂市政府数据开放实现高水平发展,很大程度上也是基于该市为推进政府开放数据建设营造了良好的政策支持环境。例如:临沂市人民政府于2018年发布《关于成立市电子政务和大数据发展专项小组的通知》,为统筹推进数据开放提供专门的组织机构支持;2020年印发《临沂市公共数据资源开发利用试点实施方案》,探索公共数据资源开发与利用,发挥数据的经济和社会价值;2022年市政府发布《临沂市“十四五”数字强市建设规划》,对一体化大数据平台的完善发展提出明确要求。根据日照市和临沂市案例可知,营造良好的政策支撑环境是推动地方政府数据开放高水平建设的基础前提和关键要素,也是驱动地方政府数据高水平开放的可行路径。
(3)需求-供给联动型,对应表4中的组合5。在该组态中,数据资源和公众数据需求程度发挥了核心作用,表明市民对数据有着较高的使用需求,政府对高需求做出有效回应,并实现数据资源的高效供给,便可提高政府的数据开放水平。组合5的一致性是0.923,可以解释28.3%的高水平政府数据开放案例,且有11.0%的案例仅能被该组态所解释,代表城市是德州市。德州的政策支持度在全省16个城市中排名第九,2021年人均GDP排名全省第十,环境因素在整个数据开放生态系统中发挥的优势作用并不明显,但政府注意力倾斜于公众数据需求并高效回应,从而推动数据开放落到实处。据德州公共数据开放网数据统计,截至2022年4月,德州市政府数据开放平台的用户访问量突破200万,用户注册数接近2万,政府针对用户的高数据需求开放近1亿条数据,这与位列数据开放水平全省第一的青岛市体量相当。此外,该平台还根据公民的建议和反馈对数据及时做出调整,通过需求与供给双方的互联互动提升数据开放水平。
4.3 稳健性检验
为保证研究效度,本文还进行了稳健性检验。首先调整一致性阈值,对其采用更高的值0.9和更低的值0.75进行替换,其他处理方式不变,检验结果与先前结果保持一致。其次调整PRI阈值,将其从0.65调高至0.75,案例频数1和一致性阈值0.8保持不变,输出的中间解组态数量由原先的5个减少至4个,检验结果与原结果存在子集关系,组态的内在解释机制不变。最后调整校准锚点,将条件变量和结果变量的交叉点提升至55%分位数,其他处理方式保持不变。检验结果显示,组态的数量减少至4个,核心条件基本保持不变,一致性(由0.959提高至0.989)和覆盖度(0.695降低至0.623)数值发生较小的变化,但变化不足以支撑与原先结果存在实质性差别的解释。因此,可判断本文的研究结论是基本稳健的。
5 讨论与启示
本文在对山东省16个地方政府的数据开放驱动因素进行组态分析后发现,其在全国范围内拥有普遍较高的数据开放水平,不是由单个因素决定的,而是受到数据资源、数据相关方以及数据生态环境等多因素的交互影响,其中政策支持度、数据资源与公众数据需求程度组合发挥着核心作用,并将提升地方政府数据开放水平的5条路径归结为全要素驱动型、政策支撑型以及需求-供给联动型。虽然在全国173个已开通地方政府数据开放平台的城市排名中,山东省下辖16个城市位居前列,地方政府数据开放水平整体较高,但就省内城市而言,也存在排名先后,各地政府数据开放水平存在差异。其原因在于各地在政策支持环境、数据开放资源以及公众需求等核心驱动条件方面,资源拥有程度不一,可以用数据开放水平排名相对靠后的淄博、泰安、枣庄、菏泽等城市来解释。山东省政府高度重视大数据发展,发布系列政策文件促进并指导公共数据开放,为政府数据开放工作提供了良好的政策环境。日照、临沂等地方政府正是抓住这一政策红利充分释放契机,成立专项工作小组,制定适合本市实际的工作方案。但并非所有地方政府都是如此,如淄博、菏泽等只是转发上级的政策文件,缺乏具有良好适应性的本土配套政策,短期内难以实现较高的数据开放水平。此外,政府向社会开放的数据资源是否丰富,市民对公开数据的需求强度,对提高地方政府数据开放水平也具有显著影响作用。泰安、枣庄等地公众对数据的需求程度不高,2021年度依申请公开件数不过千,数据的潜在价值没有被充分挖掘;由于缺乏高需求驱动,政府向外开放的数据资源量不足2 000万条,与开放上亿条数据的城市相比差距明显,呈现出“双向乏力”特征。基于以上分析,可以得出山东省各个地方政府间的数据开放水平存在差异,主要取决于地方政府对外开放的数据资源是否丰沃,公众对数据是否有高需求,以及是否有相应的政策支撑环境。
本文的研究结论为我国地方政府如何提升数据开放水平提供了一些启示和建议。第一,对于经济环境、政策环境、人才储备、公民素质各方面基础较好的城市而言,如直辖市、副省级城市,可通过发挥数据开放生态系统全要素的作用这一路径提升政府数据开放水平。这些城市往往有着雄厚的经济基础,能够为数据开放平台建设提供强大的财力支撑,同时也要重视引进人才工作,提高城市的开发创新能力,制定相应的数据开放政策法规,为政府开放数据营造良好的政策环境。此外还要发挥好数据开放相关方之间的联动效应,倡导公众、企业、社会组织等多元主体参与到政府数据开放建设中,基于公众需求政府要开放尽可能多且优质的数据资源,鼓励数据利用者积极创新,通过协同努力带动地方政府数据开放水平的整体提升。第二,对于具有一般资源禀赋且正在努力推进政府数据开放的地级城市而言,比如地级市,应提高政府数据开放的战略地位,释放数据开放政策红利,以达到提升政府数据开放水平的目的。第三,对于发展基础薄弱、暂不具备明显资源优势的城市,政府既要积极主导制定相关政策,更要注重供需两端协同、内外双向发力。大数据时代下,要让政府数据开放平台成为实现供需匹配的连接枢纽,实现公民需求与政府供给之间的耦合互动。
本研究尚存不足有待完善。首先,选取山东省16个地方政府数据开放平台进行研究,一方面样本量较少,另一方面同一省份下的城市异质性不够,可能受到相同的政策环境和行政文化影响,由此得出的政府数据开放水平驱动因素组合的结论推广解释力度不够。其次,政府数据开放水平的影响因素众多,基于数据开放生态系统理论选取的变量可能存在一定局限性,基于数据可得性和已有的研究成果选取的测量指标,与复杂的现实情况相比可能存在一定偏颇。因此,未来可选取更多的地方政府样本,不断完善条件变量,选取更加全面、客观、准确的测量指标,进一步改进和深化研究结论。