APP下载

QCA视角下我国开放政府数据城市排名变化影响因素分析

2021-02-03

图书馆研究与工作 2021年2期
关键词:变量政府分析

张 斌

(黑龙江大学信息管理学院 黑龙江哈尔滨 150080)

从2009年时任美国总统奥巴马签署《开放透明政府备忘录》到如今,开放政府数据已经有10余年时间。在这期间,全球开放政府数据运动蓬勃兴起,而且已经成为一种潮流被国际和国内认同[1-2]。我国每半年发布一次《中国地方政府数据开放报告》,其中城市的排名会出现变化,但是这种变化背后的因素有哪些,哪些因素的组合可以影响城市的排名还有待于分析。

1 国内外研究现状

关于影响开放政府数据的因素,目前国内相关研究较少,主要集中在实证分析和从用户的角度进行分析。实证分析方面,王法硕等人[3]与智慧交通项目有关的18个工作人员进行访谈,采用扎根理论的方法处理访谈数据,认为社会经济转型、提高政府绩效以及提升企业竞争力5个因素可以影响我国开放政府数据。李梅等人[4]采用解释结构模型法,对影响我国开放政府数据的12个因素进行了验证与解析。王法硕[5]采用定性比较分析方法,将我国47个地市分为两部分,并指出加强地方政府的法制化建设、以政府为主导以及创造良好的外部环境等有利于城市排名靠前,但是两部分的分类较为主观。齐艳芬等人[6]构建相关模型对部分城市的开放政府数据进行了实证研究,发现4个影响开放政府数据的因素并根据发现的问题提出了相关建议。从用户的角度进行分析方面,高天鹏等人[7]采用UTAUT模型,分析影响上海市政府开放数据的主要因素。姜红波等人[8]通过使用问卷调查以及SPSS分析,定量化研究了用户视角下的4个因素对政府开放数据所产生的影响。董姣等人[9]认为心理赋权和自我决策会促使用户积极参与到开放政府数据中,怀疑以及不信任则会削弱开放政府数据的建设。

国外则主要从技术角度和相关政策角度进行研究。从技术角度出发,Gechert Sebastian[10]采用回归分析的方法对搜集到的104个符合研究要求的数据集进行分析,得出财政税收、公共支出以及财政转移支付等能够对该领域的开放数据产生重要影响。Khurshid Muhammad Mahboob等人[11]采用创新扩散理论和统计分析的方法得出用户行为之间的相容性以及自愿性更能对开放政府数据的使用产生影响。Siddoo Veeraporn等人[12]采用定性分析的方法,对影响泰国政府数据开放的因素进行了研究。而从相关政策角度出发,Lee Gwanhoo等人[13]分析了美国在组织、财物等领域开放政府数据存在的障碍,提出使用包含5个因素的“开放政府成熟度模型”来推动政府数据更加开放和透明。Grimmelikhuijsen Stephan G等人[14]对美国地方政府500个网站进行了调查,认为提升技术水平、合理的组织机构以及灵活的模式能够促进政府开放数据。Pfenninger Stefan等人[15]认为确保数据的透明度以及技术上的易用性是确保能源领域开放政府数据可以持续的重要因素。

从上述国内外研究来看,针对开放政府数据影响因素的研究或者是采用定性分析,或者是采用定量的模型以及分析手段进行实证研究,或者是针对不同领域的开放政府数据政策进行分析,并针对发现的问题提出相应的解决措施。但是一个城市开放政府数据排名的变化显然是多因素共同组合发挥作用的结果,因此需要从系统的角度出发,将涉及到的能够影响开放政府数据的因素作为一个统一整体进行分析。

2 研究目的和研究方法

2.1 研究目的

本文的研究目的在于分析哪些因素的组合能够影响城市的开放政府数据的水平,对于能够起到正向促进作用的因素继续保持,对于起到负面阻碍作用的因素尽量克服,从而更好地促进我国开放政府数据的持续发展,更好地在大数据时代发挥政府数据自身所具有的经济价值和社会价值,为相关部门结合自身实际更好地制定开放政府数据政策提供借鉴和参考。

2.2 研究方法:定性比较分析法

定性比较分析法(Qualitative Comparative Analysis,简称QCA)是查尔斯·C·拉金在1987年提出的一种方法。该方法将集合的思想与布尔代数的思想结合起来,以案例作为研究导向,通过对不同条件变量组合情况下的不同案例结果进行比较,得出若干变量与不同因果之间的关系[16]。不同的案例,其结果可能是相同的,也可能是不同的。从这个意义上来说,定性比较分析力求兼顾“定性”(案例导向)与“定量”(变量)两种分析方法的长处。同时,定性比较分析法力图实现在保留适当因果复杂性的基础上,以尽量简约的形式表达出条件变量的组合。根据本文的实际研究情况以及上述三种方法发展的成熟程度和稳健程度,选用清晰集定性比较分析法(csQCA)来研究本文的数据[17]。

使用定性比较分析法,布尔最小化是关键的步骤。即若两个布尔表达式仅在其中某一个条件不同的情况下产生了相同的结果,那么可以认为这个条件是可以去掉的,则该操作被叫做布尔最小化。经过该操作之后,可以找到产生结果的必要条件[16]。

3 数据获取与处理

3.1 数据获取

(1)结果变量的获取

根据定性比较分析的思想以及本文的研究目的,本次研究的结果变量是各个地市(含副省级)在开放政府数据排名中的变化情况。因此,选取由复旦大学数字与移动治理实验室与国家信息中心数字中国研究院联合发布的《中国地方政府数据开放报告》(以下简称《报告》)作为数据源。该报告每半年发布一次,是我国第一个专门针对地方政府开放数据进行评估的系列报告,通过科学选取相关指标、多维度的分析对比,全面直观地呈现出了各个地市开放政府数据的发展情况。

2018年下半年发布的《报告》中包含47个地级市和副省级城市,2019年下半年发布的《报告》包含86个地级市和副省级城市,其中有许多城市是2018年下半年《报告》中所没有的。为了确保对比的合理性,因此只选取2019年下半年《报告》中排名在前47位的地级市和副省级城市与2018年下半年《报告》中的数据进行对比。排名发生变化的城市情况如表1所示,共计32个城市,其中排名变化显示“+”的为上升名次,如梅州2019年下半年比2018年下半年上升11名,显示为“-”的为下降名次,如武汉2019年下半年比2018年下半年下降11名。

表1 排名发生变化的城市一览表

(2)原因变量的获取

关于哪些因素会对地方政府落实开放政府数据造成影响,不同的学者有不同的观点。王法硕[5]认为是领导重视、制度以及组织规范、地方的经济水平、信息技术等因素;梁乙凯等人[18]则指出数据的及时性、可视化和可读性是重要因素;Conradie Peter等人[19]则指出数据的存储、获取和使用方式是影响城市开放政府数据的关键因素;Yang TungMou等人[20]认为法律、政策、组织、外部环境和信息技术是影响地方政府开放数据的主要因素;郑磊[21]指出科学有效的管理机制、高效便捷的数据使用、内部外部环境的支持可以影响地方政府落实开放政府数据。在借鉴已有研究的基础上,结合本文研究实际,将综合经济发展水平、地方机构设置、数据获取无障碍、地方信息技术发展程度4项指标作为原因变量。

3.2 数据处理

(1)数据编码

数据编码是QCA分析中的重要组成部分,按照一定的标准对涉及到的原因变量和结果变量进行编码,从而可以应用布尔代数进行运算,最终得到符合要求的结果。结合已有研究,本文各变量编码规范如下。

本次研究的结果变量是“同一城市在不同年份的《报告》中排名发生变化”,据此将排名上升的城市编码为1,排名下降的城市编码为0。

“综合经济发展水平”是本次研究选取的原因变量之一。特别是在目前的大数据时代,开放政府数据对于充分挖掘数据内部价值、盘活数据潜力、推动当地社会的经济发展水平具有重要意义,而经济发展水平越高,反过来也会要求地方政府的开放数据活动持续开展[22]。同时,政府数据的开放还有助于推动大数据等产业的蓬勃发展,优化地方经济产业结构,破除原有思维弊端,给地方经济发展注入新的活力,带动地方综合经济实力整体发展[23]。鉴于2019年下半年《报告》统计截止到2019年10月,据此,依次检索各省统计局公布的所属各个城市在2018年和2019年前三季度的GDP数据,并测算2019年数据的增长率。若增长率高于2019年前三季度全国同比增长率,则赋值为1,否则赋值为0。

“地方机构设置”是本次研究选取的原因变量之二。政府的数据开放离不开不同部门之间的彼此协作和通盘考量,地方各个部门之间条块化现象明显[24],不同部门之间往往出于自身利益考虑,对于数据开放的力度难以达成准确性意见,同时各个部门之间所掌握的数据格式、规范等各不相同,也给数据开放带来了障碍。因此需要一个专门的结构来协调处理这些问题,整合不同部门之间的数据衔接问题,实现数据之间的高效集成,将政府数据与社会信息高度融合起来。所以,检索公开报道,若某个城市负责处理此类事务的机构在2019年成立,那么该城市此项内容编码为1,否则编码为0。

“数据获取无障碍”是本次研究选取的原因变量之三。数据开放是一种手段,其目的在于使得数据可以更好地被社会公众所利用,从而能够挖掘数据内部存在的潜在价值,而数据获取的便利程度是确保公众可以有效利用数据的重要前提,是否方便可以体现出政府对待开放数据的思想态度。《国家信息化发展纲要》明确指出“推动政府网站信息无障碍建设”,而谭必勇等人[25]对我国10个省市的调查研究也表明,数据便利程度的高低与否对用户能否从中发现有价值的信息,辅助用户进行数据创造有着很大的影响。据此,本研究作出如下赋值:若某城市的开放政府平台能够在显著位置标明“信息获取无障碍”的,则该城市此项内容赋值为1,否则赋值为0。

“地方信息技术发展程度”是本次研究选取的原因变量之四。开放政府数据的发展离不开信息技术的支撑,大数据的发展促使人们将以前由各个部门、各个系统之间分别掌握的数据整合起来,通过分析碎片化的数据,从中发现出内部深层次彼此之间的联系[26]。所以,一个城市信息技术水平的高低与其数据的多少以及利用能力的高低有着密切的联系。《开放数据晴雨表》也体现出信息技术较为先进的国家和地区在开放政府数据方面走在前列。2019年下半年的《报告》显示,省级(含直辖市)开放数据排名中,上海、浙江、贵州名列前三名,其中上海和浙江是传统意义上信息技术较为发达的地区,而贵州得益于其独特的地理优势,与世界诸多信息技术厂商有着密切的合作,也使得其信息技术水平有了长足的提高。据此,若某个城市在2019年《报告》中“数据层”统计排名比2018年排名上升,则赋值为1,否则赋值为0。

(2)二分数据表的构建

二分数据表的构建是进行定性比较分析的基础,按照前文所述的编码方式并结合本次研究获取到的实际数据,本次研究所构建的二分数据表如表2所示。其中,每一个case代表一个城市,Y1到Y4代表4个原因变量,Q1代表结果变量,赋值方式参照前文所述的编码方式进行赋值。

(3)真值表的构建

表2 二分数据表(部分)

真值表的构建是进行csQCA分析的基础,将上述二分数据表的数据导入TOSMANA软件中,真值表的可视化形式如图1所示。

图1 真值表可视化图

图1中,组合为“0000”“1101”“1100”的区域代表能造成结果变量为0的原因变量的组合,共计3种;组合为“0001”“1001”“1111”“1110”的区域代表能造成结果变量为1的原因变量的组合,共计4种;白色区域是“逻辑余项”,即在本次研究中没有出现,但是从理论上来说应该存在的原因变量的组合,共计6种;以斜线表示的区域即“矛盾组态”,共计3种,需要单独进行分析,总共16种情况。

4 数据分析

“逻辑余项”只是理论上存在但是本次实际观察中没有发现,因此存在实际导致结果变量为0或者1的可能。所以需要在将“逻辑余项”纳入结果变量为1和结果变量为0的情况下分别分析。

4.1 结果变量为1的分析

在TOSMANA软件中进行布尔最小化操作,可以得到造成结果变量为1的布尔表达式为:

Y1{1}*Y3{1}+Y2{0}*Y4{1}→1

由上式可知,两种状态下会得到结果变量为1,分别是Y1{1} * Y3{1},Y2{0} * Y4{1} ,“*”表示两个变量同时存在的情况。

Y1{1} * Y3{1}对应于case7和case11,即济南市和阳江市。二者的经济数值增长速度均高于全国平均水平,同时在对待开放政府数据的态度上,两地政府均积极应对,在开放政府数据平台上主动标出类似“无障碍阅读”的字样,大大降低了政府数据的获取门槛,方便政府数据真正为社会公众所获得,从而盘活政府数据潜力,真正发现其内在价值。张晓娟等人[27]的研究表明,从国际上来看,经济发展水平较高的地区,其公众的监督意识也越强,对于政府数据的利用也就越多,进而可以推动整个地区的开放政府数据深化落实,而从国内研究来看,也有着相似的表现。

Y2{0}*Y4{1}对应于case3、case8和case9,即烟台市、银川市和东莞市。上述三个城市负责政府开放数据的机构均成立于2019年之前,是本轮政府机构改革的产物,同其他城市相比,上述三个城市的政府在对待开放政府数据上呈现出积极的态度。政府作为数据的拥有者,在开放数据的过程中起到重要的推动作用。此外,政府在提供相应数据的过程中还应该遵循一定的标准以及技术规范,从“大数据”的思想出发[28],与信息技术等对数据格式、规范等内容的要求协调一致,共同发挥政府数据真正的价值。

4.2 结果变量为0的分析

使用TOSMANA计算可得结果变量为0的布尔表达式:

Y2{0}*Y4{0}+Y1{1}*Y2{1}*Y3{0}→0

由此可知,共有两种路径会导致结果变量为0,分别是Y2{0}*Y4{0}和Y1{1}*Y2{1}*Y3{0}。

Y2{0}*Y4{0}对应于case20、case24和case28,即淄博市、滨州市和扬州市。虽然三个城市均在2019年之前成立相应机构来负责政府开放数据的工作,但是只是在制度上确立,并未标明“信息无障碍”获取等类似的内容,对于公众获取相应的政府数据没有及时提供便利措施[21]。虽然三地的经济发展水平在一个比较高的层次,但是从开放政府数据的理念来看,深化落实的程度还不够,尚未充分从公众的角度出发,充分提供措施来方便公众利用政府数据。

Y1{1}*Y2{1}*Y3{0}对应于case15、case16、case19、case29和case17,即宣城市、南京市、日照市、佛山市和武汉市。对比真值表来看,主要是因为对数据的利用率不高以及缺乏“无障碍获取信息”的渠道所致。从已有研究和我国目前开放数据平台内容来看,医疗、交通、就业以及教育等数据往往是公众最想获得的[29],但是国内大部分平台在开放数据的过程中恰恰忽略了这点,反而按照政府自身的意愿来进行数据开放。同时政府相关部门的技术工作尚未及时更新,目前已有部分平台开放API接口,供用户可以基于自身需要自主进行数据的处理,但是在使用难度以及效率上同商业应用还有着很大的差距,造成政府数据利用效率低下。虽然各个城市的GDP增速在全国平均增速之上,但是在弥补技术上的不足上仍显得力不从心。因此需要构建良好的开放政府数据生态,从制度、思想上降低开放数据的获取以及使用难度。

4.3 矛盾组态的分析

关于矛盾组态,根据图1来看,主要有三种情况,各情况及其所包含的实例如表3所示。

表3 各个矛盾组态的实例

矛盾组态1主要是case1和其他案例的不同。除了case1最后导致结果变量为1之外,其余均导致结果变量为0。case1是梅州市,虽然从2018年前三季度与2019年前三季度的GDP来看,其数值较小,但是梅州市位于广东省,社会风气以及地理位置的不同也让民众对于开放政府数据有了比其他省份更多的需求。同时其经济环境和法治环境同内陆诸多省份也有不同,当地政府的治理理念和治理思想与其他省份相比也有不少超前的地方。胡海波等人[30]的研究表明,一个城市开放政府数据所取得成效的高低,与其法律法规的健全程度、政治环境、社会经济环境等软实力有着密切的联系。两者之间相互支撑,共同保证政府数据开放的效果。

矛盾组态2主要是case21和case32导致的结果变量与其他不同。case21是枣庄市,case32是中山市。中山市的Y1数值为1.15%,相比于广东省其他地市,增长率处于一个较低的水平面上,而枣庄市的经济发展水平从GDP数值上来看也排名靠后,2018年和2019年在山东省前三季度排名均排在15位。曹雨佳[31]针对19个地方政府的调研显示,地市的经济发展水平能够对政府开放数据产生重要影响;黄如花等人[29]通过研究发现,在经济发达的省份或者地区,开放政府数据平台建设更加完善,更有助于地市在《报告》中的排名上升。

矛盾组态3主要是case4和case30导致的结果变量不同,其中case4是肇庆市,其结果变量为1;case30是广州市,其结果变量为0。从行政职能来看,广州市所担负的行政职能比肇庆市要多,在社会公共资源有限的情况下,势必会对每一项所投入的资源要少。从时间上来看,开放政府数据是一项长期的活动[32],人力、财政、行政等各方面都要发挥作用共同协调,同时对于开放政府数据过程中出现的潜在威胁也要进行妥善处理,因此导致广州市在《报告》中排名下降而肇庆市排名上升的结果。

5 结论

本文通过以《报告》中排名发生变化的城市作为研究对象,分别以排名上升和排名下降作为分类标准,使用定性比较分析法对哪些因素的组合导致城市排名变化的进行分析,得到结论如下:

(1)经济发展水平高于全国平均增长率的城市,当地政府不仅应在制度上积极落实开放政府数据的要求,同时应该从社会公众等用户的角度考虑如何让他们更加高效便捷地获取所需要的数据,满足他们对于政府数据的需求,这能够更好地促进地市开放政府数据的水平。

(2)信息获取无障碍程度越低、便利性越低,同时对于日常与数据开放、获取以及分析等利用密切相关的技术无法及时发挥作用,对地市的开放政府数据会产生阻碍作用。

(3)城市的软实力高低往往会对开放政府数据的程度起到显著影响。同时行政级别越高的城市、担负的行政职能越多的城市在日常对待开放政府数据的过程中更应该在公共资源上给予更好的倾斜,从而确保开放政府数据的力度能够得到稳步提升。

本文依然存在的不足主要是原因变量的分类略显粗糙,还可以根据城市的行政级别来进行划分,同时对于经济发展水平等原因变量的赋值还可以采取更加细致的赋值方法,后续可以在这方面继续开展相应的分析以进一步充实研究成果。

猜你喜欢

变量政府分析
寻求不变量解决折叠问题
抓住不变量解题
隐蔽失效适航要求符合性验证分析
知法犯法的政府副秘书长
电力系统不平衡分析
电力系统及其自动化发展趋势分析
分离变量法:常见的通性通法
“政府信息公开”观察
完形填空三则
变中抓“不变量”等7则