APP下载

基于社会网络分析的政府开放数据生态链的演进过程研究

2022-02-11李鑫浩赵需要

现代情报 2022年2期
关键词:社会网络分析

李鑫浩 赵需要

摘 要:[目的/意义]随着数字社会的形成与发展,数据与社会的互动形成了以数据、人和环境为核心的圈层生态系统,政府开放数据生态链是系统中最为重要的结构要素。[方法/过程]基于耗散结构理论、演化博弈理论和社会网络理论对政府开放数据生态链演进过程进行深入分析,通过社会网络分析工具Gephi对政府数据生态链演进过程中的部分环节进行可视化分析,归纳其主要特征并抽取演进的关键路径。[结果/结论]梳理出演进过程中各组成要素及其互动关系,发现和总结了演进过程的特征、动因和动力,并对各个演进过程的形成机理与嬗变规律进行深入研究,最终以深圳市政府数据开放为演进起点对演进过程进行可视化分析,从而为政府开放数据生态链上各个节点的优化发展和数据治理提供参考。

关键词:政府开放数据;生态链;演进过程;社会网络分析

DOI:10.3969/j.issn.1008-0821.2022.02.012

〔中图分类号〕D630.1;C932 〔文献标识码〕A 〔文章编号〕1008-0821(2022)02-0130-13

Analysis on the Evolving Process of Government's Open Data

Eco-Chain from the Perspective of Social Network Analyzing

Li Xinhao Zhao Xuyao

(School of Economics and Management,Xi'an Shiyou University,Xi'an 710065,China)

Abstract:[Purpose/Significance]With the formation and development of the digital society,the interaction between data and society has formed a circle-level ecosystem with data,people and environment as the core.The government's open data eco-chain is the most important structural element in the system.[Method/Process]Based on dissipative structure theory,evolutionary theory and social network theory,the study analyzed the evolution process of government open data ecological chain,visually analyzed links in the evolution process of government's open data eco-chain through social network analysis tool Gephi,summarized its main characteristics and extracts the key path of evolution.[Result/Conclusion]The study sorted out the constituent elements and interaction in the evolution process,found and summarized the characteristics,motivation and driving force of the evolution process,studied the formation mechanism and evolution law of each evolution process,and finally made a visual analysis of the evolution process with the government open data of Shenzhen as the evolution starting point,so as to provide reference for the optimal development and data governance of each node on the government's open data eco-chain.

Key words:government's open data;eco-chain;evolving process;social network analysis

政府是最大的社會数据和公众数据保有者,在治理过程不断采集并长期储存着大量相关数据[1]。自2009年美国政府在《开放政府指令》首次提出政府数据开放的概念后,我国也于2012年正式开始政府数据开放道路的探索。近年来,随着国家各部门间信息化程度的提高,政府数据开放的门槛不断下降,而政府开放数据作为大数据最主要的数据源,对其进行挖掘和分析将为社会产生巨大的价值[2]。以贵州市、上海市为主的政府已经开始着手建设政府数据开放生态,和谐完善的政府数据开放生态系统能够为政府开放数据提供价值产生、汇集、增值的良好环境保障。从生态系统角度来看,政府数据开放首需研究的结构就是政府开放数据生态链[3]。演进是政府开放数据生态链的一个重要发展特征,不仅包括生态链的演化过程,还有层次跃升与进化过程。通过对政府开放数据生态链演进过程的讨论与分析,能够进一步把握政府开放数据生态链所处阶段,指导政府通过及时调整数据开放力度、策略等措施,进而提高生态链中主体间的转化效率,改善生态链的整体演进效果。

当前,对政府开放数据生态链演进过程的研究还处于起步的阶段,其中生命周期等传统视角是学者最早采用也是最广泛的研究视角。黄如花等对政府数据开放过程进行识别,并提出了基于生命周期的政府数据开放的五阶段管理模型[4]。赵龙文等基于关联数据提出两步式的政府数据开放模式,并将政府开放过程细分为发布维护、组织管理与服务使用过程[5]。代佳欣指出,政府数据开放是满足公众需求的主动开放过程,并将其细分为筹备、实施和完善3个过程[6]。除生命周期视角外,也有学者从价值增值视角进行研究,吴金鹏等基于生态系统的价值创造角度,将政府数据开放分为数据供应、创新与消费3个过程[7]。任福兵等从价值增值角度,运用价值链理论将政府数据开放分为数据采集、数据处理、数据开放、数据利用和价值增值过程[8]。赵宁等采用信息生态链和价值网络等方法,将政府开放数据演化过程分为初期阶段、成长阶段和成熟阶段[9]。随着研究的不断深入,学者开始尝试在生态系统视角下研究政府数据开放过程,王卫等基于利益相关者理论并结合生态系统理论,从数据创建与审查、选取、发布、获取与使用、管理与评估的多阶段过程描述政府数据开放[10]。朱晓峰等以武汉市政府数据网作为研究对象,从种群演化角度进行实证研究,选取重点种群探究其演化情况,判断群落所处的共生演化阶段[11]。通过对现有文献的研究发现,目前较少涉及对其演进过程的研究,仅停留在对生态系统中各主体的独立演化过程的研究,或是采用价值等指标来反映政府数据开放的演化过程,由于演进过程中各主体间也会产生联系和作用,因此不仅仅需要考虑各主体演进过程,也要充分考虑生态链中的各部分之间联系,把握政府开放数据生态链的整体演进过程。

政府开放数据生态链本质是一个高度开放的复杂系统,其在演进过程中将不断地优化调整,同时政府开放数据生态链可以看作是社会网络在政府开放过程中的投影。因此,本文对借鉴信息生态链的研究成果,结合耗散结构[12]、演化博弈[13]和社会网络[14]等相关理论,对政府开放数据生态链的演进过程进行分析和讨论,探究其演化过程中的各要素之间的特征,归纳总结其演进过程和演进规律,指导政府开放数据生态链从低效、非稳态阶段向有序、高效的稳态过程进行演化,并在各个阶段中最大限度地发挥出政府数据价值,产生更大的社会影响力,从而提高政府的数字治理能力。

1 政府开放数据生态链的结构、特征与演进逻辑

1.1 结构模型

在生态学范畴中,生态链的实质是不同物种间的能量流转[15],而政府数据开放是一个复杂的动态过程,其内部特征与信息生态链高度相似[9]。因此,借鉴信息生态链理论,政府开放数据生态链是指在政府数据开放过程中,围绕政府开放数据、数据生产者等节点要素之间形成的数据场,经过数据转流最终形成的政府开放数据、主体与环境之间相互联系相互作用的有机链式结构。

根据信息生态系统构成要素以及政府数据开放的特点,政府开放数据生态系统主要包括政府开放数据、政府数据开放主体和政府开放数据生态环境。政府开放数据生态链是政府开放数据生态系统的微观反应,基本要素为生态链中的各类主体节点、政府开放数据本身以及政府开放数据环境。

政府开放数据生态链上的节点按照功能属性可以划分为政府开放数据生产者、政府负责部门、传播者、使用者和消费者5类主体节点。生产者是生态链中政府开放数据的发展起点和主要供应者,其产生的数据主要有两种:第一种是行政机关在履职过程中不断产生和累积的数据,主要有基础设施、政府治理、数据创新与应用、数据管理、经济和社会效益5种维度的数据[16],由于此类数据是从行政机关中产生的,因此具有职级层级、行政区域以及主管行业上的显著特征;第二种数据源自非政府领域,如从企业、民间组织等搜集来的数据,此类数据在形成过程中有着明显的需求属性。政府主管部门主要包括各级大数据发展管理局以及网信办等政府部门,由其审定数据生产者汇总的庞大数据,并根据数据的保密属性和隐私属性来确定具体数据开放策略。数据传播者承担着政府开放数据各个主体之间的数据流转功能,其携带了海量的数据,主要由各级政府的数据开放平台或第三方同类型平台组成。使用者指的是利用和分析政府开放数据的行政机关、企事业单位、其他组织和个人,主要承担分析和利用政府开放数据、提供数据服务产品的作用。消费者节点数量众多,且与使用者联系密切,指的是使用和消费政府开放数据产品和服务的各类用户,不仅包括组织和个人,也包括政府部门。政府数据开发生态链在法律、政策、技术、社会等因素的相互作用下,将输入的政府开放数据不断转化、加工和利用,最终输出庞大的社会价值和经济效应,其结构模型如图1所示。

1.2 基本特征

政府開放数据生态链的基本特征为开放性、动态性和方向性,这也是其能够不断演进发展的基本条件。

1)开放性。政府开放数据生态链处于复杂的数据开放环境中,将直接受到环境变化的影响,从而不断调整其结构。如:涉及数据开放种类的政策一经调整,将直接影响政府开放数据生态链中的生产者节点的数量变化,将会造成萌生或减少生产者节点,从而影响整个链式结构。

2)动态性。动态性主要体现在两个方面,从整体上来看,在政府开放数据生态链的内部会产生频繁的数据交换和数据流转,包括同类节点和节点之间、不同类节点之间,以及与外部生态环境也有密切的交流,因此,链式结构本身就具有显著的动态流动性。从内部结构来看,链内节点之间可以动态转化,不同类节点之间也能够根据数据需求、演化阶段和所处环境的不同而相互转化,并且同一节点也可能拥有不同的身份,比如深圳市统计局本身作为生产者节点产生数据外,由于其本身还可以通过自身平台对外发布数据,也可以作为数据传递者,因此节点也具有动态发展的特征。

3)方向性。方向性是伴随其流动性而产生的特性,链内各个主体之间具有以需求为导向的主观能动性,或者以法律政策推动为基准的被动链路走向。随着数据的流动和各个节点的转化,使整个生态链也产生一定的方向性,同时开放数据也存在明显层级关系,如地市级数据、省级数据、国家数据等范围特征。因此,从宏观角度来看,该特征也将使其演进过程具备一定的方向性。

1.3 演进逻辑

演进不是无组织、无目的在各要素之间独立发生的,而是在一定的演进动因和演进动力的共同作用下按照一定的逻辑发生的。动因是系统发展的起点,为系统演进提供强有力的推动作用,而演化动力是各个阶段内要素之间的相互作用,为演进提供拉动作用[17]。通过对演进动因和动力的分析,能够准确把握政府开放数据生态链的演进方向和基本逻辑,从而更好地探究其演进过程。

对于政府开放数据生态链而言,其演进动因主要为政策导向和公众需求。政府有意识地通过开放数据这一政策手段,将原本相对封闭的数据面向社会公开,降低政府数据的准入门槛,以求最大程度地发挥数据价值,同时数据开放过程也将吸引社会各界力量,在社会中形成良好的数据使用氛围,提高政务效率,提升公民对于政府的满意度。同时随着信息化水平的不断提高,社会公众对于政府数据的需求也更为迫切,尤其在交通、医疗、教育等与公民生活水平息息相关的领域,公民不仅希望能够及时获取到相关数据,还希望能够享受到更加方便快捷的政府服务。因此,在政策导向和社会需求的双重动因推动下,政府开放数据生态链将不断演进。

演进动力为数据生态链中各主体节点和政府开放数据资源、环境间的相互作用。政府开放数据生态链的演进过程中存在明显的主客体关系,并将其分为主体动力和客体动力两种,主体动力是节点在追求各自利益最大化需求的博弈与协作的内生动力[18],各个政府部门间需要通过开展协作来提高开放能力,而使用政府数据的各个单位组织,如:同时利用交通数据的高德地图与百度地图,为了自身生存处于相互竞争的关系中。而政府间客体动力是在主体动力作用下迫使整个生态链向更稳态的结构进行演化的结构动力,各个节点间将向最高效的交流合作方式不断优化,如:政府统计部门通过网站方式公开数据,随着信息技术的发展,涌现出微信公众平台、视频号等更加多样化且受众更加广泛的宣传渠道,从而使整个政府开放数据生态链的结构进行调整和优化。

政府开放数据生态链将在演进动力的拉动和演进动因的推动下,在政治、经济、社会等因素的共同影响下,从形成阶段逐步演化到初级阶段,最终跃升至高级阶段,完成整个演进过程,政府开放数据生态链的演进逻辑模型如图2所示。

2 政府开放数据生态链演进阶段过程的阶段特征与形成策略

政府开放数据生态链是在信息生态链的基础上演变而来,与其有着相似的演进逻辑,政府开放数据生态链本质上是数据在不同节点之间的流动与节点内部的转化,并受到所处环境因素的影响。政府开放数据生态链的演进不是简单地将政府开放数据的过程,除了考虑各节点之间的流转,节点与外部环境之间也会发生作用,应充分考虑各个节点之间的变化关系。因此,在自然生态链、信息生态链演进路径的基础上,结合政府开放数据生态链的演进动因与动力分析,将其划分为形成阶段、初级阶段和高级阶段,并对各个阶段中的环节的基本特征和形成策略进行分析,同时辅以实际案例对各个阶段的当前情况进行说明。

2.1 形成阶段

形成阶段是政府开放数据生态链演进的起始阶段,主要包括节点的准备与形成环节以及链式结构形成环节,此阶段演进完成的标志为:以各地市级数据为基础,节点间形成了完整的政府开放数据生态链结构,开始将地市级数据转化为社会价值。

2.1.1 节点准备与形成环节

准备与形成环节是政府开放数据生态链的演进起点,是后步过程的演进基础。政府开放数据生态链的节点准备过程主要包括数据准备、技术准备和政策准备等内容,而节点形成过程则主要包括主体需求产生与明确、政策制定与完善、技术支持与探索等具体任务。与政府开放数据直接相关的组织与个人,将产生对政府开放数据的基本需求,明确其主体目标与预期效果,并根据其目标定位与功能分化形成使用者、传递者与消费者主体,并通过技术条件的完善来应对政府数据开放的发生。

此过程的生产者主要为与开放数据需求直接相关的政府数据生产与存储部门,如:各地级市统计局、工业和信息化局、交通运输局等,将根据需求调研结果开始筹备政府数据开放工作,并对开放的数据类型、数据门类、数据总量、数据安全程度以及开放数据的技术手段进行分析与评估,选择与社会需求密切相关的数据,通过合适的技术进行优先开放。相关政府负责部门将结合相关工作经验与各相关主体意愿来制定初步的数据开放政策与法律,用以引导和保障政府数据开放过程,各节点的形成机理如图3所示。

由于各个节点的基础条件以及技术手段不同,导致节点并不是同时形成,而是有着明显的先后顺序,节点的准备与形成阶段整体呈现出逐步开放的特征。此特征在生產者节点形成过程中更为显著,政府统计部门相较于其他部门,数据储量较大且丰富度较高,具备良好的开放基础,因此将成为首先开放的部门,并为其他部门的数据开放提供参考和范本,从而形成“羊群效应”,加速周围节点的生成。

2.1.2 基础链式结构形成环节

1)演进环节特征

在节点准备与生成的基础上,各个节点开始探索开展合作与交流,并逐渐向基础政府开放数据生态链演进。其中既存在节点准备与形成阶段的无序状态,持续吸引新节点生成,同时在已形成的节点间又产生了政府开放数据生态链的基本形态,并具备初步的政府开放数据生态链演进的趋势。

根据耗散结构理论,随着演进时间的推移与各主体节点功能的完善,主体间也逐渐从以对抗竞争为主的模式转变为宽容竞争模式,各个节点开始通过交流合作来谋求更大利益,但节点有着随机和不确定性,并且主体间尚未形成稳定的合作模式。而演化博弈论认为,随着时间的推移与节点交流的深入,系统将逐渐迭代某些不成熟、质量差的节点以及节点间的交流关系,进行以谋求更加稳定的结构和更加高效的交流质量。根据系统的层级结构,将此阶段中节点间的交流方式分为3种:一对一方式、一对多方式、多对一方式。如:深圳市统计局与其自身的发布网站之间就是常见的一对一方式;深圳市政府部门与微信公众平台、微博、官方网站等多种平台进行合作交流就是常见的一对多方式;多个深圳市政府部门的数据开放工作通过微博平台传播就是典型多对一方式。

2)基础政府开放数据生态链的形成策略

政府开放数据有着明显的层级关系,来自地市级各个部门的政府开放数据开始涌现出社会使用价值,也成为政府开放数据生态链的基础数据,而围绕此层面数据形成的链式结构称为基础政府开放数据生态链。

各个节点在基础开放数据生态链的形成环节中的策略如下:生产者节点通过区域、部门两个维度进行聚集;政府主管部门围绕以市级数据管理单位为主开展工作;传播者节点通过领域、行业两种标准进行推广宣传;使用者节点则针对不同领域开展业务,消费者根据具体场景使用产品,同时各个节点间按照演进特征不断关联,最终形成基础政府开放数据生态链。

例如:在深圳市政府开放数据生态链的形成过程中,在区域维度将福田区、深汕特别合作区、罗湖区等11个区级政府生产者进行聚集,在部门维度又将市发展和改革委员会、市统计局、市交通运输局等37个市级部门生产者进行汇聚,通过这两种维度汇聚深圳市内所有的生产者节点。政府主管部门节点则以深圳市政务服务数据管理局统筹,同时协调深圳市大数据资源管理中心、深圳市人民政府办公厅等政府部门开展政府数据开放相关工作。以深圳市政府数据开放平台、深圳市政府在线平台等为代表的传播者节点,则在生产者数据聚集的基础上,按照教育科技、交通运输、企业服务等14个领域或者制造业、住宿和餐饮业、交通运输等18个行业进行推广宣传。与此同时,使用者节点中的小豆苗、预约挂号等移动APP针对卫生健康领域开展业务;腾讯乘车码、智慧通勤等小程序则针对交通运输领域开展业务。而以深圳市民为主的消费者节点则根据自身需求围绕相应产品进行聚集。

2.2 初级阶段

初级阶段是基础政府开放数据生态链的不断融合发展的阶段,该阶段的生态链已经具备与一定的规模和相对稳定从中心发散的网络状结构,但根据其影响范围与形成层次将其分为两个阶段:基础政府开放数据生态链的区域融合环节;以及区域政府开放数据生态链融合的社会价值辐射环节。整个初级阶段完成的标志是社会层面的政府开放数据生态链的形成。

2.2.1 区域生态链融合环节

1)演进环节特征

根据耗散结构理论对系统演进的阐述,系统不会一直处于混乱无序的状态,而是在内外界因素的影响下向稳定有序的状态进行演进,而其中序参量将起到决定性作用[19]。根据信息生态位概念,政府开放数据生态位是指具有政府开放数据需求,且参与政府开放数据过程的政府部门、社会组织、机构平台以及个人,在由政府开放数据、政治、技術、经济等影响因素所构成的政府开放数据生态环境中所处的既定位置[20],政府开放数据生态链的序参量处于核心信息位,序参量是用来描述系统整体运动的宏观参量,其通过支配子系统来决定系统整体的演进方向。政府开放数据生态链序参量一部分由各个节点在演进过程中基于各自需求自发形成;而另一部分由公众对于政府开放数据的实际需求,以及政府部门数据开放的主观能动性中产生,促使基础生态链沿着既定方向演进,其形成机理如图5所示。

由于开放数据有着明显的地域和层级的区位属性,因此将会先按照区域关系,在序参量的作用下进行聚集并形成耗散结构,各个节点之间形成较为稳定的共享和利用模式,由于各地级市的经济发展不同,导致基础政府开放数据生态链的形成有一定的先后顺序,当区域内的政府开放数据集聚与各类主体节点形成一定规模后,各个主体与影响因素的博弈将更为频繁,生态链将会自动对其中的节点与关系进行筛选,通过区域融合过程不断优化生态链结构,脱离或断裂多余、低效的组织结构,最终形成较为稳定的区域政府开放数据生态链。

2)区域政府开放数据生态链的融合策略

区域政府开放数据生态链是由基础政府开放数据生态链不断聚集融合而来的更高层次的生态链结构,其融合策略主要分为内部区域化、部门化聚集,外部统一化、规范化融合两个方面。

内部区域化、部门化聚集策略指的是基础政府开放数据生态链以生产者为形成起点,在融合过程内部同样是生产者节点作为融合起点,各个基础生态链中的市级生产者节点按照区位属性进行融合,而省级单位的生产者则按照部门属性进行聚集,最终将形成以生产者为中心发散的网络状结构。外部统一化、规范化融合表现策略指的是在生产者聚集形成网络结构中,传播者、使用者等其余节点则按照统一的领域或者行业规范进行融合,逐渐形成清晰标准的区域政府开放数据生态链的外部结构。

例如:广东省在区域生态链融合环节中,其内部按照区域属性聚集了深圳市、中山市、广州市等21个地级市生产者,同时按照部门属性聚集了省市场监管局、省生态环境厅等50个省级部门,在数据生产者侧对各市的基础数据链进行融合。同时,在外部形成了资源环境、经济建设、教育科技等12个主题领域,并据此开展外部融合。围绕资源环境领域,产生了省自然资源厅、省生态环境厅等多个政府主管部门负责该领域的政府数据开放工作,同时产生了广东省水土保持对外服务信息系统、广东空气质量实况与预报APP等多个使用者节点;围绕经济建设领域,产生了省发展改革委、工业和信息化厅等多个政府主管部门负责该领域的政府数据开放工作,同时产生了农博士APP、广州工信APP等多个使用者节点。

2.2.2 社会价值辐射环节

1)演进环节特征

随着社会各界对于政府开放数据的迫切需求,各区域开放程度的不断提高,以及信息技术的飞速发展,区域数据间需要采取更深层次的联系,进而产生出更大的社会价值,此时区域间的政府开放数据生态链的结构已经不再适应当前需求,政府开放数据开始突破原有的区域属性,使得整个系统逐渐向突变临界条件演进。

在此环节中,系统的涨落会被放大,在整个社会需求的驱动下,区域生态链之间将不断融合,最终发生突变,破坏原有区域政府开放数据生态链中的平衡状态。根据支配机理与协同机理,不同链之间将相互影响,并不断迭代原有结构中的低效率的关系,通过高位信息支配低位信息的方式,在信息传递的过程中不断优化政府开放数据生态链结构,以某些数据开放基础较好的区域政府开放数据生态链为主导,整合其他区域开放数据生态链,最终整体跃升到范围更大的有序状态,从而形成社会层面的政府开放数据生态链,而在其内部也将根据社会与行业需求进行重新整合与划分,并且以社会层面的政府开放数据生态链为中心,源源不断地向社会各个行业辐射政府开放数据的价值[21],进而产生出更大范围的社会影响力,如图6所示。

2)社会价值辐射形成策略

社会价值辐射阶段是当前政府开放数据工作所处的主要阶段,跨区域的政府开放数据生态链的融合将产生更大范围的社会价值,为了使消费者能够更加直观地感受到政府开放数据带来的价值,应采用更加易于消费者体验的形成策略,因此社会层面的政府开放数据生态链的形成策略主要分为规范元数据标准、促进区域融合的底层策略,以及统一行业标准,激发社会价值的上层策略。

在底层策略中,通过规范元数据标准的手段,能够极大地降低政府数据融合的难度,统一各区域数据的接口,最大限度地促进区域数据在社会层面的融合,同时能够减少不必要的传递消耗,进一步减少多余节点的数量,降低数据传递者和使用者的数据获取难度;而在上层策略中,采用更加贴近消费者使用习惯的行业属性作为分类标准,更易于政府主管部门的监管工作,以及使用者与消费者的数据使用难度,优化政府开放数据生态链的结构,使得从输入数据到产生社会价值的信息链路更加高效。

目前,社会中已经逐渐形成围绕交通运输、经济金融以及医疗卫生等行业的政府开放数据生态链,未来将会有更多的行业加入其中。例如:在交通行业中,综合交通出行大数据开放平台通过统一的元数据标准,整合了包括广东、北京、浙江等多个省份的区域数据,并将其分为地面交通、轨道交通、城市道路等多个维度的分类标准,形成了社会层面的交通行业政府开放数据生态链。

2.3 高级阶段

政府开放数据生态系统是政府开放数据生态链

演进的高级阶段,也是政府开放数据生态链的最终阶段。政府开放数据生态链在演进过程中与外界环境进行数据交换愈发频繁,政府数据开放环境也呈现出更为稳定的状态。在政府开放数据生态链内部形成了稳定的协同机制,并且结构具有极强的稳定性,各个主体节点之间既有密切的交流与联系,又保持相对的独立性,不断地与外界开放数据环境之间进行交流,针对外界环境的变化能够动态调整内部结构。

整个政府开放数据生态系统处于动态演进中,总体上呈现有序螺旋上升的演进状态,生态系统的安全弹性不断提高,对于外界变化的自适应能力与自我调节能力不断增强,同时与环境中的开放企业、开放大学等多种开放数据生态链间产生稳定的联系,逐渐向稳定可持续的高级层次演进,如图7所示。政府开放数据生态系统将作为建设数字中国[22]的重要組成部分,承担政府数据的开放、管理、运营等重要任务,从而提高整个社会的政府治理水平,形成健康良好的政府数据开放生态系统。

3 政府开放数据生态链演进过程实证研究

3.1 研究工具

由于政府开放数据生态链可看作社会网络在政府开放过程的映射,因此,本文采用社会网络分析工具Gephi 0.9.2对政府开放数据生态链进行可视化分析,力求对生态链中各个节点间的关联关系进行深入剖析,同时基于实际案例展示不同阶段中政府开放数据生态链的具体特征,从而清晰地还原政府开放数据生态链中各阶段的演进过程。

3.2 数据准备

3.2.1 数据来源

深圳市作为全国改革开放的窗口,有着雄厚的经济基础和信息技术水平,根据中国开放树林指数[23]显示,深圳市、广东省的数据开放程度均位于全国各省市前列,据此,本文选择深圳市政府作为实证分析的起点。本文数据量等统计数据均来自于深圳市政府开放数据平台、开放广东等官方平台,访问量、下载量等数据来源于站长工具,数据统计日期截至2021年7月31日。

3.2.2 数据处理

为准确还原政府开放数据生态链的实际结构,本文通过节点权重来表示各个节点对于政府开放数据生态链的影响程度,权重选择策略如下:生产者节点以产生数据量作为权重;政府主管部门节点以其负责的部门数量作为权重;传播者节点中网站类节点以百度权重数据(PC端)作为权重,微信公众号、微博官方平台类节点则以当前关注量为权重;使用者节点以其使用量、访问量和下载次数的累计总数作为权重,由于政府开放数据生态链中的消费者节点数量较为庞大,为保证主体结构的可观性,本文选择对消费者节点进行隐藏处理,由于部分权重数据难以获取,本文将部分省缺值填充为同类型节点权重的均值。同时,由于本文主要目的是探究政府开放数据生态链的不同阶段的主题特征,本文暂时将边权重默认为相同值。

由于不同类节点的权重的选取标准不同,为了准确反映出各个同类型节点对于政府开放数据生态链的影响程度,本文选择通过0-Max方法对同类节点的原始权重Wi进行标准化处理[24],如式(1)所示,并将最终得到无量纲权重Wnew(处理结果精确至小数点后两位)作为可视化展示时节点的实际权重。

Wnew=Wi÷Wmax (i=1,2,3,…,n)(1)

3.3 可视化分析

由于节点的准备与形成阶段中各个节点较为孤立,尚不具备复杂的关联关系,因此本文将跳过此环节,从基础数据开放生态链开始可视化分析,聚焦于深圳市政府数据开放过程,以整理到的实际数据为基础,依次展示数据开放生态链演进过程的深圳市基础数据开放生态链以及广东省区域数据开放生态链,并对其基本形态和形成过程进行简要分析,从而验证政府开放数据生态链的演进过程和演进逻辑是否符合实际情况。

3.3.1 深圳市基础数据开放生态链

将收集整理到的151个节点数据,以及节点间的628组关系数据导入网络分析工具Gephi中,并通过Yi Fan Hu布局算法还原深圳市基础数据开放生态链的实际结构,如图8所示。

首先总览其整体结构,虽然本文未对消费者节点进行可视化展示,但可以预见的是深圳市基础政府开放数据生态链遵循“生产者—政府主管部门—传播者—使用者—消费者”的基本链式结构,从生产者开始将政府开放数据通过生态链进行传递,交由使用者对其分析、利用和加工为政府数据开放产品,最后由消费者使用产品进而发挥出政府开放数据的社会价值。

同时聚焦于各类节点的分布特征,探究政府生态链演进过程中的重要节点和节点聚集规律。从生产者节点的分布特征可以看出,在其内部形成了以区级政府和市级直属部门聚集的主要布局,其中区级政府以龙岗区、龙华区和南山区为主要生产者节点;而市级直属部门以深圳市市场监管局、深圳市住房和建设局、深圳市卫生健康委员会为主要生产者节点,说明以上区级政府和政府部门的政府数据开放程度较高,数据开放工作较为完备。从政府主管部门节点分布特征可以看出,深圳市政府数据开放工作主要由深圳市政务服务数据管理局和深圳市人民政府办公厅统筹负责,其余各部门则针对各自主管行业协调配合整体开放工作。从传播者节点分布特征可以看出,当前深圳市政府数据开放工作主要以深圳市政府开放平台、深圳市政府在线、i深圳为主要宣传阵地,同时配合相关领域平台进一步扩大宣传范围。从生产者节点分布特征可以看出,生产者节点虽然整体呈现出多样化特征,但其内部则围绕不同领域聚集,并且以交通运输、医疗卫生和政府服务为主要领域,说明以上领域消费者需求较大,应重点关注以上领域的政府数据开放工作来满足消费者的实际需求。同时结合其链式结构,可根据上述关键节点归纳提取出深圳市基础政府开放数据生态链的关键路径,如图9所示。

3.3.2 广东省区域数据开放生态链

将收集整理到的350个节点数据,以及节点间的1 652组关系数据导入网络分析工具Gephi中,并通过Fruchterman Reingold布局算法还原广东省区域数据开放生态链的实际结构,为便于挖掘其演进特征,本文采用两种方式对其着色,按照节点类型着色如图10所示,按照领域着色如图11所示。

从图10的整体结构可以看出,广东省区域政府开放数据生态链结构由内而外呈现出与基础的链式结构相同的“生产者—政府主管部门—传播者—消费者”的逻辑,但总体却呈现为放射状结构,并且由图11可以看出,围绕生产者向外扩散形成链式结构时,放射状结构主动分化为12种领域,单独聚焦于每一个领域发现均为完整的链式结构,两者共同反映出该阶段的区域政府开放数据生态链是由广东省各市级的基础数据开放生态链以生产者为原点融合而成,同时由生产者向外按照领域进一步组织链式结构,最终形成区域政府开放数据生态链。

聚焦于各类节点的分布特征发现,生产者形成了以市级单位和省级部门聚集的特征,市级单位主要以广州市、深圳市、中山市为主,省级部门则是以省生态环境厅、省交通运输厅、省市场管理局为主,生产者节点从两个维度聚集,从而带动整个基础政府开放数据生态链的融合。政府主管部门则是围绕广东省人民政府办公厅、广东省政务服务数据管理局聚合,其余主管部门节点按照所属领域依次排列。而传播者和使用者则是按照所属领域进行聚集,其中,除传播者中的开放广东平台和使用者中的粤商通APP、广东政务服务网与各领域内节点交流比较密切外,其余各领域间节点交流较为稀疏,反映当前的领域划分较为均匀合适,同时反映出开放广东平台为主要的传播者节点,粤商通APP与广东政务服务平台为主要的使用者节点,为广东省内的各类消费者提供主要的政务服务,同时发现经济建设、教育科技、道路交通领域的节点丰富程度最高,以上领域为政府开放过程中需重点关注的领域。结合其总体结构特征,对其关键节点和主要路径进行抽取,如图12所示。与深圳市基礎数据生态链关键路径相比,广东省区域数据生态链的关键路径节点数进一步减少,生态链结构进一步优化,同时也为广东省提出的“一网统管”省域治理模式提供了良好的参考。

4 结 语

政府开放数据生态链的演进是一个非线性的复杂过程,处于一种相互作用的动态演进状态。本文基于耗散结构理论、演化博弈论等相关理论,在信息生态链的演进基础上,结合政府开放数据的本质与特征,通过分析其演进动因与动力,进而准确把握其从形成阶段、初级阶段向高级阶段演进的主体规律。并通过社会网络分析工具对形成阶段和初级阶段中的部分环节进行可视化分析,并通过抽取其关键路径进一步剖析政府开放数据生态链演进规律,指导利益相关者对其发展过程、阶段、位阶等进行准确把握,明确各个阶段中不同节点功能的变化,动态调整节点的数量或数据能量补给机制等来提高数据生态链的弹性,提高数据流转效能,从而提高政府数据治理能力水平,以此来推动数字中国的建设进程。本文局限性在于目前仅对部分环节进行可视化分析,后续将持续跟踪政府开放数据生态链的变化,尝试通过量化方法研究其演进过程中指标体系的变化,进一步分析政府开放数据生态链的演进规律。

参考文献

[1]郑磊.开放政府数据研究:概念辨析、关键因素及其互动关系[J].中国行政管理,2015,(11):13-18.

[2]Bertot J C,郑磊,徐慧娜,等.大数据与开放数据的政策框架:问题、政策与建议[J].电子政务,2014,(1):6-14.

[3]赵需要,侯晓丽,徐堂杰,等.政府开放数据生态链:概念、本质与类型[J].情报理论与实践,2019,42(6):22-28.

[4]黄如花,赖彤.数据生命周期视角下我国政府数据开放的障碍研究[J].情报理论与实践,2018,41(2):7-13.

[5]赵龙文,罗力舒.基于关联数据的政府数据开放:模式、方法与实现——以上海市政府开放数据为例[J].图书情报工作,2017,61(19):102-112.

[6]代佳欣.基于过程的政府数据开放风险识别与防控策略研究[J].情报杂志,2019,38(6):145-151.

[7]吴金鹏,韩啸.开放政府数据何以成功?——生态关系理论视角的跨国实证研究[J].图书馆论坛,2020,40(8):87-95.

[8]任福兵,孙美玲.基于价值链理论的政府开放数据价值增值过程与机理研究[J].情报资料工作,2021,42(4):56-63.

[9]赵宁,黄铁娜,曹洋.信息生态链下开放政府数据价值演化的研究[J].图书馆,2021,(3):65-71.

[10]王卫,王晶,张梦君.生态系统视角下开放政府数据价值实现影响因素分析[J].图书馆理论与实践,2020,(1):1-7.

[11]朱晓峰,黄晓婷,吴志祥.基于种群演化的政府数据开放实证研究[J].情报科学,2020,38(7):123-131.

[12]Gong Q X,Chen M,Zhao X L,et al.Sustainable Urban Development System Measurement Based on Dissipative Structure Theory,the Grey Entropy Method and Coupling Theory:A Case Study in Chengdu,China[J].Sustainability,2019,11(1):293.

[13]Girolamo R D,Esposito C,Moscato V,et al.Evolutionary Game Theoretical On-line Event Detection Over Tweet Streams[J].Knowledge-Based Systems,2021,211:106563.

[14]Liu W H,Wei W Y,Yan X Y,et al.Sustainability Risk Management in a Smart Logistics Ecological Chain:An Evaluation Framework Based on Social Network Analysis[J].Journal of Cleaner Production,2020,276(9):124189.

[15]娄策群,周承聪.信息生态链:概念、本质和类型[J].图书情报工作,2007,(9):29-32.

[16]陈玲,段尧清.我国政府开放数据政策的实施现状和特点研究:基于政府公报文本的量化分析[J].情报学报,2020,39(7):698-709.

[17]张舜禹.我国地方政府机构化的影响因素、演变逻辑与发展策略[J].天府新论,2017,(3):106-115.

[18]吳建材,谢永平.商业生态系统演化发展及其动力学分析——基于自组织理论的视角[J].企业经济,2017,36(11):96-101.

[19]吴彤.自组织方法论研究[M].北京:清华大学出版社,2001.

[20]王娟,李玉海.基于演化博弈论的政府开放数据质量控制机制研究[J].现代情报,2019,39(1):93-102.

[21]刘志峰,李玉杰.信息生态位概念、模型及基本原理研究[J].情报杂志,2008,(5):28-30.

[22]陈昌盛,许伟,兰宗敏,等.“十四五”时期我国发展内外部环境研究[J].管理世界,2020,36(10):1-15,40.

[23]复旦大学数字与移动治理实验室.中国地方政府数据开放报告(2020 下半年)[R/OL].http://ifopendata.fudan.edu.cn/static/report/ 中国地方政府数据开放报告(2020 下半年).pdf,2021-05-20.

[24]Liu X Y,Li N,Liu S,et al.Normalization Methods for the Analysis of Unbalanced Transcriptome Data:A Review[J].Frontiers in Bioengineering and Biotechnology,2019.

(责任编辑:陈 媛)

收稿日期:2021-08-15

基金项目:国家社会科学基金项目“政府开放数据生态链演化机制与优化策略研究”(项目编号:17BZZ069)。

作者简介:李鑫浩(1998-),男,硕士研究生,研究方向:政府数据开放,大数据与信息管理。赵需要(1978-),男,副教授,研究方向:政府数据开放。

猜你喜欢

社会网络分析
突发事件网络舆情传播的实证研究
国内图书馆嵌入式服务研究主题分析
展会品牌利益相关者的构成及其网络结构研究
新浪微博娱乐明星的社会网络分析
基于社会网络分析的我国微课研究探析
国内计算机领域科研团队结构分析
近10年我国会计学专业教育改革的综合可视化分析