APP下载

用户创新激励视角下政府开放数据生态链演化的影响因素研究

2023-06-26杨战社赵需要

关键词:范畴编码政府

杨战社 薛 媛 赵需要

(西安石油大学 经济管理学院,陕西 西安 710065)

0 引 言

随着互联网的发展,共享数据和信息在促进社会发展和完善政府工作方面发挥着重要的作用。相比于美国、欧盟等国家和地区,我国开展数据开放工作起步较晚。[1]1-172018年,政府发布《公共信息资源开放试点工作方案》,数据开放政策整体走向精细化,各级地方政府相继建立数据平台,逐渐意识到用户参与在政府数据开放过程中的关键作用。政府数据开放是一个数据生成、数据开放、数据利用、再到反馈的动态循环过程。[2]22-28从供给和需求的角度来看,用户的利益诉求对于政府开放数据生态链的演化有推动作用,同时用户对数据需求的持续增加也拉动了政府开放数据生态链的演化。[3]7-17政府开放数据生态链的演化呈现非线性、有序的状态,是在一定的演化动因和演化动力的共同作用下发生的。[4]130-142生态系统的动态演化最终会达到一个稳定的均衡状态,这个均衡点就是生态链演化的边界。曹雨佳[5]145-150通过对加拿大政府开放数据的用户参与机制研究,指出用户在政府开放数据建设中至关重要的作用。汪庆怡、高洁[6]298-302以美国Data.gov网站为例,提出我国应建设一站式的政府数据开放平台,鼓励用户参与基于用户需求逐步开放政府数据,以用户为中心提升用户体验。通过用户与平台的互动机制可以帮助平台及时发现政府数据开放过程中存在的问题,了解用户需求从而提高用户体验和使用积极性。[7]当前,我国政府开放数据平台与用户间的契约设计尚存在欠缺,从而削弱了政府数据开放对社会创新的激励作用。[8]15-28

因此,本文将在扎根理论的基础上结合用户创新激励理论,研究政府开放数据生态链演化过程中的影响因素及影响机制,并据此提出用户创新激励措施。

1 演化模型

1.1 演化动力

数据生态链的演化源于其演化动力,而用户对政府数据开放的创新需求就是生态链形成和演化的原动力。演化后的潜在利益驱动用户不断进行创新,用户间沟通进一步促进创新需求扩散,各节点不断演化并围绕用户创新需求拓展衍生,最终形成结构复杂且功能完善的政府开放数据生态链结构。基于创新扩散理论,创新在生态链演化过程中呈现“S曲线创新扩散”,演化萌芽时期通过沟通渠道迅速进行扩散,扩张时期创新人数逐渐超过半数,创新走势逐渐变缓,到成熟时期,创新趋于饱和。

1.2 演化逻辑

数据生态系统的演化不会一蹴而就,也不会迅速飞跃到最高阶协同共生的成熟阶段。结构复杂、动态变化等特性决定了政府开放数据生态链的演化过程必然会在演化动力的推动下不断突破“暂时平衡点”,在变革过程中不断创新,在创新扩散过程中不断演化。政府开放数据生态链的演化路线将会经过萌芽、扩张和成熟三个阶段的演化。萌芽阶段数据生态链初步形成,只有少数的数据生产者和数据传递者,此时处于孤立运营阶段或者数据的简单交换阶段。扩张阶段数据生产者、节点更多,链内价值共享,数据流转更为复杂,这时演化为简单数据链,之后会出现链内、链际间的竞合,在不断演化博弈过程中由简单数据链转化为数据生态链并达到一个平衡状态,实现数据循环流转,开始步入成熟阶段。成熟阶段,各节点合作稳定,在链内充分实现数据的协同和共享,形成完善的网络知识生态链。再继续演化,旧系统逐渐淘汰,新系统开始形成,最终节点、数据和数据环境都有很大变化,形成新的一个数据生态系统。政府开放数据生态链演化模型见图1。

图1 政府开放数据生态链演化模型

2 实证分析

2.1 数据获取

研究数据来源于文献梳理,一手访谈数据和二手平台意见反馈。数据收集过程如下:由于精确搜索主题为“政府开放数据生态链演化”的相关文献较少,因此选择中国知网CNKI数据库所收录的以“政府开放数据”为主题的期刊文献,时间范围为2012年至2022年。检索策略为:“主题”=“政府开放数据”,“篇关摘”=“影响因素”。在诸多文献中,只挑选属于SSCI、SCI、CSSCI、北大核心期刊中具有代表性的文献,剔除不相关论文后得到788篇相关论文。一手资料的收集主要是对政府开放数据生态链的用户进行深度访谈,考虑到受访者对于研究问题的认知程度,挑选的受访者为20名经常使用政府开放数据的科研人员或政府公务人员。二手资料的收集主要包括广州、北京、深圳等政府数据平台互动中心用户的数据需求、平台建议、权益申诉、数据纠错等用户诉求信息。上述政府数据平台均运营良好且互动交流部分数据资源丰富,可作为一手访谈资料的补充验证。

2.2 文献调研

为了能准确概括政府开放数据生态链影响因素之间的关系,利用NoteExpress软件得出关键词共现矩阵,导入Netdraw中可得政府开放数据关键词的聚类关系图。Netdraw图谱见图2。

图2 Netdraw图谱

通过知识图谱分析,“数据开放平台”“政府数据治理”“生态系统”“数据共享”“数据政策”“数据利用”“信息公开”“政策法规”“隐私保护”和“数据质量”等关键影响因素与主题联系紧密,且彼此间关联度较高,但目前这些影响因素仅从文献分析中得来,不足以代表用户的具体意见。因此采取深度访谈的形式获得一手材料,同时将文献调研初筛的影响因素作为半结构式访谈问题设计的主要依据。

2.3 数据编码及分析

访谈前告知受访者相应的受访内容和研究主题,在征得受访者同意的前提下进行录音。访谈的提纲主要定为半结构式访谈,结束后将语音信息转化为文字资料进行分析。

2.3.1 数据分析

为了保证研究的严谨性和数据资料的信度和效度,选择多元证据来源,反复迭代分析编码,同时通过文献调研,一手及二手资料交叉验证编码结果。结合收集的资料进行逐条讨论并最终将数据与概念意义一一对应,形成分类编码。

2.3.2 自动编码

基于Nvivo质性分析的词语云见图3。受访者关注点主要集中在“数据便利”“数据公开”“数据质量”“数据真实性”“数据泄露”“政府监管”“数据公布及时”“政府数据开放力度”以及“数据侵犯”等方面。因此将变量的主范畴编码初步归类为数据便捷程度、数据公开范围、数据质量、隐私保护、政府监管和数据真实性6个方面。

图3 基于Nvivo质性分析的词语云

2.3.3 开放式编码

在对原始访谈数据逐句解释的基础上提取出访谈数据中有效语句的概念和类别,剔除出现频次少于2次的原始概念,进行开放式编码。一手访谈数据资料标示为“F”,政府数据平台用户互动交流数据资料标示为“P”,其中广州市政府为P1,北京市政府为P2,深圳市政府为P3,杭州市政府为P4,上海市政府为P5,安徽省政府为Pa,海南省政府为Pz,贵州省政府为Pg。最终提取26条一手数据原始语料、25条二手数据原始语料,共51条原始语料提取的14个基本子范畴和相关概念。开放式编码结果见表1。

表1 开放式编码结果

2.3.4 主轴式编码

在开放式编码的基础上进一步分析原始语料库、概念和子范畴,寻找范畴与概念之间的逻辑关系。基于自动编码,将主范畴初步定为“数据公开范围”“数据便捷程度”“隐私保护”“政府监管”“数据真实性”和“数据质量”6方面。归类分析中未出现新的核心内容,因此不增加新的主范畴,时根据主范畴之间的逻辑关系将其分为平台、政策和数据3个层面。主轴式编码结果见表2。

表2 主轴式编码结果

2.3.5 选择性编码

选择性编码的目的在于提炼出核心范畴,梳理出核心范畴和各范畴之间的逻辑关系。根据范畴间的内在联系,确定“政府开放数据用户创新需求”为核心范畴。同时为加强关系结构的说服力,附上相对应的访谈人员的数据资料加以验证。选择性编码结果见表3。

表3 择性编码结果

2.3.6 饱和度检验

根据三级编码结果,再次选取剩余原始数据和政府数据平台用户反馈数据进行分析,检查是否存在缺失的概念和范畴。实验结果表明,该部分的编码没有超出主范畴,表明相关概念和范畴没有遗漏,理论模型达到饱和,故认为检验通过,部分检验材料如下:

P1:对数据开放的真实性存在一定的质疑。(A15人为优化—B7数据路径—C4数据真实性)

P2:平台对于用户提交的数据使用申请恢复

不及时,用户体验感不高,未能真正发挥平台和数据资源的价值。(A22用户体验—B10数据服务质量—C5数据质量)

P3:数据开放要适当开放、准确开放,既能达到我们需要的效果,又能防止被不法分子利用是政府部分数据开放时需要考虑的问题。(A13脱敏处理—B6数据保护—C3隐私保护)

P4:部分数据并没有对外开放,导致搜集数据有所困难。(A04开放范围、标准—B2数据开放程度—C1数据公开范围)

P5:这个要看不同的乡镇,不同的平台,有些地方可能连官网都没有。(A28中央与地方政府差异—B13监管差异性—C6政府监管)

3 政府开放数据生态链演化的影响机制

3.1 框架构建

基于上述编码分析,全面整合政府开放数据生态链演化过程中的主要影响因素及其逻辑关系。从政策层面、平台层面和数据层面3个逻辑层面分析其影响因素,并提出用户创新激励手段。用户创新激励视角下政府开放数据生态链演化的影响因素模型见图4。

图4 用户创新激励视角下政府开放数据生态链演化的影响因素模型

3.1.1 平台层面直接影响用户创新需求

首先,用户对“数据更新频率”需求较高,但当前政府开放数据还具有滞后性,主要体现在数据公开时间晚、数据更新频率慢等问题上。[9]其次,大部分用户对政府数据公开范围有更高需求,而平台的数据覆盖面不够,数据开放领域也不够全面。数据公开度的提升需要生态链中各节点的共同努力,协同优化。最后,用户获取政府开放数据的目的不同、期待的数据形式也不同。[10]10-168如学者群体更偏向于获取原始数据,因为此类数据更适合做量化研究,而其他群体则更倾向于加工后的数据,便于更快获取信息。

3.1.2 政策层面直接、间接影响用户创新需求

政策层可以直接影响用户创新需求,也可以通过影响平台层来间接影响用户创新需求,从而促进政府开放数据生态链的演化。(1)从直接影响来看,首先,由于政府部门定位涉密信息的界限不清,用户个人也存在安全意识不足的问题,因此“个人隐私”的定义往往难以辨别。[11]4-9而用户则普遍“希望政府开放数据公开程度更高但不希望侵犯个人隐私”。[12]其次,数据保护程度影响着用户对政府开放数据的态度。[13]77-79+85截至2022年6月,仅有18个省市公布了相关的《数据条例》,地方性法规条例与国家层面法规出台速度相比较为落后。[14]在此现状下用户普遍认为“中央与地方政府数据开放水平存在差异”。(2)从间接影响来看,由于地方政府的法律法规有待完善,地方政府发布的政策法规也不够全面,缺乏对平台的指导性。同时当前数据传递的管理主体主要有3种:政府办公厅、经济与信息委员会以及大数据管理机构,这三者之间分工并不明确,甚至存在竞争行为,因此数据传递路径较为混乱。

3.1.3 数据层面直接、间接影响用户需求

(1)从直接影响来看,受访者需要数据真实性的保障,具体体现在数据路径是否明晰、数据是否有第三方监管。目前的政府数据开放水平仍然存在着开放数据质量不过关的现象,有相当一部分数据仍不能满足用户对数据的需求,也不能实现数据的再利用价值。同时由于政府开放数据的“碎片化”管理,政府内部职能交叉、权责不明,给用户跨部门大数据收集、共享、梳理带来了较大困难。(2)从间接影响来看,由于技术难题、互联网制约等导致政府数据开放平台中的核心数据共享受到了较大制约,若干技术障碍导致数据发布复杂化,缺乏数据标准。用户的体验度主要来自于平台提供的数据质量、信息交互反馈程度、平台的维护情况等,用户要求的数据格式各不相同,而平台未提供各种数据转化功能,因此用户需求的满足程度较低。

3.2 用户创新激励措施

用户创新动机的产生需要动因,分为内因和外因。内因是来自用户内部的创新需求,外因则为外界对用户创新的激励。基于前文研究,从创新、平台和数据层激励3个维度提出用户创新激励手段。

(1)政策层面。

政策法律法规是政府开放数据生态环境的重要组成部分。数据生产者与政府主管部门在政策制定方面发挥着指导性的作用。第一,为满足用户对数据隐私保护的需求,政府要明确数据安全保障政策体系,并且制定安全技术体系来保障数据脱敏。第二,政府要明确管理主体,消除数据开放过程中存在的权责模糊问题,在政策法规中对各管理主体标明权利义务。第三,统一开放标准。建立完善的数据分类体系,将数据转化为标准格式在数据平台上进行公布。第四,定期评估数据开放效果。除内部评估外还可以借助第三方评估机构定期评估,采取双重评估机制。

(2)平台层面。

数据开放平台作为数据传递者的主要阵地,主要实现面向用户需求的个性化服务。同时,作为生态链内数据流转的中心,其汇聚了各节点数据并为其提供了交流沟通的空间。在平台层面的用户创新激励主要包括以下手段:首先,数据平台应完善数据检索功能,帮助用户从海量数据中迅速找到自己需要的信息。第二,平台要增强与用户之间的信息互动,要着眼用户的体验、需求,例如深圳市数据开放平台设计调查问卷来寻求用户意见,同时设置用户社区交流专区。第三,对开放数据平台进行定期评估,及时进行平台功能的完善和技术改进。

(3)数据层面。

数据是重中之重,其在数据生态链演化过程中不断流转循环。从数据层面看用户创新激励,首先,要提高数据开放的覆盖性。目前政府数据开放的覆盖性仍有局限,要及时根据用户的需求更新、拓展数据集。其次,要精准更新数据,通过数据集下载量判断数据需求,从而调整更新周期。最后,要加强数据资源建设,提高数据开放的深度和广度,丰富数据的形式,使得数据既满足用户的直接利用需求,又满足用户对数据再创造的需求。

4 结 语

本文将用户创新激励理论应用于政府开放数据生态链演化的影响因素研究中,选取文献资料,政府开放数据用户访谈资料以及典型政府数据平台的用户反馈意见三类数据资料,运用扎根理论的方法,通过开放式编码、主轴式编码以及选择性编码三级编码,总结出6个主范畴,14个子范畴的政府开放数据生态链演化影响因素模型。用户创新需求为政府开放数据生态链中的核心演化动力,最后从政策、平台、数据3个维度分别提出用户创新激励建议。本文基于前人提出的政府开放数据生态链演化的理论研究,具体界定了政府开放数据生态链演化的核心动力和影响因素,并明晰了其影响机制。其局限性在于运用扎根理论的方法进行编码存在一定的主观程度,未来可以进一步引入其他量化研究对模型中各影响因素之间的内在关系进行测量分析,以提高模型适用性。

猜你喜欢

范畴编码政府
批评话语分析的论辩范畴研究
正合范畴中的复形、余挠对及粘合
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Clean-正合和Clean-导出范畴
知法犯法的政府副秘书长
Genome and healthcare
依靠政府,我们才能有所作为
政府手里有三种工具