面向“十四五”规划建设目标的社会公众开放政府数据利用行为比较研究
2024-02-28胡江枫周力虹
王 迪 胡江枫 张 芮 周力虹
(1.中国人民大学信息资源管理学院,北京,100872; 2.武汉大学信息管理学院,武汉,430072)
1 引言
开放政府数据是建设和加强数字政府的重要工作,有利于提高政府工作的透明度,提升社会公众对社会事务的参与度和信任度[1]。我国高度重视政府数据的开放与再利用,先后发布一系列政策文件,推动政府数据在政治、经济、文化、教育等领域潜在价值的深度释放。2020年3月,我国政府发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次将“数据”作为生产要素,提出“加快培育数据要素市场”,并将推进政府数据开放共享作为其中的重要环节[2]。同年10月,“十四五”规划进一步提出提高数字政府建设水平,加强公共数据开放共享,利用开放共享数据不断提高决策科学性和服务效率;扩大基础公共信息数据安全有序开放,建立健全国家公共数据资源体系;同时,构建统一开放平台和利用端口,提升国家数据共享交换平台功能,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放,并鼓励第三方深化对公共数据的挖掘利用[3]。2021年《政府工作报告》将“提高数字政府建设水平,营造良好数字生态”作为“十四五”建设时期的主要目标任务[4]。2022年4月19日通过的《国务院关于加强数字政府建设的指导意见》强调进一步推动政府数字化,运用数据“为推进国家治理体系和治理能力现代化提供有力支撑”[5]。
在过去的十几年,开放政府数据在全球范围内获得了飞速发展[6],在驱动经济转型发展、创新社会治理模式和服务民生建设上发挥了重要作用[7]。社会公众作为开放政府数据的利用主体和最主要受益者[8],其对开放政府数据的认知在不断提升,其需求和行为也在不断发生变化。然而,现有研究对社会公众的开放政府数据利用行为关注尚不充分,尤其缺乏关于开放政府数据发展进程中,社会公众利用行为变化方面的研究[9]。
本研究聚焦作为开放政府数据核心用户的社会公众,分析从“十三五”到“十四五”建设时期,我国社会公众的开放政府数据利用行为产生的变化。“十四五”建设时期是我国开启全面建设社会主义现代化国家新征程的第一个五年,以社会公众为代表的我国人民是“十四五”规划的中心。本研究有助于了解开放政府数据的利用实效,改善开放政府数据的利用现状,提出相应对策来提高社会公众的获得感,从而为“十四五”建设时期我国开放政府数据的发展提供借鉴,助力数字政府建设水平的提升。
2 相关概念与研究框架构建
2.1 开放政府数据利用
开放知识基金会(Open Knowledge Foun-dation)将开放政府数据定义为由政府部门产生或收集,任何人都可以自由利用、再利用或重新分配的数据[10]。政府数据面向社会公众开放,不仅有利于提升政府工作的透明度,便于社会公众更好地了解政府部门,还有助于创造兼具社会与经济效益的新型数据服务[10]。
然而,学者们发现,开放政府数据的核心要义不仅在于“开放”,更在于“利用”[11]。数据开放虽然是挖掘政府数据潜在价值的第一步,却并不能创造价值[12]。开放政府数据必须依赖于有效的利用才能实现数据价值的最大化[13],政府部门、企业、社会组织、社会公众等均为开放政府数据的利用主体[14]。在信息社会,社会公众作为开放政府数据利用的核心参与者和主要受益者,最大限度地满足其对开放政府数据的需求成为我国政府部门工作的题中之义[15]。
2.2 开放政府数据生命周期理论
开放政府数据是一个动态且复杂的过程,涉及到不同的类型和主体[16],以及从数据的产生、组织、发布到利用等多个环节,构成了开放政府数据的生命周期[17]。目前,学术界就开放政府数据生命周期理论进行了许多探讨,根据划分阶段的不同大致可以分为三类观点:其一,认为开放政府数据生命周期包含三个阶段,如Attard等[18]提出了开放数据的准备、使用和维护三个阶段,包含数据创造、筛选、统一、出版、交换、发现、探索、利用和管理九个子步骤。其二,认为开放政府数据生命周期由五个阶段构成,如Villazon-Terrazas等[19]认为开放政府数据生命周期由数据说明、建构、生成、发布和开发构成。其三,认为开放政府数据生命周期包括六个阶段,如Hyland等[20]认为开放政府数据生命周期包含数据的识别、命名、描述、转换、发布和保存;而鲍静等[21]则认为生命周期由数据的生成发布、权限管理、网上流动、数据呈现、开发利用和更新管理构成。
不难看出,虽然国内外学者们普遍认为开放政府数据存在完整的生命周期,但对于开放政府数据生命周期的阶段构成尚未形成统一观点。另外,现有的开放政府数据生命周期理论研究大多从政府部门的角度出发进行阶段划分,聚焦于数据的供给,缺少从社会公众的视角对数据的利用阶段进行深入的分解与论述。
2.3 社会公众开放政府数据利用研究框架构建
针对上述开放政府数据生命周期理论研究的不足,本文从社会公众的视角出发,重点关注开放政府数据利用的阶段划分。首先,认知是利用的前提和基础。社会公众必须先了解开放政府数据及相关服务,才能对其进行利用。目前,社会公众对开放政府数据的认知仍然不足。Toots等[22]认为很多社会公众尚不了解开放政府数据这一概念,对其在提供以数据为导向的服务方面带来的益处知之甚少;Abdelrahman[23]指出社会公众对开放政府数据认知的缺乏已成为阻碍开放政府数据建设目标实现的重要因素之一;余奕昊等[24]发现我国开放政府数据平台的总体开放力度较弱,在社会公众中缺乏认知度;朱红灿等[25]也认为开放政府数据平台尚未成为社会公众获取政府信息的首选渠道。由此可见,现阶段社会公众对开放政府数据和数据平台的认知存在一定的局限,社会公众对数据的认知是影响开放政府数据利用的首要因素[26]。
其次,认知并不会直接驱动利用行为,而需求是利用行为的直接驱动力[27]。即使社会公众已经建立对开放政府数据及其相关服务的认知,如果不考虑社会公众的实际需求,政府部门同样无法为社会提供有价值的政府数据[28]。Gonzalez-Zapata等[29]认为社会公众对不同主题的开放政府数据具有不同的需求,如社会公众为探寻影响自身健康问题的潜在风险因素[30]需要利用医疗健康数据。吴钢等[31]也发现各国政府以及国际组织为指导开放政府数据的发展,针对数据属性提出了诸多建设原则,如批量下载、免费下载、定期更新、机读数据等。越来越多的开放政府数据平台正在为社会公众更好地利用开放政府数据而提供不同的数据属性功能。这些数据属性与开放政府数据的价值实现息息相关,是评判开放政府数据质量的重要指标[32]。在数据属性上表现优异的开放政府数据能够更好地调动社会公众进行深度开发利用的积极性[33]。同时,这些数据属性作为决定开放政府数据质量的基础要素[34],也直接影响了社会公众对开放政府数据的信任程度和利用情况[35]。
再次,对于开放政府数据而言,获取了所需数据才能对数据进行开发利用。当前,为方便社会公众快速准确地获取已开放的政府数据,各地政府部门通常会建设专门的开放政府数据平台[36],提供诸如关键词检索、浏览、排行榜、筛选等功能,方便社会公众获取目标数据[37]。这些功能的效果会直接影响社会公众的数据获取效率[38]。黄如花[39]认为开放政府数据平台站内搜索引擎提供的关键词检索功能是方便社会公众多角度查找和获取数据的最有效途径;杨瑞仙等[40]发现数据分类导航功能有助于社会公众通过直接浏览获取目标数据,同时能够帮助其发现潜在的数据需求,因此,应作为评价开放政府数据平台的重要指标之一。此外,用户信息行为研究表明,社会公众对不同类型的数据获取方式存在偏好。因此,精准捕捉社会公众在数据获取方式上的需求与喜好,有助于不断完善开放政府数据平台建设[41]。
最后,开放政府数据价值的实现需落脚于社会公众对数据的实际利用,本文将之理解为一种对数据价值的消费行为。随着开放政府数据平台中数据数量不断增多,根据社会公众数据消费过程中的实际需求提供针对性的数据服务成为平台建设的主要挑战之一[42]。研究表明,社会公众对开放政府数据的消费存在复杂多变的目的。如Gurin[43]指出社会公众将开放政府数据用于创造商业价值并获得商业收益;武琳等[44]认为社会公众使用开放政府数据来了解个人关心的诸如政府工作、社会经济发展状况等问题。因此,政府部门有必要了解社会公众的开放政府数据消费目的及消费行为产生的条件[45]。此外,Abdelrahman[23]指出不少现有的开放政府数据平台因缺乏开放数据使用手册而给社会公众的数据消费增加了难度。明确社会公众在使用开放政府数据平台时遇到的困难是健全和完善平台功能的关键。
综合上述讨论,结合现有开放政府数据生命周期理论[46],本文构建了以社会公众为主体的开放政府数据利用研究框架(见图1)。笔者将社会公众的开放政府数据利用行为划分为四个阶段:首先,社会公众需要对开放政府数据及数据平台具有一定的认知,了解开放政府数据这一概念及其涵盖的数据范围。在此基础上,社会公众会对不同主题的开放政府数据以及数据属性产生不同程度的需求。在形成较为明确的数据需求后,社会公众会通过一定的方式获取所需的开放政府数据。如果获取的数据能够满足其实际需求,则社会公众会对数据进行消费来实现自身目的;反之,如果无法获取数据或数据无法满足实际需求,则会产生数据消费难度,进而抑制社会公众的数据消费行为。这一研究框架为本文对社会公众的开放政府数据利用状况的调查设计与分析提供了理论支撑。
图1 社会公众开放政府数据利用研究框架
3 研究方法
3.1 问卷设计
基于上述研究框架,本研究通过设计调查问卷以了解“十三五”到“十四五”建设时期,我国社会公众的开放政府数据利用状况发生的变化。该问卷包括五部分:①社会公众的基本特征,包括性别、年龄、最高学历和职业;②社会公众的开放政府数据认知,包括对开放政府数据的认知和对开放政府数据平台的认知;③社会公众的开放政府数据需求,包括对数据主题的需求和对数据属性特征的需求;④社会公众的开放政府数据获取,主要包括两方面:一方面是获取途径,通过对现有开放政府数据平台的获取途径进行调研,采用了关键词搜索、浏览功能、排行榜(如最多点击、最多下载、最佳评价等)和推荐功能;另一方面是获取频率,主要对最常使用的关键词搜索和浏览功能进行对比分析[47];⑤社会公众的开放政府数据消费,包括消费目的和消费难度。根据相关文献,在去除内涵存在交叉的消费目的之后,最终采用以下六种消费目的:日常生活、新闻报道、商业决策、监督知情、软件发展和科学研究[48-49]。问卷包括单选题、多选题、填空题和量表题,其中量表题均采用李克特7分量表。完整样卷参见附录。
3.2 问卷发放与回收
本研究使用“问卷星”平台进行在线问卷的创建与发放。问卷通过我国两个最大的社交平台(微博和微信)采用完全相同的征集方式,分别在“十三五”和“十四五”建设时期的两个时间段进行发放。其中,“十三五”建设时期的问卷发放时间为2017年8月1日到8月10日;“十四五”建设时期的问卷发放时间为2021年9月9日到9月26日。由于两次问卷发放的时间间隔较长,因此并未要求被调查者必须同时参加两次调查。两次问卷发放分别回收有效问卷208份和211份,共计419份。
3.3 样本分布与信效度检验
本研究采用alpha信度和KMO检验对问卷的信度和效度进行检验,在信度检验中,alpha值为0.87,高于0.8;在效度检验中,KMO值为0.9,大于0.8,说明本次采集的数据具有较好的信度与效度。
本次被调查者基本特征分布如表1所示。卡方检验表明,本次征集“十三五”与“十四五”建设时期的被调查者在性别、年龄、职业和教育水平分布上均无显著差异。
表1 被调查者基本特征分布
4 “十四五”规划前后社会公众的开放政府数据利用比较
4.1 开放政府数据认知比较
关于开放政府数据的认知,本次调查数据显示,“十四五”规划前后仅有不到半数的参与者表示知道或使用过开放政府数据及相关平台。同时,卡方检验(表2)显示,除“知道数据”以外,社会公众对其他三个方面认知的显著性p值均小于0.05,说明进入“十四五”规划建设时期后,知道并使用过开放政府数据及平台的社会公众显著增加。
表2 “十四五”规划前后社会公众的开放政府数据认知比较
4.2 开放政府数据需求比较
关于开放政府数据的需求,本次调查数据发现,在数据主题需求方面,进入“十四五”建设时期后,社会公众对开放政府数据的总体需求呈上升趋势。两独立样本t检验结果表明(表3),社会公众对教育科技、区域统计、公共交通、公共安全、法律政策和环境质量等主题的需求程度较“十三五”时期显著降低。
表3 “十四五”规划前后社会公众的开放政府数据主题需求比较
通过对被调查者的年龄、学历和职业与其对开放政府数据的主题需求进行单因素方差分析发现(详细数据参见附录1),进入“十四五”建设时期后,不同社会背景的社会公众对数据主题的需求呈现多样化趋势,且关注重点发生变化。41—50岁的社会公众更关注公共安全、公共交通、法律政策相关数据;拥有学士学位的社会公众对气候气象、文化休闲这两类主题的数据需求度更高,而管理人员更加关注环境质量类的数据。
在数据属性需求方面(详细数据参见附录1),两独立样本t检验的结果显示,进入“十四五”建设时期后,除“数据批量下载”外,社会公众对另五项数据属性的需求均有所下降。其中,“数据免费下载”“数据保持最新”“数据定期更新”和“可机读的数据”等属性的需求变化尤为显著。
4.3 开放政府数据获取比较
关于社会公众的开放政府数据获取途径,本次调查数据显示,进入“十四五”建设时期后,各个获取途径的使用人数都有所增长,偏好差距进一步缩小。其中使用最多的是关键词搜索和浏览,使用最少的是排行榜。卡方检验结果(表4)表明,“十四五”规划后,浏览功能的使用人数得到显著提升。
表4 “十四五”规划前后社会公众的开放政府数据获取途径比较
通过对被调查者的背景特征与其对开放政府数据的获取途径进行卡方检验发现,进入“十四五”建设时期以后,不同年龄层和学历水平的社会公众对“关键词搜索”这一数据获取方式的利用度存在显著差异。在数据获取途径的使用频率方面,两独立样本t检验的结果显示,“十四五”规划前后关键词搜索和浏览的使用频率变化并不显著(关键词搜索的显著性=0.497,浏览的显著性=0.313)。关键词搜索的使用频率在“十四五”规划前后均高于浏览,但“十四五”规划后关键词搜索频率略微下降,浏览频率略微上升(详细数据参见附录1)。
4.4 开放政府数据消费比较
关于社会公众的开放政府数据消费目的,卡方检验(表5)结果表明,进入“十四五”建设时期后,社会公众将开放政府数据用于软件开发的消费行为显著增多,而用于经营决策和监督知情的消费行为显著减少。
表5 “十四五”规划前后社会公众的开放政府数据消费目的比较
通过对被调查者的背景特征与开放政府数据消费目的进行卡方检验发现,“十四五”规划前后,社会公众的年龄、学历和职业对其开放政府数据的消费目的均有显著影响(详细数据参见附录1)。进入“十四五”建设时期后,41—50岁之间的社会公众大多将开放政府数据用于日常生活,而31—40岁之间的社会公众则倾向于以软件开发为目的进行数据消费。同时,该类社会公众大多获得学士学位,以日常生活和监督知情为主要消费目的的社会公众大多为管理类人员。
关于开放政府数据的消费难度,两独立样本t检验结果显示,“十四五”规划建设前后,社会公众的开放政府数据消费难度均较高,进入“十四五”建设时期后,这一点并没有得到显著改善(显著性= 0.806)。
5 社会公众的开放政府数据利用要素关系分析
在数据认知与需求间的关系方面,通过两独立样本t检验发现,社会公众对开放政府数据及其平台的认知对其数据主题需求与属性需求都具有显著影响。使用过开放政府数据及其平台的社会公众对地理地图、国际贸易和公共安全数据需求更高,同时更关注数据批量下载、数据保持最新和数据的可机读性。
在数据需求与获取间的关系方面,两独立样本t检验结果显示,使用关键词搜索的社会公众对信用记录、医疗健康、数据批量下载和数据保持最新的需求程度显著更高。使用浏览功能的社会公众对医疗健康、地理地图、公共安全、数据批量下载、格式化数据和可机读数据的需求程度显著更高。同时,社会公众对开放政府数据主题及属性的需求程度与数据获取方式的使用频率存在显著正相关关系(显著性均≤0.002)。
在数据获取与消费间的关系方面,两独立样本t检验结果表明,使用关键词搜索的社会公众认为开放政府数据的消费难度显著更高(显著性=0.034),而将开放政府数据用于科学研究的社会公众则会更频繁地使用关键词搜索功能(显著性=0.044)。卡方检验结果表明,将开放政府数据用于科学研究的社会公众更易选择关键词检索,用于软件开发的社会公众更易选择浏览来获取所需数据,用于日常生活和新闻报道的社会公众更多选择查询排行榜。
在数据认知与消费间的关系方面,卡方检验结果表明,知道和使用过开放政府数据的社会公众更多地将数据用于日常生活、科学研究和新闻报道。而知道和使用过开放政府数据平台的社会公众则更多地将数据用于科学研究和监督知情。
通过上述对开放政府数据利用的认知、需求、获取和消费四个要素间的关系进行分析,本研究得出图2所示的开放政府数据利用要素关系模型。粗箭头指向四个要素间的演进顺序,灰色细箭头代表不同背景特征的社会公众和各要素间的关系,黑色实线则代表细分要素间的相互影响关系。
图2 社会公众的开放政府数据利用要素关系模型
可以发现:①社会公众对开放政府数据及其平台的认知情况决定其对数据主题和属性的不同需求;②社会公众对数据主题和属性的不同需求都会影响其选择不同的数据获取方式和对获取方式的不同使用频率;③社会公众选择开放政府数据的获取方式直接反映了其数据消费目的和消费难度,而获取方式使用频率的不同也是社会公众基于不同消费目的做出的选择;④社会公众的不同消费目的往往又会导致其对开放政府数据及其平台产生不同的认知。
6 发展途径探索与研究局限
基于前文对“十三五”到“十四五”建设时期,我国社会公众的开放政府数据认知、需求、获取和消费四个维度行为变化及各维度间相互关系的分析结果,本研究认为,面向“十四五”规划关于“加快数字化发展,建设数字中国”的战略目标,可通过以下四条途径进一步推动社会公众对开放政府数据的利用:
(1)开展个性化的数据认知培训和指导。进入“十四五”建设时期后,虽然社会公众对于开放政府数据的认知情况有所改善,但总体覆盖率仍不到50%,社会公众的数据意识较为薄弱,数据素养有待提升[50]。普及提升社会公众的数字素养,是“十四五”规划明确提出的建设目标之一。政府部门可通过多种途径提升社会公众的数字素养[51],如定期培训、讲座、研讨会等,普及开放政府数据平台、数据质量等知识[52],提升社会公众对开放政府数据的认知,更精准地捕获社会公众的数据偏好,为开放政府数据平台功能的改善奠定基础。
(2)构建供需匹配的数据开放模式。本研究发现,社会公众对开放政府数据具有特定的需求,而当前政府部门的数据供给尚无法充分满足其数据需求。要实现“十四五”规划中提出的“持续提升社会公众的获得感”这一建设目标,针对社会公众的个性化需求提供针对性的开放政府数据服务势在必行。结合本研究提出的开放政府数据利用要素关系模型,政府部门可通过大数据技术,挖掘各年龄层、学历水平和职业定位的社会公众在数据需求方面的偏好,加大对浏览次数多、下载量大的主题类型数据的开放程度[53]。同时采用线上线下相结合的形式,通过平台社群论坛、线上问卷、一对一访谈等,了解当地社会公众的数据需求状况[54]。此外,可通过政府部门、学界和业界的三方合作模式,协作高效地开展政府数据的开放工作[55]。
(3)统一数据标准,提升数据质量。推动高质量发展是“十四五”规划的主题,深化供给侧结构性改革是“十四五”规划的主线。目前开放政府数据平台数据集的数据属性尚无法充分满足社会公众的需求。而这些数据属性对开放政府数据质量有重要影响,是判断数据质量的评价要素[56]。数据质量是影响开放政府数据价值实现的关键因素[51]。因此,政府部门可从社会公众更关注的数据属性角度入手,提升数据质量,包括统一数据格式、免费性、及时性、可机读等;通过数据管理办法进一步规范数据属性[53],建立数据质量评估标准体系[57],从宏观层面提供数据质量保障。
(4)开展特色服务推动创新利用。目前开放政府数据平台提供的服务功能尚不完善,如部分数据获取服务因使用效果不佳导致利用率不高。为进一步实现“十四五”规划中提出的“推动数字化服务普惠应用”的目标,开放政府数据平台在未来可提供更精准的检索服务,结合人工智能技术和数据可视化技术,提供更直观的数据获取途径和数据展示方式,降低社会公众的数据获取和消费难度[31]。同时,完善平台的数据推送功能,根据社会公众的需求偏好和消费目的提供个性化服务[58]。
本研究基于现有开放政府数据生命周期的研究文献,构建了社会公众的开放政府数据利用框架,并对我国“十四五”规划前后社会公众的开放政府数据利用情况进行了对比分析,结合“十四五”规划中关于数字化发展的建设目标,探索了推动社会公众对开放政府数据利用的发展途径。然而,受调查样本数量所限,本文研究结论可能无法充分反映社会公众的开放政府数据利用全流程。未来,可针对不同类型的社会公众,对其开放政府数据需求和消费行为进行更深入的调查分析。
注:本文第4节和第5节的更多支撑性数据详见附录1《支撑性数据分析结果》,获取地址:https://docs.qq.com/doc/DSXZyT0VzbFF5YWFB
本文调查问卷样卷详见附录2《调查问卷样卷》,获取地址:https://docs.qq.com/doc/DSXV1a3lNcUNXQXh2