政府数据开放成熟度模型研究
2019-02-25迪莉娅
迪莉娅
摘要:成熟度模型是衡量政府数据开放能力的重要方面。本文阐述了政府数据开放成熟度的含义、模型构建的重要性,并回顾了国外政府数据开放成熟度模型的类型。重点从政府主体的角度构建了我国政府数据开放成熟度的模型,分析了当前政府数据开放成熟度的状况,并提出了提高政府数据开放能力成熟度的建议和意见。
关键词:政府;数据开放;成熟度;模型
DOI:10.3969/j.issn.1008-0821.2019.01.013
[中图分类号]D63-39 [文献标识码]A [文章编号]1008-0821(2019)01-0103-08
政府数据开放不仅促进政府管理更加开放和透明,而且大幅度提高企业对数据的创新性利用和推动大数据产业的发展(见图1)。自从2009年美国政府宣布实施政府数据开放政策并建立专门的网站开放数据以来,世界范围内掀起了政府数据开放的热潮,相继有英国、澳大利亚、欧盟等国家和超国家组织发布和建立政府数据开放网站,促進数据的开放和免费利用。为了促进政府数据开放,我国也于2013年发布了《促进大数据发展行动纲要》,该纲要指出将在2018年年底前建成国家统一的政府数据开放平台,成为指导我国政府数据开放的纲领性文件。
政府数据的开放是一个不断进步和优化的梯度性发展过程,虽然很多国家制定了大力推行政府数据开放的宏观政策与方案,但是其阶段性发展方向、能力性指标建设却没有得到足够的重视。
1政府数据开放成熟度含义及其模型构建的重要性
成熟度是衡量政府数据开放阶段性能力的重要依据,而对其含义的认识和模型的构建对于政府数据开放能力的提高具有重要的推动作用。
1.1政府数据开放成熟度含义
成熟度这一概念是由1984年美国卡内基·美隆大学的软件工程研究所提出的能力成熟度这一概念演变而来。能力成熟度模型是用于改进软件开发过程的一种方法论,通常由5个阶段构成,包括起始阶段、项目式管理阶段、定位阶段、定量管理控制阶段和持续优化阶段。
随着对成熟度认识的不断加强.成熟度模型被广泛应用于信息、管理和医疗等领域,主要测评和描述事物阶梯型的发展过程及能力的表现。当然,关于成熟度模型目前学界并没有统一的认识。例如Laura Sanchez等学者认为成熟度模型是指组织机构实施管理过程中一个或多个领域重要实践的演进路线图。Schott P等学者认为成熟度模型描述了特定应用领域内的流程、对象、组织和技术的发展阶段。R T Stephens认为成熟度模型是指为了创造更加持续稳定的环境对管理活动或者良好实践所进行的渐进式描述。
综上所述,成熟度模型具有以下特点:1)成熟度模型是描述管理活动渐进式发展的过程图;2)成熟度模型体现了事物从低到高发展的路径;3)成熟度模型也是对事物发展能力测评的重要依据。目前对政府数据开放成熟度模型的认识还处于起始阶段,并没有统一的认识,本文认为政府数据开放成熟度模型是指政府开放数据范围、内容及利用效果由低到高循序渐进发展历程的模型。
1.2政府数据开放成熟度模型构建的重要性
第一,政府数据开放成熟度模型的构建有助于政府数据开放战略目标的实施。政府数据开放成熟度模型是从整体构建政府数据开放的梯度发展历程,也可以称之为政府数据开放阶段性发展战略目标的路线图,对于持续改进和优化政府数据开放的能力、目标、方法的实施具有重要的参考价值。
第二,政府数据开放成熟度模型的构建是评估政府部门开放数据情况的重要尺度。尤其在对刚实施政府数据开放的部门,通过成熟度模型,正确评估和定位政府部门内部数据开放的准备情况、数据安全、质量优劣等方面具有重要的参考意义。
第三,政府数据开放成熟度模型有利于不断提高政府数据开放的能力。政府数据开放是对政府本身数据治理、数据共享、数据安全和隐私保护、数据服务、数据利用能力的全面体现,通过成熟度模型的构建,有助于不断完善政府数据开放中存在的问题,提高政府数据开放的管理能力、安全能力和服务能力。
2国外政府数据开放成熟度模型回顾
成熟度模型是评估政府开放数据能力的重要标准,得到国外很多学者的重视。虽然很多模型只是描述政府开放数据能力的某一个方面,但是对于我国政府数据开放能力成熟度模型的构建具有重要的参考价值。目前,具有代表性的开放数据成熟度模型有万维网联盟的数据开放成熟度模型、Tim Berners-Lee的开放数据关联5颗星模型、政府开放数据价值增值成熟度模型。
2.1万维网联盟的数据开放成熟度模型
于1994年成立的万维网数据联盟是世界上最具影响力的技术标准机构,已经发布了多项数据的技术标准和指南。万维网数据联盟在其报告《出版政府数据》中提出开放政府数据三步走的成熟度模型。首先,出版原始的数据,而非加工的数据,并且数据的结构必须完整。第二步,建立政府原始数据的开放目录,方便用户查找。第三步,保证出版的数据人类可读和机器可读(见图2)。
2.2 Tim Berners-Lee的开放数据关联5颗星模型
关联数据是促进政府开放数据利用的重要方式,Berners-Lee T于2006年提出,其核心的原理是:1)以URL命名事物;2)使用HTFP URIs方便查询事物的名称;3)查询URL,提供有用的信息和标准;4)通过利用其他的URL,以便发现和利用更多有用的信息和知识。Bemers-Lee T提出了以结构化数据为基础的、面向机器处理的全球性数据网蓝图。与互联网相同,其同样秉承了开放、参与、透明的理念。Berners-Lee T为了促进政府数据的开放,提出了关联数据成熟度的5颗星模型,以提高政府数据的创新性利用(见图3)。
2.3政府开放数据价值增值成熟度模型
Kalampokis E等基于数据治理的角度认为可将政府数据开放分为4个阶段:第一阶段,将不同来源的数据聚集起来。在这一阶段主要克服数据收集中政府机构在文化、法律方面的障碍。第二阶段,政府开放数据的阶段。在这一阶段由于数据来自不同的地方,因此政府在管理方面存在很大的挑战。因为需要保证整合数据的一致性和准确性,政府就需要在技术层面制定数据标准和识别标准。第三阶段,整合政府数据与非政府数据阶段。由于很多非政府的数据资源依然对用户具有重要价值,政府数据如何和非政府数据整合起来,就需要依靠关联数据技术,扩大数据的范围和内容,促进开放数据创新性的利用。第四阶段,政府数据和非政府数据与社交媒体数据的整合。这一阶段尤其要加强与社交媒体数据的整合,有助于增进政府对公众意见的了解,并能够让公众参与到政府的实际管理当中。因此,政府数据开放是一个梯度性发展的过程,每一个阶段都是数据价值不断递增的过程(见图4)。
从以上国外组织机构和学者关于政府数据开放成熟度模型的认识来看,主要从政府开放数据本身的收集、整合、关联和利用层面对成熟度进行了研究,为政府开放数据能力成熟度的研究提供了重要参考。本文从另外的视角,即从政府数据开放的主体一政府的角度研究数据开放发展的成熟度,希望对提高我国政府开放数据的能力具有一定的借鉴价值。
3我国政府数据开放成熟度模型的构建
政府数据开放是促进政府开放、透明以及大数据产业发展的重要举措。虽然我国目前还没有建立国家统一的政府数据开放网站,但是早在2012年已经有部分省、市开始陆续开放政府的数据,目前已经有上海、北京、武汉、贵阳、青岛等19个地方政府建立了政府数据开放平台。通过复旦大学的数字与移动治理实验室的调查报告显示,我国的政府数据开放还处于起始阶段,开放数据集和可机读数据集的数量还非常有限。
目前本文的调查显示,我国政府数据开放的良性循环模式还没有建立起来,很多的政府机构虽然建立了数据开放平台,政府数据开放成熟度远没有建构起来。本文认为,政府数据开放成熟度模型包括以下环节(见图5):
第一,认知阶段。政府工作人员对于数据开放的认知和了解程度是政府数据开放实施的基础。政府工作人员是数据开放的主体,政府主体对于数据开放的概念、特点、价值、目标、政策、法律、标准有清晰的了解和认识是推动数据开放可持续发展的重要保障。
第二,政府开放数据的治理阶段。政府数据开放的治理包括元数据治理、开放数据质量治理、数据安全治理以及个人隐私的保护等方面。治理阶段是开放数据服务的重要基础,也是对政府数据开放内容、管理能力和服务能力检验的重要环节。
第三,政府数据开放阶段。这一阶段的主要标志是政府数据开放网站的建立。政府数据开放网站是开放数据服务的窗口.是政府和民众互动的桥梁,也是政府数据开放治理成效的重要体现。如果前期治理不到位,在网站服务方面自然会出现数据质量、安全以及服务等方面的问题。
第四,政府数据开放服务全面监管和优化阶段。这一阶段可以说政府数据开放的体系已经建立起来,不仅要关注用户动态的需求,而且要基于用户的动态需求提供数据内容和不断改善与用户的交互方式,提高用户利用的满意度,并通过评估不断优化政府数据开放的流程和质量。
4我国政府数据开放成熟度分析
依据复旦大学公布的《2018中国地方政府数据开放报告》显示,虽然我国地方政府的数据开放取得了一定的成绩,但是可持续性和动力不足,其中重要的原因是政府数据开放的成熟度不足所致。
4.1政府数据开放的认知度比较低
政府数据开放的主体是政府工作人员,而其对于数据开放的认知是政府数据有效开放的直接动力。根据对我国部分政府工作人员发放的问卷调查显示,只有51%的被调查工作人员表示了解什是政府数据开放,其余的政府工作人员则表示不知道或者不清楚什么是政府数据开放。总体来讲,我国政府工作人员对于数据开放的认知度偏低,虽然目前我国有很多政府部门已经建立了政府数据开放的平台,但是很多政府数据开放的主体一政府工作人员却对数据开放的概念、特点、法律、政策、标准等方面的认识还远远不够,这也是一些政府数据开放平台动力、能力不足的重要原因。
4.2政府开放数据集的治理方法不到位
通过对我国已经建立的开放数据平台的调查来看,普遍存在以下问题:
1)多个平台元数据描述不一致,缺乏对元数据标准的共识。元数据是数据利用和再利用的重要基础。如果没有统一的标准,对后续数据的整合、关联、利用将会产生重要的影响。例如,从元数据的标注来看,我国政府数据开放度比较好的浙江政务网、上海市政府数据服务网和武汉市政务公开数据网在元数据的标注项方面也普遍存在不全面和用语不一致等情况(见表1)。
2)政府开放数据集的可机读性有待提高。开放数据很重要的特点之一是其可机读性,如果没有了可机读性,那么数据的关联和利用都会受到严重的制约。根据2017年政府数据开放平台报告显示,很多政府数据开放平台,例如武汉、上海、贵阳、青岛、浙江等的开放数据集并没有完全达到开放数据可机读的标准(见图6)。
3)政府数据开放安全和隐私的管理尚不到位。根据对各级政府机构数据安全和隐私管理的调查显示,很多政府机构并没有意识到在大数据时代,数据安全和隐私管理的重要性,其中约47%的政府机构没有建立信息安全的有关规章制度,隐私管理方面更加欠缺,约有59%的被调查者表示所在单位没有隐私保护和管理的有关制度和条例。
4.3政府数据开放平台的建设需要加强
目前我国除了独立性的政府数据开放网站,例如北京和上海之外,还有另外一种是依附性的政府数据开放网站。这类网站主要依附于电子政务网站和大数据平台建立起来的政府数据开放网站,例如青岛、重庆等,这些网站中,有些开放的數据直接通过链接跳转到电子政务门户网站或者其它的链接平台,减少了利用的便捷度。另外,从整体来讲,我国目前的政务数据开放平台建设依然采用的是以“块”为中心的建设方式,很少达到与“条”的链接。数据开放以地方政府自身数据资源为中心,而对上级机构和下级机构的数据关联、开放方面还没有得到足够的重视。
4.4政府数据开放服务能力需要加强
虽然我国目前已经有19个政府数据开放网站,但是网站的内容提供能力、互动能力和反馈能力都需要提高。例如,网站的数据内容提供方面普遍存在更新慢、格式单一、数据关联能力弱、授权不清等问题,同时网站缺乏实时的互动媒介,对于用户的需求难以及时掌控。虽然部分网站,例如上海市政府数据网、武汉市政务公开数据服务网、青岛市政府数据开放网等建立了用户评价界面,但对于用户需求方面的调查却缺乏实时或及时的反馈。
5加强我国应用政府数据开放成熟度模型的对策
从我国政府数据开放的发展来看,虽然很多政府机构建立了数据开放平台,但是其内容服务并没有达到理想的状态。政府数据开放网站是为用户服务的桥梁,如果政府工作人员的认知和数据治理的状态都没有达到要求,那么即使建立了政府数据开放平台也难以提供高质量的数据。
5.1提高政府部门对数据开放的认知能力
政府工作人员是数据开放的主体,而其对政府数据开放的认知和意义的建构对推动政府数据开放的有效实施起到至关重要的作用。
从认知的层次来讲,首先是对政府数据开放概念的认知,通过对政府数据开放含义、意义、价值、目标以及与政府信息公开的联系和区别等问题的学习,将会很大程度上提高政府主体对数据开放的认识。第二,政府主体对政府数据开放政策的学习。通过对国内外政府数据开放政策的学习,进一步了解政府数据开放的政策目标、实施步骤和评估方式。第三,政府主体对相关法律的学习。政府数据的开放涉及数据安全和个人隐私,通过有关法律的学习,提高政府主体对数据开放法律层面的认知,有助于加强对政府数据开放平台安全和个人隐私的保护。
5.2政府开放数据集的治理
虽然称之为政府数据开放,实际上是政府数据集的开放。数据集是由一个机构发布、保管并且可以被利用、下载的一个或者多种格式的数据集合,即由一个机构或部门发布和维护数据的集合。数据集治理是政府数据开放的基础,关系到数据开放利用的广度和深度。政府数据集的治理包括开放元数据标准制定、数据质量评估、数据安全机制及个人隐私保护方案的建立等方面。
第一阶段,制定元数据标准。数据的开放、共享离不开元数据的支持,为开放数据集建立高质量的元数据标准是实现数据目录之间互操作的基础,更有利于用户发现、理解和使用数据。在国际上通常采用数据目录互操作性协议(Data Catalog Interoperability Protocol,简称DCIP)。该协议中元数据标准分为3部分:数据目录标准、数据集标准和数据传播标准,对开放数据的共享和利用产生了积极的推动作用(见图7)。
从我国目前政府数据开放平台元数据的调查显示,需要完善数据开放元数据的目录,很多平台元数据不仅普遍缺少标识符、字节大小的描述,而且描述用语也不一致。因此,我国国家统一的政府数据开放平台的建立,需要加强元数据标准的制定,更好的指导地方政府数据开放平台的建设。
第二阶段,加强开放数据质量的评估。数据的质量包括准确性、及时性、完整性、可靠性、清晰性、连续性等。数据质量是数据分析和决策的生命线。因此为了提高政府开放数据的质量需要:1)成立专门机构,审核和负责开放数据质量及其管理。2)需要出台有关开放数据质量的政策和评估标准,为其评估提供依据和保证。3)建立政府开放数据质量评估方法。例如,欧盟数据质量评估主要依据用户的需求和国际标准进行评估,其方法和工具有质量报告、质量指数、评估的过程和变量分析、用户调查、自我评估和审计以及认证等多种。
第三阶段,制定数据开放的安全机制。正如《促进大数据发展行动纲要》中指出政府数据开放将会促进我国经济发展的战略转型,但是在不断促进开放的同时,加强数据的安全能力也是刻不容缓需要面对的问题。
1)对政府数据依类分级进行安全方面的鉴定。政府数据来源广泛,涵盖社会、经济、政治的方方方面,对政府数据依据不同类别进行安全级别的鉴定和赋予不同的开放权限,才能更有利于政府数据的有效开放,防止泄密和危害社会安全问题的发生。例如,佛山南海区政府数据开放平台将数据分为分析、共享、公开和开放4个权限,依据权限开放数据,极大地促进了数据的流动和利用。
2)加强数据脱敏及加密技术的应用。脱敏数据是指对某些敏感的数据,例如涉及个人隐私和安全的数据进行变形以防止泄密所采用的规则和技术。数据加密是指将数据集涉及安全和敏感的数据经过加密函数的转换以及密钥的方式将原数据变成无意义数据的过程。数据包括个人数据的正确开放是有效开放的前提。因此要加强个人敏感数据,例如身份证号、财务状况、DNA等方面的保护防止泄露,以免给个人和社会造成危害。在政府利用和开放过程中.对于不涉及个人敏感内容的数据,在符合有关法律和规范的情况下,需要尊重当事人的数据权,建立当事人知情一告知的原则,并采取去识别化的技术,例如采用加密和脱敏的方法加以利用,防止对个人造成侵害。
3)加强数据安全及隐私安全方面的评估。安全和隐私泄露影响评估目前已经是很多西方国家保护安全和隐私的具体方法之一。安全和隐私泄露影响评估是指依据法律和政策的规定,对组织机构所收集、存储、管理、利用、开放的数据是否对数据安全和隐私产生影响所进行的全生命周期、系统的评估过程和结果。数据安全和隐私泄露影响评估是政府部门风险评估的重要组成部分,不仅成为保护数据安全和隐私的重要工具和手段,而且已经成为很多国家政府部门工作中常态化的理念与方式。只有将数据安全和隐私泄露影响评估纳入到数据开放系统的规划、设计、运行中的每一个环节,才能及时的防止数据安全和个人隐私泄露风险的发生。
5.3建立独立、统一和集成的政府数据开放门户网站
所谓独立是指政府数据开放门户网站由独立的组织机构管理,并不依附于其它的政府部门。而統一、集成是指在统一管理、规范和标准下所建立的信息共建、共享、开放的政府数据网群体系。这就需要:1)加强政府数据纵横数据链的开放。从目前我国政府数据开放平台来看,主要是以地方政府为中心的横向数据链的开放,却很少兼顾到纵向政府数据链的开放。只有不断加强政府纵横数据链的开放和流动,才能促进数据的深度开放,为政府的决策和管理提供强有力的支持。2)充分利用社交媒体加强政府数据开放平台的交互能力。虽然部分政府数据开放平台提供了问卷调查、意见反馈、用户评价的窗口,但是缺乏像微信、QQ、RSS实时互动的媒介,影响了用户参与与交流的积极性。3)充分利用语义网技术和移动互联网的技术,提高政府数据开放平台的整合、关联、可视化、分析及移动服务的能力。从我国当前政府数据开放平台开放的数据来看,由于其数据质量、机器可读性、格式等问题,还远远达不到数据关联的要求,更难以实现大范围数据的可视化分析。4)提高政府数据开放平台服务工具的开发。开放数据的用户除了企业之外,很多个体用户并没有先进的技术去分析下载的数据,政府数据开放平台如果能够提供即时的分析软件,将会大幅度提高用户的利用率。例如印度的政府数据开放平台提供了可视化、应用程序和混聚应用工具,为用户直接利用和分析数据提供了极大的便利条件。
5.4政府开放数据服务及利用效果的监管与评估
开放数据网站是连接用户和政府的桥梁,通过加强政府数据开放网站用户利用需求和利用情况的监管,不断提高政府数据创新性利用的效率和用户的满意度是政府开放数据的初衷之一。
1)对用户动态需求的监管。政府数据开放平台的主要价值在于提供基于用户需求的数据内容,促进数据的利用、重复性利用和创新性的利用。而对用户动态需求的监管,不仅有助于提高政府开放数据的质量,而且将会大幅度提高用户的满意度和利用率,促进政府数据的开放向着以用户需求为中心的方向转变。
2)服务失灵的监管。服务失灵是指用户在利用政府数据开放平台过程中存在数据更新慢、数据的质量和机器可读性差以及格式不兼容等问题。作为政府数据开放平台不仅需要关注用户的需求,还要关注用户在利用过程中存在的问题并及时解决才能提高网站的服务质量,有效地实现平台的价值和目标。
3)数据服务与利用效果的评估。政府数据开放平台的重要目标是促进数据的利用。政府除了在平台上提供高质量的数据之外,还需要采取各种方式促进数据的利用并能及时对数据利用效果进行评估和反馈。
目前,整体来讲,我国的大多数政府数据开放网站的服务还处于静态服务的阶段,即只是将数据内容公开在网站上,虽然对网上利用的人次、内容有一定的统计,但远没有达到互动、基于用户需求的服务及利用效果不断优化的阶段。因此,为了促进数据服务和利用效果的评估及反馈,需要将服务工作纳入到政府工作人员绩效评估的考核当中,不仅有助于政府提高对开放数据服务推广的积极性,而且将不断提升和完善政府数据服务与利用的质量和效率。
6结语
自2012年我国第一个政府数据开放平台建立以来,地方政府开放数据平台建设的积极性越来越高,但是开放数据的质量、利用并没有达到理想的效果,这与地方政府对于政府数据开放的认知、价值、目標、定位的认识以及数据治理的效果息息相关。虽然政府数据开放平台的建立是政府数据开放、透明的重要标志,但平台服务内容的建设才是重中之重。很多政府部门采用先搭平台,后补内容的方式,不仅不利于政府数据的有效开放,而且也造成资源浪费,导致平台服务内容缺乏可持续性、利用效果不佳等问题。因此,需要不断提高政府主体对于政府数据开放成熟度的认识,不断加强其内容建设,为平台提供高质量服务打下坚实的基础,才能为用户提供有内涵的服务。