基于政务数据结构化提升政府网站服务能力
2018-09-01李希帆
李希帆
【摘要】目前,我国信息数据资源80%以上掌握在各级政府部门手里。随着“互联网+政务服务”的深入推进,政府部门之间信息孤岛、数据壁垒问题进一步得到解决,一些地方“最多跑一次”、“不见面审批”、“五全服务”等创新模式不断涌现.政府网站提供的政务服务成为行政审批改革中公众最直接的“获得感”。本文探讨的并非政务服务网提供的“一站式”政务服务,而是政府网站编辑每天从大量的碎片化政务信息中,如何通过结构化数据打造轻量级政务服务.改进用户体验.提升政府网站服务能力。
【关键词】政务数据 政务信息 数据结构化 网站服务
一、政务数据和政务信息的定义、联系和区别
1.定义
我国《政府信息公开条例》第二条规定:“本条例所称政府信息,是指行政机关在履行职责过程中制作或者获取的,以一定形式记录、保存的信息”。政务信息应当同时符合三个条件,一是由政府机关掌握的信息,是指政府机关合法产生、采集和整合的;二是与经济、社会管理和公共服务相关的信息,三是由特定载体所反映的内容。
政务数据是行政主体在依法履行职责过程中制作或者获取的,以一定形式记录、保存的各类数据资源。它不仅与社会公众生产生活密切相关,且能为社会经济发展作出贡献,比如测绘数据、交通数据、气象数据等。
2.联系
政务数据和信息都是政府管理中的“非物质资源”,政府网站是政务数据和信息公开的载体。通过政府网站公开的政务信息和数据需要通过脱敏处理和保密认定。《国务院办公厅关于印发政府网站发展指引的通知》(国办发[2017]47号)中,“网站功能”明确了通过政府网站信息发布的内容与范畴,包含政府重要会议、重要活动、重大决策信息。详细内容为:
(1)概况信息。既经济、社会、历史、地理、人文、行政区划等介绍性信息。
(2)机构职能。机构设置、主要职责和联系方式等信息。
(3)负责人信息。本地区、本部门、本机构的负责人信息,可包括姓名、照片、简历、主管或分管工作等,以及重要讲话文稿。
(4)文件资料。本地区、本部门出台的法规、规章、应主动公开的政府文件以及相关法律法规等。
(5)政务动态。本地区、本部门政务要闻、通知公告、工作动态等需要社会公众广泛知晓的信息,转载上级政府网站、本级政府门户网站发布的重要信息。
(6)信息公开指南、目录和年报。政府信息公开指南和政府信息公开目录,并及时更新。
(7)数据发布。发布人口、自然资源、经济、农业、工业、服务业、财政金融、民生保障等社会关注度高的本地区本行业统计数据。
(8)数据开放。在依法做好安全保障和隐私保护的前提下,以机器可读的数据格式,通过政府网站集中规范向社会开放政府数据集,并持续更新,提供数据接口,方便公众开发新的应用。
以上不难看出,通过政府网站发布的政务信息包含了利用数字、文字、图像、音频、视频等对自然或社会信号(现象、事件等)进行观察或调查所做的记录,得到的诸如空间数据、经济数据等,也包含政府部门在履行行政职能、管理社会公共事务过程中采集和存储的除依法涉密之外的数据集合,如政府信息公开目录。
3.区别
政务数据具有原生性、可获取性、可机读性。而政务信息具有碎片化、非结构化和结构化并存,既包括“原生”数据,也包括经过人为解读和二次加工的并被赋予意义后的数据资源。笔者在这里讨论的重点即是,政务信息蕴含的政务数据既包括结构化,也包括非结构化,那么除数值型外,图片(尤其是照片、地图、规划图等)、音频、视频等非结构化资源也经由特定设备直接采集。可纳入数据范畴:文本资源中,无论短文本(诸如姓名等)或长文本(比如政策条文、政务动态等),基于特定“元数据”标准后也可以实现结构化。
二、政务信息的数据结构化应用
1.树立数据结构化思维
通过政府网站公开的政务信息,呈现碎片化、零散化特质,蕴含的数据结构差异性大。通常让政务信息形成关联的办法是通过栏目的形式或相关阅读的功能实现物理性聚合,而这仅仅为信息发布。政务信息中蕴藏的多源异构的数据就像一个个信息孤岛,散落在各处。在此,我们需要建立元数据结构,通过采集、变更、删除及检索等方式,在元数据的驱动下实现数据的抽取、转换、加载,将信息中的数据集成到统一的数据中心,最终实现统一的对外数据服务。
2.政务信息的数据结构化路径
(1)确保数据源权威、可公开、可更新
政务数据结构化的基石是政务信息。数据源是否权威将影响服务质量和用户的信任度。根据《信息公开条例》里,确定了政府信息公开范围。对于涉及国家秘密的信息,原则上不允许公开,对于部分需要公开的信息,需要进行脱密处理;对于涉及用户隐私的数据,视为内部信息,在不违反国家法律法规的条件下,予以开放或脱敏开放:对于非敏感信息,则可完全开放。同时,应确保数据源可持续更新,避免变成“僵尸”服务。
(2)元数据描述规范准确
元数据是一种结构化的信息,用于对某项信息资源进行描述、解释、定位,使其易于提取和使用。如何从海量数据中发现整理元数据结构成为难题。所以,将政务信息结构化的关键是建立一套规范的元数据结构,并且能够准确描述其数据特征。
(3)多维度分类提供高效检索
通过采集抽取元数据,建立标准数据与元数据映射,并对关键元数据进行筛选,按照不同维度进行划分形成数据目录,数据目录支持按维度浏览查询。
(4)用户体验友好
搭建元数据结构,进行多维度分类的出发点是将用户需求放在首位,帮助用户更加便捷获取数据服务。用户体验是否友好是衡量服务水平的重要评判标准,通过政务信息进行数据结构化改造后的服务必须具备服务精准和使用便捷两大特性。服务精准:需要我们找准用户需求点,分解需求点从而构建元数据结构,进一步形成数据目录。使用便捷:要求我们在维度划分的逻辑关系上保持用户思维,确保用户每一个需求点在数据目录中能有映射。另一方面,服务应根据不同终端的用户需求进行UI界面设计,不管是移动端还是pc端,框架分布应适用于不同操作系统、不同浏览器,并且尽量减少服务层级,功能导向清晰,使用快速簡易。
三、政务数据结构化应用实例
2017年4月,随着“我选湖北”计划的深入实施。湖北17个市州出台了一系列关于大学生就业、创业的具体政策,包括实习实训补贴标准,就业创业扶持政策。这些政策以政府信息形态零散地在政府网站发布,随着时间的推移,渐成为历史资料。有效信息埋没,获取不便……这些问题驱使省政府客户端编辑思考,如何将这些政策汇集成一个在移动端可随时查阅、易用的小程序,而不是作为简单的信息被零星发布。编辑通过仔细梳理省级和17个市州的政策,发现了其中的一些逻辑关联:尽管每个市州政策不完全一致,但都有实习实训、见习、就业、创业这几个固定类别,每一类别又对应着不同人群。实习实训针对在校大学生,就业创业针对应届毕业生和离校未就业人群。
大学生实习实训、就业创业政策内容来源于湖北省人社厅提供的对外公开的文件,编辑就此内容保持和人社厅的联系,确保数据源权威、可公开及可更新。实习实训、见习、就业、创业可继续分解。比如:實习实训优惠政策含有实习补贴、住房保障等项目:见习优惠政策含有就业见习补贴、人身意外伤害保险等项目:就业优惠政策含有就业帮扶、就业补贴、岗前培训等项目;创业优惠政策含有创业资金扶持、创业补贴、创业担保贷款等项目。现在需要思考的是,这些分解后的项目是否可以继续分解,如果能分解,继续往下:如果不能分解,需要建立一套元数据来描述这些项目属性。经过初步梳理确定的三大数据类别,“地域”、“人群”、“项目类别”确定成为元数据字段,再次分解的项目确定成为“具体项目”,描述“具体项目”的详细内容列为“具体政策”,部分项目有前置条件,增加“条件”字段,之前的字段无法穷尽事项列入到“备注”。
“湖北大学生实习实训及就业创业”政策查询蕴含一套元数据结构,根据初步梳理的纵向维度:地域、人群、项目进行划分能最大限度涵盖数据。进一步细分后为了减少应用层级,最后我们把字段内容相近的离校未就业毕业生和应届毕业生合并成为“毕业生”这一大类。这里需要指出的是,该服务应用对象是大学生,了解政策内容的思维模式是:我是何种大学生,想在何地选择何种项目,纵向维度用更通俗易懂的方式表示,即是:我是(人群),我想(项目类别),我选(地域)。
至此,“湖北大学生实习实训及就业创业”政策的数据化结构路径已经明晰,经过湖北省政府客户端编辑对政策材料的进一步精确梳理,之前上万字的政策信息转化为140多条结构化数据。经过技术人员反复体验式打磨,最终在移动端呈现出权威准确、可随时查阅的“湖北大学生实习实训及就业创业政策”应用小程序。(见图3、图4、图5)
此外,运用数据结构化思维,省政府客户端围绕国务院涉企收费大督查工作,通过与省物价局合作,制作了一系列涉企收费应用小程序,增加了搜索功能,为公众快速获取信息提供了新途径。(见图6、图7、图8)