交通运输政务信息资源目录编制方法及应用
2018-07-19郭明多
郭明多,魏 彬
(交通运输部科学研究院,北京 100029)
0 引言
政务信息资源产生于各级政府部门履行职责过程中的各个环节[1],这些信息资源是各部门开展相关业务的基础和依据,在各行业管理、科学决策、对外服务等方面发挥着越来越重要的作用。随着信息系统在交通运输各级政务部门中的广泛应用,交通运输行业已经积累了较为丰富的政务信息资源。为切实提高行业信息资源开放共享和开发利用水平,实现以信息资源目录管理交通运输数据资产,使行业信息资源能够“找得着、用得上、管得了”[2],从而有效支撑“四个交通”的建设和发展,交通运输行业的政务信息资源目录编制工作势在必行。基于交通运输行业在政务信息资源目录体系前期相关研究成果,通过本文所阐述的信息资源目录编制方法,交通运输部首次对部级信息资源进行了全面的梳理和汇总,形成了第一版部级政务信息资源目录,为行业信息资源目录体系的搭建、信息资源管理、信息资源共享和开发利用奠定了坚实基础。
1 政务信息资源目录研究现状
1.1 国外研究现状
美国等西方发达国家从20世纪70年代就开始开展政务信息资源的管理政策研究。1994年,美国商务部提出了一种政府公开信息资源的分布式目录管理和利用体系,即政务信息定位服务(Govern⁃ment Information Locator Service,简称GILS),并将其作为政府信息处理标准颁发,各政府机构可以利用GILS标准梳理各自的信息资源,建立自己的政务信息资源目录和信息资源检索系统[3],该项标准在其他国家也得到了广泛应用[4]。1995年,由联机计算机图书馆中心(Online Computer Library Cen⁃ter,简称OCLC)与国家超级计算应用中心(Na⁃tional Center for Supercomputing Applications,简称NCSA)联合发起了都柏林核心元数据(Dublin Core Metadata,简称DCM)[5],其基本方案包括15个核心元素的集合,相关规范都由都柏林核心元数据倡议组织(Dublin Core Metadata Initiative,简称DCMI)管理和维护。都柏林核心元数据具有简单、易理解、易扩展以及能与其他元数据形式进行桥接的优点,成为迄今为止应用最广泛的元数据集[6]。英国、澳大利亚等国家的政务信息资源元数据标准都是基于都柏林元数据标准发展而来的,其中最典型的是英国电子政务元数据标准(e−Gov⁃ernment Metadata Standard,简称 e−GMS),它定义了公共部门使用的管理元数据的结构和规则,包括25个核心元素、几十个限定元素及其编码模式,在都柏林核心元数据标准的基础上添加了一些元数据并进行了精简以满足公共部门的特殊需要[7]。
1.2 国内研究现状
我国相关研究起步较晚,在21世纪初开始理论和实践的探索[8],但随着信息技术的飞速发展和信息资源的爆炸式增长,政府部门越来越重视政务信息资源的开发利用。国家信息中心较早关注政务信息资源目录体系建设,并提出了基于目录体系的政务信息资源整合方法[9]。随后,国务院办公厅于2017年5月印发了《政务信息系统整合共享实施方案》(国办发〔2017〕39号)[10],国家发改委和中央网信办随后在6月联合印发了《政务信息资源目录编制指南(试行)》(发改高技〔2017〕1272号)[11],旨在指导各级政府部门编制信息资源目录,提高我国政务信息资源整合共享水平。国内部分行业及省、市政府部门已经编制了政务信息资源目录,如国家发改委、公安部等部委,上海市的政府数据服务网已累计汇聚了11个重点领域300多类数据[12]。各部委和地方政府在信息资源目录体系上的建设,对我国政务信息资源目录体系建设与理论实践进行了有效探索。
1.3 交通运输行业研究现状
交通运输部从2006年开始开展交通信息资源目录体系前期研究工作,并于2009年发布了《交通信息资源核心元数据》[13]、《公路水路交通信息资源业务分类》[14]、《交通信息资源标识符编码规则》[15]3项行业标准,随后陆续研究制定了涉及交通数据管理、交通管理数据字典、交通基础信息数据元等一系列标准,为行业信息资源的梳理和目录编制奠定了基础。交通运输部海事局、黑龙江省交通运输厅[16]和广西省交通运输厅等省级行业管理部门,已经开展了信息资源目录的编制工作,形成了各自的目录体系和成果,但交通运输行业仍然未能形成覆盖全行业的政务信息资源目录。总体上,行业政务信息资源“家底”不清、共享困难、开发利用不充分等问题依然十分突出。
2 交通运输政务信息资源目录编制方法
2.1 自下而上的信息资源梳理
要摸清行业政务信息资源,首先要开展信息资源调查与梳理。政务信息资源目录的梳理有两种途径可供选择:一是从业务梳理入手,调查业务环节和业务办理流程,梳理各个业务相关的信息,从而摸清部门所产生的政务信息资源;二是从现有政务信息系统入手,对系统情况和数据库中的数据资源进行调查和梳理,形成信息资源清单[17]。
自上而下的梳理方法相对简单便捷,梳理出的信息资源清单整齐规范,但是因实际信息系统和数据资源与业务环节和业务流程并非一一对应,清单实用性差,不能作为指导今后数据资源交换共享的依据。因此,结合交通运输行业信息资源目录相关科研和工作经验,第2种自下而上的途径更容易在行业中开展和落地。
交通运输政务信息资源目录编制工作,从信息系统调查入手,对部内各司局主管的用于提供公众服务、日常办公及支撑业务运转所有信息系统的基本情况、主要设备基本情况、数据资源基本情况(包括数据库名称、数据表名称、数据记录数、数据存储量、数据更新频率)、数据字典情况(字段名称、字段含义、数据类型、长度等)等进行了详细的调查研究和梳理,从而初步摸清了部级政务信息资源的家底,形成了信息资源清单。数据资源基本情况调查表和数据字典调查表如表1和表2所示。
表1 信息系统数据资源基本情况调查表
表2 信息系统数据字典调查表
2.2 自上而下的信息资源分类
为了加强行业政务信息资源有序管理,促进信息资源共享和利用,应形成一套科学的信息资源分类方法和标识符编码规范,以实现信息资源的分类管理、快速检索和精准定位。
依据行业内各部门现有的“三定方案”(定职能、定机构、定编制)和工作职能,采用自上而下、线面结合的分类方法,梳理交通运输政务信息资源分类体系。首先以行业领域及其运输方式作为行业分类的主要依据,然后依照各行业分类下的业务范围作为业务分类的主要依据,并在业务范围内从管理对象、管理业务行为的主题和信息资源的类别3个不同维度定位信息分类。最终形成了9个行业类目、35个业务类目以及11个管理对象类目、10种行为主题类目和3种信息类别类目的分类体系[18],分类结构如图1所示,类目名称如表3所示。
图1 交通运输政务信息资源分类结构
表3 交通运输政务信息资源分类类目
2.3 信息资源编码
基于上述信息资源分类,结合信息资源提供方代码等标识符,形成行业政务信息资源编码规则,给所有信息资源贴上了唯一的“标签”[19]。
交通运输政务信息资源代码由前段码、分隔符和后段码3部分组成。其中,前段码是交通运输行业政府管理机构编码,表现为20位的字符串;分隔符为“/”;后段码包括资源来源系统代码和资源分类代码,表现为17位的字符串。信息资源代码的表示形式如图2所示。
图2 信息资源代码格式
2.4 信息资源元数据
元数据是描述信息资源特征的数据,是关于数据的数据,用于组织、描述、检索、保存和管理信息资源[20]。利用元数据来描述信息资源后,就能够实现快速发现和确认信息资源、为信息资源提供检索点等以及在不同系统之间进行数据交换。给元数据进行赋值,是信息资源编目过程中最重要的环节。
交通运输政务信息资源目录的元数据,结合行业特点,在国家发改委印发的《政务信息资源目录编制指南(试行)》[11]要求的基础上进行了一定的扩展和完善,确定了包含必选项和可选项在内的共计33个核心元数据(如图3所示)。
图3 交通运输政务信息资源目录元数据
其中,为了方便联系数据资源提供方,在国家要求的基础上增加了提供方联系方式;由于现在行业信息资源仍然存在“一数多源”的现象,增加来源系统和来源数据库两个核心元数据,用于对来自不同系统的相同信息资源进行区分;此外,还增加了数据元编号,为今后信息资源目录与行业数据元标准的对标工作提供基础。
3 信息资源目录编制实践
交通运输政务信息资源目录编制主要包含目录编制、目录审核、目录注册和目录发布4个过程。其中,目录编制主要涉及信息资源目录信息化部分编制、信息资源目录业务部分编制以及信息资源目录汇总3个环节。交通运输政务信息资源目录的编制过程如图4所示。
图4 交通运输政务信息资源目录编制过程
3.1 信息化部分编目
依托前期信息资源调研成果,编目人员可通过电子表格的形式直接进行人工编目,或使用目录系统进行在线人工编目。此外,对于可直接访问其业务数据库的信息资源,可通过目录系统从数据库中提取元数据特征信息,从而实现自动编目。信息化部分编目,将完成对信息资源名称、信息资源提供方、信息资源提供方代码、来源系统、来源数据库、信息资源格式、信息项属性、更新周期等核心元数据的赋值,形成信息资源清单。以全国道路运政管理信息系统为例,形成的信息资源清单如表4所示。
表4 信息资源清单示例(部分内容省略)
3.2 业务部分编目
基于信息资源清单,由各被调查机构的业务人员根据业务特点和资源特点,确定信息资源的业务属性,包括对信息资源进行分类,补充信息资源的共享类型、共享条件、共享范围以及信息资源提供共享的方式分类、方式类型等,确定信息资源的开放属性,最后各自形成部门信息资源目录。
3.3 信息资源目录汇总
汇总各部门信息资源目录,由目录系统完成信息资源编码和元数据校验,并将目录注册到目录管理系统中。报部审核通过后,进行信息资源目录的发布,实现部级信息资源目录的在线查询和检索,完成目录编制工作。此版信息资源目录最终共计汇总了11个部内司局和部直属机构反馈的500多个信息资源,包含6 900余个信息项。
以班线线路信息为例,形成的信息资源目录如表5所示[21],在目录系统中查询结果如图5所示。
表5 信息资源目录示例(部分内容省略)
图5 信息资源目录查询结果
4 信息资源目录的作用
通过编制政务信息资源目录,交通运输部第一次摸清了部级政务信息资源的“家底”,初步形成了交通运输政务信息资源的“总账本”,成为行业各级部门了解行业信息资源现状的重要工具。各级交通运输政务部门可在信息化项目立项和建设实施过程中,通过信息资源目录了解现有信息资源情况,充分利用现有信息资源开展信息系统建设,避免数据的重复采集,从源头减少“信息烟囱”和“信息孤岛”的出现,促进信息资源的整合。
部级信息资源目录的编制,为各级交通运输政务部门开展信息资源目录编制工作奠定了良好的基础。各省可参照部级目录,依据目录编制指南开展各自的信息资源目录编制和目录系统建设工作。在信息资源共享方面,信息资源目录为部级信息资源交换共享和开放应用平台建设提供了技术前提和保障。目前交通运输部正在依托信息资源目录,开展共享数据库建设,推进信息资源汇聚。同时,通过信息资源目录,能够有效促进各部门挖掘信息资源共享需求,推动业务协同和业务流程的升级优化。
5 结语
通过本文所阐述的信息资源目录编制方法,交通运输部完成了第1版部级政务信息资源目录编制,目录的应用已经开始初显成效。后续将持续进行信息资源目录的维护和更新,通过目录使用过程中收集的反馈意见,对信息资源分类和元数据不断进行优化。同时,依托信息资源目录推动信息资源汇聚和共享服务上线,真正实现以目录管理交通运输数据资产。