湖南省数字公路数据元集编制研究
2013-11-04廖年冬
刘 军 ,廖年冬 ,向 军 ,熊 兵,汤 强
(1.湖南省交通科学研究院;2.长沙理工大学 计算机与通信工程学院)
1 引言
随着科技水平的不断提高,人们日常生活和工作对计算机的依赖程度越来越高。
20世纪90年代末,美国提出了“数字地球”的概念,当前我国正在进行的“数字政府”、“数字城市”无不展示出当今时代是一个信息技术高度集中、迅猛发展的数字时代。
“数字公路”是“数字城市”的一部分,“数字公路”主要指在公路建设、管理中,充分利用GIS(地理信息系统)、GPS(全球定位系统)、RS(遥感系统)、MIS(管理信息系统)、DSS(决策支持系统)等数字化信息处理技术和网络通信技术,对公路设施数据、运行状况等进行采集,将各种数字信息加以整合并充分利用,实现动态监控和辅助决策服务等。
交通信息化建设经过多年的建设,已建立了一批技术含量高、实用的专项业务管理信息系统和OA办公系统,这些系统为行业信息化建设奠定了基础。
当前,“数字公路”正在公路工程的各个环节中发挥巨大的作用。“数字公路”较之传统的公路工程,主要技术特点有:集成化、实时化、动态化、数字化、自动化、智能化。这就要求未来“数字公路”信息化系统建设也必须满足其中的技术要求,实现各信息系统之间的互联互通、为公众提供及时、可靠的交通信息服务。
从2005年起,交通部在江苏、浙江、山东、成都、北京等省推行“省级公路交通信息资源整合工程”,工程对解决信息孤岛、应用孤岛的问题起到了重要的作用。2012年起,湖南省交通厅也开始启动了“公路交通信息资源整合工程”。
系统整合的基础是数据标准化,交通部2008年就出台了交通信息基础数据元规范。但是,在交通资源信息整合各省都有自身的特殊要求,因此,急需根据湖南省的具体情况,依据国家和行业相关规范、标准,制定符合湖南省的数字公路数据元规范,规范湖南省的交通信息化工作。
2 制定数据元标准的必要性
由于当前不同交通部门之间基础数据版本以及数据标准不一致,缺乏统一存储、管理、更新的机制和标准,无法实现共享。
通过制定统一数据元标准,有利于建立各级数据库,实现各业务系统互联互通和信息高度共享,解决信息孤岛问题。
信息化建设是“十二·五”重点工作.现有的交通信息系统普遍孤立存在,相互之间信息访问不方便。另外,随着信息系统建设越来越多,未来整合这些系统的成本也越高,信息化使用效率会逐渐降低。
3 数据元技术简介
数据元是用一组属性描述定义、标识、表示和允许值的一个数据单元。
数据元由以下n部分组成。
(1)对象类:现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且其特性和行为遵循同样的规则而能够加以识别;
(2)特性:对象类的所有个体所共有的某种性质;
(3)表示:值域、数据类型的组合,必要时也包括度量单位或字符集;
(4)限定词:帮助定义和呈递唯一性概念的术语。
4 数据元标准化方案
通过分析国内兄弟省份(山东、浙江等)成功建立公路基础数据元集的实施方法,再参见了T/T697.2《交通信息基础数据元第2部分:公路信息基础数据元》、《数字公路与监控管理系统-数据库说明书》等公路行业标准和我省相关信息系统文档。本文提出一种基于业务和管理结合的数据元标准化方案。
4.1 编制原则
遵照交通部公路基础数据元编制原则,主要包括以下几个方面。
(1)协调一致原则:保持同交通部的基础数据元集一致,再结合湖南省和国内外数据元现状、发展,提出符合湖南省要求的数据元集。
(2)服务应用原则:始终结合湖南省交通信息化实际要求。
(3)坚持规范、统一、易扩展、易查询和易修改原则。
4.2 编码规则与分类方法
(1)编码规则。
数据元是由数据元概念和表示两部分组成。每个数据元包括内部标识符(即该数据元编号)、数据元中文名称、中文全拼、定义、类型、格式、值域、计量单位、备注等属性内容。其编码规则如图1所示。
(2)分类方法。
山东省分类方法和交通运输部保持一致,只是增加了交通量、收费、监控、管理单位等分类,使数据元的应用更加贴近山东省的实际应用。分类编码方法延用部颁标准。
图1 数据元编码规则
浙江省采用面划分方法,将公路数据元划分为:公路基础、公路建设、公路养护、公路管理、公路稽征和道路运输等六个主要分类;每个类别所属子分类采用面、线相结合的分类方法进行分类。
山东和浙江采用的分类方法主要存在以下问题。
(1)浙江省数据元分类较细,但存在重复。
浙江省的数据元分类特点是按照实际业务分类对数据元进行分类,因为公路业务过细,导致重复数据元过多,单独将某个数据元抽出时可能会产生歧义,失去了数据元建立的初衷。
(2)单纯按业务划分,不能够体现管理层次。
按照业务领域进行的数据元分类,方便公路业务人员使用,不便于数据元的管理和按交通部门层次维护。
我们从湖南省公路交通信息化的实际情况和“十二·五”交通信息资源整合项目的需求出发,采用面、线结合方法,首先按照业务类型分为5大类:公路类、道路运输类、交通统计类、建设项目类、收费公路类,每个业务领域下设二级和三级分类。该分类方法具体实施办法如下。
(1)公路类。
交通运输部公路基础信息数据元(综合统计、路线概况、路基、路面、主要构造物、沿线设施、交通量、沿线环境)进行了保留,且根据湖南省实际需求增加了道路养护、监控系统、路况实时信息、气候条件、地籍管理。
(2)道路运输类。
保留了JT/T697.7-2007《交通信息基础数据元 第7部分:道路运输信息基础数据元》,且进行了扩充,增加了长株潭城市群物流资源整合平台数据元集(物流基础、绿色物流、应急物流、服务物流)及邮政运输数据元。
(3)交通统计类。
保留了JT/T697.10-2009《交通信息基础数据元 第10部分:交通统计信息基础数据元》,且进行了扩充,增加了交通事故管理、应急管理、路损数据元集。
(4)建设项目类。
保留了JT/T697.9-2009《交通信息基础数据元 第9部分:建设项目信息基础数据元》,且进行了扩充,增加了我省交通建设项目管理特色数据元集,如建设项目安全数据元。
(5)收费公路类。
保留了JT/T697.13-2009《交通信息基础数据元 第13部分:收费公路信息基础数据元》,且进行了扩充,增加了收费公路基本信息、机电系统、收费公路动态信息。
为了保证每一个基础数据元的来源可追溯,可维护,在数据元分类中,我们增加了按管理层次分类方法。公路建设和管理中信息繁多,每层的管理实体关心的信息粒度级别不同,例如,省交通厅的领导不会关心到某一路段的气象检测器。根据湖南省的公路信息化建设管理现状,按管理层次划分数据元所对应信息见表1,其中表格中的编号会根据数据抽取的来源将编号对应到数据元编号第二项中。
4.3 数据元抽取
提取数据元的方法有多种,如直接提取法、业务流程分析法等。我们按“急用先行”的原则,既保留了交通部公路基础数据元,也融入了我省交通信息化建设成果。具体采取的方法有以下几种。
表1 按管理层次划分部分对应信息
(1)业务流程分析法和直接提取法。
我们对我省数据业务流程进行了分析,利用流程建模获得业务的主导方和相关参与方,并确定业务的实施细则,提取相应的数据元。比方说抽取台座后张法施工工艺相关的数据元,首先查找相关工艺流程图,如图2所示,从图2中提取相应的数据元。
图2 台座后张法施工工艺
(2)用户视图分析法。
我们通过收集用户视图、分解/规范用户视图,抽取数据元三步完成数据元抽取。如从湖南省各种统计报表、申请表、报告单、数据库设计图等数据获取数据元,必需先对其进行规范化,建立标准化的数据格式,才能提取有效的数据元。
具体实例如新增的建设安全数据元主要来源于相应的数据库设计模型图。
(3)从信息系统(含设计文档)提取数据元。
为了抽取适合湖南省特色的数据元,我们先分析了湖南省已有的公路信息化建设项目,部分信息化项目信息见表2。
表2 公路信息化建设项目
具体的数据元抽取方法见图3。
图3 数据元抽取过程
数据元抽取方法具体原则如下。
(1)唯一性原则。
抽取的数据转换成数据元后,必须保证数据元的唯一性,如同样性质的数据可能在两个不同系统中都出现,但是名称不一样,这时,该数据整理成数据元就只有一个。
(2)科学性原则。
由于抽取的数据来源多样化、数据质量参差不齐,这就要求在抽取时尽可能从科学原则出发,消除数据的差异性,保证抽取出来的数据元的正确性。
4.4 统一模型规范
从4.3节可以得知,我们提取的数字公路数据元集来源于多种不同的途径,包括交通部公路基础数据元,湖南省特色信息系统相关数据元和其他行业特色数据元(比方说邮政数据元、气象数据元、GIS数据元等)等。
为了使建立的数据元方便用户查询和使用,我们采用了统一模型规范,保证数据元的规范性和统一性。外围源系统数据统一加载至数据仓库,所有汇总过程由数据仓库完成(该方法见图4)。这样保证从各个不同系统获取的数据元在内容和形式上统一,将来建立的子系统数据(获取相应数据元数据)通过ETL从数据仓库获取。
数据仓库系统架构统一定义为:应用层、基础层、主题层。所有外部来源数据都统一到基础层,基础层包含各个层次所对应的数据元。
主题层主要是提供给其他外围系统平台(含将来建设的信息化系统)所需的数据元信息,包括提供给展现服务器的展现数据、提供跨部门系统的接口数据等。
4.5 数据元管理
数据元管理包括数据元注册、数据元更新、数据元废止过程。
数据元注册流程如图4所示。
(1)数据元更新。
数据元更新流程同注册流程相似。先提交,再评审、专家审核、验证。
(2)数据元废止。
废止数据元内容先提交,并提交废止理由。注册机构根据提交的内容进行初审,并征询专家意见,确保废止数据元理由正确充分。当数据元通过评审后,注册机构实时更新数据元目录,标识数据元状态为“已废止”。如数据元废止理由存在问题,或不够充分,注册机构将退回给提交机构,并给出退回理由。
图4 数据元注册流程图
6 结束语
本文对湖南省数字公路基础数据元的编码方法抽取方法、统一建模和管理机制进行了详细说明。重点结合湖南省交通信息资源整合工程实际需求,从规范数据来源、统一数据元标准和统一规范业务数据模型出发,遵照交通部和我省相关标准,建立符合湖南省数字公路信息化建设要求的基础数据元库和主题数据元库。
数字公路标准数据元还需要不断完善,进一步促进湖南省交通行内数据共享与协作服务和跨省之间业务协同,提高公众信息服务。
[1]张丽宾.数字公路课题的研究[J].市政技术,2003,21(3):178-180.
[2]亓晓贵,闫宝杰,王爱涛等.浅述数字公路的技术组成及特点[J].公路,2001,5:45-48.
[3]蔡英.在省市两级普通公路管理体系中制定并推行公路基础数据元标准[J].工程建设,2012,44(3):71-74.
[4]吴波,李建,伍东.数据元标准化在石油数据中的研究与实现[J].山西电子技术,2006,5:86-89.