数据源物理集中技术在水利信息化资源整合中的应用
2020-12-09王玉丽
摘要:资源整合是水利信息化工作的重要组成部分,是发挥信息化成果推广应用的突破口,是促进资源共享的有效途径。本文叙述应用数据源物理集中技术开展水利信息化资源整合,较好地解决了信息化数据资源分布零散标准不一问题,初步实现了“一数一源”,解决了数据描述对象及其属性的语义一致性,为信息化资源共享提供了前提基础。
关键词:资源整合;物理集中;归并数据源;维持数据源;对象类
中图分类号:TV22-39 文献标识码:A 文章编号:1007-9416(2020)10-0000-00
0 引言
兵团于2006年开始水利信息化建设工作,经过近10年的建设发展,借助“十二五”期间国家关于继续实施西部大开发、全国对口援疆和第一、二次中央新疆工作座谈会后相关政策的支持,兵团水利信息化推进明显加快,水利信息化基礎设施得到明显改善,水利信息化程度显著提高,水利信息化形成了较为完善的应用体系,但还远没有形成全面服务、有效支撑、共建共享、协同工作的局面。尤其体现在决策人员需要快速获取各分散业务系统数据过程中,往往存在“数据上不来、数据找不到、数据不准确”的问题,严重影响综合会商决策的时效性、科学性和准确性。要破解以上难题,开展水利信息化资源整合共享工作是突破口,也是解决上述问题的最有效途径[1]。
1 信息化资源整合需求
目前兵团水利信息化侧重于面向单一业务应用视角的数据组织方式显然已不能满足水行政管理的需要,不能为水行政管理决策支撑提供充分的信息支撑[2]。主要表现在:
1.1 数据分布零散,数据标准不一
各业务系统数据资源分布零散,缺乏整理,不成体系。而且每个系统的数据库设计、数据格式、数据类型、数据编码等标准不统一,从而导致各个系统数据不能共享与交互。
1.2 数据资源对现有业务的决策支撑能力不足
现有的业务数据资源没有形成面向对象、统一语义、易于关联的有机整体,难以有效利用和深度挖掘,为决策支持提供数据支撑的能力有限。
2 归并数据源物理集中和维持数据源物理集中技术
物理集中是指将数据资源按面向对象模型转换后,统一语义空间集中存储在中心数据库中,整合形成面向对象、统一语义、易于共享、易于关联、易于挖掘的有机数据体系,同时抽取元数据,并生成数据资源目录[3]。整合后原生产库(业务应用系统)维持正常运行,实体数据的共享使用需求由中心数据库承载。根据数据源的更新维护特征,可将物理集中细分为归并数据源物理集中和维持数据源物理集中两类。
2.1 归并数据源物理集中
主要针对数据来源不唯一、缺乏统一更新维护、有广泛共享应用需求的数据资源,即数据存在多个版本并被多单位更新维护,如:水利工程、河湖水系等。由于多源维护导致各版本数据不一致、共享利用困难,因此将数据源进行归并后再共享更为合理,并确定唯一的数据责任单位负责更新维护。
进行归并数据源物理集中整合后,数据源由多源合并为单源,数据的长效更新维护由拟定的唯一数据责任单位完成,从而保证数据的标准性、一致性和现势性。同时,数据共享服务由共享服务库统一提供,原生产库可维持正常运行(利用数据同步提供的接口按需抽取最新数据),也可基于合并后的数据源加以适当升级改造。
2.2 维持数据源物理集中
主要针对数据来源唯一、能伴随业务部门的日常业务工作更新维护、具有共享应用需求的数据资源。进行维持数据源物理集中整合后,数据源维持不变,即数据的长效更新维护仍然由原数据责任单位完成。整合后,数据共享服务由中心数据库统一提供,原生产库维持正常运行,仅需提供接口供共享服务库抽取数据。
3 物理集中技术在资源整合中的应用
在梳理兵团水利信息资源的基础上,利用面向对象的水利数据模型,将涉及水利业务应用的水利对象基础数据,以及水利对象空间及业务关系等数据集中统一存储于基础数据库和应用共享库,整合形成面向水利对象,统一语义,易于共享,易于关联,易于管理的统一数据库,实现“一数一源”,同时抽取元数据,生成数据资源目录。通过数据资源目录,数据交换与共享服务进行数据共享应用,为水利业务应用提供权威、全面、完整和统一的数据服务。
3.1 划分对象类
根据水利部水信息基础平台项目标准《水利对象基础信息数据库表结构与标识符》,对象分为水利对象、涉水对象和IT对象。水利对象是指水事活动中所涉及水利系统事权范围内的实体或概念,例如:河流、水库、水利行业单位和水资源分区等。水利对象划分为自然和非自然两个大类,其中自然类划分为地表和地下两个中类,非自然类划分为设施和非设施两个中类;地表与地下两个大类分别划分为集水单元和输水通道两个小类,设施中类划分为独立设施和组合设施两个小类,非设施中类划分为行为主体和行为客体两个小类;每个小类下划分若干个对象基础类,对象类可根据需要无限制扩充。
考虑兵团的实际需求,本项目选取水利部三大类66个基础类中的52类进行数据建模扩展和数据整合,并根据兵团水行政管理业务需求增加防汛抗旱物资仓库、防汛装备(队伍)、涉水景点、数字标示牌(水功能区、河长制等)等,共设计包括56类对象的中心数据库模型,整合相关数据。
水利对象名录包含47类水利对象和5类涉水对象共计52类基础对象,每类对象分别整合对象名录表,每类对象名录表里需包含对象代码、对象名称、对象建立时间等。
涉水对象是指水事活动中所涉及非水利系统事权范围内的实体或概念,包括行政区划、桥梁、管线、涉水组织机构、主体功能区等。
IT对象是指水利信息化活动中所涉及的硬件、数据、服务、应用、角色、用户及信息载体等实体或概念。
3.2 面向對象的数据模型
在对现有数据资源进行梳理和分析的基础上,采用面向对象的理论方法,以对象的方式组织兵团水利数据资源,系统整理水利业务系统中的各类水利对象,并采取统一口径对水利对象进行定义和命名,从标示和属性两方面描述对象。
建立合理的水利对象模型,是建立基础数据库和共享库的基础,以对象的唯一标示为核心,实现对象的基本属性、业务属性、空间描述、对象间关系及元数据的统一关联,确保“一数一源”。
3.2.1 水利对象与其属性
为减少数据冗余、提高结构灵活性和数据间的易关联能力,将对象划分为标识和属性,其中对象标识仅表达本体的存在性和唯一性,属性则是该本体有可能存在的相关特征信息,如基本属性、业务属性、空间属性,以及标识或属性均有可能存在的时相特征等。
以水库工程为例,按此建模思想,则对象标识仅存储水库唯一编码和曾用编码(即在已有系统中曾经采用过的编码),基本属性可存储水库名称、所属标识对象编码、总库容、正常蓄水位等信息,业务属性可存储设计参数、防洪指标、病险情况等。同时,水库一般还会有自身的空间属性,在大比例尺空间时它可以表达为一个面状要素,在小比例尺空间时它又可以表达为一个点状要素。而且,水库的对象标识、基本属性、业务属性和空间属性均可能存在时相特征,如:水库的消亡、名称发生变更、病险情况发生变化、蓄水水位不同引起的淹没范围变化。其数据模型如图1所示。
根据该模型的特征,标识类对象及其基本属性和空间属性宜于统一集中更新和维护,而业务属性则宜由各业务主管单位分别更新和维护。
3.2.2 对象与对象的关系模型
依赖关系:对象与对象间一般会存在依赖关系,即表达对象间的所属、隶属、附属的关系。这种关系比较强烈,因为如果关系一旦丧失,对象间就无法建立关联,因此,这种关系是一种强关联关系。如:某大坝属于某水库,某水库属于某个或某些行政区划。
相关关系:另外,对象间还可能存在一种相关关系,指的是对象间可以存在这种关系,但不以这种关系的存在而影响自身的存在,因此,这种关系是一种弱关联关系。如水库对象与公文对象的关系,水库对象与档案对象的关系。
空间关系:指有空间属性的对象与其他对象空间属性的关系,如:水库库区有哪些入河排污口。无空间属性的对象有时也可通过相关关系间接建立空间关系,如:“关于某水库除险加固初步设计报告的批复文件”这个公文对象就可以借助相关水库的空间属性挂接在空间要素上。
以上这些关系都是进行数据资源间广泛关联和深度挖掘的基础,应进行有序建设和长时序积累。兵团水利信息化资源整合主要以依赖关系建立关系表,针对相关关系则建立对象类级的关系映射规则表,通过搜索引擎等技术手段实现动态关联;空间关系通过空间分析算法计算而得,不单独建立数据库表存储。
4 结语
在水利信息化资源整合工作中,利用数据源物理集中技术很好地解决了水利信息化数据资源中的数据分布零散标准不一问题,初步实现了水利工程对象“一数一源”,解决了数据描述对象及其属性的语义一致性,为信息化资源共享提供了前提基础。信息化资源整合提升了兵团水利行业在综合业务管理、电子政务及公共服务等领域的信息化应用水平。
参考文献
[1] 王涛.我国水利信息化发展研究综述[J].水利技术监督,2017,25(5):31-33.
[2] 倪建军,汤敏,詹万林,等.水联网与水利信息化理论探讨及应用实践[J].水利信息化,2016(4):32-35.
[3] 蔡阳.关于水利信息化资源整合共享的思考[J].水利信息化,2014(6):1-6.
收稿日期:2020-08-17
作者简介:王玉丽(1980—),女,内蒙古赤峰人,本科,高级工程师,研究方向:地理信息系统与制图。
Application of Data Source Physical Concentration Technology in the Integration of Water Conservancy Information Resources
WANG Yu-li
(Xinjiang Corps Survey and Design Institute (Group) Co., Ltd.,Urumqi Xinjiang 830002)
Abstract: Resource integration is an important part of water conservancy informatization work, a breakthrough in the promotion and application of informatization results, and an effective way to promote resource sharing. This article describes the application of data source physical concentration technology to carry out the integration of water conservancy informatization resources, which better solves the problem of different standards for the distribution of informatization data resources, initially realizes "one number, one source", and solves the problem of data description objects and their attributes. Semantic consistency provides a prerequisite foundation for information resource sharing.
Keywords: resource integration; physical concentration; merge data sources; maintain data sources; object classes