元数据在数据仓库中的研究与应用
2020-10-12王亚宁鲁华杰李恒陈黎明
王亚宁 鲁华杰 李恒 陈黎明
摘 要 元数据由于数据仓库技术的发展而变得越来越重要,其不仅能够定义数据仓库的具体作用,还能够实现数据仓库的有效管理。而由于不同的单位大多采用不同的数据仓库管理系统,并未采用统一的平台进行管理,使数据之间的交流和传递变得十分困难,所以应该建立统一的标准对原数据进行管理和描述。CWM是为了将元数据管理策略进行统一而制定的,其能够使元数据和数据仓库在交换工具以及储存库时变得更加方便。本篇文章主要针对元数据在数据仓库中的应用进行了研究。
关键词 元数据;数据仓库;研究分析;元数据储存
前言
随着数据仓库技术的发展,元数据对于数据仓库技术的发展来说十分重要,其已经运用到了仓库技术的整个过程当中,成为数据仓库技术的重要部分。对元数据进行科学的管理,能够提升数据管理的安全性。目前市场上储存元数据的格式都存在着明显的差异,如何通过有效的方式使元数据的集成和理解变得更加容易,已经成为研究的重要问题。本篇文章将针对元数据在数据仓库中的应用情况进行分析,期望为数据仓库信息管理提供有效的意见建议。
1基本概念
1.1 数据仓库
数据仓库技术是指在多变化的信息需求之下,构建的多维度数据储存管理系统,其主要目的是能够更好地对信息数据进行管理,使人们能够将信息数据的应用从较低层次的尾端进行查询,帮助元数据管理提供更好的决策支持[1]。
1.2 元数据
指对数据的信息化描述,例如对信息结构的数据描述。利用元数据可以找到数据仓库中所要查询的具体数据信息,以便于更好地對数据进行管理。对元数据进行有效分类是实现数据仓库科学管理的前提,但目前并没有分类的统一标准,大多是从数据的类型、数据抽象程度、系统的用户、来源、使用目的以及形成时间等几个方面进行分类。目前元数据管理越来越得到重视,元数据管理不仅能够广泛运用,使用户掌握数据仓库中的各类信息,还能够提高生产率,所以元数据的管理十分重要。
2基于CWM的元数据管理
元数据的管理策略主要有搭建元数据交换途径、元数据储存库以及元数据仓库三种管理策略,而为了使元数据的管理维护问题得以解决,需要构建中央元数据储存库,对元数据的生命周期进行统一化的管理[2]。这样才能够促进数据仓库各种工具之间的交换。CWM是集元数据收集、储存和管理一体化的平台,其主要由用户操作层、应用层和储存数据层三层架构组成。中央元数据储存库应该以CWM为统一的标准,再根据管理平台实现元数据的科学化管理。
元数据储存的中央元数据储存库是整个平台架构的核心,所有信息数据的流动都需要经过储存库,其刚开始是CWM各个包的内和关系映射。所有在储存库进行保存的元数据都是通过CWM编码实现的,能够使终端用户对数据仓库的特定主题进行查询,中央元数据储存库可以实现的功能主要包括浏览、查询、更新、添加以及删除等基本功能。
3对于元数据储存库的设计
3.1 CWM元数据的储存仓库
对于元数据管理来说,元数据储存区是必须具备的,因此建立基于CWM的元数据管理平台有着重要的意义。应该将元数据储存结构转变为切实可行的储存结构。数据库作为元数据的储存是一种科学的处理方法。但是由于对象技术和关系数据库所存在的目标应用不相同,所以两者之间存在一定的差别,需要使用关系数据库表结构对对象的CWM原模型进行阐述,而CWM原模型关系模型的映射规则主要包括数据类型映射模式、内映射模式以及关联模式映射三种模式。
3.2 元数据储存库的具体数据库模式
在元数据储存库当中可以构建CWM类与关联的映射表,但是应该充分考虑到每个工具的特定数据需求。其表格类型主要包括数据仓库表、包的信息表、各包中类信息表以及内表、关联表、关联信息表、超类表。
4元数据管理平台工具的实现
4.1 管理元数据工具的具体功能结构
管理工具能够对数据储存库里的元数据进行科学的管理,其主要的工作原理是登录元数据管理工具,此时设备会主动连接元数据储存库里的数据库系统,在与元数据储存库进行连接之后,就能够得到元数据管理所需要具备的类表和关联表,元数据工具主要有元数据查询、操作、更新几种功能。
4.2 对于元数据的查询
元数据的查询条件主要包括类查询和关联查询两种方式,两种查询方式都需要首先选定数据仓库的主题,最后选定每个包或者关联名进行具体信息的查询。查询流程:元数据的查询结果通常以数据表格的形式展现出,包括查询实例的位置属性以及ID等基础信息[3]。
4.3 元数据的具体操作
元数据的具体操作过程包括内实例增加、删除以及关联实力删除等几种功能,但是由于元数据的实例添加或者删除与数据库不一样,所以必须在整个继承链上进行操作过程的实现。
4.4 对于元数据的更新
因为数据的更新主要包括类实例以及关联实例更新两种功能,但是因为CWM的重用继承技术,以及继承链在关系数据上实现比较复杂,所以元数据的更新方法与一般的数据库更新不同[4]。类实例更新:主要是对类实例的具体属性进行更新,具体属性又包括特有属性和超类继承属性,特有属性更新只需要在类相对应的表即可完成整个更新操作,而超类属性更新则需要更新函数,获取超类名之后才能够调用更新函数。
5结束语
综上所述,对元数据进行数据管理库的有效管理,需要建立统一的元数据管理平台,而借助CWM元数据管理策略能够对元数据进行有效的管理,构建元数据仓库管理平台的有效框架,并从中央元数据储存库的开发管理和元数据管理平台核心组件等两个方面有效规划了管理平台的组成,搭建数据仓库中的元数据进行统一储存建模以及管理的全过程平台。虽然本篇文章的元数据管理平台能够实现数据仓库的基本功能,但是仍然存在着一些问题,需要进行进一步的探究和实践工作。
参考文献
[1] 罗小洪.数据仓库元数据管理系统[J].神州,2019(17):233-234.
[2] 姚鹏飞.数据仓库技术在装备试验信息集成中的应用研究[J].信息技术,2019(1):146-150.
[3] 王伟,宁丽.数据仓库技术与信息加工理论镜像关联分析[J].中国教育技术装备,2018,436(10):38-40.
[4] 程芳,张权,董少林.基于数据集成的质量元数据研究[J].标准科学,2019(5):140-142.