虚拟数据仓库在电力行业的应用
2010-06-29夏传鲲刘思青王颖峰
夏传鲲 刘思青 王颖峰
在“SG186”工程体系的框架下,河南省电力公司已经统一建设了省公司数据仓库,但目前使用者的主体对象是省公司的用户,如何此基础上构建地市数据仓库,从体系结构和数据冗余度等方面来看,我们可以有以下三种形式
第一,集中式。在省公司的机房中再建一套地市综合数据库系统,以实现地市的决策分析需要,采用单个物理数据库中存贮用来查询和分析的综合数据,所有业务系统网省层次部署,地市不部署任何系统。采用此方式可以降低数据抽取的网络负担,但数据访问时需要较好的网络支持,但价格昂贵,开发周期长,需要解决数据抽取、实体化视图维护等问题。
第二,分布式数据仓库。各数据成分分散在多个不同的物理数据库中。即在每个地市建立综合数据库,每个站点是一个自治的本地数据仓库,决策在本站点内部完成。省公司的中心站点上设有全局数据仓库,可进行全局决策。这种实现方式包含有大量的数据冗余,对数据的装载和更新等处理极其复杂。
第三,虚拟数据仓库。类似于分布式数据仓库,其在中心站点上存放的不是各地市供电公司的具体数据,而是描述这些数据的指针。终端用户通过指针的方式,利用适当的工具直接在虚拟的数据仓库中获取数据。它不需要对数据进行预先抽取、综合,也没有数据维护等问题,且建造周期短、投资小。
一、虚拟数据仓库的数据理论基础
(一)%l选择
%l选择也称为限制,即从大的数据仓库集合中进行过滤和筛选。
%lF(R) = {t | t∈R∧F(t) = TRUE}
选择关系具体的语句的形式如下:
SELECTR.a1,…,R.an
FROMR
WHERER.name =鹤壁(或者R.code =100000033)
(二)%i投影
%i投影是从大的数据仓库集中的关系R中选择若干属性组成新的关系。记作如下:
%in(R) = {T[A] | t∈R}
其中A为R中的属性列。在我们建设地市鹤壁的虚拟数据仓库中,投影关系主要用于以下场合,即是在省公司数据仓库中有一些地市不用关心的属性,通过投影关系的限定,作为地市的只关注自己范围内的信息和属性,极大地保证了省公司数据的安全性。
二、虚拟数据仓库的体系结构
虚拟数据仓库通常采用三层结构:
(一)展现层
实现如何把数据库系统中的数据和分析结果提供给最终用户。按照用户的分析需求,使用报表、即席查询、多维分析和数据挖掘进行数据展现。展现层是采用IBMCognos8.1作为前端的展现分析工具。虚拟数据仓库透明地支持各种不同需求的终端用户,通过语义层在展现层可以实现整个组织的统一视图。
(二)映射层
1.应用程序接口:采WebService的方式向数据的需求者提供基于XML文件接口,实现虚拟数据仓库的跨应用数据共享。
2.数据库接口:采用数据库物理视图实现数据映射,通过视图可方便地对数据进行重组。另外,将这些数据同业务规则捆绑在一起,可满足机构中某一方面特定应用的查询。
(三)数据层
表示实际的数据来源。它们既可以是各种类型的数据库,也可以是文档、记录、声音、图象数据。它们当中既有实时数据,也有历史数据;既有专门的业务数据,也有局部综合数据;在地市数据仓库的建设中,数据源包括省公司数据仓库系统、地市特有数据应用。
三、虚拟数据仓库的作用
第一,有利于降低地市数据仓库的建设成本,虚拟数据仓库节省了服务器、存储设备和软件平台的投资。
第二,虚拟数据仓库有利于省公司数据仓库的实用化建设。
第三,虚拟数据仓库充分利用了省公司的实体数据仓库资源,建设速度快,缩短了建设周期。
第四,维护方便,虚拟数据仓库通过映射和指针技术,保证了与省公司数据仓库的一致性,加强了数据集中的管理、保证了数据的单一出口和数据的正确性,增强了数据共享的能力,从而获得完整的业务数据视图;
第五,通过跟踪分析这些业务数据信息,管理层可以预定企业盈利、生产、安全等方面的计划,增强企业领导决策能力。
四、虚拟数据库的应用
自从虚拟数据仓库概念提出以来,它已经在金融、保险、军事等部门得到了广泛的应用。通过在河南省电力公司鹤壁地市建设虚拟数据中心,很好地实现了地市的领导辅助决策支持系统,不仅建设周期短,而且建设成本低,维护方便。可见,电力企业领域特别是在“SG186”工程的推动下,在网省两级数据中心已经全面的基础上,实现数据的唯一性与共享性,建立统一的安全体系,保证数据及业务系统的访问安全,完善数据交换体系,实现数据中心间的级联,提升经营决策的管理能力等领域,虚拟数据仓库也有广泛的应用前景。