APP下载

OLAP分析在企业决策中的应用

2010-08-23

制造业自动化 2010年10期
关键词:数据仓库度量级别

郭 爽

GUO Shuang

(河北邢台学院,邢台 054001)

0 引言

近年来,数据库领域的研究重点和热点之一是联机分析处理技术(Online Analytical Processing,OLAP)[1],1933年,它由关系数据库之父 Codd 博士在发表的《为用户和分析员提供联机分析处理》论文中首先提出。OLAP是数据仓库系统的主要应用,它以数据仓库为平台,以多维分析为基础,针对某个特定主题进行联机数据访问、处理和分析,支持复杂的分析操作,侧重决策支持,并可提供直观易懂的查询结果,使得数据分析人员能够从多角度对数据进行快速、一致、交互的存取,从而获得对数据更深的了解,为企业管理和决策提供一个崭新的分析工具。

1 OLAP分析原理

1.1 OLAP逻辑概念

联机分析处理技术逻辑概念包括以下几方面:

1)维

维是人们观察数据的特定角度,是考虑问题时的一类属性,一组用来唯一标识和区分数据的值的列表,在逻辑模型中,维是层次、级别和属性的父级[2]。描述维的数据内容以维表的形式存放于数据仓库中。

2)层次

对细节程度不同的多个描述方面可以存在于维上,我们称这多个描述方面为维的层次。一个层次可以被用来定义一个数据的汇总。如在时间维中,一个层次可能是一个从日级别到月级别到季度级别再到年级别的数据汇总。一个层次内的每个级别都可以从逻辑上连接到它的上下层级别,低级别的数据值能被汇总到更高一级的级别中。一个维可以有一个或多个层次,如果定义多个层次,须指定一个默认层次。

3)级别

一个级别代表了在层次中的一个位置。在维中,级别被组织成为一个或多个层次,所有级别的成员都存储在同一个维中。例如,一个日期维有一个层次包括日、月、季度、年四个级别。通常我们把一个层次中不同两个级别之间的关系定为父子关系。

4)属性

属性提供维中成员的信息,用来标记交叉表和图的数据显示、选择数据、组织维成员等等,所有的维在创建时都会有长描述属性和短描述属性。

5)度量

度量即事实数据,每个度量都相当于一个特定立方体中的单元格,用以存放数据,并与立方中其它的度量共享特定的属性特征,如使用相同的维,还可与其他的度量进行计算,共同完成数据分析过程。

6)立方

立方是多维数据的逻辑展现。立方的边缘包含维,立方内部包含数据值[3]。立方是度量即事实数据的父级,是将度量和确定的维视为一体的信息对象,在数据装载、汇总、存储和查询的所有过程中被使用和处理。立方中维的顺序会影响到使用性能,设计时立方中的首维应该是变化最快的维,末维应该是变化最慢的维。

1.2 OLAP多维分析

OLAP 的多维分析是指对那些以“维”形式组织起来的数据(多维数据集)采用切片(slice)、切块(dice)、钻取(drill down or roll up)和旋转(pivot)等各种分析动作来剖析数据,从而使用户能够从不同侧面、不同角度观察数据仓库中的数据,从而深入理解多维数据集中的信息[4]。多维分析操作通常包括如下内容:

1)钻取可以改变维的层次、变换分析的粒度,包括向上钻取(roll up)、向下钻取(drill down)、交叉钻取(drill across)和钻透(drill through)等。向上钻取即减少维数,是在某一维上将低层次的细节数据概括到高层次的汇总数据;而向下钻取正好相反,是从汇总数据深入到细节数据进行观察,是维数的增加。

2)切片和切块是在一部分维上选定值以后,度量值在剩余维上的分布。如果剩余维有两个是切片,三个则是切块。

3)旋转是指变换维的方向,即在表格中重新安排维的放置,例如进行行列之间的互换。

2 在系统中优化OLAP实现

OLAP 技术在系统中应用的实现是有章可循的,遵循规范的实现步骤将有利于提高效率。但目前并没有一个完整的步骤可以遵循,本文在查阅大量资料并结合实践经验后总结归纳出来了以下步骤,依照这个步骤就可以快速高效的实现OLAP 技术的应用。步骤如下:

1)根据系统需求建立基本信息立方图。

2)在数据仓库中创建维表、事实表。

3)利用 AWM 工具创建维并进行维的维护。

4)利用 AWM 工具创建立方并进行立方的维护。

5)分别利用AWM度量数据查看器和集成了Oracle BI Beans 的 JDevelper 10g 程序实现多维分析交叉表和图表的展示。

其中AWM是指Oracle Analytic Workspace Manager,Oracle 分析工作区管理器,用于创建、开发和管理 Oracle OLAP 数据仓库中的多维分析工作区。由于前两个步骤是基本步骤,比较简单,下面将以一个电厂机组的评优系统为例来详细介绍后面三个步骤的优化实现过程。

2.1 创建维度

创建和维护维是系统OLAP实现过程中的一个重要内容。本文对电厂机组的评优划分为可靠性、经济性和技术监督指标这三个方面,在分析这三个目标时,主要包括从电厂机组维MACHINE_DIM、机组容量维CAPACITY_DIM、汽轮机制造厂家维TURBINE_DIM、锅炉制造厂家维BOILER_DIM、发电机制造厂家维DYNAMO_DIM、循环水循环方式维CYCLE_DIM、脱硫方式维DESULFUR_DIM这七个维进行分析。

首先,打开AWM,建立到数据仓库的连接,输入数据仓库连接名称evaluation和连接信息LOCALHOST:1521:evaluation,依次展开分析工作空间。分析工作区中的对象包括维、立方和度量等,维的建立过程中分别需要建立级别、层次、属性。

2.1.1 创建维

打开OLAP分析工作空间,右击维进入维创建窗口,创建维PRODUCTS_DIM,维类型选取用户维,然后点击创建完成创建过程。

2.1.2 创建级别

在级别的划分中,考虑到维数据的特点和对维层次结构的影响,本文将电厂机组维的级别划分为电厂所属的发电集团GROUP、电厂PLANT以及电厂拥有的机组NUMBER这三级。级别划分如图1所示。

2.1.3 创建层次

级别创建完成后,再创建层次C A L_ROLLUP,在可用级别中依次选择GROUP、PLANT及NUMBER,点击创建完成创建。

2.1.4 创建映射

创建完成维之后,接下来要进行维的映射,即选择数据仓库中的维表MACHINE,完成维表MACHINE和电厂机组维MACHINE_DIM的对应。

2.1.5 维护维

右击维,选择维护维,在可用目标对象中选取TIMES_DIM添加到目标对象中,点下一步,完成维的维护过程。

图1 维基别划分

创建后的电厂机组维映射图如图2所示。

图2 维映射图

2.2 创建立方

2.2.1 创建立方

打开OLAP分析工作空间,右击立方进入创建立方窗口,在一般信息的名称框中输入EVALUATION_CUBE,在可用维中选取CAPACITY_DIM,TURBINE_DIM,BOILER_DIM,DYNAMO_DIM,CYCLE_DIM,DESULFUR_DIM,其他选项卡均采用默认设置,然后点击创建完成创建过程。

2.2.2 创建度量

打开OLAP分析工作空间,点击立方,打开EVALUATION_CUBE,右击度量,进入创建度量对话框,在一般信息的名称框中输入EVALUATION_MEASURE,然后点击创建完成创建过程。

2.2.3 创建映射

打开OLAP分析工作空间,点击立方,打开EVALUATION_CUBE,右击映射,选择数据仓库中的事实表EVALUATION_FACT,然后完成事实表EVALUATION_FACT和EVALUATION_CUBE的对应。

2.2.4 维护立方

右击立方EVALUATION_CUBE,选择维护立方,在可用目标对象中选取立方添加到目标对象中,点下一步,完成立方的维护过程。

创建后的立方如图3所示。

图3 立方图

2.3 结果展示

在Oracle 10g OLAP分析工作区间建立好维和立方之后,我们就可以通过多种应用开发架构来访问建立的多维数据模型。有两种OLAP结果的展示方式可供选择,一种是采用AWM(Analytic Workspace Manager)度量数据查看器中的交叉表方式,另一种是JDeveloper BI Beans的beans图表方式。我们可以根据不同情况,对以上分析所得到的数据进行不同程度的显示和分析。

3 测试及结果分析

以2006年收集到的电厂机组评优得分为例进行数据分析,采用的是Oracle10 g数据库以及相应的Oracle10 g OLAP分析工具。图4是图3所建立方在Analytic Workspace Manager的度量数据查看器中的交叉表展示。由图可见,机组容量分为120-165MW、200MW、300MW等,对于总分来说,在200MW机组容量下,大唐集团的电厂机组得分远远高于其他集团的,在三个基础得分中,可靠性得分表现为最高,这说明相比其他集团的机组,大唐集团在机组容量为200MW的电厂中,可靠性最好。

图4 OLAP度量查看器中机组各项得分的交叉表展示

图5是与图4相同的立方在BI Beans中以线形图方式展示各个发电集团不同机组容量的可靠性得分。

图6是在BI Beans各大发电集团不同机组的总得分柱状图展示。从图中可以看出,在各机组容量情况下,大唐集团的总得分情况均要高于其他发电集团,其机组各方面性能最好。很明显的,通过beans图表方式,能够更加直观具体的观察数据,更加方便地比较各大发电集团各项得分情况。

图6 总得分柱状图

4 结束语

本文通过对OLAP技术的分析和研究提出了一种优化的分析方法,通过这种方法可以快速高效的对数据进行分析并得出对管理和决策有用的信息。实验验证了这一方法的有效性。

关于OLAP的研究方法,在国外比较普遍,并且广泛应用在企业中。但是在国内还处于起步阶段。随着数据分析技术的发展,OLAP技术在各行业中应用必然是大势所趋,使得OLAP在企业中的应用必将有广阔的前景。

[1]常恩翔,刘洪芳.数据仓库与OLAP技术的应用研究[J].电脑知识与技术.2009,5(11).

[2]何玉洁,张俊超.数据仓库与OLAP实践教程[M].北京:清华大学出版社,2008.

[3]田志强,田苗,李娜,等. OLAP在电站生产过程数据分析中的应用研究[J].自动化技术与应用,2010,29(3).

[4]汤姆森,朱建秋.OLAP解决方案:创建多维信息系统[M].北京:电子工业出版社,2004.

猜你喜欢

数据仓库度量级别
鲍文慧《度量空间之一》
基于数据仓库的数据倾斜解决方案研究
代数群上由模糊(拟)伪度量诱导的拓扑
突出知识本质 关注知识结构提升思维能力
基于数据仓库的住房城乡建设信息系统整合研究
级别分明
迈向UHD HDR的“水晶” 十万元级别的SIM2 CRYSTAL4 UHD
新年导购手册之两万元以下级别好物推荐
你是什么级别的
探析电力系统调度中数据仓库技术的应用