APP下载

电力调度数据仓库建模研究

2010-07-23李树静于光波

山东电力高等专科学校学报 2010年1期
关键词:数据仓库调度建模

李树静 于光波

1.山东电力高等专科学校 济南 250002;2.济南供电公司 济南 250012

0 引言

经过二十多年的发展,电力企业信息化进入了一个新的阶段,由于信息化建设初期缺乏必要的企业信息资源规划和信息化建设规划,电力企业信息化建设暴露出了一些问题,其中主要是:电力信息系统孤岛林立、集成度差;海量信息未得到充分处理。电力系统信息化的不足产生的根本原因是企业信息化初期各个部门各自为政,开发自己需要的信息系统。这些信息系统往往有不同的开发商不同的时期开发出来,所使用的信息技术和编码标准都是很大不同。电力信息化的发展,信息集成和数据综合利用成为电力企业的需求,怎样一方面能够满足企业的应用需要,另一方面又充分利用现有信息系统,保护以往信息化投资成为一个重要的研究课题。

为了解决当前的问题,很多信息化方案被提出,例如软总线技术[1],XML/CIM的数据抽取技术[2]等,但是这些点对点信息集成方式虽然能够解决一些信息系统数据互传递和互操作的问题,但是大量点对点的信息系统连接结构会导致信息系统的蛛网模型,并且由于没有全局数据的形成,不能有效的支持数据的高级应用。数据仓库技术作为一种新兴的海量数据处理工具,可以将电力系统数据清洗,整理转储到其中,并且数据仓库将原本在其它信息系统数据的存储模式进行改变,使之适合电力系统决策的应用[3,4]。

针对数据仓库系统建设的中的主要问题,本文根据电力企业数据仓库项目建设规划咨询的实际经验,总结出电力系统数据仓库建设的一套标准化方法。首先分析了数据仓库系统实施的特点,强调了信息资源规划在数据仓库建设中的重要作用,并总结出电力企业信息的特点和基本方法。本文根据电力调度的实际需求完成了关键决策主题的维度模型的建立,提出了信息系统建设的规划,对充分利用数据仓库系统指明了方向。

1 数据仓库项目实施概述

整个数据仓库实施的生命周期过程[5]如图1所示,图中阐明了在有效地设计、开发和部署数据仓库时所必须的一系列高级任务。该图显示了整个项目的实施路经,图中每一个方框都可以看成数据仓库项目建设过程中的指示标记。数据仓库项目实施主要有四步,以下我们对这些步骤进行简要的概述。

1.1 项目规划阶段

项目评估主要关注的是数据仓库项目的定义和范围,其中包括项目准备评估和业务合理性评估。由于建立电力系统数据仓库已经得到了众多电力企业的认可,项目规划阶段的主要工作就是对项目实施的人力物力的准备以及合理项目实施的安排。最终集成的项目计划中会确定与业务维生命周期相关的所有任务,并且确定项目的参与人员及各自的责任。项目规划可以看作是数据仓库项目管理的基础。

1.2 信息资源规划和需求分析阶段

电力生产的规模巨大,产生的数据无论在种类和数据产生量和频率是其它行业无法达到的。而且由于数据仓库的数据不是由使用者录入的,而是对多个操作型信息系统集成得来,在实施数据仓库项目的第一阶段就是对生产数据和经过操作型信息系统处理过的生产数据进行整体清理和规划。首先必须对现有生产数据的种类、存储格式、数据量进行清理,其次为了统一数据格式,便于数据仓库的数据集成以及维护和扩展,对数据命名、编码、格式进行统一规划。

需求分析是对数据仓库的应用目标进行统计和分析。业务需求会几乎影响到整个数据仓库实施过程中全部步骤。数据仓库的建设提倡以业务需求为驱动,需求分析位于数据仓库实施中的中心环节。如图2所示。

信息资源规划和需求分析是两个不同目的的工作,但是由于两者都要对整体信息资源和业务流程进行分析,并且都有相似的实现手段,所以我们将两者放在一个阶段完成。需求分析和系统信息资源规划是数据仓库项目重要的一个环节,这一阶段的工作可以对数据仓库的规模,技术要求和高级应用有了大体上的把握。根据经验,信息资源规划和需求分析和项目实施之间的时间一般应该达到7:3的关系,就是信息资源规划应该占到整个项目大部分时间。此外由于电力信息化进入到了集成的阶段,为了指导信息集成的实现,好的信息资源规划可以起到事半功倍的效果。

1.3 数据仓库实施阶段

数据仓库实施阶段有三条主线,分别是:技术轨迹、数据轨迹和应用轨迹,技术轨迹主要实现数据仓库系统技术结构设计、产品选择与安装;数据轨迹主要的主要任务是根据需求分析和信息整理的结果进行维度建模,物理设计和数据登台的设计与开发,数据轨迹的设计是电力调度决策应用实现的重要一环,本文将以此为重点,对数据仓库的维度建模进行深入的研究;最后是应用轨迹的设计,应用轨迹要在数据仓库平台基础上的利用各种客户端工具提供用户服务,其中主要包括综合查询工具,报告写作工具,决策分析工具。其中决策分析应该是数据仓库系统的主要应用,数据挖掘和OLAP是最主要的分析方法。

图1 数据仓库项目实施步骤图

图2 需求分析和其它步骤的关系

1.4 数据仓库维护与增长阶段

数据仓库系统不是一个静止的系统,在系统部署成功投入使用后,企业的业务系统,企业应用型信息系统都是在不断变化,这就要求数据仓库具有易于扩展的体系结构和更好的兼容性。

表1 电力调度部门职能划分表

2 电力调度的信息资源规划

由于调度部门只是生产部门中的一个部门,所以自己独立成为一个职能域。电力调度的职能划分如下表1:

通过对调度部门的交流调研,总结出调度部门的需求决策分析的主题主要有:

1)电力负荷预测主题。电力负荷预测是电网建设和生产检修计划的重要依据,高质量的负荷预测能够保障电力稳定有序的发展,是重要的一项决策工作。负荷预测主要是通过分析负荷值同电力用户、天气、经济法发展之间的关系。

2)电能质量主题。电能质量包括电压质量和电力谐波两个方面。电能质量对于用户的使用和设备安全都有重要的影响,电能质量出现情况,调度人员必须采取一定的措施控制。

3)网损主题。网损是电力企业经济性效益的重要影响因素,降低网损是降低供电成本的主要途径。对网损相关的问题进行综合分析有利于选择降低网损的方案。

4)故障停电主题。通过故障分析,可以发现某个地区电网故障出现的特点,哪种故障出现频率最高,哪条线路容易出现故障,何种故障。通过故障主题的挖掘,可以为调度部门采取针对性的措施,优化电网的运行方式。

3 总线结构的电力调度数据仓库维度建模

3.1 数据仓库的维度建模

3.1.1 维度模型

数据仓库所涉及的数据量比传统事务处理大得多,随着时间的推移,数据量会达到几百GB甚至TB的级别。因此数据仓库仍需要使用关系数据库来管理数据。但是用户在使用数据仓库时的访问方式与传统的关系数据库有很大的不同。对于数据仓库的访问往往不是简单的表和记录的查询,而是基于用户业务的多维分析。基于星型连接的维度模型成为连接数据仓库联机分析处理(OLAP)和关系数据库的桥梁,为最终用户做决策分析工作提供了最易于理解的呈现方式和最优越的查询能力。

维度建模是一种逻辑设计技术,该技术采用直观的标准框架结构来表现数据。每个维度模型都有具有复合键的事实表和一系列维度表组成,每个维度表通过一个主键精确对应着事实表复合键的某个组成部分。事实表是由指标实体及指标的度量属性所构成,这些度量作为所有维的交集,描述了一个特定的事实。事实表中的事实是数值型可加数据,对用户为只读数据。数据存在于事实表中的详细等级称为 “粒度”。维度表中的成员通常为描述性的文本信息,可以更新。维度表和事实表之间的外键联系用以支持复杂的查询和下拉式分析,也就是说,维度可以看作用来组织事实的种类,是数据仓库查询的约束。在维度模型中,每一个维度都是对等的,所有的维度都可以被看作是对称相等的事实表入口点。用户通过维度模型可以实现对事实表的任意n路连接。

3.1.2 数据仓库总线结构

成功建立一个高性能的、可扩展的数据仓库平台,关键是首先要建立一个可扩展的系统结构。业界通常存在两种数据仓库结构实施方案观点,即所谓的“自顶向下”和“自底向上”的方法。“自顶向下”的实施方式意味着先建立一个覆盖所有业务流程的企业级数据仓库,然后再根据不同的主题建立聚集数据集市。这种实施方案代价高昂、投资周期太长,难以接受。而“自底向上”的观点则认为可先按部门独立设计数据集市,然后再把这些数据集市装配成一个企业级的数据仓库。这种方案在实施数据集市的时候各自独立设计,数据模型迥异,将这些数据集市结合无异于形成新的非集成的信息孤岛。

我们采取的解决方案是将二者结合起来:首先,规划企业级数据仓库的数据模型;接着,在这种数据模型的基础上,采用分步方法来实施各个独立的数据集市。这里规划的企业级数据模型用来保证数据集市的可扩展性和可兼容性,从而最终形成一个企业级的数据仓库。我们的建模目标是产生一整套一致性维度,并且标准化所有事实度的定义,这些事实度与维度的集合便称之为数据仓库总线结构。一致性维度是指与之可能连接的每一个事实表中意义相同的维度;一致性事实定义是在确定一致性维度的同时完成的,用来保证某个事实在不同的数据集市中具有兼容的指标单位。

3.2 数据仓库的物理建模

数据仓库的物理建模就是维度模型在关系数据库中以关系表的形式实现。

1)为每个事实表和维度表确立数据源;

2)规范数据表的名称,建立数据元素标准——数据元素命名标准、编码标准和一致性标准;

3)确定各列的数据类型;

4)分别为事实表和维度表创建索引;

5)确定表的物理存储结构、存储策略和存储分配优化;

6)确立数据仓库的规模,即确定数据容量。

3.3 建模实例

电力调度负责对电网的实时监控,负责电网运行方式设定,故障的紧急处理,电力调度在电力企业生产经营的安全性、经济性上有着重要的作用。根据笔者的调研,我们选出电力调度部门中主要的关注四个决策主题作为分析,它们是:负荷预测主题、网损分析主题、故障停电分析主题、电能质量分析主题。下面按照总线式数据仓库建设方法进行四个主题的维度建模。

3.3.1 调度数据仓库中的一致性维度和一致性事实

根据各主题的分析,其中在各个主题分析中都涉及到的通用的维度表主要有,时间表,地理表,供电单位表,设备表,负荷表。

1)时间表。所有的事实都是具有时间特性的,所以建立维度模型时一般应该建立时间表。由于电力系统的速度特定,时间维表中的信息项。

2)地理表。地理信息也是电力系统的公共属性,地理信息对于分析电网的故障多发区域,网损分布等主题都有重要的作用。

3)供电单位维。供电单位维表主要记录供电企业的一些属性,例如:供电企业的规模,供电企业负责人等等。

4)电力设备维。电力设备是组成电力系统元件,所有的问题分析都离不开电力设备的分析。电力设备的型号、状态、服役年限都是电力设备维的属性。

5)负荷维。负荷是电力系统的组成部分,从电气角度负荷是电网的一个环节,负荷属性关系到电网的稳定,电能的特点;从服务角度,负荷是供电的服务对象,负荷的发展变化促进电力系统的发展。

调度一致性事实的建立主要包括基本的电气数据,根据分析主要有负荷,电压,电流。对于负荷的单位根据调度部门的级别可惜分别设定不同的单位等级千瓦、兆瓦;电流可以为安培;电压单位可以为伏特、千伏。

3.3.2 数据集市的维度建模

1)负荷预测主题维度建模。负荷预测分为长期负荷预测和短期负荷预测,长期负荷预测是电力规划和建设的依据,短期负荷预测是调度部门安排调度的参考。两种负荷预测的关注点不同,需要建出短期负荷预测维度模型和长期负荷预测主题维度模型。我们首先建立负荷预测的类关系图3:

图3 负荷预测相关的类关系图

对于短期负荷预测,除了一致性维度中的地理键、时间键、供电单位维之外,还有以下几个维度:

(1)负荷维。对于短期负荷预测,负荷维中主要考虑负荷的短期变化特性,例如说日周期特性,负荷峰值特性等。

(2)气候维。居民用电是重要的电力负荷组成部分,气候是居民用电量的重要影响因素。气候维中可以分析天气的阴晴、温度等作为分析因素。

(3)日类型。日类型主要考虑是不是节假日,所以只有一个属性日类型,其中可以选择节假日或是一般工作日。

长期负荷预测除了一致性维度之外,主要考虑经济发展和节能技术的应用。可以形成维度:

(4)负荷维。负荷是一致性维度之一,长期负荷预测中主要考虑负荷的行业特性。此外周期特性和峰值也是负荷预测的考虑因素。

图4 中长期负荷预测主题的维度模型

(5)经济发展维。经济发展维主要是负荷所于经济体发展情况,主要有经济总量和发展速度两个属性。由于经济发展本身是连续的数值,为了成为描述性的维度,可以采用一定等级离散化。

(6)节能技术维。节能技术的发展可以影响负荷值,其中主要考虑技术的发展和应用水平。同样也应该进行属性离散化的步骤。

图5 短期负荷预测的维度模型

负荷预测维度模型事实表中主要的事实数据项是实际负荷值和预测负荷值。

通过上面的维度建模,数据按照主题形式组成,可以很方便的分析负荷同天气,同经济发展的关系,分析出不同行业的经济发展对电力负荷产生的不同影响,还可以看出节能技术的应用对于负荷的影响。

2)故障停电主题维度建模。电力调度的中心任务就是监控电力系统运行,避免非计划性停电,为了实现这个目的,对历史的故障数据分析,可以让我们更好的避免故障性停电的发生。停电故障数据集市中主要是包含和电网故障的数据,根据分析目标的不同可以建立出多个维度模型,比如说停电事故维度模型、设备故障分析维度模型(例如说变压气故障分析),电网故障分析维度模型等。故障停电相关主要有电力设备类,线路类,故障抢修类等,其类关系图如下图6:

其中主要的维表是:

图6 电力故障相关的类关系示意图

通过分析类关系图可以转化为维度模型如下图7:

图7 事故停电主题维度模型

(1)电力线路类。电力线路是电网的最主要组成部分,线路的型号、质量、可靠性、使用年限是影响线路故障的原因。

(2)一次设备类。一次设备和电力线路类似,主要考虑一次设备的型号、质量、可靠性、使用年限。

(3)二次设备类。二次设备是专门用来保护电网,防止出现电网故障的设备,正常状况下,二次设备不参与电网的运行,但是其误动也是造成故障停电的原因。

(4)检修维。电力检修工作可以发现电力设备的缺陷,将故障停电处理于未然,其中主要考虑检修的周期,检修操作等。

(5)故障维。故障维是对故障发生后的一些评估判定。其中主要包括停电事故的等级认定,事故类型分析以及事故原因分析。其中事故类型主要是指造成停电的直接电气原因,而事故原因主要是指发生的诱发因素,比如说三项短路就是指电气事故而认为误操作则是诱发短路的因素,是事故原因。

(6)抢修维。抢修维主要是在停电事故发生后抢修工作属性,主要是指停电事故发生后调度部门采取的补救性调度方案和修试部门的工作情况。

事故停电分析主题中的事实项主要包括:

(7)停电开始/结束时间事实。事故停电分析中单位设定为分钟。

(8)停电影响居民数,根据调度范围可以选择不同等级单位,一般为万人。

(9)停电损失数据。停电事故损失一般以万元计。

(10)人员伤亡统计。单位为:人次。

通过停电分析主题维度模型的建立,我们可以分析停电事故多发区域、运行多发时间、可以分析出哪一种故障造成的停电事故的最主要原因,各种故障发生后经济损失之间的差别,可以统计出针对某种故障采取何种处理措施最为适合。

3)电能质量分析主题维度建模。伴随着经济发展,更多种类的电气设备成为电力负荷,一方面它们对电网运行产生了很大的影响,另一方面也对电能质量的要求。电能质量主要有两个方面——电压值和电力谐波。

电压主要由于线路上的电压降造成的,和其相关的主要类是线路负荷,电力无功以及无功补偿设备;谐波主要是负载中的电力电子设备造成的,谐波问题主要相关的类有负荷类,谐波抑止设备特性和投切情况等。电能质量主题的类关系图如下图8:

图8 电能质量相关的类关系示意图

对于电压质量问题,主要是分析负荷,无功分布以及无功补偿措施对于电压的影响,可以建立维度模型如图9所示。

除了常规的一致性维度之外,其中主要维表有:

①线路维。输电线路的电气特征对于网损有直接影响,其中主要考虑线路的单位电阻,线路长度等属性。

②负荷维。在对电压质量分析中,负荷维度主要考虑采集负荷功率因数和接入位置等属性。

③无功补偿设备维。大量的无功传输是产生电压损耗的重要原因,现阶段电力系统的中的无功补偿设备可以降低电压降落。为了以此作为分析入口,其中主要关注无功补偿设备的自身性能特点,电力系统接入位置以及设备投切对于电压降的影响。

图9 电压质量主题的维度模型

电压质量维度表中主要考虑的事实项有:

①负荷值。负荷维属于维表之一,但是负荷值的内容属于不断产生的数值信息,所以应该成为负荷表的一项。

②实际电压值。实际电压值单位为千伏,是事实表最重要一项。

③电压损耗。数据仓库建模重要的特点就是通过空间换取检索速度,电压损耗本来可以通过实际电压值和额定电压之间计算得到,但是电压损耗有较高的使用频律,为了保证较快的处理速度,在事实表中建立电压损耗数据项。

电能质量中谐波质量是近些年逐渐被人们重视的问题,其中主要相关的类是负荷类,电力电子设备类。维度模型如图10所示为:

图10 电力谐波质量主题维度模型

主要的维度有:

①负荷维。负荷维是作为一致性维度之一,在谐波主题中主要分析需要负荷的谐波特性,负荷值等级,此外负荷接入电网位置对于电力谐波有很大的影响。

②线路维。线路维主要考虑线路的接线方式。

③谐波抑止设备维。谐波抑止设备主要是一些电力电子设备,表中主要有设备型号,位置等属性。

主要的事实表属性是谐波事实,主要有三次谐波量和五次谐波量。

通过这样的维度模型,可以某一个可以产生谐波的负荷对电网产生的影响,可以分析最佳的谐波抑止设备使用策略。

4)网损主题维度建模。网损是评估电网运行重要指标,对于网损的分析是供电公司运行方式的重要工作。通过网损主题维度模型,可以完成对对不同线路之间的网损进行对比分析,对各种无功补偿措施进行评估,对各个供电单位的供电效率进行比较,分析不同时刻网损率的特性等分析工作。

4 结论

针对电力企业数据仓库的维度建模,本文以较详尽的篇幅给出了电力企业数据仓库数据建模的方法。该方法包括数据建模的需求分析、维度建模和物理建模三个部分。根据电力调度的实际需求完成关键决策主题的维度模型的建立。基于合理建模技术的数据仓库为电力企业的信息系统提供了良好的数据环境,在此基础上运用联机分析处理及数据挖掘等技术,可以为电力企业的决策和管理提供信息支持。

[1]严亚勤,吴文传,张伯明等.支持组件接口规范的能量管理系统软总线的初步研究与实现[J].电网技术,2004,28(20):11~16.

[2]李艳涛,栗然,苗祎岑.继电保护数据仓库的研究与设计[J].继电器,2004,32(11):49~51.

[3]张文英,束洪春,张叶.数据仓库技术在昆明电网电量分析中的应用[J].电网技术,2005,29(14):40~44.

[4]李秋丹,迟忠先,金妮等.基于数据仓库的地区电网调度决策支持系统[J],电力系统自动化,2004,28(12):86~90.

[5]R.Kimball,M.Ross.The Data Warehouse Toolkit:the Complete Guide to Dimensional Modeling [M].Addison Wesley,2002.

猜你喜欢

数据仓库调度建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
一种基于负载均衡的Kubernetes调度改进算法
虚拟机实时迁移调度算法
基于数据仓库的住房城乡建设信息系统整合研究
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践