APP下载

基于CIM的电力企业数据集成方法研究

2015-04-29杨帆

农业科技与装备 2015年1期
关键词:数据集成电力企业

杨帆

摘要:针对电力企业数据集成程中存在的数据源异构、分散,无统一标识符,实体关联缺失等问题,提出采用CIM作为电力企业数据集成通用数据模型,给出数据集成平台的设计架构。详细阐述数据集成平台中元数据库的设计模式,论述解决不同数据源中资源实体关联和实体编码映射问题的措施。

关键词:电力企业;数据集成;公共信息模型(CIM);异构数据源

中图分类号:TM743 文献标识码:A 文章编号:1674-1161(2015)01-0037-04

电力企业在日常运营管理中开发了大量的“以问题或专业为导向”的信息系统,这些系统在生产控制以及企业管理方面发挥了重要作用,解决了各业务领域或部门的业务操作问题,提高了生产和管理效率。然而这些系统开发的历史时期、采用的技术方法、出自的软件厂商不尽相同,缺乏统一的IT基础架构规划,因此,这些系统运行在一个高度分布和异构的环境中运行时,系统间的数据交换和集成困难。由于没有统一的接口规范和集成标准,跨系统的业务流程大多无法正常进行,导致电力企业很难对变化的外部需求做出迅捷响应,造成电力企业长期存在“信息孤岛”问题。

韩强等基于国家电网公司SG-ERP技术架构,探讨了符合智能电网多业务数据集成的关键技术。张德刚等提出一个以XML和Web Service为基础的电力企业数据交换和共享平台模型,能够使新开发的ERP系统与遗留系统进行数据交换和共享。张卫苓等结合XML和本体技术,采用中间件技术来解决电力系统的异构数据集成问题。刘宁等采用SOA架构设计信息一体化方案,从数据、应用、流程3方面规划新系统。王家凯等认为电力行业在数据集成方面应用IEC CIM标准已成为必然。这些文献采用多种技术探讨了电力企业数据集成的方法,但在整合历史遗留异构数据源、并以CIM模型为新老系统提供标准数据服务方面的研究还不多见。以CIM模型为基础,研究电力企业的数据集成方法,探讨如何将遗留数据整合成通用的数据服务平台,并给出电力企业数据集成平台的设计架构。

1 电力企业数据源

电力企业中的PMS(生产管理系统)、CIS(客户信息系统)、CRM(客户关系系统)、ERP(企业资源规划系统)、EMS(能量管理系统)、SCADA(数据采集与监视控制系统)等是主要的数据源。电力企业的生产管理模式逐渐由设备管理转向资产管理,企业对集地理信息、电网拓扑、设备台帐于一体的系统需求也逐渐增加。GIS是集电力系统资源的空间属性、电气属性、资产属性和电网拓扑等图数模于一体的信息系统,是当前电力企业生产管理系统的主要呈现模式。由于电力系统资源、资产、量测等都具有空间属性,建设完备且覆盖不同电压等级的GIS系统几乎涉及电力企业的所有业务部门。GIS存储的各种地理要素涵盖了生产、运行、管理等各个方面的实体,是电力企业重要的信息源。这些地理要素包括组成电网的各种电力系统资源(或资产)及用户等,与EMS、ERP、CRM等系统中的数据实体有着不可分割的联系。因此,电力GIS系统是联系地理空间数据、电网拓扑、设备台帐、电网运行实时和非实时数据、客户关系数据的纽带,是电力企业数据集成的关联媒介。

2 电力企业数据集成中的问题

信息技术广泛应用于电力企业的生产、运行、营销、管理等环节。电力企业是信息化程度最高的企业类型之一,运行着各种类型的软件系统。电力企业中存在着多个职能部门,这些职能部门独立完成本部门的业务,并逐渐形成以职能为中心的业务系统。这些系统存储和管理着各种电网结构数据、电力系统资源数据、实时和非实时运行数据等。这些数据存储在多个异构的数据仓库中,形成碎片数据。而且,随着多部门间的业务融合,还可能引入新的数据仓库。数据仓库中存储的数据结构、格式、定义、质量可能完全不同。加之这些数据仓库在物理上的分布相互孤立,造成电力企业中的数据随处可见,但又难以关联集成。另外,数据源的异构性和分散性,导致企业新增业务时无法确定所需数据是否已被完整定义,经常出现重复建设问题。

数据库技术可以在一定程度上解决数据集成的问题,如利用SQL,ODBC,ADO,JDBC等技术实现跨库操作,但前提是数据源采用的存储方式必须是数据库,且存储于不同数据库中的数据实体之间已经建立关联。然而数据源除了采用多种类型的数据库外,还可能以自定义文件格式、XML、电子表格、结构化、非结构化文档等形式存在。

除数据源的异构性给电力企业数据集成带来困难外,数据实体的实际存储也给数据集成造成一定的困难。例如,同一种类型的数据实体存储于不同的数据源中;同一种类型的数据实体在不同的数据源中具有不同的设计模式;同一个数据实体存储于不同的数据源中(重复);同一个数据实体在不同的数据源中具有完全不同的标识符。同时,不同数据源中的实体缺乏相互关联,即逻辑上具有关联关系的实体因各自独立建设而缺少对关联关系的维护与存储。

电力企业业务实现所涉及的工作流可能被划分成多个工作步,并与多个数据仓库相关,即需要访问多个仓库中的数据才能实现业务需求,这对电力企业的数据交换和集成提出了现实要求。例如进行电力企业的实时线路损耗分析时,需要电网结构数据、电网实时运行数据、集抄数据等。然而,这些数据被分散在不同系统的数据仓库中。

如果能够在整个电力企业范围内对已有数据仓库进行规范和整理,对相关数据进行统一的描述并达成一致理解,则不同业务部门或系统就可以对同样的业务问题给出完全相同的答案。然而,电力企业在历史上形成的各种信息系统和数据仓库是企业的重要信息资产,不可能完全推倒重来。解决方法是将遗留的各个异构数据源转换为通用的第三方数据模型,建立模型之间的关联,并采用通用数据交换协议进行数据的传输与集成。同时,新建系统应该遵循公共数据模型,并采用开放的体系架构。

3 数据集成方法

3.1 公共信息模型

电力企业数据集成需要公共的数据模型、统一的数据规范和一致的数据访问方法,以屏蔽多种数据源的异构性。由国际电工委员会(IEC)制定的IEC 61970和IEC 61968标准对电力系统公共信息模型(CIM)进行了详细定义。CIM模型详细地定义了电力系统中的各种实体,并具有很强的可扩展性和可裁剪性,为电力企业提供公共的数据模型。许多电力数据交换试验验证了CIM模型在数据交换和集成方面的有效性。因此,如果能够将不同数据源的私有实体数据模型映射为CIM模型,即可有效解决异构数据源的共享和集成问题,从而为已知和未知应用提供通用数据,大大降低各种应用之间的数据交换接口的开发成本。此处将使用异构数据源数据的各种应用系统称之为数据用户。在实际应用中,电力企业的各种系统可能既是提供数据的数据源,也是其他数据源的潜在数据用户。

3.2 数据集成平台

为实现异构数据源的数据共享与集成,首先在数据用户和数据源之间引入数据集成中间件——数据集成平台,其构成见图1。平台对存储于各个异构数据源的电力系统数据实体进行分析、整理,同时根据CIM模型使各种实体之间建立关联,并以服务接口的方式向整个电力企业的数据用户提供一致的数据服务。数据集成平台中的通用数据访问组件能够对各种应用程序、消息系统、关系型数据库、结构化、半结构化或非结构化数据进行连接访问。通过对数据集成平台中的元数据库中的元数据的分析,对驻留在不同数据源中的电力系统实体进行提取,并根据CIM模型将其转换成结构一致的CIM数据,为上层提供通用的数据访问接口,最大程度地降低数据访问的成本和复杂性。数据集成服务整合获取自不同数据源的数据,借助元数据库建立数据实体之间的关联,构建数据服务所需的CIM对象集。

数据集成平台根据用户的具体数据需求,通过数据服务接口为其提供特定CIM剖面的实例对象集。CIM对象集可以采用XML格式的RDF进行编码,利用RDF编码的CIM对象可以被使用不同平台和技术的数据用户解析。为提高数据交换的效率,数据集成平台也可为特定数据用户提供二进制格式的CIM对象集。数据集成平台将发布的数据服务接口注册于企业服务总线(ESB)上,所有数据用户可通过企业服务总线透明地访问数据服务。

3.3 元数据库设计

为描述各分布式异构数据源,并关联各数据源中的数据实体,需要在数据集成平台中设计元数据库。元数据指描述数据的数据,数据集成平台中的元数据库用于记录各异构数据源的名称、来源、位置、状态、版本等,同时记录各异构数据源中数据实体之间的关联等。在元数据库中设计一个能够记录电力系统实体数据类型信息的模式P,其表达式为:

P={ETi} (1)

式中,ETi为电力系统实体数据类型。表达式为: ET=ename,esrc,eqi,

estate,eversion (2)

每种实体数据类型采用5元组来描述。ename表示实体数据类型的名称,数据集成平台中的通用数据访问组件和数据集成服务借助ename获取实体数据类型的其他元信息。esrc描述了存储数据实体的数据源信息,可以表示网络上某台计算机的名称、数据文件的存储路径、数据库服务器的连接字符串或者仅是数据源的描述描述字符串等,通用数据访问组件及esrc建立远程数据源连接。eqi表示实体数据的查询访问接口,可以是SQL数据检索命令,或者是检索XML结构化文件的XQuery,也可以是访问远程数据的Web服务接口等。estate表示对应数据源对当前实体数据类型提供服务的状态,如正常、暂停、停止等。eversion表示数据实体类型的版本,多个异构数据源可能同时具有一种类型的数据实体,采用eversion表示数据实体类型的版本号;维护良好、能根据电网变化作出实时或准实时更新的数据源,为该属性赋予更高的版本号。通用数据访问组件将优先检索具有更高版本号的数据源,只有高版本号的数据源无法检索到数据实体时,才去查询低版本号的数据源。

为解决同一电力系统资源实体在不同的数据源中具有不同的资源标识符的问题,在数据集成平台的元数据库中设计资源标识符对照表I:

I={ename,bid,rid,esrc} (3)

式(3)中的ename,esrc与式(2)中的含义相同。bid表示某一个电力系统资源实体的基准标识符,该基准标识符可以与实体所在的高版本数据源中的资源标识符相同。rid代表该电力系统资源实体在特定数据源(esrc)中的资源标识符。当数据用户以基准标识符为条件调用数据集成平台的数据服务接口时,平台通过检索对照表I获取电力系统资源实体所在的数据源esrc和对应的标识符rid,然后根据数据服务规则从特定的数据源中检索所需的数据实体,并将该实体转换为CIM数据。

为建立电力系统资源实体之间的关联,在元数据库中设计数据实体关联表R:

R={sen,sbid,ten,tbid} (4)

关联表R记录了资源实体之间的关联。电力系统资源实体之间的关联采用4元组来表示,而对4元组的解析需要根据CIM模型定义,即4元组是被解析成聚合还是简单关联,要根据对应的CIM模型定义。sen与ten表示关联两侧的电力系统实体数据类型的名称,其含义同ename。s*表示关联关系的源头,t*表示关系的目标。sbid与tbid表示具有关联关系的两个电力系统资源实体的基准标识符。当数据用户请求的CIM数据集跨越多个数据源,且其中的实体存在关联时,数据集成平台结合对照表I和关联表R可从多个数据源中提取所需数据。

3.4 数据提供者

让数据集成平台对非结构化的数据源或纯文本文件类型的数据源进行直接访问是困难的。在解析这些数据前,需要明确了解私有文件结构。因此,以非结构化数据文件作为数据仓库的软件提供商,可以根据其私有的文件结构创建数据提供者程序,以标准服务接口(如Web Service)接入数据集成平台,以便这些数据源能通过数据集成平台为数据用户服务。

4 结语

通过分析电力企业信息系统的应用现状,总结电力企业数据源类型及其相互关系。深入探讨电力企业数据集成的必要性和其面临的主要问题:数据源异构、分散,无统一标识符编码规范,难以建立关联。为解决电力企业数据集成问题,提出以CIM作为电力企业通用数据模型建立数据集成平台,将异构数据源映射为以CIM模型进行表达的通用数据,最后通过服务接口为数据用户提供符合CIM剖面规范的数据服务。数据集成平台中元数据库的设计模式,解决了不同数据源中电力系统资源实体关联和实体编码映射问题,是解决电力企业异构数据源集成问题的切实可行方案。

参考文献

[1] 陶佳,朱传柏,唐跃中,等.基于多防线分布容侵技术的电力企业信息集成安全防护体系[J].电网技术,2008,32(20):24-29.

[2] 韩强,黄刚,冯涛,等.智能电网多业务数据集成技术[J].电力信息化,2012,10(12):92-96.

[3] 张德刚,罗学礼,盛俊,等.基于ERP的电力企业数据集成研究[J].计算机科学,2013,40(6A):160-162.

[4] 张卫苓,赵亚伟.异构数据集成在智能电网中的应用研究[J].电源技术,2013,37(7):1239-1240.

[5] 刘宁,祝唯微,卫祥.SOA架构在电力企业信息集成中的应用[J].电力信息化,2013,11(10):109-112.

[6] 王家凯,王继业.基于IEC标准的电力企业公共数据模型的设计与实现[J].中国电力,2011,44(2):87-90.

[7] 邱健,牛琳琳,于海承,等.基于多源数据的在线数据评估技术[J].电网技术,2013,37(9):2658-2663.

[8] 李国庆,潘振波,王丹,等.基于C/S与B/S混合架构的配电地理信息系统[J].电网技术,2009,33(6):102-106.

[9] 谢善益,梁成辉,高新华,等.CIM/CIS互操作细则在多级电网调度中的应用[J].电力系统自动化,2009,33(1):103-107.

[10] 朱伯通,程志海,唐志强,等.基于CIM模型的智能变电站和调度中心互操作研究[J].电力系统保护与控制,2013,41(10):93-97.

Abstract: The heterogeneous of information system constructed in different historical periods by electric power enterprise produces the “information isolated island” phenomenon, which affects the effective use of information resources. This paper starts with analyzing the application status of power enterprise information systems, summarizes the data sources type and their relationships. Meanwhile, the data integration necessity in electric power enterprise is discussed, and the main problems which include the heterogeneous and dispersion of data sources, no unified identifier for power system entities, no entities relationships are analyzed. In order to solve these problems, the data integration platform architecture is designed, which uses CIM as the common data model in electric power enterprise. Through data integration platform, the heterogeneous data sources are mapped to general CIM model, and then the data services are provided by the platform through the well-defined service interfaces. The users can get data form service interface, and the data conform to specified CIM profile. Moreover, the metadata database schema of data integration platform is introduced minutely. Through the metadata database, the problems which contain the relationships of power system resource entities from different data sources, and the unified entities identifier are solved.

Key words: electric power enterprise; data integration; common information model (CIM); heterogeneous data source

猜你喜欢

数据集成电力企业
基于新形势下电力企业人力资源的开发与管理
电力企业物资管理模式探讨
中国电力企业的海外投资热潮
成本与制造数据集成分析
基于Biztalk的异构医疗信息系统数据集成研究
关于电力企业生产管理信息系统的设计与实现应用
信息系统集成与数据集成策略研究
XML数据交换技术在中医智能化诊断数据集成中的应用
高校一表通系统建设探究
基于数据集成的水上项目国家队数据库网络管理平台的设计与开发