基于大数据技术的电网分配系统设计
2019-07-13徐锐
徐锐
摘 要:利用大数据的理念、技术和方法,结合电力行业的实际情况,实现电网与大数据的结合,使发电、输电、变电、配电、用电等各个环节得到有效的调度。电网大数据是跨多个平台的数据结合,使看似无关电网数据进行融合,以可视化的方式展现,旨在实现电力行业的稳固发展。
关键词:电力行业 大数据 调度 稳固发展
中图分类号:TM727.2 文献标识码:A 文章编号:1674-098X(2019)03(b)-0002-03
2011年底,我国的发电装机已超过10亿kW,成为世界发电装机第一大国。近些年,随着网络科技的发展、国民生活水平提升,发电装机以每年平均1亿kW的速度发展着。这是一个庞大的数据,完成如此庞大的发电,需要耗费大量的自然资源及庞大的人力管理。由于传统发电在能源方面消耗过大,造成的污染不可小觑,节省资源,减少排放对电网发展的压力增大。多数发达国家电力消费占终端能源消费比例约为20%,且呈现逐年上升的趋势[1]。因此,很多国家引入新能源电能,新能源发电具有污染小、可再生优势。但新能源发电渗透到电网中,打破原有电网运行的管理方式,这就需要利用大数据技术的优势实现对电网系统合理的分配。我国电力行业紧跟时代潮流,于2013年发布了《中国电力大数据发展白皮书》,在电网领域引入大数据技术。目前电力系统仍存在能量管理、配电管理以及市场运营等各类信息不能共享[6],引入电力大数据有助于各个环节的协调利用,实现对电网分配[2-5]。
1 电力大数据技术概述
电网大数据具有4V的特点,即Volume(数据量大)、Velocity(处理速度快)、Variety (数据类型多)、Value(价值大)。
(1)电网数据规模大。近些年,电网发电机及负荷节点数量不断增加,由于负荷与电网间存在许多交互因素,产生大量的数据,存储单位已达到PB量级。
(2)电网数据处理高速,这决定着电网最重要的属性。由于负荷波动具有随机性,发电侧需要实时跟踪,以防止出现突发情况。而且电网出现故障也是具有随机性,为保障电网正常运行,需要及时处理电网数据。
(3)电网数据类型多,主要表现为数据来源多样,存储类型多样,各个地区采集周期不一。图1所示为电网数据不同来源,有电网内部,还有电网外部的一些数据。对数据进行存储时,包括结构性数据,同时也含有非结构性数据。而采集的周期视具体情况而定,如广域测量及大型用户数据采集一般为分钟,小型的保护监测系统采集周期仅在毫秒。
(4)电网数据价值大。电网是我国经济发展的支柱型产业,通过收集各个地区发电、输电、变电、用电情况,通过计算機云计算进行处理开发,实现电力分配最优,资源利用最大,营销利润最好,为社会各个领域生产经营带来不可估量的经济价值和社会价值[7]。
2 整体框架设计
本文设计了基于大数据的电网系统分配。分成数据来源、数据存储结构、关联分析处理以及将电力分配反馈到最低层数据来源处几部分。具体可如图2所示。
2.1 数据来源
电网数据的来源具体可如图1所示,由于地区的差异,行业的不同,数据类型传输也是有差异的,包括结构化数据、半结构化数据及非结构化数据,其中主要以非结构化数据为主。
2.2 数据库存储
数据库存储处于数据处理与数据来源中间部分,不仅要把底层传来的数据按类存储,还要及时把获得的数据向上传递,进行处理。
电网的数据来源不仅信息量庞大,类型各不相同,而且根据数据的传递的重要性,需要进行不同的处理。应对的策略包括构建NoSQL数据库[8]、HDFS(Hadoop Distributed File System)分布式文件系统、实时数据库等3种存储方式,从存储结构上初步实现存储数据与应用系统做到信息、能量与业务流的高度融合,并根据信息处理结果进行预测、决策,提高数据的管理能力[9]。
NoSQL数据属于非关系型、分布式数据库存储系统,可达到每秒数万次的读写,完全适应电网大数据的要求。NoSQL数据存储系统有2种架构:Master-Slave结构和P2P环形结构。Master-Slave结构设计简单,易于控制,一般采用水平分区,将Master节点和Slave节点功能分开,由Master节点维护管理的Slave节点。P2P环形结构的系统没有中心节点,自调性好,便于扩展,但是不便于范围查询。由于支持的技术不同,两种结构具有很大的差异。近些年,数据发展趋势是半结构化数据和非结构化数据,且占用的比重越来越高,NoSQL数据库的两种架构通过优势互补,利用分布式系统、集群、分区等技术,满足半结构化数据和非结构化的发展。
HDFS是一个分布式文件系统,它有高容错性特点,可部署在低廉的硬件上。HDFS放宽线程POSIX要求,以流的方式访问文件中的数据,适合应用于超大数据文件(包括结构化数据、半结构化数据及非结构化数据)的应用程序。分布式文件系统如图3所示,从一组服务器中选择一台高性能作为主控制节点NameNode,其他服务器作为从节点DataNode。主控节点和从节点的服务器的目录结构不同,主要由功能决定,NameNode负责管理文件系统的命名空间和元数据,DataNode保存文件系统中的命名、数据块与文件名映射表的位置信息。
2.3 关联分析处理
将数据库系统中的数据分类存储完整,需要通过关联分析的方法、一系列复杂的算法对各类数据进行处理。通过规则算法进行频繁项集表,最后分析关联规则;通过关联规则进行关联分析;通过站点扰动影响对电压、电流、频率站点进行规划。最后将处理好的数据通过云计算技术进行整合,把海量的数据进行详细分类,再以图片、表格、线性表等方式展现到屏幕上。
2.4 电网大数据对电力的分配