地区电力调度数据中心应用探讨
2020-03-05王新瑞毛俊杰
王新瑞,毛俊杰
(国网山西省电力公司晋城供电公司,山西晋城 048000)
0 引言
随着地区电力系统规模的不断壮大,电力运行过程中产生了反映设备状态的海量数据,传统的人工统计分析数据模式存在着数据版本混乱、中间环节多、人为因素影响大、分析效率和准确率低、多人在线协作与数据同步处理性差等问题,已不能满足电力调控运行精益化管理的要求。再加上目前电力系统中运行着多个独立的应用系统,各应用系统功能侧重点不同,系统之间数据交互、共享性差,统计查询性能差,数据价值利用率低;已有应用系统对地、县调度运行管理人员的应用需求支持不足,也不能满足专业主题需求。针对现状,本项目运用数据仓库技术[1],建立地区电网调度数据中心,实现地区电力调度数据标准化管理与存储;整合业务需求,运用计算机程序实现各类数据综合性、多维度统计查询,提取反映电力调度控制、运行维护的关键特征值,实现海量数据有效利用,使电力管控由定性经验型向定量科学型转变。
1 地区电力调度数据中心的体系架构
地区电力调度数据中心的体系主要由数据处理层、业务逻辑层及数据展示层组成,具体架构如图1所示。
1.1 数据处理层
为保证数据的完整性、准确性,按照“立足应用、标准设计、分层维护、全局共享”原则,开展地区电力基础数据的采集、治理工作,构建地区电力调度数据仓库[2]。电力运行涉及的数据主要分为反映设备属性的静态数据,反映设备运行状态的实时数据(如电压、电流等),以及与电力有关的外部数据(如地理、环境、气象等数据)。
1.1.1 数据采集
静态数据:以调度管辖范围划分,从生产管理系统、调度管理系统中采集与调度运行业务相关的静态数据。
实时数据:数据平台运用Flume等辅助类工具定时采集位于安全三区的数据采集与监视控制系统SCADA(supervisory control and data acquisition)镜像库中的各类运行数据。
外部数据:人工采集与电力运行有关的环境信息、气象信息、规划信息和社会经济发展信息等,提高数据的完整性。
图1 地区电力调度数据中心的体系架构图
1.1.2 数据治理与存储
数据平台运用ETL工具对采集的各类数据进行分类、整理、清洗、对接,开展数据治理,整合成满足各类主题需求的元数据。建立分布式数据库系统,运用分布式文件系统实现数据的分布式存储,实现数据网络化共享、存储与管理。
统一设计数据的事实表与维度表,建立雪花型数据模型,构建满足第三范式的多维关系型数据库,存储与管理各类型结构化元数据。设计分布式的、面向列的开源型HBase数据库,解决电力运行工作中必须的文本类及音频、视频等非文本类非结构数据存储问题。
数据仓库的建立,实现了地调、县调电力数据同质化存储管理。同时,可按照使用者的主题需求,划分出数据子集,形成数据集市,向业务逻辑层提供细粒度、广维度的统计分析数据,减少业务逻辑层的数据处理量。
1.2 业务逻辑层
业务逻辑层按照使用者的主题需求,从数据仓库和数据集市中提取所需数据,实现对电力数据的统计、分析、应用功能。其主要包括业务逻辑单元、业务应用单元等。
1.2.1 业务逻辑单元
运用计算机程序将电力运行专业领域知识与技术规则、技术人员的经验和常识转换为机器语言,同时分析现有各专业数据报表需求及业务指标,梳理整合业务逻辑规范,设计报表格式,运用计算机程序实现满足公司各业务部门统计需求的关键业务指标算法。
1.2.2 业务应用单元
通过对电力运行主要业务的梳理和整合,针对特定主题,应用系统利用数据挖掘工具对数据进行聚类分析、特征化及偏差分析等[3]。目前该系统可实现的主要业务有电力基础资料管理和电力数据统计分析。地区电力调度数据中心的主题应用如图2所示。
图2 地区电力调度数据中心的主题应用
电力基础资料管理功能:用户可运用辅助类工具、分布式搜索引擎(Elastic Search)等调取分布式数据库中存储的各类基础数据,对所需要的基础类资料进行下载、查看。
电力数据统计分析功能:系统运用数据仓库工具Hive、Spark等分布式运算工具调用SparkMLib、Python等算法组件包,实现对数据的统计、分析,主要包括负荷与电量、电力规模、线路故障统计分析等主题应用。
负荷与电量主题:可实现从年、月、日等细节全面统计地区历年负荷与电量,查询地区负荷与电量同比、环比增长率详细数据,观测地区负荷与电量的变化趋势。
电力规模主题:可实现多维度统计和呈现地区电力系统规模,主要包括变电规模、输电规模、发电规模。同时,该模块可实现负荷普查及详查的全过程管控,辨识不良数据,形成用于负荷建模需求的普查和详查数据,可服务于电网规划、营销等各专业数据需要。
线路故障统计分析主题:该模块建立线路故障分析的数学模型与电网的拓扑结构。从数据仓库提取线路基础数据,同时结合线路跳闸构成的动态数据,利用概率论与数理统计的原理对基础数据和动态数据进行精确统计和分析。从线路故障率、停电时长、重合成功率、高掉闸等方面进行分析、比对,提取反映线路运行维护的关键特征值,根据分析结果找出影响配电线路供电可靠性的主要因素,形成数据分析报告[4],服务于地区高跳闸线路治理工作,解决电网精益化管控中缺少数据支撑的问题,提高设备维护的针对性,提高维护资金的利用效率。
1.3 数据展示层
地区电力调度数据中心提供了可视化平台,可通过地理信息图、柱状图、饼状图、折线图、断面图等多种形式对各类数据进行图形化展示,将业务型数据转换为管理型数据以获得有用信息,实现人机交互。用户可以按需组合索取信息,根据需要定制报表,多角度对数据进行观察和处理,实现了数据的有效应用。
2 地区电力调度数据中心的技术架构
地区电力调度数据中心的技术架构如图3所示。为满足应用系统的稳定性、安全性和可维护性需求,对应用系统的软、硬件分别进行选型。
选择面向对象程序设计OOP(object oriented programming)和模型-视图-控制器MVC(modelview-controller)模式相结合的开发策略进行软件开发,系统采用B/S(browser/server)软件架构,采用免费开源支撑体系和成熟的前后端框架构建,以提高软件的灵活性和可扩展性。
服务器操作系统采用免费、安全、低维护、稳定的Linux环境。网络服务采用开放源代码的网页服务器软件Apache。
结构式数据库系统采用MySQL的分支MariaDB。数据库管理应用程序采用基于网页的MySQL数据库管理应用程序phpMyAdmin。其中,为保障数据库的高可用性,采用2台服务器构建数据库服务器集群,互为备用。
程序语言采用开源通用可嵌入超文本标记语言中使用的计算机脚本语言PHP7。该语言易于学习,允许用户修改、编译、扩展使用。
图3 地区电力调度数据中心的技术架构
软件前端开发使用jQuery、Bootstrap框架实现,使系统界面友好,人机交互响应快捷方便,后台管理系统使用ThinkPHP实现,其包含底层架构、数据库访问层、角色认证、表单处理等常用的组件,支持Linux服务器环境,并支持MySQL数据库以及PDO扩展,其快速、兼容的特性满足系统应用需求。
硬件方面,为防止服务器故障,设置备份服务器系统,当服务器软件系统故障,由备份服务器接管业务应用,并将故障服务器脱离网络,维持系统的正常运行。
3 结束语
目前,基于数据仓库技术创建的地区电力调度数据中心,作为数据交换和共享中心,有效连接了各相关业务系统,对已有数据资源进行了充分利用,是对现有应用支持系统功能的补充。下一步将继续开发电网风险预测与防范、负荷预测等数据挖掘模型,运用深度学习、迁移学习等人工智能方法与数据挖掘技术深层次挖掘数据价值,助力地区电网管控人员精准掌握电网运行规律,实现对电网运行状态的全局优化控制,提高电网的安全稳定性。