我国电力大数据技术应用问题与对策
2020-05-15秦苻珂李晓龙
秦苻珂 李晓龙
(1.北京国研信息工程监理咨询有限公司;2.国网节能服务有限公司,北京 102206)
0 引言
随着我国电力系统智能化、数据化建设的不断深入,电网运行、电力设备监测、电力企业营销及管理等产生的数据量呈指数级增长。在这样的情况下,电网运行、电力企业营销和管理等决策要求越来越高,需要综合考虑各种因素,涉及到的数据集越来越大,对数据的处理速度要求也很高,大数据技术的出现为这种需要提供了技术支撑。通过大数据技术的应用,能够对不同类型、不同型号、不同状态的设备进行故障预测,为电网安全运行提供有力保障;根据运行和管理提炼准确、有价值的数据,为管理效益、决策能力提升提供有效帮助。然而,大数据技术在我国电力行业的应用还处于起步阶段,存在一些问题和不足。
1 电力大数据技术
电力生产以及电网运行是一个非常复杂的过程,包含发电、配电、输电、营销以及管理等环节,这个过程中的各个环节都会产生大量的数据,这些数据的集合就叫做电力大数据。处理这些电力大数据的技术,称为电力大数据技术。电力大数据包含4个主要方面:(体量)Volume、(种类)Variety、(价值)Value和(速度)Velocity。
(1)(体量)Volume。体量指从任何不同来源获得的大量数据,包括移动设备、发电设备、配电设备、变电设备、社交网络等。在电力行业,随着智能计量装置的广泛部署,配电自动化、用电信息采集等系统的广泛应用,每时每刻都在创建大量的数据。这些数据的体量非常大,也非常复杂,不能按照传统的数据处理方式存储和分析,为企业获取有价值的知识带来了许多挑战。
(2)(种类)Variety。多样性指的是通过传感器、智能手机或社交网络收集不同类型的数据,如视频、图像、文本、音频、日志等。电力大数据具有高度的多样性,包括结构化数据、半结构化数据和非结构化数据。这些数据的组合将使大数据应用变得异常复杂。
(3)(价值)Value。价值是任何基于大数据应用的最重要特性。如果能源大数据没有被挖掘,以支持业务决策或客户服务等,那么它没有任何意义和价值。对于电网和发电企业来讲,通过大数据分析,能够更好地了解不同消费者的能源消费模式,从而采取相应措施,以节约能源,提高电网运行效率。
(4)(速度)Velocity。速度主要是指电力大数据采集、处理和分析的速度。采集和处理需要惊人的速度,电力能源数据的实时处理就是以“秒”为目标。
2 电力大数据分析处理流程
大数据的价值体现在通过对大数据进行智能处理,进而从其中获取有用信息。这个过程的实现,就是对数据进行分析和挖掘。电力大数据分析处理流程为电力大数据采集、电力大数据存储、数据清洗、数据挖掘、电力大数据应用展示,见图1。
图1 电力大数据分析处理流程
(1)电力大数据采集。电力大数据从来源上可以分为运行数据、企业管理数据和营销数据三大类型。其中,运行数据包括生产管理数据、运行调度数据以及各种设备和输配电网运行过程中监测到的数据;企业管理数据包括电网规划、财务、气象环境、地理信息以及电力知识等数据;营销数据主要有来自用电采集系统、营销业务系统等数据库系统产生的数据。
(2)电力大数据存储。大数据应用的一个主要特点是实时性或者近实时性。数据通常以每年50%快速增长,尤其是非结构化数据。随着科技的进步,有越来越多的传感器采集数据、移动设备数据、社交多媒体数据等。因此,大数据需要高性能、高吞吐率、大容量的基础设备存储。
(3)数据清洗。采集到的电力大数据往往是不完整、有噪声和不一致的。数据质量问题会使基于这些数据的分析和研究毫无意义甚至还会产生灾难性后果。作为提高数据质量的一种重要技术,数据清洗是解决数据质量问题的处理过程,其目的是保证数据质量,提供准确数据。数据清洗包括结构化数据清洗和非结构化数据清洗,能够提高数据分析的准确率和分析效率,可以避免对后期数据处理以及分析造成不良影响,提高大数据分析的正确性、完整性、一致性和可靠性。
(4)数据挖掘。数据挖掘是电力大数据应用的关键技术,具有知识推理功能,能够在建立知识数据库基础上,将信息数据转化为有用知识,达到数据分析目的。通过融合人工智能、机器学习和云计算等技术,目前数据挖掘已发展成为大数据分析的主要手段。
(5)电力大数据应用展示。通过大数据分析产生的知识信息会通过报表、界面以及接口形式展现出来。
3 应用现状及存在问题
目前,大数据技术在我国电力行业的应用还处于起步阶段,存在一些问题和不足。大数据的价值在于数据融合与数据挖掘。国家电网大部分省公司已经实现各系统的数据集成以及共享,电网公司之间,如国网与南网、电网与发电企业之间的数据共享还有待实现。同时,电力企业各个系统之间,以及不同企业的系统之间没有采用统一的数据标准,使数据共享和融合难以实现。
(1)电力行业知识系统建设不完善。绝大多数相关领域研究人员认为,要很好地完成数据清洗过程,一定要结合特定应用领域的知识。数据挖掘同样需要结合应用领域的知识。知识是一种有组织的经验、价值观、相关信息及洞察力的动态组合,它所构成的框架可以不断地评价和吸收新的经验和信息。信息系统研究人员顺应了知识管理的发展趋势,在信息系统的基础上开发了知识管理系统,以支持知识的创造、转移和应用。在大数据分析过程中,必须借助于知识系统,同时,大数据分析产生的新知识也会存入知识系统(见图2)。知识系统越完善,大数据分析的准确性越高。知识系统的建设,除了平台建设,更重要的是知识数据的搜集、分类、整理和完善,是一项工作量巨大的系统工程。目前,电力行业知识系统的研究和应用并不充分。没有电力知识系统支撑,电力大数据技术平台得到的信息不够可信,不足以成为决策的依据。
图2 电力大数据分析和知识系统关系
(2)系统之间和企业之间数据共享不充分。电力行业信息系统包括生产管理系统(PMS)、调度管理系统(OMS)、调度自动化系统(SCADA)、用电信息采集系统等很多各自独立的信息系统。各个信息系统开发时间不同,使用的操作系统、系统模型、数据格式等各异,其数据是分布的、异构的,不同系统之间的数据资源难以相互访问,形成信息孤岛,数据信息很难共享。除了技术上的原因,现有管理体制也是造成跨部门、跨单位数据共享的最大障碍。数据共享不充分的直接结果会导致大数据分析系统的实施难度大大增加,影响大数据分析的效果。
4 相关建议
(1)建设电力行业知识系统。为了建设更高效、准确率更高的大数据分析系统,需要建设和完善电力行业知识管理系统。电力行业需要建设统一的知识系统,为我国电力行业大数据战略提供有力基础保障。可以由电力行业协会或者大型电力公司牵头实施。
(2)建设电力数据共享中心。信息共享描述了各种组织、人员和技术之间的数据交换。大数据解决方案涉及数据从简单的行到复杂的图,但是所有这些数据的出处最好是以统一的方式记录和储存,以便统一查询。电力大数据分析需要以信息共享为基础。数据集成是将现有分布、异构以及各自独立的多个业务系统分散的业务数据通过应用间的数据交换有机地集合起来,屏蔽这些数据之间的差异,形成数据共享中心。电力大数据分析系统建设,需要构建发电企业、设备供应商、气象部门、电网、电力调度机构、供电系统、电力市场、配电网、服务提供商及用户的数据集成体系,以利于电力大数据分析的平台建设的方便性及大数据分析的准确性(见图3)。建设数据共享中心除了克服技术障碍,还要解放思想,打破体制壁垒。只有打破体制壁垒,才能建设不同级别的企业级、地区级、省级电力数据共享中心;只有数据得到充分共享,才能更加高效地进行宏观电力大数据分析,促进电力行业高质量发展。
图3 电力大数据分析与数据共享中心
(3)统一电力行业数据标准。电力数据共享中心的建设需要统一的电力行业数据标准。目前,电力行业虽然具有一些数据标准,如IEC61970标准、IEC61968标准,但整个电力行业并没有统一遵循。电力行业各种应用系统多为不同时期分别建设或由不同专业机构负责建设的,缺少总体设计和统一规范,也缺少统一的信息化标准体系,内部信息系统的信息编码没有统一尺度,直接影响了企业上下级以及企业之间的信息共享交流。因此,急需统一电力行业数据标准,以利于实现电力数据共享中心的建设与大数据分析的开展。
5 结语
通过大数据技术应用,能够保障电网安全运行,提升管理效益、决策能力,优化电网运行方式、降低管理成本。电力大数据分析的关键就是通过数据挖掘,提取出有价值的数据。而数据清洗和数据挖掘都离不开电力行业知识库的支持。电力大数据采集则离不开电力数据共享中心。电力数据共享中心的建设需要统一的电力行业数据标准。因此,为了建设更高效、准确率更高的大数据分析系统,更好地应用电力大数据技术,需要建设和完善电力行业知识管理系统,建设电力数据共享中心,统一电力行业数据标准。