基于大数据分析技术的电力运营数据管理
2018-03-22皮霄林
皮霄林
为进一步提升电力部门的服务水平,加快电力部门的信息化建设,是当前电力部门建设的重点。本文首先对大数据分析进行简单的概述,并就大数据分析的基础技术进行介绍,最后以电力运营中常见的电力负荷预测为例,提出一种电力负荷预测方法,以此通过上述的论述,为当前电力部门的有效运营提供参考。
【关键词】大数据分析 电力运行 数据分析 负荷预测 关联技术
随着智能电网的发展,以及电网设施的改造,基于计算机技术的各类信息管理系统的应用,使得电力企业积累了海量的数据。对此,在这些海量数据面前,如何加强对这些数据的分析,从而通过分析结果为电力部门服务,是当前思考的重点。当前我国电力企业在运营数据方面大致可以分为三类:一类是电网运行和设备监测数据,即电力企业生产数据;一类是电力企业营销数据,如交易电价、售电量、用电客户等方面的数据;最后则是电力企业管理数据,如ERP、一体化平台、协同办公等方面的数据。这些数据中都包含着电力部门日常运营的情况,如果能够及时对这些数据进行挖掘,将给当前的电力部门的服务带来较大的提升,并有利于电力企业的运营管理。而大数据分析作为专门針对海量数据的一种技术,其在电力数据分析中的应用,势必给电网建设和云西红带来有益的参考。对此,本文从大数据分析的基本概念入手,结合其主要的分析工具,就其在数据运营管理中的应用进行了详细的阐述和分析。
1 大数据分析
当前,针对大数据概念的定义中,在行业内部还没有明确的分析和定位。但是很多人认为所谓的大数据是针对传统数据而言的,是采用传统的分析工具不能对数据进行分析和处理的。而从广义的角度来讲,大数据则被认为是一种可以对大量数据进行分析的一种技术体系。目前,针对大数据的应用中,涉及到多个不同的领域,如金融、医疗、能源等领域。在这些领域中,通过对数据的融合、挖掘和分析,进而在海量的数据分析中找到具有价值的信息,以此为企业的运营和发展提供辅助决策依据。而大数据分析在电力部门的应用中,由于其涉及到电力的多个环节,如发电、输电等,但是总结归纳起来,针对电力大数据的应用主要集中在以下三个方面:
(1)为电网企业本身的运营管理提供决策支撑, 该模式通过对各类电力大数据进行融合、分析,挖掘出用户的电力消费特征,提高电力需求预测准确性,从而提升企业的运营效益,此外,该模式通过利用电力大数据为电网企业经营决策提供更具广度和深度的数据支撑,增强企业对发展趋势的前瞻性;
(2)以电力为中心的能源数据综合服务平台,平台的提供方为具有资金、数据优势的电网企业,通过综合分析电力供给、消费和相关技术数据,通过为参与平台的不同类型用户提供大数据分析和信息服务,给出能源管理方案实现节能降低电力消费成本等目的;
(3)为智能型节能新产品的研发提供支撑, 该模式主要通过综合分析能源供应、消费等数据,将电力大数据与信息、制造技术相结合,研发制造新型节能环保产品,为消费者提供低费率、高能效的能源消费和用电方案。
因此,总结和归纳当前大数据技术在电力中的应用,对理顺电力部门大数据应用具有非常重要的作用。
同时在电力大数据中,其具体的应用框架可以用图1来表示。
2 大数据分析主要技术
当前,随着大数据技术在电力数据分析中的应用中,大致可以分为以下几种技术:
2.1 统计分析
统计分析是电力数据分析的一个常见的技术,也是最为基础的技术。通过对数据的基础搜集、整理和分析,可以直观的得到数据的内在规律,并通过计算得出可以反映整体数量特征的统计信息,以此更好的为电力企业的运营提供服务。
2.2 关联分析
数据挖掘最早为人所知实际上就是对某超市的销售数据进行关联分析,因此关联分析在数据挖掘领域中具有不可替代的地位。常用的关联分析算法有A-priori关联算法、基于划分的算法以及FP-growth算法等。近年来又提出了一些改进算法,包括并行关联规则挖掘、模糊关联规则挖掘、基于变化时空的关联规则挖掘、多层或多维的关联规则挖掘、基于聚类的关联规则挖掘等算法。
2.3 聚类分析
聚类是近年来机器学习研究的热点之一,研究者已给出了多种类型的聚类算法,如基于谱分析的划分方法、层次聚类方法、基于密度的聚类方法、基于原型的聚类方法等。适用于不同聚类需求,聚类问题也发展出了多种新模型,如异质聚类、子空间聚类、聚类集成、多路聚类、演化聚类等。面向不同类型的数据形式,聚类分析也有不同的特点,如时序数据聚类、流体数据聚类、图像分割等。
2.4 分类分析分类算法是解决分类问题的方法
分类算法通过对已知类别训练集的分析,从中发现分类规则,以此预测新数据的类别。分类算法包括单一分类算法和集成学习算法,单一的分类方法包括决策树、贝叶斯分类、神经网络、K-近邻、支持向量机等;集成学习算法包括Bagging、Boosting等。其中决策树是一种常用的分类算法,决策树学习是一种以实例为基础的归纳学习算法,它从一组无次序、无规则的实例中推理出以决策树表示的分类规则。贝叶斯分类算法是一类利用概率统计知识进行分类的算法,如朴素贝叶斯算法。神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。
2.5 多核学习
近年来,核学习方法在数据挖掘与机器学习领域得到了广泛的应用,也涌现了多种基于核学习方法思想的不同算法,如支持向量机和KPCA等。核学习方法的主要思想是将低维空间中的数据映射到高维空间,从而在高维空间中进行处理和分析。
3 大数据技术在运营管理中的具体应用
为更加直观的表达大数据技术在电力部门日常运营管理中的应用,本文以电力市场负荷需求预测为例,就上述大数据技术在电力部门的具体应用进行研究。而在电力部门服务的日常运营中,加强对电力需求的预测,从而为后续的电力调度和电网建设提供参考,是当前电力部门提升自身服务水平的一个显著标志。本文首先提出电力负荷预测的框架,然后以广东某电力部门的运营数据作为基础,对其数据进行挖掘分析。
3.1 负荷预测框架搭建
对电力负荷的预测来讲,首先需要构建一个功能强大的数据分析和处理平台,这是实现负荷预测的基础,也是关键。而通过上述的分析看出,海量数据的分析,电力负荷的分布较广,并呈现出典型的地域性的特点。同时,受到多种因素的影响且作用方式不尽相同,负荷类型丰富、发展规律多元。因此,在对电力数据进行挖掘前,需要对不同的电力负荷数据进行分区,分别挖掘各分区内客户用电规律,然后利用适合大数据处理的聚类方法,区分不同的客户负荷类型,将变化规律相似的负荷划归一类,针对类负荷结合分区内经济、城市规划等数据进行影响因子关联性分析;最后在区域用电结构分析的基础上实现各分类负荷预测模型的有效综合,其中区域用电结构分析与预测分区对应,与大区域的经济结构、产业结构等密切关联。具体负荷预测框架如图2所示。
3.2 負荷数据聚类
为方便对数据进行聚类,在本文中引入K均值聚类算法。该算法的原理是对给定数据集合分类,将数据分为K类。然后通过隶属度来表示不同数据的相似程度,并使得目标函数达到最小。
3.4 模型的具体应用
结合上述的模型,以广东某电力公司2012年~2015的营销数据为例,并将该模型与传统的灰色模型法进行比较,从而得到如表1的比较结果。
4 结束语
综上,大数据作为当前电力信息化的一种重要途径,可以帮助电力企业找到最佳的方法,进而极大的提高整体的工作效率。而通过本文给出的示例,可以让电力企业营销和建设部门结合预测的结果进行有针对性的调度和电网扩建,进而保障地区的电力销售。
参考文献
[1]黄庆键,欧周,林佳亮.关于空间电力负荷预测方法综述与展望[J].自动化应用,2017(02):79-81.
[2]陈利芳.面向大数据的电力预测系统应用研究[J].广东科技,2017,26(02):89-90+76.
[3]鲁宗相,黄瀚,单葆国,王耀华,杜松怀,黎静华.高比例可再生能源电力系统结构形态演化及电力预测展望[J].电力系统自动化,2017,41(09):12-18.
[4]李冰洁,陈哲,牛东晓.短期负荷预测中气象因素的大数据分析[J].科技和产业,2015,15(01):94-97.
作者单位
广东电网有限责任公司珠海供电局 广东省珠海市 519000