APP下载

基于大数据挖掘的用电行为分析

2020-06-04董爱迪潘建宏杨爽

无线互联科技 2020年8期
关键词:智能电网大数据

董爱迪 潘建宏 杨爽

摘   要:得益于智能电网的发展,电力大数据的价值与作用逐渐被挖掘。通过对电力大数据的深入挖掘与研究,可促进电网企业管理水平的进一步提升,为我国智能电网的发展提供助力。而依托于大数据挖掘的用户用电行为分析,可实现当前企业电网调控与需求侧的充分融合,为电力系统的稳定性运行提供保障。基于此,文章针对大数据挖掘的用电行为分析进行深入探析,以期为智能电网发展提供帮助。

关键词:智能电网;大数据;电力行为

近年来,大数据技术应用逐渐从金融、商业领域扩展至医疗、能源、交通等多个领域。得益于能源互联网技术的不断创新发展,大数据技术被广泛应用于电力行业。随着数据云平台的构建与完善,大数据技术应用更为广泛成熟,实现了在数据采集、存储的同时,具备数据分析与应用的功能。因此,电力大数据的价值依托于大数据挖掘得到进一步的开发,为电力行業以及智能电网的发展提供重要帮助。

1    电力大数据技术分析

智能电网的发展,促使了大数据技术在电力系统中的应用,构建完善的技术体系,包括:数据采集、数据分类、数据分析、数据存储以及数据应用。不同数据处理步骤的功能与任务不同:(1)数据采集,为基础环节,主要作用为电力数据的采集与收集,是开展数据分析工作的基础与前提。具体运行中,通过实时数据采集、离线数据抽取、文件数据采集等形式进行数据的全面收集。(2)数据分类处理。主要作用体现为数据筛选,甄选出高价值的数据信息,并按照预选设定标准进行数据识别与分类。经分类整理后,重复、多余数据将被剔除,在保障数据价值前提下,使剩余数据更为清晰、规整。(3)数据存储。预先构建电力数据库,用于存储分类整理后的电力数据,依托于数据库应用来管理、存储数据,可实现对以往电力数据存储困难、调取困难问题的有效解决。(4)数据分析与挖掘。电力数据信息依托于数据统计、神经网络、机器学习、模糊算法等方式进行分析与挖掘,将数据信息存在的隐藏价值、潜在联系充分挖掘并分析,直观呈现出数据信息的关联与规律。数据挖掘过程中涉及关联分析、分类分析、特异群组分析、聚类分析、异常分析等。针对数据分析的开展,则是借助高性能计算技术完成对数据信息的计算与处理,常用计算技术包括Hadoop分布式计算、Yonghong Z-Suite等技术。(5)数据应用。现阶段电力数据应用是将挖掘分析结果应用于其他部门,以挖掘分析结果为依据,对行业资源配比做出合理调整,提升资源利用率,并促进电力企业经济效益创造。而要想高效、高质量地完成上述5个阶段的数据处理,需构建完善的数据采集分析平台[1-2]。

2    基于大数据挖掘用电行为分析

2.1  用户分类

以往电力企业针对用电用户分类凭借的依据为用电模式、电压等级,即按照用户电压等级与模式的不同进行用户划分,具体分为工业、商业、农业、居民用电4种。

依据大户数挖掘的用户分类,则是以电力大数据为依据,采取科学数据分析算法来达到用户分类的目的。现阶段常用分类方法为:利用大数据信息制定曲线分析图,结合对模糊算法、逆向分析、最小二乘法、曲线变化因素、聚类算法来科学分类。例如逆向分析法应用,依据用电用户不同类型特点的分析,结合熵权法对用户电力数据进行分析,明确掌握其数据特点和数据权重,最后以数据特点分析结果为基准,找到电力数据中与分析结果相对应的数据信息,实现这部分数据用户的有效分类。相较于传统分类方法,基于大数据挖掘的用户分类更为科学合理,为用户分类提供理论基础的同时也能进一步提升用户分类的精准性。

2.2  用电行为影响因子分析

2.2.1  自我影响因子

自我影响因子是指在具体用电过程中,用户因自身因素使导致用电行为受到影响,此类影响因子具体包括用电事故发生、用电计划改变等。

2.2.2  自然环境影响因子

自然环境影响因子是指自然环境的变化使得用户用电行为受到影响。自然环境影响因子涉及温度、风力、季节、湿度、天气等,在具体用电过程中,上述变化因子的存在使得用户用电行为受到影响。

2.2.3  社会环境影响因子

社会环境影响因子是指发生重大国家事件或者是重要节假日,会影响用户用电行为的因素,具体包括春节、十九大等。社会影响因子具有不确定特点,所以在具体影响因子的分析过程中,需通过手动选择的形式进行数据筛选。

通过对用电行为影响因子的精准、科学分析,并准确筛选出电力数据中不同种类的影响因子,可进一步提升电力数据的代表性,精准体现出用户用电行为的特点,提高用电行为分析的合理性与可靠性,为电网资源合理配置提供依据。

2.3  用户用电行为分析

基于大数据挖掘前提下,用电行为分析主要研究的内容包括:用户用电负荷、用户分类、故障率预测等。

依托于数据采集分析平台开展用电行为分析,将数据信息存储于数据库,依据分析目标选取特定类型的数据进行用电行为分析。具体分析过程中,首先,需对某类用户的整体数据信息进行整体性分析,制作用户用电曲线图,曲线图指标囊括功、电流、电量以及电压等。其次,将整体数据中存在影响因子的数据排除,如将涉及春节、周末等节日的数据全部排除,对剩余数据进行分析与研究。在排除影响因子数据后,以月、季、年分段标准进行剩余数据的划分,分析与比较不同阶段用户数据的具体特征。企业要想进一步提升用电行为分析的全面性,可在实际数据分析过程中合理采用负荷分析法、负荷预算法、聚类算法、回归法等方法来探明数据信息存在的隐藏规律与关联,通过用户模型构建的形式来提高行为分析的全面性与有效性。

作为主要用电行分析方法之一,聚类分析法的应用在当前电力企业数据分析中较为常见,此方法中K-means算法则是聚类问题解决的常用算法。K-means算法应用具有高效、便捷的特点,应用于电力大数据,可进一步提升数据处理的效率性。但是需注意,K-means算法对初值的敏感度较大,初值的差异使得最终计算结果也会有所不同。模糊C均值算法的应用较为广泛,每个样点通过目标函数的优化来获取所有类中心隶属度,依据对样本点类属的精准、科学判断,实现样本数据自动分类。但是实际分析中,因模糊C均值算法只是进行离散数据点集合的处理计算,所以无法做到直接处理特殊类型数据,并对初始值有着较强的依赖性。另外,部分学者提出聚类问题可采取云计算处理方式,在有效解决聚类问题的同时,进一步提升数据处理的速度与效率。但是在具体数据处理过程中,因云计算方式需频繁地读写Hadoop,再加上电力数据庞大,极易在数据处理分析过程中产生性能问题。

猜你喜欢

智能电网大数据
智能电网中光纤通信系统的可靠性分析
智能电网现状与发展分析
大数据环境下基于移动客户端的传统媒体转型思路