电力用户侧大数据分析与并行负荷预测
2019-10-21谢鹏梁睿张晓丰
谢鹏 梁睿 张晓丰
摘要:近年来随着国家通信网络以及电网建设的发展便利,用户数据也逐渐呈现上升趋势,并且其复杂度越来越高,构成庞大的数据库,目前现有的数据分析模式无法满足当前电力用户侧大数据分析,因此有关部门急需解决目前大数据分析和电力数据处理面临的问题。在本研究中通过进行电力数据分析以及并行负荷相关研究进行深入分析,希望能够对国内电力用户侧大数据分析提供参考经验。
关键字:电力用户;侧大数据;分析;并行负荷;预测
近年来随着我国人口和经济建设的发展,对于国内电力用户大数据来源以及侧数据量,数据种类相关研究表明,在电力数据储存方面存在很大问题,而且在数据处理和可用性方面还面临较多挑战,基于大数据背景下云计算技术支持的数据分析平台实际上是利用多种传感器进行电力用户侧大数据分析,并提出一些有效方法,将这些方法进行优化处理能够为国内电力用户侧大数据分析提供帮助。
1电力用户侧大数据
数据量大。针对目前社会存在的广泛问题是电力用户测大数据分析储存面临极大挑战,由于侧大数据本身容量大,比如对于某地区拥有1万套传感器终端设备进行计算时发现,每套终端每隔5分钟会进行数据采集,每个月将产生较大的数据量,每年形成的数据量将无法计算。近年来随着电网智能化程度的加深,为确保实现数据精细化处理,能够有效控制数据,且数据维度也拓展了几百倍,同时数据产生的影响是比较大的电力负荷因素,采集频率种类显著提升。基于这种情况下电力公司还需要对过往的数据储存能够完成数据复杂分析,以满足当前电力用户实际需求。
数据类型较多。随着科学技术的发展多种传感器的应用性拓广,日常所收集的数据包含结构化和半结构化数据,对于一些非结构化数据需要由电力公司进行收集,而这些数据在传输采集储存时会形成多元化数据,这对于构建用户增大数据是十分重要的。由于这些数据具有多种类型,导致大数据库负荷更加严重,数据处理问题和准确化受到了极大挑战,除存在较多类型的数据之外,数据本身也会快速产生,每秒钟采集的数据是比较多的,每次采集频率提升也会给数据库带来指数变化。从一定程度上来看,科学技术的发展以及数据库数据采集速度的提升会给数据库负荷带来严重压力。比如电力公司会针对智能电表进行数据采集,其采集频率由过去的15秒变为1秒,其数据采集及频率显著提升,所采集的数据逐渐增加,需要对数据完成实时采集,在设计时由于数据类型较多所产生的类型也不断发生变化,这对于数字化来说面临极大挑战。在电力系统应用过程中,电力公司需要对庞大数据进行有效分析,能够对过往产生的海量数据完成及时处理,要求构建大数据平台并实现并行化处理,减轻数据库负荷压力,能够为电力用户获得较为准确和且有价值的数据。
数据交互性。从目前科学技术角度来看,智能电网具有交互性特点,其交互性主要包括与用户交互性,与电力相关行业的数据交互,智能用电交互,这对于数据挖掘分析是十分重要的,可将所收集到的气象、民生数据进行融合,从一定程度上能够使电力符合时间预测。目前可解决大数据平台的数据支持及云计算,该技术在大数据管理中是一种核心技术,同时能够对数据完成并行计算处理,包括分布式文件,并行编程框架等,该技术具有较强功能,具有一定的可靠性,拓展性,已经实现了在电力行业中也针对该技术进行深入研究,目前研究成果主要集中于系统框架设计,这对于系统储存模型设计来說也发生了较大程度的变化。
2电力用户侧大数据的发展分析
大数据整合。从一定程度上来看,大数据整合是电力用户侧大数据发展的主要趋势,近年来随着国内电网广泛应用智能电表,以及传感器、网络、物联网技术的快速发展,导致大数据模式出现较大变化,每个单位数据也存在口径不一的问题,这对于大数据整合加工是十分困难的。针对目前海量数据利用这些数据创造有效模型,完成大数据规范表达,基于模型实现大数据融合,对于国内电力用户特大数据发展是十分重要的,电力用户侧大数据需要具备一定的可用性,由于数据采集方法较多,因此不同通道质量及大小不同对于大数据可用性不仅需要进行接收数据质量处理,同时还需要提升数据管控能力,在实际运行过程中需要将低劣质量的数据删除,并进一步精确分析一些具有价值的数据,能够通过数据分析及时为有关部门提出决策依据。可以说大数据整合是一个数据分析较为完整的过程,能够使信息社会获得更好的发展。
数据储存分析。目前国内已经实现了针对1.5亿用户进行信息采集工作,从一定程度上也使国内电力数据形成大规模体系,在多个省市投资使用电动汽车换电站、充电桩等设备,这些数据储存要求是比较高的,其储存模式时间快速增长对于数据库性能提出较高要求,针对复杂数据传统关系型数据库无法满足精准储存和数据分析要求,因此需要寻找更加完善的数据分析模式,进而能够对这些庞大数据量进行有效储存分析,互联网交互性能够从一定程度上决定用户侧大数据分析过程中的准确性,实时性分析,急需利用大数据工作进一步来支持互联网的推进速度。
可以利用随机森林法利用随机子空间理论进行计算分析,在随机森林中不同分类回归树可以在样本集中表现特异性质差异,如果总样本为s,则不同分类样本为ts,其次随机森林结果为不同分类回归式投票选择结果或平均结果。具体如下所示。
该方法并行化是依据随机子空间这种方式可体现相互独立构建,能够为并行化提供基础。随机子空间是每个节点的属性测试,采用抽签法从样本抽取多种属性测试,从一定程度上可避免数据一次读入过度拟合的问题产生。
小结
总而言之,在本研究中针对电力用户侧大数据数据库进行深入分析,能够针对当前国内电力用户侧大数据实际发展情况进行探讨,通过分析用户侧大数据库特点,进一步说明了基于数据分析平台开展数据实时收集、分析处理、挖掘的重要性。
参考文献
[1]王鸿玺, 李飞, 李翀, et al. 基于大数据分析的混沌神经网络模型在负荷预测中的应用[J]. 贵州电力技术, 2017, 20(8):1-5.
[2]龙鑫. 基于Spark和Holt-Winters模型的短期负荷预测方法[D]. 2017.