APP下载

基于信息融合的电力营销数据多元回归分析系统研究

2022-05-11杨峰刘胜强吴丽贤

微型电脑应用 2022年4期
关键词:精准度聚类模块

杨峰, 刘胜强, 吴丽贤

(广东电网有限责任公司佛山供电局, 广东, 佛山 528000)

0 引言

由于电力营销数据来源种类很多,多是通过实时采集和调度中心收集而来,所以数据是以非线性方式描述的,在描述过程中会涉及数以千计的状态变量,如何处理电力营销数据已经成为了亟待解决的问题[1-2]。信息融合是将多种来源的资讯或资料组合、整合以形成统一结构的技术。最初,信息融合在军事领域得到了广泛的应用,分析并整合诸如传感器、信号、信息以及人工产生的各种信息,以获取隐藏的军事情报[3]。今天,人们对信息融合的理解不仅仅来自传感器,还来自因特网、数据库、软件等。随着人们认知领域的扩大,信息融合的概念也不断扩大,通过计算机和软件的支持,实现了多数据源的融合,扩大了人们的认知范围,提高了人们的分析和决策能力,提高了问题解决效率。相关学者进行了研究,取得了一定的进展。陆慧等[4]提出基于数据挖掘的电力营销数据分析系统,通过挖掘电力营销数据,分析电力企业营销对象情况,同时优化电力营销数据分析系统的架构,此方法能够有效提升数据分析准确性,但是数据分析时间过长、分析效率不佳。王奇等[5]提出基于数据融合的电网运行全景可视化分析系统,通过算术平均值去除电网数据误差,并通过一致性检验分析电网数据的数据序列,构建关联性模型实现电网运行全景可视化分析,能够全方位地实现电网运行分析,但是此方法分析过程比较复杂,分析用时较长。陈泗贞等[6]提出基于COMTRADE模型的电力系统多源故障数据融合分析方法,构建于COMTRADE模型,采用集对分析方法有效整合可靠数据信息,利用BF算法进行电力数据融合,此方法有效提升了数据分析时间,但是分析的准确性不佳。王萍等[7]提出基于云计算的电力大数据分析系统,通过云计算方法分析电力企业业务能力,给出对应的电力营销管理策略,有效解决电力,实现数据融合,但是此方法的营销分析结果准确性低。

针对以上问题,本文基于信息融合技术,应用多元回归分析理念,针对电力营销数据设计一种新的多元回归分析系统,将不同条件下的数据融合到一起,通过多元回归分析实现数据的整合处理。

1 电力营销数据多元回归分析系统整体架构设计

本文设计的基于信息融合的电力营销数据多元回归分析系统整体架构包括平台层、核心功能层、系统逻辑层和应用层构成。系统整体架构结构如图1所示。

图1 电力营销数据多元回归分析系统整体架构图

该平台以 MongoDB数据库为主库,支持本体模型的持久化存储;以关系型数据库为补充,实现了从原始科学研究信息到科学研究本体的过渡存储。MongoDB用于与系统上层模块交换数据,负责与关系数据库的数据交换工作,支持将源数据转化为融合数据的过程。基于云的架构在平台层上,使系统的可扩展性更强[8-10]。

核心功能层包括系统所需的核心算法,如信息提取、聚类、分类、实体识别、重复名称消除、网络特征值计算等。在数据预处理过程中,主要采用信息提取和实体识别算法对数据进行有用信息提取[11-12]。聚类分类算法和重复名称消除歧义算法是数据融合的一部分,主要用于消除歧义。在信息挖掘过程中主要应用了网络特征值的计算[13]。

从系统整体上看,其操作流程为数据采集、数据预处理、本体构建、信息融合、数据分析、可视化。

2 基于信息融合的电力营销数据多元回归分析系统硬件设计

在完成电力营销数据多元回归分析系统整体架构设计后,设计系统硬件。系统硬件有信息管理模块、数据管理模块、报警模块和电力营销数据管理模块。系统硬件结构如图2所示。

在系统硬件结构中,信息管理模块是公共模块,能够管理数据信息,实现用户管理,增强继电保护装置的自主保护性能,取得较高的电路安全性。信息管理模块通过调节电力系统内部的安全信息,将数据信息全部录入转化空间中并构建电路数据传输通道,配置数据监管装置,时刻掌控此时的数据状态,并获取精准程度较高的初始继电保护装置数据,提高操作的成功率,提升其电路安全性。

图2 系统硬件结构图

信息管理模块主要负责管理电力营销数据用户信息、角色信息、片区管理、数据配置等。

数据管理模块实现了对电力营销数据的管理,主要内容:合同管理、租约管理、电费管理、基站管理、电表管理。

预警模块主要负责预警各类信息,所有的预警信息在生成后都会以短信的形式传给负责人,达到及时提醒的目的。

电力营销数据管理模块是系统的核心模块,负责预估、监控、分析、统计电量。

电量估算:根据各机房设备的实际情况,从理论上估算能耗。针对电力频繁变化或受气候影响的设备,采用灵活的电力估算公式及相关系数,保证电力估算的智能化。

功率监测:在动态环境监测系统中,通过对装有功率采集模块的设备进行实时的功率采集来实现功率监测。

用电分析:分析用电消耗、实际用电量和理论用电量,以检查设备老化、用户偷电和其他情况,并为今后节能和减排提供决策依据。分析用电量以实现节能减排,通过科学合理地分析用电量,可以调查业主偷电行为和设备故障导致用电量过大的原因,从而实现节能减排。

用电统计:对收集到的电量进行统计,包括日用电统计、月用电统计、年用电统计、随时用电统计等。

3 基于信息融合的电力营销数据多元回归分析

3.1 电力营销信息融合

对电力营销数据进行信息融合,通过引入回归分析方法对系统进行优化。首先,分析电力营销信息融合过程,具体融合过程如图3所示。

图3 电力营销信息融合过程

分析图3可知,采集电力营销信息,通过数据关联对原始电力营销信息进行分析,并根据电力营销信息的不同类别进行融合,获得新的电力营销数据。在此基础给出电力营销数据功能模型如图4所示。

根据图4可知,通过传感器对电力营销数据进行校准,提取相关数据并对电力营销数据状态进行估计,通过模式识别获得电力营销数据中更加细致的信息。通过信息融合的功能模型,引入回归分析方法对系统进行优化。工作流程如图5所示。

图4 信息融合的电力营销数据分析系统功能模型

图5 电力营销数据多元回归分析流程

3.2 电力营销数据筛选

利用挖掘算法筛选数据,筛选过程如下:

(1) 通过低密度区域分割电力营销数据。分割计算过程如下:

nd=(v-b1)nr

(1)

其中,v表示研究的电力营销数据所属空间的数目,b1表示在低密度下电力营销数据的对象子区域空间,nr表示电力营销数据所处节点的值域。

(2) 电力营销数据的分割是在低密度下分割的,在完成分割后,从高密度中显示出来。高密度的属性值与低密度不同,低密度的属性值为φ,高密度的属性值为δ,在高密度对象区域,电力营销数据的表现式为

(2)

其中,a1表示在高密度下电力营销数据的对象子区域空间。

(3) 在综合分析低密度和高密度电力营销数据的表达式后,对电力营销数据进行聚类,得到聚类公式为

ni=p(nd+ng)i

(3)

其中,i表示所处理的电力营销数据,由此实现电力营销聚类数据筛选值后,在样本数据中选择属性最高的数据,总结成数据集,如果数据集满足特殊条件执行下一步。

3.3 多元回归处理

在筛选系统营销数据后进行多元回归处理。回归过程如下:

(1) 根据数据结构构建矩阵,矩阵表示为A:

(4)

矩阵A是t×p形式的相异度矩阵,t泛指矩阵的电力营销数据对象,p代表该对象所对应的属性。

(2) 根据度量值和绝对平均值进行标准化处理,进而得到绝对偏差值为

(5)

其中,mf表示绝对平均值,sf表示绝对偏差值,f表示数据对象之间的差异。与其他数值相比,绝对偏差值的鲁棒性更好,这样可以更好地避免异常数据而带来的降低效果。

(3) 在实现上述标准化处理后,确定不同电力营销数据类型之间的相似程度,寻找不同对象之间的距离。回归分析距离公式为

(6)

式中,d(i,j)表示分析的不同电力营销数据多元回归分析对象之间的距离:如果d(i,j)的数值是0,则2个对象之间是具有对称性的;如果d(i,j)的数值不为0,则2个对象之间不具备对称性,对象具备相异性,计算式为

W=d(i,j)×ki

(7)

其中,ki表示需要进行回归分析的数据量,W表示多元回归分析结果。

4 实验研究

为验证基于信息融合的电力营销数据多元回归分析系统的可行性和操作效果,设定实验,选取电力营销数据分析网站(https:// yq. aliyun. com/zt/437092)得到电力营销数据回归分析测试所需实验,在确定重要参数即权重系数和聚类数目之后,探讨本文研究的多元回归分析系统的分析效果:如果分析结果显示聚类数目小于聚类样本的总数量,则表明数据分析是无意义的;若聚类的数量等于1,表示该数据多元回归很有意义。权值指标是数据多元回归分析的重要参数,参量过大,分析效果不好,因此,必须保证权值指标一直在合理范围之内。选择的电力营销数据数值如表1所示:

对表1中的电力营销数据进行多元回归分析,回归分析过程如图6所示。

根据图6可知,实验过程如下:

(1) 对电力营销数据内部的空缺值进行填充,通过填充处理纠正内部数据,防止电力营销数据存在不一致。

(2) 将所有的电力营销数据源统一结合到一起,在一个相同的数据仓库中。

(3) 将数据仓库中的样本数据转换,并统一存放在数据库中。

(4) 在进行多元回归分析之前,需要压缩数据,从而提高数据多元回归的速度。

表1 电力营销数据数值

图6 回归分析过程

(5) 通过多元回归消除电力营销数据内部无关数据。

(6) 在决策树下将数据转换。

选择本文研究的基于信息融合的电力营销数据多元回归分析系统和传统的基于数据融合的电力营销数据分析系统、基于COMTRADE模型的电力营销数据分析系统进行对比实验,得到的回归分析用时结果如图7所示。

图7 回归分析用时结果

分析图7可知,不同方法下电力营销数据分析速度不同。当实验次数为700次时,基于COMTRADE模型系统的回归分析用时为1.8 s,基于数据融合系统的回归分析用时为1.65 s,所设计系统的回归分析用时为0.8 s。所设计系统的回归分析用时始终在1.0 s内,分析速度较快。由此可以证明,本文提出的信息融合电力营销数据的回归分析能力更强。在此基础上测试系统的分析精准度,精准度计算式为

(8)

其中,m表示多元回归分析的电力营销数据数量,w表示实际的分析数量,w′表示预测的分析数量,Z表示分析结果精准度。得到的实验结果如图8所示。

图8 分析结果精准度

分析图8可知,不同方法的分析精准度不同。当电力营销数据量为300 bit时,COMTRADE模型分析系统的精准度为58%,数据融合系统的精准度为35%,所设计系统的精准度为65%。所设计系统始终具有较高分析精度。这是由于本文在研究的过程中不断提高分析数据的位置跟踪力度,按照故障数据流动曲线查找相应的位置信息,利用相关程度较高的信息数据转化不同的数据系统,并整合具体的诊断信息,最终获取较高的分析结果精准度。

5 总结

目前研究的电力营销数据信息多元回归分析系统分析精准度低,耗时过长,本文利用信息融合技术研究了一种新的电力营销数据多元回归分析系统。根据实验结果可以得出以下结论:

(1) 所设计系统的回归分析用时短,当实验次数为700次时,所设计系统的回归分析用时仅为0.8 s。

(2) 所设计系统的分析精准确较高,当电力营销数据量为300 bit时,所设计系统的精准度为65%。

猜你喜欢

精准度聚类模块
一种傅里叶域海量数据高速谱聚类方法
28通道收发处理模块设计
“选修3—3”模块的复习备考
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
让党建活动更加有“味”——礼泉县增强“两新”党建精准度
把脉培训农民需求面 提高农业培训精准度
必修模块相关知识过关训练
基于Spark平台的K-means聚类算法改进及并行化实现
压力表计量检定及校准方法探讨