基于分布式多层架构的计量生产管理平台设计与研究
2022-04-20欧振国张永旺刘海斌舒晔黄博伟彭强
欧振国, 张永旺, 刘海斌, 舒晔, 黄博伟, 彭强
(广东电网有限责任公司, 计量中心, 广东, 广州 510000)
0 引言
电能计量是各个生产部门、企业用户、商业、个体等各个环节的必需工作,也是发电部门、供电部门和用电部门之间实现电能传递的重要途径。通过电能表实现电能计量的历史已经很久,由于用电用户较多,电能表计量留驻在千家万户,用电信息采集量很大,在对各种计量数据信息进行管理时,计量生产管理平台等信息系统跃入人们的视线[1]。计量中心生产调度平台在电能表计量状态检验以及数据管理方面具有重要的作用。
现有技术中使用的电能表计量生产管理平台存在诸多缺点。
(1)平台结构简单,数据库管理不完善,在面对检测规模巨大、检测作业量较大的情况下,难以实现数据的统一调度,工作效率低下。
(2)数据计算量大,对数据分类、计算能力以及获取信息的能力很差,调度时间信息发布和获取时间长,造成生产滞后。
(3)自动化程度差,大量计量数据管理,仍离不开人工劳动,整体运行步幅迟缓,整体效率不高。
由于计量生产管理平台大部分在省级计量中心应用,因此需要设计出新型的计量生产管理平台[2]。
1 多层架构平台设计
研究基于多层架构的管理模式实现计量生产管理平台的智能化、自动化管理[3],架构示意图如图1所示。
数据层设置容纳多种数据类型的数据库信息,比如计量设备运行参数信息管理数据库、生产运行数据信息管理数据库、计量检测数据管理库、故障数据管理数据库等,这些数据库能够包含计量设备全生命周期等一系列管理数据。研究的计量生产管理囊括范围不局限于电能表,还涉及不同型号的专变终端、单相电能表检定装置、三相电能表检定装置、便携式计量检定该装置或者公用配变考核设备等,上述计量设备在全生命周期过程的数据信息是一个庞大的数据系统,常见的数据库管理软件有SYBASE、duDB、Oracle、MySQL、ACCESS、Visual Foxpro、MS SQL Server、Informix、PostgreSQL等,在本研究的计量生产管理平台设计中,采用MySQL数据库[4]。
在访问层中设置有应用接口、数据流、数据接口、通信接口以及各种访问权限设置等,通过访问层,用户能够获取数据层中的各种数据信息,并与外界实现信息通信。其中通信接口可以为RS485通信接口、RS232通信接口、红外通信接口、载波通信接口、TCP/IP通信接口、ZigBee无线通信接口、GPRS通信接口、CDMA无线通信或蓝牙通信接口等[5]。通过这种多模式通信方式设置,能够实现多设备的通信。
在计算层中设置计算单元,由于数据层存在大量不同类型的数据,在寻找、应用和数据管理时,常规人工方式显然已经满足不了当前需要。在本研究的计量生产管理平台中,在计算单元中融入了数据挖掘算法,进而实现电能计量数据的多种处理和应用。数据挖掘算法更进一步地包含诸如Apriori算法、关联算法、回归分析、聚类算法、调度树算法、贝叶斯算法、神经网络、支持向量机等[6]的多种算法,通过不同的算法能够实现不同的数据计算和处理功能,研究针对分类算法和AdaBoost算法故障诊断算法进行说明。
2 关键技术研究
2.1 数据管理平台设计
计量生产管理平台包括计量客户服务层、计量业务处理层、计量工作质量监控层和计量调度层,如图2所示。计量客户服务层主要实现与用户以及客户进行信息互通,可以在其内设置呼叫装置、触摸查询装置、通信设备、电子通信装置、客户服务管理系统等,以便实现与调度用户的信息沟通。在计量业务处理层中,通过设置业扩报装子系统、对电能计量进行统一管理的计量子系统、对电能进行计费计算的收费或者计费系统、对用电信息进行电费管理的子系统、对用户用电进行监控的用电监查子系统、对市场供求侧进行管理和调度的市场与需求侧子系统、对线缆运行和线损耗进行管理的线损管理子系统、对配电信息进行配电管理的配电GIS管理子系统、对获取的用电数据信息进行总结的报表汇总子系统和系统管理子系统等模块进而实现不同数据类型的处理[7]。在计量工作质量监控层中,其内至少设置有工作质量管理子系统,用于实现工作流程控制、业务稽查、统计报表、综合查询和工作评估,所述工作质量管理子系统至少包括采购管理模块、生产管理模块、工艺管理模块和质量报表管理模块。在计量调度层中,其内至少设置有综合调度子系统,用于经营业绩分析、管理业绩分析、策略效益分析、客户动态分析和市场策划,所述综合调度子系统至少包括对用电信息进行数据存储、分析和管理的计算模块、对已获取的电力信息进行数据查重的数据查询模块、对电能计量进行策划的方案策划模块、根据计算出的结果进行方案执行的方案执行模块和对电力数据信息进行调度的信息管理模块[8]。
图2 计量生产管理平台示意图
2.2 大数据处理算法
2.2.1 大数据分类算法
以KNN算法为例,对电能计量生产调度平台中数据库的数据进行分类,该算法在应用过程中,首先要输入数据信息,将输入的数据信息与数据库中设置的标准数据信息进行比较,搜索与标准数据库中相对比较类似的前k个数据,根据距离关系的远近,将其分类。具体步骤如下。
(1)将待测数据信息的样本信息与设置好的标准数据信息之间进行比对,利用的距离公式为
(1)
式中,xk和yk分别为数据集合中的2个不同的点,n为数据的维数。
(2)按照距离的递增关系进行排序。
(3)选取距离最小的k个训练集数据,确定前k个点所在类别的出现频率。
(4)聚类分析,将抽出的数据样本进行聚类,得出k个聚类个数,分别为C1,C2,…,Ck;然后输出k个子簇;将k个子簇分为小子簇,选取距离中心,抽样数据中的不同点到所选取距离中心点的距离集合记作d={d1,d1,…,dn}。
(5)根据距离中心点的远近进行分类,其中将
(2)
中的比例的倒数
(3)
作为距离权值,其中k个值中的类别T的
(4)
个数分别为C1,C2,…,Ck,计算加权后的个数中最大的值作为样本数据的预测类别,通过这种方式实现数据的分类。
其中,k大于2,可根据用户需要进行设置,k值设置不宜过大,也不宜过小。如果k太小,则会降低分类精度[9];如果k太大,则会增加噪声,降低分类效果。
在进行距离计算时,还可以采用曼哈顿距离、欧氏距离和闵可夫斯基距离。其采用的计算式为
(5)
式中,当p=1时,称为曼哈顿距离(Manhattan distance),当p=2时,称为欧氏距离(Euclidean distance);当p趋向于∞时,式(5)称为闵可夫斯基距离。
2.2.2 AdaBoost故障诊断算法
为了计算方便,下面分步骤进行说明。首先构建AdaBoost算法模型,然后利用该模型进行电能表计量数据故障诊断,具体分为以下几个步骤。
(1)获取训练样本,训练弱分类器,通过训练多个弱分类器,训练强分类器,表示为
D1(w11,w12,…,w1N)
(6)
其中,
(7)
(2)迭代计算。计算出不同弱分类器分类的误差,所计算出的误差等于各个不同电力营销大数据样本的权重和,算法迭代的次数小于弱分类器的个数。
(3)迭代误差计算[10]。迭代误差Gm(x)在训练集上的误差率计算式为
(8)
(4)归一化处理。获取最优分类器之后,进一步地计算所选取的分类器的权重,接着再更新各个不同样本的权重,再进行归一化处理,然后计算Gm(x)的系数,am代表Gm(x)在训练后的最终分类器中的关键程度,表示为
(9)
式中,em≤1/2时,am≥0。通过式(9)可看出,am与em成反比例关系,即误差率越小,分类器在最终分类器中起到的作用越大。
(5)迭代判断。判断迭代次数是否等于阈值:如果与阈值相等,则完成迭代计算,最后的分类器则由迭代过程中所选择的弱分类器经过线性加权得到的;如果迭代次数不等于阈值,则重新进行迭代计算。
这样就构建出了AdaBoost算法模型,然后,再计算每个样本的相对误差。当选择的电能表计量数据是线性误差时,则利用式(10):
(10)
如果选择的电能表计量数据是平方误差时,则利用式(11):
(11)
如果选择的电能表计量数据是指数误差时,则利用式(12):
(12)
然后,再计算回归误差率:
(13)
通过上述算法模型能够实现数据的故障诊断,有利于用户及时发现故障并排除故障。
3 试验结果及分析
3.1 硬件条件及实现目的
在试验时,试验硬件条件为Pentium(R),其中CPU为8 G内存,硬盘容量为160 G,软件环境为WinXP+sp2或者Win2003+sp1,数据仿真界面为MATLAB界面。然后根据样本类型选择数据样本进行试验。试验目的是将文中研究方案与文献[5]、文献[6]以及常规技术进行对比分析,以显示文中研究技术的优越性。
3.2 系统对比
下面以电能表计量装置为例,以文献[5]和文献[6]方法作为实验对比对象,通过平台整体数据接收的反应能力来衡量不同平台的工作效率,为了提高测量精度,分别测试10次,据此得到3种方法进行10次测试的耗时对比结果,如图3所示。
图3 检测耗时对比示意图
在图3中,文献[5]方法在10次检测实验中的总耗时为103 s,文献[6]方法在10次检测实验中的总耗时为97 s,而文中研究的技术方案总耗时为49 s,约为2种对比方法的一半。因此,文中研究的方法大大提高了数据传递和处理速度,从而提升了计量生产管理平台的工作效率。
3.3 算法验证
在对具有算法的计量生产管理平台进行验证时,将未采用算法的计量生产管理平台作为对比对象,同时也观察文献[5]、文献[6]处理数据的能力。测试时间为10 min,所处理的数据类型分别为相同的100万种电能计量数据类型,在处理数据完成性上来看,得出如图4所示的对比曲线图。
图4 3种不同方法的对比曲线图
通过图4可以看出,在10 min内,常规方法处理数据的能力极其落后,文献[5]和文献[6]虽然利用了算法,但是效果不够好,文中研究的方法不到1 min的时间内就完成了所有数据的处理,因此,通过人工智能的大数据算法有效地实现了数据处理。
下面在对数据处理的误差程度进行对比。在上述10 min的数据处理过程中,观察数据处理误差,其中误差的计算式为
(14)
通过这种方式,得出如图5所示的误差曲线图。
图5 误差曲线对比示意图
通过图5可以看出,通过10 min的持续测试,发现设置文中研究算法的平台处理数据的误差低于2%,相对于文献[5]、文献[6]和未融合任何算法的常规计量生产管理平台的误差曲线随着测试时间的延长,逐步增大,因此,融入文中算法误差较低,数据处理能力较强。
4 总结
文中研究通过构建分布式多层架构的计量生产管理平台,将平台划分为数据层、访问层、计算层和应用层等层次,在不同层次之间实现互助配合,实现电能计量的多功能处理,并在计量生产管理平台中融入大数据处理算法实现多种数据的分类、故障诊断等多种处理。通过试验,文中研究比常规技术具有突出的技术进步性,但是仍旧存在一些问题,比如数据传递、多数据共享时存在的干扰等,这需要进一步的探讨与研究,为下一步对计量生产管理平台的研究奠定技术基础。