基于数据挖掘的户变拓扑关系辨识算法研究
2019-03-30谷海彤张远亮卢翔智崔卓杜锦阳
谷海彤 张远亮 卢翔智 崔卓 杜锦阳
摘要:户变拓扑关系的准确识别一直是电网运营过程中一个亟待解决的难题,从技术上寻求台区户变拓扑关系信息识别的方法已迫在眉睫。针对智能电网中部分集采台区存在户变关系混乱的情况,本文利用数据挖掘技术对电力通讯载波信号数据进行分析,基于增量式决策树算法设计了台区户变拓扑关系的辨识方法,实现了户变拓扑关系及时准确的维护。实际运行结果表明:该模型较之传统的决策树算法和贝叶斯模型具有更高的准确度,能有效提高台区用户信息识别的实时性和可靠性。
关键词:数据挖掘;户变拓扑关系识别;通讯载波
中图分类号:TM76 文献标识码:A 文章编号:1007-9416(2019)12-0116-02
0 引言
计量自动化系统是智能电网的重要组成部分,然而由于多种因素,投入运行的部分集采台区存在户变关系混乱的情况,影响台区线损分析等关键技术指标,进而阻碍了计量自动化系统的推广应用。近年来,数据挖掘、机器学习等智能技术的发展为实现台区户变关系的识别提供了诸多行之有效的方法,这些理论和技术已经在电网运营中取得了成功的经验,例如,将数据挖掘应用于智能电网,邹云峰邓利用K均值聚类(K-means)实现了台区合理线损预测[1]、张蓝宇等运用聚类算法和关联分析法,搭建了线损管控、评估与智能诊析模型实现了台区线损管理的快速诊断决策[2]。本文则利用与电网拓扑关系紧密相关的载波技术,基于通信载波中所能够提供的计量信息,提出了一种基于增量决策树算法的户变拓扑关系辨识方法,通过数据挖掘的方式建立户变拓扑关系的识别模型并对其进行维护,用以提升户变拓扑关系识别的准确率。
1 系统工作原理
本系统利用宽带载波技术,实现了基于增量式决策树算法的户变拓扑关系识别相关的设备,在电网运营具体实施时,主站发送开始台区识别指令,CCO将该指令转给户变识别设备,户变识别设备发射信号,由台区内宽带载波(STA)模块负责回应,CCO根据收到的上报数据利用决策树算法进行拓扑关系的自动识别,并与自己网内的拓扑档案进行比较,将分类异常的用户进行剔除.该过程主要分为两个阶段:第一阶段为启动阶段,其示意图如图1所示,待识别台区(A)中的集中器载波模块进行数据广播,要求站点启动台区识别功能,正常广播的数据,其他台区的站点也有可能回应。由抄控宝于过零点发射识别信号。该信号采用的频率和调制方式与正常PLC通讯方式不同。其内容为本台区通讯模块的SNID和工作模式。
台区识别流程第二阶段为下发SNID并生成正确表档案,其示意图如图2所示,由台区A集中器模块发起读命令,来查看各节点回应信号并进行增量式决策树的识别算法,根据识别的分类结果,CCO模块会发现STA2_21属于异常分类,而STA1_24属于本区域的正常分类。于是可根据此结果生成正确的档案。因此节点STA1_24会知道自己的SNID已经错误,会主动退出台区B并加入台区A,如图2中灰色节点所示,即完成了台区的正确辨识。
台区识别流程的结束由发起时定义的超时时间决定,目前一般定义为60分钟以内。台区识别结束后,所变更的台区对应关系会被恢复为与主站设置档案一致。即台区识别只提供正确的台区对应表,并不更改集中器档案,防止本地档案与主站不一致。
2 增量式决策树算法
决策树分类算法是通过一系列规则对数据进行分类的过程,用于来发现数据中蕴涵的分类规则[3]。但是由于电网大数据的特性,数据集随时间推移不断增大,如果每次建模过程都需要对所有数据进行训练会大幅度增加算法的时空复杂度。理论上基于贝叶斯估计的增量学习分类器是解决这个问题的有效途径,该算法在已有数据集的基础上,仅针对新样本对原有模型进行更新,可以保证算法的快速性和有效性。因此本文考虑将两者相结合,建立户变拓扑关系的辨识模型。该算法主要分为两个阶段,首先将样本训练集的一部分作为初始样本数据集来生成初始决策树T0;然后在初始决策树的基础上执行后续新样本的增量学习。
假设根据某个样本数据集生成的决策树中一个节点属性空间为D,之后依据此样本数据集的属性空间和分类情况作为贝叶斯分类器的参数,当接收到新的样本数据后,对到达这个节点的样本数据进行朴素贝叶斯分类,这种节点称为贝叶斯结点。增量式决策树算法执行过程如图3所示[4],当产生一个新的训练集样本时,决策树算法将该实例与已生成决策树中划分的属性进行匹配,并在到达叶节点时终止操作。如果到达的节点不是贝叶斯节点,则需要判断该实例的划分是否正确。如果划分结果准确,则决策树的结构参数不会发生任何更改,否则,如果基于贝叶斯分类方法的結果比决策树分类方法更加准确,则将此节点转换为贝叶斯节点。如果该节点是贝叶斯节点,则结合实例更新修正该节点的贝叶斯参数。因此,可以根据上述流程,通过连续递归的方式构建增量式决策树。
3 实验结果分析
本文主要利用载波通信数据来对算法进行对比实验测试对某供电营业所所属45个台区户变拓扑关系进行了模型有效性的检验,测试数据中所有台区的用电客户数量为3846个,通讯载波信息记录数约为120万条。在网络的建立和测试过程中,利用电力载波通信信号品质数据作归一化处理作为训练样本输入数据,信号品质范围为0-1,选用本文提出的增量式决策树算法与经典决策树C4.5算法和贝叶斯分类算法的耗时以及准确率进行对比,测试户变拓扑关系识别模型的性能分别如图4和图5所示。实验中选取不同大小的数据集进行测试,横坐标中的数字1,2,3,4分别代表数据集大小为1000,5000,10000和20000。
从图4和图5中可以看出,增量决策树算法在没有明显增加计算负担的前提条件下,其分类准确率比其他两种算法有明显提升,同时,随着数据量的增大准确率波动较小,体现了该算法优良的分类性能以及算法的鲁棒性。
4 结语
本文面向台区户变拓扑关系的辨识问题,将决策树算法和贝叶斯增量式学习融合,提出了基于载波技术的增量式决策树算法用以准确识别台区户变拓扑关系。测试结果表明该算法能够满足电力公司对户变拓扑关系识别精度的要求,在计量自动化系统的推广应用方面发挥了积极的作用。
參考文献
[1] 邹云峰,梅飞,李悦.基于数据挖掘技术的台区合理线损预测模型研究[J].电力需求侧管理,2015,17(4):25-29.
[2] 张蓝宇,陈艺云,海入.基于数据挖掘技术的台区线损智能诊断研究及应用[J].湖南电力,2019,39(2):16-20.
[3] 刁智华,赵春江,郭新宇.一种新的基于平衡决策树的SVM多类分类算法[J].控制与决策,2011(1):149-152.
[4] 王明星.数据挖掘算法优化研究与应用[D].安徽大学,2014.
Research on the transformer area identification algorithm based on data mining
GU Hai-tong,ZHANG Yuan-liang,LU Xiang-zhi,CUI Zhuo,DU Jin-yang
(Guangzhou Power Supply Bureau Co., Ltd., Guangzhou Guangdong 510620)
Abstract:The accurate maintenance of the topology relationship of the transformer area has always been a difficult problem for the power grid company. At present, technical breakthroughs must be sought to solve the bottleneck problem of accurately identifying the topology relationship across the transformer area. In this paper, an incremental decision tree algorithm was proposed to identify the relationship based on the analysis of the power line carrier communication technology through the data mining technology. The actual operation results showed that the model has the advantages of high recognition accuracy than the Bayesian model and can effectively improve the real-time and reliability of user information identification.
Key words:data mining;transformer area identification;power line carrier