APP下载

基于数据挖掘的智能电网在线故障诊断与分析

2017-05-09杨世海陈铭明李志新

电子设计工程 2017年1期
关键词:项集数据挖掘故障诊断

杨世海,李 涛,陈铭明,陈 晶,李志新

(1.国网江苏省电力公司电力科学研究院,江苏 南京 210019;2.福建亿榕信息技术有限公司,福建 福州350003)

基于数据挖掘的智能电网在线故障诊断与分析

杨世海1,李 涛2,陈铭明1,陈 晶2,李志新1

(1.国网江苏省电力公司电力科学研究院,江苏 南京 210019;2.福建亿榕信息技术有限公司,福建 福州350003)

基于智能电网故障在线诊断与分析的目的,本文采用基于关联规则挖掘改进的Apriori算法,分析了电网三态数据的特性,并利用关联规则建立测试数据库,用于故障诊断在线挖掘;对传统的Apriori算法进行改进,使其只在起始扫描数据库一次,用以获取当前所有项集的支持度计数,解决了原算法多次扫描数据库的弊端,明显提高了在线挖掘效率。工程应用测试结果表明,该算法可有效提高在线故障诊断的实用化水平,具有很好的工程应用价值。

智能电网;故障信息;联合规则挖掘;在线故障诊断

随着智能电网相关技术在国内的发展与普及,其自我感知、自我检测、自我预防成为电网所必需的智能运行能力[1]。其中,自我故障诊断能力具有重要作用,即当电网发生故障时,如何从海量故障数据中提取有效信息,自动、快速地诊断电网中的故障设备,辅助调度运行人员及时处理,成为目前故障在线诊断所急需解决的问题。

传统的电网在线故障诊断通常基于单一数据源,这使得其诊断结果在正确性、实时性及全面性等方面难以达到预期效果,以致未能在调度中心得以实用[2]。因此,国内外诸多学者针对电网故障的多数据源特性先后提出了多种电网故障诊断方法,如专家系统[3]、模糊理论[4]、信息理论[5]等,然而以上方法对于处理海量数据信息的能力和不确定故障信息的容错性仍不甚理想。因此近年来有关数据挖掘的相关技术被应用于电网故障诊断,并取得了较理想的研究成果[6-7],其中,关联规则挖掘因对决策的生成具有重要的实用价值而备受关注[8-10],但应用于电网故障诊断方面的成果并不多,如文献[9-10]分别分析了故障信息序列中必有或特有的信息,提出了对应的关联规则挖掘方法。

基于此,文中结合电网三态数据的特性,将基于关联规则挖掘改进的Apriori算法应用于电网在线故障诊断中。利用关联规则建立建立用于故障诊断在线挖掘的测试数据库;对传统的Apriori算法进行改进,使其只在起始扫描数据库一次,用以获取当前所有项集的支持度计数,解决了原算法多次扫描数据库的弊端,明显提高了在线挖掘效率。工程应用算例测试结果表明,该算法可有效提高在线故障诊断的实用化水平,具有较高的工程应用价值。

1 智能电网故障数据特性分析

智能电网故障诊断以反映电网设备故障信息为基础,在线故障诊断所需采集的原始数据有:稳态数据的开关变位、保护告警/动作事件、断路器状态、隔离开关状态、保护定值、通道状态、动态数据的电压、电流突变以及暂态数据的电压、电流突变等,其电网故障数据源特性如表1所示。

从时间维角度可知,电网发生故障后,稳态和动态数据的上送时间比暂态数据要短的多,故应尽量利用稳态和动态数据;而从空间维角度来看,利用稳态数据可实现故障范围的全方位监视[11-13]。目前,电网故障时存在的数据丢失、上送速度慢及电网正常运行时存在的误遥信等因素使得3种状态的故障数据不稳定,进而导致在线故障诊断实用化程度较低[12],因此,在线故障诊断在算法设计过程中需要充分考虑电网数据现状,综合运用调度端的多源信息进行分析,以减小数据可靠性不高对在线故障诊断正确率的影响。

表1 电网故障数据源特性

2 基于关联规则的数据挖掘算法实现

2.1 测试数据库及关联规则模型的建立

设C={C1,C2,…,Cm}表示保护测试条件,D={O}为保护的动作状况,其中Ci(0≤i≤m)和O都是概念层。保护测试数据库为T={T1,T2,…,Tn}。T中的每个元祖 Ti(1≤i≤n)的表示形式为(c1,c2,…,cm,0),其中ci∈Lset(Ci),0∈Lset(0)。在数据被存入T之前,对各数据进行离散化处理[14-15]。

保护测试关联规则是形如X⇒Y的蕴涵式,其中,X,Y分别是C和D的模式。规则X⇒Y在事务集W中成立,具有支持度s,其中s是中事务W包含X∪Y的百分比。规则X⇒Y在事务集W中具有置信度c,其中c是中事务W包含X的事务同时也包含Y的百分比。用相关规则表示模式X与模式Y之间的相关度:

根据概率论,若P(X∪Y)=P(X)P(Y)成立,则说明模式X的出现时独立于模式的,若相关度大于1说明模式X和Y是正相关的。

2.2 Apriori改进算法设计

Apriori算法是一种挖掘单维关联规则频繁项集的算法,使用逐层搜索迭代,由连接和剪枝两步构成。但该算法在挖掘过程中存在一定的不足:如需多次扫描数据库以确定各个候选项集的支持度计数;运算时间受频繁项集长度影响显著。针对上述问题,此处提出一种改进方案,其改进后的算法执行流程如图1所示,其具体步骤为:

1)对D进行首次扫描,并对其中的各单项事务统计支持度,产生候选l-项集C1。从项集C1中删除支持度计数小于最小支持度的项[16],从而得到频繁l-项集L1;

2)建立各单项事务统计的事务总列表;

3)利用L1自连接生成候选2-项集C2及其对应的各单项事务列表,并进行项集的求交集运算;

4)由上一步运算得到的中间候选项集C2确定侯选集C2,最终生成频繁2-项集L2;

5)依次重复步骤3)直到不再产生新的候选项集即完成挖掘。

3 工程应用案例分析

3.1 算法改进性能验证

在进行系统性能实测之前,需建立故障数据挖掘库,并验证改进算法的优越性。以福建省供电公司近3年内的收集200余次故障记录数据为基础,建立容量为200项的数据挖掘库,容量为20项的无故障测试数据库,并在某服务器上进行挖掘算法测试,其测试内容为在挖掘库中增加50项不良记录,用于模拟故障事件中的丢失信息、错误信息和冗余信息,检验程序的健壮性。分3次测试,第1次测试为只挖掘200项正常的故障记录;第2次为在增加30项有缺失信息和20项有冗余信息的挖掘测试;第3次为10项有缺失信息和40项有冗余信息的挖掘测试。测试结果如表2所示,可看出,利用改进算法产生的规则对测试库中20项故障记录进行诊断,规则匹配度全部达到0.8以上,且效率大为提高。在有缺失信息的情况下,适当降低可信度仍然可以挖掘出有效的规则;冗余信息对挖掘的影响较小,说明该算法可把握重要关联规则,滤除干扰。

3.2 在线故障诊断测试

为测试算法的在线故障诊断功能,以图2所示的故障电网局部拓扑结构为例,进行实地在线诊断。其测试信息序列如表3所示。该改进算法诊断的故障结果为 “线路1过负荷保护动作,切除线路1成功;线路2中DL2差动保护动作电流差动保护动作,切除线路2成功,重合闸失败,引起相邻线路三相过负荷误动,匹配度0.81,建议检查过负荷保护”。事后分析证明过负荷保护和电流差动保护均为误动,诊断基本正确。

图1 Apriori改进算法流程图

表2 不良数据记录的挖掘测试结果

图2 故障电网局部拓扑图

表3 电网局部主要故障序列

4 结束语

文中研究了智能电网故障在线诊断问题。结合电网三态数据的特性,利用关联规则建立建立用于故障诊断在线挖掘的测试数据库;改进了传统的Apriori算法,解决了原算法多次扫描数据库的弊端,减小了计算量。工程应用算例测试结果表明,该算法可有效提高在线故障诊断的实用化水平,具有较高的工程应用价值,对智能电网的建设和应用推广也应具有很好的经济效益和社会效益。

[1]姚建国,严胜,杨胜春,等.中国特色智能调度的实践与展望[J].电力系统自动化,2009,33(17): 16-20.

[2]陈玉林,陈允平,孙金莉,等.电网故障诊断方法综述[J].中国电力,2006,39(5):27-31.

[3]杜一,张沛超,郁惟镛.基于事例和规则混合推理的变电站故障诊断系统 [J].电网技术,2004,28(1):34-37.

[4]周明,任建文,李庚银.基于模糊推理的分布式电力系统故障诊断专家系统 [J].电力系统自动化,2001,25(24):33-36.

[5]汤磊,孙宏斌,张伯明.基于信息理论的电力系统在线故障诊断 [J].中国电机工程学报,2003,23(7):5-11.

[6]于之虹,郭志忠.基于数据挖掘理论的电力系统暂态稳定评估[J].电力系统自动化,2003,27(8): 45-48.

[7]孙雅明,廖志伟.基于事件序列数据挖掘原理的高压输电线系统故障诊断[J].电力系统自动化,2004,28(5):20-24.

[8]张云涛,于治棱,张化祥.关联规则中频繁项集高效挖掘的研究[J].计算机工程与应用,2011(3): 139-141.

[9]张斌,孙哲.关联规则技术在电力系统中的应用[J].电网技术,2007,5(1):63-66.

[10]李再华,白晓民,周子冠,等.基于特征挖掘的电网故障诊断方法[J].中国电机工程学报,2010,30(10):16-22.

[11]Hirokane M,Kouno S,Nomura Y.Extraction of minimum decision algorithm using rough sets and genetic algorithms [C].The Sixth International Conference on Machine Learning and Applications,Kansai University,Osaka,2007.

[12]Chen-Ching L,Marino S,Hanjin Miao.On-line fault diagnosis using sequence-of-events recorder information[J].IEEE Transactions on Automatic Control,1996,31(7):339-344.

[13]闪鑫,赵家庆,张剑,等.基于三态数据的电网在线综合故障诊断[J].电力系统自动化,2012,36(23):79-84.

[14]刘海蓉,闺仁武.一种改进的加权关联规则挖掘算法[J].现代电子技术,2011,21(12):51-54.

[15]董志赟,乐全明,郑华珍,等.高压电网子站故障选线诊断新方案研究[J].继电器,2006,34(10): 7-11.

[16]朱金坛,数据挖掘Apriori算法的改进[J].电子设计工程,2013,21(15):37-40.

On-line fault diagnosis and analysis of smart power grid based on data mining

YANG Shi-hai1,LI Tao2,CHEN Ming-ming1,CHEN Jing2,LI Zhi-xin1
(1.State Grid Jiangsu Electric Power Research Institute,Nanjing 210019,China;2.Fujian Yirong Information Technology co.,LTD.,Fuzhou 350003,China)

For the purpose of on-line fault diagnosis and analysis for smart power grids,this paper designed the improved Apriori algorithm based on united rules mining.Through analyzing the features of power grid three state data,test database which would be used for on-line fault diagnosis was found by using united rules.The traditional Apriori algorithm was improved to scan the database initially,in order to observe the frequency counting of all present itemsets,which solved the shortage of scanning the database frequently,and increased the efficiency on on-line mining.The results of engineering application tests indicated that the algorithm proposed in this paper could enhance the practical level of on-line fault diagnosis,which had good project application benefit.

smart power grid;fault information;united rules mining;on-line fault diagnosis

TN87

:A

:1674-6236(2017)01-0136-04

2015-12-28稿件编号:201512282

杨世海(1976—),男,安徽合肥人,硕士研究生,高级工程师。研究方向:电力系统自动化与电能计量技术。

猜你喜欢

项集数据挖掘故障诊断
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
因果图定性分析法及其在故障诊断中的应用
一种基于Hadoop的大数据挖掘云服务及应用
关联规则中经典的Apriori算法研究
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
一种频繁核心项集的快速挖掘算法
高速泵的故障诊断
基于GPGPU的离散数据挖掘研究