AI优化模糊核聚类算法的变压器DGA分析
2014-04-16宋志杰王健
宋志杰,王健
(华南理工大学电力学院,广州 510640)
电力变压器运行状态对电力系统安全可靠运行起着至关重要的作用,因此对变压器的运行状态及其潜伏性故障进行判断一直是国内外研究的热点。变压器油中溶解气体分析方法DGA(dissolved gas analysis)是目前发现变压器早期内部故障比较有效的方法,已经得到广泛的应用。其中,IEC/IEEE推荐的三比值法是基于实践经验总结而来的;人工神经网络理论、模糊理论、专家系统、支持向量机理论、粒子群理论、灰色系统理论[1-7]等人工智能技术是基于特征气体与故障类型的非线性映射关系建立相应数学模型而来。这些方法都取得了不错的效果,但考虑到变压器故障机理的复杂性,仍需要加强对其的研究,引入新的方法,以期提高诊断效果。
模糊聚类分析是数据挖掘的重要方法,根据事物间的特征、相似程度进行分类,已经被广泛应用于数据分析、模式识别、图像处理等方面。文献[8~10]将模糊聚类应用于变压器故障诊断中,在一定程度上实现了故障的分类,但由于其易陷入局部极值点、对初值敏感,对样本数据的分布要求严格,仅对球状或椭球状的数据类型才有效,因此诊断精度受到限制;文献[11]将遗传算法和模糊聚类算法结合起来诊断变压器的故障,通过模糊聚类实现模糊C划分,遗传算法在整个状态空间进行搜索,得到最优分类数及聚类中心,解决了聚类中心的个数C难以确定的问题,能以较大概率收敛于全局最优解,但收敛速度较慢,易出现早熟;文献[12]提出了模糊核聚类算法,通过核函数将输入特征气体样本映射到核空间,能较好地分辨和放大有用的特征,并对样本特征进行优化,能有效的改善变压器故障特征气体数据集的聚类性能,但也存在全局收敛概率较低等缺点;文献[13~15]将人工免疫技术引入变压器故障诊断中,利用其很强的学习、识别、分布式联想记忆和特征提取能力,来实现故障类别的有效分类,但单纯人工免疫算法诊断精度不高,需要与其他方法结合应用。
本文在以上分析的基础上,针对模糊聚类方法的不足,利用人工免疫算法中免疫细胞克隆、记忆、选择、变异等机理,将人工免疫算法与模糊核聚类算法结合起来应用与变压器故障诊断,采用群体搜索策略,将待分类的数据对象视为抗原(Ag),把聚类中心看作抗体(Ab),通过免疫系统不断产生抗体,识别抗原,来优化FKCM的目标函数,可以取得很好的诊断效果。
1 模糊核聚类算法理论
模糊核聚类FKCM(fuzzy kernel C-means)与模糊聚类的区别是:通过引进支持向量机的核方法思想来对样本数据的特征进行优化,把原来的样本模式空间映射到更高维特征空间中去,然后在此空间中设计学习算法。这样做能够突出不同类别样本特征的差异,大大提高了聚类的准确性及算法收敛速度。
核方法是一种非线性数据处理方法,通过某一非线性函数,把原始数据映射到更高维特征中间。例如,原始数据样本xi∈Rp(i=1,2,…,p),通过某核函数φ(X→Y)映射到某一特征空间H,得φ(x1),φ(x2),…,φ(xp),那么映射后的输入空间的点积形式,在特征空间就可用Mercer核描述为
式中,K(xi,xj)为输入是任意两个样本xi,xj时的核函数值。所有的样本两两点积组成一个核函数矩阵。引入核函数后,在问题求解过程中无需探求非线性函数的具体形式,只需关心这个核函数矩阵。
设X={x1,x2,…,xn}∈Rs为待分类的n个样本,s为样本特征维数,c(2≤c≤n)为样本分类数。V={v1,v2,…,vc}为各个聚类中心,U=(μik)c×n为模糊划分矩阵,μik为第k个样本xk对第i类的隶属度。聚类过程可归结为对聚类准则函数的优化问题,最终获得样本集合X的聚类中心矩阵V和模糊划分矩阵U。在特征空间H中,聚类目标函数可以表示为
式中:K(xk,xk)为输入同是第k个样本向量xk的核函数值;K(vi,v)i为输入同是第i个聚类中心向量vi的核函数值;K(xk,v)i为输入是第k个样本向量xk与第i个聚类中心向量vi核函数值;为μik的m次方,m为加权指数(一般取为2)。
FKCM聚类的准则是求式(2)目标函数的极小值。根据Lagrange乘子寻优法,得到隶属度和聚类中心的迭代公式为
式中:K(xk,vj)是第k个样本向量xk与任一聚类中心向量vj核函数值;K(vj,vj)是输入同为任一聚类中心向量vj核函数值。
FKCM算法的具体计算步骤如下。
步骤1给定聚类类别数c,加权指数m,选择核函数及其参数,设定迭代停止阈值ε,初始化聚类中心V(0),设置迭代计数器b=0;
步骤2用式(3)计算更新聚类中心V(b);
步骤3用式(4)计算更新模糊划分矩阵U(b+1);
步骤4如果||V(b+1)-V(b)||<ε,则算法停止并输出模糊聚类矩阵U和聚类中心矩阵V,否则令b=b+1,转向步骤2。
由于FKCM是基于局部搜索的迭代爬山法,算法往往会陷入局部最优解,同时受初始聚类中心影响较大,特别是在聚类数较大的情况下,不同的初始聚类中心会产生迥然不同的聚类结果,因此需要进一步改进。
2 基于人工免疫的模糊聚类算法理论
与人工神经网络、进化计算和群集智能算法一样,人工免疫系统也是受自然界中生物的信息处理机制启发而发展起来的智能计算方法,具有分布式、自学习、自适应、自组织和鲁棒性等优良特性,同时具有强大的信息处理和问题求解能力。本文将基于克隆选择原理和亲和力成熟的免疫克隆算法与模糊核聚类算法相结合,用免疫克隆选择算法优化FKCM的目标函数,得到一种新的基于人工免疫的模糊核聚类算法,即AI-FKCM。
AI-FKCM是基于免疫机理,将待分类的数据对象视为抗原(Ag),把聚类中心看作抗体(Ab)。数据对象的聚类过程即免疫系统不断产生抗体,识别抗原,最终产生出可以捕获抗原的最佳抗体过程,其主要包括抗体选择、克隆、超变异及再选择等操作,求解问题的具体步骤如下。
步骤1抗原识别及抗体编码。将待分类的数据样本作为抗原,对抗体-聚类中心矩阵进行编码,根据各自取值范围,将其量化值编码成二进制基因串;
步骤2初始化参数。初始化群体规模、最大迭代代数、交叉概率、变异概率等参数,随机产生一组聚类中心作为初始抗体群V;
步骤3亲和度计算。用式(2)来构造亲和度A。若选择的核函数为高斯核函数,有K(xi,xi)=1,且有
式中,η为给定常数。这样也就达到了亲和力最大时,目标函数JH最小。
步骤4迭代终止判断。通过设定迭代次数阈值及亲和力阈值,若满足则终止迭代,确定当前种群中的最佳个体为算法的最优解,否则继续。
步骤5选择种群个体。个体按亲和度大小排列,选择前n个高亲和度个体V。
步骤6种群克隆。对群体中的n个个体进行复制,生成一个临时克隆群体P,每个个体的复制规模根据抗原与抗体的亲和度大小按比例分配。
步骤7种群变异。对群体P以高频变异模式进行变异操作,使高频变异与抗体亲和力成比例,得到成熟的抗体群P*。
步骤8种群记忆。计算P*中个体的亲和力,亲和力高的保留以组成记忆集合,并替换V群体中同数目亲和力低的个体,维持抗体的多样性。
步骤9循环。t→t+1,返回步骤4。
通过上述步骤,可以看到AI-FKCM算法具有高度并行性快速搜索功能,通过对亲和度最高的抗体和抗原的选择、克隆(步骤5、6)以及对克隆抗体群的高频变异及记忆(步骤8、9),改善了抗体亲和度,维持了抗体的多样性,减少对聚类中心的原始特征信息的依赖,极大的提高了聚类性能。
3 人工免疫优化模糊核聚类算法的电力变压器DGA分析
油中溶解气体分析法(DGA)是变压器内部故障诊断的极为有效的方法。故障时特征气体的含量和组成与变压器的故障类型有非常重要的非线性对应关系。由于变压器故障类型、故障原因、故障现象的复杂性、随机性和模糊性,模糊核聚类被引入该领域,它通过模糊核聚类把气体特征接近的样本聚集到一类中,不同类的气体特征尽可能的区别开来,来实现故障诊断。但基于模糊核聚类故障诊断法由于对初值敏感及易陷入局部极值点的问题,诊断精度较低。本文引入人工免疫来优化模糊核聚类,该算法将基于克隆选择原理和亲和力成熟的免疫克隆算法与模糊核聚类算法相结合,采用群体搜索策略,将待分类的数据对象视为抗原(Ag),把聚类中心看作抗体(Ab),通过免疫系统不断产生抗体,识别抗原,来优化FKCM的目标函数,能快速地获得全局最优解,从而实现较高的诊断精度。
3.1 确定故障特征量及故障分类
变压器在故障情况下会分解出甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、氢气(H2)、一氧化碳(CO)、二氧化碳(CO2)等特征气体。表1列出了不同的故障类型所对应的主要特征气体和次要特征气体。由于CO和CO2含量主要是反映固体绝缘的问题,对判断过热和放电故障不明显,故选择CH4、C2H6、C2H4、C2H2、H25个特征向量的浓度作为故障特征量。
由于各原始数据差异较大,如果直接利用原始数据进行计算,不能反映气体之间相互作用的关系,且数据量纲变化范围太大,因此,本文采用规格化处理,即
表1 变压器故障与特征气体的关系Tab.1 Relation between transformer fault and characteristic gasses
式中:xi为原始的气体浓度;xmax、xmin分别为每一样本5类气体浓度最大值及最小值;xi′为规格化处理后的数据。
一般来说,在变压器故障诊断中,变压器的故障类型可以分为低温过热LT(t<300℃)、中温过热MT(300℃
3.2 AI-FKCM电力变压器DGA分析步骤
步骤1数据样本处理。按照以上确定的5种故障特征气体,搜集故障样本,并利用式(7)规格化处理,再将预处理后的数据样本xi∈Rp(i=1,2,…,p),通过某核函数φ(X→Y)映射到某一特征空间。
步骤2确定聚类的类数。根据以上对变压器故障类型的分析,本文拟定聚类数为6。
步骤3亲和度计算。根据式(5)构造聚类目标函数,应用式(6)计算抗体与抗原的亲和度。
步骤4计算最优FKCM目标函数。应用人工免疫的并行搜索功能,通过抗体选择、克隆、超变异及再选择等操作,来计算最优抗体与抗原亲和度,也就间接得到了最优FKCM目标函数。
步骤5故障分类。通过以上最优FKCM目标函数的获得,同时可计算出最优聚类中心矩阵及隶属度矩阵,从而实现故障的分类。
3.3 实例仿真分析
本文搜集了265个故障样本,选择其中的140个作为训练样本,其余的125个作为测试样本。选用高斯核函数来对样本特征进行优化,将待分类的故障样本视为抗原(Ag),把聚类中心看作抗体(Ab),模拟生物学抗体克隆选择机理和亲和度成熟过程,应用群体搜索策略,实现以概率1收敛到聚类目标函数最优解,达到故障诊断的目的。具体参数设置如下:高斯核宽σ2=0.35,加权指数m为2,初始化抗体数为35,最佳抗体选择数为6,抗体克隆规模为15,抗体变异率为0.02,选择比率为0.1,抗体死亡阈值为0.8,抑制阈值为0.15,迭代次数为200,抗体亲和度用式(6)来表示(其中η取0.001),保证抗体亲和度愈大对应的聚类目标函数愈小,经抗体选择、克隆、超变异及再选择等操作来获得亲和度的尽可能大,实现最优聚类。最后对测试样本进行测试,得出总故障诊断准确率为92.8%,详见表2。由表2可看出此法在低温过热与低能放电故障诊断中的准确率相对较低,但总体的诊断精度非常高,证明了本文方法对类似变压器故障诊断这类非线性映射问题的优越性。
表2 变压器故障诊断准确率表Tab.2 Diagnosis accuracy of transformer fault
表3列出了8组基于人工免疫优化模糊聚类算法的电力变压器故障诊断实例。从本算法与改良三比值法诊断结果对比可看出,本算法准确地对这8组故障类型做了判断,而三比值法出现1个误判和2个无法判断的情况,证明了本算法在变压器故障诊断上的可行性、优越性和准确性。
表3 8组变压器故障诊断实例表Tab.3 Eight samples of fault diagnosis for power transformer
4 结语
本文提出了一种基于人工免疫的模糊核聚类新算法应用于变压器故障诊断。本算法通过引入支持向量机核方法思想对样本特征进行优化,并将免疫克隆算法的全局并行搜索与FKCM算法的局部搜索相结合,能以较大概率快速获得全局最优解,且不易陷入局部极值点,具有较高的搜索效率,明显改善了聚类性能。通过工程数据仿真验证了该方法在变压器故障诊断上的可行性和有效性。
[1]Castro A R G,Miranda V.Knowledge discovery in neural networks with application to transformer failure diagnosis[J].IEEE Trans on Power Systems,2005,20(2):717-724.
[2]宋功益,郭清淘,涂福荣,等(Song Gongyi,Guo Qingtao,Tu Furong,et al).模糊贝叶斯网的变压器故障诊断(Novel method for transformer fault diagnosis based on theory of fuzzy Bayesian networks)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2012,24(2):102-106.
[3]任静,黄家栋(Ren Jing,Huang Jiadong).基于免疫RBF神经网络的变压器故障诊断(Transformer fault diagnosis based on immune RBF neural network)[J].电力系统保护与控制(Power System Protection and Control),2010,38(11):6-14.
[4]柳纲,郭基伟,唐国庆(Liu Gang,Guo Jiwei,Tang Guoqing).基于灰色位势理论的变压器故障诊断算法(New method of fault diagnosis in transformer based on grey potential energy theory)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2004,16(2):54-57.
[5]费胜巍,苗玉彬,刘成良,等(Fei Shengwei,Miao Yubin,Liu Chengliang,et al).基于粒子群优化支持向量机的变压器故障诊断(Fault diagnosis of transformer based on particle swarm optimization-based support vector machine)[J].高电压技术(High Voltage Engineering),2009,35(3):509-513.
[6]Lin C E,Ling J-M,Huang C-L.An expert system for transformer fault diagnosis using dissolved gas analysis[J].IEEETranson Power Delivery,1993,8(1):231-238.
[7]钱政,黄兰,严璋,等(Qian Zheng,Huang Lan,Yan Zhang,et al).集成模糊数学与范例推理的变压器故障诊断方法(A fault diagnosis method for power transformer integrating fuzzy theory with case-based reasoning)[J].电网技术(Power System Technology),2001,25(9):24-27.
[8]宋斌,于萍,廖冬梅,等(Song Bin,Yu Ping,Liao Dongmei,et al).变压器故障诊断中溶解气体的模糊聚类分析(Fuzzy set analysis of dissolved gas applied to fault diagnosis of power transformer)[J].高电压技术(High Voltage Engineering),2001,27(3):69-71.
[9]杨廷方,刘沛,李景禄,等(Yang Tingfang,Liu Pei,Li Jinglu,et al).FCM结合IEC三比值法诊断变压器故障(New fault diagnosis method of power transformer by combination of FCM and IEC three-ratio method)[J].高电压技术(High Voltage Engineering),2007,33(8):66-70.
[10]李俭,孙才新,陈伟根,等(Li Jian,Sun Caixin,Chen Weigen,et al).灰色聚类与模糊聚类集成诊断变压器内部故障的方法研究(Amethod of synthesis based on the grey cluster and fuzzy cluster about internal fault diagnosis of transformer)[J].中国电机工程学报(Proceedings of the CSEE),2003,23(2):112-115.
[11]田质广,张慧芬(Tian Zhiguang,Zhang Huifen).基于遗传聚类算法的油中溶解气体分析电力变压器故障诊断(Dissolved gas analysis based on GA and FCM for power transformer fault diagnosis)[J].电力自动化设备(Electric Power Automation Equipment),2008,28(2):15-18.
[12]符杨,田振宁,江玉蓉,等(Fu Yang,Tian Zhenning,Jiang Yurong,et al).加权模糊核聚类法在电力变压器故障诊断中的应用(Power transformer fault diagnosis using weighted fuzzy kernel clustering)[J].高电压技术(High Voltage Engineering),2010,36(2):371-374.
[13]宋绍民,王耀南,孙炜,等(Song Shaomin,Wang Yaonan,SunWei,et al).基于免疫聚类算法的变压器DGA数据故障诊断方法(Fault diagnosis method with transformer DGA data based on immune recognition algorithm)[J].变压器(Transformer),2008,45(8):70-72.
[14]符杨,曹望舒,郑小霞(Fu Yang,Cao Wangshu,Zheng Xiaoxia).基于人工免疫方法的变压器故障诊断(Artificial immune algorithm for fault diagnosis of power transformer)[J].上海电力学院学报(Journalof ShanghaiUniversity of Electric Power),2011,27(6):559-562.
[15]韩富春,高文军,廉建鑫,等(Han Fuchun,GaoWenjun,Lian Jianxin,et al).基于免疫优化多分类SVM的变压器故障诊断新方法(A novel approach based on multi class support vector machine of immune optimization for transformer fault diagnosis)[J].电力系统保护与控制(Power System Protection and Control),2012,40(2):106-110.