基于IGA优化SVM的变压器故障诊断
2022-01-03李启迪黄治翰
李启迪,黄治翰,汪 晗,刘 闯
(1.国网湖北省电力有限公司荆门供电公司,湖北 荆门 448000; 2.国网湖北省电力有限公司鄂州供电公司,湖北 鄂州 436000)
0 引 言
随着经济的快速发展,中国电网结构日益复杂,变压器是电力系统的核心设备,承担着电力交换和能量传输的重要角色,保障变压器安全稳定运行尤为重要[1]。大型变压器结构复杂,安全隐患较多且不易发现,如何快速准确地找出变压器的潜在隐患,建立有效的数学模型,提高变压器故障诊断工作的准确性,对于制定科学合理的检修计划和减少变压器的非计划停运,具有非常重要的意义。
目前,变压器故障诊断已成为研究的热点,针对变压器故障诊断方法,专家学者们提出了不同的观点。文献[2]将遗传算法的惯性权重因子、变异算子引入标准粒子群算法,对标准粒子群算法进行改进,并用改进粒子群算法对小波神经网络进行优化,建立了变压器诊断模型,仿真结果表明,该方法提高了变压器故障诊断的精度。文献[3]采用差分进化算法对BP(back propagation)神经网络的权值和阈值进行优化,利用优化后的BP神经网络对变压器进行了故障诊断,取得了较好的诊断结果。但神经网络对样本容量的要求较高,通常样本容量越大,神经网络的应用效果越好。对于小样本数据,支持向量机(support vector machine,SVM)的优势更明显,文献[4]提出了一种采用帝国殖民竞争算法优化SVM的变压器故障诊断方法,该方法虽然得到了一定的应用,但计算精度有待进一步提高。文献[5]对变压器油中溶解气体的特征量进行优选后建立了基于遗传算法(genetic algorithm,GA)优化SVM的变压器故障诊断模型,提高了变压器故障诊断的精度,但由于遗传算法存在早熟及不收敛的现象,因此SVM的参数寻优方法还有待进一步改进。
针对现有变压器诊断方法中存在的不足,采用改进遗传算法对SVM的惩罚因子和径向基核函数参数进行优化,以变压器油中溶解气体成分为输入量,故障类型编码为输出量,建立基于改进遗传算法优化SVM的变压器故障诊断模型,并用算例分析验证所提变压器诊断方法的正确性。
1 算法介绍
1.1 支持向量机
20世纪90年代,数学家Vapnik在统计学理论的基础上提出了一种新的机器学习方法——SVM,SVM的思想是将低维空间中的样本映射到高维空间,在高维空间构造最优超平面,完成对样本的分类和回归[6]。
SVM最初的目的是解决二分类问题,而变压器故障诊断属于典型的多分类问题,因此需要将该多分类问题分解为多个二分类SVM问题。1-v-1多分类SVM的中心思想是把任意两类数据在1个子分类器中进行训练,此时类别数目为n的样本需要构造n(n-1)/2个SVM子分类器,每个子分类器的训练数据只来自与之相关的两类,测试时,测试数据分别带入n(n-1)/2个SVM 子分类器中进行测试,并对各类别的得分进行统计,得分最高的那一类即为测试数据所属的类别。
1-v-1多分类SVM的优点是训练速度快;缺点是当样本的类别数目较多时,子分类器数量迅速增加导致计算时间过长,降低分类精度。变压器故障类别通常分为高温过热、中温过热、低温过热、高能放电和低能放电等5种,即决策属性数量为5,数量相对较少,只需要构造10个子分类器,不会增加太多计算量,也能保证正确率,因此采用1-v-1多分类SVM进行变压器故障诊断。
1.2 改进遗传算法
遗传算法是一种常用的优化算法,其实质是模拟生物遗传进化[7]。在算法进化初期,由于初始种群是随机给定的,初始种群可能存在少量适应度较好的个体,这些个体在GA进化过程中可能会被重复选择,导致它们的子代在进化后的种群中占据了主导地位,经过交叉和变异后,得到的后代仍与父本相同或相近,从而使GA出现早熟的现象。在算法进化后期,种群中个体的适应度值相对稳定,相互之间的多样性大大降低,导致算法收敛缓慢甚至不收敛。为了避免出现早熟和不收敛的现象,对GA的交叉概率和突变概率进行动态设定,形成改进遗传算法(improved genetic algorithm,IGA),IGA的交叉概率和突变概率的设定方法如下:
(1)
(2)
式中:pc为交叉概率,pc,min为突变概率的最小值,fi为个体i的适应度值,favg为种群中所有个体的平均适应度值,N为种群容量,pc,a为交叉概率调节参数,pm为突变概率,pm,max为突变概率的最大值,pm,a为突变概率调节参数。
在进化初期,种群中个体适应度较差,个体之间差距不大,IGA通过增大交叉概率,使优秀个体能够尽快显示出来,缩小最优解的搜索范围;相反在进化后期,种群中个体适应度普遍较好,相互之间差异不大,IGA通过增大突变概率,增强种群局部搜索能力,快速找到最优解,加快算法收敛。
2 变压器故障诊断模型
研究表明,SVM具有所需样本少、分类效果好等优点,但其计算精度受惩罚参数C和径向基核函数宽度σ的影响很大,采用交叉验证获取最优参数的计算量太大,因此采用IGA对SVM的C和σ进行优化,建立基于IGA优化SVM的变压器故障诊断模型,对变压器进行故障诊断。
根据1-v-1多分类SVM原理,以油中溶解气体成分为输入量,故障类型编码为输出量,建立变压器故障诊断模型,建模流程如图1所示,具体建模步骤如下:
1)对样本数据进行归一化,以减小数据之间量纲的影响,公式为
(3)
式中:xi为某一特征量;xmax为该特征量的最大值;xmin为该特征量的最小值。
2)对IGA的相关参数进行初始化,确定编码方式、种群规模、突变概率最小值、交叉概率最大值及最大迭代次数。
3)对SVM的相关参数进行初始化,设置C和σ的初始值和搜索范围。
4)在C和σ的搜索范围内,利用IGA展开搜索,然后把初始解分别带入各SVM故障诊断模型中,计算初始解的诊断正确率,即初始适应度值。诊断正确率(适应度值)的计算式为
(4)
式中:χj为第j类故障的故障率;pj为第j类故障的样本总量;qj为第j类故障诊断错误的样本个数。
5)执行迭代过程,每完成一次迭代,根据式(4)计算适应度值,判断个体适应度值是否满足迭代终止条件,若已达到最大迭代次数,则解码获得适应度值对应的最优个体;否则,继续迭代。
6)执行选择、交叉和突变等操作,产生新一代种群,返回步骤5),重新执行迭代。
7)判断迭代后的结果能否满足寻优及迭代次数的要求,若是,则结束计算,输出最优适应度值对应的C和σ即为全局最优解;否则,返回步骤5)。
8)将步骤7)中的全局最优解赋值给SVM变压器故障诊断模型,即可对变压器进行故障诊断。
图1 IGA优化SVM的变压器故障诊断流程
3 仿真分析
变压器发生故障时,其绝缘油中会溶解一定量的H2、CH4、C2H6、C2H4和C2H2等气体,可以根据绝缘油中溶解气体的含量对变压器故障类型进行判断。该文收集了100组运行条件和容量相同变压器油中溶解气体数据及相应的故障类型(高温过热、中温过热、低温过热、高能放电和低能放电各20组),部分数据如表1所示。将100样本数据划分为测试集和训练集,训练集数据用于模型训练,测试集数据用于检验模型的分类精度,训练集和测试集的样本容量均为50,训练集和测试集各有10组不同故障类型的样本。为了便于计算,对变压器的5种故障类型进行编码,具体如表2所示。
表1 变压器故障数据
表2 变压器故障类型编码
在Matlab软件中进行仿真分析,利用训练集数据进行训练,分别采用GA和IGA对SVM的惩罚因子C和径向基核函数参数σ进行参数寻优,设置C的寻优范围为[1,100],σ的寻优范围设置为[0,1],C和σ的初值分别设置为100和1。IGA参数设置如下:种群规模为30,突变概率最小值为0.5,交叉概率最大值为0.05,最大迭代次数kmax=30。GA参数设置如下:突变概率为0.7、交叉概率为0.04,其他参数与IGA相同。IGA与GA迭代寻优过程如图2所示,由图2可知,相比GA,IGA找到全局最优解所需的迭代次数更少、计算精度更高。
图2 改进PSO与PSO算法迭代寻优过程
2种算法找到最优解需要的迭代次数、最大适应度值及收敛时间如表3所示。
表3 2种算法寻优结果对比
由表3可知,IGA只需12次迭代就找到了全局最优解,最大适应度值为0.98,收敛时间为4.92×10-3s,均优于GA。由此可见,改进遗传算法能够有效减少迭代次数,加快算法收敛,提高计算精度。
利用训练好的IGA-SVM变压器故障诊断模型和GA-SVM变压器故障诊断模型分别对测试集数据进行故障诊断,IGA-SVM模型和GA-SVM模型的诊断结果分别如图3和图4所示,2种方法故障诊断结果的正确率如表4所示。
图3 IGA-SVM故障诊断模型诊断结果
综合分析图3、图4和表4可知,IGA-SVM变压器故障诊断模型的诊断结果存在2个错误,一个是将中温过热误诊断为低温过热,另一个是将低温过热误诊断为中温过热。中温过热和低温过热诊断正确率为90%,其余故障类型诊断正确率均为100%,综合正确率为96%。出现误诊断的原因可能是这两组气体成分可能处于中温过热和低温过热边界条件的附近,造成误判。而GA-SVM变压器故障诊断模型的诊断结果共有7个错误,5种故障类型的诊断正确率依次为90%、80%、90%、80%和90%,综合正确率仅为86%。诊断错误的原因除了边界条件外,最大的可能是GA在寻优过程中容易陷入局部极值。由此可见,IGA优化的SVM变压器故障诊断模型的诊断效果更好、分类正确率更高。
图4 GA-SVM故障诊断模型诊断结果
表4 2种方法故障诊断结果的正确率
4 结 语
采用动态设定交叉、突变概率的方式对遗传算法进行改进,以提高算法的收敛速度和计算精度。应用改进遗传算法对SVM的惩罚因子和径向基核函数参数进行优化,以变压器油中溶解气体成分为输入量,故障类型编码为输出量,建立了基于IGA-SVM的变压器故障诊断模型。采用实际变压器故障数据进行仿真分析,结果表明,IGA-SVM模型诊断结果综合正确率高达96%,验证了模型的正确性和实用性。