基于多种机器学习算法的变压器故障诊断方法研究
2024-12-05程荣森
摘要:近几年,对于变压器故障诊断的研究逐渐增加,提高其诊断准确率具有明确的价值。以往常用的诊断方法虽然具有一定准确率,但效率较低,缺乏时效性。随着对于机器学习的相关研究不断深入,其在变压器故障诊断中的应用逐渐被发现。基于机器学习,分别在K邻近(K-NearestNeighbors,KNN)算法、决策树(DecisionTree,DT)算法、支持向量机(SupportVectorMachine,SVM)算法3方面搭建了诊断模型,并进行了纵横交叉优化(CrisscrossOptimization,CSO)算法的超参数优化模型搭建。最后,经过仿真实验验证可知,经CSO优化后,3种诊断模型的准确率和平均诊断时间均得到了有效提高。
关键词:机器学习变压器故障诊断优化模型
ResearchonTtransformerFaultDiagnosisMethodBasedonMultipleMachineLearningAlgorithms
CHENGRongsen
XinyangAgricultureandForestryUniversity,Xinyang,He’nanProvince,464000China
Abstract:Inrecentyears,researchontransformerfaultdiagnosishasgraduallyincreased,andimprovingitsdiagnosticaccuracyhasclearvalue.Thecommonlyuseddiagnosticmethodsinthepasthaveacertainaccuracy,buttheirefficiencyislowandlacktimeliness.Withthecontinuousdeepeningofresearchonmachinelearning,itsapplicationintransformerfaultdiagnosisisgraduallybeingdiscovered.Thisarticlebuildsdiagnosticmodelsbasedonmachinelearninginthreeaspects:theK-NearestNeighbors(KNN)algorithm,theDecisionTree(DT)algorithm,andtheSupportVectorMachine(SVM)algorithm,andconstructsahyperparameteroptimizationmodelbyusingtheCrisscrossOptimization(CSO)algorithm.Finally,itwasverifiedthroughsimulationexperimentsthattheaccuracyandaveragediagnostictimeofthethreediagnosticmodelswereeffectivelyimprovedafterCSOoptimization.
KeyWords:Machinelearning;Transformer;Faultdiagnosis;Optimizationmodel
目前来说,变压器故障诊断方法主要有三比值法、三查法、特征气体法等,但也存在故障诊断效率不高、诊断实时性不强等问题。机器学习被认为是目前实现人工智能最为可行的方法,将其应用于变压器故障诊断中,对于加强变压器故障诊断准确率有着极为重要的现实意义。
1变压器故障类型
1.1变压器热性故障
变压器热性故障是由温度异常升高引起的故障类型,通常是由绝缘材料老化、过载运行或冷却系统失效等原因导致。按照过热位置温度,可将变压器热性故障分成3种类型,如表1所示。
1.1.1低温过热
低温过热通常发生在过热位置温度不超过500℃(t≤500℃)的情况下,此类故障多由绝缘油老化、轻微过载或冷却系统部分失效引起[1]。低温过热虽然不会立即导致变压器的严重损坏,但长期运行可能加速绝缘材料的老化,影响变压器的使用寿命。对于低温过热故障的诊断,常用的技术包括油中溶解气体分析和局部放电检测。
1.1.2中温过热
中温过热发生在过热位置温度大于500℃且小于等于800℃的情况下(500℃<t≤800℃),通常由较严重的过载运行、绝缘材料老化程度较高或冷却系统效率显著下降引起。
1.1.3高温过热
高温过热是指过热位置温度超过800℃(t>800℃)的情况,这种故障通常由严重的过载运行、大面积绝缘损坏或冷却系统完全失效引起。高温过热会导致绝缘材料快速分解,可能引发严重的电气故障甚至火灾。
1.2变压器电性故障
变压器电性故障主要是在高电压作用下,绝缘材料在劣化情况下发生的击穿放电现象。从化学机理的角度来看,变压器的电性故障与热故障的机理基本相同,都是由于化学键的断裂和重新结合所导致。然而,电性故障和热故障在能量形式和表现特征上存在显著差异。具体来说,在电性故障过程中,高电压导致的电场作用会使绝缘材料中的分子键发生断裂,形成自由基和离子,这些带电粒子在电场作用下迅速运动并引发进一步的分解反应,最终导致绝缘材料的击穿和放电。而在热故障过程中,主要是由于过高的温度引起绝缘材料的热分解,导致分子结构的变化和劣化。
在不同类型的故障情况下,变压器产生的典型故障特征成分和速率也会有所不同。在不同故障类型下,故障气体的相对含量和生成规律也有所不同,这为变压器故障诊断提供了重要的依据[2]。根据放电故障强度,将变压器电性故障分为以下3类,如表2所示。
2基于机器学习的变压器故障诊断方法
无论是热故障还是其他常见故障,传统的诊断方法在变压器故障检测中往往存在准确率低和实时性差的问题。针对这一情况,本文提出了基于机器学习的变压器故障诊断方法,研究了K近邻(K-NearestNeighbors,KNN)算法、决策树(DecisionTree,DT)算法和支持向量机(SupportVectorMachine,SVM)算法3种机器学习算法在变压器故障诊断中的应用,以提高变压器故障诊断的准确性和实时性。
2.1K近邻算法
KNN算法是一种简单且直观的监督学习算法,被广泛用于分类和回归任务。其基本原理是通过计算待分类样本与训练集中所有样本的距离,选择距离最近的K个样本(邻居),然后根据这些邻居的类别或数值进行预测。KNN算法具有无需训练过程、实现简单、效果直观的优点,但在面对高维数据或样本量较大时,计算复杂度和存储需求较高。为了提高效率,常使用KD树、球树等数据结构进行优化。
在本文中,在m个特征向量的特征矩阵可设为:
其中n维特征向量为:
对应m个样本的标签为:
而对于样本点之间的距离可采取Minkowskidistance定义,则二者间的距离定义为
式中:a表示为该算法的超参数,a≥1。如果a数值处于2时,则确定欧式距离,即:
由于KNN算法在计算各特征间的距离时需要保持相同的权重,所以,为了保证每个特征的计算距离一致,必须对每个特征进行归一化处理,以消除数据的量纲差异。
2.2决策树算法
DT算法是一种常用的监督学习算法,适用于分类和回归任务。它通过构建树状模型来进行决策,使数据可以被逐层细化并归类。DT的每个节点代表一个特征或属性,每个分支代表该特征的一个可能值,叶节点则代表最终的预测结果或类别。DT的构建过程涉及选择最优特征进行数据分割,以最大程度地减少数据的不纯度。
DT的优点包括易于理解和解释、不需要数据归一化、能够处理多类别数据及在处理大型数据集时的高效性。然而,DT也存在一些缺点,如容易过拟合、对数据噪声敏感及在数据维度较高时表现较差。因此,为了克服以上缺点,本次使用剪枝技术来简化树结构。
2.3支持向量机算法
SVM算法是一种经典的二分类机器学习算法,其核心思想是寻找一个最优超平面作为决策边界,使决策边界与两类最近的样本点之间的距离最大化,从而提高模型的泛化能力。距离决策边界最近的这些样本点被称为支持向量,各样本点到决策超平面的距离表示为d[3]。则,假设样本点线性可分,如图1所示。
使用n维空间中的距离计算公式,将图1中支持向量的样本点x到决策超平面的距离表示为
式中,为权重w的膜,b为超平面截距,可定义为
按照这一定义,可以将图1中决策边界上方的样本点标记为y=1,下方的样本点标记为y=-1,因此,所有样本点xi与决策边界的距离必然大于d,简化后,可得到。综上,结合SVM算法核心思想,列出以下有条件最优化问题:
在结合上述优化目标函数的基础上,SVM算法的首要任务是确保决策超平面可以完全区分两类特征样本,然而,这样会限制模型的泛化能力。为了解决这一问题,以及处理数据样本的线性可分性,可以通过求解拉格朗日对偶问题来优化目标函数,转化为以下形式:
优化后,公式大大增加了数据点线性可分概率。在SVM算法中,常用函数包括有限性核函数、多项式核函数与高斯核函数。在使用高斯核函数时,y与C作为模型超参数,可使用智能优化算法解决。
3仿真结果分析
通过利用CSO算法对这3种机器学习算法的超参数进行优化,并通过仿真实验验证了这些优化模型的有效性[4]。在使用CSO算法对原模型进行优化前,可借助实例化模型将训练数据集平均划分为5份,计算这5份验证集的平均误差,并轮流使用,得到的差异值与实验数值作为实验度函数。在仿真实验中,分别建立了KNN算法、DT算法、SVM算法变压器故障诊断模型,并与传统三比值法的诊断准确率进行对比,得到F1分数对比,如表3所示。
由表3可知,基于机器学习的3种模型在故障诊断准确率和F1分数方面明显优于传统的三比值法。其中,DT算法模型的诊断准确率最高,比三比值法高出9.53%;在F1分数方面,3种机器学习模型均显著提升,约提高了30%。这些数据表明,与三比值法相比,基于机器学习的3种模型在不同评价指标下均表现出更优越的故障诊断性能[5]。
4结论
本文基于机器学习算法构建了KNN算法、DT算法和SVM算法3种变压器故障诊断模型,通过理论研究与仿真实验,得出以下结论。为了应对传统变压器诊断准确率低、实时性差的问题,本文提出了一种基于机器学习的故障诊断模型。仿真实验表明,这些模型具有较高的诊断精度和快速的诊断速度,能够有效满足实际工程需求。此外,针对机器学习算法在特征稳定性和提取能力方面的不足,本文采用CSO算法对3种模型进行了优化,优化后的变压器故障诊断模型在诊断准确率和F1分数方面均有显著提升。
参考文献:
[1]李强,张睿智,范晓丹,等.基于特征气体和比值准则的RAPO植物油变压器故障诊断方法[J].高压电器,2023,59(9):294-303.
[2]刘国柱.基于自注意力机制与1D-CNN的变压器故障诊断方法[J/OL].重庆工商大学学报(自然科学版),1-8[2024-05-28].http://kns.cnki.net/kcms/detail/50.1155.N.20230726.1802.006.html.
[3]王爽,罗倩,唐波,等.考虑样本类内不平衡的CHPOA-DBN变压器故障诊断方法[J].中国电力,2023,56(10):133-144.
[4]万可力,马宏忠,崔佳嘉,等.基于Mel-GADF与ConvNeXt-T的变压器铁心松动故障诊断方法[J].电力自动化设备,2024,44(3):217-224.
[5]宋辉,苑龙祥,郭双权.基于数据增强和特征注意力机制的灰狼优化算法-优化残差神经网络变压器故障诊断方法[J].现代电力,2024,41(2):392-400.