基于随机森林和三比值法的高铁牵引变压器故障诊断研究
2022-12-29翟陆琦
翟陆琦
(中国铁路南宁局集团有限公司南宁供电段,广西 南宁 350001)
铁路作为我国大宗货物运输和旅客运输的主要方式,在近十多年来发展规模和技术水平都得到了突飞猛进的发展。截至2021年底,我国铁路总营业里程已经突破15万公里,其中高速铁路超过4万公里。高速铁路以更高的运行速度和安全性对各个系统提出了新的技术要求,其中高速铁路牵引供电系统直接为高速电力动车组提供电能,其工作性能及稳定性直接关系到高速动车组运行的准时及旅客的安全。对于高速铁路牵引供电系统的日常维护与检修工作,在确保牵引供电系统安全正常工作的前提下,如何通过改革维修方式降低维护成本成为近几年研究的热点问题。
在高速铁路供电系统各组成部分中,变压器是最为重要的核心设备之一。牵引变压器的一次侧为三相绕组连接结构,二次侧为两个单相绕组结构,将高压母线的三相电转化为上下两路单相电为高速动车组提供电能。牵引变压器的工作负荷随所在供电区间的动车组数量及运行状态决定,供电负荷大且变化剧烈,容易造成牵引变压器故障[1]。在变压器的各种故障当中,其绕组绝缘故障尤为突出,变压器的绝缘故障主要包括绕组的匝间绝缘故障、绕组的相间短路及绕组的对地短路故障。如果能够在变压器绕组绝缘故障早期对故障进行准确检测和定位,可以避免故障程度进一步扩展,防止早期微弱的匝间短路故障发展为相间短路或对地短路故障。
近几年来,为了能够准确和可靠地对高铁牵引变压器进行故障诊断,诸多基于DGA(溶解气体分析)和机器学习算法的故障诊断方法已经被提出。通过模糊C均值算法来优化RBF(径向基神经网络)的中心向量等超参数,利用PSO(粒子群算法)选择最优的RBF神经网络初始化参数,该方法可以对牵引变压器的故障进行有效检测[2]。应用罗杰斯比值法将变压器的故障模式分为12种,采用PSO优化的SVM(支持向量机)的网络结构,实验表明该网络结构可以有效区分变压器的12种故障模式[3]。通过对DGA成分进行在线检测和分析,结合模糊三比值法对牵引变压器的绝缘故障进行诊断,该方法可以克服变压器的DGA结构与IEC编码不符及缺码问题,从而对牵引变压器的绝缘故障进行有效诊断[4]。利用一种嵌入SVM的BP神经网络结构,以变压器运行时油中溶解的气体之间的关系为特征,可以有效地提高变压器故障诊断准确度[5]。
1 三比值法
1.1 三比值法基本原理
高铁牵引供电变压器绝缘系统主要由变压器油、绝缘油纸、层压纸板等绝缘材料构成[6]。在变压器某种工作状态下,受变压器油温、绕组之间放电等因素影响,变压器油中会溶解绝缘材料裂解过程中产生的某些特定气体。变压器油中溶解的气体成分可以有效体现变压器运行状态及健康程度,通过对变压器油中溶解气体成分的监控和分析可以判断变压器的故障类型与故障程度。目前,对变压器故障诊断和监测主要采用对变压器工作过程中产生的气体色谱进行分析的三比值法。
随着变压器油温升高,变压器油裂解的主要烃类气体依次为CH4、C2H6、C2H4及C2H2,低温下变压器绝缘结构局部放电造成的离子撞击会产生H2。以CH4/H2、C2H6/CH4、C2H4/C2H6、C2H2/C2H4比值为依据的变压器故障诊断方法即为四比值方法,由于其中C2H6/CH4的比值只能反映较为有限范围温度气体的分解过程,因此IEC(国际电工委员会)推荐采用其余三种气体成分的比值作为变压器状态判断的依据,即为三比值法。表1为三比值法的编码规则[7]。
表1 三比值法编码规则
根据表1中三比值法的编码数值,在表2中可以找到此时对应的变压器工作状态,但三比值法也存在一定缺陷,在计算临界点数值时,无法得到唯一固定的数值,同时该编码方式也存在编码缺失问题[8]。
表2 三比值法故障类型判断
1.2 改良三比值法基本原理
改良三比值法是在基本的三比值法基础上改进和发展而来,该方法在判断故障性质、统一和细化故障类型、对不明确编码明确化等方面都进行了改进,增加了绕组层间、匝间短路和引线对地放电、分接开关围屏放电等具体故障类型。将基础三比值法110编码的高能密度局部放电统一化为电弧放电。基本三比值编码0→1→2及0→1的不确定编码,在改良三比值法中给了明确编码。
2 决策树与随机森林
2.1 决策树基本理论
决策树是按照自上向下的方法递归构建,由一个根节点、若干个分枝和叶子节点组成,根据使用样本特征将训练集划分为n个类别增长。决策树构建要确保选择训练集的最佳分割,由上一级分类的全体子集被分配给新节点;相同操作对每个节点重复,直到不再进行分割允许操作,终端节点由同一类样本组成[9];分类操作将样本通过一定算法分配到终节点(叶子节点),这些算法的典型代表为ID3算法、C4.5和CART算法。
2.2 随机森林
随机森林(RF)是基于决策树和Bagging的分类模型算法,可以看作是一组决策树分类器,是一种具有精度高,能够处理大量输入数据特征,并在分类过程中能够自动确定数据特征权重,有一定的数据异常特征值的容错能力,广泛用于基因分类、图像识别和其他分类。随机森林分类模型由n个决策树组成,其中每个决策树将对输入样本进行分类。随机森林对每个决策树的分类结果进行投票,投票最多的分类结果将是作为随机森林的最终分类结果[10]。
3 基于随机森林的牵引变压器故障诊断
3.1 故障诊断流程
基于三比值法和随机森林的高铁牵引变压器故障诊断流程如图1所示。首先,需要检测出牵引变压器油中的特定气体含量,通过三比值法计算获得故障特征来训练随机森林分类器;其次,将训练好的分类器对变压器某个状态下的三比值气体分量进行分类,判断变压器故障类型。
图1 故障诊断流程
3.2 不同牵引变压器故障诊断准确率比较
应用三比值法对变压器各种工作状态下气体含量进行计算,构成训练分类器的数据集。从表3可以看出,BP神经网络对变压器故障数据集分类的准确率为63.57%,SVM对变压器故障数据集分类的准确率为75.37%,决策树和随机森林的故障诊断准确率分别为74.52%和94.31%。上述结果可以说明,三比值法与随机森林相结合的牵引变压器故障诊断方法可以较好地对高速铁路供电牵引变压器故障进行诊断。
表3 不同诊断方法准确率
4 结论
本文主要为了解决高速铁路牵引供电系统变压器故障诊断问题,提出了以三比值法与随机森林相结合的故障诊断方法。该方法克服了三比值法和改良三比值法的诸多缺陷,与几种以经典智能分类算法为基础的故障诊断方法相比,可以较为准确地对高速铁路牵引变压器进行故障诊断,具有很高的实用价值。在当前高速铁路技术发展的要求下,需要对牵引变压器的故障诊断方法进行继续深入研究,以不断提高故障诊断的准确率、诊断速度和鲁棒性。