基于随机森林特征优选与MAEPSO-ELM算法的变压器DGA故障诊断

2022-05-13丁学辉许海林罗颖婷鄂盛龙

电力科学与技术学报 2022年2期

丁学辉，许海林，罗颖婷，杨鑫，鄂盛龙

(1.长沙理工大学电气与信息工程学院，湖南长沙 410114；2.广东电网有限责任公司电力科学研究院，广东广州 510080)

变压器承担着对电压的转换和对电能的分配，及时发现变压器内部潜在故障并准确诊断其故障类型对维护整个电网的安全运行与供电可靠性具有重要意义。

随着变压器油中溶解气体(DGA)在线监测技术不断发展，越来越多的基于DGA数据的人工智能算法被运用在变压器故障诊断领域并取得了不错的效果，如支持向量机、人工神经网络、贝叶斯分类器等[1]。这些智能算法克服了传统IEC三比值法分类边界过于绝对、反映故障类型与表现特征之间关联关系准确率不足的局限性[2]，但诊断模型训练效果差，难以满足实际工程运用需求。

近年来，极限学习机(extreme learning machine，ELM)以其学习速度快、泛化能力优良、分类准确率高等特点在变压器故障诊断领域运用广泛，然而ELM 对变压器故障分类时，随机产生的输入层权值和隐层阈值对故障诊断准确率会带来不良影响[3]。常用粒子群优化(particle swarm optimization，PSO)算法求解ELM参数[4]，但该算法在搜索过程中易导致群体多样性丧失、早熟、陷入局部最优。为此，本文利用多尺度协同变异的自适应粒子群优化(multi-scale cooperative mutatingly self-adaptive escape PSO,MAEPSO)算法对ELM参数进行优化，建立多尺度协同变异粒子群极限学习机(MAEPSO-ELM)变压器故障诊断模型。MAEPSO算法的多尺度高斯变异机制，能促使整个种群以尽量分散的变异尺度对解空间进行更加详尽的探索，在强化算法全局寻优能力的同时兼顾局部精细化探索的能力，找到适应值更高的参数以提高ELM的诊断效果。

此外，目前基于DGA和智能算法建立的诊断方法大部分采用H2、CH4、C2H2、C2H4、C2H6等主要特征气体及部分比值作为算法输入特征，在选择特征量时并没有充足的依据，而各种人工智能诊断方法会因为输入特征不同影响诊断结果[5]。文献[6]基于筛选器模式利用粗糙集方法对变压器故障输入特征进行约简；文献[7]基于封装器模式利用SVM分类准确率评估变压器故障输入特征并通过遗传算法搜索适应度最高的输入特征集。筛选器模式独立于后续的智能分类算法，选取的输入特征集准确度不高；封装器模式使用的智能搜索算法计算量大且需要提前设定输入特征维数。随机森林算法利用变量重要性评分(variable importance measure，VIM)值这一指标反映各输入特征对因变量变化所做贡献的重要性，在输入特征选择领域应用广泛[8]。本文拟利用随机森林算法计算候选特征集各特征重要性评分并降序排列，结合优化的ELM，基于序列前向选择法逐一添加VIM值最高的输入特征计算其分类准确率，由分类准确率最大确定最优输入特征。该方法相比筛选器模式和封装器模式，具有计算量小且无需提前设定特征个数并能给出各输入特征对故障分类影响程度的优点。

综上所述，本文基于变压器DGA数据及相关运算属性构建候选特征集，建立基于随机森林特征优选与MAEPSO-ELM算法的变压器故障诊断方法，通过实例验证所提方法的有效性与正确性。

1 基于随机森林的特征选择算法

随机森林算法是利用bootstrap重采样技术从原始样本中抽取多个样本，对每个采样得到的样本集建立决策树进行训练，然后组合多棵决策树投票得到最终分类结果的集成决策树算法，同时该算法能给出各输入变量重要性评分，广泛应用于特征选择场景[9]。随机森林算法对特征进行评估主要思想是通过对未参与决策树训练的袋外(out-of-bag,OOB)数据施加扰动，再计算预测准确率的变化来获得特征重要性。

假定变压器故障数据训练集(X,y)，每个样本含n个输入特征x1、x2、…、xn，随机森林算法通过bootstrap方法随机抽取K个子样本数据集，对应K个OOB数据集，特征重要性排序步骤如下：

1)初始化k=1；

4)当k=2,3,…,K时，重复步骤2、3；

5)计算特征xi重要性，即

(1)

6)对VIMi降序排列，得到特征重要度排序，VIM越大特征越重要。

2 MAEPSO算法

由于PSO算法中粒子的运动轨迹是一个有限的并逐渐减小的区域，无法覆盖整个可行空间解，因此，存在早熟收敛、易陷入局部最优等不足[10]。鉴于此，引入多尺度协同变异粒子群算法，该算法粒子速度变异能力由粒子所在子群高斯变异算子决定，不同子群的变异算子尺度由该子群的适应度决定，有助于粒子群在搜索空间中分散式搜索，增强算法全局寻优能力，同时变异算子的大小随着适应度的提升逐渐减小，在算法后期有利于提高最优解的精度。

2.1 多尺度高斯变异算子

设粒子变异尺度为M，并设置M个高斯变异算子标准差的初始值，其值为优化变量取值范围内的随机值：

(2)

随着算法的迭代，不同尺度变异算子的标准差会改变，规律如下：首先，将种群中的N个粒子依据适应度F的大小升序排列；然后，将排好序的种群按照适应度大小划分为M个子群，每个子群的粒子个数为P=N/M。t为算法当前迭代次数，则第m个子群在第t次迭代时平均适应度值可定义为

(3)

(4)

(5)

为最大范围实现空间搜索能力，粒子速度Vij达到一定阈值Tj时按伪代码进行一次变异操作，计算变异后所有粒子适应度及M个变异算子，取适应度最大位置作为下一次粒子新的逃逸点，代码描述如下：

(6)

其中，Tj记录种群中第j维的当前速度阈值且恒为正数，其自适应设定原理参考文献[11]，xi为粒子位置，rand为均匀分布在[0,1]范围内的随机数。

3 基于随机森林特征优选的MAEPSO-ELM算法变压器故障诊断

将随机森林特征优选与MAEPSPO-ELM算法变压器DGA故障诊断方法分为3步：建立候选特征集、确定最优输入特征以及ELM参数优化过程。

3.1 建立候选特征集

本文采用广东电科院提供的已确认变压器故障类型样本，共417组。根据相关规程，诊断结果可划分为7种状态：正常(N)、低能放电(D1)、高能放电(D2)、局部放电(PD)、中低温过热(T12)、高温过热(T3)、放电兼过热(TD)，分别用{1,2,3,4,5,6,7}表示，样本分布如表1所示。随机选取80组样本为训练集、186组为验证集、120组为测试集。

表1 变压器故障样本Table 1 Transformer fault samples

目前，常用CH4、C2H2、C2H4、C2H6、H2的体积分数检测变压器是否发生故障而利用其对故障状态与性质进行更明确判断时依旧存在较大程度偏差。IEC三比值法、Duval三角形法、无编码比值法等一系列方法则常用于判定具体的故障类型。此外，文献[12]表明，与 DGA 全部数据相比，DGA气体中2种气体的相对比值和变压器运行状态联系更紧密。为此，以上述5种气体为典型故障特征气体，并参照相关比值法构造故障特征的规则，选取关键气体的相关比率以及气体之间的总体占比作为候选特征集，如表2所示，其中CH为总烃含量。

表2 候选输入特征Table 2 Candidate input features

3.2 确定最优输入特征

首先，在训练集中通过随机森林算法计算各候选输入特征的VIM值并降序排列；然后，假设最优输入特征集合为空集，依据特征重要度排序，使用序列前向选择法，每次无放回地选取排序最前的特征加入最优输入特征集合，在验证集上利用MAEPSO-ELM模型进行训练，得到最优输入特征集合的分类准确率。遍历完所有特征后，最优输入特征集合即为分类准确率最高对应的特征。最优输入特征选择流程如图1所示。

图1 最优输入特征集合筛选流程Figure 1 Optimal input feature set screening process

3.3 ELM参数优化过程

利用MAEPSO算法优化ELM的输入层权值和隐层阈值，其中ELM算法分类准确率作为粒子适应度，算法流程如图2所示。

MAEPSO算法优化步骤如下。

1)预设网络拓扑结构、PSO算法的惯性权重、学习因子等固有参数。

图2 MAEPSO-ELM算法流程Figure 2 Flowchart of MAEPSO-ELM algorithm

3)根据粒子适应度竞争机制，更新所有微粒当前最优适应度Pbest、种群当前最优适应度gbest。

4)根据PSO粒子速度进化公式调整微粒速度。

5)判断粒子速度是否满足Vij

6)按PSO粒子位置更新公式调整微粒的位置。

7)根据式(3)～(5)更新M个高斯变异算子的大小，并更新每一维速度的阈值Tj。

8)判断是否满足迭代条件。迭代次数t>tmax则退出循环，输出最优适应度对应的ELM输入权值和隐层阈值，否则转至步骤3。

9)由训练求出的最优参数建立ELM分类模型。

4 算例计算与分析

4.1 基于随机森林的故障特征优选

按本文方法通过随机森林算法计算训练集22个候选输入特征VIM值，在验证集下结合优化的ELM，可得到不同输入特征个数时的分类准确率，如图3所示。本文随机森林参数设置: 回归树数目为400，节点最小尺寸为5， mtry 节点值为8。

图3 变量重要性评分及分类准确率曲线Figure 3 Variable importance score and prediction error curve

由图3可知，输入特征维数较低时模型提取表征输出特性的关键信息较困难，分类准确率低；当按照VIM值排序逐个增加故障特征量时，进一步丰富了信息，分类准确率有所提高，并且在特征个数为9时准确率最大；继续增加特征量，分类准确率又呈下降趋势，最后趋于平稳。这说明在特征增加到一定个数时输入特征混入冗余特征，随之而来的冗余信息对模型的分类性能有副作用。由此可见特征选择的必要性，选择VIM值排序前9的特征作为本文方法的最优输入特征，分别为C2H4/C2H6、CH4/H2、C2H2/CH、C2H4/CH、C2H2/C2H4、H2/CH、CH4、C2H6/CH4、H2。

从结果来看，最优输入特征排序的前几个特征包括CH4/H2、C2H4/C2H6、C2H2/C2H4，即IEC导则推荐的三比值特征量，说明本文方法筛选的特征量与传统变压器故障诊断理论中故障特征比值量的选取有较大一致性。

本文方法参数最终设置：种群总规模N=50，尺度个数M=5，惯性权重w采用随进化次数线性递减方式，粒子学习因子c1、c2均取1.5，Vmax为100，迭代次数tmax为160。ELM输入节点为筛选出的特征维数9，输出节点个数对应变压器7种状态设为7，采用尝试对比法确定隐含层节点数为50，因此ELM拓扑结构为9-50-7。

4.2 输入量的选择

构建粒子群极限学习机(PSO-ELM)、量子粒子群极限学习机(quantum particle swarm extreme learning machine，QPSO-ELM)、MAEPSO-ELM模型，当输入为最优输入特征时，验证集在相同参数情况下各方法迭代过程的适应度进化曲线如图4所示。

图4 适应度随迭代次数的变化曲线Figure 4 Variation curve of fitness with the number of iterations

图4表明在PSO-ELM模型中，粒子迭代早期就陷入局部最优，导致后续迭代搜索无法优化出适应度更高的曲线，此即为标准PSO算法的“早熟”缺陷，在约第35次迭代时训练精度收敛于83.3%；QPSO-ELM全局寻优性能略好于PSO-ELM，在第45次迭代时进化陷入停滞，并收敛于86.7%的训练正确率；MAEPSO-ELM利用多尺度高斯变异算子对粒子速度进行变异，迭代初期粒子训练精度就达到81%，远大于PSO-ELM、QPSO-ELM；迭代后期，当粒子适应度陷入局部最优后，通过多尺度协同变异多次跳出局部最优在搜索空间中分散式搜索，在有限的迭代次数内提高搜索精度，最终收敛于95.2%。综合对比，本文引入的MAEPSO算法寻优能力最好。

为验证本文方法高效性，将MAEPSO-ELM及对比模型输入特征分为4类：①最优输入特征；②DGA气体比值，即H2/CH、CH4/CH、C2H6/CH、C2H2/CH、C2H4/CH；③IEC气体比值，即CH4/H2、C2H4/C2H6、C2H2/C2H4；④DGA全数据。

3种方法在4种输入特征下及IEC三比值法的测试样本整体诊断结果对比如图5所示，得出结论：

1)当采用相同诊断方法、最优输入特征作为输入时，诊断准确率比DGA全数据高20%左右；

2)当采用相同特征量时，该文方法的识别准确率比PSO-ELM、QPSO-ELM故障诊断准确率高5.6%～13.1%；

3)当同时采用最优输入特征与该文方法进行故障诊断时，能获得最高的故障诊断准确率；本文方法识别准确率为91.3%，高于IEC三比值法32.9%、QPSO-ELM法7.9%、PSO-ELM法13.1%，诊断效果最好。