基于小波分析和随机森林算法的变流器电路故障诊断研究
2016-10-15李明昆宋丹妮
李明昆 宋丹妮
(西华大学电气与电子信息学院,成都 610039)
基于小波分析和随机森林算法的变流器电路故障诊断研究
李明昆 宋丹妮
(西华大学电气与电子信息学院,成都 610039)
针对变流器电路中电力电子器件的故障特性,利用小波分析对采集的数据进行去噪,运用随机森林算法对变流器电路故障类别进行诊断,并与单一随机森林故障诊断方法进行对比。仿真与实验结果分析表明,提出的方法在变流器故障诊断中具有较强的抗噪能力和较高的正确诊断率,尤其在干扰噪声较大时效果明显,在实际工程解决变流器电路故障诊断问题上具有良好的实用价值。
变流器电路;小波分析;随机森林;故障诊断
目前随着现代电力系统的智能化、复杂化,经过整流及逆变技术处理的电能在整个国民经济的耗电量中所占比例越来越大。尤其是在最近热门研究领域的可再生能源发电、高压直流输电、柔性交流输电、储能装置、V2G、用户电力技术等应用广泛[1-3]。这些含有变流电路的装置一旦发生故障,将造成十分严重的后果,为确保其安全性和可靠性,对变流器电路进行故障诊断具有十分重要的意义[4]。
诊断故障的方法可以分为基于特征提取和基于模式识别的两类方法[5]。前者方法大多使用数学模型变换获取功率谱,主要有参数估计法和残差法等,但由于对象的精确数学模型很难获得,故通用性不强[6-7];而后者方法较丰富且实用性强,其中神经网络由于其强大的自学习能力被广泛应用于变流器电路的故障诊断中,但神经网络识别方法存在在训练时容易陷入最小极值、过拟合等缺点[8-10];此外SVM机作为一种小样本的概率学习方法也被应用到故障诊断中,但由于其自身特点,在分类类别较多时,SVM方法速度较慢,占用资源大,不利于在线算法的实现[11-12]。
随机森林算法是一种基于模式识别的学习算法,通过样本训练,生成多个含有样本特征的随机决策树,其从而可对故障进行诊断。随机森林具有很高的分类能力、调整参数少和运算速度快等优点。考虑噪声干扰对算法诊断正确率的影响,提出了小波分析与随机森林算法有效结合的方法,用于对整流电路电力电子器件进行故障诊断,仿真和实验结果验证了所提方法的正确性。
1 随机森林算法
随机森林算法(Random Forests,RF)是由Leo Breiman[13]于2001年在结合了Bagging集成学习[14]和CART决策树算法[15]的基础上提出的一种组合回归和分类算法,其实质是一个包含多个决策树的分类器。随机森林算法的计算过程主要包括以下两个部分:Bootstrap法重采样产生训练集和随机森林的生长。
1.1Bootstrap法重采样
随机森林算法应用 Bootstrap法重采样[16]产生多个训练集,这种重采样方法可以无需预先知道待估计参数的先验信息,而只需要通过少量的样本就可以估算出参数的分布特征。设集合P中含有n个不同的样本{x1, x2, x3, …, xn},若每次有放回地从集合P中抽取一个样本,一共抽取n次,形成新的集合P*,则集合P*中不包含某个样本xi(i=1, 2, …, n)的概率为
当n趋近于无穷大时,有f=e−1≈0.368,故新集合P*的样本总数与原集合P的样本总数都为n,但新集合P*中可能包含了重复的样本,因为是有放回的重采样方式,若除去重复的样本,新集合P*中大约只包含63.2%的样本。随机产生的t个训练集p1, p2, …, pt,试验证明这种随机有放回的采样方式基本能包括训练样本的全部信息。
1.2随机森林的生长
使用Bootstrap方法对训练样本P(i×j)进行随机重采样后,生成t个新的训练集p1, p2,…, pt(n×j, 0<n<i),采用随机选取分裂属性集的方法构建决策树,随机森林生长的基本思路如图1所示。
图1 随机森林的生长过程
决策树的生成过程步骤[16]如下。
1)基于每一个自助样本pt,使用完全分裂的方式构建一棵决策树,如图2所示。具体方式如下:随机挑选m(0<m<j)个特征,在树的每个内部节点处按照Gini不纯度最小的原则从中选出一个分类效果最好的特征 xi,将该节点分为两个分支。Gini不纯度最小的原则为
式中,P(i)表示每一类占总类数的比例,值越大表示越“不纯”,相反越小表示“纯”。
图2 决策树结构
对树的每个节点重复上述分裂方法,直到这棵决策树能准确的分类全部训练数据,或树中每个节点的不纯度都达到最小。每个自助样本生长为单棵分类树,该自助样本是单棵分类树的全部训练数据。
2)分类树不进行剪枝操作,直到这棵树能准确地分类训练集或所有属性都已被使用,这样就可以达到低偏差和高差异而要充分生长,使得每个节点的不纯度达到最小目的。
重复以上步骤 t次可生成 t棵决策树 Ct,这 t课决策树就组成了随机森林。每棵树都完整成长,且每一棵决策树之间是没有关联,可避免过拟合的产生。
通过样本训练得到的随机森林,每一棵树包含的信息很弱,但含 t棵决策树的森林就具有强大的分类能力。如图3所示,对于每个测试样本,用决策树进行测试,得到每个决策数对应的类别 C1(n), C2(n), …, Ct(n)。最后采用投票的方式,票数最高的一个类别即为该测试样本所对应的类别。
图3 测试过程
2 小波分析
2.1小波去噪介绍
一个含噪声的一维信号模型为
式中,s(t)为原始信号;e(t)为噪声。
小波去噪模型根据信号和噪声的小波系数在不同尺度下有不同的特征表现为基本依据。一个含噪声信号的高频系数分量是f和噪声信号e的高频系数叠加,根据噪声和信号的不同小波变换特性,可以对信号进行降噪处理[17]。
2.2小波阈值去噪
Donoho提出的小波阈值去噪方法是工程中应用最广泛的方法之一[17]。如式(3),对f(t)作小波变换得到的小波系数由两部分租成:有用信号的能量对应着幅值较大的小波系数,噪声的能量则对应着幅值较小的小波系数,分散在小波变换后的所有系数中。
阈值函数:
式中,wj,k和分别代表经过去噪处理前后的小波变换系数,阈值λ取值为λ=σ2lg(M),其中σ=样是对噪声水平的估计值,M为信号的长度。对含噪信号进行小波分解后,用门限阈值对小波系数进行处理,最后将阈值化处理后的小波系数进行小波反变换得到去噪信号。
3 变流器电路故障诊断
3.1变流装置器件故障
调查显示,变流器中二极管、晶闸管、场效应管等开关元件属于易损坏器件,发生的故障大多源于元器件的老化、损坏或触发脉冲的丢失。一般情况下考虑电力电子器件会出现0个、1个、2个同时故障这三种状态。以3相6脉冲整流器(见图4)为故障诊断对象,包括5大类的22小类故障类型。具体不同故障对应编号见表1。
图4 3相6脉冲整流主电路
3.2诊断步骤
利用采集的故障特征样本训练随机森林,对未知故障进行小波分析去噪,将去噪后的测试样本输入到随机森林中,诊断出故障类别并判断其正确诊断率。具体步骤如下。
表1 22种故障类别编号
(1)对变流器装置中的各类故障进行仿真,获取电路故障信息的原始数据,并对提取的数据作归一化处理,以取消各维数据之间的数量级差别,避免造成测试误差较大的情况,文中随机森林的输入均通过归一化处理。本文使用数据归一化方法中的最大最小法:
式中,xmin表示数据序列中的最小值;xmax为序列中的最大值。
(2)利用采集的原始数据形成训练样本,利用表1中编号生成期望输出。按图1所示进行训练,形成含有多棵决策树的随机森林,建立起整流器电路故障诊断的随机森林分类器。
(3)运用小波分析对收集到的含噪数据进行去噪处理,形成测试样本,作为随机森林分类器诊断时的输入。
(4)如图3所示,将测试样本输入到随机森林中,由各个决策树对故障进行判别与分类,测试故障类别,并与期望输出进行对比,判断诊断结果的正确性。
3.3仿真分析
在Matlab下进行仿真分析。按图4电路图搭建,得到 3相 6脉冲整流器故障模型。输入端为工频220V的三相交流电压,负载端为300Ω纯电阻负载,利用示波器在每个周期内提取直流端电压值,采样频率为 fs=104Hz。在故障设定时考虑晶闸管触发角度的影响,分别在触发角α 为0°和30°时进行采样,每种触发角情况下对每一类电路故障采样10个周期共10组直流端电压,生成220个故障样本作为原始数据。
通过仿真可得到22种故障下的仿真波形。考虑到每一大类下的故障波形为同时间轴上的平移,波形形状相同,图5只给出了每大类下的一种故障波形。
采用以上提出的小波阈值降噪和随机森林算法相结合的方法,首先对原始数据进行归一化处理,作为随机森林的训练样本,生成含500棵随机决策树组成的随机森林分类模型。将无加噪、5%、10%、15%、20%和 50%的噪声情况下的数据归一化后作为测试样本,分别输入到随机森林分类模型中进行测试,得到测试输出;将经过小波分析降噪后的数据作为测试样本,输入到随机森林分类模型中进行测试,可得到基于小波分析和随机森林算法的测试输出。对比期望输出,得到表2中3相6脉冲整流电路故障正确诊断率。
图5 整流电路5种故障波形
将基于小波分析和随机森林算法故障诊断得到的结果与单一随机森林算法结果相对比,可知本文方法对变流器中电力电子器件多类别的故障形式有更好的故障诊断效果。对比结果见表 2,试验结果表明该方法有效的提高了故障正确诊断率及抗噪性,尤其在噪声干扰强度较大时效果更加明显,从而提高了算法的故障诊断识别能力。
表2 诊断正确率
3.4实验分析
实验电路中用二极管代替晶闸管,相当于晶闸管触发角α 为 0°时,各晶闸管在自然换相点换相的情况,模拟整流器电路故障时可通过设置二极管正向支路的关断实现[18]。具体实验方案为:按照图4整流电路原理搭建实验平台,每个二极管正向端串联一个开关元件,构成整流器故障诊断实验的故障发生电路;输入端接入接触调压器,调压器输入为工频 380V电压,输出范围为 0~430V,作为整流器的输入电压;输出端负载选用阻值为300Ω电阻负载,与数字示波器并联。见表1,分别对22种故障类别通过开关关断进行模拟,当故障发生时使用数字示波器测试负载端的输出电压并记录波形,与图5中仿真波形相对应,实验波形如图6所示。
图6 实验5种故障波形
利用数字示波器的数据存储功能,对数据进行采样频率为fs=104Hz的电压值提取,并对实验采集的数据进行归一化处理,分别输入到单一随机森林算法与小波分析和随机森林算法相结合的算法中进行诊断,随机森林算法对实验故障正确诊断率为76.82%;基于小波分析和随机森林算法的实验故障正确诊断率为95.91%。由此可见,利用小波分析和随机森林算法相结合的变流器电路故障诊断在实际应用中具有很高的故障正确诊断率,尤其在输入样本含有噪声的情况下,具有较高的故障诊断识别能力。
4 结论
噪声的干扰对变流器电路故障诊断会产生一定的影响,尤其在一些恶劣环境下发生故障也需要及时准确地识别故障及其类别,并作出相应处理。本文提出的小波分析与随机森林算法相结合的故障诊断方法有较强的抗噪能力,能很好的从含噪声的信号中提取有效数据,准确高效的对变流器电路中的各类故障进行诊断,试验结果表明本文方法有较高的正确诊断率,具有实际应用价值。
[1] Boban I, Kilchenmann P. A modern tests facility for large power electronics components[J]. ABB Review, 1993, 7(6): 29-35.
[2] Tso SK, Liang Jun, Zhou Xiaoxin. Coordination of TCSC and SVC for improvement of power system performance with NN-based parameter adaption[J]. Electrical Power&Energy Systems, 1999, 21(14): 235-244.
[3] 汤广福, 温家良, 贺之渊, 等. 大功率电力电子装置等效试验方法及其在电力系统中的应用[J]. 中国电机工程学报, 2008, 28(36): 1-9.
[4] 汤广福, 贺之渊, 滕乐天, 等. 电压源换流器高压直流输电技术最新研究进展[J]. 电网技术, 2008, 32(22): 39-44, 89.
[5] Frank P M. Analytical and qualitative model based fault Diagnosis-A surveyandsome new results[J]. European J. Control, 1998, 5(2): 6-28.
[6] YVV. S. MurtyGK. Duby. R. M. K. sinha. fault Diagnosisin Three-phase Thyristor Converters Using microprocessor[J]. IEEE Trans on Industrial Application, 1984, 20(6): 1490-1497.
[7] 王荣杰. 电力电子整流装置故障诊断方法的研究[D].广州: 广东工业大学, 2006.
[8] 杨明玉, 杨立红. 基于神经网络的柔性直流混合输电线路故障测距[J]. 现代电力, 2013, 30(5): 50-54.
[9] 苏鹏声, 王志强, 姜建国. 用人工神经网络诊断电力电子电路主回路故障[J]. 清华大学学报(自然科学版), 1999, 39(3): 20-23.
[10] 龙伯华. 电力电子电路故障诊断方法研究[D]. 长沙:湖南大学, 2009.
[11] 崔江, 王友仁, 刘权. 基于高阶谱与支持向量机的电力电子电路故障诊断技术[J]. 中国电机工程学报, 2007, 27(10): 62-66.
[12] 鄢仁武, 蔡金锭. FCM-HMM-SVM混合故障诊断模型及其在电力电子电路故障诊断中的应用[J]. 电力科学与技术学报, 2010, 2(2): 61-67.
[13] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[14] Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2): 123-140.
[15] Olshen LBJHFRA, Stone C J. Classification and regression trees[J]. Wadsworth International Group, 1984.
[16] Computers E B, the Theory of Statistics:Thinking the Unthinkable. Siam review[Z]. 1979.
[17] 孔玲军, 王峰松. MATLAB小波分析超级学习手册[M]. 北京: 人民邮电出版社, 2014: 296-321.
[18] 林飞, 杜欣. 电力电子应用技术的 MATLAB仿真[M]. 北京: 中国电力出版社, 2009: 193-200.
Fault Diagnosis Method of Converter Circuit base on Wavelet Analyze and RF Algorithm
Li Mingkun Song Danni
(School of Electrical and electronic Information Engineering, Xihua University, Chengdu 610039)
Aiming at the fault characteristics of power electronic devices in converter, using wavelet threshold method to reduce the noises of the collected data, diagnosing the fault classification of converter circuit with random forests, and making a comparison with single random forests diagnosis method. The testing results show that the method owns good ability to resist noises and high accuracy, the effect is obvious when the interference noise is large. The new method has high application value to solve the problem of power electronic circuit fault diagnosis.
converter circuit; wavelet threshold; random forests; fault diagnosis
李明昆(1989-),男,汉族,四川双流人,硕士研究生,主要研究方向为电力电子装置在线监测与故障诊断。