APP下载

基于深度置信网络的移动电站发电机故障诊断

2019-06-22陈海松

装备制造技术 2019年3期
关键词:发电机故障诊断准确率

孙 鑫,陈海松,王 清

(陆军工程大学,野战工程学院,江苏 南京210001)

0 引言

移动电站作为一种移动式的独立电源,在工程作业中的主要作用是提供动力或者照明供电,通常使用在矿井、洞穴、建筑工地等场所,由于这些场所扬尘多、潮湿,工作环境较为恶劣,而发电机作为电站核心部件,长久处于该种环境下极易导致故障频发,且不同作业环境下故障类型不同,为故障排除带来困难。实现对移动电站发电机故障快速准确的诊断识别,不仅有利于提高作业效率,对保证作业人身安全也具有较大意义。针对移动电站及其发电机的故障诊断,很多学者提出了有效方法,如小波分析[1]、故障字典诊断法和灰色预测诊断法[2]、BP神经网络[3]等,但这些方法较多的依赖于人工经验,要求具有一定的先验知识,而浅层人工神经网络挖掘故障信息、提取故障特征和识别设备故障状况的能力有限,还可能产生维数灾难等问题,因此这些方法很难达到理想效果。深度置信网络由 Hinton[4]自 2006 年提出后,Tamilselva[5]、Tran[6]等使用DBN(Deep Belief Network,DBN)分别对飞机发动机和压缩机进行故障诊断,效果明显,取得了相比机器学习算法更好的诊断精度。

本文利用DBN从底层到顶层逐步获取移动电站发电机故障特征,在对初始数据进行简单预处理之后,无需过多的专业知识即可完成发电机故障的诊断,减少人为因素的影响,拥有较好的普适性和实用性。

1 深度置信网络基本理论

深度学习网络能够模拟人的大脑,建立与人思维相似的分析和学习结构[7],来解释相关数据,如图像、声音、文本等。深度置信网络是一种非监督贪婪逐层训练的神经网络,通过不断的实验与验证,DBN展现了优异的特征提取和训练算法,能很好的表达出初始数据与最终输出之间的复杂映射关系。

深度置信网络是基于限制玻尔兹曼机堆栈而成的,其基本机构如图1所示。该图展示的是一个含有3个限制玻尔兹曼机的DBN结构示意图,每个RBM都有相对的输入与输出,即可见层与隐含层。如最初的RBM1中,原始数据按照样本的维度输入作为可见层v1,其输出层h1,两者之间的连接权重为w1;在RBM2中,RBM1的输出h1作为其输入v2,经过连接权重w2输出为h2,以此类推下去。每个RBM都是采用非监督的贪婪学习,使得输出层能最大似然的表示输入,因此通过多层RBM,实现了最初数据的特征提取。最后在输出层加上softmax函数完成对故障模式的分类识别。

图1 DB N结构示意图

深度置信网络的训练主要包含两个过程,一是基于RBM由下自上的前向传播,二是在BP算法下进行自顶向下的反向微调。

在前向传播中,Hinton提出了对比散度算法[8],以n次(n一般取1)吉布斯采样完成快速参数更新,使RBM训练得以有效完成,更新公式为:

其中<*>data表示输入数据,<*>recon表示重建后的数据,m为惯性系数,控制参数受上一次影响的程度,η为正向学习率。单个RBM的参数训练完毕之后,将其输出作为下一个RBM输入循环以上步骤即可,从而完成所有RBM的参数初始化。

反向微调时使用BP算法,将分类误差自顶向下传播,对初始化的权重和偏置进行微调,更新公式为:

其中,α为微调学习率。通过反向微调完成整个网络的参数优化,达到整体网络性能最优。

2 基于DB N的发电机故障诊断模型

2.1 数据预处理

基于学者对发电机故障的分析[9-11],结合实际工作,确定相应指标作为输入。对故障种类进行编号,记为1,2,…,m,为与正常工作时的指标进行对比,添加正常工作状态下的参数,编号为0,共m+1种输出类别标签。

为降低各指标之间的数量级差别,减少量纲对预测的影响,需要对数据进行预处理,作为后期DBN网络输入。

(1)对于部分为0的数据,将其赋值为10-8,避免运算过程中出现分母为0导致溢出;

(2)为提高数据随机性,将所有样本随机打乱组成样本集,按比例组成训练集和测试集;

(3)将数据进行归一化处理,调整到[0,1]之间,调整方式为:

其中,x′为调整后的数据,xmax和xmin为指标特征的最大和最小值,

2.2 DB N结构确定

DBN的结构参数主要包括数据输入维度、输出维度、RBM数量(隐含层数量)、各隐含层节点数。其中,数据输入维度由输入样本集的指标维度确定,输出维度一般由故障类别总数确定。这里主要需要人为确定的参数为隐含层数L和各隐含层节点数nl,由于这两个参数的确定尚无理论依据,本文采取文献[9]中提出的经验公式进行确定:

ni和no分别表示三层神经网络的输入与输出节点数,由于深度神经网络中第i个RBM的输出为第i+1个RBM的输入,因此对于第k个隐含层ni=hk-1,代入到式12,得到:

其中第一层输入h0=n0。

而关于层数的确定,一方面过少的层数易造成数据欠拟合,使得训练在训练集上表现就很差。另一方面,当层数过多时,则对分类特征具有更详细的表达,但是容易造成过拟合,虽然在训练集上表现很好,但泛化能力较差。因此,需要选取在合理的范围之内,由于没有确定的理论依据,通常2-3层可以满足需求,若想找到具体问题的最佳层数,需要通过实验确定。

分类问题中,一般采用交叉熵作为损失函数,而添加正则化项可防止模型过拟合,本文最终的损失函数为:

λ为惩罚系数,其值越大,对较大的权重值惩罚越大,从而控制目标权重在较为合理的区间取值。pˆi、pi分别表示数据输出的真实值与预测值。

2.3 模型训练

基于以上分析,移动电站发电机故障诊断模型流程为:

(1)采集发电机指标,对数据进行预处理,记录故障标签,划分训练集与测试集;

(2)设定网络各项参数,如网络层数、节点数与学习率、迭代次数等超参数;

(3)以样本输入维度为第一个RBM的输入,通过对比散度算法不断调整该RBM的权重与偏置,实现局部参数最优;

(4)将第一个RBM输出作为第二个RBM输入,重复3,直至所有RBM训练完毕;

(5)根据softmax层输出与实际标签对比,利用BP反向传播算法,将误差进行反传至各个RBM,微调权重与偏置,得到全局最优参数;

(6)判定是否达到停止条件,若是,停止迭代并输出,否则继续训练。

3 实例分析

3.1 实验数据

为验证模型有效性,使用某型拖车式移动电站进行实验验证。确定以下14项指标作为输入:工作线电压、工作电流、工作频率、发电机转速、励磁电压、励磁电流、水温、油压、油温、蓄电池电压、电机轴承温度、发电机外壳温度、发电机振动量、绝缘电阻。从这些指标可以看出,很多参数之间具有复杂联系,如励磁电压与励磁电流、发电机外壳温度与发电机振动量之间可能存在某种隐形函数关系,传统方法很难处理,并且随着维数的拓展,浅层神经网络也逐步丧失可行性,该种情况下宜使用提出的DBN方法进行分析。

实验设置了发电机轴承旷动、熔丝烧断、调压器调整不当、电刷接触不良、风扇损坏、润滑脂缺少、绕组受潮共7种故障,加上正常运行状态,共8类输出。为保证数据能充分反映发电机工作实际情况,水温、油压、油温、电机轴承温度和外壳温度统一设定为稳定运行30 min之后测量所得。

所有故障采样间隔为5 s。其中,每个故障取500组数据,共5000个样本,每个样本14个维度,打乱后构成整个数据集。对于标签数据,为便于计算输出误差,将故障编号转换为独热编码,如熔丝烧断编号为2,转换为[0 0 1 0 0 0 0 0 0],采样结果按照前述数据预处理方法进行归一化,得到表1样本数据。

表1 预处理后部分数据

根据前文描述,隐含层数可从最少的2层开始,考虑输入数据维度为14,并不大,本文设为2层。节点数按照经验公式计算为11,将其作为参考值带入,前向学习率与微调学习率取为0.001,惯性权重为0.9,迭代次数为50次。为去除随机性影响,每次计算结果重复实验20次,取平均值,损失函数采用交叉熵,正则化系数为0.000 2。训练集为按比例随机在所有样本中抽取,剩余样本作为测试集。

3.2 实验与结果分析

为说明与其它传统故障诊断或浅层神经网络的区别,将DBN与BP、SVM方法进行对比,为保证环境的一致性,其中三层BP采用的隐含层节点数为11,激活函数同样为sigmoid,学习率、迭代次数与惯性系数均与DBN一致。SVM采用RBF作为核函数,训练集与测试集按照从1∶9到9∶1的比例进行试验,取20次实验平均值,准确率表示为模型预测类别正确的样本占测试总样本的百分比,结果如表2。

表2 DB N、BP、S V M准确率

从图2实验结果可知:

图2 不同方法结果对比图

(1)但从DBN准确率变化曲线来看,从第三组开始网络的预测准确率就已经高达98%以上,并且随着训练样本比例的增加最终递增到100%,说明样本越多,对模型提高其准确性具有更大的帮助,而且DBN对样本数据集划分比例变动不是很敏感,具有一定的鲁棒性。

(2)三种算法比较来看,在同样迭代到40次时,BP尚未找到合适的参数拟合,效果最差。而SVM具有与DBN相当的精度,即使在样本比例为1∶9时,仍然可以达到75.19%的准确率,此时DBN参数训练还严重欠拟合,导致其准确率接近随机结果。但当实验进行到编号3时,DBN具有相对较高的准确率,而SVM在最后还可能出现波动。整体实验表明,DBN用于发电机故障诊断切实可行,且相对浅层网络和传统方法具有更高的准确率和稳定性。

4 结论

本文基于深度置信网络较强的特征提取能力,构建了针对移动电站发电机的故障诊断模型,通过正向传播和反向微调,优化网络参数。验证了更多的测试样本有利于增加模型的预测准确率,表明DBN对划分的训练集和测试集比例变化具有一定的抵抗能力。通过与BP、SVM等算法的比较,进一步说明了DBN具有高精度、鲁棒性的优点[12]。

猜你喜欢

发电机故障诊断准确率
基于包络解调原理的低转速滚动轴承故障诊断
笑声发电机
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
运行中发电机出口压变异常的分析与处理
数控机床电气系统的故障诊断与维修
基于量子万有引力搜索的SVM自驾故障诊断
随身携带的小发电机