基于CS特征数据启发算法的旋转机械结构故障诊断与评估
2023-08-05陈旭
陈 旭
(眉山职业技术学院,四川 眉山 620010)
0 引言
在信息技术、通信技术和物联网的推动下,全球工业已经迈入了4.0时代[1],工业设备朝着大型化、连续化、高速化和智能化的方向发展[2-4]。旋转类机械设备在工业领域的应用较为广泛,但其结构较为复杂且设备的工作周期长,也更容易产生故障。为了避免由于旋转类设备突然出现故障,而造成更大停机损失或人员伤亡,工业企业大都对该类设备实施在线实时监控与故障诊断,以保障旋转机械的稳定运行[5]。针对旋转类机械结构的故障分析与诊断,现有研究主要从对故障信号的时频分析[6]、特征识别[7]、模式识别[8]等角度展开。陈仁祥等[9]提出基于离散小波变换的旋转机械故障诊断方案,对连续的故障信号进行离散化处理和多尺度变换,更准确地提取故障信号的视频特征。但此种算法下,离散小波基选取难度较大,算法复杂度也较高;郭煜敬等[10]提出基于经验模态分解(EMD)的故障诊断方法,EMD处理故障信号的效果更直接,且具有较强的自适应能力,能够更好地处理非线性、非平稳性的故障信号。但由于在应用EMD方法时无法保证全部IMF分量的正交性,而且还存在一定程度的模态混叠现象,影响最终的旋转机械结构故障诊断精度;昝涛等[11]提出基于人工神经网络(ANN)的故障诊断方法。人工智能算法的优势在于自适应能力强,能够处理规模较大的故障集,在故障信息存储和故障数据训练方面具有优势。但ANN的结构设计与参数选择会在一定程度上依赖先验知识,具有一定的主观性,利用ANN算法在全局范围内迭代更容易陷入局部最优化,影响到对故障状态的判断。近些年,仿生算法[12]和启发式算法[13]开始在机械故障诊断领域崭露头角,仿生算法和启发式算法在计算求解过程中不依赖于梯度信息和先验知识,且能够应对大规模的数据集。本文提出一种基于布谷鸟搜索算法(CS)特征数据启发算法的故障诊断方法,基于仿生学理论启发算法,提升旋转机械设备故障诊断的精度。
1 旋转机械结构故障数据集特征提取
旋转机械故障诊断的核心工作是从采集到的机械振动信号中提取出故障特征。随着旋转机械设计复杂程度的不断提高,故障数据集的规模越来越大,不利于故障特征的识别与提取。传统基于信号分析的浅层故障特征提取方法,无法有效应对和处理大规模数据集,为此本文基于深度卷积神经网络算法,自适应提取特征参数并进行模式识别,应对大规模数据集的特征处理问题。深度卷积神经网络是一种深层结构的神经网络,与ANN相比,其具有更强的数据处理性能。借助卷积运算一方面能够降低系统噪声和环境噪声的干扰,另一方面还可以增强原始信号的特征值,深度卷积神经网络的结构见图1。
图1 深度卷积网络结构简图
卷积神经网络的卷积层被视为一组数量为n线性滤波器组:
(1)
(2)
激活函数表示为
(3)
下采样层选用均值采样的方式,得到特征矩阵的局部汇总集合,深度卷积网络的输出层配备了Softmax函数以获取特征参数,输出结果在0~1之间,分类器模型可以描述为
(4)
其中,τp表示故障数据分类输出过程中获取的特征参数。
深度卷积神经网络是一种深层次的网络学习算法模型,具有更强的大规模故障数据处理能力,通过实时调整与匹配各层次之间的最优连接权值,确保卷积和采样之后的信号重构差异最小化。深度卷积神经网络模型在结构设计上更复杂,同时也具有更强的故障数据处理能力,为降低算法的复杂度引入前向传播原则,降低总体上的连接权值数量。在获取到与卷积层相对应的样本特征向量后,再利用激活函数反向调整权值偏置,得到故障样本数据的分布特征。
2 CS算法数学模型的建立及优化
深度卷积神经网络具有强大的自学习能力和数据泛化处理能力,但随着故障样本规模的增大,学习速度下降且容易陷入局部最优解,甚至导致故障数据集训练的失败。为保证在大故障数据集条件下的故障诊断精度,弥补深度卷积神经网络算法的不足,本文引入CS仿生算法提升深度卷积神经网络的泛化能力、全局搜索能力和大规模故障数据集的处理能力。CS仿生算法是一种模仿布谷鸟飞行、繁殖等生物学特征行为的启发式搜索算法。在寻找最优解的过程中将布谷鸟在宿主巢穴中所产的卵视为一个新的最优解。设定宿主鸟巢的固定值为m,宿主能够识别出新解的概率是P,P∈[0,1],如果概率P值被替代,在新的宿主鸟巢位置会出现新解。布谷鸟个体zi通过飞行活动更新当前位置,寻找新的宿主巢穴,过程描述如下:
(5)
(6)
其中,u和v为服从正态分布的步长函数参数。
个体位置不断更新以后,均匀分布的随机数φ(取值范围为[0,1])也发生改变,CS仿生算法的优化模拟过程如(7)所示:
(7)
经典CS仿生算法中布谷鸟个体移动步长具有随机性,种群个体只能通过飞行过程中的随机迁移持续地更新位置。由于布谷鸟个体之间缺乏种群交流机制,模型中也没有其他参数供对比分析,导致搜索能力下降,不利于算法的快速收敛。因此本文对经典的CS仿生启发算法进行步长优化,在经典CS算法中引入牵引分量(种群中最优和最差适应度分量)和随机函数值。基于适应度函数值自适应调整移动步长,避免随机移动而导致全局范围内搜索精度的降低,在t+1时刻步长分布函数的自适应调整过程描述如下:
(8)
(9)
其中,Fw表示种群中的最差适应度分量;Fb表示种群中的最佳适应度分量。
此时布谷鸟个体zi的位置更新过程描述如下:
(10)
根据适应度函数值的变化趋势调整布谷鸟个体的移动步长,避免了由于个体随机移动而导致全局搜索精度降低。在搜索前期加大步长,扩大最优解的搜索范围,而在搜索后期逐渐根据需求减小步长,避免了由于个体移动步长过大而导致个体在最优解搜索中陷入局部最优化。
3 基于CS启发算法的故障数据训练与故障诊断
通过优化的CS启发算法,能够提升深度卷积神经网络结构的全局搜索性能和数据训练性能,全面改善机器学习在旋转机械故障中的应用效果。数据训练时首先确定深度卷积神经网络的层次结构,基于网络的复杂程度、阈值、权值等指标确定搜索空间的维数;其次构建种群个体坐标与卷积网络之间的映射关系。在训练中由于适应度函数和移动步长均可调整,则通过调节权重比例wi控制网络误差的偏差。基于优化CS算法的故障数据训练流程见图2。
图2 基于优化CS算法的故障数据训练流程
CS特征数据启发算法的应用步骤如下:
Step1 根据旋转机械结构故障集的规模设定布谷鸟种群的初始规模,同时设置优化算法的最大迭代次数、自适应步长参数、新解概率及深度卷积神经网络的各层权值与阈值。
Step2 在分析是否满足终止搜索条件前计算迭代次数,如果达到最优解则停止搜索;如果没有达到最优解,则继续计算自适应步长,进入下一步寻优阶段。
Step3 根据种群中布谷鸟个体位置的具体更新情况,计算个体的适应度函数值、最优适应度分量、最差适应度分量。
Step4 基于贪婪策略择优选择最佳的新解,对各代个体的适应度函数值进行比较,避免在迭代过程中出现个体退化现象。
Step5 比较迭代寻优过程中的新解概率与随机数的大小,筛选出最优位置。每一个更新后的布谷鸟位置对应一个目标函数的维度,通过个体飞行重新产生新解,并通过自适应步长寻优传递到下一代,且保证了算法的收敛性能。在基于深度卷积神经网络训练故障数据,在提取故障特征过程中,将布谷鸟位置更新值作为调整神经网络权值和编码阈值的一个分量。优化CS启发算法的应用,一方面提升了深度卷积神经网络算法的特征提取性能和收敛性能,另一方面适应度函数值的引入,在很大程度上避免了最优解搜索过于随机而导致故障数据训练与检测精度降低。
4 实验分析
4.1 旋转机械故障数据集的选取
本实验从University of California Irvine数据库中选择三种不同规模的数据集,用于旋转机械结构故障检测,数据集规模、特征数、标记数等信息如表1所示。
表1 实验用故障数据集相关信息
应用CS特征数据启发算法对深度卷积神经网络算法的数据训练过程进行优化,相关参数设置如表2所示。
表2 算法参数设置
4.2 总平方误差控制效果对比
基于深度卷积神经网络提取故障特征时,随着故障数据集规模的增加,算法训练的学习效率和迭代效率降低,算法的总平方误差收敛效率降低,进而影响故障识别的精度。而引入CS启发算法后提取故障特征的总平方误差的收敛速度更快,以Sonar故障数据集为例,发现概率值设定为0.35,比例因子调整为0.40,并利用Matlab仿真软件得出优化前后总平方误差控制效果,如图3和图4所示。
图3 CS算法优化前算法总平方误差收敛效果仿真
图4 CS算法优化后算法总平方误差收敛效果仿真
对比结果显示,在优化前训练迭代次数达到600才能够收敛到最佳,而经过CS算法优化后,迭代次数减少到290次,收敛性能和学习效率得到明显改善。
4.3 故障特征数据分类性能与故障诊断精度对比
面向不同规模的故障数据集,运用CS分类算法得到的分类准确率和数据降维率,与引入传统的离散小波算法、EMD算法和ANN算法参与对比,数据计算和统计结果见表3至表5。
表3 小规模数据集的特征分类性能对比
表4 中等规模数据集的特征分类性能对比
表5 大规模数据集的特征分类性能对比
在处理小规模的旋转机械结构数据集时,经过CS算法优化后的深度卷积神经网络的分类性能,要优于三种传统算法,但差距较小,但故障特征数据的降维性能要明显好于三种传统算法。这主要是由于CS算法具有更强的步长控制能力和全局寻优能力,能够在全局范围内识别出更多的最优新解。随着数据集规模的不断增大,各种算法的分类准确率与数据降维率都在不断降低,但CS算法的性能衰减相对于其他算法更慢。以Sonar数据集为例,CS算法的数据分类准确率和数据降维率分别达到了93.26%和90.12%,远高于三种传统特征数据分类算法。
六类故障数据集中实例数对应的故障特征比例如表6所示。
表6 各故障数据集中包含的故障特征比例
统计分析在不同规模数据集条件下本文算法与三种传统算法的故障诊断精度,如图5至图7所示。
图5 大规模数据集故障诊断精度对比
图6 中等规模数据集故障诊断精度对比
图7 小规模数据集故障诊断精度对比
旋转机械结构故障诊断分析结果显示,在三种不同规模的数据集条件下,基于CS特征数据的优化算法的故障诊断精度都能保持在95%以上,当故障特征比例较低时,CS启发算法的故障诊断性能也并未衰减。这表明经过CS算法强化故障数据训练后,无论是算法的分类性能、降维性能、检测性能,还是收敛性能都得到本质上的改善。
5 结语
随着旋转机械结构复杂程度的不断提高,故障数据集的规模不断增大。深度卷积神经网络算法在处理大规模故障数据集时,相对于传统算法具有一定优势,但算法的全局搜索性能和收敛能力需要加强。为此,本文利用优化的CS算法模型提升卷积神经网络结构的数据训练能力与泛化能力,保证故障特征提取和分类的准确性。实验结果表明,本文提出的优化算法具有更强的算法总平方误差控制能力,故障诊断精度明显优于传统算法。