频谱密度函数相似性比较的齿轮箱故障诊断
2018-04-10郭远晶魏燕定金晓航杨友东
郭远晶 魏燕定 金晓航 杨友东
摘要:为降低齿轮箱振动信号频谱分析与故障识别的难度,提出了基于频谱核密度估计与密度函数相似性比较的齿轮箱故障诊断方法。首先针对齿轮箱的每一种故障状态采集多组振动信号,利用核密度估计方法对每组振动信号的频谱求取密度函数;然后选取一部分密度函数进行算术平均化,得到对应故障状态下的标准密度函数;最后根据测试振动信号频谱密度函数与各种故障状态标准密度函数之间的余弦相似度值与相关系数值,对齿轮箱的故障状态进行识别。试验结果表明:与振动信号的频谱相似性比较方法相比,所提方法对于齿轮箱故障状态的判别具有更高的准确率,同时对应于齿轮箱的不同故障状态,相关系数比余弦相似度显示出更大的差异性,具有更好的适用性。
关键词:故障诊断;齒轮箱;核密度估计;余弦相似度;相关系数
中图分类号:TH165+.3;TH132.46 文献标志码:A 文章编号1004-4523(2018)01-0157-08
DOI:10.16385/j.cnki.issn.1004-4523.2018.01.019
引言
齿轮箱作为一种转速变换与动力传递部件,广泛地应用于旋转机械设备中,如风力发电机、高速列车、矿山机械等。由于齿轮箱工作环境比较恶劣,且经常长时间运行在高转速、重载荷的条件下,再加上齿轮、轴承等零部件的加工、装配误差,齿轮箱容易出现各种类型的损伤,如点蚀、裂纹、磨损、剥落甚至断齿等,从而导致旋转机械设备不能正常运转,造成经济损失甚至安全事故。因此,有必要对齿轮箱进行状态监测与故障诊断,以便排除故障隐患,及时发现早期故障,简化维护工作,避免严重故障的发生,从而提高齿轮箱乃至整套机械设备的使用效益。
当前的齿轮箱故障诊断方法中,振动信号FFT频谱分析方法技术成熟,最为简单实用。因此,在大多数的振动分析仪与机械设备状态监测系统(CMS)中,FFT频谱分析是一项最基本的功能。但频谱分析方法应用于故障诊断仍然存在一些不足。第一,故障诊断的有效性取决于频谱分析方法本身的可靠性和适应性。很显然,针对非平稳的振动信号,FFT频谱分析会造成严重的“频率模糊”现象,因此不适合用于非平稳工况下齿轮箱的故障诊断。第二,在很多情况下,频谱分析的有效性要么依赖于原始振动信号的预处理,如经验模态分解(EMD)技术、随机共振(SR)技术以及窄带干扰消除(NIC)等;要么依赖于频谱的进一步处理,如倒频谱分析_6]、复解析带通滤波细化谱分析、随机振荡子检测及共振稀疏分解等。第三,频谱分析方法的有效性较大程度上依赖于维护人员对于故障诊断方法的认识以及相关经验的积累。维护人员若要直接从齿轮箱振动信号频谱中识别出故障信息,需要知道齿轮箱典型故障所具有的振动特征以及相应的诊断方法。第四,齿轮箱振动信号频谱分析主要是针对具体的故障特征频率,这种具体信号很容易受到工况变化的影响以及噪声的干扰,其分析难以量化,因此,频谱分析很难直接应用于齿轮箱的智能故障诊断中。
对于处在某一特定故障状态下的齿轮箱而言,在工况保持稳定的情况下,不同时刻采集到的振动信号有着相似的频谱图,即在这些频谱图中,沿着信号频率增大的方向,幅值的变化趋势基本相同;而对于齿轮箱的不同故障状态,振动信号频谱的幅值变化趋势则差异较大。这种相似性与差异性的判别是直接针对频谱的概貌作出的,不需要对频谱的结构细节进行深入的分析与识别,亦不依赖于维护人员对于齿轮箱故障诊断方法的认知和经验,因而能够由计算机智能化实现,同时也避免了繁琐的、专业化程度较高的故障特征信息提取。鉴于此思路,本文引入密度函数来表示齿轮箱振动信号频谱的幅值变化趋势,然后对齿轮箱的不同故障状态建立对应的标准密度函数曲线,最后采集一组测试用的齿轮箱振动信号,利用其核密度函数曲线与各个标准密度函数曲线进行相似性比较,判定测试振动信号所对应的齿轮箱故障状态,从而实现齿轮箱故障诊断。
1频谱预处理
可以认为,原始的频谱图被转化为以频率成分f(k)为横坐标、B(k)为纵坐标或者以fg(p)为横坐标、Bg(p)为纵坐标的坐标图。从物理意义上来讲,该坐标图表示信号x(n)中频率成分f(k)或者fg(p)的能量占信号总能量的比例。从统计学意义上来理解,该坐标图也可以认为是一幅频率分布直方图。对于处于相同故障状态的齿轮箱而言,在额定工况或者相同的稳定工况下,不同时刻采集的振动信号中,频率成分f(k)或者fg(p)的能量占比是大致相同的,即所获得的频率分布直方图趋势线也是基本相同的。而对于齿轮箱的不同故障状态,振动信号频谱所对应的频率分布直方图趋势线则有较大的差异。在统计学中,频率分布直方图的趋势线采用密度函数曲线来表示,而密度函数则采用核密度估计方法来确定。
为进行后续的核密度估计,需要进一步将频率分布直方图转化为服从某一密度函数分布的离散数据,实现步骤如下:
(1)将频率分布直方图的各个幅值B(k)(k=1,2,…,N/2)或者B(p)(p=1,2,…,Ng)同时乘以一个系数C并圆整,得到一个整数序列I(k)或者J(p),则I(k)表示原始振动信号频谱中幅值为1、频率成分f(k)的数目,J(p)表示原始振动信号频谱中幅值为1、频率成分fg(p)的数目;
(2)将频率分布直方图转化为一组以频率成分f(k)或者fg(p)为变量,总长度大约为C的离散数据,该组数据序列可以表示为
在本文的研究中,将不对齿轮箱振动信号频谱的频率成分进行分组,并统一将系数C取1000。2核密度估计
相对于核函数而言,带宽w对于核密度估计的计算结果有着更为至关重要的影响。叫太小会使估计的密度函数曲线过拟合,有过多的波动而不够平滑;w太大则会使估计的密度函数曲线过于平滑而丢失很多的有用信息,不能准确地表示密度函数曲线的变化情况。因此,有必要对带宽叫进行优化以顺利地进行核密度估计,得到更为准确的密度函数。
在本文中,采用了文献中所述的算法来选取核密度估计中的最优带宽w*,其过程主要有:
3余弦相似度和相关系数
齿轮箱若处于同一或者大致相同的故障状态,那么相同工况下采集到的振动信号在频谱上会有相似的密度函数曲线,而不同故障状态下振动信号频谱的密度函数曲线则有较大的差异。为了衡量密度函数曲线之间的相似性或者差异性,引入余弦相似度和相关系数两个参数。
4频谱密度函数相似性比较的齿轮箱故障诊断方法
5应用实例研究
5.1齿轮箱试验台
齿轮箱试验台由驱动电机、摆线针轮减速箱、双列圆锥滚子轴承、二级行星增速箱、一级平行轴增速箱、转矩转速仪以及加载电机等部件组成,如图2所示。试验台电气控制主要由SiemensS120变频驱动系统来实现。数据采集硬件系统由NI9324模拟量输入模块、NI 9401数字量I/O模块配以NI CDAQ-9132机箱组成,软件系统则由NI LabView编程实现。
试验研究所用齿轮箱为一级平行轴齿轮箱,其工作于增速状态,增速比为2.45。通过人工的方法在试验齿轮箱上先后加工出小齿轮磨损(F1)、小齿轮断齿(F2)、大齿轮磨损(F3)与大齿轮断齿(F4)这4种故障状态,如图3所示,在每种故障状态下对试验齿轮箱进行运转试验。在试验中,控制驱动电机转速为700r/min,加载电机施加载荷为3N·m,从而得到试验齿轮箱的输出转速为1347r/min。振动传感器测量试验齿轮箱垂直方向上的振动数据,其采样频率为5.12kHz。
5.2密度函数相似性比较
针对试验齿轮箱的5种故障狀态(正常状态F0与上述的4种故障状态),采集得到5×50组长度为2048的振动数据。对于每种故障状态,选取其20组振动信号,分别先后进行频率分布直方图求取、核密度估计,然后将得到的20个密度函数进行算术平均化,最终得到该故障状态的标准密度函数。
针对试验齿轮箱的每种故障状态,选取余下的30组振动数据作为测试数据,分别求取其密度函数,然后计算各密度函数与前述5个标准密度函数之间的余弦相似度s值与相关系数p值。限于篇幅,这里将每种故障状态前3组测试数据的计算结果列入下表1中,其中i表示第i组测试数据。具体也可以从表1中看出。依此思路,分别利用余弦相似度值或者相关系数值,对每种故障状态的30组测试数据进行故障状态判别,最终的判别准确率列入表2中。
根据表1所示的计算结果,余弦相似度s与相关系数p之间呈较强的正相关性。测试数据的密度函数与标准密度函数之间的余弦相似度值越大,相关系数值也会越大。相对而言,相关系数对于齿轮箱的不同故障状态显示出更大的敏感性,能够更好地指示测试数据所对应的齿轮箱故障状态,这主要是因为密度函数数据的均值差异会对测试数据对应的故障状态判别产生一定影响,而相关系数的计算过程中对数据进行了去均值化处理。为作进一步说明,这里以试验齿轮箱故障状态F2的30组测试数据为例,其密度函数与5组标准密度函数之间的余弦相似度和相关系数变化曲线如图5所示。可以看出,相比于各条余弦相似度变化曲线,各条相关系数变化曲线之间有着更为显著的差距,界限范围更大。
5.3FFT频谱相似性比较
作为比较,针对试验齿轮箱的每种故障状态(F0,F1,F2,F3与F4),同样利用上述构建标准密度函数的20组振动数据,采用频谱算术平均化的方法计算得到每种故障状态的标准频谱;然后针对齿轮箱的每种故障状态,再同样选取上述的30组测试数据,计算其频谱与5组标准频谱之间的余弦相似度s值与相关系数p值。按照上述的试验齿轮箱故障状态判别方法,可以得到每种故障状态30组测试数据所对应故障状态的判别准确率,如表3所示。
为作详细比较,这里以故障状态F1和F2的30组测试数据的判别为例进行说明。
首先,F1的30组测试数据密度函数与F1和F2的标准密度函数之间的余弦相似度,以及30组测试数据的频谱与F1和F2的标准频谱之间的余弦相似度,变化曲线如图6所示。同样,与之相对应计算的相关系数变化曲线如图7所示。
其次,F2的30组测试数据密度函数与F1和F2的标准密度函数之间的余弦相似度,以及该30组测试数据的频谱与F1和F2标准频谱之间的余弦相似度,变化曲线如图8所示。同样,与之相对应计算的相关系数的变化趋势如图9所示。
最后可以看出,F1测试数据的密度函数与F1和F2标准密度函数之间的余弦相似度、相关系数,以及F2测试数据的密度函数与F2标准密度函数之间的余弦相似度、相关系数,变化趋势是比较稳定的,而且基本上线性可分。但对应频谱与标准谱之间的余弦相似度与相关系数,变化曲线的波动则比较剧烈,而且基本上线性不可分。产生这种现象的主要原因是受数据采集硬件、齿轮箱工况以及运行环境等因素的影响,齿轮箱振动信号频谱的一些细节结构会发生较大变化,对直接的频谱相似性比较会产生一定的影响,而频谱密度函数反映的是频谱的概貌,剔除了频谱细节结构对故障状态判别的影响,因此频谱密度函数的相似性比较具有较强的抗噪性。
6结论
针对经常运行在额定工况或者某一稳定工况下的齿轮箱,可以利用振动信号频谱核密度估计方法对其各个典型故障状态建立标准密度函数,然后计算齿轮箱在未知故障状态下采集振动信号的频谱密度函数,以及该密度函数与各个标准密度函数之间的余弦相似度值和相关系数值,以余弦相似度或者相关系数最大值所对应的标准密度函数来判别齿轮箱所处的具体故障状态。其中,相关系数比余弦相似度更能够显著地呈现不同故障状态之间的差异性,因而相关系数能更准确地指示齿轮箱的具体故障状态。此外,相比于直接的频谱相似性比较,频谱密度函数相似性比较方法对于齿轮箱故障状态的判别具有更高的准确率,其余弦相似度曲线和相关系数曲线的变化趋势更为平稳,且曲线之间基本上线性可分,这为齿轮箱智能故障诊断的实现提供了一种可行的方法。