APP下载

基于MFCC和MDE-SVDD的滚动轴承音频信号异常检测方法

2024-02-26邓艾东范永胜梁志宏傅行军

动力工程学报 2024年2期
关键词:音频轴承噪声

高 原, 邓艾东,, 范永胜, 梁志宏, 傅行军

(1.东南大学 大型发电装备安全运行与智能测控国家工程研究中心,南京 210096;2.东南大学 能源与环境学院,南京 210096; 3.国家能源集团江苏电力有限公司,南京 215433)

旋转机械设备对于制造业的发展十分重要,风电机组滚动轴承是大型旋转机械中的关键部件,在运行过程中承受巨大的负载,易发生故障,导致整个系统停机,从而对生产过程的安全运行造成巨大影响。同时在正常工业生产中,设备长期处于正常运行状态,正常样本数据丰富而各类故障工况的异常样本数据获取困难,因此对滚动轴承进行早期故障诊断和异常状态监测具有重要意义。

马天霆等[1]提出一种基于有理样条插值的局部均值分解算法,并将其应用于滚动轴承早期微弱故障的诊断。张西宁等[2]采用改进随机森林实现了针对单类轴承样本的异常检测。冯辅周等[3]提取排列熵等特征参数,通过神经网络完成对异常模式的分类。尹爱军等[4]提出了一种基于变分自编码器的轴承状态评估方法,通过变分推断的方式,从振动信号频域中学习潜在的状态概率分布,并将其应用于轴承的运行状态评估。单龙飞等[5]针对系统的动态特性,使用软阈值和自编码器(AutoEncoder,AE)结合的方法进行特征提取。

基于信号处理的方法需要人为提取传统特征,不同工况下的故障需要提取不同的特征,而神经网络又面临着无法提取轴承运行深层特征,模型诊断效率不高的问题。支持向量机(SVM)作为一种解决小样本、非线性和高维模式的代表性机器学习方法,已被广泛应用于滚动轴承故障诊断[6]。支持向量数据描述(SVDD)[7]是一种有效的单值SVM,该方法仅需正常样本进行模型训练,这为实际生产中的异常数据匮乏问题提供了解决途径。王斐等[8]提出了一种基于变分模态分解提取分量奇异值特征,结合SVDD模型的滚动轴承性能退化评估方法。

然而SVDD只考虑了数据点与超球体之间的核距离,未考虑数据的密度分布情况,使得到的超球体忽略那些高密度区域,一些受到噪声影响的边缘样本在模型训练时受到同等对待[9],使模型的准确性和抗噪性能下降。滚动轴承工作过程中,传动系统的零部件以及外界会存在严重噪声干扰现象,这对该情况下实现滚动轴承故障的准确识别提出了严峻的挑战。同时,SVDD在大样本下计算性能较差,需要人为提取特征,因此其与新的特征提取方法的结合有待深入研究。

大型旋转设备一般处于长期工作的状态,启停不易,传统的振动信号故障诊断技术因为接触式测量、传感器不易安装等缺点,在某些场景下使用不便。而声音传感器具有设备简单、安装灵活、信号易获取等优点,可以实现非接触测量。同时声纹特征,例如线性预测编码(Linear Predictive Codes, LPC)、梅尔倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)等由于提取简单、预测精度高等优点,在语音识别领域有着广泛应用[10]。在工业领域,基于声纹特征的故障诊断也有所使用,周宴宇等[11]研究了梅尔倒谱系数和线性预测倒谱系数在滚动轴承不同类型故障下的诊断效果。但使用音频信号进行轴承异常检测的研究仍有较大空白。

综上所述,考虑到滚动轴承运行数据易受噪声干扰导致密度分布不均匀的问题,笔者提出一种基于MFCC和马氏距离加权支持向量数据描述(MDE-SVDD)的滚动轴承音频信号异常检测方法,将基于马氏距离的加权系数引入SVDD优化问题的松弛变量中,仅使用轴承正常运行状态下的音频信号样本数据作为模型的输入,提取其梅尔倒谱系数作为特征向量,使用MDE-SVDD对不同噪声背景、运行状态下的滚动轴承音频信号进行二分类的异常检测,并将结果与传统SVDD和AE 2种模型进行比较。

1 理论基础

1.1 MFCC特征

MFCC利用人类对声音频率非线性变化的感知能力,将声音频谱转换为梅尔频率尺度,与正常的对数倒频谱中线性间隔的频带相比,更接近人类的听觉系统,使声音信号有更好的表示。逐条计算滤波频谱的能量,得到的参数反映了各频带的频谱能量分布。MFCC提取流程如图1所示。

图1 MFCC提取流程图

步骤1,对输入的连续声音信号进行预处理,包括预加重、分帧和加窗等步骤。预加重可以对声音信号的高频分量衰减进行弥补,其公式如下:

(1)

分帧是将音频样本分为长度相等的片段的过程,其目的是使每一帧内的信号具有短时稳定性。两相邻帧之间有一段重叠区域,称为帧间隔或者帧移。

为了增加信号两段的连续性,对每个分帧信号施加汉明窗变换,其函数h(n)如下:

(2)

假设分帧后的信号为s(n),n=0,1,…,N-1,其中N为帧的大小,乘以汉明窗之后:

S(n)=s(n)·h(n)

(3)

步骤2,预处理后的信号S(n)经过快速傅里叶变换(FFT)得到频谱X(k),计算式为

(4)

步骤3,求X(k)的平方获得能量谱,之后使用M个MEL带通滤波器进行滤波,第p个滤波器的传递函数为

Hp(k)=

(5)

步骤4,计算滤波器组的对数能量,第p个滤波器组的对数能量C(p)为

(6)

步骤5,计算得到的对数能量经过离散余弦变换(DCT)可得到梅尔倒谱系数:

0≤i

(7)

式中:M也表示MFCC特征的维数。

1.2 SVDD

SVDD是一种异常检测算法,主要思想是求解一个包围尽可能多正常样本的最小超球体。

对于m个样本点x(1),x(2),…,x(m),假定这些样本点分布在一个球心为a、半径为R的球中。那么样本x(i)满足:

(x(i)-a)T(x(i)-a)≤R2

(8)

而样本训练集中难免存在一些噪声或者异常值,为了提高超球体对异常数据的鲁棒性,引入松弛变量ξ,允许部分样本不在这个超球体之内,于是优化问题的目标函数转化为

(9)

其中C>0由人为设置,是一个惩罚因子,也就是正则化参数,代表着以多大程度拒绝目标样本或者以多大程度接受异常点样本。

1.3 MDE-SVDD

传统的SVDD使用训练集样本训练模型时,模型对所有的样本采取相同设置,没有考虑样本数据自身的密度分布。在训练集的正常样本数据中,存在一些密度稀疏的离群样本会对模型的构建产生负面效果。因此,笔者决定对样本赋予不同的权重,聚集程度高的样本应具有较大的权重,同时削弱离群点对超球体的影响。

马氏距离[12]表示数据的协方差距离,能够有效计算2个未知样本的相似度,可以看作是欧氏距离的一种修正,其考虑了各个维度特性之间的关联性,修正了欧式距离中各个维度尺度不一致且相关的问题。

对于一个均值为μ=(μ1,μ2,μ3,…,μm)T,协方差矩阵的逆矩阵为Σ-1的多变量向量x=(x1,x2,x3,…,xm)T,其中样本向量到均值的马氏距离DM(xi)为

(10)

本文距离权重系数λi计算方法如下:

(11)

式中:DM,avr为所有样本到均值马氏距离的平均值;DM,max、DM,min为DM(xi)中的最大值和最小值,考虑到其中距离最大值的点也不应完全排除这类偏差点对模型训练的影响,故添加修正系数ε=0.01。

使用距离权重系数λi乘以式(9)中的松弛变量ξi,将马氏距离加权引入SVDD,则目标函数变为

(12)

使用拉格朗日乘子法,将原问题转化为对偶问题,并引入核函数,将这一问题变形为

(13)

从而该问题的决策函数f表示为

(14)

式中:L(α)为拉格朗日函数;αi、αj为优化参数;z为决策变量,代表待测样本点的坐标。

核函数表征了样本从低维到高维的特征映射,影响模型的表达性能。目前,常用的核函数包括线性核函数、多项式核函数、高斯核函数(也称径向基函数(RBF))。

2 滚动轴承音频信号采集与分析

2.1 实验台介绍

利用实验室的传动系统实验台搭建音频信号采集系统,实验台驱动电机功率为3 kW,音频信号采集系统由电容式麦克风、话筒放大器、声卡和电脑组成,其中麦克风的频率响应为20~2×104Hz;声卡采样率为44.1 kHz,量化位数24位。考虑到安全性和信号采集准确性的平衡,将声音传感器的麦克风放置于正对滚动轴承约25 cm处。滚动轴承音频信号采集系统如图2所示。

(a) 滚动轴承音频信号采集示意图

2.2 实验方案

本实验对滚动轴承在正常运行以及在外圈裂纹、内圈裂纹、内外圈裂纹和滚动体故障共5种运行状态下的音频信号进行采集。滚动轴承型号为NSK-uc210,各状态轴承如图3所示。

(a) 正常

传动链系统的驱动电机转速为900 r/min,采样频率为22 050 Hz,考虑到每个信号样本应至少经历轴承运行一圈的时长,每种类型的轴承运行声音信号以25 ms即5 120个点为一组样本进行采集,对正常运行轴承连续采集350 s的数据,对各类异常样本连续采集200 s的数据。

由于工业现场环境复杂,对音频信号采集时,通常有噪声干扰存在。为了进一步验证模型性能,将高斯白噪声添加到采集到的声音信号中,构建信噪比分别为10 dB、0 dB和-5 dB的加噪信号。

绘制样本时频图,之后对采集的连续音频信号进行预加重、分帧、加窗,再提取其梅尔倒谱系数。按帧长25 ms(5 120),帧移2 048处理,对于正常样本获得13维的梅尔倒谱系数共3 769组,对于4类异常样本各获得2 154组样本。

将正常样本的13维数据划分出2 000组训练样本送入马氏距离加权SVDD进行模型训练,之后将剩下的1 769组正常样本和8 616组异常样本送入仅使用正常样本训练的模型进行测试。

本文模型的核函数取高斯径向基核函数,惩罚因子C=0.5,映射参数γ=0.01。

采用正确率(TPR)、真阴率(FPR)和准确率(Acc)对异常检测算法进行性能评估。TPR表示正常样本被识别为正常的概率;TNR为异常样本被识别为异常的概率。具体计算公式如下:

(15)

其中,TP代表正常数据被检测为正常的数量;FP代表异常数据被检测为正常的样本数量;TN代表异常数据被检测为异常的数量;FN代表正常数据被检测为异常的数量。

3 结果与分析

图4为一组轴承处于正常状态和故障状态(外圈裂纹)下采集的运行音频信号时频图。图4(a)、图4(b)为时域波形图,可以观察到轴承正常运行状态下的波形更加平稳,而异常运行状态下的轴承在波峰、波谷时具有更突出的峰值。

(a) 正常运行时域图

图4(c)、图4(d)为音频信号频域图。可以看出,轴承运行时幅值较大的音频信号集中在低频区,且正常轴承和故障轴承的频域图出现了3处相同的峰;而在479 Hz附近,故障轴承出现了正常轴承运行没有的显著峰值。这种差异表明了使用音频信号进行轴承状态异常检测的可行性。

将音频信号从时域映射到频域,获得13维的梅尔倒谱系数,其可视化效果如图5所示,其中纵坐标为映射后的梅尔频率,图中同样可以看出正常和异常状态下音频信号在低频区的差异。

(a) 正常运行

图6为使用正常样本构建的SVDD超球体结果。其中距离为模型的决策函数计算样本到超球体球心的距离。

图6 SVDD超球体构建

不同信噪比下各异常状态的检测结果如表1和图7所示,对正常(异常)测试样本分别以TPR(TNR)表示模型识别正确率。在无噪声/轻微噪声(10 dB)情况下,MDE-SVDD模型都取得了接近100%的识别正确率,甚至在强噪声背景(-5 dB)下仍有接近90%的检测精度。

表1 不同信噪比下各运行状态的识别正确率

图7 不同噪声下轴承运行状态识别结果

从表1和图7可以看出,对于不同类别的异常样本,模型表现出相近的检测效果,没有出现针对某一类特定异常状态的偏好。此外,在同一信噪比下,模型对正常样本的识别率(TPR)总是低于对各类异常样本的识别率(TNR),这表明该模型以相对更大的概率选择拒绝所有样本,这使模型更易识别出异常状态,但同时也拒绝了一些正常样本,造成虚警率的增大。

选取普通SVDD、AE进行异常检测性能对比研究,将4种异常状态和正常状态数据混入测试集中,比较3种分类算法的平均准确率,结果见表2。其中普通SVDD的参数与MDE-SVDD相同;AE输入层单元数为5 120,隐藏层单元数为25,以重构信号与原信号的相关系数取固定阈值进行判别。

表2 不同信噪比下各模型的平均准确率

从表2可以看出,MDE-SVDD模型的平均准确率均高于90%,而随着噪声强度的增大,MDE-SVDD与普通SVDD模型的平均准确率差距在增大。在强噪声(-5 dB)背景下,MDE-SVDD的平均准确率为91.99%,比普通SVDD时提升了7.73百分比,这表明MDE-SVDD具有更好的抗噪性能。

4 结论

(1) 本文针对滚动轴承运行异常检测问题,将基于音频信号的MFCC特征应用到模型中,提出了一种基于马氏距离加权的支持向量数据描述方法,解决了传统SVDD没有考虑数据密度分布、轴承运行信息易受噪声干扰的缺点。

对于不同的故障类型声信号数据进行异常检测,MDE-SVDD均达到了优秀的检测效果,验证了使用音频信号以及MFCC特征进行异常检测的有效性。

(2) 在低信噪比(-5 dB)背景下,MDE-SVDD的异常检测平均准确率达到91.99%,显著高于传统SVDD模型,表明其具有良好的抗噪性能,可以更好地运用于复杂的工业场景。

猜你喜欢

音频轴承噪声
轴承知识
轴承知识
轴承知识
轴承知识
噪声可退化且依赖于状态和分布的平均场博弈
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
控制噪声有妙法
音频分析仪中低失真音频信号的发生方法
Pro Tools音频剪辑及修正