APP下载

基于声学特征的微电机故障诊断方法

2022-04-19刘艳杰陈炳发丁力平

机械制造与自动化 2022年2期
关键词:准确率卷积能量

刘艳杰,陈炳发,丁力平

(南京航空航天大学 机电学院,江苏 南京 210016)

0 引言

微电机,全称是微型电动机,是指直径<160mm或者额定功率<750mW的电机,经常被用于控制系统中实现机电信号的解析运算和转换等功能。微电机装配过程已经实现了自动化,但是在最终质量检测环节中,却要依赖有经验的工人听微电机的转动声音来判断是否有噪声故障。虽然人耳是个极为精密的器官,但人耳对微电机装配质量的判定受诸多因素的影响,不同人对同一微电机、甚至同一个人对同一台微电机的多次判定结果均可能不一致,因此识别率难以得到保证。随着数字信号处理[1]和机器学习[2]等技术的发展,将机器学习技术用于声音信号处理,以实现生产线中微电机装配质量的智能化识别,有利于提高装配质量的检测精度和效率。

基于声学特征的故障诊断主要包含特征提取和故障分类两个部分。电机在运行的过程中,会由自身的振动产生噪声,噪声信号中包含着电机的状态信息。当发生故障时,其噪声的振幅、频域都会发生变化[3]。声音信号的特征参数一般可以分为时域特征、频域特征和倒谱域特征[4]。信号处理的方法一般为时频分析方法,主要有小波变换[5]和经验模式分解[6]。胡文明等[7]对微电机声音信号进行小波包能量谱分析,将信号分成不同频段,通过每个频段内能量分布的不同来识别故障类型。HUANG N E等[8]提出了经验模态分解方法(EMD),这种分解方法是自适应的,适用于非线性和非平稳过程。

梅尔频率倒谱系数(mel frequency cestrum coefficient,MFCC)[9]将人耳的听觉感知特性和语音的产生机制相结合,广泛适用于音频信号处理。语谱图是语音频谱图,它表达了语音信号不同频段的信号强度,在语音情感识别中广泛应用此特征[10]。卷积神经网络(CNN)[11]是一种深度监督学习下的机器学习模型,具有很强的适应性,便于挖掘数据的局部特征,在语音识别、图像处理[12]等领域都取得了很好的成果。

本文提出了一种基于声学特征的微电机故障诊断方法,以融合CNN模型作为声音识别模型。首先利用声音采集装置获得微电机转动声音信号,然后提取信号的MFCC、短时能量和语谱图等声学特征,最后将提取的特征数据输入到模型中进行故障识别。本文对该方法的设计与实现的过程进行阐述。

1 微电机故障诊断的整体流程

本文提出的微电机故障诊断方法的整体流程如图1所示,主要包含以下5步。

图1 微电机故障诊断的整体流程

1)声音信号采集:使用声音传感器采集微电机声音信号,并进行预处理;

2)特征提取:提取声音信号的39维MFCC、短时能量和语谱图特征,用于后面的分析识别;

3)模型识别:将MFCC和短时能量输入1D-CNN(一维卷积神经网络)模型,语谱图输入2D-CNN(二维卷积神经网络)模型中,分别得到各自识别的结果;

4)模型融合:给不同模型识别的结果赋予不同的权重,以提高识别的准确率;

5)故障识别:输出微电机的故障类型。

2 微电机声音信号采集及特征提取

2.1 声音信号采集

本文研究的微电机型号是24BYJ46,微电机声音信号使用隔音装置采集,没有环境噪声。首先将微电机接通电源,将声音传感器靠近微电机进行采集,采样频率是16kHz,采样位数是16位,采样点是30 000,信号的保存格式是无损的WAV格式。采集的声音信号有4种,正常微电机转动声音、齿轮啮合不良故障、擦铁异音故障、内有垃圾故障。每种信号有480个样本,总共1 920个样本。4种微电机声音信号的时域波形图如图2所示。

图2 4种微电机声音信号的时域波形图

2.2 特征提取

a)梅尔频率倒谱系数

梅尔频率倒谱系数是基于人耳的听觉特性提出来的,它与频率成非线性对应关系。MFCC是一种常用的音频特征,广泛应用于自动语音和说话人识别中。在实际应用中,MFCC特征提取的过程[13]如图3所示,具体计算过程如下。

1)预加重。将采集的声音信号s(n)通过一个高通滤波器,以增强声音信号中的高频部分。高通滤波器的传递函数为

X(n)-s(n)-a×s(n-1)

(1)

式中a为预加重系数,值介于0.9~1.0之间。

2)分帧。声音信号具有短时平稳性,分帧的过程就是将一段声音信号分成N段,每一段为一帧,通常情况下每帧涵盖的时间约为20~30ms,为了避免相邻两帧之间变化过大,因此会让两帧之间有一段重叠的区域,称为帧移,一般为帧长的一半左右。

3)加窗。加窗可以增加帧两端的连续性,减少频谱泄漏。常用的窗函数是汉明窗(Hamming),表达式如下为

(2)

式中N为窗长,即帧长。

4)DFT。将声音信号进行离散傅里叶变换后得到频谱,将频谱取模平方得到信号的能量谱。声音信号的频谱为

(3)

5)Mel滤波器组。求出能量谱后,用M个Mel带通滤波器组进行滤波,将每个滤波频带内的能量进行叠加,这时第k个滤波器输出功率谱x′(k)。

6)对数运算。对m个滤波器组的输出取对数运算,得到相应频带的对数功率谱。计算公式为

(4)

式中:s(m)是对数功率谱;Hm(k)是滤波器组。

7)DCT。将对数功率谱进行DCT(离散余弦变换),得到L个MFCC系数,计算公式为

(5)

式中c(n)是第n个MFCC系数。

8)动态差分参数的提取。上面直接得到的MFCC特征只反映了信号的静态特征,对这种静态特征做一阶、二阶差分,可得到相应的动态特征。差分参数的计算公式为

(6)

式中:d(t)表示第t个一阶差分;c(t)表示第t个倒谱系数,Q表示倒谱系数的阶数;K表示一阶导数的时间差,可取1或2。将上式结果再代入就能得到二阶差分的参数。

图3 MFCC的提取过程

b)短时能量

声音信号的能量随时间变化比较明显,其短时能量可以分析这些幅度的变化。对于信号x(n),短时能量的定义如下:

(7)

式中h(n)=w2(n)。

4种微电机声音信号的短时能量如图4所示。

图4 4种微电机信号的短时能量图

c)语谱图

语谱图是语音频谱图,它的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于语谱图采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色越深表示该点的语音能量越强。语谱图表达了语音信号不同频段的信号强度,便于观察频率随时间的变化情况。通过语音信号获得语谱图的过程如下:

1) 获取音频数据;

2) 将声音信号分帧加窗;

3) 对帧信号进行FFT,得到帧信号的频谱;

4)将各帧频谱叠加,得到整个声音信号的语谱图。

4种微电机声音信号的语谱图如图5所示。

图5 4种微电机信号的语谱图

3 微电机故障声音信号识别及结果分析

3.1 融合CNN模型

本文训练了两种模型:1D-CNN和2D-CNN,同时对微电机声音信号数据集进行训练,将两种模型训练输出的结果进行加权平均后再输出,获得模型融合后的识别结果。1D-CNN和2D-CNN模型融合的整体流程如图6所示。

图6 1D-CNN与2D-CNN模型融合过程

1D-CNN的网络结构包括输入层、2个卷积层、2个池化层、全连接层和输出层。该网络的输入是大小为40(39维MFCC和短时能量)的特征向量。第一个卷积层卷积核的数目为16,卷积核大小为8,步长为2,卷积后使用relu激活函数引入非线性因素,卷积后得到的特征向量用0填充边缘部分;第一个卷积层后连接第一个池化层对卷积后的特征向量进行压缩,以简化网络计算复杂度,采用大小为2的卷积核进行最大池化,得到16个大小为1×8的特征向量;第二个卷积层卷积核的数目为32,卷积核大小为8,步长为2,激活函数是relu, 边缘部分用0填充;第二个池化层采用大小为2的卷积核进行最大池化,得到32个大小为1×2的特征向量;第二个池化层后是全连接层,用来连接所有的特征,将输出值送给softmax分类器,经全连接层后得到的64维特征向量;最后一个是输出层,大小为4。

2D-CNN的网络结构包括输入层、2个卷积层、2个池化层、全连接层和输出层。该网络的输入是大小为32像素×32像素×3通道(RGB)的语谱图。第一个卷积层卷积核的数目为32,卷积核大小为3×3,卷积后使用relu激活函数引入非线性因素,卷积后得到的特征图用0填充边缘部分,使其大小保持不变;第一个卷积层后连接第一个池化层对卷积后的特征图进行压缩,以简化网络计算复杂度,采用大小为2×2的卷积核进行最大池化,得到32个大小为16×16的特征图;第二个卷积层卷积核的数目为64,卷积核大小为3×3,激活函数是relu,边缘部分用0填充;第二个池化层采用大小为2×2的卷积核进行最大池化,得到64个大小为8×8的特征图;第二个池化层后是全连接层,用来连接所有的特征,将输出值送给softmax分类器,经全连接层后得到的4 096维特征向量;最后一个是输出层大小为4。

本文采用加权平均法对2个模型的输出结果进行融合,加权平均的公式如下:

(8)

3.2 试验验证与结果分析

1)试验设计

从样本中随机选择70%的样本作为卷积神经网络的输入训练样本,剩下30%的样本作为测试样本。将训练样本提取特征值并分别输入到一维CNN和二维CNN模型中,获得训练模型;再将测试样本提取特征值并输入到训练好的一维CNN和二维CNN模型中并输出,然后将2个模型的结果融合后再输出,对比3种模型的输出结果。

2)状态编码

微电机状态对应编码表如表1所示。

表1 微电机状态对应编码表

编码后的向量便是CNN的输出向量。

3)结果分析

本文分析了3个模型:1D-CNN、2D-CNN和融合CNN。在融合CNN模型中,1D-CNN的权重为α1,2D-CNN的权重为α2,且α2=1-α1。融合CNN模型中每个模型的权重和识别准确率的变化如表2所示。当α1=0时,2D-CNN模型的准确率为91.67%;当α1=1时,1D-CNN模型的准确率为90.63%。当α1=0.4并α2=0.6时,准确率最高,为93.58%。故本文融合CNN模型中,取1D-CNN的权重为0.4,2D-CNN的权重为0.6。不同深度学习模型的故障识别准确率对比如表3所示。

表2 融合模型识别准确率

表3 不同深度学习模型的故障识别准确率对比

由表3可知,1D-CNN模型主要分析特征为时域特征和倒谱域特征,准确率为90.63%;2D-CNN模型主要分析特征为频域特征,准确率为91.67%,融合CNN模型集合了两个模型的优势,识别准确率为93.58%,比1D-CNN和2D-CNN的准确率各提高了2.95%和1.91%,平均提高了2.43%。

4 结语

本文提出了一种基于声学特征和融合CNN模型的微电机故障诊断方法。该方法提取了微电机声音信号的MFCC特征、短时能量和语谱图特征,并建立了一维CNN和二维CNN分类模型来进行识别,然后利用模型融合技术将两个模型训练的结果进行加权平均,充分发挥了不同模型的优势,提高了准确率。该方法具有很好的准确度,在实际的工程中有良好的应用前景。

猜你喜欢

准确率卷积能量
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
能量之源
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
诗无邪传递正能量