车内异响自动识别方法研究
2019-09-26顾灿松房宇王东
顾灿松 房宇 王东
(1.中国汽车技术研究中心有限公司,天津 300162;2.江苏大学,镇江 212013)
主题词:车内异响识别 Mel频率倒谱系数 小波包能量 支持向量机 NVH
缩略语
MFCC Mel Frequency Cepstrum Coefficient
SVM Support Vector Machine
GUI Graphical User Interface
FFT Fast Fourier Transform
DCT Discrete Cosine Transform
HMM Hidden Markov Model
GMM Gaussian Mixture Model
ANN Artificial Neural Network
0 引言
车内的异响问题是消费者和整车厂普遍关注的一个问题,车内异响的识别是寻找异响声源并进行改进优化的重要前提。目前在整车异响测试实验中,主要依靠实验人员通过主观评价的方法寻找异响声源,这对实验人员的经验水平要求较高。通过声音识别的方法实现对车内异响的自动识别,可以快速准确地检测是否存在异响问题,并确定异响声源,从而指导实验人员进行改进优化。声音信息具有良好的实时性,对整车异响测试具有较好的辅助作用。
随着故障诊断不断趋于智能化,对异响的自动识别也提出了更高的要求。2015年,重庆大学李爽开发出一套基于Labview平台的发动机异响在线检测系统,通过提取不同异响信号的极坐标镜像图并进行匹配系数分析,可以准确得到故障类型[1]。2016年,沈阳理工大学邹鹏飞采用小波能量识别法对汽车齿轮齿条转向器的异响进行识别,并取得了较高的识别率[2]。
但是目前对车内各零部件的异响识别研究较少,并且现有的异响识别方法仍有很大的提升空间,故本文结合现有的研究成果,并引入语音识别中的主流特征参数Mel频率倒谱系数,对车内几种常见的异响声音进行识别。
1 车内异响识别系统
车内异响识别系统如图1所示。车内异响的识别主要分为3个部分:异响声音的特征参数提取、参数学习和待测声音的识别[3]。
图1 异响声音识别系统[3]
异响信号的预处理分为端点检测、预加重、分帧加窗3个步骤。对预处理后的信号进行特征参数提取,得到训练样本和测试样本的特征参数集。将训练样本的特征参数集输入进行训练,得到一个异响声音的分类模型,同时调用生成的模型对测试样本进行识别,输出异响声音的类型。
2 异响信号的特征参数
2.1 异响信号的时频图分析
特征参数选取的好坏直接影响识别的正确率。好的特征参数可以更直接地描述信号的特征,从而提高识别精度。不同的异响声音由于其产生原因不同,其信号在时频图上的特征也不同。图2和图3分别是车内常见的仪表板手套箱卡扣异响和座椅导轨碰撞异响的时频图,其中X轴的坐标为频率/Hz,Y轴的坐标为时间/s,Z轴的坐标为帕斯卡/Pa,由时频图可以看出两者在不同频段的能量分布存在差异,其在500~1 000 Hz和1 500~3 000 Hz的频率分布有较明显的不同。
针对不同异响信号频率的变化特性与频带分布差异,本文引入语音识别主流参数Mel频率倒谱系数,以及小波包能量两种特征参数来表征异响声音的特性,并将两者结合形成混合特征参数,对比识别率。
图2 仪表板手套箱卡扣异响
图3 座椅导轨碰撞异响
2.2 Mel频率倒谱系数
Mel频率倒谱系数(MFCC)可以表示声音短时功率谱的包络特性,间接地反应声音信号的能量变化特性。由于人耳对频率的响应与实际频率成非线性对应关系,故在声音信号处理中,先对频率进行Mel尺度的转换,这样更符合人耳的听觉特性[4]。Mel尺度转换公式为:
式中f为实际频率,Mel(f)为人耳的感知频率。
MFCC特征参数提取过程如图4所示[5]:
图4 MFCC参数提取过程[5]
MFCC具体计算过程如下:
(1)将预处理后的信号进行傅里叶变换(FFT),将频谱通过Mel尺度转换的滤波器组,实现Mel尺度的转换。Mel滤波器在频域上为Mel频率轴上均匀分布的重叠的三角窗[6]。
(2)对滤波器组输出的转换后的频谱取平方,得到能量谱P()k。其中k为经过傅里叶变换计算后信号采样点的编号。
(3)对得到的能量谱取对数,得到对数能量谱s(m)。
其中Hm(k)为第m个三角带通滤波器的传递函数。
(4)将对数能量谱作离散余弦变换,最终求得MFCC特征参数。
式中,N为MFCC参数值的维数,n代表参数中的每一阶,取值范围为0~N-1,M为Mel滤波器组中三角滤波器的个数。
2.3 小波包能量特征参数
小波包变换是目前在声音信号分析中常采用的一种时频分析方法,它可以反映信号非平稳、时域和频域局部化的特性。与小波变换相比,小波包变换不仅对低频部分进行分解,对高频部分也实施了分解,而且小波包分解可以根据信号特性和分析要求自适应地选择相应频带与信号频谱相匹配,是一种精细的分解方法[7]。图5是4层小波包分解的示意图。
图5 4层小波包分解示意[7]
不同的异响声音信号由于其产生机理不同,在时频谱中的频带分布特性也是不同的。小波包分析可以将信号无遗漏、正交地分解到各个独立频带内[8],通过计算不同频带内信号具有的能量,作为识别不同异响声音的特征参数。
小波包能量参数提取流程如下:
(1)将信号进行小波包分解,分解层数依据信号的采样频率和复杂程度决定,然后将分解得到的各层小波包系数用Mallat算法重构[9]。
(2)求取重构的各频带信号的总能量。
(3)构造特征向量,将各频带的能量进行归一化处理,并按照从低频到高频的顺序将能量元素构造成特征向量集。
3 异响声音识别模型
提取异响声音信号的特征参数之后,需要对其进行建模与训练,得到异响声音的模板库。对待识别的声音信号提取特征参数后并与模板库进行模式匹配,最终得到识别结果。
在声音识别领域常用的识别模型有隐马尔科夫模型(HMM)、支持向量机(SVM)、高斯混合模型(GMM)和人工神经网络(ANN)等[10]。本文采用支持向量机对异响信号的特征参数进行建模与分类。
支持向量机(SVM)是依据统计学原理发展起来的一种机器学习方法。它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,在机器学习中可以分析数据、模式识别以及分类和回归分析[11]。在声音识别中。它可以看作是一种分类器,可以将两种或多种样本准确地分开,并使经验风险和真实风险都尽可能地小[12]。结合本文异响声音信号小样本与非线性的特点,选择SVM作为异响识别的分类器。
4 异响识别实验
4.1 实验环境
本文中的异响声音信号采集环境为某汽车技术研究中心的异响半消声实验室,背景噪声控制在20~30 dB之间。识别阶段的实验在PC机的Windows 10操作系统环境下实现,实验所采用的软件是MATLAB R2018a。实验样本采集设备为LMS数采前端和声传感器。样本包含4种车内常见异响声音:座椅导轨碰撞异响、手套箱卡扣异响、车窗共振异响和空调口异响。每种异响采集150个样本用于模型的训练,分别来源于5个问题样件,每个样本的时常为2 s,采样频率为48 000 Hz。
图64 种异响的MFCC参数值
4.2 特征参数提取
实验过程中声音信号预处理的分帧帧长为1 024个样本点,帧移为512个样本点,所加窗为Hamming窗。提取的MFCC特征参数为36维。图6为提取出的4种异响声音某一帧的MFCC参数值。
由对信号的时频分析可知,4种常见的车内异响声音信号的能量所分布的频段存在差异,且主要分布在3 000 Hz以内,由于采样频率为48 kHz,故对4种异响声音分别进行7层小波包分解,小波基选择多贝西小波,得到128个子频带,取前8个子频带作为主要研究对象,其频率范围如表1所示:
表1 小波包分解各频带频率范围
计算4种异响声音信号各子频带的能量值,并进行归一化处理,得到各子频带能量的百分比,作为特征参数。图7为计算出的4种异响声音各子频带的小波包能量的百分比均值图。
图7 小波包能量百分比均值图
将每个声音样本提取的36维MFCC参数值和8维小波包能量参数结合,形成44维混合特征参数矢量,用于后续识别的正确率对比实验。
4.3 识别结果分析
4.3.1 特征参数选择对识别率的影响
将训练样本集的特征参数矢量输入到SVM中进行训练,得到一个异响声音模型,SVM的核函数选择高斯核函数。同时对测试样本提取特征参数矢量,并调用建立好的异响声音模型进行识别,最终输出识别的结果。
对每种异响信号采集90组样本用于测试,最终得到每种异响的识别率。表2为不同特征组合对4种车内异响的识别率。
表2 不同特征组合异响识别率
由表2的识别率可知,采用MFCC作为异响声音的特征参数,可以取得平均88.35%的识别正确率,其中对车窗共振异响的识别率最高,达到91.1%。采用小波包能量作为特征参数取得的平均识别率为82.5%,识别错误的次数相对MFCC较多,其中空调口异响的识别率最高,而手套箱卡扣异响的识别正确率只有81%,错误次数最多。而将MFCC与小波包能量结合,形成新的混合特征参数,扩充参数向量的维数,此时取得了平均90.8%的识别正确率,其中对4种异响声音的识别正确率均超过了90%,相较于单参数的识别效果取得了明显的提升。
4.3.2 异响识别系统与实验人员识别率的对比
为了体现本文异响识别系统识别的可靠性,还进行了基于异响识别系统与基于实验人员主观评价两种方法的异响识别实验对比。
实验中邀请了3名具有汽车异响相关工作经验的实验人员,在声品质实验室中采用主观评价的方法对各种异响声音进行辨别。在事先未告知实验人员异响声音种类的情况下,3人对用于上述模型测试的各种异响声音进行识别。分别取每种异响的5个问题样件的10个声音样本用以主观评价测试。表3为基于实验人员主观评价方法得到的识别率。
表3 基于实验员主观评价法的识别率
由表3的识别率可以看出,基于实验人员主观评价的方法得到的异响识别率受经验的影响较大,识别率波动较大,且平均识别率都低于异响识别系统的识别效果。对比可知,本文的异响识别系统相较于目前异响实验中主要采用的主观评价方法,可以显著提高识别率,减小经验差异对识别结果的影响,快速识别出异响的种类。
4.4 异响识别系统GUI界面
为了方便试验测试中便捷地使用本文的异响识别系统,在MATLAB中采用GUI界面进行子程序的综合,编写出GUI界面方便实际测试的使用,其主界面如图8所示。
图8 异响识别系统GUI界面
5 结论
本文对车内常见的4种异响声音的识别进行研究,通过提取异响声音信号的MFCC参数值与小波包能量参数值,形成混合特征参数,利用SVM建立识别模型,同时调用模型对待测信号进行识别,输出识别结果。
经过多组实验验证,将MFCC参数值与小波包能量参数值结合,形成混合特征参数,可以更好地表征各异响信号的特点,相较于单特征参数可以取得更高的识别率,同时将异响识别系统得到的识别率与基于实验人员主观评价方法得到的识别率对比可得,本文的识别方法相较于主观评价法可以消除实验人员经验差异对识别结果的影响,显著提高识别效果。因此,本文提出的基于MFCC与小波包能量和SVM的异响识别方法是可行的。