基于EMD与BP神经网络的汽车关门声品质预测*
2013-04-17于德介徐亚军
杨 川,于德介,徐亚军
(湖南大学,汽车车身先进设计制造国家重点实验室,长沙 410082)
前言
目前,汽车关门声品质的准确评价主要依赖于主观评价实验。它直接通过实验主观评价人们对声音的感受,并对实验数据进行统计分析,进而选择适当的术语来描述目标声音的主观感知特性。常用的声品质主观评价方法有等级评分法、排序法、语义细分法、幅度调节法和成对比较法等[1]。主观评价方法能准确、直接反映出声音的品质,但花费的时间和人力较多。针对这一问题,国内外学者研究出了一些声品质预测方法[2-3]。该方法首先进行少量主观评价实验,从而得出某类声音的主观评价值,并作为声品质预测的目标;然后通过多元线性回归、支持向量机和神经网络法等方法建立数学模型来描述声音信号的某种特征与主观评价值之间的关系,进而得到声品质预测值。声品质预测方法能有效减少主观评价实验的次数,提高声品质评价的效率。
声音信号特征的选取是声品质预测的关键,直接影响到预测的精度,目前国内外学者已经成功地将心理学参数[4]、信号能量、峰值和均值[5]等作为声音信号特征用于声品质预测。但汽车关门声音信号属于冲击信号,是典型的非平稳信号,仅通过时域或频域来提取信号特征并不能全面反映汽车关门声音信号的特点,从而影响声品质预测精度,应从时频联合域上提取信号特征。经验模态分解(empirical mode decomposition,EMD)是一种有效的自适应非平稳信号的时频处理方法,广泛应用于机械故障诊断中[6],本文中以汽车关门声音信号EMD分解的时频特征作为声品质预测的基础,研究建立了基于EMD与神经网络的汽车关门声品质预测模型。为验证该预测模型的准确性,同时建立了基于关门声音心理学参数与神经网络的声品质预测模型。通过对比两个模型的预测精度,证明了基于EMD建立的预测模型的声品质具有更高的预测精度。
1 基于EMD声音信号特征的提取
1.1 EMD
EMD是一种自适应的非平稳信号处理方法[7],它依据数据自身的时间尺度特征来进行信号分解,无须预先设定任何基函数。该方法的本质是对非平稳数据进行平稳化处理。使复杂信号分解为若干个频率由高到低排列的本征模函数(intrinsic mode function,IMF),所分解出来的各IMF分量包含了原信号的不同时间尺度的局部特征信号。一个IMF必须满足以下两个条件:(1)函数在整个时间范围内,局部极值点和过零点的数目必须相等,或最多相差一个;(2)在任意时刻,局部最大值和局部最小值的包络(上和下包络线)平均必须为零。
其分解过程如下。
(1)找出声压信号p(t)的所有极大值点,并用三次样条插值函数拟合形成原数据的上包络线;同样,找出所有的极小值点,并将所有的极小值点通过
本征模函数hi(t)反映信号中不同的频率成分,其分解结果完全依赖于信号本身,是一种自适应的分解方法。
1.2 声音信号特征的提取
声音信号特征提取的主要步骤如下。
(1)首先对声音信号进行滤波,去除人耳无法听见的20Hz以下的声音。
(2)对滤波后的信号进行经验模态分解,得出n 个本征模函数 hi(t),i=1,2,…,n。
(3)计算n个本征模函数的能量Ei作为该声音信号的特征:三次样条插值函数拟合形成数据的下包络线,上包络线和下包络线的均值记作m(t)。
(2)将声压信号p(t)减去均值m(t)得:
检查f1(t)是否满足IMF条件,若不满足,则将f1(t)作为待处理信号,重复以上步骤,直至满足IMF条件,记为h1(t)。
(3)计算第1次分解后的剩余信号p1(t):
(4)将剩余信号p1(t)作为待处理信号,重复以上步骤直到再没有满足IMF条件的分量被分解出,最终得出n个本征模函数,其残余信号记为r(t),则原始信号p(t)可表示为
式中T是采样时间。将式(5)离散化后得
式中:N为离散后的数据点数;Δt为采样时间间隔。由式(6)得出信号的特征向量:
2 声品质预测模型
2.1 声品质主观评价实验
本文中采用成对比较法对声品质进行评价。首先,按照排列组合方法,将n个汽车关门声音进行两两配对,则组合数m=n(n-1)/2;然后,让每一个评价者对各个组合进行选择,选出组合中评价者认为更喜欢的声音;最后,统计出i、j配对组合中i被选择的概率Pij(喜欢样本i声音的人数与总评价人数的比值),由式(7)计算出样本i的主观评价绩效值Mi[8]。
称Wi为主观评价值,它代表样本i声音的恼人程度。
2.2 BP神经网络模型
反向传播神经网络(back propagation neural network,BPNN)[9]是目前比较成熟且应用最广的一种前向型人工神经网络的结构形式。一般来说人耳对声音的主观评价过程是一个非线性过程,BP神经网络能够快速有效地反映多因素之间复杂的非线性关系,找出实验数据之间的潜在规律,建立有效的高精度非线性模型,避免传统线性回归方法的不足。一个3层的BP神经网络可以完成任意映射[10],因此本文中采用3层BP神经网络结构,输入层为IMF分量的能量,输出层为主观评价值,其结构见图1。
式中:Mi代表人们对样本i声音的偏好程度。通过将式(7)中自然对数真数分式的分子与分母对换,本文中引入类似但相反的另一个参数Wi:
2.3 声品质预测模型的建立
建立基于EMD与BP神经网络的声品质预测模型的主要歩骤如下:
(1)信号采集 采集若干样车的关门声压信号;
(2)经验模态分解 对声压信号进行经验模态分解,得出IMF分量;
(3)根据式(6)计算IMF分量的能量,形成特征量;
(4)主观评价实验 采用成对比较法得出样车关门声品质的主观评价值;
(5)神经网络训练 将IMF能量作为训练输入,主观评价值作为输出,训练BP神经网络,最终建立预测模型。
其相应的流程如图2所示。
3 应用实例
将声压传感器布置在距离门最外侧500mm,高1 600mm的位置。使用比利时LMS公司的信号采集设备及相应的TEST.LAB软件对30辆样车的关门声音进行数据采集。数据采集参数如下:采样频率为2 048Hz;谱线宽度为1Hz(频谱上相邻两点的间隔),图3为两辆具有不同关门声品质样车的关门声压信号。
从图中可以看出,样车28关门声压信号比样车4关门声压信号有较多的毛刺,表明样车28关门声压信号的高频分量较多。根据主观评价结果,样车28的声品质明显不如样车4。为更好地对比分析预测结果,建立了两个预测模型。它们分别以基于EMD的IMF分量和心理学参数(响度和尖锐度)作为神经网络的输入。
3.1 样车关门声品质主观评价实验
对30辆样车按成对比较法进行关门声品质主观评价试验,评价者中男生24人,女生6人,年龄在22~26岁。评价结果见表1。表中主观评价值越高,则声品质越差。
表1 30辆样车的关门声音主观评价值
3.2 关门声信号特征的提取
3.2.1 基于EMD分解的信号特征提取
先对声音信号进行20Hz高通滤波,除去低频噪音,保留人耳能听见的声音,再对滤波后的信号进行经验模态分解,得出9个IMF分量。图4为样车4关门声信号的EMD分解结果。
根据式(6)计算9个IMF分量的能量作为该声音信号的特征。
3.2.2 心理学参数特征的提取
响度和尖锐度是表征人们对声音感知的两个重要的心理学参数,响度定义为,以40phon响度级的响度N为1sone,测听时判断为其两倍响度的则为2sone。通过大量的实验得到了响度与响度级之间的关系,可以表示为[11]
式中:N为响度,sone;LN为响度级,phon。
尖锐度1acum的定义为中心频率为1 000Hz,带宽为150Hz的声音,声压级为60dB。在特定临界频带上的尖锐度和临界频带率有关,计算公式为[12]
式中:z为临界频带率,bark;S(z)是尖锐度,acum;L(z)是响度,sone;Δz是相邻bark之间的宽度,g(z)是计权函数,计算公式为
总的尖锐度S是S(z)对z的积分,可表示为
根据式(9)和式(12)得出了样车的响度和尖锐度,见表2。
表2 30辆样车关门声音的响度和尖锐度
3.3 声品质预测模型的建立和预测结果分析
(1)建立预测模型 分别基于上述两种不同信号特征建立了两个声品质预测模型:第1个预测模型基于关门声信号的经验模态分解,以9个IMF分量的能量作为输入,输入层的个数为9;以主观评价值为预测目标,输出层的个数为1;隐含层的个数根据经验公式m=i+o+a(i为输入个数,o为输出个数,a取值范围为1~10)取值[4],为保证预测结果的准确性,取隐含层的单元数为20;第2个预测模型以声音的响度,尖锐度作为神经网络输入,输入层的个数为2;同样以主观评价值为预测目标,输出层的个数为1;隐含层的单元数根据经验公式取13。因此,所建立的声品质预测模型的两个神经网络结构为9-20-1和2-13-1,其结构见图5和图6。取1~20号样车的关门声信号为训练样本,经过BP神经网络训练得到声品质预测模型。
(2)预测结果对比分析 取21到30号样车关门声品质作为预测样本,采用两个预测模型对汽车关门声品质进行了预测,预测结果和误差统计见表3。表中模型一指采用IMF分量能量作为输入的预测模型,模型二指采用响度和尖锐度作为输入的预测模型。
由表3可以看出,模型一的预测精度高于模型二,即以IMF能量作为神经网络输入的预测模型的预测精度高于以响度和尖锐度作为输入的预测模型。
表3 预测结果对比
4 结论
(1)基于声音信号IMF分量的能量建立的神经网络声品质预测模型的预测精度高于基于心理学参数建立的预测模型,表明声音信号的IMF分量能量能更准确地表现汽车关门声信号的特征。
(2)EMD方法能够在时频联合域上反映声音信号特征,可有效应用于产品声品质评价与预测。
[1] 毛东兴,高亚丽,愈悟周.声品质主观评价的分组成对比较法研究[J].声学学报,2005,30(6):515 -520.
[2] Lee Hyun-Ho,Lee Sang-Kwon.Objective Evaluation of Interior Noise Booming in a Passenger Car Based on Sound Metrics and Artificial Neural Networks[J].Applied Ergonomics,2009,40(5):860-869.
[3] Kim Sung-Jong,Lee Sang Kwon,Park Dong-Chul,et al.Objective Evaluation for the Passenegr Car During Acceleration Based on the Sound Metric and Artificial Neural Network[C].SAE Paper 2007-01-2396.
[4] 申秀敏,左曙光,李林,等.车内噪声声品质的支持向量机预测[J].振动与冲击,2010,29(6):66 -68.
[5] Wang Y S,Lee CM,Kim D G.Sound-quality Prediction for Nonstationary Vehicle Interior Noise Based on Wavelet Pre-processing Neural Network Model[J].Journal of Sound and Vibration,2007,299(4-5):933-947.
[6] 罗洁思,于德介,彭富强.基于EMD的多尺度形态学解调方法及其在机械故障诊断中的应用[J].振动与冲击,2009,28(11):84-86.
[7] Huang N E,Shen Z,Long SR.The Exmpirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Nonstationay Time Series Analysis[J].Pric.R.Soc,1998,44:903 -905.
[8] 高印寒,孙强,梁杰,等.B级轿车车内噪声品质的主观评价研究[J].噪声与振动控制,2010,30(4):115 -118.
[9] VAPN IK V.The Nature of Statistical Learning Theory[M].New York:SpingerVerlag,2000.
[10] 申秀敏,左曙光.车内噪声声品质的神经网络预测[J].声学技术,2009,28(3):265 -268.
[11] Mutsumi Ishibashi,Anna Preis,Fumiaki Satoh,et al.Relationships Between Arithmetic Averages of Sound Pressure Level Calculated in Octave Bands and Zwicker's Loudness Level[J].Applied Acoustics,2006,67(7):720 -730.
[12] Zwicker E,Fasti H.Psychoacoustics:Facts and Models[M].Spring-Verleg Berlin Heidelberg,1999.