APP下载

流形学习在运动声源声特征提取方面的研究∗

2019-12-04宿元亮刘志红王万凯赵玉贵仪垂杰

应用声学 2019年6期
关键词:流形高维声源

宿元亮 刘志红 王万凯 赵玉贵 仪垂杰

(1 青岛理工大学机械与汽车工程学院 青岛 266000)

(2 工业流体节能与污染控制教育部重点实验室 青岛 266000)

0 引言

运动声源研究主要集中在运动声源的定位识别、声源运动以及流场作用所产生的多普勒效应、运动声源的声场重构等方面[1-6]。上述研究都需提取运动声源的声特征。在进行运动声源的声特征提取时,由于声特征与运动状态高度耦合,且由多个声源(如行驶车辆发声源:车身、底盘、发动机等)的声辐射叠加,呈现出宽频带、非稳态、非线性等特点[7]。行驶中车辆噪声声辐射问题是一个复杂的动态过程,辐射噪声不仅与自身各噪声源的噪声特性有关,还与车辆运动参量:距离、速度、加速度、方位和方向等紧密相关,其辐射强度、频率及声传播模式也与车辆运动状态高度耦合。运动声源的声特征提取主要采用传统理论的数值分析方法研究。数值分析方法已很好地应用于实际问题,特别对飞机、叶轮机械的气动噪声研究。但车辆噪声源及噪声特性的复杂性、时变性突出,呈现高维数及非线性特征,使得此类运动声信号的特征提取困难,数据本质特征表示不清,且数据运算量大。因此,寻找一种能够有效提取声特征且降低数据计算量的方法尤为重要。流形学习是流形与机器学习相结合的方法,属于机器学习领域中的一种数据降维方法,涉及到几何学、代数学及拓扑学等学科,已成功应用于图像处理、人脸识别、语音识别及故障诊断等应用领域[8]。流形学习算法能够通过保持数据间的某种关系来发掘藏匿于高维数据中的内在低维流形结构,用低维流形结构表征数据的本质特征,并将低维流形特征坐标化,以实现维数约简及数据可视化,从而完成特征提取。流形学习方法能够对高维数据进行维数约简并提取其本质流形特征,是一种高效提取声信号特征的新方法,同时该方法又隶属于机器学习的范畴,因此利用该方法进行声特征提取研究能够为声源智能识别奠定基础。但是,从国内外研究现状来看,该方法应用于车辆噪声这类运动声信号的分析处理直接相关研究甚少。为此,将流形学习这种高效降维算法应用于运动声特征提取,将声特征从时域、频域或时频域转化到流形域上表征不仅能够提高后期模式识别的准确性及快速性,而且是一种时变声信号特征提取的新思路、新途径。

1 基本理论

流形学习算法分为线性流形学算法和非线性流形学习算法。线性流形学习算法有主成分分析(Principle component analysis,PCA)[9]和多维尺度变换(Multidimensional scaling,MDS)[10],计算简单、理解容易,能够很好地提取到线性数据的有用的信息,应用十分广泛。但高维数据在空间中具有高度非线性结构,即呈流形分布。由于线性流形学习算法力求保持数据的全局线性结构,所以该线性算法对非线性数据进行特征提取时,得到的结果则不能真实反映数据的本质结构,无法提取到原始数据的有效信息,使得难以完成后续分类识别等任务。典型的非线性流形学习算法有等距映射算法[11](Isometric mapping,Isomap)、局部线性嵌入算法[12](Locally linear embedding,LLE)和局部切空间排列算法[13](Local tangent space alignment,LTSA)。LLE算法最显著特点,一是权重具有平移、旋转、缩放不变性;二是最优解无迭代,求解过程为稀疏矩阵特征分解。从各算法优缺点以及复杂度上来看:Isomap相比于LLE及LTSA,由于要寻找最短路径使得时间复杂度较高,算法处理效率降低;LLE则考虑局部线性重构误差,计算的时间代价较小,求解容易,其步骤中不产生迭代[14]。在对人造数据集(Punctured sphere、Swiss roll)进行降维方面,LLE算法基于数据的局部线性假设来逼近非线性结构[15],通过局部线性重构误差最小化获得低维流形特征,适合处理非平稳的时变信号,而且LLE算法的计算速度快、求解简单等优点也适用于高维数、非线性的运动声信号的处理与分析。因此选取LLE算法。

1.1 高维特征矩阵构建

在信号处理领域,对于流形学习算法中高维特征矩阵的构建,有多样本信号重组[16]、相空间重构[17]、多元统计分析[18]和时频分析四种方法。本文选用时频分析即STFT作为声特征初步提取方法。

离散短时傅里叶变换的数学表达式如下:

式(1)中,k=0,1,2,···,N-1,x(n)是原始信号,w(n)是分析窗函数,n值为离散的而N值为连续的,即STFT在时间上离散、在频率上连续。窗函数w(n)会在时域中随着N值的改变来截取信号x(n)某一时段信号,并将截取的近似平稳信号进行傅里叶变换,最后得到的信号频谱会随n值变化而变化。若对ω的N点离散化,得到则w(n)的长度为N的取值。因频率信息泄露等问题,本文选用Hamming窗。

其相应的短时功率谱,即频谱图为

基于时频分布的瞬时频率为

假设一维时间序列S=[x1,x2,···,xn],合理选择分析窗函数w(n)、窗宽大小w、窗重叠度l以及傅里叶变换的样本点数D,则信号分帧数目即窗数为

若对第i帧信号进行傅里叶变换,得到该帧信号的傅里叶谱记为

则基于短时谱的高维特征矩阵,即时频特征矩阵构建示意图,如图1所示。

短时谱中能够充分体现信号的频率特征,以频率作为维数,以时间作为样本数,将其构建为时频特征矩阵:

其中,D×N的矩阵X即为构建的高维特征矩阵。

1.2 基于STFT-LLE的运动声源声特征提取模型

1.2.1 匀亚音速运动模型

本文研究对象为运动声源,观测点与声源之间发生相对运动,其匀亚音速运动点源模型如图2所示。单极子声源S沿X轴正方向以亚音速V匀速直线运动。假设观测点O的坐标为(x,y,z),t=0时声源从坐标原点出发,在t时刻观测点接收到声源在te时刻发出的声压且此时声源以亚音速V运动到xs位置,则xs=V t,ys=zs=0。由数学几何知识可知:

式(7)中:R=|R(t)|为声源位置与观测点的距离,|R(t)|称为声矢量;te=t-R/c为延迟时间;r为观测点O到声源运动轴线的垂直间距,有r2=y2+z2。

声源运动的快慢可用马赫数(Mach number)M衡量:

M<1称为亚音速(subsonic),M>1称为超音速(supersonic)。则

求解此方程,得

因为在亚声速条件下,M<1,R>0,只有正号满足实际情况,令

式(12)中,R即为声波从声源到观测者的实际传播距离。

若将θ表示为声源运动轴线与R之间的夹角,则x-xe=x-V t=Rcosθ,由于R=c(t-te),则

式(13)中,

所以可以推导出:

图2 匀亚音速运动点源模型Fig.2 Uniform subsonic motion point source model

1.2.2 运动声源特性

(1)运动声源声辐射特性

假设运动点源为强度由q规定的脉动球[19-20],其源分布密度可以表示为q(r,t)=QS(t)δ(xvt)δ(y)δ(z),声压场波动方程[21]可表示为

当声源低速运动(M<0.2)时,声辐射公式可简化为[21]

式(17)中,p(t)为观测点接收信号,q′(t)为声源原始信号。

因为R是时间的函数,当单频声源以亚音速做匀速直线运动时,观测点接收到的声信号频率以及幅度均随时间发生变化。这种特征频率的变化在多普勒效应以及指向性特征中均有所体现。

(2)多普勒效应

随着声源的运动,观察点获得的信号会因多普勒效应出现频散现象。图3给出在不同亚音速情况下,当声源运动时随着观察时间变化,接收信号特征频率的变化趋势。从图3中可以看出:(a)声源运动速度越高,即M值从0.3变化到0.9,观察点频率与源频率的比值(频移量)逐渐变小,频移现象越来越明显;(b)随着声源运动时间的推移,观察点频率与源频率的比值(频移量)达到平稳趋势[22-23]。

图3 匀亚音速直线运动声源的频移特征Fig.3 Frequency shift characteristics of uniform subsonic linear motion sound source

1.3 声特征提取实现流程

将STFT-LLE流形学习方法应用于特征提取,弥补传统特征提取方法在处理数据复杂、提取特征维数高、不准确等缺陷[24]。STFT-LLE流形学习方法的声特征提取流程如图4所示。

图4 STFT-LLE流形学习方法声特征提取流程图Fig.4 Flow chart of STFT-LLE manifold learning method

STFT-LLE流形学习方法的声特征提取具体流程如下:

(1)对声信号数据进行预处理,获得时间序列S=[x1,x2,···,xn]。

(2)选择合适的窗函数及窗宽,采用hamming窗,其窗宽取为256,利用1.1节中方法原理构建时频特征矩阵X=[x1,x2,···,xN]∈RD即为构建的高维特征矩阵。

(3)使用LLE算法处理高维特征矩阵提取低维流形特征。

LLE算法提取低维流形特征步骤如下:

(1)最近邻点选择,构造邻域。通过欧氏距离寻找与每个样本点最近的k个近邻,运用统计法并选取k值范围为1~30。

(2)局部线性重构,计算权值矩阵W。通过使线性重构误差函数取最小值求得W,误差函数为

(3)为实现可视化,选取维数为3。根据权值矩阵W,使得嵌入坐标的误差函数取得最小值,则

对矩阵M特征值分解,即可得到低维嵌入Y。

选取d=3,利用局部线性嵌入算法(LLE)提取出低维流形特征Y=[y1,y2,···,yN]。

(4)将提取的低维流形特征向量绘制色谱图,实现流形特征可视化。

2 仿真实验分析

采用标准的地面车辆通过噪声的测试数据,测试模型如图5所示,传声器放置于离声源直线运动轨迹垂直距离7.5 m处。声源从A点出发,以某一速度沿直线运动到B点,传声器接收从A点到B点时间段内的声数据。

选取马赫数为M=0.12以及M=0.35的运动速度,由3种不同的正弦信号仿真运动声源的声信号,如表1所示。

图5 通过噪声测试示意图Fig.5 Schematic diagram of noise passing test

表1 仿真信号Table1 Simulated signal

将运动声源仿真信号o~q及l~n进行短时傅里叶变换,采用hamming窗,其窗宽取为256,窗重叠度选为200,得到各仿真信号短时谱图如图6所示。

各仿真声信号短时谱呈现信号时频特征,且存在一简单结构,声信号短时谱中必定包含一流形结构。基于流形假设,由1.1节高维特征矩阵的构建过程,均匀采样于信号短时谱,将各仿真信号短时谱构建为2000×255的高维特征矩阵。将提取的流形嵌入在三维空间中。

选取线性流形学习算法中的主成分分析(PCA)与短时傅里叶变换(STFT)相结合,简称STFT-PCA方法,将提取出的流形特征与STFTLLE方法对比。现利用LLE与PCA分别提取仿真信号短时谱中潜在的低维流形结构,两种特征提取方法的低维嵌入结果如图7和图8所示(其中,图8为STFT-LLE方法选取最近邻点数k值为12时的结果)。

STFT-PCA低维流形结构图显示:同一马赫数下,仿真声信号的低维流形结构都存在一定差异,但是不同马赫数下仿真声信号的低维流形结构几乎一样。

图6 仿真声信号短时谱图Fig.6 Simulation acoustic signal short-time spectrum

图7 STFT-PCA低维流形结构Fig.7 STFT-PCA low-dimensional manifold structure

图8 STFT-LLE低维流形结构Fig.8 STFT-LLE low-dimensional manifold structure

STFT-LLE低维流形结构图显示:同一马赫数下,仿真声信号的低维流形结构都存在很大差异,同时不同马赫数下仿真声信号的低维流形结构也不同。

从以上仿真结果中可以得出:

(1)采用STFT-PCA方法与STFT-LLE方法对各仿真声信号进行特征提取,都能够得到各信号的低维流形结构,这说明STFT作为运动声特征初步提取以及构建高维特征矩阵具有可行性。

(2)对于STFT-PCA方法:如图7所示,同一马赫数下的仿真声信号流形结构(图7(a)、图7(b)与图7(c))及(图7(d)、图7(e)与图7(f))存在一定差异,但不同马赫数下的同频声信号流形结构(图7(a)与图7(d))、(图7(b)与图7(e))及(图7(c)与图7(f))几乎一样,这使得提取两种状态的特征向量相差无几,后期难以分类识别。

(3)对于STFT-LLE方法:如图8所示,同马赫数下的仿真声信号流形结构存在差异(l、m与n)及(o、p与q),不同频率的特征从下到上依次分开聚集;对于不同马赫数信号流形结构(l与o)、(m与p)及(n与q)有区分度,低维特征分量类内距d随马赫数的增加而增大。初步验证了STFT-LLE方法提取的低维流形对后期声信号分类识别的有效性。

(4)流形物理意义如下:STFT-PCA方法所提取的流形结构几乎没有呈现出信号内在规律,从而无法解释其物理意义。STFT-LLE方法提取各仿真声信号的流形结构两端特征分布密集,对应短时谱中特征频率变化较平缓时间段的频率值;其他区域特征分布稀疏,对应短时谱中特征频率变化急促时间段的频率值。STFT-LLE方法提取的流形保留了声信号短时谱中的频率特征。此外,随着仿真信号所含频率成分的增加,流形结构的弯曲个数也逐渐增加。

(5)STFT-LLE方法提取的低维流形特征在结构上能够分布在不同空间区域的流形即可作为区分不同声信号的特征向量,并利用分类器完成后期不同声源的识别。

3 结论

本文针对运动声信号的特征提取问题,主要研究了算法高维特征矩阵构建的问题。提出了STFTLLE流形学习方法并将该方法应用于亚音速运动车辆的声特征提取中,得到初始的低维流形结构。本文研究采用理论算法仿真分析,利用所提出的方法,将流形学习应用于运动声特征提取,使得声特征从时频域转化到流形域上表征,成为一种可行的声特征提取思路,并通过仿真验证方法所提出的可行性。

猜你喜欢

流形高维声源
有向图上高维时间序列模型及其在交通网络中的应用
虚拟声源定位的等效源近场声全息算法
紧流形上的SchrÖdinger算子的谱间隙估计
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
Nearly Kaehler流形S3×S3上的切触拉格朗日子流形
基于GCC-nearest时延估计的室内声源定位
高维洲作品欣赏
基于矩阵模型的高维聚类边界模式发现
运用内积相关性结合迭代相减识别两点声源
基于多故障流形的旋转机械故障诊断