水下目标的Gammatone子带降噪和希尔伯特-黄变换特征提取
2015-11-19王曙光曾向阳王征王强
王曙光,曾向阳,王征,王强
(1.西北工业大学航海学院,陕西西安710072;2.中国船舶工业集团公司,北京100048)
水下目标的Gammatone子带降噪和希尔伯特-黄变换特征提取
王曙光1,曾向阳1,王征2,王强1
(1.西北工业大学航海学院,陕西西安710072;2.中国船舶工业集团公司,北京100048)
水下目标识别是水声探测中的关键技术,具有重要的应用价值。海洋环境的复杂性导致水下目标识别中存在不可回避的噪声干扰。以人耳听觉机理为基础,提出了一种结合Gammatone滤波器、小波阈值降噪和希尔伯特-黄变换(HHT)的水下目标识别方法。采用Gammatone滤波器实现人耳听觉机理的模拟,并在此基础上进行小波阈值降噪,提高系统的噪声鲁棒性,然后利用HHT进行时频分析和特征提取。利用实际水下目标数据进行识别实验,对提出的方法进行了验证。实验结果表明,提出的方法在低信噪比条件下具有良好的鲁棒性,并具有较好的识别效果。
声学;水下目标识别;人耳听觉;Gammatone滤波器;希尔伯特-黄变换
0 引言
水下目标识别是水声探测领域的关键技术之一,是探测系统智能化的重要标志。在现代海战中,能否对水下目标实现快速、准确的探测和分类,对海军舰艇的作战能力和生存能力至关重要。海洋环境复杂、多变的特性对水下目标识别系统的精确度和稳定性都提出了巨大的挑战。海洋环境噪声和海洋混响是水下目标识别系统的主要干扰,如果能够有效地消除这些噪声的影响,便有望建立具有高精度的鲁棒性水下目标识别系统。
人耳听觉系统在嘈杂的环境下仍可以有效地跟踪并识别感兴趣的声音,而不受其他噪声的干扰,即所谓的“鸡尾酒会效应”。这种优秀的识别能力是许多机器识别方法不能比拟的。人耳听觉的一个显著特点是非线性,其对声音的感知可以划分为一系列不同带宽的频带,通过对各频带的感知实现对声信号的整体把握。研究证明[1-2],对人耳听觉能力进行模拟,应用于水下目标识别系统,这是提高识别系统鲁棒性的有效手段。考虑到水下目标探测中的噪声问题,将人耳听觉的非线性特点与降噪处理结合,在各个子带信号上进行降噪处理,有助于增强系统对噪声的鲁棒性。
另一方面,特征提取是目标识别的关键环节,提取的特征是否有效,对最终的识别结果具有直接影响。水下目标辐射噪声主要包含连续谱的宽带噪声和离散频率上的线谱。其中,线谱部分主要由目标自身机械结构工作时产生,连续谱部分主要由螺旋桨空化噪声和水动力噪声引起。由于传播过程中的多途效应,往往体现为时变信号。作为时频分析的重要工具,希尔伯特-黄变换(HHT)可以有效地提取信号的瞬时特征,这使其非常适合于水下目标辐射噪声的分析与处理[3-4]。
本文在已有研究的基础上,提出了一种结合Gammatone滤波器组、小波阈值降噪和HHT的水下目标识别方法。其中,Gammatone滤波器组用来模拟人耳听觉感知的非线性特点,并在此基础上进行小波阈值降噪处理,以提高识别系统对噪声的鲁棒性;HHT则用来进行时频分析,构建对应的特征向量。最后,采用支持向量机(SVM)对目标种类进行判定。实验结果表明,该方法在低信噪比条件下仍具有较高的识别精度。
1 方法原理
如图1所示,含噪信号首先通过Gammatone滤波器组进行分解,将其分解成为与人耳听觉的非线性频率相对应的一系列子带信号。对各子带信号进行小波阈值降噪。HHT用来进行特征提取,构建特征向量。最后,采用SVM实现目标信号的识别。
图1 方法流程图Fig.1 Workflow of proposed algorithm
1.1 Gammatone滤波器组
人耳听觉感知系统中,基底膜的不同位置会对不同频率的信号产生最大响应。从信号处理的角度,可以将基底膜的这种频响特性看成是一组滤波器。并采用等效矩形带宽(ERB)滤波器来表示。滤波器的ERB与中心频率fc的关系为
Gammatone滤波器只需要很少的参数就能很好地模拟人耳听觉机理的实验数据,能够体现基底膜的频谱特性。Gammatone函数的时域表达式为
式中:a为归一化因子;ut为阶跃函数,
b为带宽相关的参数,b=1.019ERB(fc);n为Gammatone滤波器的阶数,研究表明,n=4的Gammatone滤波器就能很好地模拟基底膜的滤波特性[5];φ为滤波器的初始相位,本文中,取φ=0.
将0~4 kHz的频率范围划分为24个子带,由(1)式可计算得到各子带的中心频率,进而可根据(2)式得到各Gammatone子滤波器的时域响应。对于第16个子带,其时域的脉冲响应如图2所示。依据这种方法,可以得到各滤波器的时域脉冲响应及对应的频谱。图3显示了所有24个滤波器的频率响应曲线。
1.2 子带小波阈值降噪
经过Gammatone滤波器组的处理,信号分解为一系列与人耳听觉相对应的子带信号。接下来,采用小波阈值降噪的方法,对各子带信号进行降噪。在各子带上进行降噪处理有助于得到更纯净的结果,提高降噪效果。另外,子带划分与人耳听觉感知特性相对应,这也使得降噪处理后的结果具有更好的音质效果。
图2 第16个Gammatone滤波器的时域响应Fig.2 Time domain response of 16th Gammatone filter
图3 Gammatone滤波器组的频域响应Fig.3 Frequency response of Gammatone filter bank
小波分析能够同时在时频域对信号进行分析,所以它能有效地区分信号中的突变部分和噪声,从而实现对信号的降噪。小波阈值降噪就是在小波分解后的各层系数中,对模大于和小于特定阈值th的系数分别处理,然后对处理完的小波系数再反变换重构得到降噪后的信号。
小波分解系数的阈值处理方法分为软阈值法和硬阈值法。相比之下,软阈值法的结果具有较好的整体连续性[6]。因此,本文选取软阈值法作为小波阈值降噪的处理方法。
图4 小波软阈值降噪Fig.4 Soft threshold of wavelet denoising
1.3 利用HHT提取特征
HHT的核心思想是将时间序列信号通过经验模态分解(EMD),分解成若干固有模态函数(IMF),然后利用希尔伯特变换构造解析信号,得到信号的瞬时频率和瞬时振幅。
1.3.1 经验模态分解
EMD可以看作是一个筛选过程,依据信号特点自适应地将任意一个复杂信号分解为一列IMF. IMF满足如下两个条件:
1)信号极值点的数量与零点数相等或相差1;
2)信号由极大值定义的上包络和由极小值定义的下包络的局部均值为0.
EMD筛选过程如下:
1)对输入信号x(t),求取极大值和极小值点;
2)对极大值点和极小值点采用3次样条函数插值构造信号上下包络xu(t)和xl(t),计算上、下包络的均值函数m1(t)=[xu(t)+xl(t)]/2;
3)考察h1=x(t)-m1是否满足IMF条件,如满足则转到下一步,否则对h1循环进行前两步操作,直到第k步结果h1k满足IMF条件,则求得第一个IMF c1=h1k;
4)得到第一个残留r1=x(t)-c1,对r1作如同上述3步操作,得到c2以及r2=x(t)-c2,以此类推;
5)直到rn为单调信号或者只存在一个极点为止。
经过经验模态分解后,原始信号可以表达为
1.3.2 EMD数据的希尔伯特变换和谱特征提取
对IMF作希尔伯特变换,对于IMF信号ci(t)有
构造解析信号
于是得到幅值函数
和相位函数
进一步可以求出瞬时频率
获得瞬时频率ωi(t)和瞬时幅值ai(t)后,即可以此为基础构建特征向量。文献[7]已有的研究结果表明瞬时频率的加权平均值ωMIF具有较好的分类效果,其计算方法如下:
ωMIF描述了信号固有模态间的频率分布。在信号分析中,除了频率分布外,其能量分布也具有重要的分类价值,其瞬时能量的计算通过下式获得
各类信号EMD分解后得到的IMF个数为14~17个,取各信号的前12阶IMF,即在(11)式、(12)式中取i=1,…,12构建特征向量F:
1.4 基于SVM的分类算法
设样本为多维向量,n个样本及其所属类别表示为(xi,yi),yi∈{+1,-1},i=1,…,n.超平面方程为ωx+b=0,使得对该线性可分的样本集满足:
对判别函数进行归一化,两类中所有的样本都满足:
此时分类间隔等于2/‖ω‖,使间隔最大等价于使‖ω‖最小或‖ω‖2最小。满足条件(15)式且使‖ω‖2/2最小的分类面就叫作最优分类面。
这样求最优分类面的问题就可表示为:在(15)式的约束下,求φ(ω)‖ω‖2/2的极小值(最小化泛函).为此定义Lagrange函数为
这里的目标是将(16)式对ω和b求Lagrange函数的极小值。将问题转化为其对偶问题,即在约束条件
下对αi求解下列目标函数的最大值:设满足上述函数最大值的解为,解中将只有一部分αi不为0,其对应的样本就是支持向量。求解出上述系数后,就可以得到最优分类函数:
2 实验验证
2.1 降噪效果的实验验证
海洋环境噪声是多种声源的综合效应,其中包含潮汐、波浪的海水静压力效应,随机水流形成的湍流,航运等持续的噪声源,以及海洋生物叫声、降雨等间歇性噪声源。其功率谱密度随频率变化的关系非常复杂。但水声系统都工作在一个十分有限的低频段内,在该频段,环境噪声谱级近似为常数[8]。因此,相关研究中通常将其近似为白噪声。
对于水声信号s(t),假设加入的白噪声为n(t),则其信噪比(SNR)计算方法如下:
图5所示为一实测的目标信号的原始信号以及人工加噪后的信号。原始信号为船桨划水时的声音,采样频率为8 kHz.加噪信号由原始信号和白噪声叠加而成,信噪比为5 dB.
图5 原始信号、加噪信号与降噪信号Fig.5 Original signal,noised signal and denoised signal
混合信号首先通过Gammatone滤波器组分解为24个子带信号,在各子带信号上进行小波阈值降噪。采用db8小波作为小波基函数,小波分解的层数为3层。阈值的选取采用无偏风险估计阈值[9],降噪的结果如图5所示。
从图5可以看出,降噪处理有效地滤除了信号中的噪声,其处理后的结果与原始信号具有较高的一致性。分别利用信号失真比(SDR)、相关系数和语音信号处理中常用的听觉感知评价参数(PESQ)作为评价指标[10-11],对降噪效果进行定量分析。其中,SDR的计算方法如下:
以直接采用小波阈值降噪的方法作为对比,对图5中的信号进行处理。小波降噪的设置与文中所用设置一致。两种降噪方法的结果见表1.
表1 不同降噪方法的结果对比Tab.1 Denoised results of different methods
由表1可以看出,与传统的小波降噪方法相比,结合Gammatone滤波器后新方法的SDR有明显的提升;处理后的结果与原信号具有更高的相关性;PESQ结果也有所改善。这些结果充分说明,本文的降噪方法具有良好的性能。
2.2 水下目标识别实验
实验数据为实测的水下目标辐射噪声信号,采样频率为8 kHz,分为A,B,C,D四类。每类信号中含有60个持续时间为1 s的样本。各类数据的时域波形如图6所示。
图6 4类信号的时域波形图Fig.6 Waveforms of four types of signals
通过加入高斯白噪声的方式来模拟不同的SNR条件,首先进行降噪,提取HHT后的特征,利用SVM作为分类器,对4类目标进行分类实验。采用留一法(LOOCV)对多次分类结果进行交叉验证。最终的识别结果见表2.
表2 在不同条件下提出方法的识别结果Tab.2 Recognition results of proposed method under different conditions
由表2可以看出,随着测试信噪比从20 dB下降到5 dB,A类和D类信号均得到了正确的识别。B类信号的识别率从100%下降到了80.00%,C类信号的识别率从90.00%下降到了75.00%.系统的平均识别率从97.50%下降到了96.25%.在不同的信噪比条件下,系统的平均识别率保持在95.00%的较高水平,且随信噪比的降低,系统的平均识别率下降不显著。这说明本文提出的方法对噪声具有较强的鲁棒性。
为了进一步了检验本文特征提取方法的性能,选用小波包能量谱特征[12],替代本文中的特征,进行识别实验。小波包能量谱特征的提取流程如下:首先,采用db5小波对信号进行3层小波包分解。然后计算分解后各子带信号的能量,并用总能量对其进行归一化处理。处理后的结果即为小波包能量谱特征。对应的识别结果见表3.
表3 小波包能量谱在不同条件下的识别结果Tab.3 Recognition results of wavelet packet energy spectrum under different conditions
从表3可以看出,随着信噪比的降低,系统的平均识别率从89.58%下降到了87.50%.得益于文中降噪方法的引入,系统的平均识别率对信噪比的变化并不敏感。这再次确认了本文降噪方法的效果。另外,小波包能量谱特征的平均识别率整体低于本文特征的识别率,使用本文的特征提取方法,各种信噪比条件下的识别率平均提高了8.02%.这说明本文提出的特征具有更好的识别性能。
3 结论
结合Gammatone滤波器和HHT,本文提出了一种新的水下目标识别算法。其中,Gammatone滤波器用来将信号划分为一系列与人耳听觉相对应的子带信号。在此基础上,引入了小波阈值降噪,对信号进行降噪处理,以消除噪声的干扰。采用SDR、相关系数和PESQ为依据,对降噪处理的效果进行了对比分析,结果表明,本文提出的降噪方法具有更好的效果。
该算法在HHT的基础上进行时频特征提取,并以SVM为分类器,利用4类实测水下目标噪声信号,在不同的信噪比条件下进行了识别实验,并与其他特征提取方法进行了对比。结果表明,本文提出的方法具有较好的噪声鲁棒性,且识别性能更好。
(
)
[1] 陆振波,章新华,胡洪波.水中目标辐射噪声的听觉特征提取[J].系统工程与电子技术,2005,26(12):1801-1803. LU Zhen-bo,ZHANG Xin-hua,HU Hong-bo.Auditory feature extraction of noise radiated from an underwater target[J].Systems Engineering and Electronics,2005,26(12):1801-1803.(in Chinese)
[2] 王娜,陈克安.分段谱质心特征在水下目标识别中的应用[J].兵工学报,2009,30(2):144-149. WANG Na,CHEN Ke-an.Application of sub-band spectral centroid features to recognizing underwater targets[J].Acta Armamentarii,2009,30(2):144-149.(in Chinese)
[3] Huang N E,Shen S S.Hilbert-Huang transform and its applications[M].Singapore:World Scientific Publishing Company,2005.
[4] 谢磊,李秀坤.HHT在水雷目标特征提取中的应用[J].声学技术,2009,28(4):480-484. XIE Lei,LI Xiu-kun.The application of HHT to feature extraction of mine[J].Technical Acoustics,2009,28(4):480-484.(in Chinese)
[5] Lopez-Poveda E A,Meddis R.A human nonlinear cochlear filterbank[J].The Journal of the Acoustical Society of America,2001,110(6):3107-3118.
[6] Jansen M.Noise reduction by wavelet thresholding[M].New York:Springer,2001.
[7] Wang S G,Zeng X Y.Robust underwater noise targets classification using auditory inspired time-frequency analysis[J].Applied Acoustics,2014,78(4):68-76.
[8] 冯西安.水下目标高分辨方位估计技术研究[D].西安:西北工业大学,2004. FENG Xi-an.Study on the high resolution DOA estimation techniques of underwater targetrs[D].Xi'an:Northwestern Polytechnical University,2004.(in Chinese)
[9] Zhang L,Bao P,Pan Q.Threshold analysis in wavelet-based denoising[J].Electronics Letters,2001,37(24):1485-1486.
[10] Rix A W,Hollier M P,Hekstra A P,et al.Perceptual evaluation of speech quality(PESQ)—the new ITU standard for end-toend speech quality assessment:partⅠ—time-delay compensation[J].Journal of the Audio Engineering Society,2002,50(10):755-764.
[11] Beerends J G,Hekstra A P,Rix A W,et al.Perceptual evaluation of speech quality(PESQ),the new ITU standard for end-toend speech quality assessment.PartⅡ—psychoacoustic model[J].Journal of the Audio Engineering Society,2002,50(10): 765-778.
[12] 刘健,刘忠,熊鹰.基于小波包能量谱和SVM的水下目标识别[J].武汉理工大学学报:交通科学与工程版,2012,36(2):361-365. LIU Jian,LIU Zhong,XIONG Ying.Underwater target recognition based on wavelet packet energy and SVM[J].Journal of Wuhan University of Technology:Transportation Science&Engineering,2012,36(2):361-365.(in Chinese)
Gammatone Subband Denoising and HHT-based Feature Extraction for Underwater Targets
WANG Shu-guang1,ZENG Xiang-yang1,WANG Zheng2,WANG Qiang1
(1.School of Marine Science and Technology,Northwestern Polytechnical University,Xi'an 710072,Shaanxi,China;2.China State Shipbuilding Corporation,Beijing 100048,China)
Underwater target recognition,as a key technique,places a great role in underwater acoustic detection.The inevitable noises decrease the performance of the system in the complex underwater acoustic environments.An underwater target recognition algorithm which includes Gammatone filter bank,wavelet threshold denoising and Hilbert-Huang transform(HHT)is proposed based on auditory perception mechanism.Gammatone filter bank is used for the simulation of auditory perception,and the wavelet threshold denoising is applied to enhance the noise robustness of the system.Hilbert-Huang transform is employed as the time frequency analysis tool and used for feature extraction.At last,the efficiency of the proposed algorithm is testified by using the measured underwater target data in the recognition experiment.The results show that the proposed method has a robust performance and good accuracy under the condition of low SNR.
acoustics;underwater target recognition;auditory perception;Gammatone filter bank;Hilbert-Huang transform
TN912.34
A
1000-1093(2015)09-1704-06
10.3969/j.issn.1000-1093.2015.09.015
2015-01-23
陕西省自然科学基金项目(2012JM1010)
王曙光(1986—),男,博士研究生。E-mail:wangshuguang@mail.nwpu.edu.cn;曾向阳(1974—),男,教授,博士生导师。E-mail:zenggxy@nwpu.edu.cn