基于频域典型相关分析的水下目标回波识别
2012-01-09蔡惠智吴永清吕曜辉
陈 拓 ,蔡惠智,吴永清 ,吕曜辉
(1.中国科学院声学研究所,北京100190;2.北京中科海讯数字信号处理技术有限公司,北京100095)
基于频域典型相关分析的水下目标回波识别
陈 拓1,蔡惠智2,吴永清1,吕曜辉1
(1.中国科学院声学研究所,北京100190;2.北京中科海讯数字信号处理技术有限公司,北京100095)
水下目标回波的特征提取与分类识别是当前主动声纳关键技术之一。采用基于回波频域特性的典型相关分析算法(CCA:Canonical Correlation Analysis)提取回波的特征,这些特征集中体现了不同目标回波的综合相关特性。设计合适的支持向量机分类器,并获得识别结果。利用这一方法对湖试中的不同目标回波进行分类识别,分析了不同接收信噪比条件下的性能,获得了理想的结果。
特征提取;典型相关分析;支持向量机
水下目标回波的分类识别问题已经成为主动声纳信号处理领域中的一项关键技术。由于水声环境的复杂特性,声纳回波往往经历不同程度的衰减与失真,其程度受目标距离与具体环境的影响。有效的识别算法不仅能够获取不同目标回波信号的关键信息,而且对一定程度的失真与衰减具有鲁棒性。
完整的识别算法包括特征提取与分类器设计两部分。特征提取获得回波的一些具有强判别能力的信息,而分类器则根据这些特征决定信号的类别归属[1]。较早的水声信号特征提取方法有适用于高频信号的亮点模型、反映目标形状与材料特征的极点模型、共振散射理论[2]等,它们的建模方法比较复杂,而且适用范围较窄。近些年采用的水声信号特征提取方法许多来自于模式识别领域,例如广泛应用于语音识别的主成分分析方法、隐马尔科夫模型[3],以及小波变换[4]等。这些方法具有良好的适用范围,建模方法也较为简单,但模型参数的选择难度较大。
为了能够简化建模过程,获得更加精简且具有较强判别力的特征,采用CCA对频域信息作进一步处理。CCA是一种衡量信号综合相关特性的算法,不仅考虑了信号间的相关性,而且考虑了信号内部的结构特性。经由该算法能够获得一系列简洁的相关系数,它们包含了大部分的相关性信息[5-7]。通过基于频域信息的典型相关分析获取回波的关键特征,并利用支持向量机实现归类识别。根据湖试数据的分析结果,表明该算法是可行的。
1 CCA介绍
CCA不仅能够单独用于特征提取,也可以做为一种特征选择方法,对原本高维度的特征进行提炼。由于同时考虑了向量的内部特性与互相关特性,CCA能够更加充分地利用发射信号的特点。下面将简单介绍CCA的基本原理以及相应的特征提取流程。
1.1 典型相关分析原理简介
假定用于典型相关分析的两组向量分别为X1,X2,…,Xp与 Y1,Y2,…,Yq,其中 p≥q>1。令两个线性变换 ωx,ωy,它们分别将原向量组变换至新的向量组U1,U2,…,Uq与V1,V2,…,Vq。令corr(a,b)表示向量a与b之间的简单相关系数,其表达式为:
那么典型相关分析的根本目标就是寻找线性变换ωx,ωy,使得corr(Ui,Vi),i=1,2,…,q达到最大值,并且满足如下条件:
U1,U2,…,Uq与 V1,V2,…,Vq被称为 X1,X2,…,Xp与 Y1,Y2,…,Yq对应的典型变量。
式(1)可以等价为求解如下问题:
令:
可以得到相应的格朗日表达式:
令 λx=λy=λ,可以解得:
可以证明式(6)中的两个方程具有相同的非零实λ解,这些λ值即为两个向量组之间的典型相关系数。
1.2 特征提取流程
采用基于频域特性的CCA特征提取算法,对回波信号的频域特征进行CCA特征选择,获得少量更加凝练的特征,最后用支持向量机进行分类识别。特征提取的流程如图1。
图1 特征提取流程图
首先获得不同回波信号的频域信息,然后按照合适的规则将其转换成多维的样本矩阵,最后对样本矩阵进行CCA处理,获得与其维度一致的特征向量。根据发射信号的带宽、系统采样率等参数,选择合适的样本矩阵维度,尽可能利用回波的频域特征。
2 试验数据分析
2.1 湖试条件介绍
试验数据来自于2009年千岛湖的湖试,基阵采用收发合置的形式,其中发射阵为线阵,接收阵为圆弧阵。发射信号形式为HFM,中心频率30 kHz,带宽8 kHz,采样率192 kHz,脉宽8 ms。
两个似雷目标被固定放置于水中,基阵收集它们的回波。目标的形状如图2所示,其中柱形目标的长度为2 m,直径0.5 m,目标强度-7.5 dB;球形目标的直径0.9 m,目标强度-16.5 dB。基阵与目标的实际吊放情况如图3所示。图4给出了部分信噪比条件下两个目标回波经过归一化后的时域波形。
图2 湖试中采用的两个似雷目标
图3 基阵与目标的吊放情况,球目标的吊放方式与图中相同
图4 不同信噪比下两个目标回波的时域波形
2.2 数据分析
在保持吊放深度不变的条件下,通过调整发射声源级和目标与基阵的距离,可以获得不同信噪比的回波信号。为了能够充分利用试验数据,选取朝向目标方位的部分阵元域数据进行处理。将这些回波信号按照图1的流程进行特征提取,选择合适的样本矩阵维度,获得一系列特征向量。采用支持向量机(SVM:Support Vector Machine)分类器[8-10]对这些特征向量进行分析,获得它们的类别归属。
整个分类识别过程分两步进行:(1)SVM的训练与验证,即根据部分回波的特征向量来确定SVM的参数,并计算能够有效区分不同类别特征的分割面;(2)SVM的测试,即提取不同条件下获得的接收信号的特征,使用训练完毕的SVM对其进行归类。SVM的训练、验证与测试准确度是衡量整个识别算法有效性的标准。
首先,分别选取两个目标各300个回波数据用于SVM的训练,它们拥有较高的信噪比(14 dB左右),且不具有多普勒频移。图5给出了部分提取特征的分布情况。图5(a)、图5(b)表明两个似雷目标回波的前二维特征具有明显的类别可分离性,柱目标对应的特征值要略高于球目标,而且柱目标的特征值浮动较小,稳定性更佳。然而正如图5(c)所示,两类目标的前三维特征在空间上并不是完全线性可分,也就是说不存在线性SVM能够将两个特征集合完全区分。将这600个三维的特征向量作为SVM的训练数据,并采用线性准则进行计算。训练完毕后的SVM分类器对两类目标特征的正确识别率分别为:柱目标91.7%,球目标90.7%。
图5 训练数据的特征分布情况
图6 两类目标的分类识别测试结果
然后,基于训练完毕的SVM,另取近似条件下的回波数据进行验证。在相同的布放条件下,重新记录接收数据,获得一组新的目标回波,并进行特征提取。将特征向量输入现有的SVM,获得每个样本的分类结果,然后将其与真实情况进行比对。最终的验证结果为:柱目标识别率92.3%,球目标识别率90.3%。验证结果表明:提出的特征提取方法能够获得目标回波的稳定特性,具有良好的鲁棒性。
图7 信噪比变化对于两类目标识别率的影响
图8 两类目标的分类识别测试结果
为了进一步验证特征提取算法的有效性,使用大量不同信噪比条件下的回波数据对已有的SVM进行测试,测试过程与前述的验证过程基本相同。在保持布放深度的基本条件下,改变目标与基阵的距离、相对方位角,获得不同接收条件下的回波。不同信噪比条件下,两类目标回波的正确识别率如图6。从图6中可以获得几点结论:(1)随着接收信噪比的增加,正确识别率将越接近SVM的训练结果,且当信噪比在9 dB以上时能够获得理想的识别率;(2)在低信噪比条件下,柱目标回波的识别率下降很快,而球目标回波的识别率则始终保持在一个较高水平。产生这一现象的原因可以由图7解释。以二维特征空间为例,方形表示柱目标的特征区域,圆形表示球目标的特征区域,那么线性SVM会产生分割线将不同特征区域进行划分。可以看到,由于特征区域彼此有交叠,因此并不能进行完全分离。当接收信噪比降低时,获得的特征取值将减小,对应的特征区域呈现低取值方向的移动。区域移动的结果就是柱目标的特征区域将有更多落在类别2中,从而产生更多的错误分类,而球目标正好相反。为了解决这一问题,重新选择训练数据,用低信噪比(8.8 dB)的柱目标回波代替原先高信噪比(14 dB)的样本。那么训练完毕后的SVM分类器对两类目标特征的正确识别率分别为:柱目标90.0%,球目标86.3%。验证结果为:柱目标89.3%,球目标85.3%。可见SVM的训练性能有一定的降低。基于这一SVM进行测试,获得的结果如图8。可见采用第二种方法能够获得更高的整体性能,但是SVM的训练精度降低。
对于水下目标回波识别问题而言,关键之处在于获得不同特性目标回波的特殊信息,同时保证对干扰具有一定的鲁棒性。实际情况中两者可能是矛盾的,因为越是精确的模型对干扰越是敏感,图6与图8的结果体现了这一问题。因此理想的识别算法需要兼顾分类器的准确度与泛化能力(可以理解为抗干扰能力,或者鲁棒性),获得最合适的整体性能。从湖试数据的分析结果来看,基于频域特性的CCA特征提取算法与线性SVM分类器的组合是相当有效的,通过合适的训练数据能够获得优良的识别性能,有效接收信噪比为7 dB左右。
3 结论
基于频域特性的CCA是一种优秀的特征提取算法,能够获得不同目标回波的关键信息。湖试数据的相关仿真与分析表明:在目标回波的频域信息基础上,采用CCA获得的特征向量能够提供良好的类别可分离性,并且通过线性SVM能够获得理想的训练与测试结果。在一定信噪比条件下,采用该识别算法能够有效区分两个不同形状的似雷目标,并且对于变化的水声环境具有良好的鲁棒性。
[1]Jain A K,Duin R P W,Jianchang Mao.Statistical pattern recognition:a review[J].IEEE Transactions on Pattern Anal-ysis and Machine Intelligence,2000,22(1):4-37.
[2]章新华.水下目标自动识别的核心技术[J].兵工学报,1998,19(3):275-280.
[3]吴朝晖,杨莹春.说话人识别模型与方法[M].北京:清华大学出版社,2009.
[4]Azimi-Sadjadi MR,De Yao,Qiang Huang,et al.Underwater target classification using wavelet packets and neural networks[J].IEEE Transactions on Neural Networ-ks,2000,11(3):784-794.
[5]Pezeshki A,Azimi-Sadjadi MR,ScharfLL.Undersea target classification usingcanonical correlation analysis[J].IEEE Journal of Oceanic Engineering,2007,32(4):948-955.
[6]ScharfLL,Mullis CT.Canonical coordinates and the geometryofinference,rate,and capacity[J].IEEE Transa-actions on Signal Processing,2000,48(3):824-831.
[7]David R H,Sandor Szedmak,John Shawe-Taylor.Canonical correlation analysis:an overviewwith applicat-ion tolearningmethods[J].Neural Computation,2004,16(12):2639-2664.
[8]Burges CJ C.Atutorial on support vector machines for pattern recognition[J].Data Miningand Knowledge Discovery,1998,2(2):121-167.
[9]John C P.Fast Training of Support Vector Machines using Sequential Minimal Optimization[J].Advances in kernel methods:support vector learning,1999:185-208.
[10]Rong-En Fan,Pai-Hsuen Chen,Chih-Jen Lin.WorkingSet Selection UsingSecond Order Information for TrainingSupport Vector Machines[J].Machine LearningResearch,2005,6:1889-1918.
Echo Identification of Underwater Target Based on Frequency Domain Canonical Correlation Analysis
CHEN Tuo1,CAI Hui-zhi2,WU Yong-qing1,LV Yao-hui1
(1.Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190,China;2.Beijing Zhong Ke Hai Xun Digital Signal Processing Co Ltd,Beijing 100095,China)
Feature extraction and classification for underwater target echoes is one of key technologies for active sonar.Efficient features will be extracted using frequency-based canonical correlation analysis,which represent the comprehensive correlation characteristics between echoes from different targets.Support vector machine is used as a classifier to get final results.The proposed method is used for classification of different underwater targets in the lake and verified to be efficient according to numerical analysis results.
feature extraction;canonical correlation analysis;support vector machine
P733.2
B
1003-2029(2012)01-0014-05
2011-09-02
“十一五”预研基金(4010501050104)资助项目
陈拓(1985-),男,博士研究生,研究方向为信号与信息处理。