基于EMD能量占比的海面漂浮小目标特征检测
2021-01-26时艳玲刘子鹏张学良顾为亮
时艳玲, 刘子鹏, 张学良, 顾为亮
(南京邮电大学通信与信息工程学院, 江苏 南京 210003)
0 引 言
有效探测海面小目标是雷达检测领域的热点问题之一。针对非线性非平稳的海杂波,有效的统计模型有很多,比如K分布、对数正态分布、韦伯尔分布、逆高斯分布等[1-8],但由于海杂波的非线性非平稳性,统计模型存在一定的误差。
同时,除了建模这一有效的检测方法外,众多学者还提出了基于特征的海面目标检测算法。海内外的研究者关注较多的特征研究理论主要包括混沌理论和分形理论[9-11]。在特征的提取研究中,混沌理论相关的特征是否有效依然存在争议[12]。一般认为,在海杂波的短时序列中并不能使用单分量的混沌模型来提取特征,但海杂波可能是多个混沌模型复合的。另一方面,分形理论由于具有较好的可解释性[13],在海杂波特征研究方面广受欢迎。
另外,提取特征的方法还包括时频分析法[14-15]。时频分析法主要包括:快速傅里叶变换、短时傅里叶变换、分数阶傅里叶变换、小波变换等。于晓涵等人提出了基于短时稀疏分数阶变换和短时稀疏分数阶模糊函数的雷达机动目标检测和估计方法[16]。但是,传统的傅里叶变换分析方法缺乏对信号某一特定频率的研究,短时傅里叶变换与小波分析仅能对信号某段特定频率进行研究,不能同时准确地表达时间和频率上的信号变化,因此这几类时频处理方法难以处理非线性非平稳的海杂波信号。经验模态分解(empirical mode decomposition, EMD)[17]克服了上述时频处理方法的缺陷,是真正意义上的自适应时频分析方法,尤为适合解决现实生活中遇到的非线性非平稳的信号[18-19]。
近些年的研究和发展,使得EMD方法取得了非常广泛的应用。张建等人提出了一种基于EMD的低频固有模态函数(intrinsic mode function, IMF)分量的能量比目标检测方法[20],通过采用高阶IMF分量与低阶IMF分量的能量比作为特征来实现目标检测,效果显著。关键等人提出了一种基于固有模态能量熵的微弱目标检测算法[21],利用能量熵特征描述各阶IMF分量的变化,有效增强了雷达对海杂波中微弱目标的检测能力。张林等人提出了一种基于分形特性改进的EMD目标检测算法[22],并采用快速傅里叶变换进行去噪,实现了性能优良的检测算法。
海杂波的频率一般位于低频位置,而小目标信杂比较低,速度较慢,多普勒频率窄,且目标多普勒频谱易被海杂波的频谱掩盖。EMD方法能将接收的回波数据从高频分解到低频,实现从高频到低频由粗到细的过程。通过EMD的方法,可以细化海杂波和目标的频率并分解成不同的IMF分量,利用不同的IMF分量观察海杂波和目标的差异。但是,大多数采用EMD的研究方法主要存在两处缺陷:第一,对于IMF分量的选取没有固定的选取标准,导致很多IMF分量提取的特征并不能区分目标和杂波。第二,大多数研究者提取的特征性能有限,无法更进一步地提升EMD带来的优势。针对这两点,本文的创新点主要是:第一,针对IMF分量的选取,提出了一系列的筛选标准;第二,根据提出的筛选标准,利用筛选出的IMF分量,提出了一种基于能量占比特征的检测方法。经过大量的实验对比分析,发现提出的检测方法具有优良的检测性能。
本文首先采用EMD将接收回波数据分解为若干个IMF分量,实现对接收回波的频率从高频到低频的分解;在采用EMD后,纯海杂波的能量主要集中在前几个IMF分量中,而目标的前几个IMF分量的能量相对较少。同时,由于海杂波的非线性非平稳特性,回波中分解出的IMF分量并不都适合用来做检测。为此,分别建立IMF分量与原始数据的线性相关性,求出各分量的相关系数,并利用平均均值与标准差之比作为筛选IMF分量的准则,实现对目标所在的IMF分量的自动筛选。最后,确定目标所在的IMF分量在原始信号中的能量占比情况,并将能量占比作为特征来实现海面漂浮目标的异常检测。最终,通过实测数据进行实验,验证了所提的能量占比算法较对比算法具有更好的目标检测性能。
1 EMD算法的特征分析与提取
1.1 EMD算法简介
EMD算法可以根据信号本身的局部时间尺度特征来进行平稳化分解,是希尔伯特黄变换(Hilbert-Huang transform, HHT)的核心,具有良好的自适应性,适合处理非线性非平稳的复杂信号,如海杂波信号。EMD可以将信号分为多个IMF分量和残留信号,每个IMF包含同等数目的极值点和零交叉数,连续两个极值点之间定义了信号局部波动特征,反映了信号在不同尺度上的特性。每个IMF都关于时间轴局部对称。
设雷达接收回波数据的幅度为y(n),n=1,2,…,N,经EMD后[23],可表示成:
(1)
式中,xi(n)是第i个IMF分量;R(n)为残差分量;I为IMF分量的个数。
据此,接收回波信号y(n)被分解为具有不同频谱特性的IMF分量xi(n),低阶IMF分量对应信号的高频部分,高阶IMF分量对应信号的低频部分。
1.2 能量占比特征提取
相关系数是表征两序列之间的线性相关程度的量,常作为统计特征值来进行数据线性相关程度的判断,可应用于故障诊断、目标探测等。假设已经接收了K段长度为N在第p个距离单元的回波数据y(n,k,p),n=1,2,…,N,k=1,2,…,K,p=1,2,…,P,则第i个IMF分量xi(n,k,p)与接收回波y(n,k,p)的相关系数Corrxi,y(k,p)可表示为
Corrxi,y(k,p)=
(2)
(3)
(4)
由于IMF分量反映了数据在不同频率范围的分布情况,为了获得目标所在的IMF分量,需要对IMF分量进行筛选,首先定义了均值-标准差之比(mean-standard deviation ratio, MSR),即
(5)
然后,当对所有P个距离单元的MSRi(p)进行平均时,定义平均MSR(mean of MSR, MMSR)作为筛选准则,即
(6)
式中,ε为一个较大的正数,ε的取值将依据具体的数据确定。考虑到适合的IMF分量不仅需要特征值上的差异明显,且在整体上的分布要比较均衡,以减少海杂波和目标特征值上的混叠,因此希望海杂波和目标的标准差尽可能小。
通过式(6),得到了第p个距离单元的两个IMF分量,假设为第j个和第l个IMF分量xj(n,k)和xl(n,k),j,l∈{1,2,…,I}。为了避免公式复杂,在后续的公式中,默认数据的第3维是指第p个距离单元。目标的存在不仅改变了原始海杂波的IMF分量的频率结构信息,而且也改变了原始海杂波IMF分量的能量结构。通过大量的实验分析,杂波的频谱宽而目标的频谱窄,且都在低阶的IMF分量上,目标的频谱被淹没在杂波的频谱上。同时,目标的IMF分量的能量占比特征比同阶数杂波的IMF分量的能量占比要低。那么,xj(n,k)在接收回波数据中的能量占比(energy ratio, ER)为
(7)
考虑到目标的运动性,目标会影响多个IMF分量,由上述筛选过程可以求出其中受影响最严重的两个IMF分量,经过大量实验,这两个IMF分量的能量占比特征均有较好的检测性能。于是,采用均值能量占比(average energy ratio, AER)作为检测统计量来实现海面漂浮小目标检测,AER检测统计量的计算公式为
(8)
式中,j和l为被筛选出的IMF分量的阶数。利用AER作为检测统计量,如果待检测单元的检测统计量小于判决门限则认为有目标;否则认为当前单元为纯杂波单元。由于式(8)中的检测统计量涉及许多复杂操作,实验中采用蒙特卡罗方法来确定给定虚警下的检测门限。
依据上面的特征提取过程,本文提出的基于EMD的AER特征检测的流程图,如图1所示。图1中,pf表示给定的虚警概率,Hi表示有目标,H0表示无目标。
图1 基于EMD的能量占比特征检测流程图Fig.1 Flow chart of energy proportion feature detection based on EMD
依据图1,本文提出的基于EMD的AER特征检测算法的具体步骤如下。
步骤 1接收K段长度为N在第p个距离单元的回波数据的幅度为y(n,k,p)。
步骤 2将第k段接收回波数据进行EMD,计算I个IMF分量xi(n,k,p)与接收回波幅度y(n,k,p)的相关系数Corrxi,y(k,p)。
步骤 3根据式(6),筛选出第j和第l个IMF分量xj(n,k)和xl(n,k)。
步骤 4根据式(7)和式(9),计算筛选出的xj(n,k)和xl(n,k)在接收回波y(n,k)中的能量占比,并求AER(k)作为特征检测量。
步骤 5采用蒙特卡罗方法来确定给定虚警下的检测门限,并利用AER特征实现海面漂浮小目标的检测。
2 实验结果分析
本节首先给出相关系数分析,然后介绍ER特性分析,随后给出利用MMSR筛选目标所在的IMF分量的合理性分析,以说明本文提出的AER检测器的合理性,最后将AER与快速傅里叶变换(fast Fourier transform, FFT)、频域香农熵(shannon entropy, SE)检测器[24]以及低频IMF能量比检测器(proportion of low frequency IMFs energy, LIMF)[18]进行对比实验。
采用全相参X波段(ice multiparameter imaging X-band, IPIX)雷达数据库驻留模式下的10组实测雷达数据[25]以及南非科学与工业研究院(the Council for Scientific and Industrial Research, CSIR)雷达数据TFA10_001,其数据说明如表1所示。其中,前10组数据每组由14个相邻距离单元组成,每个距离单元采样点数为131 072(即131.072 s),目标是用金属丝网包裹、直径约1 m的聚苯乙烯泡沫塑料球。目标所在的距离单元称为目标单元,目标单元周围的2个或3个单元受漂浮目标的影响,称为受影响单元,其他距离单元称为杂波单元。这10组数据的距离分辨率为30 m,其中第一组数据为3~4级海况,属于高海况,第7组数据为中海况,其他数据属于低海况。第11组数据由64个相邻距离单元组成,中心频率为6.9 GHz,距离分辨率为15 m,海况等级是4级海况,属于高海况。
表1 IPIX雷达数据和CSIR数据说明
2.1 相关系数分析
针对相关系数分析,采用第4组数据(#31)的HH极化以及第11组(TFA10_001)数据。图2显示了所有距离单元的前5个IMF分量与接收回波的平均相关系数。
图2 前5个IMF分量的相关系数均值对比Fig.2 Comparison of correlation coefficient mean values of the first five IMF components
由表1可知,第4组数据(#31)的目标单元为第7个距离单元,受影响单元为第6、8、9个距离单元,剩余的单元为杂波单元。由图2可知,首先目标单元和受影响单元的前几个分量与接收回波数据相关系数比杂波单元的相关系数要小很多,说明采用相关系数可以粗略地分出目标单元和杂波单元。其次,由图2(a)可知,在目标单元中,IMF1、IMF2、IMF3这3个分量的相关系数最小,说明目标严重影响了低阶IMF分量。最后,随着IMF分量的阶数增加,目标单元的相关系数也增加,导致与海杂波的区分性小。在图2(b)中,目标前3个IMF分量的相关系数小于杂波单元,而在IMF4和IMF5中这种规律并不存在。出现该现象的原因是海杂波主要集中在低频部分,IMF分量是由高频到低频变化排列的,即低阶分量代表高频部分,而高阶分量代表低频部分。阶数越高,海杂波的主导性越明显,则相关系数会变大,导致海杂波与目标的可分性变差。而在低阶分量上,海杂波的主导性弱,目标的主导性强,导致分解前后的相关系数小,海杂波与目标的可分性变好。所以,通过这个实验可以得知,对IMF分量的选取不是随机任意的,需要对IMF分量进行筛选,通过一定的筛选标准自适应地选取两组IMF分量来进行后续的目标检测,该两组IMF分量含有表征海杂波和目标之间差异的特性。本文给出的其余组数据也显示出相类似的实验结果,不再一一列出。
2.2 ER特征分析
ER特征的实验参数与相关系数的实验参数相同。图3显示了所有14个距离单元的前5个IMF分量在原始信号中的ER值。从图3中可以看出,首先,目标单元的IMF1在原始信号中的ER值非常小;其次,随着IMF分量的阶数增加,目标所在单元的ER值也随之提高;最后,海杂波所在单元的各阶IMF分量(除IMF1分量外)的ER值分布较均匀,且杂波所在单元前几个IMF的ER值要高于目标单元的IMF的ER值。出现上述3个现象的主要是:首先,在目标单元,接收回波的高频部分受到了目标小球的影响,由于目标的频谱比较窄,使得能量比较集中在后几个IMF分量中,因此前几个IMF分量的ER比较小。其次,随着IMF分量阶数的增加,分解到高阶IMF分量的能量增加,使得ER值增加。最后,杂波所在单元前几个IMF的ER值要高于目标单元的IMF的ER值,主要是因为杂波的频谱相对于目标的频谱较宽,使得分解的能量较为分散地落到各阶IMF分量上,与此同时,由于海尖峰的存在,也会有较多的能量分解到较低阶的IMF分量上,使得杂波的较低阶IMF分量的ER值高于目标的ER值。随着IMF阶数的增加,这种差距越来越小,甚至有些杂波的高阶IMF分量的ER值会小于目标的ER值。鉴于此,可选用ER值作为特征区分海杂波和目标。
图3 #31数据HH极化的前5个IMF分量能量占比的均值对比Fig.3 Comparison of the mean energy proportion of the first five IMF components for data #31 under HH polarization
经过式(6)对IMF分量的筛选,确定出IMF2和IMF3能体现目标与海杂波的区别。图4显示了IMF2和IMF3能量占比的检测性能,纵轴表示检测概率pd。利用蒙特卡罗方法来确定给定虚警范围内的检测门限,待检测单元的检测统计量小于判决门限则认为有目标;否则认为当前单元为纯杂波单元。
图4 #31数据HH极化下IMF2和IMF3能量占比检测性能对比Fig.4 Detection performance comparison of IMF2 and IMF3 energy proportion for data #31 under HH polarization
两个IMF分量已显示出较好的检测性能。考虑到目标的运动性,目标可能被分到两个IMF分量中,所以单一选择一个IMF分量是不合理的。于是,给出平均能量占比的方案,即AER,更加符合实际情况。不选择IMF1的原因是,在图2(a)和图3中,海杂波所在单元IMF1与目标所在单元IMF1所体现出的相关性相当,ER值也不相上下,不能体现出海杂波与目标的明显区别,故在实际应用中不宜选择IMF1。
2.3 筛选合理性分析
本节主要对利用MMSR来选择IMF分量的合理性进行分析。采用第1组数据(#17)和第4组数据(#31)进行对比分析,其中第1组数据是3~4级海况,属于高海况,第4组数据是2~3级海况,属于低海况。通过对高低海况的对比分析,来说明选择IMF分量的合理性。图5显示了两组数据HH极化下的MSR和各IMF分量的MMSR。
图5 #17数据在HH极化下的MSR和MMSR对比Fig.5 Comparison of MSR and MMSR for data #17 under HH polarization
由表1可知,第1组数据(#17)的目标单元为第9个距离单元,受影响单元为第8、10和11个距离单元,剩余的单元为杂波单元。第4组数据(#31)的目标单元为第7个距离单元,受影响单元为第6、8和9个距离单元,剩余的单元为杂波单元。从图5(a)和图6(a)可以看出,目标所在单元的MSR较低,而杂波单元的MSR较高。这是因为在同一标准差水平下,目标的相关系数均值较低。图5(b)和图6(b)是对各IMF分量的MSR在所有距离单元上取平均,即MMSR,横坐标表示分量的阶数。从图5(b)和图6(b)可以看出,不管是高海况还是低海况,IMF2和IMF3均体现出较大的MMSR,这说明综合使用IMF2和IMF3是合理的,而单一选择某个IMF分量会导致无法达到最优的检测性能。
图6 #31数据在HH极化下的MSR和MMSR对比Fig.6 Comparison of MSR and MMSR for data #31 under HH polarization
表2给出了两组数据HH极化下单个IMF分量能量占比的检测概率。由表2可以看出,在各种虚警概率下,#17数据的IMF2和IMF3分量拥有较高的检测概率,#31数据的IMF2和IMF3分量拥有相对较高的检测概率。这主要是因为在不同海况下,采用EMD后,同一数据的不同IMF分量描述不同的频率,而不同数据的同阶IMF分量描述的频率也不同。又因为不同海况下,目标所在单元受影响的频率段不同,主要集中在高频部分。因此,需要根据不同的海况来找出目标回波中受影响最严重的频率段,也就是找出能够凸显海杂波和目标回波之间差异的IMF分量,然后提取ER特征做检测。
表2 第1组数据(#17)和第4组数据(#31)在HH极化下不同IMF分量的能量占比检测概率
针对第11组数据,做了同样的分析处理,IMF分量的筛选结果如图7所示。
图7 第11组数据的筛选结果Fig.7 Filtering results of the eleventh set of data
由图7可知,通过MMSR准则可以筛选出两组分量分别是IMF1和IMF2,这说明提出的筛选准则能够根据数据来做出合理选择。
本文提出的MMSR准则在平均尺度和离散程度之间衡量,是针对具有不同均值的各距离单元在离散程度上的描述,即希望目标数据和海杂波数据在各自的均值水平上都比较聚集,防止目标和海杂波数据过多的混叠,从而能够得出平稳且合理的检测效果。通过上述实验证明,所提出的MMSR准则能够非常准确地自动筛选出最适合做检测的IMF分量,也进一步验证了综合使用两个筛选出的IMF分量是合理可行的。
2.4 检测性能分析
本节采用表1给出的11组数据的4种极化方式,对比本文提出的AER与对比算法FFT、SE和LIMF 4种检测器的性能。实验参数为:K=10 000,I=8,N分别取512,1 024,2 048和4 096。虚警概率pf=0.001。其中,为了保证获得足够的数据,对相邻数据段采取每次滑动10个点的处理。每种极化方式的观测时长均为0.512 s,1.024 s,2.048 s和4.096 s。
2.4.1 AER检测性能分析
图8显示了11组数据在4种极化方式下的检测概率图。为了便于分析,图9显示了11组数据的平均信杂比(average signal to clutter ratio, ASCR)图。如图8所示,在不同极化方式下有不同的检测概率。其中HV和VH极化下的检测概率相似,而HH和VV极化方式的检测概率差异明显。造成这种现象的主要原因是ASCR的不同,一般来说,ASCR越高,检测概率越高,大部分的实验结果与此结论是相符的。对于第11组数据,ASCR很高,所以具有非常好的检测概率。在IPIX的10组数据中,除第1组数据(#17)和第7组数据(#280)外,其余8组均在低海况下采集。在整体上,由于提出的AER实质上反映的就是ASCR,所以在实测数据中,ASCR越高,检测概率就越高。但这并不是严格成立的,检测概率还要受到风速、浪高和雷达方向角的影响。对于第1组数据,HH极化下的ASCR最高,却没有达到非常高的检测概率。同样,HV和VH极化下的检测概率也没有达到与ASCR相应的水平,这主要是因为第1组数据是在高海况下采集的,掠射角度较小,浪高2.2 m,产生了遮挡效应,目标经常会被海浪掩盖,从而影响了检测性能。
图8 11组数据在4种极化方式下AER特征检测器检测性能Fig.11 Detection performance diagram of AER feature detector with four polarization modes of 11 sets of data
图9 11组数据的ASCRFig.9 ASCR of 11 sets of data
表3是11组数据在4种极化方式的ASCR与检测概率的关系表,其中,N=4 096,虚警概率pf=0.001。ASCR的计算公式如下:
(9)
表3 检测概率关于ASCR分布表
2.4.2 4种检测算法的检测性能对比
将分析本文提出的EMD下的AER特征检测器与FFT、频域SE检测器以及LIMF检测器的实验性能。4种检测算法针对4种极化方式的数据观测时长为0.512 s,1.024 s,2.048 s和4.096 s,即采用同样的方法对数据进行分段和选取。图10~图13显示了4种检测算法的检测性能。从图10~图13中可以直观地看出,在4种极化方式下,本文所提出的AER方法均有较好的检测概率。FFT的检测方法不能有效地提取特征,特别是在ASCR很低的数据上完全丧失性能。频域SE检测算法在采用FFT下,不能完全挖掘出海杂波的非平稳和非均匀特性。LIMF检测算法同样用EMD后的IMF分量提取特征,但在提取的特征上直接将前3组IMF分量混合在一起,忽略了分解时各IMF分量的差异性,虽然在某些特定数据上表现效果较好,但整体上逊色于提出的AER。本文所提方法挖掘出海杂波的非平稳和非均匀特性,又克服了FFT的缺点,所以在各组数据上都有较好的表现。这同时也说明了较之于传统的傅里叶变换下的特征检测,采用EMD以及所选取的AER特征在海杂波目标检测上有明显的优势。图14为第11组数据采用4种不同算法下的检测概率图,观测时长分别为0.064 s,0.128 s,0.256 s和0.512 s。其中,需要指出的是,在观测时长超过1.024 s后,4种检测方法的检测概率均已达到1,因而此处未将观测时长超过1.024 s的对比放入文中。由图14可以看出,本文采用的方法与其他方法相比略有优势,不过微乎其微,但是相当高的检测概率也足以说明本文采用的算法是行之有效的。
图10 N=512时不同极化方式下4种极化方法的检测结果对比(pf=0.001)Fig.10 Comparison of detection results of four methods under different polarization modes when N=512 (pf=0.001)
图11 N=1 024时不同极化方式下4种极化方法的检测结果对比(pf=0.001)Fig.11 Comparison of detection results of four methods under different polarization modes when N=1 024 (pf=0.001)
图12 N=2 048时不同极化方式下4种极化方法的检测结果对比(pf=0.001)Fig.12 Comparison of detection results of four methods under different polarization modes when N=2 048 (pf=0.001)
图13 N=4 096时不同极化方式下4种极化方法的检测结果对比(pf=0.001)Fig.13 Comparison of detection results of four methods under different polarization modes when N=4 096 (pf=0.001)
图14 第11组数据在不同观测时长下4种方法的检测结果对比(pf=0.001)Fig.14 Comparison of detection results of four methods under different observation duration of the data for the 11th set of data (pf=0.001)
3 结 论
本文主要对接收回波数据的幅度进行了EMD,并对得到的IMF分量进行了研究分析。首先,从分解后的IMF分量与原数据的相关性角度切入,分析了各层IMF分量与原数据的相关性,同时对比杂波数据和目标数据之间的相关性差异,采用MMSR准则筛选出能充分体现出目标与杂波差异的两组IMF分量。然后,利用IMF分量在原数据中的ER值作为提取的特征,对筛选出的IMF分量进行ER特征的提取与分析,发现目标单元的ER值比较低,而海杂波单元的ER值比较高。最后,对选出的两组IMF分量的ER值进行平均,得到AER作为特征进行检测,并与传统的FFT检测、FFT下的频域SE检测以及LIMF检测做了对比,实验结果显示本文所提出的方法具有比较显著的效果,说明所提出的方法是可行的。