APP下载

半监督条件下基于朴素贝叶斯和Choi-Williams时频分布能量积累的雷达信号识别

2021-04-06王红卫董鹏宇周一鹏肖冰松

电子与信息学报 2021年3期
关键词:时频贝叶斯分类器

王红卫 董鹏宇 陈 游 周一鹏 肖冰松

(空军工程大学航空工程学院 西安 710038)

1 引言

雷达信号识别是电子侦察系统的关键环节,为后续的目标识别、定位、威胁告警等提供重要的先验信息[1,2]。当接收机接收到信号时,提取雷达信号的脉冲描述字等参数[3],并通过与先验知识库进行比较来判断辐射源信号样式以及目标类型。然而随着电子战环境的复杂度越来越高,这些经典参数的识别效果越来越不适应环境的变化,为了适应现代新体制雷达辐射源信号识别的需要,脉内特征参数成为研究的热点,基于信号脉内特征的辐射源信号识别自然成为研究的突破口[4]。

雷达信号识别技术可以分为3类:第1类是基于对系统参数的匹配分析,随着电磁环境越来越复杂,该方法已经无法适应作战需求;第2类是基于人工智能的识别分析,包括专家系统[5]、人工神经网络[6]和进化算法[7];第3类是脉内特征参数分析,提取的特征诸如能量聚焦效率检验[8]、模糊函数多普勒切片[9]以及时频特征[10,11],这些新特征的挖掘打破了雷达辐射源信号识别对于5大参数的依赖。另外,用于解决雷达信号识别问题的分类器主要包括监督学习和无监督学习。一些学者将K-means聚类[12]、K近邻算法[13]等无监督学习算法用于雷达辐射源信号识别过程,其操作简单成本低。但是因为无标签,导致最终识别结果不理想;还有一些学者将模板匹配法[14]、支持向量机[15,16]等监督学习算法用于信号识别过程,得到较好的识别效果,但是其学习过程需要大量先验信息,而现今复杂电磁环境下侦察方对复杂体制雷达信号往往得不到充足的先验信息,必然在非合作识别中存在缺陷,制约其对复杂体制雷达信号识别的推广。对于非合作侦察来说,侦察方能够得到的往往是少量的标记样本,大量的数据都是未标记过的。如果只使用少量的标记样本进行训练,一方面使用它们所训练出的学习系统往往很难具有强泛化能力;另一方面,大量的未标记样本不被利用也是对数据资源的一种浪费。对此,研究人员提出了使用大量未标记样本来改善学习性能的半监督算法,不仅较好地克服了监督学习模型泛化能力不强的缺点,也对无监督学习模型不精确的缺点进行了改善,使其成为机器学习领域研究的热点方向[17]。

考虑到传统方法在雷达信号非合作识别存在的不足,本文将朴素贝叶斯(Naïve Bayes, NB)和半监督学习结合,提出了改进的半监督朴素贝叶斯(Improved Semi-supervised Naïve Bayes, ISNB)学习算法并将其用于非合作雷达信号识别过程。在特征提取方面,考虑到低信噪比下的噪声导致Choi-Williams时频分布(Choi-Williams Distribution,CWD)图像恶化严重,使得识别效果不佳,本文基于时频变换得到一个在识别工作中有优势的特征—能量累积量,并将其定义为输入特征向量;在分类器设计方面,利用ISNB算法在无标记样本集生成的置信度列表中选取置信度较高的样本添加到有类标号样本集中,从而有效避免迭代失误,进而实现对雷达信号的准确识别。

2 调制信号CWD及其特征提取

本文研究的雷达辐射源脉内信号包括以下6种:线性调频(Linear Frequency Modulated,LFM)、非线性调频(Non-Linear Frequency Modulated,NLFM)、正弦调频(Sine Frequency Modulated,SFM)、Frank编码、相移键控(Quadrature Phase Shift Keying, QPSK)以及PSK/FSK混合编码信号。

2.1 调制信号Choi-Williams时频分布

常用的时频分析方法有:短时傅里叶变换(Short Time Fourier Transform, STFT), Wigner-Ville分布(Wigner-Ville Distribution, WVD),Choi-Williams分布(CWD)等。其中,CWD克服了STFT和WVD的缺点,不仅有较高的时频分辨率,还能够抑制和消除交叉项[18]。所以,本文选取CWD获得调制信号的时频分布图像。其表达式为

图1给出了信噪比在10 dB时上述6种信号的CWD 2维图像。其中,F.S.和T.S.分别为频率序列长度和时间序列长度。

文献[19]提出了基于CWD和CNN的雷达辐射源信号识别方法,在低信噪比条件下,噪声对于信号的CWD图像影响较大,造成了时频图像的严重失真,因此低信噪比条件下的识别效果较差。图2给出了信噪比在–5 dB时6种信号的CWD2维时频图,从图2可以清晰地看出,低信噪比条件下信号被噪声淹没得很严重,如果仅从CWD时频图进行信号识别,识别效果定然不理想。

2.2 调制信号Choi-Williams时频分布能量积累

在对高信噪比和低信噪比条件下调制信号CWD时频2维图进行对比分析后,可以看出虽然噪声对时频分布有较大的影响,但其大部分时频能量仍保留。定义时频分布能量点随时间序列在每一个频率点上的累积为能量累积量,定义式为

其中,m为时间序列,n为频率序列,p为CWD时频分布时间序列的长度,q为CWD时频分布频率序列的长度。

图3给出了6种信号在信噪比为10 dB条件下的CWD能量累积量图,从图3中可以看出,不同调制模式信号的时频图像的能量累积量图的形状是不同的,为后续识别提供了良好的依据。

图4给出了6种信号在信噪比为-5 dB条件下的CWD能量累积量图,从图4中可以看出,虽然不同调制模式信号的时频图像的能量累积量图的形状受到噪声的污染比较严重,但是相比于信号CWD时频图像来说,其保留了足够的峰值和宽度,其形状的不同足够使后续的识别系统识别不同的调制信号。

图1 6种调制信号在信噪比为10 dB时的CWD时频分布图

图2 6种调制信号在信噪比为–5 dB时的CWD时频分布图

2.3 降噪预处理

复杂电磁环境中接收到的雷达信号由于噪声的影响其CWD图像会发生严重失真。本文在将特征参数输入信号识别网络之前,对时频分布矩阵作如下处理,设时频分布矩阵为Ap×q,为了更好地进行降噪处理,将矩阵Ap×q转换为向量α=[α1, α2,···, αp]。其中,αi是矩阵Ap×q的行向量。

对于α,其0均值归一化由式(3)求得

其中,mean(α)是向量α中所有元素值的均值,var(α)是向量中所有元素值的方差。

图3 6种调制信号在信噪比为10 dB时的CWD时频能量积累图

图4 6种调制信号在信噪比为–5 dB时的CWD时频能量积累图

然后对新的向量α*进行如式(4)的操作

由式(3)和式(4)去除噪声点,显然,进行1次式(4)的操作只能去除一部分噪声。为了得到更好的降噪性能,需要重复式(3)、式(4)至少6次[20]。

然后,将处理后的向量α*转化为矩阵A*p×q。由式(2)求得新的特征向量,经过归一化处理得

图5展示了对NLFM信号去噪前后的CWD图像、EC-CWD和EC-CWD振幅直方图的对比。从CWD图像可以看出,图5(c)的大部分噪声已经消除了。另外,图5(d)—图5(f)显示了经过降噪预处理后,EC-CWD保留了脉冲信号的显著特征,图5(g)—图5(i)的振幅直方图表明了本文降噪方法是可行的。

3 改进半监督朴素贝叶斯分类器

3.1 半监督朴素贝叶斯

朴素贝叶斯分类算法的基本思想是根据贝叶斯定理,首先计算出测试样本数据特征的先验概率,进而估计出其属于某一类别的后验概率,最后预测出该样本数据的类别[21]。假设雷达信号特征分布为正态分布,通过提取训练样本的特征向量对分类器进行学习,得到训练后的分类器的参数,即均值向量mi=(mi1, mi2, ···, min)和方差向量σi=(σi1, σi2,···, σin),则根据正态分布概率公式有

则NB模型为

半监督朴素贝叶斯识别算法综合了监督学习和无监督学习两者的优点,能够同时利用少量的有标签样本数据和大量的无标签样本数据来进行识别。设有标签的数据集为l,无标签的数据集为u。贝叶斯分类算法根据有标签的训练集来预测测试样本集数据的类别,根据贝叶斯定理有

图5 NLFM信号降噪前后的CWD, EC-CWD及振幅直方图

其中,P(Xk/Ci)(l+u)和P(Ci)(l+u)的计算包含了无标签数据中的高置信度数据集[22,23]。

半监督朴素贝叶斯分类算法在对雷达信号进行分类识别时,首先利用少量的有标签的样本数据对分类器进行训练,然后利用训练好的分类对无标签数据进行识别,得到无标签数据的类标签,将识别到的无标签数据的类标签连同原始样本数据一起加入有标签的样本集中进一步训练分类器,提高对测试集数据预测的准确性。但是其存在一个问题,在对测试集进行预测的过程中,一旦预测错误,则会导致在迭代的过程中将大量的错误类标签的数据集添加到有标签的样本训练集中,从而降低识别的正确率。

3.2 改进的半监督朴素贝叶斯

针对上述SNB算法存在的问题,本文提出了改进的半监督朴素贝叶斯算法(ISNB)。改进的算法没有将无标签数据全部加入到初始样本中,而是选取其中置信度较高的样本,这样极大地提高了训练样本的正确率。在对后续测试集进行分类识别时,将会得到更加准确的结果,再利用预测后的分类结果对分类器参数(即特征期望向量mi和方差向量σi)进行改进,从而提高分类准确率。

对于基本的SNB算法,在式(9)中,需要计算多个概率的连乘,可能会造成结果的偏差,对乘积取对数,将连乘变成连加。改进后的SNB算法分类器表示为

步骤 3 将Ai中数值最大的Aimax返回并将其添加到置信度列表Clist中,令|U|=|U|–1,若|U|不为0,则返回步骤1;

步骤 4 将置信度列表中样本xj根据Ai的数值从大到小进行排列,取出前M个Ai所对应的样本,将其添加至有标签数据集L中,完成对样本集的更新。

4 识别流程

本文提取雷达信号CWD时频能量积累量作为特征,利用改进的半监督朴素贝叶斯作为分类器,进而完成对辐射源信号的识别。具体流程为:首先对接收到的雷达辐射源信号进行参数提取和分选预处理;然后对辐射源信号求取CWD时频图像并进行降噪预处理,提取其能量累积量作为特征参数,选取部分有标签样本的特征参数对分类器进行训练;利用初始样本训练完分类器之后,对没有标签的数据进行特征提取,并利用初始分类器进行分类,每次更新迭代过程中,选取没有标签样本中预测准确度较高的样本加入训练集,再次对分类器进行训练和修正,直到分类器参数满足收敛性条件;最后利用训练好的分类器对接收到的雷达辐射源信号进行分类和识别。

具体识别流程如图6所示。

5 仿真实验

仿真采用6种典型的雷达信号进行分类识别,分别为LFM, NLFM, SFM, BPSK, QPSK, PSK/FSK。载频设置为10 MHz,采样频率设置为100 MHz,脉宽设置为10 μs; LFM和NLFM的带宽设置为5 MHz,其中LFM信号的调频斜率设为0.5 MHz/μs, NLFM信号采用的多项式为f(t) =Bt/τ + Bt2/τ2; BPSK信号采用的编码方式为{1, 1,1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1}, QPSK信号采用弗兰克编码方式;PSK/FSK信号的跳频设置为2 MHz。

图6 辐射源信号识别流程

将本文提出的CWD能量积累特征作为图6识别流程的输入,6种雷达信号时域长度设为1000,能量累积量的长度为500,每种信号提取500组样本数据,在此基础上完成半监督分类器的训练和分类识别。

5.1 算法识别效果分析

本文采用Micro-precision标准[24]来计算识别率,具体公式为

设Clist.size为数据置信度列表的大小,将M值设为Clist.size×40%,且分类器参数收敛条件为α=0.05。对每一种雷达信号,随机选取样本的5%,10%, 15%, 20%, 25%作为有标签样本,剩余的作为无标签数据样本,将改进半监督算法同传统的半监督算法进行对比,仿真结果如表1所示。

从表1实验结果可看出,对于实验的6种雷达信号,随着有标签样本比例的增加,改进半监督朴素贝叶斯算法(ISNB)的识别率要高于传统的半监督朴素贝叶斯算法(SNB),说明改进后的SNB算法具有一定的优势。但是在实验的过程中,也发现了存在SNB算法识别率高于ISNB算法的情况,这是因为原SNB算法会使更多的数据加入有标签样本集,这样就使得信号样本集中大多数都是准确率较高的数据;而改进后的SNB算法是靠M值调整后续加入的准确度的数据的,这样就导致大量的高预测准确度的数据无法添加至有标签样本集中,使得其识别率不如原SNB算法。这样也可以得出这样的结论,当信号样本集中预测结果准确率整体较高时,应选取较大的M值,也就是将尽量多的高准确率的无标签样本加入至训练集中;另一方面,若对无标签样本的预测不是很准确,应选取较小的M值,此时应将尽可能少的那部分高置信度的样本加入至训练集中,而避免添加大量预测程度不高的无标签样本,进而对预测结果的正确性产生影响。

从图7可看出,ISNB算法较SNB算法具有更好的分类性能。该方法通过提取高置信度的无标签样本添加到训练集中,使得训练样本集中始终保留的是高质量的样本,从而避免了传统的SNB将预测的全部无标签样本添加至有标签样本集会产生迭代错误的缺陷,提高了对测试样本集的分类准确率。

5.2 不同信噪比下不同算法识别效果

文献[25]采用主成分分析法(Principal Component Analysis, PCA)对双谱进行降维从而提取出特征向量,下面使用此特征提取方法提取4种信号的特征向量,将本文提出的算法与SNB算法、文献[19]算法和PCA-SVM算法进行比较,当有标记样本比例为25%时在不同信噪比下对4种LPI雷达信号进行识别,识别结果如表2所示。

从表2中可以看出,相比于SNB算法和PCA-SVM算法,本文ISNB算法在不同信噪比下的识别率较高,识别效果较好。由于SNB算法将预测到的所有特征样本都添加至有标记样本,会产生迭代错误进而降低识别率;而采用PCA-SVM算法时,对信号进行双谱对角切片提取后的维数依然很高,此时训练出的SVM分类器学习能力不强,识别效果不太理想;ISNB算法通过提取CWD时频分布能量累积量作为特征,然后生成置信度列表进而选取预测准确度较高的特征样本,极大地提高了识别率,因而对于6类LPI雷达信号的识别更有效。

6 结论

本文针对先验信息残缺的非合作电子侦察背景下的雷达辐射源信号识别问题,提出了基于半监督条件下朴素贝叶斯和Choi-Williams时频分布能量积累的识别算法,具体完成了以下内容:

表1 两种方法在不同标记样本下的识别效果比较

图7 两种算法平均识别率对比

表2 不同信噪比下的识别正确率

(1) 在特征提取部分,本文针对低信噪比条件下雷达信号Choi-Williams时频分布出现严重失真的问题,提出了时频能量积累量这一新的特征用于后续分类器的输入,在经过降噪处理后,可以获得更加清晰的新特征包络,不仅有助于为后续分类器的分类识别工作,而且拓宽了电子侦察中的信息维度;

(2) 针对传统的半监督朴素贝叶斯算法在更新训练样本集过程中会产生迭代错误的不足,通过在无标签样本集生成的置信度列表中选取置信度高的样本添加到有标签样本集中,再利用预测后的分类结果对分类器参数进行修正,进而构建改进的SNB分类器,有效解决了传统SNB算法分类精度低且分类性能不稳定的缺点。

(3) 本文从理论论证了所提方法的可行性,并与经典算法进行对比,通过仿真验证了算法的有效性,为非合作侦察中辐射源信号的识别提供了新思路。

猜你喜欢

时频贝叶斯分类器
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
一种基于贝叶斯压缩感知的说话人识别方法
基于时频分析的逆合成孔径雷达成像技术
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
对采样数据序列进行时频分解法的改进
IIRCT下负二项分布参数多变点的贝叶斯估计
双线性时频分布交叉项提取及损伤识别应用