一种基于聚类和集成学习的混合脉冲去交错方法

2022-03-31建柴新新刘正成

舰船电子对抗 2022年1期

刘建柴新新刘正成

(中国船舶集团有限公司第八研究院,江苏扬州 225101)

0 引言

电子战是敌我双方利用电磁能和定向能以破坏敌方武器装备对电磁频谱、电磁信号的利用或对敌方武器装备和人员进行攻击和杀伤,同时保障己方武器装备效能的正常发挥和人员安全而采取的军事行动。雷达脉冲去交错技术是电子战中至关重要的一部分,是电子支援的核心和雷达对抗系统中的关键技术。在复杂的电磁环境下,来自同一类型的辐射源脉冲信号通常会采用同一传播路径,这使得接收到的信号在时域、空域和频域上均高度重叠交错。来自相邻方向上的同一类型辐射源发出的脉冲信号往往只是在频率上有所不同。但是,现代先进辐射源的脉冲频率会有一组集合,对于不同的辐射源而言,它们在这个频率集合上是存在交叉重叠的。在这种情况下,使用传统的去交错方法很难识别辐射源数量以及对混合脉冲信号去交错。

本文提出一种对同一类型、同一方向的混合脉冲信号的去交错方法。该方法首先根据脉冲信号的多参数对混合信号进行聚类,产生大量交错的小信号群。接着,采用集成学习的Stacking方法对脉冲信号进行分类,从而达到对不同辐射源信号去交错的结果。

1 传统的脉冲信号去交错方法

传统的去交错方法主要包括:基于脉冲重复间隔(PRI)的方法、基于脉冲多参数的方法、基于聚类的方法和基于脉内特征的方法。

常用的基于PRI的去交错方法有统计直方图法(如CDIF和SDIF)和PRI变换法。基于PRI的去交错方法利用到达时间参数(TOA)来计算脉冲之间的PRI。但是在混合脉冲信号中,仅有交错在一个狭窄范围内的PRI能被正确检测到。现代的辐射源越来越复杂,通常有较大的PRI范围和复杂的交错,这使得使用单一参数去交错的方法变得愈加困难。因此,目前研究多数集中在使用多个参数进行去交错。

多元脉冲参数去交错方法的思路来自于模板匹配,从接收到的信号中提取TOA、DOA(波达方向)、射频(RF)、脉宽(PW)和脉冲幅度(PA)等参数,并与辐射源数据库中的模板进行比对。随着人工智能技术的发展,多参数模板匹配方法也有了新的进展。例如,使用神经网络能够提高高度重叠脉冲信号去交错的正确性。基于脉冲多参数去交错方法的性能取决于辐射源数据库的正确性和完整性。

基于聚类的去交错方法也使用脉冲参数。每个辐射源被当做一个群组,每个脉冲都是一个样本。来自同一个辐射源的信号属于一个群组,以此进行混合信号去交错。由于聚类方法是无监督的,因此不需要先验知识。基于聚类方法的性能取决于来自同一辐射源信号的相似性和不同辐射源信号的差异性。

基于脉冲特征的去交错方法除了使用上述提出的多个参数外,还引入了一个新的特征维度。然而,复杂电磁环境下脉冲信号的脉内特征提取存在一定的困难,目前对该技术研究较少。

在复杂电磁环境下,混合脉冲信号的脉冲参数TOA、DOA、PW 和PA 非常接近,甚至相同。在这种情况下,传统的基于多脉冲参数的去交错方法性能较差。因此,本文提出一种利用聚类和集成学习相结合的方法对复杂电磁环境下的混合脉冲信号进行去交错。

2 基于聚类算法和集成学习的去交错方法

如图1所示,本文提出了一种将聚类方法和集成学习相结合的去交错方法。该方法首先利用脉冲参数进行聚类,得到若干个小的信号群组;接着进行特征提取,然后将数据集输入到分类器中进行训练和预测,采用集成学习的Stacking方法将不同信号群组按照辐射源进行分类融合,从而将交错信号分开。

图1 基于聚类和集成学习的去交错方法模型图

2.1 基于脉冲参数聚类

在聚类阶段,分别利用脉冲的RF和TOA 2个参数进行2次聚类。通过不同的参数进行聚类,将混合脉冲划分成若干个小的信号群组,在同一个群组内的信号来自于同一个信号源。下一步将会把不同群组按照信号源分类进行融合。

由于相同类型的辐射源有着相同的DOA,为了避免互相干扰,就必须使用不同的RF。因此,在这种情况下RF是区分不同信号源最有效的参数。每个辐射源可能有多个频率,但是不同辐射源的频率集是不重叠的,因此将具有相同射频的脉冲分到同一个群组()中,并计算PRI 值,方便后续处理。

第2次聚类利用脉冲的TOA 参数。假设信号组()中最新的2个脉冲的PRI值相等,则后续脉冲()的TOA 可以根据脉冲信号的延续性计算得到:

式中:和分别表示来自同一个辐射源的群组索引号;

表示某个信号群组中的脉冲序号。因此,相邻脉冲群组满足公式(1)的可以被归为来自同一个辐射源,并融合到群组(),如图2所示。

图2 脉冲信号TOA 参数聚类

2.2 基于集成学习的辐射源分类

来自同一个辐射源的脉冲序列通常有着某种变化趋势,这取决于辐射源的特性和位置影响。因此,脉冲信号的变化趋势可以被用来混合脉冲去交错。例如,搜索型辐射源脉冲信号的幅度(PA)通常会有一个凸起形状,如图3 所示。信号组()和()有着同一种变化趋势,很大概率来自于同一辐射源,而()来自于另外一个辐射源。

图3 脉冲幅度的变化趋势

专家能够通过对大量数据进行分析获得信号的变化趋势,并且在遇到新的混合信号时,可以确定输入信号的数量以及根据所学知识识别来自于同一辐射源的信号,我们的目标就是构建一个像专家这样有效工作的机器系统,因此本文采用了集成学习的思想来构建这个系统。

如前文所述,聚类是基于脉冲序列的变化趋势。因此,从相邻的2个信号群组中提取的特征应该能够表征它们之间的关系和脉冲序列的形状。本文中用到的特征与文献[6]中一致,如表1所示,其中表示信号组的索引号,表示信号中脉冲的索引号。

表1 Stacking模型中输入的脉冲特征

到达时间(TOA)差值特征表示信号组序列,来自同一个辐射源的信号组的差值必须为正值,而差值为负值则表示存在2 个不同的辐射源。幅度(PA)差值特征表示相邻的信号组幅度的连续性,来自同一个辐射源的信号组必须有很小的幅度差值。幅度的变化范围、变化趋势用来表征信号组的形状。

在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时候只能得到多个有偏好的模型(弱监督模型,在某些方面表现得比较好)。集成学习潜在的思想是即使某个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来。集成学习是将几种机器学习方法组合成一个预测模型的元算法,以达到减小方差、偏差或改进预测的效果。

本文采用的是Stacking方法,该方法是一种集成学习技术,通过多元分类器组合多个分类模型。如图4所示,基于完整训练集训练各个分类模型,基于各个分类模型的输出-元特征来拟合元分类器。元分类器可以根据预测类标签或者来自集合的概率进行训练。即首先训练多个不同模型,然后再以之前训练的各个基分类器模型的输出作为主分类器的输入进行训练。本文中采用的基分类器分别是朴素贝叶斯、决策树和近邻,目标分类器采用的是逻辑回归。

图4 Stacking模型图

3 仿真实验及结果分析

3.1 实验设置

为了验证本文提出方法的有效性,用软件仿真模拟电磁环境来生成混合脉冲信号。为了对比文献[6]中提出的方法,我们设置的仿真训练环境参数与其保持一致。本实验设计了2个发射器和1个接收机,2个辐射源是同一个类型且由同一个方向发出。2个辐射源发出的信号有着一样的PA、PW、PRI和DOA,进行4轮仿真,每次持续20 s。

得到仿真数据后,训练集和测试集按7∶3的比例划分,并采用5折交叉验证法对本文提出的方法进行验证。

本文在4个测试集上对提出的方法进行实验验证,如表2所示,一共有4个数据集,分别是A、B、C、D,每个数据集包含2种辐射源。

表2 测试集数据描述

图5展示了某训练集中混合脉冲信号分布,点和圆圈表示2种不同的辐射源。

图5 某训练集脉冲信号分布

3.2 实验结果与分析

本文在4个数据集上进行仿真实验验证,并设计对比实验来验证本文提出方法的有效性,对比方法如下:CDMD 表示本文提出的方法;CDMD-NBM表示本文方法分类模块只保留朴素贝叶斯;CDMDDT 表示本文方法分类模块只保留决策树;CDMDKNN 表示本文方法分类模块只保留近邻;Mu’19表示Mu等人在文献[6]中提出的方法。

仿真实验结果如表3所示。从表3可以看出,只保留单一分类器的3种方法仿真实验准确性均不如本文提出的方法。从而说明Stacking 确实可以提升预测结果的准确性。同理,本文提出的方法CDMD 优于Mu’19,因为Mu’19中采用支持向量机算法进行分类,该方法也是单一的分类器,单一的弱分类器在分类时可能存在欠拟合问题。本文提出的方法采用的是Stacking融合方法,能够弥补各个单分类器的不足,从而提高分类结果的准确性。

表3 不同去交错方法的准确性

4 结束语

本文提出了一种复杂电磁环境下混合脉冲去交错方法,首先利用脉冲的多参数进行聚类,然后再采用集成学习的Stacking方法进行分类。与传统的仅采用脉冲参数TOA、DOA、PW、PA 的方法不同,本文提出的方法提取的是表征脉冲序列变化趋势的特征,接着将数据集输入到分类器中进行模型训练,然后利用训练好的Stacking模型对2 类辐射源信号组进行分类来达到去交错的效果。仿真实验结果表明本文提出的方法与对比方法相比,平均提升了2.41%,从而说明本文提出方法的可行性与有效性。