基于特征提取和机器学习的电磁目标识别方法
2022-07-22徐洪志姚家驰李彩霞蒋东翔孙腾龙赵新青
徐洪志 姚家驰 刘 超 李彩霞 蒋东翔 孙腾龙 赵新青
(1.中国人民解放军32142部队 河北保定 071000;2.清华大学 北京 100084;3.河北大学 河北保定 071000)
0 引言
电磁目标识别在军事领域中具有非常重要的作用,通过识别电磁目标的类型和数量能够有助于判断敌方所使用的设备状态及人员规模,进而提前有针对性地部署相应的作战方案。目前国内外学者对电磁目标识别进行了许多研究,主要有基于卷积神经网络的方法,基于轻量化卷积神经网络的方法,基于深度学习的方法,基于深度神经网络与多任务学习的方法,基于轻量级深度神经网络的方法,基于迁移学习的方法,基于压缩感知的识别方法,基于模型的识别方法,基于指纹机制的识别方法等。基于神经网络和深度学习的方法虽然识别准确率高,但是复杂的网络结构会导致计算时间较长,且需要较高的计算硬件条件;基于模型和指纹机制的识别方法需要根据电磁目标的特点建立相应的数学模型,虽然能够准确识别电磁目标,但是存在模型通用性有限等限制。
本项工作针对实际现场环境中要求快速准确识别出电磁目标的需求,提出一种基于特征提取和机器学习的电磁目标识别方法,同时针对现有电磁目标数据库数据有限的情况,提出通过重采样、改变幅值和信号叠加三种方法扩充现有数据库,通过本项工作既能扩充现有电磁目标数据库,又能实时准确地识别出各电磁目标。
1 电磁目标数据库及其扩充方法
对于电磁目标识别,Anu Jagannath和Jithin Jagannath学者通过研究得到了电磁目标数据库。该数据库主要包含8种信号类型和6种调制类型,8种信号类型分别为Airborne detection radar、Airborne range radar、Air-Ground MTI radar、Ground mapping radar、Radar Altimeter、SATCOM、AM Radio、Short-range wireless;6种调制类型分别为Pulsed Continuous wave、Frequency modulated Continuous wave、BPSK、AM-DSB、AM-SSB、ASK。虽然该数据库中已有许多数据,但是在实际应用中可能还不够,为了扩充数据库,提出通过重采样、改变幅值和信号叠加三种方法对现有数据库进行扩充:重采样指改变电磁信号的采样频率;改变幅值指增加或降低电磁信号的幅值;信号叠加指将两个或两个以上的电磁信号混合生成新的电磁信号。通过重采样、改变幅值和信号叠加三种数据扩充方法能够有效扩充现有的电磁目标数据库,有助于开展电磁目标识别研究。
对于扩充的电磁目标数据库,选取8种电磁目标进行研究,如表1所示。
表1中电磁目标类型6采用了重采样处理,电磁目标类型7采用了改变幅值处理,电磁目标类型8由电磁目标类型1和2叠加生成。对于选取的8种电磁目标,研究能在不同信噪比(18dB、16dB、14dB、12dB、10dB、8dB)下准确识别各电磁目标的方法,每种电磁目标类型有600个样本,表1中8种电磁目标类型的波形图如图1所示。
表1 8种电磁目标
图1中展示的是在信噪比18 dB下第78个样本数据的电磁目标波形图。对于8种电磁目标类型,每种类型共有600个样本数据,将其中的70%当作训练集用于训练,剩下的30%当作测试集验证所提出电磁目标识别方法的识别效果。
图1 8种电磁目标波形图
2 电磁目标识别方法计算过程
电磁目标识别方法主要包括三个步骤:特征提取、特征降维和分类识别,下面分别对这三个步骤的计算过程进行分析。
2.1 特征提取
在特征提取部分,对于电磁目标信号,提取其时域和频域统计特征,时域和频域统计特征参数的计算公式分别如表2和表3所示。
表2 时域统计特征
表3 频域统计特征
表2中的表示电磁目标时间序列信号,表3中的和分别表示经过傅里叶变换后的频率成分和频谱幅值。通过计算时域统计特征可以得到16个特征参数,通过计算频域统计特征可以得到12个特征参数,为了提高计算效率,采用特征降维方法保留主成分。
2.2 特征降维
经过特征提取后可得到16个时域统计特征和12个频域统计特征,采用主成分分析(Principal Component Analysis,PCA)方法对其进行特征降维。
对于个特征参数对应的个值,构造的特征矩阵为
(1)
将特征矩阵进行线性变换使其满足式(2)。
(2)
且有
(3)
式中var()表示方差,cor(,)表示主成分间的相关性。
通过PCA方法能够将特征参数变换成多个主成分,为了提高计算效率,这里选取前三个主成分进行计算和分析。
2.3 分类识别
对于8种电磁目标,每种电磁目标有600个样本,总共4800个样本,对每个样本提取16个时域统计特征和12个频域统计特征,然后经过PCA处理选取前三个主成分,最后得到4800×3维的特征空间,将其中的70%当作训练集用于训练,剩余的30%当作测试集验证识别的准确率。为了进行对比分析研究,选取SVM、KNN、Random forest和AdaBoost四种基于机器学习的分类识别算法进行识别,同时考虑在现场环境应用中的实际需求,还研究了在不同信噪比下的识别结果以及进行识别所需耗费的时间,在进行计算时所使用的计算机为Windows 10系统,CPU为英特尔i7-9700,内存为64 GB,程序代码用python语言编写,并基于Spyder编译器运行。
3 电磁目标识别结果
通过计算得到的电磁目标识别结果如表4所示。
表4 电磁目标识别结果
由表4可知,随着信噪比(18dB、16dB、14dB、12dB、10dB、8dB)降低,电磁目标识别的准确率也逐渐降低。在采用时域统计特征时,8dB信噪比下SVM、KNN、Random forest和AdaBoost算法识别的准确率分别为92.92%、93.75%、94.72%和94.86%;在采用频域统计特征时,其识别准确率分别为96.88%、97.29%、97.78%和98.06%;在同时采用时域和频域统计特征时,其识别准确率分别为89.86%、93.26%、93.75%和92.85%。当同时采用时域和频域统计特征时,电磁目标的识别准确率没有只采用频域统计特征时高,这可能是因为电磁目标对频域特征参数更加敏感,因此只需采用频域统计特征即可准确识别各电磁目标,此外通过比较平均耗费时间可知,Random forest算法虽然识别准确率略高于AdaBoost算法,但是其所需的时间比AdaBoost算法约长1.3s。为了快速准确识别电磁目标,研究结果表明基于AdaBoost算法采用频域统计特征能够准确快速识别出电磁目标,识别的平均准确率高达99.20%,所需时间为0.19s。
4 结束语
本项工作提出了重采样、改变幅值和信号叠加三种电磁目标数据库扩充方法,通过这三种方法能够有效扩充现有数据库。基于扩充的电磁目标数据库,提出了一种基于特征提取和机器学习的电磁目标识别方法,研究结果表明,基于频域统计特征采用AdaBoost算法能够准确识别出不同信噪比下的电磁目标,平均识别准确率高达99.20%,在8dB低信噪比下的识别准确率仍有98.06%,且平均耗时仅为0.19s。