结合卷积神经网络和随机森林的辐射源个体识别 *
2021-07-02侯思尧李永光黄黔川
侯思尧 ,李 伟,李永光,凌 杰,黄黔川
(电子信息控制重点实验室,成都 610036)
0 引 言
辐射源信号个体识别首先利用表征个体指纹特征的属性,如包络上升沿、下降沿、顶部起伏等,通过傅里叶变换等手段完成指纹特征的提取,再采用相应的个体识别方法实现对同类辐射源的不同个体的识别。
目前利用机器学习的个体识别方法方面主要包括深度学习和集成学习两类,均需要根据个体样本开展识别模型训练,然后根据训练后的模型完成未知个体的识别。其中,深度学习方法首先提取辐射源个体特征,然后构建多层网络,将提取的特征作为输入开展个体识别训练,训练期间利用多层网络组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,提升识别准确率。典型深度学习方法包括卷积神经网络[1-4]、深度置信网络[5]等,通过二维分布图或多维的描述作为输入,通常由于网络层级较大,导致计算量大,不利于工程应用。
集成学习首先组成一组个体学习器,再用某种策略将它们结合在一起,使其具有较好的分类效果和泛化性能,典型方法有随机森林[6]、Adaboost[7]、GBDT[8]等。随机森林具有高维特征处理、数据适应性强和较好的抗噪能力,但在噪声较大的分类或回归问题上容易出现过拟合;Adaboost方法在数据不平衡的情况下容易导致分类精度下降,训练耗时长且易受噪声干扰;GBDT方法的多个弱学习器之间存在依赖关系,难以并行训练数据。
本文采用优势互补的方式,将卷积神经网络和随机森林方法进行综合,同时,从工程化应用角度考虑,减少卷积神经网络层数,最终形成针对不同辐射源的综合识别模型。通过仿真验证,本文提出的识别方法具有运算时间短、识别概率高的特点。
1 结合卷积神经网络和随机森林的辐射源个体识别
本文提出的辐射源个体识别流程如图1所示。
图1 辐射源个体识别流程
Step1 将所有辐射源信号进行预处理并建立标签,生成数据集M,随机抽取其中的80%作为训练集T,剩余的20%作为测试集C,其中,抽取的辐射源信号满足数据标签均匀分布,对于数据量少的个体通过同标签数据随机填补,以保证不同个体的训练样本数量基本一致。
Step2 依次提取训练集T中各辐射源信号的指纹特征,生成辐射源特征矩阵A,用于下一步的训练与实际分类处理。
Step3 构建基于卷积神经网络的深度学习模型,考虑工程化应用,采用3个卷积层、3个池化层、3个激活层以及输入层和输出层。将Step 2生成的辐射源特征矩阵作为输入进行训练,生成个体识别模型。
Step4 构建基于随机森林的集成学习模型,将Step 2生成的辐射源特征矩阵作为输入进行训练,生成个体识别模型。
Step5 将Step 2中的辐射源特征矩阵作为输入,分别利用Step 3、Step 4的个体识别模型进行个体识别,并基于两种模型的识别结果,采用识别概率统计的方法生成不同辐射源个体的综合权重向量,即卷积神经网络和随机森林的权重值,最后根据综合权重向量形成针对不同辐射源个体的综合识别模型。
为了适应实际应用中电磁环境的变化,将新获取的数据Madd添加到辐射源信号数据集M中形成新的数据集Mnew,定期执行Step 1~5,对训练模型进行更新。
Step6 依次提取测试集中各辐射源信号的指纹特征,生成辐射源特征矩阵,利用Step 5生成的综合识别模型进行个体识别验证。
2 综合权值的确定
2.1 利用卷积神经网络生成个体识别模型
构建卷积神经网络,训练基于深度学习的个体识别模型。卷积层的卷积核为一维向量,激活层为ReLU函数,输出层由一层全连接网络和Softmax分类器组成。其中,卷积层1的卷积核为1×25,步长为2,卷积核个数为70;卷积层2的卷积核为1×16,步长为2,卷积核个数为140;卷积层3的卷积核为1×8,步长为2,卷积核个数为280。池化层1、2、3均采用最大池化,池化大小为1×4,步长为2,如图2所示。将特征矩阵A作为输入,生成基于卷积神经网络的辐射源个体识别模型Mdpl。
图2 卷积神经网络结构
2.2 利用随机森林网络生成个体识别模型
构建随机森林网络,训练基于集成学习的个体识别模型。通过K个决策树和信息增益构建随机森林网络,其中K为辐射源个体数的20倍,用于分割节点的特征子集合个数为特征集合个数的均方根。将特征矩阵A作为输入,生成基于随机森林网络的辐射源个体识别模型Meml。
2.3 辐射源个体综合权重向量计算
将特征矩阵A作为输入,分别利用识别模型Mdpl和Meml进行个体识别,并基于识别结果的概率统计确定个体识别模型Mdpl的权重向量wdpl以及个体识别模型Meml的权重向量weml,并保存模型参数。权重向量算法如下:
根据给定的阈值Ftrust以及辐射源个体集合D={a1,a2,a3,…,az},得到识别结果为辐射源个体am的准确率Fam为
(1)
式中:Sam是训练集中辐射源个体am的信号数量;fam表示某一信号识别为am的概率值;Bool(fam≥Ftrust)表示当fam≥Ftrust时值为1,否则值为0。
通过上述方式可得到长度为z的综合权重向量wdpl和weml。
2.4 综合识别模型的确定
根据两个识别模型及其对应的权重向量生成不同个体的综合识别模型,利用综合识别模型计算某一信号识别为个体am的综合概率如下:
(2)
3 应用分析
本文在仿真环境下利用某型号雷达9个不同个体实际数据进行仿真验证,数据集中每个个体的脉冲数为7 000~12 000,其中80%作为训练使用,剩余20%作为测试使用,如表1所示。置信度阈值Ftrust=0.6,训练用计算机的CPU为Intel Xeon Silver 4110,内存32 GB,显存16 GB。
表1 辐射源脉冲数统计表
利用卷积神经网络算法的识别结果如图3所示,利用随机森林算法的识别结果如图4所示,利用本文所述算法的识别结果如图5所示。
图3 卷积神经网络算法得到的识别结果
图4 随机森林算法得到的识别结果
图5 结合卷积神经网络与随机森林算法得到的识别结果
通过图3~5的对比分析可知,本文所提方法的平均识别准确率为94.6%,卷积神经网络算法平均识别准确率为88.4%,随机森林算法平均识别准确率为90.6%,因此本文方法能够提升整体识别准确率。针对单一算法识别准确率较低的个体,如卷积神经网络对辐射源个体A44识别准确率为38%,随机森林对辐射源个体A46识别准确率为49%,而本文所提方法对辐射源个体A44识别准确率为92%,对辐射源个体A46识别准确率为98%,识别正确率均高于单一算法,因此本文所提算法对于不同辐射源个体均有较好的适用性。
4 结束语
本文提出的辐射源个体识别算法选取了深度学习中的典型算法——卷积神经网络和集成学习中的典型算法随机森林,目的在于提供一种思路,即如何将深度学习算法与集成学习算法相结合,通过减少深度学习网络层数,达到减少运算时间的目的,从而提升工程化应用能力。应用分析结果显示,本文所提方法具有良好的识别结果。
此外,应用分析中用到的雷达数据不含多径效应以及噪声干扰等情况,因此在工程应用中,所述方法缺少对数据的预处理环节,这也是本文的不足之处,后续应该进一步探索在复杂电磁环境下的辐射源个体识别问题,以满足实际需求。