APP下载

基于卷积神经网络的末敏弹复合探测信号识别方法

2022-06-09闫广利刘荣忠武军安

激光与红外 2022年4期
关键词:单通道特征提取卷积

闫广利,郭 锐,刘荣忠,武军安

(南京理工大学 智能弹药技术国防重点学科实验室,江苏 南京 210094)

1 引 言

末敏弹是一种重要的反装甲灵巧弹药,通过弹载探测器在作战区域上空旋转扫描搜集目标信息,一旦发现目标立刻起爆EFP战斗部,从而实现在特定区域内对目标的精准打击。为了提升识别准确度,末敏弹一般采用多模探测方案,即同时采用多种传感器进行扫描,以获取目标的多维度信息,例如美国的SADARM和德国的SMART均采用了主、被动毫米波/红外探测,法国的ACED末敏弹和俄罗斯的改进型9K55K1都采用了红外/毫米波复合探测,美国的BLU-108智能反坦克弹药携带的Skeet末敏子弹和法、瑞两国联合研制的BONUS末敏弹最初只采用的多波段红外敏感器,后来都加装了激光雷达实现复合探测。目前我国已经研制出采用3 mm主、被动毫米波/红外复合探测的末敏弹,为进一步提升末敏弹的作战效能,已经展开了毫米波/激光/红外三模复合探测末敏弹的研制工作[1-3]。

当前目标识别算法大体可以分为两类:基于人工特征提取的方法和基于深度学习的方法。传统的末敏弹目标识别算法属于前者,特征提取由人工完成,比较依赖设计人员的经验,且所得特征大多属于浅层次特征,其稳定性一般,易受外界干扰,而特征表示的优劣对算法的识别精度有着重要影响。

经典的末敏弹目标识别方法基于人工特征提取,其算法流程大致为:数据预处理,特征提取,特征分类。其中数据预处理阶段多采用滤波方法或小波理论进行信号降噪,特征提取阶段一般选择提取探测信号的峰值、脉宽、能量、最大斜率等构成特征向量,特征分类阶段一般基于BP神经网络、支持向量机、模糊集理论等设计分类器[3-5]。整个算法模型的构建采用分治策略,将目标识别问题分解为若干环节,并试图在每个环节获得局部最优解,但局部最优并不意味着全局最优,而且每个环节——特别是特征选择与提取,含有较多人为因素,会对最终算法的精度产生重要影响,导致算法的鲁棒性较低。

以卷积神经网络为代表的深度学习方法,能够通过“端到端”的学习,自动提取目标的深度稳定特征,已经在计算机视觉、自然语言处理等众多领域取得出色效果,当前,将深度学习方法应用于新领域已成为一股研究热潮。苏宁远等[6]将卷积神经网络应用于雷达海上目标识别,设计了一种双通道CNN对雷达信号预处理得到的时间-多普勒谱和幅度信息分别进行特征抽取,获得了较好的识别性能;张弘斌等[7]提出一种多通道输入的卷积神经网络来诊断轴承故障,通过设计一种三通道样本交给CNN融合处理得到诊断结果,其模型比基于单通道样本的模型诊断准确度高;郭迎福[8]等将CNN用于风力机叶片裂纹诊断,在双目摄影测量原理的基础上,提出一种三维振动信息融合的多通道样本构造方法,然后设计了一种新的多尺度卷积神经网络来获取裂纹多层次语义信息,该方法具有较高的诊断精度;叶壮[9]等利用经验模态分解对振动信号进行处理获得多通道一维信号,然后提出了一种基于多通道一维卷积神经网络的齿轮箱故障诊断方法,所提方法的故障诊断能力优于典型的深度学习方法和机器学习分类器。

目前末敏弹的目标识别多采用传统方法,在公开的文献中鲜有采用深度学习方法的案例,南京理工大学的武军安[10]等以线阵激光雷达作为末敏弹探测器,利用卷积神经网络对线阵激光雷达扫描获取的距离像进行目标分类与识别,所用方法识别精度较高,即使在复杂背景下也能有效识别装甲目标。但目前尚未有针对末敏弹点源、多模探测信号的深度学习识别算法研究,本文针对毫米波辐射计、激光测距雷达和红外敏感器三模探测信号,提出了3种样本构造方案和3种卷积神经网络结构,并通过实验测试了各个模型性能。

2 卷积神经网络

卷积神经网络(CNN)是受到生物学上的感受野概念启发而提出来的,最早主要用于处理图像信息,一般由卷积层、池化层和全连接层这样的基础层堆叠构成。

卷积层(Convolution Layer)的作用是特征提取,计算方式如下:

(1)

池化层(Pooling Layer)用于特征选择和降采样,一般采用最大池化(Max Pooling)方法,计算方式如下:

(2)

其中,pi,m表示一个池化区域的输出;Rm表示一个池化区域;qi,k是池化区域中的元素。

全连接层(Fully Connected Layer)的作用是整合上一层输出的所有特征表示,将其映射到样本标记空间,计算方式如下:

(3)

其中,δk表示当前层第k个神经元的输出;xi是上一层输出的第i个元素;wk,i是第k个神经元的第i个权重;bk是第k个神经元的偏置;f(x)是当前层的激活函数。

CNN在结构上具有权重共享、局部连接、汇聚等特性,这使其参数量较少,且具有一定的平移、缩放和旋转不变性。最初CNN主要应用于图像分析任务,其性能远超其他种类的神经网络,近年来也被广泛地应用于推荐系统和自然语言处理等领域。当前,利用卷积神经网络给各行业赋能已成为一个研究热点。

本文所提算法主要是利用卷积神经网络出色的拟合能力,获得从探测信号到识别结果的良好映射,同时,通过设计神经网络结构将多种不同传感器信号中蕴含的信息加以融合,以提升算法的识别能力。

3 基于CNN的末敏弹多模复合识别方法

考虑到数据对于深度学习模型的重要性,本文采用多种不同的样本构造方法,以求找到相对适合于CNN模型提取特征的样本类型。针对多种样本类型,本文提出了单通道和多通道两种类型的网络结构,以求找到性能相对较好的模型结构。

3.1 数据预处理

末敏弹是智能化弹药的一种,为了提高战场环境适应能力和精准打击能力,目前多采用复合探测识别手段,通过挂载多种不同类型的探测器,获取不同维度下的战场信息,例如采用毫米波、激光和红外复合探测,就可以同时获得目标的几何与温度信息,这样的复合探测信号能够提供更为全面的战场信息,进而能为目标识别算法提供更丰富的环境特征,有利于提高目标识别准确率、降低虚警率。

本文采用课题组积累的多模探测试验数据制作训练样本,其中含有毫米波辐射计、激光测距雷达和红外敏感器3种探测信号,均为点源探测器。由于探测器需要现场调试,试验现场环境较为复杂,部分探测信号存在不同程度的干扰,但这恰恰为神经网络模型提供了丰富的样本,有利于提升算法的鲁棒性,以适应复杂的现场情况。信号波形如图1所示,对于这3个时间序列,不同的样本构造方式,输入模型后所能提取的特征和信息融合的过程是存在差异的,对此本文提出了3种样本构造方案,以探究何种构造方案相对更有利于特征提取与分类。

图1 三种探测信号Fig.1 Three detection signals

方案1:直接以灰度值表示信号强度,将3种信号值分别映射到[0,255]灰度区间,然后并排构成一张3×n×1的灰度图(n为信号所含时间点的数量),如图2所示。

图2 并排形式的多信号样本Fig.2 Multiple signal samples side by side

方案2:同样直接以灰度值表示信号强度,将3种信号值分别映射到[0,255]灰度区间,然后将每种信号作为一个图像通道,构成一张1×n×3的RGB图,如图3所示。

图3 多信号RGB样本Fig.3 Multi-signal samples in RGB format

方案3:以波形图呈现信号,图像的纵向表示信号强度,横向表示时间,即取一段时间内的信号,将三种信号值映射到图像高度,再将这段信号降采样到图像宽度,然后将每种信号的波形图作为一个图像通道,构成一张H×W×3的RGB图像,如图4所示。

图4 波形RGB样本Fig.4 Waveform samples in RGB format

3.2 网络结构设计

针对上述复合信号样本的类型,考虑到不同层面的信息融合,本文设计了单通道和多通道两种基本的网络结构,将二者结合形成第三种网络结构,其中多通道网络是以单通道网络模块为分支搭建的。

结构1:单通道网络采用两个卷积层,两个池层化和两个全连接层,最后连接Softmax分类器,但根据样本的不同,采用不同类型的卷积核,整体结构如图5所示,如果输入数据是复合信号,则相当于在数据层进行了信息融合。

图5 单通道网络Fig.5 Single channel network

结构2:多通道网络是在输入层之后产生多个分支,每个分支连接一个单通道网络模块,对复合信号中的一种进行单独卷积,以提取出该种信号的独有特征,然后在全连接层以级联的方式完成特征融合,再经过一层全连接层,将融合特征输入Softmax分类器,如图6所示。

图6 三通道网络Fig.6 Three-channel network

结构3:从信息融合层次的角度看,单通道网络在输入层之后直接对原始复合信号施加了卷积操作,属于数据层融合,而多通道网络通过单独的卷积通道对每种信号分别提取独立特征,然后在全连接层组合所有特征,属于特征层融合。前者最终提取到的是复合信号特征,后者提取到的是单种信号的独立特征,将这两类特征组合起来,即同时在数据层和特征层进行信息融合,所得特征在理论上能更全面地描述输入信号,相应的网络结构如图7所示。

图7 四通道网络Fig.7 Four-channel network

4 实验结果与分析

4.1 实验样本

实验样本来自高塔试验数据,含毫米波辐射计、激光测距雷达和红外敏感器三种探测信号,如图1所示。根据信号波形,为了充分捕捉有目标的时段,采用长度为256的滑动时间窗口对信号进行截取,在此基础上,分别按照前文所提的3种样本构造方案制作数据集,图8展示了每种样本构造方案下的4对样本。

图8 实验样本Fig.8 Experimental samples

由于在末敏弹探测信号中,扫描到目标的时段相对较短,为了保证样本数量均衡,对滑动时间窗口采用变步长策略,在有目标区域采用小步长,在无目标区域采用大步长,以保证正负样本数量基本相等,最终获得各方案下的样本87128个,其中负样本(无目标)43580个,正样本(有目标)43548个,并按照3∶1的比例将数据集划分为训练集、测试集。

4.2 实验平台与网络参数

为了说明复合探测的优势,根据3.1小节的样本方案2和方案3,以单模毫米波辐射计信号构造样本作为对照组,采用相同的单通道网络结构进行训练。各类型的样本、网络结构与模型的对应关系如表1所示。

表1 样本与模型对应关系Tab.1 Correspondence between samples and models

本文针对末敏弹点源探测器的信号数据设计了3种不同类型的样本,又提出了3种基本网络结构,其中多通道模型是基于单通道网络模块构建的,即Model2系列和Model3系列各自采用相同的单通道网络模块,故在此仅列出其单通道网络模块的主要结构参数,如表2~4所示,其中Input Shape和Output Shape采用“Height×Width×Channel”的格式表示。

表2 Model 1主要结构参数Tab.2 Main structural parameters of Model 1

表3 Model 2系列单通道网络模块主要结构参数Tab.3 Main structural parameters of Model 2 series singlechannel network module

表4 Model 3系列单通道网络模块主要结构参数Tab.4 Main structural parameters of Model 3 series singlechannel network module

模型的训练平台为Win10,采用Caffe框架,GPU型号为NVIDIA GeForce GTX 1650,batch size为256,优化器为Adam,训练迭代次数为10000,学习率为0.0001。

4.3 评估指标

4.3.1 准确率(Accuracy)

准确率表示在所有测试样本中,预测正确的样本所占的比例,计算公式如下:

(4)

其中,I(·)表示指示函数,当x为真时,I(x)=1,x为假时I(x)=0。

4.3.2 召回率(Recall)

召回率表示实际属于c类的测试样本中,被预测为c的样本所占的比例,计算公式如下:

(5)

其中,TPc表示被预测为c类实际也确实属于c类的样本数量;FNc表示未被预测为c类实际属于c类的样本数量。

4.3.3 精确率(Precision)

精确率表示被预测为c类的样本中,确实为c类的样本所占的比例,计算公式如下:

(6)

其中,TPc表示被预测为c类实际也确实是c类的样本数量,FPc表示被预测为c类实际却不属于c类的样本数量。

4.3.4F1值(F1 Measure)

为综合考虑模型的精确率和召回率,可采用F1指标评价,F1值是召回率和精确率的调和平均值,计算公式如下:

(7)

其中,Pc表示模型对c类的精确率;Rc表示模型对c类的召回率。

由于末敏弹主要关注扫描区域是否存在目标,因此本文仅关注对“有目标”类别的F1值。

4.4 实验结果与分析

本文提出的各个模型,经训练后在测试集上所得各项指标如表5所示。

表5 各模型的最优性能对比Tab.5 Comparison of the best performance of each model

根据表5可以看出:

(1)采用相同的模型,多模信号相对于单模信号,能提供更丰富的探测信息,获得更好的识别效果;

(2)对于相同的样本,网络结构3表现最佳,即同时进行数据层融合与特征层融合的多通道网络结构,能更有效地提取目标特征,获得更好的识别效果;

(3)整体来看,样本方案1、2的优于样本方案3,这可能是由于后者将序列信号转换为二维波形图时丢失了大量信息,而CNN由于具备强大的拟合能力,能够从样本1、2这样的原始信息中有效提取特征;

(4)所有模型的准确率均在90%以上,从各项评估指标来看,model2_3的性能明显优于其他模型,表明所提方法具有较好的应用潜力。

4.5 对比实验

为了提高实验结论可信度,本小节基于同样的信号数据,对末敏弹经典识别方法进行测试。经典方法有赖于人工特征提取,本文选择末敏弹一维探测信号常用的特征——峰值、脉宽、脉冲高度、能量和最大斜率,将三种探测信号的特征依次排列构成特征向量,作为分类器的输入,而特征分类器选取常用的BP神经网络和支持向量机。其中BP神经网络的隐藏层神经元数设为5,支持向量机的核函数采用Linear核,测试结果如表6所示。

表6 经典模型与本文模型性能对比Tab.6 Performance comparison between the classic model and the model in this article

从表6可以看出,本文方法的识别准确率明显高于两种经典识别方法,体现了自动特征提取的优势。此外这种差异与模型输入的信息量也有关系,无论采用何种分类器,经典方法对原始信号进行特征提取的过程都是对数据的降维操作,损失了大量隐含信息,而本文基于卷积神经网络的方法,可以在保持较小计算量和参数量的同时,直接以原始信号作为输入,用卷积层自动提取特征,信息损失较少。

5 结 论

本文针对末敏弹探测识别问题,结合人工智能技术,引入卷积神经网络模型,提出了基于CNN的末敏弹多模复合识别方法,获得了较好的识别效果。实验表明,多模复合信号相比单模信号能提供更丰富的信息,获得更好的识别效果;对于复合信号,同时进行数据层和特征层融合能在一定程度上改善识别效果;基于原始信号的样本构造方案1、2优于方案3;总体上,本文所提方法能够充分自动提取复合探测信号中蕴含的目标信息,获得出色的识别效果,优于传统识别方法,可以为新型末敏弹的目标识别方案提供参考。

猜你喜欢

单通道特征提取卷积
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
从滤波器理解卷积
基于Daubechies(dbN)的飞行器音频特征提取
基于傅里叶域卷积表示的目标跟踪算法
模拟电视发射机数字化改造方法的探讨