基于1DC-CGAN和小波能量特征的引信小样本地形目标识别
2022-12-01李晓雄张淑宁赵惠昌陈思
李晓雄,张淑宁,赵惠昌,陈思
(南京理工大学 电子工程与光电技术学院,江苏 南京 210094)
0 引言
无载波超宽带引信是近年来发展起来的一种全新的无线电近炸引信,它具有距离分辨率高、抗截获能力强、电磁穿透性好等特点[1-2]。
近年来,有很多学者对无载波超宽带引信进行了研究。其中,文献[3]针对平坦地面建立无载波超宽带引信回波模型,通过仿真和实测波形比较,验证了建模的正确性。文献[4]设计一种超宽带与弹头共型微带天线,有效增加了天线带宽。文献[5]提出一种改进变步长最小均方(LMS)自适应滤波算法,提高了对无载波超宽带引信信号的滤波效果。然而,与无载波超宽带引信目标识别相关的研究非常稀少。
引信接收机接收到的回波信号中包含噪声和地面杂波,特别是在近炸引信工作过程中,地面杂波的影响尤为突出。不同地形条件下的地杂波功率谱分布不同,区分地形能更好地对杂波进行抑制,也能够减少杂波干扰导致的引信炸高散布[6-7]。此外,根据不同地形自适应确定引信最佳炸高也要求准确识别不同地形。
引信采集大量的地形回波信号需要耗费较大的人力物力,导致回波数据量不足,而样本量的不足会造成神经网络过拟合,降低识别准确率[8-9]。生成对抗网络(GAN)能够通过学习真实样本分布生成逼真样本,从而解决样本量不足问题。文献[10]针对新冠肺炎前期胸片数据量不足的问题,提出基于GAN和迁移学习的方法,显著提高了诊断准确率。文献[11]提出了一种改进条件生成对抗网络(CGAN)用于激光雷达数据分类。文献[12]通过GAN扩充了合成孔径雷达船舰数据,将识别准确率提高了4%以上。
本文针对无载波超宽带引信小样本地形识别问题,提出一种基于一维卷积CGAN(1DC-CGAN)和小波能量特征的识别框架,其中1DC-CGAN通过生成地形回波进行数据增强解决样本量不足的问题。1DC-CGAN引入了一维卷积和批标准化(BN)[13],提高了拟合真实信号分布的能力,减少了模式崩溃的发生,提高了生成信号质量。数据增强解决了样本量不足时分类模型无法得到充分训练的问题,提高了小样本条件下地形识别的准确率。
为验证算法的有效性,整个实验包括静态实验与动态实验。静态实验中的地形回波由静止的引信样机采集,针对每种地形采集了在不同视角观测的回波以验证小波能量特征对观测角变化的鲁棒性。动态实验中的地形回波为实际炮弹在飞向地面时由弹载数据采集器获得,由于炮弹型号和环境等因素影响,引信落角具有一定随机性。实验结果表明,相比原始训练集,在使用1DC-CGAN扩充的训练集上训练PSO-BP神经网络可以提高地形识别的准确率,提高幅度超过4%。
1 信号分析与预处理
1.1 无载波超宽带引信信号
超宽带信号的相对带宽μ大于25%,相对带宽定义如下:
μ=2(fH-fL)/(fH+fL)
(1)
无载波超宽带信号的基本波形为高斯脉冲:
(2)
式中:A为脉冲峰值幅度;σ为脉冲方差。由于路径损耗、天线增益和雷达散射截面的影响,传输信号的强度会衰减。此外,由于引信与散射中心的距离不同而导致的时间延迟也反映在接收信号中。因此,接收信号[14]可以表示为
(3)
式中:P为散射中心的数目;s(t)和n0(t)分别表示发射的高斯脉冲信号和传输路径噪声;am和τm为第m个散射点引起的幅度衰减和时延。
动态实验中,选取了平坦草地、中等湿度耕地、含碎石山地3种地形,其原始回波信号如图1所示。可以看出地形回波包含一定噪声且是多个不同脉冲相干叠加的结果,表明地形目标包含多个散射点,不同散射点回波的时间延迟和幅度衰减有所不同。
1.2 信号预处理
原始地形回波的采样点数和幅度范围并不一致,同时还含有较多噪声,不利于后续的识别处理。无载波超宽带信号是宽带信号,普通的低通滤波或者带通滤波的方法并不适用。本文选用集合经验模态分解(EEMD)来去除高频噪声[15]。
集合经验模态分解是由经验模态分解(EMD)[16]改进而来,相比后者EEMD可以减少模态混叠问题,二者的共同点都是把原始信号分解为一系列本征模态函数和余量。通过选取合适的分解层数和去除某些模态就可以达到自适应去噪的目的。
EEMD的算法流程如下:
步骤1将高斯白噪声ni(t)加入待分解信号xi(t)=x(t)+ni(t),i∈[1,N],代表第i次加入噪声,初始i=1,N为样本总数。
本文选用10层EEMD,即M=10,添加噪声方差为0.2,噪声添加次数N=70。以某一组草地回波为例,EEMD分解结果如图2所示(只画了前5个模态),可以看出高频噪声主要集中在第1个模态内,因此本文通过去除第一个模态,将剩余模态和余量相加实现EEMD去噪。
去除噪声后的不同回波仍然存在采样点数不同,幅值范围不同的问题,因此本文提出了一种滑动帧能量阈值截取的方法。取固定长度而位置可变的矩形窗,矩形窗从信号起始点滑动到信号结束点,计算每个窗内信号的能量:
(4)
接着对截取后的回波信号进行幅度归一化,使其取值在[0,1]之间,计算公式如下:
(5)
式中:fstd(t)为归一化信号;f(t)为截取后的信号;fmax(t)、fmin(t)分别为f(t)的最大值和最小值。
2 数据扩充
2.1 1DC-CGAN模型
当样本量较少时,训练的神经网络极易发生过拟合,从而导致在测试集上的识别率偏低。数据增强能有效缓解样本量不足带来的不利影响。GAN能通过学习真实样本分布生成足够逼真的生成样本,扩充训练集,从而有效提高分类器的鲁棒性[17-18]。
(6)
CGAN生成器和判别器的损失函数分别为
(7)
(8)
优化器迭代更新判别器和生成器参数使得损失函数取得最小值,此时生成器能够生成统计分布和真样本一致的假样本,判别器不能够区分真假样本,即判别真假样本的概率均为50%,此时CGAN达到“纳什均衡状态”。标签信息的引入方式一般是通过嵌入层(Embedding)将维数扩充后的标签信息融入生成器或判别器,相比于one-hot编码,Embedding编码后的向量不至于过于稀疏,可以引入更多的信息。
原始CGAN的网络结构一般是全连接层,由于采集的原始信号数据量少,但序列长度较长,所以全连接神经网络每一层的神经元数目较多,很容易出现过拟合和模式崩溃问题,即同一类别的生成样本高度相似,没有多样性。而一维卷积神经网络通过卷积运算极大地减少了网络参数数量,减轻计算量的同时,降低了过拟合发生的机率,同时它还能利用序列点间的位置信息,对与充分提取序列信号的特征是有益的[20]。
本文提出了1DC-CGAN,生成器和判别器模型结构如图3和图4所示。通过引入批量标准化调整神经网络输出范围,使其处于激活函数的活跃区间,从而减少梯度弥散,提升训练速度。生成器通过输入标签和噪声生成指定类别的假样本,它含有两个反卷积层,而每次反卷积都将信号维数扩大一倍,因此第一个反卷积层需要输入200维向量。输入标签经过嵌入层、全连接层后整型成单通道200维向量,高斯噪声向量通过全连接层、激活层后整型成64通道200维向量。拼接层将这两个向量按通道拼接,接着通过两个反卷积层和一个卷积层后得到生成样本,输出层激活函数为双曲正切。
判别器是将真假样本及其标签作为输入做出真假判别。标签信息经过嵌入层、全连接层后整型成单通道800维向量,与单通道800维时间信号合并为两个通道,接着通过两个卷积层和全连接层后得到判别结果,生成回波和原始回波对比如图5(a)~图5(c)所示,横轴为采样点,可以看出1DC-CGAN可以生成较为逼真的生成样本。
2.2 生成质量评估
设原始样本序列集为s={s1,s2,…,sN},生成样本序列集为={1,2,…,M}。相关系数矩阵Z的矩阵元素zmn为sm和n两个序列的互相关系数。固定一个阈值σ,对于矩阵Z的每一列,当最大值超过阈值时,将该最大值设置为1,同列其余元素设置为0。当全列元素均不超过阈值时,该列元素均设置为0,便得到一个维度为N×M的二值矩阵
(9)
式中:λ1、λ2为惩罚因子。
3 特征提取与分类
3.1 小波能量特征提取
离散小波变换降低了连续小波变换的计算复杂度,使小波变换的应用易于实现。离散小波变换的定义为
WX(j,k)=〈X(t),ψj,k(t)〉=
(10)
小波能量特征提取方法如下:
1)对s信号进行3层小波分解,小波基选为db3,分别得到低频小波系数c3和高频小波系数d3、d2、d1。
2)对小波分解系数重构,记s0(t)、s1(t)、s2(t)、s3(t)分别表示c3、d3、d2、d1的重构信号,则信号s(t)可表示为s(t)=s0(t)+s1(t)+s2(t)+s3(t)。
3)求各频带信号的总能量,设sj(t)对应的能量为Ej(j=0,1,2,3),其中Ej可以表示为
(11)
4)以能量为元素,构造特征向量X=(E0,E1,E2,E3),即为小波能量特征[22]。
提取动态实验中预处理回波信号的小波能量特征,并选取后3个特征(E1,E2,E3)可视化,结果如图7所示,可见3种地形的小波能量特征可分性较好。
3.2 PSO-BP神经网络
粒子群优化(PSO)算法的BP(PSO-BP)神经网络是BP神经网络的改进算法[23],利用PSO算法良好的全局搜寻能力,对BP神经网络的权值和阈值进行了优化,弥补了BP神经网络收敛速度慢,存在多个局部极值点的缺陷。PSO算法的主要思想是:粒子在空间中根据自身的经验和它临近个体的经验不断调整位置,从而找到最优解。
PSO-BP神经网络算法的具体步骤如下:
步骤1BP神经网络和PSO算法初始化。
步骤2确定适应度函数,粒子位置为网络权值和阈值。
步骤3根据适应度确定粒子和种群最优位置。
步骤4更新粒子的位置和速度、惯性权重及学习因子。
步骤5PSO算法找到最优解则用其初始化神经网络,训练网络收敛,否则返回步骤3。
PSO-BP的参数设置如下:种群规模30,迭代次数100,学习率0.001,速度范围-2~2,位置范围-5~5,学习因子c1=c2=2,训练测试样本比7∶3,目标误差0.001。BP神经网络输入层、隐含层、输出层神经元的数目分别为4、6、3。
4 实验
4.1 实验场景
整个实验分为静态实验与动态实验。在静态实验中,引信样机通过超宽带天线发射无载波超宽带信号,回波信号通过高速示波器采集存储。在实验过程中采集了30°、45°、60° 3种不同的入射角的回波,每种入射角下观测获得的回波数量大致相等。地形种类分别为平坦草地、低矮灌木、光滑瓷砖和粗糙大理石地板。静态实验场景如图8所示。
在动态实验中,弹目交会速度范围98~238 m/s,炮弹飞向不同类型地面的过程中,由弹载数据采集器采集回波数据。不同口径、不同型号的炮弹飞向地面时落角会有所不同,而同型号炮弹的落角有小幅度变化,因此动态实验中的炮弹落角有一定随机性。由于实验场地的限制,动态实验采集了三类地形,分别为干燥耕地、平坦草地、含碎石山地,样本的采集数量分别为36、54和18。
无载波超宽带引信信号频率范围为1~3 GHz,瞬时带宽不小于1 GHz。在动态实验和静态实验中获取的回波信号情况如表1所示。
表1 不同类型地面的回波数据
4.2 静态实验结果分析
本节分析在静态场景下的实验结果,重点分析小波能量特征对不同落角的敏感性、小波能量特征相比其他特征的有效性以及PSO-BP神经网络的优越性。
4种地形回波在经过预处理后,分别计算其小波能量特征、时域特征、双谱对角切片特征。其中时域特征是指均值、方差、波形因子、峰值因子、峭度、偏度、平均附加延迟、均方根时延扩展、能量、裕度等10个时域特征[24],PCA降维成6个特征用于识别。双谱对角切片特征是计算信号的双谱对角切片后,分段取平均值的结果[25]。
分类器方面选取了PSO-BP神经网络、BP神经网络、支持向量机(SVM)3种。静态实验下的识别结果如表2所示。由表2可以看出,通过小波能量特征和PSO-BP神经网络的方法可以对不同地形实现较好的分类。
表2 不同方法对比
4种地形在3种落角下的小波能量特征如图9所示。由图9可以看出,由于瓷砖表面较为光滑,接收到的回波信号主要是镜面反射,特征点较为聚集,而低矮灌木在不同入射角下的散射点分布会有所不同,因此小波能量特征也呈现分散的特点。但是总体来看,不同地形的小波能量特征对入射角变化存在一定的鲁棒性。
4.3 动态实验结果分析
本节分析在动态场景下的实验结果,重点分析本文提出的1DC-CGAN相比其他数据扩充方法的优越性,以及使用1DC-CGAN扩充训练集对于提升PSO-BP神经网络识别性能的有益影响。
对动态实验中的3种地形回波训练集采用多种方法进行数据扩充。数据扩充的方式为每种地形生成相同数量的回波信号后,添加到原地形回波训练集中。每种地形扩充数量为200时,3种生成式生成样本的质量对比如表3所示,扩充后样本的小波能量特征如图10(a)~图10(c)所示,可以看出本文提出的1DC-CGAN生成回波信号的质量较高。
表3 生成回波信号质量对比
由图10可以看出,CGAN生成的回波信号在小波能量特征图上出现了特征点聚集,山地和耕地的回波信号有大量的特征点重叠在一起,这是因为出现了模式崩溃问题,生成的信号高度相似。而且生成地形回波的特征数值相比原始信号差别较大,尤其是E3的数量级扩大了10倍以上。采用随机裁切和添加高斯噪声同样存在特征点重合和多样性不足问题。而使用1DC-CGAN生成的回波的特征点分散在原始回波特征点周围,不但生成回波质量较高,还有效增加了回波的多样性,因此采用1DC-CGAN生成回波可以有效实现数据增强。
将预处理后的原始地形回波按照7∶3的比例划分为训练集和测试集,用在训练集上训练好的1DC-CGAN生成不同数量的回波信号扩充原训练集,然后在扩充训练集上训练PSO-BP神经网络对测试集分类。表4列出了每类地形不同样本扩充数量对PSO-BP神经网络识别率的影响。
由表4可以看出,数据扩充减轻了神经网络的过拟合,提高了PSO-BP神经网络的识别率,在每类地形扩充样本为300时,相比不进行数据扩充,分类准确率提高了4%以上。
表4 数据扩充对分类器的影响
5 结论
本文首次将无载波超宽带引信用于地形识别。针对小样本地形回波数据,本文提出先通过1DC-CGAN进行数据扩充,再训练PSO-BP神经网络对回波信号的小波能量特征进行识别。得到主要结论如下:
1)由于卷积相比全连接的优越性,改进的CGAN生成对抗网络减少了模式崩溃问题的发生,提高了生成信号质量。
2)神经网络在扩充训练集上训练后,减轻了过拟合现象,在测试集上得到更好的识别效果。这种通过GAN扩充数据的方式,减轻了数据获取需要的高昂人力物力,提高了分类器的识别准确率。