基于深度学习的雷达性能指标等效外推方法
2021-11-30张静克戚宗锋王华兵曾勇虎汪连栋
张静克,戚宗锋,王华兵,曾勇虎,汪连栋,王 伟
(1.电子信息系统复杂电磁环境效应国家重点实验室,河南洛阳471000;2.中山大学电子与通信工程学院,广东 深圳518000)
0 引言
随着现代战争日趋信息化、网络化、智能化,拥有制信息权就意味着最可能获取战争的胜利。雷达作为战场侦察的一个关键节点,在战场信息获取中的作用日益突出。相应的,针对雷达的各种电子战技术和设备层出不穷,导致雷达在遂行任务时面临的电磁环境日趋复杂,因此对复杂电磁环境下特别是对抗环境下的雷达性能进行分析评估具有重要的军事意义和价值[1]。雷达性能评估试验是通过合理地设计试验方案,构建相应的试验环境,开展试验并利用各种测量设备和录取设备获取必要的数据,然后对所得的数据进行处理和分析,进而对被试雷达系统的性能做出评价,为其设计定型、生产及使用提供决策依据[2-3]。由于复杂电磁环境下雷达性能评估试验具有样本空间大、试验成本高等特点,无论是内场仿真试验还是外场实装实验,均只能开展部分电磁环境下性能评估试验,获取的试验数据具有不完备性,难以反映系统的全面性能,因此需要对试验数据进行处理分析,建立雷达性能指标等效外推模型,实现未试验条件下试验结果的预测。
雷达性能评估试验中,雷达性能指标多为连续变量,建立指标等效外推模型为数据挖掘中的回归问题,机器学习中的线性/非线性回归、支持向量机等一系列有监督学习方法[4-7]均可用于解决此类问题。然而由于雷达性能评估试验数据具有定性和定量因子混合、响应与因子间映射关系复杂且非线性等特点,常用的线性或多项式回归分析通常存在模型失配、外推准确率较低的问题。实际上,在雷达性能评估试验中,通常可根据雷达装备的实际使用情况以及战术用途将雷达性能指标划分为不同的等级或类别,来反映雷达在复杂电磁环境下的适应性,此时雷达性能指标等效外推可建模为分类问题,利用机器学习中的分类方法可实现指标等效外推。近年来,随着深度学习的迅速发展,各种深度学习模型如深度置信网络、深度卷积神经网络、深度递归神经网络以及深度森林等层出不穷,因其强大的特征自动提取和抽象能力、复杂映射关系学习能力等,在图像分类、目标检测、文本分类、语音识别等领域得到了广泛的应用[8-16],取得了经典机器学习无法比拟的效果。本文将深度学习应用于雷达性能指标等效外推,主要研究基于深度置信网络和深度森林的雷达指标等效外推方法,并通过仿真试验对比了基于深度学习和经典机器学习的指标等效外推性能。
1 雷达性能指标等效外推问题
以对抗环境下的雷达性能评估试验为例,试验因子由雷达系统参数和干扰机参数组成,试验响应为待测的雷达性能指标。雷达系统参数通常包括发射功率、极化方式、抗干扰措施以及数据处理中的可调参数等;干扰机参数包括干扰发射功率、干扰样式(噪声调频干扰、多假目标干扰等)以及干扰样式相关参数(调频斜率、调制噪声标准差和调制噪声带宽等,多假目标干扰的假目标个数、位置及速度等),显然试验因子中定量因子和定性因子是混合存在的;雷达性能指标包括目标截获时间、最大跟踪时长、距离(角度)测量精度以及跟踪目标消耗的资源率等,其测量值多为连续变量。
在雷达性能指标等效外推问题中,输入数据为试验因子,输出数据为试验响应也即雷达性能指标。由于将雷达性能指标等效外推建模为分类问题,需要先对试验数据进行预处理,主要包括试验因子归一化和试验响应类别划分。试验因子归一化包括定性因子定量化和定量因子归一化。对于定性因子如抗干扰措施,根据其是否使用可定量化为0和1,其中0表示未使用,反之为1;对于定量因子,由于因子取值相差范围较大,在指标等效外推之前,需要将其因子的取值统一到某一较小的范围,通常为[-1,1]或[0,1],归一化方法有最小-最大归一化、z分数归一化等。试验响应类别划分可根据装备的实际使用情况以及战术用途将雷达性能指标划分为不同的类别,反映雷达性能在干扰下的表现程度或雷达性能对干扰环境的适应性,这里类别数及含义可根据实际需求定义,但是最少应包含2种类别。
经过试验数据预处理后,雷达性能指标等效外推问题可进一步描述为:已有N组雷达性能评估试验数据{(X1,y1),(X2,y1),…,(XN,yN)},其中Xi=(xi1,xi2,…,xik)为输入数据,yi为输出数据,雷达性能指标等效外推是利用分类方法学习X→y的映射函数即等效外推模型。当一组新的试验因子组合XN+1作为输入时,使用等效外推模型可对输出yN+1进行预测。
2 基于深度学习的雷达性能等效外推方法研究
2.1 基于深度置信网络的雷达性能等效外推方法
深度置信网络(DBN)是Hinton提出的一种包括多个隐藏层的深度学习模型[8],由多个受限玻尔兹曼基(RBM)堆叠组成。DBN利用RBM将原始数据从一种特征空间转换到另一种新的特征空间,通过无监督自学习的方式进行特征提取,增加了神经网络对数据特征的提取能力和网络学习的抽象化,从而提高网络的分类精度。
RBM由可见层V和隐藏层H组成。可见层表示输入数据的特征,隐藏层一般也叫做数据特征提取层,用来获得相互连接的神经元之间的依赖关系。当RBM接收到输入数据时,首先将数据特征从可见层V映射到隐藏层H,然后隐藏层输出再重构到可见层V,并计算原始输入数据和重构数据之间的误差,根据二者误差调整更新可见层和隐含层之间的参数使得误差值最小,此时认为隐含层的输出可很好地代表原始输入数据,达到特征提取的目的。RBM的训练通常采用对比散度方法实现,其具体求解和详细步骤[8]这里不再赘述。
基于深度置信网络的雷达性能指标等效外推模型的网络结构如图1所示,为一个全连接定向的多层神经网络,包括一个输入层h0,M个隐藏层h1,h2,…,h M和多类别输出层,其中输入层和M个隐藏层构成M个RBM。输入层h0有k单元,对应于输入数据X中特征个数。输出层Y=[y1,y2,…,y C],等同于输出数据中的类别数,其中W={w1,w2,…,w M+1}是深层架构中需要学习的参数。隐藏层的个数和每个隐藏层中的结点数可根据经验或采用特定策略设置。构建等效外推模型,也即将寻找映射函数X→Y的问题转换为利用深层架构寻找参数空间θ的问题。
图1 基于深度置信网络的指标等效外推方法网络结构示意图
由于雷达性能指标等效外推为多分类问题,因此可采用softmax()作为输出层的激活函数,则最后一层各单元的输出可表示为:
式中,y i c和分别为第i组训练数据的输出向量的第c个元素的真实值和预测值。
基于DBN的雷达性能指标等效外推模型的训练可分为无监督逐层预训练和有监督反馈微调2个步骤:1)无监督逐层预训练。该阶段的训练数据为无标签数据,采用逐层贪婪算法,利用输入数据训练依次训练各个RBM,计算每个RBM的参数。2)有监督反馈微调。将经过堆叠RBM处理的数据作为输出层的输入,利用后向传播算法基于公式(2)所示代价函数对深层架构进行训练,获取整个网络的参数空间θ。
当整个网络训练完成后,输入一个新的数据X N,可以根据深度置信网络的输出来判断新输入数据的所属类别,进而完成雷达性能指标的等效外推。
2.2 基于深度森林的雷达性能等效外推方法
深度森林[13]是周志华教授于2017年提出的一种新型基于多粒度扫描与级联森林结构的深度学习模型。考虑到多粒度扫描是为了提取原始输入数据的多粒度邻域特征,而本文处理的雷达性能指标等效外推问题中的输入数据也即试验因子的顺序是随机的,不存在邻域特征,因此只采用其中的级联森林结构。
深度森林的每一层都是由多个不同类型的随机森林组成的,每个森林中包含多颗决策树,也就是说深度森林的每层都是“集成的集成”,基于深度森林的雷达性能指标等效外推结构示意图如图2所示。采用了深度网络的一层叠一层的结构,其输入为试验因子,级联森林每一层的输出与原始输入合并作为下一层的输入,对最后一层的输出取平均后再取其最大值即可得到等效外推结果。级联森林的每一层包括2个普通随机森林和2个完全随机森林。每个普通随机森林由多颗(一般选择为500或者1 000颗)决策树组成,通过随机选取sqrt(k)(k表示输入特征维度)个候选特征,然后选择具有最佳gini值的特征分裂节点,直到每个叶节点只有1个类别或者少于规定的最少样本数。同样的,每个完全随机森林是由多颗完全随机决策树组成,每颗决策树会随机选择一个特征作为分裂树的分裂节点。对于每个森林而言,每个样本在森林中的每棵树中都会按照一定的路径去找到自身所对应的叶节点,但是在这个叶节点中的数据很有可能包含其他类别的,通过对该节点不同类别进行统计从而获得各自所占的比例,然后对所有树的比例进行求均值,生成的概率分布作为该森林对该样本的预测。对于图2所示三分类问题,每层的输出的维度为3×4=12,下一层的输入的维度为12+k。
图2 基于深度森林的指标等效外推方法网络结构示意图
为了避免过拟合现象,每一层中每个森林的训练都采用K折交叉验证,也即将训练子集分为K个大小相同的互斥子集,每次使用其中K-1个子集作为训练集进行训练得到分类模型,然后利用该模型预测得到剩下子集对应的输出,重复K次得到所有训练集对应的输出,这也意味着每一层中每个森林实际上对应着K个训练模型,因此当训练完成后,利用模型进行等效外推时,每层中每个森林的输出其实是K个模型的均值。在完成一层结构的添加和训练后,会将该层所有训练子集的输出与其真实类别进行对比,来评估其性能是否有明显的性能增益,如果没有则训练过程将结束。因此,深度森林能够通过适当的终止来自动决定层数,也即决定其模型的复杂度,这就使得相对于深度神经网络,深度森林在面对小数据集的情况下具有一定的优势。
3 试验与分析
3.1 试验数据集的构建
为了验证本文方法的有效性,利用自研的雷达对抗仿真平台开展仿真试验并生成仿真数据,根据雷达对抗仿真平台输出的雷达探测报表进行分析计算可以获取雷达性能指标数据,比如目标截获时间、最大跟踪时长、距离测量精度等。仿真场景中设置1部X波段搜索雷达和1部噪声调频干扰机,其系统参数取值如表1所示。利用试验设计方法生成500组试验方案,运行该软件获取生成500组试验的雷达探测报表,然后根据各雷达性能指标计算方法获取500组试验数据的响应结果。
为了利用基于深度学习的雷达性能等效外推方法构建外推模型,首先需要对试验数据进行预处理,主要包括定量试验因子归一化、定性试验因子数值化以及试验响应标签化。定量试验因子(如表1中CFAR单边参考单元数目、干信比)归一化采用最小-最大归一化将参数归一化到[0,1]。定性试验因子(如表1中的抗干扰措施:频率捷变、烧穿、前沿跟踪)数值化为0和1,其中0表示未使用,反之为1。对于试验响应标签化,将对应的试验响应划分为三个类别,分别用0、1和2表示。其中0表示雷达在该干扰条件下下降严重,无法根据雷达试验数据获取指标的有效值;1表示雷达性能不受在该干扰条件的影响;2表示雷达在该干扰条件下性能有一定的程度的下降,但是依然可以根据雷达试验数据获取指标的有效值。
表1 雷达和干扰机系统参数
3.2 试验参数设定
对于基于深度置信网络的试验数据预测方法,设定一个四层网络,其前三层组成2个为RBM,最后一层为输出层。其中第一层网络的规模为(9,18),输入层为9是由于试验参数的维数为9,第二层网络的规模为(18,9),第三层网络的规模为(9,3)。网络的训练速率设为0.05,迭代次数1 000,训练中一次迭代的数据批次为50。有监督训练采用随机梯度下降法。
对于基于深度森林的试验数据预测方法,设定深度森林最多10层,每一层网络由2个随机森林和完全随机森林组成,每个随机森林的最大深度为5,每个森林中包含500棵树。每个森林在训练时采用5折交叉验证。
3.3 试验结果分析
为了验证本文提出的基于深度学习的雷达性能指标等效外推方法性能,首先采用随机抽取-训练-测试的试验流程。在每次试验过程中,从500组试验数据集中随机抽取50组数据作为测试集,剩下450组的作为训练集,利用训练集按照深度学习的训练步骤分别对每个性能参数进行训练,然后基于训练好的等效外推模型对测试集进行外推,并统计其外推正确率。重复上述操作10次,以其平均外推正确率来评价外推方法的性能。同时还选取了经典机器学习中logistic回归、支持向量机(SVM)以及随机森林3种方法进行对比。以目标截获时间和距离测量精度为例,各方法每组外推准确率与平均外推准确率如图3所示。对于目标截获时间,logistic回归、SVM、随机森林、深度森林和深度置信网络这5种方法的平均外推准确率为83.6%、87.7%、86.8%、88.0%、89.2%;对于相对距离精度,平均外推准确率依次为75.2%、77.6%、79.8%、81.0%、83.6%,即基于深度置信网络的雷达对抗试验数据外推精度最高,深度森林次之。
图3 各雷达性能指标等效外推模型准确率
为了进一步说明各方法的外推性能,表2以目标截获时间为例,展示了不同训练样本量下各种方法等效外推的平均准确率,其中每种训练样本量下外推准确率最高的结果用加粗标出。由表2可以看出,当训练样本量较少时(≤30%),深度森林的外推准确率最高,随机森林的外推准确率次之;当样本量较多时(>30%),深度置信网络的外推准确率最高,而SVM和深度森林的外推准确率次之。这表明了对于雷达性能指标等效外推而言,深度森林在小样本数据上具有更好的优越性,而深度置信网络在大样本情况下性能更优。此外,由表2还可看出,随着训练样本量的不断增多,基于深度置信网络的等效外推准确率提高幅度最大,而基于深度森林的等效外推方法在不同训练样本量情况下均可保持较高的外推准确率。这是由于深度置信网络包含特征提取结构,当训练集增大时能够提取到更强更丰富的特征,因此能够不断地提升识别准确率;而深度森林有机结合了随机森林的小样本识别能力和分层设计所提供的特征提取能力,使其对不同训练样本量具有较好的适应性。
表2 不同训练样本量下各种方法的外推性能
4 结束语
本文将雷达性能指标等效外推建模为分类问题,提出了基于深度置信网络的雷达性能指标等效外推方法和基于深度森林的雷达性能指标等效外推方法,并通过仿真试验对比了基于深度学习等效外推方法与基于经典机器学习(Logistic回归、SVM、随机森林)的等效外推方法的性能。深度置信网络通过堆叠多层RBM获取强大的特征提取能力,使其在大样本情况下具备高于经典机器学习的外推准确率;深度森林通过有机结合集成学习的小样本识别能力和分层设计所提供的特征提取能力,能够在小样本情形下依然保持较高的外推准确率。