APP下载

通信辐射源个体识别的自编码器构造方法*

2018-12-19黄健航雷迎科

火力与指挥控制 2018年11期
关键词:辐射源编码器维度

黄健航,雷迎科

(国防科技大学电子对抗学院,合肥 230037)

0 引言

通信辐射源个体识别技术是近年通信对抗领域的一个研究热点。辐射源特征又称为指纹特征,是由电台内部零件差异产生的个体特征。通信信号的技术参数差异小而导致的通信辐射源特征细微,使其难以直接从截获信号中提取[1],因此,快速准确地从辐射源信号中提取辐射源个体特征,成为研究通信辐射源个体识别技术的首要攻关课题。

自编码器算法是一种基于已有数据样本提取深层细微信息的新型数据处理方法。当前对自编码器的研究与应用多用于提取语音特征[2-4]和对海量的图像进行识别[5-7],它对输入样本内部的细微特征敏感,可以通过迭代计算,提取输入样本中能够反映样本特性的细微特征,此类细微特征往往具有较低的维度,将其用于通信辐射源识别可以快速、有效地完成识别分类任务,比起传统通信辐射源识别方法[8-10],省去了人工设计特征的复杂过程,提高了识别方法的鲁棒性。在实际电磁环境下存在着大量无标签的通信辐射源信号,由于自编码器可以提取这些数据的鲁棒特征,且泛化能力较强,因此,在提取通信辐射源信号个体细微特征上有着良好的应用前景。

针对自编码器结构难以确定导致通信辐射源个体识别性能不佳的问题,本文提出了一种通信辐射源个体识别的自编码器构造方法,一定程度上解决自编码器在通信辐射源个体识别应用上的困难。

1 自编码器模型

自编码器是一种以重构输入数据为目标的三层神经网络,由一对编码器和解码器组成,其结构如图1所示。模型输入层的神经元由原始信号构成,中间层称为隐含层,输入层和隐含层中的“+1”为偏置单元,输出层与输入层的神经元数目相同。

图1 自编码器基本结构

令矩阵W(1)表示连接自编码器输入层和隐含层的权重,令矢量b(1)表示输入层的偏置单元,则隐含层神经元的激活值可按如下方式计算:

其中,f(·)为一非线性激励函数。同理,输出层的激活值为:

其中,W(2)为连接隐含层和输出层的权重矩阵,为隐含层的偏置单元。将自编码器定义的非线性映射记为 hWb(·),则

若用范数度量重构误差,则自编码器的代价函数表示为:

显然,隐含层包含可重构输入信号的重要信息,当隐含层神经元数目少于输入层神经元数目时,编码过程相当于对输入数据的降维。在构造深度神经网络的过程中,通常只保留自编码器的编码器部分,之后以隐含层为输入继续训练下一个自编码器,通过不断堆叠自编码器可得到一个堆栈自编码网络。堆栈自编码网络的训练可借助反向传播(Back Propagation,BP)算法实现。为避免过拟合,实际训练过程通常会在式(4)中加入适当的正则项,如权重衰减项等,按照式(5)表示:

其中,J(W,b)的第1项是均方差项,第2项是正则化项(即权重衰减项),λ是权重衰减参数。此外,m为样本数目,下标i表示第i个样本,l表示第l隐含层,j表示当前层第j个单元,W,b为自编码器的参数,W为网络中每个神经元的权重系数,b为每层偏置单元系数。

自编码器的学习过程分为预训练和微调两步。首先通过随机梯度下降算法将模型参数初始化,然后根据BP算法对每个神经元的参数值进行微调。自编码器的学习过程如以下步骤所示,其中ΔW(l)是一个与矩阵 W(l)维度相同的矩阵,Δb(l)是一个与 b(l)维度相同的向量:

步骤1:对所有 l,令 ΔW(l)=0,Δb(l)=0。

步骤3:对 l=nl-1,nl-2,nl-3,…,2 的各层,计算:

步骤4:计算最终所需的偏导数:

2 通信辐射源个体识别的自编码器构造算法

2.1 自编码器结构参数

自编码器结构主要由两个参数控制:模型宽度μ和模型深度v。如图2所示,模型宽度μ为各隐含层所包含的神经元数目所组成的矢量,模型深度v则表示了自编码模型隐含层的数目。

图2 自编码器结构参数

结构参数的设置对自编码器性能的影响至关重要,模型宽度过大,模型深度过小,则模型结构扁平,如图3所示,提取特征维度较高,难以起到简化作用;模型宽度过小,模型深度过大,则模型结构狭长,如图4所示,在编码的过程中容易丢失有效特征,同样不能良好地反映输入信号的特征。

图3 “扁平”的自编码器隐含层

图4 “狭长”的自编码器隐含层

2.2 结构参数估计方法

对通信信号 (rt)=[r1,r2,…,rM],输入特征维度为M,i表示当前隐含层序数,则:

其中,γi是辅助因子,常取 γ=10。[·]表示向上取整,即出现小数时进1。e是误差修正项,用于校正估计模型宽度的误差。一般有:

式中,模型深度v为使μ(v)>γ的最小正整数。

通过式(10)和式(11),可以得到自编码器的估计结构。若估计的模型结构有n种,将待提取特征的通信信号输入自编码器,通过少量数据快速训练模型,通过模型性能测试阈值可以实现自动筛选其中达到预期性能的模型,模型性能测试阈值T的计算公式为:

式中,P为待提取特征通信信号的样本总数,Pc为在模型性能测试中正确分类的样本数目。

2.3 算法步骤

根据以上算法过程推导,自编码器构造流程如图5所示,其主要步骤可以描述如下:

步骤1:提取通信信号有效频相信息,确定输入信号维度M;

步骤2:由确定输入特征维度M,根据式(10)和式(11)估计模型结构参数以及确定的v;

步骤3:从输入信号中随机取出10%,作为估测集Nestimated,输入自编码器以预测训练模型;

步骤4:根据式(6)~ 式(9),计算自编码器模型参数优化变量;

图5 本文算法流程示意图

步骤7:将分类性能达到明显性能测试阈值T的模型结构参数(μ,v)输出,存入参数信息库I。

3 实验验证

3.1 性能指标

表1 实验数据集参数设置

本文算法针对通信辐射源信号设计自编码器构造方法,验证实验采用的数据集为实际通信环境下所采集的“建伍”手持式FM电台数据集、超短波FM电台数据集以及短波USB电台数据集[11]。各数据集的参数设置见表1,其中包含了3种不同型号的通信辐射源(共15部),调制样式为FM与USB两种,每种型号的辐射源采用了3个工作频率,通信内容为3个说话人的语音数据。验证实验主要有两组:第1组验证本文算法设计的自编码器结构是否具备较好的特征提取能力;第2组为在数据被处理为不同特征维度情况下的自编码器性能测试,旨在验证本文算法的鲁棒性是否良好。

本文以电台个体识别正确率作为性能指标,当正确率Pc高于75%时,说明通信信号个体特征已经充分提取,自编码器的性能表现良好。自编码器的鲁棒性通过实验对矩形积分双谱特征在多维度情况下的分类结果反映,当平均识别正确率的波动不超过5%时,说明自编码器提取特征的鲁棒性良好。

3.2 实验结果

实验1对9种样式的通信辐射源信号提取64维矩形积分双谱特征,作为自编码器的输入特征,以辐射源个体识别正确率Pc作为性能验证指标。表2列出了具体实验组识别结果。

可以看出,在不同样式的通信辐射源信号数据集上,本文算法所构造的自编码器均具备较好的特征提取能力,所提取的特征用于通信辐射源个体识别具有稳健的性能。其中,建伍手持式FM电台的3个实验组结果达到可直接用于实际辐射源个体识别的性能指标,识别性能显著高于超短波FM电台和短波FM电台,识别准确率不佳的原因,可能是在维度约简过程中,本算法估计的模型易受输入信号非矩形双谱特征中的无关信息扰动,从而提取了错误的特征信息,导致对通信辐射源个体分类出错。通过增大训练集规模进行优化,可达到理想性能。

表2 性能验证实验(实验1)结果

实验2从3种通信辐射源中随机选出一种信号样式,分别提取其 64、80、128、160、256 维 SIB 特征,作为自编码器的输入特征,以5种维度识别正确率的波动作为性能测试指标。表3列出了实验设置与对应识别率结果。

表3 鲁棒性验证实验(实验2)结果

实验结果表明,在3类数据集上,本算法的识别率波动值均不超过5%,可以确保所构造的自编码器具有良好的鲁棒性。这是由于本算法在构造自编码器隐含层的过程中,将输入特征的维度作为重要参考参数,因此,可以适应多种特征维度情况下的模型结构设计。

3.3 结果分析

本文所提出通信辐射源自编码器构造方法,为提取通信辐射源个体识别所需细微特征提供了可用的原始模型以及进一步优化的原型模型。以上两组验证实验结果表明,该模型可以直接用于提取高频段通信辐射源(手持式电台)样本的细微特征,此特征可以将属于不同辐射源的信号清楚区分,并且能够较为准确地区分同型辐射源。但对于低频段通信辐射源(短波、超短波电台)样本,该算法的有效性并不理想,易受样本中冗余信息的干扰,导致特征信息提取错误。因此,本算法构造的自编码器可以作为针对短波、超短波频段通信辐射源优化的自编码器的原型模型,在此基础上设计低频通信辐射源的自编码器结构,只需关注信号处理问题上的优化,可以节约大量试错实验的时间和人工设计模型结构的精力,可以提高完善自编码器性能的效率。

4 结论

本文提出了一种通信辐射源个体识别的自编码器构造方法,可以针对接收的通信信号迅速构造可用的自编码器模型。对于低维通信信号,可立即用于准确的信号特征提取;对于短波、超短波通信辐射源,可作为优化的基本模型。通过实际采集的多种通信辐射源数据集上的验证实验结果表明,本算法构造的自编码器,对于多种通信信号的低维样本均可实现准确的特征提取,在个体识别任务中最高达86.80%的平均正确率,且具有良好的鲁棒性;作为短波及超短波信号样本的自编码器的基本模型,可以大大节约设计自编码器结构的时间和精力,只需针对信号样本规模作增广处理,从而提高通信辐射源个体识别准确率。

猜你喜欢

辐射源编码器维度
基于单站干涉仪测向法的未知辐射源定位技术*
融合CNN和Transformer编码器的变声语音鉴别与还原
理解“第三次理论飞跃”的三个维度
设定多圈绝对值编码器当前圈数的方法
转炉系统常用编码器选型及调试
认识党性的五个重要维度
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
舞台机械技术与设备系列谈(二)
——编码器
基于多参数联合模糊处理的雷达辐射源威胁等级判定
浅论诗中“史”识的四个维度