基于射频指纹与行为序列的射频机器学习系统研究
2023-08-22王宁
王 宁
(中国空空导弹研究院,河南 洛阳 471009)
0 引 言
1895 年,人类第一次成功收发无线电报后,天空中的人造电波就再也没有断过。电磁空间已经成为了继“海、陆、空、天”以外的第5 维空间。目前,传统的射频信号分析与识别大多基于人工提取射频信号的微观技术。该传统分析方式受分析效率低和实时性差等限制,直接制约了其在瞬息万变的复杂电磁环境中大规模使用的可能性。该背景下,基于机器学习等技术的人工智能在越来越多的领域展现出巨大的潜力[1]。将机器学习技术引入到射频信号的分析与识别,已经成为未来发展的必然趋势。因此,引入了一种射频机器学习技术,在抽象层面上建模和分析射频信号,利用机器学习中神经网络强大的特征抽取与分类能力,聚类分析射频信号的性质,从而尽量减少人工判断,提高分析结果的准确性。
1 系统功能及组成
文章主要研究一种基于射频指纹特征和行为序列的射频信号机器学习技术,创建一种既能够识别射频辐射源个体,又能够根据重要性、危害性、合作性等方面将其分类的机器学习系统[2,3]。射频信号机器学习系统原理框图如图1 所示。
图1 射频信号机器学习系统原理框图
首先,使用时频分析和高阶谱分析等工具提取射频指纹特征;其次,通过卷积神经网络(Convolutional Neural Networks,CNN)识别和分类射频信号,同时在射频指纹特征中抽取出可供下一级循环神经网络(Recurrent Neural Networks,RNN)识别的行为序列,RNN 通过学习行为序列,并根据射频信号的重要性、危害性以及合作性将其分类;最后,提高复杂电磁环境中的态势感知能力。聚焦于射频指纹特征和行为序列的提取,具体研究射频指纹特征提取、个体与行为序列识别以及信号性质分类。
1.1 射频指纹特征提取
射频指纹具有通用性、唯一性、可测性以及稳定性,由发射机发出的射频信号所携带。通过提取和分析射频指纹,可以识别不同种类和个体的发射机[4,5]。国内外的大量研究结果已经证明了射频指纹的特性,此处直接采信研究结论[6,7]。
原始的射频指纹中包含大量信息,如果全部采用,那么计算量庞大,因此必须选取特征信息。识别射频指纹特征的具体过程如下。
(1)射频信号的预处理。主要是将射频信号采样数字化、去除噪声、并作归一化处理[8]。基于不同的接收机构架对射频信号采样的影响,选择一种能够覆盖宽带射频信号采样的硬件构架[9]。此外,射频信号的预处理包括实现抑制噪声的滤波算法、归一化、包络成型以及数字变频等算法。
(2)射频指纹特征提取。实际的射频信号可以分为平稳信号和非平稳信号。平稳信号主要是发射频率不随时间变化的平稳状态或平稳时段的信号;非平稳信号包括发射机开关过程中信号建立和关断的瞬态信号、频率随时间快速变化的跳频信号以及扫频信号等。这2 种信号一般采用不同的分析方法。
根据各种稳态信号的不同性质,选择稳态下有效的指纹特征,通过对比常用的稳态信号特征分析不同技术的优缺点,进而选取合适的分析方法[10]。
对于包含大量调制信息的平稳信号,由于信号的调制特性未知,无法直接从接收信号中提取频率偏移、相位偏移、时钟偏移以及同相正交信号原点偏移(In-phase/Quadrature origin offset,I/Q origin offset)等信息作为射频指纹特征。因此,采用高阶谱中最实用和最简便的3 阶谱(双谱)提取稳态信号。
对于非平稳信号,包含频率跳变的非平稳信号的特性随时间变化,需要使用时域和频域的二维联合函数来表示。蒋平对不同无人机进行时频分析,结果表明其时频特性明显不同,不同无人机的时频图对比如图2 所示[11]。
图2 不同无人机的时频图对比
目前,经常使用的时频分析法有短时傅里叶变换(Short-Time Fourier Transform,STFT)法、小波变换法、Wigner-Ville 分析法以及科恩类时频分析法等。经过比较不同时频分析方法的时间、频率、分辨率以及优缺点,选择一种改进的Wigner-Ville 分布即平滑伪Wigner-Ville 分布,进行研究和算法实现。通过研究平滑伪Wigner-Ville 分布中不同的核函数,分析其对多频率分量交叉项的抑制效果以及对频率和时间分辨率的降低程度,进而设计一个局部最优化的核函数,实现目标射频信号时频特征的最佳分辨和抽取。
1.2 个体与行为序列识别
设计一个机器学习中的神经网络模型,用提取出的射频指纹特征数据集训练和优化神经网络,使用该神经网络作为分类器,识别个体并抽取行为序列。提取的射频指纹无论是平稳信号的积分双谱,还是非平稳信号的时频图,都可以作为一种二维的图像来处理。因此,选择神经网络中发展迅速且被广泛成功应用于计算机视觉和图像识别等领域的CNN 模型。CNN 是一种成功的多层网络结构模型,实现了真正的训练和学习。与经典的逆向传播(Back Propagation,BP)神经网络不同,CNN 通过卷积和池化操作成功降低了网络中的参数数量,从而大大缩短网络运行时间。
文章主要聚焦于CNN 参数设置、CNN 对射频指纹特征和行为序列的有监督学习以及使用随机梯度下降法优化CNN 的训练效率。
1.3 信号性质分类
射频信号的行为序列是人为控制或由设计程序控制的一系列事件,是人们的意图和意志在射频信号变换中的体现,包含目的、手段、结果反馈的整体或部分行为序列。无论是用于通信、探测,还是用于欺骗、干扰、阻断,其行为序列都包含了设计者内在的行为逻辑[11]。按照隐马尔科夫模型(Hidden Markov Model,HMM),该行为序列构成了一个双重随机过程:第一个随机过程是描述状态转移情况的马尔可夫链(Markov Chain,MC),其输出为一组状态转移序列,内在隐藏而不可见;第二个随机过程是描述可观察的行为值与对应隐藏状态之间统计关系的一组概率分布。该行为序列可以按照隐马尔科夫模型进行建模计算,也可以使用具有强大序列数据处理能力的RNN 来进行分析。
此处主要使用RNN 来分析行为序列,并解决使用RNN 过程中的2 个问题:一是,如何训练具有反向传播的神经网络;二是,如何解决训练过程中梯度消失或梯度爆炸的问题。
2 本研究需要解决的关键科学问题
(1)时频分析中,为抑制交叉项而降低时间、频率、分辨率,进而影响射频指纹特征提取和个体识别的问题。为抑制Wigner-Ville 分布中的多频分量的交叉项,引入指数核函数平滑窗口,会在一定程度上降低Wigner-Ville 分布的时间、频率、分辨率,一旦降低幅度超过了噪声门限,就会对后面基于时间和频率关系的特征识别产生严重的干扰,通过神经网络的逐层积累,进而导致识别错误率快速上升。
(2)小样本训练集监督学习条件下,神经网络的局部过拟合问题。深度网络参数学习效率低的主要原因如下:一是,深度网络前层神经元和后层神经元参数学习的不对称引起的梯度不稳定;二是,获取标签数据的成本昂贵,小规模的标签数据会导致出现模型过拟合的情况,进而导致模型的泛化性能差;三是,梯度学习算法属于一种对初始值敏感的算法,而深度网络是一种高度非凸函数,因此容易陷入局部极值解困境。
(3)行为序列中可识别模式组合的向量化问题。从射频指纹特征中抽取的行为序列是一些最基本和固定的行为元素集合,该基本的行为元素代表的信息有限,也很难由神经网络进行学习分类,就像独立的字母元素,必须组合成单词才有具体明确的信息。因此,为便于处理和分析,需要向量化该特定的行为组合,在高维空间中将其编码为实值向量。该组合信息的相似性表示向量空间中的接近度,向量化后的行为序列可以被神经网络很好地理解和分析。
3 结 论
国内外研究中,基于射频指纹特征的研究只涉及射频指纹特征的提取和射频信号源识别问题。该背景下,文章从更高层思维出发,从射频特征中提取出代表意图信息的行为序列,并对其进行向量化编码,使用循环神经网络进行机器学习训练,并根据重要性、危害性、合作性等基础性质分类识别射频信号,大大提高了频谱空间中的态势感知能力,为以后的相关研究打开了一条新的思路。