APP下载

基于特征融合网络的短波信号规格识别

2022-09-16朱世先楚倩楠

信号处理 2022年8期
关键词:矢量图规格样本

张 见 吴 迪 胡 涛 朱世先 楚倩楠

(1.中国人民解放军战略支援部队信息工程大学数据与目标工程学院,河南郑州 450001;2.91746部队,北京 102206)

1 引言

短波通信具有抗毁性、方式灵活和远距离传输等特点,一直是军事通信领域的发展和保留手段,在通信侦察中,短波信号规格识别是一项重要内容,是后续开展信号处理、监控及对抗等工作的重要基础。当前,现代短波通信技术高速发展,信号规格和通信设备表现出格式多样化、种类丰富化、个别信号类间相似度高等特点,为传统的识别方法带来挑战。因此,为满足新形势下模块化、智能化、实时化的电磁环境感知需求,开展对短波信号规格高效识别方法的研究具有重要价值。

传统的信号规格识别方法主要分为基于特征模板匹配[1]的方法和基于比特流分析[2]的方法。基于特征模板匹配的方法中,文献[3]利用小波降噪去除短波信号中的噪声干扰,进行波形匹配识别,但该类方法建立降噪匹配模板的过程较复杂,且识别效果受判决门限的选取影响较大;文献[4]对Link4A 和Link11信号建立持续和消失时间数据库,并结合信号的时间-频率-幅度信息进行检测识别,但该类方法在低信噪比时效果不佳,且判别时采用的聚类算法无法有效区分持续和消失帧长时间相似的信号。基于比特流分析的方法中,文献[5]提取信号比特流帧同步码作为识别特征,识别合法用户和非授权用户发送的信号规格类型,但该类方法要求接收到完整的帧同步码序列,且在低信噪比下误检率较高。随着深度学习技术被应用到通信信号处理领域,一些研究利用神经网络的强大特征提取和映射能力,解决信号规格识别的问题。文献[6]以不同短波信号帧结构时频谱图的视觉特性差异作为特征,利用深度残差网络[7](Deep Residual Network,ResNet)对7种特定信号规格进行识别;文献[8]使用单阶段多目标检测(Single Shot Detector,SSD)网络模型学习信号的图像特征,实现对4 类信号的检测和识别。但此类方法依赖于待识别信号集在时频特性上具有明显差异,当信号规格的时频特征接近时,其识别效果十分受限。根据以上分析,当前信号规格识别方法存在以下不足,1)仅采用信号数据流提取特征信息,或仅采用信号图像提取特征数据,未将数据和图像两个维度的特征信息综合利用;2)集中于对采用不同调制方式的信号进行识别,对相同调制方式不同规格信号识别的研究开展不足。

针对上述问题,本文在已有研究的基础上,构建了基于信号矢量图和数据流的信号浅层特征表达形式,在尽可能保留信号原始信息的同时,充分利用信号不同维度的特征信息,并结合文献[6]的特征提取思想,以较深度残差网络结构性能更优的密集连接卷积[9](Densely Connected Convolution,DCC)作为特征提取和学习工具,提出了一种短波信号规格识别的新算法。该算法首先通过数据预处理,将采样的复信号数据流转换成实数据矩阵和信号矢量图,其中信号矢量图能够充分反映信号的调制信息,数据流矩阵能够保留信号数据完整的差异性信息;其次,构建特征融合网络模型,通过其中的密集连接卷积单元(Dense Block)模块,以较多的网络层充分挖掘信号数据流和矢量图蕴含的深度信息特征,将两类特征进行融合、学习和映射,实现对不同信号规格的有效识别。此外,利用Dense Block 模块的特征复用机制,使网络模型的参数和计算量大大降低,在不降低系统性能的同时提高了运算速度;在生成训练样本时采用添加随机频偏的策略,进一步增强了网络模型的泛化性能。实验表明,与传统算法相比,本文算法有效利用了矢量图和信号数据两个维度的特征信息,既能识别采用不同调制方式的信号规格类型,也能识别采用相同调制方式的不同信号规格类型,在信噪比为0 dB 时,识别准确率能达到98%以上,同时随机频偏策略和特征复用机制的使用,使得当信号样本含有频偏时,其识别率相对于传统算法有5%~14%的提高,且模型空间仅占471 KB,运算速度约为90 ms,具有一定的实用价值。

2 短波信号差异性特征选取

调制方式是短波信号规格的一项重要属性,短波信号矢量图是信号调制类型的理想表达形式,由信号的两路数据按时间顺序重组得来,通过矢量图不仅能区分频移键控(Frequency Shift Keying,FSK)和相移键控(Phase Shift Keying,PSK),还能区分采用不同PSK 调制方式的信号。图1 为QPSK-24K 信号、采用8PSK 调制的MIL-STD-188-110A[10](以下简称110A)和采用8FSK 调制的MIL-STD-188-141A[11](以下简称141A)信号的矢量图,由于PSK类信号的符号具有固定相位,因此对接收的信号数据进行去载频和低通滤波处理后,得到的矢量图为星座点+符号轨迹的形式,而FSK 类信号为恒包络信号,其相位随频率的变化而变化,故矢量图呈现为圆环形式。

由上述分析知,使用矢量图作为特征的浅层表达形式,可以对一系列信号进行有效区分;实际中,许多短波信号采用相同调制方式,如均为8PSK 调制的110A、MIL-STD-188-110B[12](以下简称110B)、MIL-STD-188-141B[13](以下简称141B)和Link11 SLEW[14](以下简称Link11)信号,以及各类FSK 类信号在矢量图上均呈现为圆环状,此时仅通过矢量图作为特征提取源无法对其进行有效区分。考虑到短波信号在正向设计时,会制定一系列特定的信号产生标准和规则,如图2 为110A 信号产生示意图,可见原始信息经过卷积编码、交织与格雷码映射后,添加同步前导序列和训练序列,再经过扰码、调制和成型滤波,通过数模转换(Digital to Ana⁃logue,DA)单元后经发信机发射。

由于不同的通信规格标准对应不同的信号产生算法和传输组网规范,使得其产生的信号数据序列会呈现出特殊的信息传输格式。例如,110A、141B 和Link11 数据链信号典型信息格式如图3 所示,从图中可知110A 由前导序列、数据序列、结束段和冲洗段组成,141B 由保护序列、前导序列和有效数据序列组成,而Link11 信号则由报头序列、相位参考、起始码、战术数据和监督停止码构成,同时各类信号数据字段中的比特位数也有明显差异。

这些特定的信息数据组织和排列形式设计,是为了满足不同的业务与战术通信需求,而这也使得接收的信号数据流,呈现出各类信号规格的独特波形信息。以第三代短波通信规格标准的141B 信号典型数据流为例,其保护序列是可以进行直接调制、不需要进行伪随机序列(Pseudorandom Noise,PN)扩展的256 位三比特符号序列,前导序列是一个64位的三比特符号序列,其传输的每个数据包是长度为640 位的三比特调制符号,每个141B 信号的波形可以传输P个数据包,其中P的取值为3、6、12或24。当传输的数据生成之后,会按照每3 个比特表达一个调制符号的形式来产生数据包,并与保护序列、前导序列一起,构成了141B 信号的独特波形结构。因此,接收得到的不同类型信号的数据流,具有表征各自信号波形完整的差异性特征信息,可作为对不同信号规格进行区分的主要依据。

综上所述,本文选取信号数据流作为主要特征提取源,以矢量图作为补充以提高识别性能,利用神经网络强大的特征提取与处理能力,经过一系列卷积、下采样、连接和池化等操作,将两个维度的特征进行融合、学习与映射,弥补传统算法特征选取单一以及无法区分相同调制方式不同规格信号的问题,实现对各类信号规格的有效识别。

3 基于特征融合网络的信号规格识别

3.1 特征提取模块

如何有效地提取和学习输入数据中的深度特征,是本文着重考虑的一个问题。理论上,搭建的网络卷积层数越多,神经网络提取的特征就会更加丰富,识别的效果就会越好。但是研究[15]指出,在实际中,当网络层数超过一定临界值后,反而会导致网络识别性能的下降。文献[7]指出,可以通过残差映射的方式改善上述问题,其深度残差网络结构如图4(a)所示;文献[9]在残差映射的基础上,提出了性能更优的密集连接卷积的理论,即连接网络中所有特征提取的卷积层,每个特征提取层都会接受之前所有的网络层作为其额外的输入。本文依据上述理论,构建密集连接卷积单元(Dense Block)这一特征提取模块,如图4(b)所示,实现对输入样本数据深度特征的有效提取。

对于网络的第L层,深度残差网络将每个层和前面的某层以“短路”的形式相连接,连接形式是元素级相加,其输出为:

其中xl为网络第L层的输出,xl-1为第L-1 层的输出,Hl(·)为网络的非线性变换函数,包括一系列卷积(Convolution)、正则化(Normalization)、激活(Acti⁃vation)和池化(Pooling)操作。

如图4(b)所示,Dense Block 模块采用了特征复用(Feature Reuse)机制,即每一层中提取特征的运算,都会重复利用之前所有层的特征处理和提取结果,具体为将本层数据和之前各层提取的特征数据,在通道(Channel)维度上相连接,再进行非线性运算处理:

因此,对于一个L层的Dense Block 模块结构,共包含个连接,这种连接方式可以直接融合来网络不同层的特征,增强了特征复用的效果。在达到相同分类准确率时,Dense Block 模块所使用的参数数量不到深度残差网络的一半,计算效率大大提升,同时其抗过拟合能力和泛化性能也更强。

3.2 特征融合网络模型

本文设计的特征融合网络模型如图5 所示,考虑网络模型的内部结构和实际信号的相关参数,将输入的信号数据样本统一设置为336×336的数据矩阵形式,矢量图样本统一设置为128×128 的尺寸。模型对输入信号样本的处理和识别流程如下:

1)分别对信号数据矩阵和矢量图进行7×7 的卷积和3×3 的最大池化(Max Pooling)操作,初步提取特征并降低特征数据的尺寸。

2)将上述由数据矩阵得到的特征数据依次通过4 个Dense Block 模块,由矢量图得到的特征数据依次通过3 个Dense Block 模块,逐步提取不同层次的特征,每个Dense Block 模块结构如图4(b)所示,两路网络的Dense Block 模块含有的密集连接卷积节点数量不同,依次为6、12、32、32 个和6、12、12个。每个Dense Block模块中,各个网络层的特征数据尺寸保持一致,实现在通道维度上将特征数据相连接。

3)各相邻的Dense Block模块通过变换(Transi⁃tion)模块相连接。在变换模块中,信号的特征数据先经过一个1×1的卷积,再通过步长为2的2×2的平均池化(Average Pool)层,实现对信号特征数据尺寸的减小。

4)对最终得到的两路特征分别实施7×7 的全局平均池化(Global Average Pool)操作,获得其特征向量,再将两路特征向量进以连接(Concatenate)的方式实现特征融合。

5)将上述步骤得到的融合特征送入全连接分类器中进行运算,得到对信号规格识别的结果。

在Dense Block 模块中,对信号进行特征提取采用的非线性函数H(·)的内部结构如图6 所示,信号样本数据先经过批正则化(Batch Normalization,BN)、修正线性单元(Rectified linear unit,ReLU)激活和1×1 的卷积层,使信号的特征层数减少以增加运算效率,随后再经过批正则化、Relu 激活和一个3×3的卷积,实现对信号数据的特征提取。

由上述分析可知,本文设计的特征融合网络模型对样本进行特征提取的部分共含(82+30)×2+7=231 层,得益于Dense Block 模块的良好性能,模型的运算量和资源利用率维持在较好的水平。

3.3 信号数据集的生成

本节介绍训练和测试信号样本数据集的生成,本文研究的短波信号规格识别类别包括110A、110B、141A、141B、Link11 SLEW 和PACTOR[16]协议标准下的信号,其中110A、110B、141B和Link11信号规格均为8PSK调制方式,符号速率均为2400 Baud,141A 为8FSK 调制方式,PACTOR 为2FSK 调制方式,样本信号数据集使用Matlab 平台仿真生成,图7为信号数据集的产生流程。

首先根据指定的规格标准和随机的消息符号数据序列,产生相应短波信号,信号生成的相关参数依据各协议具体标准规范执行,信号产生过程中使用高斯信道[17]模拟实际信道环境,添加高斯噪声后各样本的信噪比Es/N0范围为-5~5 dB。考虑实际应用情况和网络训练需求,对数据集产生流程中的特定步骤阐述如下:

1)加入随机频偏

本文通过对信号样本的深度特征提取、融合和学习,实现对各类信号规格差异性特征的区分。考虑到实际接收的短波信号在去载频时,往往伴随有一定的频偏,会对信号样本数据的分布产生相当的影响,因此为贴合实际情况,在仿真产生信号样本数据时,设计了随机频偏策略,即对信号进行如图8所示的添加随机频偏的处理。在产生每个信号样本时,通过产生随机的频偏控制因子α,使有50%的概率进行随机频偏操作。当产生频偏时,加入的相对于符号速率的频偏在0~λ范围内随机选取,其中频偏上限λ设为0.04。通过对信号加入随机频偏,增加了样本的丰富性,使得网络模型能够对这一频偏范围内的信号样本进行学习,从而在一定程度上提高模型的泛化能力。

2)随机截取信号长度

理想情况下,希望能够获取短波信号完整长度的帧数据以进行识别,但在实际信号传输的过程中,受各种复杂因素的影响,往往不能接收得到完整的信号帧数据。本文对每个信号样本数据进行随机截取处理,按截取的位置区间分两种情况:包括完整的单帧数据或单帧数据的某部分,若截取单帧的一部分,截取的信号长度在30%~100%间随机选取,且截取的起始点从帧头或帧尾随机选择。通过对信号样本进行随机长度截取,使信号数据集更加接近实际情况,从而提升模型的实用性。

3)生成矢量图

考虑到传统的矢量图为二值图像,无法反映符号轨迹在某些区域的聚集程度,本文将信号数据转换成基于8 位灰度图像的矢量图,使得符号轨迹在各区域的聚集程度得以体现在图像的灰度值上,并结合网络模型的处理需求,将矢量图设置为128×128的尺寸。

4)转化为单路数据

由于神经网络的内部结构,需要实数据作为网络输入,因此将信号的复数据流转化为单路数据,具体做法为将信号各样本点的实部和虚部数据分开,各点数据依据实部-奇数列,虚部-偶数列的规则排列,得到复信号数据的单路实数表达形式。

5)归一化信号数据值

为使不同强度的信号样本数据值在输入网络模型运算时,不因其幅值的统计大小水平而影响网络的性能表现,使网络模型更加有效地拟合信号样本数据,实现准确收敛,对信号数据进行归一化操作:

其中data1为未进行归一化处理的数据,data2为归一化的结果。通过式(3)将各类信号样本数据的数值区间均搬移至[0,1]之间,让各信号规格的特征值具有相同的度量尺度,使网络模型更好地实现对信号数据的特征提取和学习。

6)转化为数据矩阵

神经网络中,二维形式的数据组织形式可以实现一系列高效的卷积、池化、正则化和激活等运算,因此将归一化得到的信号数据,按每336 个数值排为一列的组织规则,构建尺寸为336×336 的数据矩阵,实现数据样本结构的高效化,方便后续网络模型的处理。

4 性能测试与分析

本节对模型的识别性能进行仿真测试,待识别的信号规格对象集为{110A、110B、141A、141B、Link11、PACTOR},各类信号在每个信噪比下测试的样本个数为1000,信号样本的生成依据3.3 节中方法步骤执行,实验平台配置为Intel(R)Xeon(R)E-2276M 处理器,Nvidia Quadro RTX 5000 GPU,32 GB DDR4内存。本文采用的信号规格识别性能指标为:

4.1 模型总体识别性能

各类信号规格在不同信噪比下的识别效果如图9 所示,可以看出在符号信噪比为-5 dB 时,对110A、110B、141B、Link11 和PACTOR 等5 类信号规格的识别率均可以达到90%以上;随着信噪比的不断提升,识别率也在逐渐提高,当信噪比达到0 dB时,对所有信号规格的识别准确率都能达到98%以上,表现出良好的识别性能。

图10 为本文算法与基于深度残差网络算法[7]以及单阶段多目标检测算法[8]的识别效果对比,由于现有算法的特征选取与处理方式在识别采用相同调制方式的信号规格类型时存在不足,本文算法以数据流作为主要特征提取源,并以矢量图作为补充,将信号的两个维度特征进行融合学习与处理,可以有效识别该6 类信号规格,其中4 类均为8PSK调制,具有一定的优势。

为便于量化分析网络模型对各信号规格的识别性能,绘制了-5~5 dB 信噪比区间模型分类混淆矩阵,同时计算模型对各个信号规格识别的准确率(Precision)、召回率(Recall)和总体识别精准度,如图11所示。

其中,数字为每个具体分类下的样本数量,数字下方百分数为识别成该类的样本数量占总测试样本数量的百分比;最右一列为模型的识别准确率,表征某样本信号被识别成该类规格时的可信程度,最下一排为模型识别的召回率,表征模型对每类信号规格的区分和鉴别性能,右下角百分数为模型总体识别精度,表征网络模型在整体测试信号数据集上的综合分类性能。由图11 可知,模型在-5~5 dB 信噪比范围内的总体识别精准度为98.93%,对110B、141A、Link11 和PACTOR 信号规格的识别准确率均达到了99%,对141A信号识别时有0.42%的信号样本与110A 混淆,其次是110B 信号,有0.27%的样本和110A 信号混淆。识别时发生上述轻微混淆的110B和110A信号均为8PSK调制方式,而141A 和110A 虽为不同调制方式,但其信息数据组织格式有相似之处,且均使用8 类符号进行数据传输,当加入强高斯噪声生成极低信噪比的信号样本后,其数据流会呈现某些相似的特性,并且在此种低信噪比环境下,其矢量图的区分度不明显,因此有个别信号在识别时产生混淆,当信噪比提升后这种相似性混淆会消失,具体如图9所示。

表1 为网络模型的相关属性参数,其中时间复杂度为分别对13200 个训练信号样本进行训练和9000 个测试信号样本进行测试后求统计平均得到,表征模型对单个样本的处理速度。可见本文模型大小仅有471 KB,权重文件大小为52.3 MB,利于部署在轻量化设备中;训练和测试的时间复杂度约为90 ms,基本可以满足实时性的识别需求,具有一定的应用前景。

表1 信号规格识别模型属性参数Tab.1 Signal specification recognition model attribute parameters

4.2 实验参数对性能的影响

实际短波信号接收处理中,对载频的估计往往会有误差,因此本文的信号样本生成算法采用了添加随机频偏的策略,图12是本文模型在不同频偏条件下,使用本文样本生成算法和使用传统无频偏样本生成算法[5]识别性能的对比。可见相对于无频偏条件下的识别性能,当信号样本含有相对于符号速率的不同频偏时,识别率会有一定程度的降低。由于本文在构造训练样本数据集时采用了加入随机频偏的策略,网络模型在一定程度上学习了设置的频偏范围内的信号样本属性特征,因此当测试样本含有频偏时,其识别率相对于传统的无频偏样本生成算法有5%~14%的提高。

输入网络的信号样本中,选取的信号数据序列的长短会影响识别效果。本文以实验验证选取信号数据序列不同长短时的识别性能,其结果如图13所示。

实验中,对各类信号采样得到的数据序列的长度占其信号波形总长度的比例δ分别取100%、90%、75%、60%、45%和30%。由实验结果知,当选取的信号数据序列长度过短时,由于信号数据流样本往往不能包含完整的表征信号间差异的数据字段序列,因此当δ取30%时识别率较低;当δ取45%时识别率有了较好的提升,表明当截取约一半的信号波形长度时,本文基于特征融合的规格识别算法即可较为有效地识别各信号规格类别;随着选取信号数据序列长度的进一步增长,识别率也在相应地提高,且比较δ取90%与100%时的识别效果可知,当选取的信号数据序列长度接近完整的波形序列长度时,即能总体达到算法的最优识别效果,此后识别性能将几乎不再变化。

考虑信号样本中截取信号数据流的起始位置对识别的影响,图14 展示了获取样本时从信号波形序列的不同位置进行截取的识别性能。其中,截取的位置相比于波形序列总长度的起始位置比例γ分别取0(波形序列之前)、25%、50%、65%、75%和90%。可见,当从信号波形数据序列之前截取时,能够取得最好的识别效果;当以信号波形数据序列的25%处为起始点进行截取时,仍可以获得较为丰富的信号数据规格信息,本文基于特征融合的规格识别算法可以取得90%以上的识别准确率;当截取的起始位置移至信号波形数据序列的50%处即中间位置时,截取得到的信号数据序列已经不能有效表征信号之间的差异,此时识别性能有了明显下降;当在波形的75%和90%处,即截取的起始位置移至信号波形序列的后1/4范围时,识别性能进一步大幅下降,表明此时截取得到的数据流序列已基本无法体现信号间的差异。

为检验多径时延和宽带干扰对识别性能的影响,增加模拟实际大气情况的宽带干扰[18],并在沃特森(Watterson)信道标准[19]中的6类短波信道标准环境下,测试算法的性能表现,实验结果如图15 所示。可见本文算法在不同信道环境下仍具有稳健性,在2 dB总体识别率可达90%以上。

比较使用数据流和时频图作为网络输入的训练效率和识别性能,将各类信号矢量图替换为相应的时频图,与数据流一同作为网络输入,记录迭代训练过程中的损失值和识别率,结果如图16 所示。由于采用相同调制方式的不同规格信号在矢量图相位上有一定差异,其时频图总体上无明显差异,因此训练效率及识别性能较本文算法有一定不足。此外,时频图的相似性会对训练产生一定干扰,表现为相应性能曲线呈现轻微扰动。

考虑网络结构对性能的影响,本文通过实验对比单一特征网络结构和特征融合网络结构的识别性能。使用本文特征提取模块构造单输入规格识别网络模型并以信号数据流作为网络输入,与本文基于特征融合网络模型的规格识别算法性能进行对比,结果如图17所示。由于仅以信号数据流作为特征提取源时未充分利用信号的调制信息,对某些调制方式不同但帧长或信息组织格式相似的短波信号(如141A 与Link11)进行识别时仍有提升的空间,在一定程度上劣于本文算法,从而验证了本文算法的可行性。

5 结论

本文基于短波信号矢量图和数据流的特征表达形式,提出了特征融合网络模型,充分利用Dense Block 模块强大的特征提取和处理能力,融合学习矢量图和数据流中蕴含的丰富特征信息,较好地解决了对包括相同调制方式在内的各类信号规格有效识别的问题。同时,在产生信号数据集时设计了随机频偏策略,进一步提升了网络模型的适用性。实验结果表明,本文算法在保证信号规格识别准确率的同时,具有较好的抗噪性和一定的抗频偏性。此外,本文设计的特征融合网络模型具有文件体积小、运算速度快的优点,可以方便部署和开展实时化处理,具有较好的工程应用前景。

猜你喜欢

矢量图规格样本
近3成苗企难以维持!规格越大越亏,2022如何让泥鳅赚钱?
Analysis of the line current differential protection considering inverter-interfaced generation station and countermeasures
闭月羞花
用样本估计总体复习点拨
山钢日钢1.2mm极限薄规格带钢的生产实践
推动医改的“直销样本”
利用矢量图对小物体从光滑斜面下滑运动探讨
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本
邻域平均法对矢量图平滑处理