数据驱动的RF信号深度调制识别方法
2022-06-23徐亚军郭恩豪司成可
徐亚军,郭恩豪,陈 林,司成可
(1.中国民用航空飞行学院航空工程学院,四川 广汉 618307; 2.同方电子科技有限公司,江西 九江 332000)
0 引 言
随着软件无线电技术快速进步,各类用频设备数量不断增多,电磁环境中的信号调制种类日益复杂,能否在实际电磁环境中快速、准确地识别出信号调制类型,对于提升频谱利用效率以及信号深度分析均具有重要意义,关于对信号调制类型识别的各种技术已在认知无线通信[1-2]、电子对抗[3-4]、信号侦察[5-6]等领域受到广泛关注。
目前,针对无线电信号的调制识别方法大致分为基于特征的(Feature Based, FB)信号调制类型识别法和基于数据驱动的深度调制识别法2类。在基于特征的调制识别技术中,首先对原始I、Q数据通过某种变换(例如:高阶累积量计算[7]、多尺度熵[8]、WVD变换[9]、HHT变换[10]、STFT[11]等)提取信号特征,随后通过各种分类器(例如:SVM[12]、决策树[13]、KNN[14]以及全连接神经网络[15]等)对信号特征作进一步分类,最终实现信号调制类型识别。然而,基于信号特征的调制识别方法对于信噪比高、且信号类型种类少时(典型值信噪比不小于8 dB且信号种类在10种以内),其识别性能较好。当信号自身调制类型复杂,信号识别种类多,尤其在低信噪比场景下对信号特征提取不充分时,其调制识别性能急剧下降。截止目前,绝大多数研究如文献[15-19]中所研究的信号调制类型种类均不超过20种,对于调制类型相似、调制样式复杂且调制样式同时超过20种的信号调制类型识别研究公开报道较少,鉴于此,本文不对其进行专门研究。与基于信号特征的调制识别类方法不同,基于数据驱动的信号调制识别方法实现了从原始I、Q数据直接识别出信号调制类型,既简化识别流程的同时又提高了调制识别性能[16-19]。具体上讲,O’Shea等人[16]最先利用信号I、Q数据训练卷积神经网络(CNN),并对不同调制类型信号进行识别,研究结果证实了CNN网络能够对不同调制类型信号进行分类识别。接着,Meng等人[17]采用经过专门设计的CNN网络对匹配滤波器输出的调制信号进行分类识别,对比之前的CNN网络,该网络的识别性能获得进一步提升。与此同时,文献[18]中还提出了一种基于端到端的调制类型识别神经网络,研究结果表明所提网络对信号调制类型的识别能力超过了基于特征类的识别方法。除此之外,Zhang等人[19]采用组合特征作为信号识别网络的输入,研究不同类型的神经网络对组合特征的识别性能,由于长短时记忆网络(LSTM)进一步考虑了信号的时间相关性,其识别性能更好。然而,上述报道的研究内容仍存在几点不足:1)信号调制样式种类不丰富。上述所介绍的信号调制类型数量大多在20种以内,面对更多种类的调制类型时,网络识别性能下降。2)大都照搬现有的图像识别领域的神经网络进行信号调制类型识别,未充分考虑无线电信号数据自身特性,导致网络结构过于复杂且识别性能不高。3)现有深度调制识别方法对信号调制识别的环境适应能力不足,当环境发生变化时,网络需要大量样本数据重新训练网络参数,即便采用迁移学习提升现有网络在新信道环境下适应能力,其识别性能仍然不佳。
鉴于此,本文通过实验室桌面仿真和外场实测数据采集相结合的方式,构建24种不同调制类型信号数据集;同时针对无线电信号自身特征,在继承残差神经网络(ResNet)结构基础上,研究网络层数、卷积层步长、卷积核大小以及训练集大小对神经网络识别性能的影响,针对性地设计出一款具有紧致残差结构的信号调制类型识别神经网络,实现在有效降低网络结构复杂度的同时保证网络识别性能;不仅如此,利用迁移学习研究环境信道变化场合下的迁移学习策略,避免因信道环境变化而重新训练网络,加快网络收敛速度,提升神经网络对环境的适应能力。
1 数据集构造与对比识别网络
1.1 数据集构造
一方面,在上位机上采用MATLAB软件开发了22种不同调制类型的基带波形(各种波形的最大符号速率设为1 MSPS),每种基带调制类型信号波形的I、Q数据长度设为100万点。将开发的基带波形通过矢量信号发生器(VSG)完成调制,并上变频至载波频率为666 MHz形成已调信号,后经放大输出(输出功率为0 dBm)。接收端,通过有线连接至RF信号采集板卡进行0中频采样(采集卡工作频段范围为70 MHz至700 MHz,采集卡AD采样率设为200 MHz),AD量化位数为16 bit量化,通过采集板卡将接收信号进行下变频至0中频并经25倍抽取后以8 MSPS的基带I、Q速率输出。每类调制类型输出信号的采集时长为10 s,依次生成22种不同调制类型的基带I、Q数据;另一方面,利用智能频谱传感器(由同方电子科技有限公司提供)作为I、Q数据采集设备,对广汉机场专用的2个VHF通信频点分别进行数据采集,最终构造出24种不同调制类型信号集。具体包括256-QAM、128-QAM、64-QAM、32-QAM、16-QAM、32-PSK、16-PSK、4-ASK;2-ASK、8-PAM、2-PAM、8-PSK、QPSK、OQPSK、MSK、DQPSK、D8PSK、DBPSK、AM、FM、GFSK、GMSK、广汉-VHF1、广汉-VHF2。在此基础上,进一步对调制类型数据集手动添加不同强度的噪声(SNR=-4 dB~12 dB)生成新的不同噪声强度下的信号集。随后再对含噪信号集样本进行分段切片处理,形成固定长度的数据集。完整的数据集生成流程如图1所示。
图1 数据集生成流程图
1.2 基线对比网络
鉴于CNN网络出色的识别性能,本文将其作为信号调制识别性能的对比网络。该网络包括2个卷积层和3个全连接层,网络输入样本为1024点长度的原始I、Q数据。卷积层主要对输入数据进行特征提取,通过卷积操作生成特征图[20]。每个卷积层中包含多个卷积核,卷积步幅设为1。网络中的激活函数采用ReLU函数,其函数表达式如式(1)所示。网络中的池化窗口大小设为1×2,采用最大池化方式,池化步长设为1,沿着同一维度对特征平面进行降维。对比网络的具体结构如表1所示。
f(z)=max(0,z)
(1)
其中z为激活函数的输入特征。
表1 CNN神经网络结构
2 信号调制识别网络设计
借鉴计算机视觉和图像识别领域已获得广泛应用的残差神经网络(ResNet)结构[21],在CNN网络基础上增加恒等映射,采用类似并联(而非级联)的形式调整优化网络参数,有效避免了CNN网络随网络层数加深、迭代次数过多所导致的梯度爆炸和梯度消失等问题[22]。然而,当前残差神经网络的典型网络层数大多设置为18、50、101层等类型,若在信号调制识别中照搬残差网络的深度层数,将直接导致网络结构过于复杂、网络参数大、所需训练样本数量多、消耗硬件资源等问题。同时,由于未充分考虑无线电信号I、Q数据特性,直接照搬图像识别领域成熟的残差神经网络进行信号调制类型识别,将导致网络的识别性能不佳,这在基于CNN网络的信号调制识别研究中已得到证实。
因此,文中结合无线电信号的I、Q数据特征,利用基本卷积层、残差单元、残差块以及全连接层搭建信号调制识别神经网络,所构建的网络架构如图2所示,根据不同的网络结构及网络超参数条件所表现出的识别性能确定网络最终结构。
图2 所提的DeepResNet-RF网络基本架构
在网络训练阶段,网络全连接层的丢弃率设为0.3,使用Adam优化器作为网络优化器,超参数学习率设为0.001,模糊因子设为10-8,每次更新后学习率的衰减值为0,每轮训练数据均随机洗牌,数据集总样本数为26万个,选取数据集中的80%作为训练数据,20%作为测试数据,每批次样本数为1000。采用多类别交叉熵作为损失函数。
(2)
(3)
其中∂yj/∂wj=bj,根据f(yj)′=f(yj)(1-f(yj)),f为每层网络的激活函数,最后一层采用softmax(.)函数,各神经元的权值梯度为:
(4)
因此,最后一层网络的权值梯度向量表示如下:
∇Θ=[∇w0,∇w1,…,∇wj]
(5)
进一步,采用梯度下降法更新网络权值。
Θ=Θ1-α·∇Θ
(6)
其中,∇Θ表示每层网络权值的梯度,α为学习率,Θ为待更新的网络权值,Θ1为上一次迭代更新的网络权值。最后反向依次完成每层网络权值更新。
1)网络输入样本长度。
首先,启发式给定网络结构参数。其中残差块数设为6,每个残差块中卷积层数为5,卷积核大小设为4×2。在此基础上,采用不同长度的数据样本对网络进行训练与测试,以此确定网络的最佳输入样本长度。分别计算了样本长度为128、256、512和1024几种情况下的网络识别性能,测试结果如图3所示。结果表明,当输入数据维度为2×1024×1(I、Q这2路)时,网络在-4 dB信噪比条件下的识别性能超过75%。信噪比超过4 dB时,其识别性能趋于100%。进一步增加数据维度至2×2048×1,网络识别性能没有显著提升,但训练网络所需的时间成本却成倍增加。折中考虑,网络输入样本长度设置为1024合理,故网络输入数据维度为2×1024×1。
图3 不同样本长度下识别性能随信噪比变化曲线
2)残差块个数。
给定网络输入数据维度为2×1024×1条件下,进一步测试网络中包含不同残差块个数对应的网络识别性能。结果表明,针对文中所采集的数据样本而言,不同数量的残差块对网络识别性能影响不明显,当网络中使用的残差块数为5时,网络在-4 dB信噪比条件下的识别准确性达到74%,6 dB信噪比条件下趋近100%,若继续增加网络的残差块数,其识别精度并没有显著提升。鉴于此,当深度残差调制识别网络的残差块数设为5时,网络能达到最佳的调制识别性能。
3)残差块内包含的卷积层数。
在确定数据样本维度(2×1024×1)和残差块数(5个)后,进一步对残差块中包含的卷积层数进行研究,分析了残差块中卷积层从1层逐次递增至6层时的网络识别性能,测试结果如图4所示。当卷积层数设为4时,网络在-4 dB信噪比条件下的识别精度达到73%,超过8 dB信噪比时的识别精度趋于100%。若继续增加残差块中的卷积层数,其网络识别性能无明显提升。故深度残差调制识别网络的残差块中的卷积层数设为4是合理的。
图4 残差块内包含不同卷积层数的网络识别性能
4)网络卷积核大小。
在确定了网络输入样本数据维度、残差块数(5个)以及卷积层数(4层)等网络超参数条件下,进一步对卷积层中不同卷积核尺寸进行研究,分析了卷积核尺寸从2层逐次递增至6层时的网络识别性能,测试结果如图5所示。当卷积核长度设为5时,相较于其他数据长度而言,网络在-4 dB信噪比条件下的识别性能达到78%,在4 dB信噪比下接近100%,进一步增加卷积核尺寸反而导致网络识别性能下降。因此,折中考虑网络识别性能以及网络复杂度等因素,将网络卷积核尺寸设为5。
最终,在以上各网络超参数选取基础上,直接确定出最终的信号调制识别网络结构,所提的紧致DeepResNet-RF网络结构参数如表2所示。
图5 不同卷积核大小的网络识别性能
表2 所提的DeepResNet-RF网络结构
所谓紧致,主要体现在3个方面。①传统的ResNet在下采样过程中,通道数是不断翻倍的,而本文中的通道数固定为32,避免了网络因通道数的增加而导致网络的计算复杂度急剧上升;②本文使用的网络层数为24层,相较于ResNet50以及ResNet101等传统残差网络而言,所设计网络在保证识别精度的同时大大减少了网络总层数,降低了网络结构复杂度;③本文所采用的的数据维度为2×1024×1。对此,通过反复的实验比对发现,选用卷积核大小为5×2,相较于传统卷积核大小为3×3而言,在加快网络运行速度的同时,也能保证网络的识别准确性。
2.1 存在的局限及分析
在移动场景中,信号源到接收机间的信道环境通常会发生变化,因此,需要验证所提网络在时变信道环境下的适应能力。接下来,在采集的原始数据集基础上,对原始数据集样本仿真加入瑞利衰落效应模拟信道环境发生变化后的数据集,利用原数据集训练的网络对加入瑞利衰落效应的新数据集进行调制类型识别性能测试,不同信噪比下的识别性能测试结果如表3所示。结果表明:网络在原信道数据集上的测试具有极高的识别性能(整体上超过90%),但采用经瑞利衰落效应后的新数据对网络进行测试时,其识别性能最高仅达41%,所提网络对时变系统的识别效果性能极差。因此,对新信道环境下的信号进行调制识别时,需要使用新信道环境下的训练数据对网络进行重新训练以更新网络参数。然而,如果完全重新训练网络,不仅需要的数据量庞大而且时间成本会急剧上升,不能满足实时性要求较高的场合。鉴于此,采用迁移学习技术,采用新环境下的训练数据对网络参数进行微调,利用部分调整后的神经网络进行调制识别[23]。
表3 信道变化条件下的网络识别性能对比
2.2 迁移学习策略选用
迁移学习理论是对源域与目标域两者之间的数据相关性进行研究。本文中,结合神经网络的深度迁移学习使用源域即原始信道的数据对所搭建的网络进行训练、测试,当所在域发生变化时,原先已训练好的网络对于目标域即在新信道下的分类识别效果极差。这时,利用少量目标域中的样本数据对源域中已训练好的网络进行网络微调,以此完成神经网络的迁移学习。在这里,源域和目标域两者之间的相似性主要体现在信号数据的无线电特性、数据分布是保持一致的。这也是为什么迁移学习能够解决信道环境改变时的网络性能恶化问题。本文针对基于神经网络的深度迁移学习提出3种迁移学习方式:1)微调网络所有层权值;2)网络全连接层权值不变、微调卷积层权值;3)网络卷积层权值不变、微调全连接层权值。
1)网络微调的数据集规模。
文中在不同训练数据集样本规模下分别测试网络识别性能,据此确定迁移学习所需的最少样本数。具体上,分别利用4000(1.5%)、6000(2.3%)、13000(5%)、26000(10%)、52000(20%)、86000(33%)、260000(100%)规模的训练数据进行网络训练后的识别性能如图6所示。结果表明,当采用86000个样本构成的微调数据集时,网络的平均识别性能超过90%,与采用全部数据集(260000个样本)对网络进行重新训练后的网络平均识别性能相当,但重新训练网络所需要的运算时间却增加了将近4倍,为此,在后续迁移学习策略选取中,微调数据集样本数为86000个。
图6 不同大小的微调数据集下网络的识别精度
2)不同迁移学习方式下的识别性能。
基于上述3种迁移学习方式,进一步利用微调数据集对DeepResNet-RF网络进行迁移学习,获得的识别性能结果如图7所示。结果表明,采用网络全连接层固定,对卷积层的权值偏置进行微调的迁移学习方法,其对于不同场景下的新数据识别效果最好。导致这一现象的原因是因为网络卷积层所需训练的参数量较少,采用较小的训练集能满足卷积层参数进行微调的要求,而全连接层所需要训练的参数众多,仅采用少量数据集对其进行调整,不足以完成网络的权值微调。另外,DeepResNet-RF网络特征提取主要由卷积层所决定,若仅对全连接层进行权值更新则无法达到网络的微调效果,故第2种迁移学习方法优于其他2种迁移学习方法。
图7 不同迁移学习方式的识别性能
3 实验结果与分析
3.1 网络泛化能力验证
为证实所提DeepResNet-RF网络的识别性能,本文采取表2中的网络结构进行训练。DeepResNet-RF网络的损失值随迭代轮次变化的曲线如图8所示,从图中可以发现,网络迭代次数在接近30次时,认定网络已训练好。虽然网络的损失值处于震荡的形式,但其数值总体上呈现下降的趋势,这表明网络的学习性能良好,鲁棒性高。
图8 网络损失值随迭代轮次的变化曲线
本文分别对边界信噪比(SNR=-4 dB和SNR=12 dB)条件测试了所提网络的识别性能。测试结果表明,所提的DeepResNet-RF网络在-4 dB信噪比场景下对不同调制类型信号的识别效果存在一定的差异,整体识别性能约为90%。当信噪比逐渐增加时,网络的识别性能不断提升,当信噪比达到12 dB时,DeepResNet-RF网络在训练数据集上的识别精度达到100%,从而证实本文所设计网络的有效性。
为进一步验证网络识别泛化能力,在相同信道响应条件下,采用未参予网络训练的新数据对已训练好的网络进行测试,分析不同信噪比下所设计网络的整体识别性能与每种调制信号的识别准确度,测试结果如表4所示。研究结果表明:所提网络在低信噪比(-4 dB)场景下对于特定的几种调制信号的识别效果不佳(如DQPSK、16QAM等),但整体识别性能达到94%。随着信噪比逐渐增加,网络的识别性能不断提升,当信噪比达到12 dB时,网络的识别精度达到100%,网络在测试数据集与训练验证集上的网络识别性能相当,证实了本文所设计的信号调制识别网络具有良好的泛化能力。
表4 信号调制类型识别性能
3.2 信号调制识别性能对比
在信号调制识别性能对比实验中,基线对比网络结构如表1所示,DeepResNet-RF网络结构如表2所示。在网络训练过程中,CNN网络训练参数与DeepResNet-RF网络训练过程中的损失函数、优化器、学习率、模糊因子、训练数据样本数和测试数据样本数完全相同。CNN网络和DeepResNet-RF网络的批量样本数目分别设为500和1000。
1)网络识别性能对比。
在完成上述2种网络的训练后,采用测试数据集对网络的识别性能进行测试,在训练数据集上的网络识别性能与迭代轮次的性能曲线以及网络在不同信噪比下的识别性能分别如图9和表5所示。当网络训练的迭代次数达到30轮时,CNN网络与所提网络在训练集上的识别性能均超过95%,但随着迭代次数增多,所提网络识别性能优于CNN网络的识别性能。
图9 网络识别性能与迭代轮次的性能曲线
表5 网络在不同信噪比下的识别性能
根据表5可知,所提网络在-4 dB信噪比下的识别精度达到76.4%,而CNN网络的识别精度仅为64%。本文所提网络在4 dB信噪比下的识别精度接近于100%,而CNN网络的识别精度最高也仅达到80%,因此,无论在低信噪比还是在高信噪比场景下,本文所提网络的识别性能都要优于CNN网络的识别性能。
2)基于迁移学习的网络识别性能。
基于瑞利衰落数据对已完成迁移学习的网络进行测试,仍然以边界信噪比为例进行“包线”测试,结果如图10所示,在-4 dB信噪比条件下,网络的识别精度整体约为78%左右,而在12 dB信噪比条件下,网络的识别精度接近于100%,与重新训练网络所达到的识别精度近乎一致。
(a) SNR=-4 dB
4 结束语
本文针对无线电信号数据特点设计了一种适用于无线电信号调制识别且结构紧致的轻量级神经网络,实现了从原始基带I、Q数据到信号调制类型输出的端到端识别。在此基础上,利用迁移学习技术降低了网络训练所需的样本数目,增强了所提网络在无线信道响应发生变化时的环境适应能力,减少了训练所需的硬件资源需求和训练数据集规模。在所构建的信号调制类型数据集上的识别性能测试表明:信道响应改变时,所提信号调制识别神经网络在信噪比为12 dB条件下的识别性能达到了95%,通过对比实验证实了所设计网络的识别性能优势。下一步的主要工作是构建全部外场实测数据集,进一步验证和改善网络在实测场景下的稳健性。