基于深度残差网络的自动调制识别方法研究
2021-11-18张婷婷方宇强
张婷婷,方宇强,韩 蕾
(1. 北京特种工程设计研究院,北京 100028;2. 电子信息系统复杂电磁环境效应国家重点实验室,河南 洛阳 471003;3. 航天工程大学,北京 101416)
1 引言
通信信号调制识别就是通过对接收信号进行一系列信号处理后获取信号的调制方式的过程,其基本目的是为选择合适的信号解调器提供依据;自动调制识别在军事和民用领域上均具有一定的意义和价值,一直是研究的关注热点。目前常见的方法多采用“人工特征”结合统计模式分类器的方式实现识别过程,这种方式对信号特征的提取依赖于专家的人工设计,如常用的正交变换、高阶累积量、延时相关和瞬时自相关特性等[1],然后对特征进行分类。近年来,这种“人工特征”的方法在语音、图像识别领域已经逐渐被以深度学习为代表的自动特征学习或表示学习方法所取代,基于数据本身,利用深度神经网络得到特征表示和分类的端到端模型已经成为发展的趋势[2]。而今年来利用深层神经网络对自动调制识别的研究也逐渐兴起,如文献[3-6]采用经典的卷积神经网络实现了调制方式的识别并得到了较好的识别效果。但是从递归、卷积等结构多角度的考虑电磁信号序列表示问题的研究相对较少。为此,本文针对信号调制识别的深层神经网络方法开展研究,对序列信号表示的递归神经网络、卷积神经网络等不同网络结构的表示能力进行研究,并提出基于双向GRU网络和深度残差网络的自动调制识别方法。在建立的包含9种不同调制模式的仿真信号数据集上,对不同算法进行了对比分析,实验结果表明了提出方法的有效性,为电磁信号调制识别问题提供了新的数据驱动解决思路。
2 基本方法
该部分首先描述通信类信号调制识别的数据仿真建模方法,然后分别对提出的基于双向GRU和深度残差卷积网络的自动调制识别方法进行描述。
2.1 通信类电磁信号调制模式仿真
实现端到端的识别方案,首先就要求从数据出发,积累一定的数据以满足模型学习的要求,从足够的数据中挖掘数据特征的表示方式。为此本文首先利用仿真建模方式建立相应的数据集。
考虑加性高斯白噪声AWGN信道下的单信号调制识别问题是调制识别研究的基础,因此,针对AWGN信道下的单信号调制识别应用场景,建立信噪比环境不理想情况下的不同调制方式数据集。
AWGN信道下接收信号的数学模型为
y(t)=s(t)+n(t)
(1)
表1 仿真参数设置
其中生成的信号如图1所示。
图1 AWGN信道不同调制样式信号仿真结果
2.2 自动调制识别的深层神经网络
2.2.1 基于双向GRU神经网络的调制识别
在语音和序列信号处理领域中,递归神经网络RNN是一种常用的序列建模网络,该网络采用递归和权值共享的方式实现序列数据的建模。借鉴RNN的基本思想,本文建立一种多层双向GRU网络模型来实现信号调制样式识别任务。门限递归网络(Gated Recurrent Network)是一种改进的RNN模型[7],引入了门限机制来克服训练过程中长记忆模型的梯度消失,同时门限单元的引入对序列数据的噪声项有一定的抑制作用,因此在本文算法中采用GRU作为基础模型。本文提出的多层GRU具体的网络结构如图2所示,模型由两部分组成,其中编码器模块由一个输入层、两个GRU隐藏层和一个全连接层组成。为了使训练模型更精确,在GRU隐藏层中采用双向结构。此外,编码器后采用两个全连接层对GRU神经网络进行训练,以提取良好的特征和识别结果。
图2 多层双向GRU网络模型示意图
2.2.2 基于深度残差卷积网络的调制识别
利用1D卷积同样可以建立局部相关性,并可以通过增加网络层数来扩大感受野的范围。为此,论文分别采用了多层感知器(MLP)、卷积神经网络(CNN)进行自动调制识别并进一步提出了针对调制识别的深度残差卷积网络。
采用的多层感知器结构中每一层均采用全连接方式进行传输,ReLU作为隐层的非线性单元,输入为截取的4096长度信号,输出为9类调制方式。
进一步,设计了一种卷积神经网络结构进行测试,结构如下图3所示。该网络结构包含7层,分别采用1*8、1*5和1*3的卷积核进行特征提取,并在最后一层利用平均池化和全连接最为最终输出。训练时采用多分类交叉熵和Adam优化器进行模型优化。
图3 基于卷积神经网络调制识别网络结构
最后,借鉴残差网络在图像识别中的成功应用[8],本文针对调制方式识别设计了一种残差网络结构模型,该模型如图4所示。模型包含三个BLOCK,每一BLOCK由1*8、1*5和1*3的卷积核构成,同时由于层数的增加,为了避免训练中的梯度消失问题,BLOCK中包含了Skip Connect模块来实现训练过程中残差的传递,最后一层利用平均池化和全连接最为最终输出进行分类。训练时采用多分类交叉熵和Adam优化器进行模型优化。该网络结构模型相比MLP和CNN而言层数更加深,针对电磁序列信号具备更好的序列特征表达能力。但由于每一个BLOCK的卷积核相对较少,参数量没有MLP和CNN多,因此具备较高的计算效率。
图4 提出的深度残差网络调制识别网络结构
3 实验分析
依据2.1节的电磁调制信号生成方式,本文建立生成了9类典型的数字通信信号作为实验对象。实验验证中输入为截取的4096长度信号,输出为9类调制方式进行识别。在训练中随机生成5000个噪声强度为5dB的数据集,并选取其中的20%作为测试数据集,剩下的80%作为训练数据集进行神经网络训练。以平均绝对误差来评价训练结果。
3.1 双向GRU神经网络的实验结果分析
提出的双向GRU调制识别网络经过训练后,训练过程如图5所示,模型对这9类调制方式识别性能在90.45%,同时将网络最后一层特征进行2维空间的可视化,可以发现特征具备一定区分度和判别性,实现了较好的数据低维特征提取效果。但是GRU虽然能够达到一定的识别率,但还存在以下不足:面对4096长度的序列建摸中,GRU的在处理较长序列信号时训练显存开销巨大,训练耗时且很难达到最优解;另一方面,GRU层数增加时,模型的训练难度就会增加,因此该模型欠缺对更大规模数据和更多样式数据的表示能力。
图5 基于双向GRU网络的调制识别训练
3.2 深度残差卷积网络的自动调制识别实验
为了对比提出的残差卷积网络模型的效果,首先对MLP模型进行训练和分类效果测试,9类的平均识别准确率仅为76%。可以说全连接网络一方面参数量大,同时识别效果精度一般。其次,选取针对调制方式识别的CNN网络结构(结构图3所示)。从图6上图中可以看出,训练的损失函数不断下降,相比MLP该结构识别效果更好,识别准确率可以达到81%,同时具备更少的参数量。
图6 提出的卷积网络和残差网络调制识别结果对比图
基于提出的残差网络模型,进行调制样式识别的实验,同样的实验设置下,该网络识别结果如图6所示。可以看出,由于采用了残差模块使得训练曲线快速收敛,验证集合精度也不断下降,9类的平均识别率达到96%,明显高于MLP和基本的CNN模型。通过对三种1D卷积深层网络模型的建立和对比,发现提出的残差网络调制识别模型可以较好的完成识别任务。
4 结论
本文利用递归神经网络结构对电磁信号序列进行表示,提出了基于多层双向GRU网络结构。同时,从一维空间卷积表示序列的角度思考,提出了基于深度残差卷积网络的调制识别方法。利用建立的调制方式仿真数据集,对提出的方法与典型神经网络模型进行了对比实验。实验结果表明了本文提出方法具备更高的识别准确率和更好的特征表示能力。未来可以进一步考虑模型压缩和剪枝的方法,再保证准确率的同时提高计算效率。