基于GRU-CNN并联神经网络的自动调制识别

2021-11-30向建,高勇

电讯技术 2021年11期

向建,高勇

(四川大学电子信息学院，成都 610065)

0 引言

自动调制识别是频谱感知、电子对抗和防御等领域中的重要技术之一[1-2]。传统的基于人工提取特征的调制识别算法分类精度不如预期。近年来，研究人员采用基于深度学习(Deep Learning,DL)的自动调制识别(Automatic Modulation Recognition，AMR)算法极大地提高了对输入数据提取高维特征的能力，从而使通信系统能够以更高的精度识别复杂多样的调制方式[3]。

业界学者已经提出了许多基于DL的AMR方法。文献[4]对调制信号的同相和正交分量(IQ)数据进行仿真实验，展示了卷积神经网络、残差网络(ResNet)等网络结构进行调制分类的性能，得出分类精度不受网络深度的限制的结论。随着基于深度学习的AMR方法的发展，研究人员开始从数据预处理和深度学习模型改进两方面来提高分类性能。文献[5]提出将IQ数据转换为振幅和相位信息，在使用长短期记忆网络(Long Short-Term Memory，LSTM)模型的试验中取得了相对于IQ数据更好的效果，突出了数据预处理和适当的数据表示的重要性。文献[6]提出用二值星座图表示调制信号，并用灰度图像和三通道图像优化星座的表示。文献[7]采用星座图对难以区分的调制方式如16QAM和64QAM进行分类，提出用密度窗来捕获这两种调制模式的数据分布差异。实践中仅使用单一网络进行调制分类对提高分类精度有一定限制，文献[8]提出了卷积神经网络(Convolutional Neural Network,CNN)和LSTM神经网络并联的网络结构，将原始IQ数据直接送入，可在较低信噪比下取得较好的识别率。

本文提出一种新的基于并联GRU-CNN神经网络的AMR方法。首先，对IQ数据进行极坐标转换，同时对IQ数据做自相关处理；然后，将极坐标下的数据送入GRU网络，自相关序列送入CNN网络；而后将两个网络的输出拼接起来，最后进行调制方式分类。经实测信号测试，本文所提方法在低信噪比下对8种相位调制或正交振幅调制信号都能取得较高的识别率。

1 系统模型

1.1 调制信号模型

本文主要讨论目前通信过程中常见的相位调制和正交振幅调制信号，包括BPSK、QPSK、8PSK、π/4-DQPSK、16QAM、32QAM、64QAM和128QAM。信号的基带波形可以表示为

(1)

式中：sn表示发送端所发送的第n个符号，g(t)表示等效滤波器，w(t)表示零均值的加性高斯白噪声。不同的调制方式，符号序列呈现的样式也不同。

对于PSK类信号，有

(2)

对于QAM类信号，有

sn=an+jbn。

(3)

本文在接收端得到的符号序列表示为

X(n)=I(n)+jQ(n) ，

(4)

因此，

(5)

(6)

那么IQ采样信号就可以表示成一个2行L列的实值矩阵：

(7)

1.2 GRU神经网络

门控循环单元(Gated Cycle Unit，GRU)是循环神经网络(Recurrent Neural Network,RNN)的一种，能使每个循环单元适应性地捕获不同时间范围的依存关系。与LSTM一样，GRU也是为了解决RNN长期记忆和反向传播中的梯度消失与梯度爆炸问题而提出的。如图1所示，类似于LSTM，GRU也具有门控单元，用来调节单元内部的信息流，但是它比LSTM少了单独的存储单元。

图1 门控循环单元

(8)

(9)

式中：σ是Sigmoid函数。在现有状态和新计算的状态之间进行线性求和的操作类似于LSTM，但是GRU不采用任何机制来控制其状态暴露的程度，而是每次都会暴露整个状态。在传统循环单元中，其隐层单元可用如下公式计算：

ht=g(Wxt+Uht-1) 。

(10)

(11)

(12)

这些单元之间共享的最显著特征是它们从t更新到t+ 1的加性成分，这是传统循环单元所缺乏的。传统的循环单元始终使用根据当前输入和先前的隐藏状态计算出的新值来替换激活的数值或单元的内容。

另一方面，GRU保留现有内容并在其之上添加新内容(见式(8))。这种加性具有两个优点：首先，很长一段时间，每个单元很容易记住输入流中存在的特定特征，由GRU的更新门决定的任何重要功能都不会被覆盖，而是保持原样;第二，也更重要的是，这样的操作只取本时刻和前一时刻的值就可将单元更新，使误差容易反向传播，而不会由于通过多个有界非线性单元而过快地消失，从而降低了由于梯度消失造成的困难[9-10]。

GRU神经网络在调制识别中面临的问题在于其只考虑到信号的时序关系而没有考虑到星座点的空间结构。

1.3 CNN神经网络

基于CNN的AMR是近年来发展起来的一种新的调制分类算法[11-13]。一个简单的CNN模型由输入层、池化层、完全连接层和输出层组成。卷积层主要用于提取输入数据的特征，并在下一步进行处理。池化层可以在一定程度上降低特征维数，避免过拟合。完全连接层在整个CNN模型中充当分类器，它利用前几层的结果对输入数据进行分类，实现CNN模型的功能。CNN中除输入层外的每一层都需要一个合适的激活函数。本文中激活函数一律采用Mish：

f(x)=x×tanh(ln(1+ex)) 。

(13)

Mish上无边界(即正值可以达到任何高度)的特点避免了由于封顶而导致的饱和，其理论上允许轻微负值梯度流的存在。同时，平滑的激活函数允许信息更好地深入神经网络，从而得到更高的识别准确率和泛化能力。

CNN神经网络在调制识别中面临的问题在于只考虑了星座点的空间结构而没有考虑到信号最主要的时序特点。

1.4 GRU-CNN并联神经网络

不同的神经网络有着各自独特的提取特征能力。CNN使用卷积核提取表示空间局部的特征，GRU更适合于处理时间序列数据。受文献[5]、[8]和[14]启发，结合GRU和CNN各自的优势，具体而言，CNN用于提取空间局部相关特征，而GRU用于提取时间特征，本文将GRU与CNN并联，应用于调制识别的研究中，如图2所示。

图2 GRU-CNN并联网络结构

2 调制识别方法模型

2.1 信号的自相关预处理

在CNN网络模型中，我们使用了基于序列自相关的方法进行输入信号预处理。

自相关描述的是一个信号在不同时刻的相似程度，所以是一个序列的前后样值相关。对信号求其自相关序列，其局部也含有了整体的信息，这可以用来弥补以往认知中的CNN感受野(Receptive Field)不足，只针对局部信息而不包含总体信息的问题。自相关函数的定义如下：

(14)

将式(4)代入式(14)中得

[I(n+m)+jQ(n+m)]=

j[I(n)Q(n+m)-Q(n)I(n+m)],

(15)

则自相关序列的实部和虚部分别为

I(n)I(n+m)+Q(n)Q(n+m)′，

(16)

I(n)Q(n+m)-Q(n)I(n+m)。

(17)

容易证明

(18)

(19)

由式(14)～(19)可以得出，经过自相关函数，序列长度增加一倍，对于复数来说，其自相关函数是厄尔米特(Hermite)函数，即实部是偶对称序列，虚部是奇对称序列。所以IQ数据经过自相关函数后得到的序列中有一半是重复的信息，在本文中我们只取后半段。

2.2 信号的极坐标转换预处理

将原始笛卡尔坐标系下的IQ数据转换到极坐标下，作为GRU的输入。极坐标下的极径和极角[5]分别为

(20)

(21)

式中：R(n)和P(n)分别代表调制信号的幅度和相位。转换坐标系的原因在于注意到时间记忆网络的特点，其能够在极坐标下更敏锐地察觉到PSK和QAM信号关于相位和振幅的变化规律。

2.3 GRU-CNN并联网络结构

网络结构见图2，其中GRU的输入为2×200的原始IQ数据转换到极坐标下的数据，极径采用L2范数归一化，极角归一化到-1～1之间，采用的是两层均为128 unit的GRU，后接一Dense层。输入CNN的数据为IQ数据的自相关序列X′，格式为2×200的矩阵。采用两层CNN，卷积核个数均为64，kernel size分别为2×7和1×7，步长都为4。两个网络的权值均采用Xavier初始化方法[15]，其保证了各层的激活值和状态梯度的方差在传播过程保持一致，使得信息在网络中更好地流动。

3 算法仿真及性能分析

3.1 仿真数据集及环境

待识别信号集包括BPSK、QPSK、8PSK、π/4-DQPSK、16QAM、32QAM、64QAM和128QAM，实验数据采集自一发一收的两台NI USRP-2930软件无线电设备。如不作特殊说明，本文试验中的训练集为以上提到的8种调制信号，载频915 MHz，成形滤波器采用滚降系数为0.35的根升余弦滤波器，码速率500 ksymbol/s，IQ采样率2 MHz，每种调制信号均含35 000个长度为200的样本，信噪比为-10～20 dB范围内的随机带内功率信噪比。测试信号集是与训练信号集相独立采集的，每种调制信号在-10～20 dB、间隔为2 dB的每个信噪比下采集1 000个长度为200的样本，码速率为500 ksymbol/s。

3.2 评价指标

识别准确率(Pc)作为本文所提出方法分类识别性能的指标，定义为

(22)

式中:Tc为正确识别样本量,TA为总测试样本量。

3.3 实验结果及分析

3.3.1 预处理对GRU-CNN并联网络识别性能的影响

图3是有预处理和使用原始IQ数据的GRU-CNN并联网络识别率曲线，可以看出经过本文采用的预处理方法，低信噪比下识别率有很高的提升，在-2 dB和0 dB时8种信号的统计平均识别率提升了25%以上。

图3 GRU-CNN在原始IQ和预处理下的识别率

8种调制信号在不同信噪比下码速率为500 ksymbol/s时的详细的识别率如图4所示。训练好的网络具有一定的泛化能力，可以适应码速率为150 ksymbol/s、250 ksymbol/s、600 ksymbol/s的测试数据。测试结果表明，识别率与码速率为500 ksymbol/s时相当，限于篇幅，此处不再列出结果。