基于密集连接机制的无线信号调制识别
2023-03-15王安义李立
王安义,李立
(西安科技大学通信与信息工程学院,西安 710054)
为适应复杂多样的信道环境,无线通信中出现了各种各样的调制方式[1]。因此在非协作通信系统中如何准确自适应的识别出接收到信号的调制类型,将对后续的解调译码起到重要前提作用[2]。当前调制识别技术研究主要有:传统的人工特征构造方法和基于深度神经网络的自适应学习特征方法。传统的特征构造方法有基于信号瞬时特征、变换域特征、循环平稳特性和高阶统计特征[3-5]等。以这些特征作为对信号辨别分类的依据,具有易于分析和实现的优点,因此得到了广泛应用[6]。但是该方法对于信号的信噪比要求较高,识别性能受信号特征的影响较大。因此无法满足复杂环境下的调制识别任务[7]。
基于深度学习的调制识别方法避免了人为构造特征的缺陷,由海量的数据驱动内部隐藏层神经网络自适应学习信号特征,并将学习到的特征映射到易于区分的特征空间,最后由网络的输出层进行分类。O’Shea等[8]将通信接收端原始信号的同相正交(in-phase quadrature,IQ)数据作为深度神经网络模型的输入数据,输出就是对应的信号种类标识,该方法采用密集神经网络(dense neural network,DenseNet)对24种调制信号进行分类,当信噪比为10 dB时,正确识别率可达95.6%。自此,基于ResNet的卷积结构模型备受青睐。文献[9]提出了一种改进的ResNet框架对9种雷达时域IQ信号进行识别,在2 dB时,综合识别率达到了90%以上。文献[10]将信号处理为星座图,采用ResNet-50和ResNet V2对高斯白噪声下的振幅键控(amplitude shift keying,ASK)、相位键控(phase shift keying,PSK)、正交振幅调制(quadrature amplitude modulation,QAM)不同阶数的调制信号进行识别。文献[11]针对深度神经网络规模大的问题,提出了轻量级的卷积神经网络降低了模型参数。文献[12]采用信号的幅度和相位二维图像作为神经网络的输入,采用卷积神经网络(convolutional neural networks,CNN)对8种调制方式进行识别研究,结果表明在信噪比为0以上时,比基于IQ数据的识别准确率高2%,这源于信号的幅度和相位信息得到了更直接的表达。除了基于卷积结构基础的调制识别研究外,文献[13]提出卷积和长短期记忆(long short-term memory,LSTM)的组合改进模型,当信噪比为8 dB时,对24种调制信号平均正确识别率超过95%。文献[14]采用卷积结构和双向循环神经网络(bidirectional recurrent neural network,BRNN)结构组合,文献[15]采用卷积结构和基于LSTM的改进门控单元(gate recurrent unit,GRU)组合对公共数据集RML2016.10a进行测试,实验结果分析表明:训练时间过长且在低信噪比下效果较差。
从以上研究工作中可以看出,算法模型的复杂度逐渐变高。以时域IQ信号或二维图像为数据源,存在一定的特征提取受限。而平台则是以软件仿真为主以及选用高斯白噪声信道背景下进行调制识别研究,未考虑真实的无线信号传输环境。针对此问题,现通过GNU Radio 软件无线电开发平台生成仿真数据集,利用两台软件无线电硬件外设HackRF完成实际电磁环境下的通信数据发送接收过程,构建实测数据集进行研究。对于深层神经网络梯度容易消失且模型训练复杂等问题,采用残差块和DenseNet结构对信号特征进行自主学习,进而实现无线调制信号的自动识别分类。此外,还通过数据预处理构建新的IQ数据维数以提高识别精度,达到对通信中常见的调制信号识别的目的。
1 无线通信模型
1.1 基带IQ数据
在实际的无线通信系统中,会根据对无线信道预测的结果动态调整调制编码方案。这些系统所使用到的调制方式有GMSK、BPSK、QPSK、8PSK、16QPSK、16QAM、64QAM、256QAM、4PAM。以上调制信号的数学表达式这里不在此给出,只考虑基带调制信号的时域复包络信息数据。
对于IQ信号数据而言就是数据分为两路,用相互正交的载波分别进行调制(调制原理见图1),然后进行叠加得到输出信号,表达式为
图1 I/Q信号调制原理图Fig.1 Schematic diagram of I/Q signal modulation
s(t)=rI(n)+jrQ(n)=acosω0t-bsinω0t
(1)
式(1)中:rI(n)和rQ(n)分别代表采样点n的同相分量和正交分量;a和b为两路信号数据;cosω0t和sinω0t分别为两路载波。在调制识别的研究中通常将基带数据的IQ向量作为神经网络的输入。
设n0为采样起点,采样点数为N,则IQ数据向量组可记为式(2),如图2所示为QPSK信号的星座图。
图2 QPSK调制星座图Fig.2 QPSK modulation constellation
(2)
通过对比文献[8-15]的仿真结果,可以看出单一且未经处理的IQ数据对QAM调制方式的类内调制识别效果较差。这是因为高阶的QAM调制其IQ数据所对应的星座图中也包含有低阶的QAM调制信息特征[10]。此外IQ数据虽然有着丰富的频域和时域信息且所包含信息量最大,但是IQ没能直接表示出信号的幅度以及相位信息(amplitude/phase,A/θ)。然而基带IQ信号星座图中的A/θ却是信号调制的重要特征之一。因此将IQ数与其计算出的A/θ数据联立组成4×N的向量数据,让神经网络自主学习信号向量数据信息从中获得更加完备的高层特征进行识别。因此选择将IQ与其幅度相位联合作为深度神经网络的输入,其向量矩阵可以表示为
(3)
1.2 接收信号模型
在自然环境中存在遮挡物、电磁干扰会导致无线通信信号传输损耗严重。虽然可以通过增大天线发射功率,提高接收灵敏度以及天线的增益来缓解此问题,但是较大的发射功率是不允许的。此外各类无线发射设备较多,在这无疑是增加了信号检测识别的难度。
无线信道可分为大尺度衰落和小尺度衰落。大尺度衰落对信号传输质量影响较小,并且在一定程度上可以消除。而小尺度衰落在时域上容易导致码间串扰,严重影响信号传输质量。主要针对小尺度衰落信道为基础,研究原始基带信号s(t)经过带有高斯白噪声的多径衰落信道后由接收机捕获,最后通过下变频处理得到基带x(t)可表示为
x(t)=s(t)*h(t)+z(t)
(4)
式(4)中:s(t)为原始基带信号;*为卷积运算;h(t)为复杂信道下的多径响应函数;z(t)加性高斯白噪声。x(t)可更具体地表达为
h(t-τ+εT)dt+zadd(t)
(5)
式(5)中:a为信号幅度;f0和θ分别为中心频率偏移和相位偏移;p(·)为脉冲整形;τ为信道响应时间;h(·)为信道相应;εT为符号定时误差;zadd(t)为加性噪声。
1.3 通信链路
实际的通信链路主要由发端和收端组成,发端过程可简化概括为信源编码、信道编码、载波调制、最后射频发送,接收端是其逆过程。相比传统无线通信系统,当前软件无线电(software defined radio,SDR)技术被业界广泛用来做通信研究,SDR的核心思想是构造一个开放化、标准化、模块化的通用平台,尽可能地将模数转换和数模转换模块靠近射频天线,通过软件程序实现无线信号收发处理功能,SDR通信系统的基本结构如图3所示。
图3 SDR通信系统基本结构Fig.3 Basic structure of SDR communication system
SDR通信系统主要由RF射频前端、中频处理部分以及基带处理部分组成。其中RF射频前端连接空口天线,可完成滤波和功率放大等操作,还能实现射频信号和中频信号的转换。A/D、D/A模块是SDR的重要组成部分,用于完成高频段信号的数字与模拟之间的转换;高速数字处理器(digital signal processor,DSP)或专用可编程门阵列(field programmable gate array,FPGA)通过数字上/下变频完成中频信号和低速基带数据流的转换。基带信号由PC端根据不同任务进行处理,主要完成编码调制等操作。
考虑到本文所研究的通信信号调制识别问题仅需要基本的收发功能即可完成 I/Q 信号的空口数据采集,因此选用HackRF作为软件无线电硬件外设。HackRF承担高频、中频信号的处理工作,而基带信号的调制解调、编解码等操作均由PC端实现,一定程度上降低了开发成本。
2 调制识别网络模型
基于深度学习的调制识别研究过程中,深度学习作为实现分类任务目标的算法基础。主要思想就是利用多层感知机网络完成非线性映射,具体通过多层的感知机网络自主的找到训练数据与其标签数据的映射关系。这一过程也可以称之为特征学习或特征表达过程。和传统的机器学习以及决策算法相比减少了人为设计特征的过程。文献[9-15]大多都是利用深度学习里面的算法模型对普通加性高斯白噪声环境下的无线调制信号进行识别研究。因此本章主要研究如何改进模型结构提升真实多径无线信道环境下的调制信号识别率。
2.1 卷积网络结构
基于信号IQ数据的调制识别方法中,大多研究者将卷积层作为网络模型的基本结构单元[6-15]。这主要源于卷积层能够较好地提取数据的局部特征并且权重共享,尤其是对无线信号而言卷积层处理对应的是频域特征。
当IQ数据维数为2×5,对其进行卷积(2×2)、池化(1×2)过程结果如图4所示。最大池化过程将最大的特征值保留下来其他的舍弃掉,因此可以有效的给数据降维,减少模型参数。常用于调制识别的典型CNN结构模型为残差神经网络(ResNet)[8-10]。残差块的结构如图5所示。
图4 信号的卷积和池化操作Fig.4 Convolution and pooling operations on signals
ResNet 结构在训练过程中主要学习残差映射F(x),这种独特的快捷连接方式并不会给网络模型带来额外参数和计算复杂度。在实际应用中,常串联多个类似图5的残差单元构成深层残差网络,其第l层网络的梯度表示为
图5 ResNet结构Fig.5 ResNet structure
(6)
式(6)中ResNet的梯度比单一的CNN多了一个常数1。有了这个恒等映射可理解为无论何时ResNet都不会发生梯度消失的现象,有效提高了网络模型训练的稳定性。
在图像识别领域中ResNet网络模型的层数最高达到了152层。本文中选50层的残差网络作为对比网络模型,基本结构类型可参考文献[9-10]。
2.2 密集连接结构
ResNet增加一个恒等映射,跳过本层或多层运算,解决了传统的网络会出现信息丢失、梯度消失、梯度爆炸等问题。但是ResNet增加的恒等映射的增加只是使得加深网络深度不会造成梯度消失,不会降低网络性能,但是一味地增加网络深度带来的训练时间开销是难以避免的。因此基于ResNet 以快捷连接实现特征传递的思想,设计一种密集前后连接的结构来保证各层特征的最大流通。
密集连接块是一个3层的复合卷积结构,也可以将密集连接块理解为一个复合的函数集合,由批量归一化(batch normalization,BN)、激活函数、卷积运算组成。其密集连接块结构如图6所示。
图6 DenseNet密集连接块Fig.6 DenseNet connected blocks
由图6可知,假设输入为x0,经过l层的神经网络,DensNet第l层的输出可记作
xl=Hl(x0,x1,…,xl-1)
(7)
根据式(7),对于DensNet而言,l层的输出是之前所有层的输出集合。相比ResNet结构l层的输出是l-1层的输出加上对l-1层输出的非线性变换。由此可见Dense Block每个中间层的输入都是之前各层输出向量的通道维合并特征,每一层的输出协同前层的输出一起传递给后层,促进特征向量的传递。这种独特的特征重用方式不仅使网络能够学习到更丰富的浅层特征信息,同时避免了网络训练时产生的冗余特征,进一步缓解了梯度消失问题。
2.3 基于DenseNet调制识别模型设计
一般基于深度学习的调制识别过程主要由信号数据预处理、自适应学习特征提取、特征融合和特征分类等过程。本文设计DenseNet模型,参考了基于图像处理的密集块网络结构和ResNet模型的优点。并增加调制信号IQ的数据的维度。将基带的IQ数据制作为4×N的向量矩阵,经数据预处理过后制作做成为数据集。以4×N的维度作为网络模型的输入维度,网络模型经损失函数每轮次的计算和反向调整得到最优的模型权重参数,最终达到调制识别泛化的性能要求。
本文DenseNet模型设计了含有3个密集块的DenseNet结构。初始卷积层设计为1×3步幅为1卷积,如图7所示。
图7 DenseNet网络结构模型Fig.7 DenseNet network structure model
(1)信号预处理。主要对接收到的射频信号进行基带处理,按1.1节将IQ数据再增加幅度和相位角信息。
(2)特征学习提取模块。将经过信号预处理数据输入网络模型,由第一层卷积对数据维度进行降维处理减小规模,后续依次进入密集连接块和卷积池化层,密集连接块主要对信号的数据特征空间进行学习,将大量的学习特征集合通过卷积池化进行降维处理以及进行融合,以此得到最关键的特征信息。
(3)全连接层分类。将特征向量映射至输出空间。最后使用Softmax激活函数实现不同调制样式的分类。
3 仿真实验与结果分析
3.1 软件无线平台搭建
基带数据处理由GNU Radio完成,产生动态衰落信道模块包含莱斯多径衰落和加性高斯白噪声。具体的数据集参数如表1所示。
表1 数据集参数设置Table 1 Dataset parameter settings
按照表1中生成数据,硬件配置为两台HackRF 外设用于数据收发,两台计算机,用于数据处理。如8所示。
图8 实际数据采集场景Fig.8 Actual data collection scenario
首先在发射端通过 GNU Radio完成调制信号基带数据处理,再将信号通过USB接口传送至HackRF进行数字上变频得到中频信号。中频信号经D/A转变为模拟信号,完成信号的功率放大和滤波,送入射频电路将高频电波通过天线发出。接收端完成发射端的逆过程,得到数字基带信号。将接收端所处理的基带信号的IQ信号的实部和虚部将IQ数据转化A/θ数据并联立组成4D-IQ数据。
3.2 实验仿真分析
本节实验仿真平台:计算机配置(CPU为i9-9900k,GPU为双RTX2080Ti,内存为32 G),采用TensorFlow2.0和Keras作为深度学习软件仿真平台完成训练并测试,最终将测试结果数据由MATLAB2020a进行数据结果可视化展示。
3.2.1 基于2D-IQ传统神经网络模型的对比
如图9所示,在对比实验中:CNN模型的框架设计源于文献[11-12]的轻量级卷积模型结构。LSTM模型根据参考文献[13]的两层LSTM结构。CLDNN网络模型根据文献[14-15]的卷积结构和LSTM的变体结构复合模型设计出的串行3种结构模型(CNN、LSTM、DNN)。由图9基于2D-IQ的传统模型识别效果对比可知,LSTM模型的识别率比CNN模型的识别率高,这源于LSTM模型适合更适合处理含有时间序列相关和延迟相对较长的通信信号数据。将CNN模型和LSTM模型结合出的CLDNN模型,有着比两者更好的识别效果,这里采用的LSTM与文献[15]里面门控循环单元(GRU)相比更适合处理海量的通信IQ数据。图9反映了传统深度学习网络与组合神经网络结构的调制识别性能。通常除了改变算法模型的方法来提高识别率,还可以对输入数据预处理达到同样目的。本文通过增加IQ数据的维度提高识别率,对比实验如图10所示。
图9 传统神经网络模型的对比Fig.9 Comparison of traditional neural network models
3.2.2 2D-IQ和4D-IQ实验对比
如图10所示,根据4D-IQ和2D-IQ识别效果对比可知,在引入A/θ信息后ResNet和DenseNet模型的识别率在整个信噪比区间都有提升,使用4D-IQ数据的模型识别率提升了10%。在5 dB时,本文中设计的DenseNet对9种调制信号的平均识别率可以达到90%以上。进一步结合本文输入数据维度设计文献[9-15]中的深度学习调制识别模型,其中文献[10]是以信号的星座图像作为神经网络的输入,文献[12]是以幅-相域的二维图像作为输入,这两个文献中的模型无法直接作为本文的数据的实验对象,因此通过改变模型输入层配置参数,进而完成文献中的模型与本文所提模型的对比。表2~表4分别为3种信噪比下的对比结果。
图10 4D-IQ和2D-IQ识别效果对比Fig.10 4D-IQ and 2D-IQ recognition effect comparison
由表2~表4可知在同一模型下4D-IQ数据的识别效果要好于2D-IQ的识别效果。在同一数据集下本文所提出的DenseNet模型识别效果最优。进一步对比算法模型的时间开销,统计模型的参数数量P和迭代一次的时间t,如表5所示。
表2 信噪比为-10 dB下的识别率Table 2 Recognition rate when the signal-to-noise ratio is -10 dB
表3 信噪比为0时的识别率Table 3 Recognition rate when the signal-to-noise ratio is 0
表4 信噪比为10 dB下的识别率Table 4 Recognition rate when the signal-to-noise ratio is 10 dB
表5 模型性能参数表Table 5 Model performance parameter table
根据表5可以看出ResNet模型参数最多,达到了23万,迭代一次的训练时间为951 s,通过结合对比各类模型的识别效果,本文所提出的DenseNet模型具有一定优势。
3.2.3 基于4D-IQ的模型性能实验对比
根据图11可知,采用改进的4D-IQ作为训练数据,本文所提的DenseNet算法模型对多径信道下的九种调制信号整体平均识别率要远高于ResNet、CLDNN和CNN模型。在-10 dB到0的信噪比下DenseNet网络模型的识别性能整体效果要比CNN和CLDNN模型的识别率高10%左右。尤其在-10 dB到0低信噪比下DenseNet模型的识别率有较大的提升。
图11 基于改进IQ算法不同深度学习网络模型性能Fig.11 Improved algorithm recognition rate
4 结论
基于软件无线电硬件平台HackRF和GNU Radio对所设计的DenseNet调制识别模型进行了分析,得到如下结论。
(1)基于4D-IQ数据下的CNN、ResNet、CLDNN和DenseNet调制识别模型对多径信道低信噪比下的九种调制信号平均正确识别率都比2D-IQ数据下的识别率高。
(2)改进后的DenseNet模型进一步提高了对通信IQ数据特征提取的能力,能够从多径无线信道低信噪比下的噪声中学习到信号特征,从而提高了在低信噪比下的识别率。