基于多端卷积神经网络的调制识别方法
2019-12-03查雄彭华秦鑫李广李天昀
查雄,彭华,秦鑫,李广,李天昀
(信息工程大学信息系统工程学院,河南 郑州 450001)
1 引言
信号的自动调制识别[1-2]是指已知信号所在调制集合,利用相关技术正确识别目标信号调制类型。其作为通信侦察和信号盲处理领域的一个重要研究课题,在很多领域都有相当大的需求。随着通信技术的发展,各种新型调制方式不断出现,调制识别技术也需要不断发展以适应不同情况下的识别要求。
自动调制识别方法中,以信号的相位、频率和幅度等时域信息作为特征的方法运用较广[3],但其受噪声影响较大,在低信噪比情况下性能严重下降。基于高阶统计量的方法,如利用信号的高阶累积量[4-5]或循环谱[6],具有很好的抗噪声性能,但特征的选取缺乏理论指导,且在处理复杂多类调制信号识别过程中决策阈值难以设定。
相对于传统人工设计特征的算法,深度学习技术由于其自学习能力以及对样本潜在的容错性,在语音、图像领域取得了突出成就[7]。近年来,从事通信领域的研究人员也逐步利用深度学习技术来解决信号处理相关问题。在调制识别领域,主要思想为建立信号的浅层特征表达,并构建深度学习网络对样本进行学习。例如,直接利用深度学习技术对信号波形数据进行学习[8],但该类算法未利用信号本身固有先验知识对信号进行特征变换,直接对样本进行全盲训练,识别效果并不理想。基于星座图的深度学习算法[9],在一定程度上引入了信号本身的先验信息,对信号的波形数据降采成符号序列,并重组形成星座图。该算法较基于波形的深度学习算法性能有进一步提升,但其过多地损失了信号的波形信息,样本难以反映信号在时序上的相位跳变信息。因此,算法在性能上仍有一定的提升空间。
本文在已有调制识别算法研究的基础上,构建了基于眼图和矢量图的调制信号浅层特征表达形式,在尽可能保留信号原始信息的同时,充分利用了信号不同维度的调制信息。这些预处理过程将信号的调制特性与神经网络的拓扑结构有机地相结合,相对于基于星座图算法更能加速网络对信号的认知。基于此,本文提出了一种基于多端神经网络的调制识别新方法,实现了对样本不同维度的特征学习与融合。通过初步实验证明,所提算法较传统算法以及现有基于深度学习的处理手段在抗噪声上有一定的优势。相对于传统算法,本文算法克服了人工提取高维统计特征稳健性差等缺陷,样本获取复杂度低,自动化程度高。
2 信号模型
2.1 信号时域表达
本文主要讨论目前通信过程中常见的幅相调制信号,包括BPSK、QPSK、OQPSK、8PSK、16QAM、16APSK、32APSK 和64QAM。信号的基带波形可以表示为
其中,v(t)表示加性高斯白噪声;g(t)表示等效滤波器,包括成型滤波、信道滤波和匹配滤波;an表示发送端所发送的符号序列。不同的调制方式,符号序列呈现的样式也不尽相同。
对于PSK 类信号,有
对于QAM 类信号,有
其中,M表示调制进制数。
对于APSK 类信号,有
其中,rk为第k个圆的圆周半径,nk为第k个圆的星座点数,θk为第k个圆的初始相位偏移。在本文实验过程中,APSK 类信号采用DVB-S2中定义的标准[10],16APSK 内外环数比为4:12,32APSK 内中外环数比为4:12:16。OQPSK 信号作为QPSK 信号的改进,在正交两路的码流的传输时间上错开半个符号周期,因此信号的相位只能跳变0°或±90°,而不会出现QPSK 中±180°的相位跳变。
2.2 信号眼图以及矢量图
本文结合已有对信号的相关认知,将信号转化为更适合神经网络拓扑结构的样本表达形式。基于此,本文采用信号眼图和信号矢量图作为样本表达形式,该表达形式相对于传统的高维统计特征而言更易获得,且不会损失过多的信号原有信息。相对于波形而言,该表达形式更能够突出信号的调制特性,更易于神经网络进行分类。
信号眼图,最早是指利用示波器观察信号基带波形,当示波器水平扫描周期和接收信号的符号周期一致时,示波器上所呈现的画面。在通信信号处理过程中,眼图通常作为一种定性反映码间串扰和噪声水平的手段,通过眼图可以调整接收滤波器,以此改善系统性能。另一方面,由于调制信号本身的特性,不同的调制方式在眼图上具有很明显的视觉差异。如图1所示,由于调制进制的不同,不同信号眼图中眼的个数也不尽相同。OQPSK 由于正交两路信号在时间上错开半个符号周期,不同于其他调制信号眼图睁开的位置都是同时出现,其眼图张开的位置总是错开出现。APSK 类信号由于内外环半径不同,在眼图中,眼张开的程度不一致。
图1 各调制信号的I 路眼图、Q 路眼图和矢量图(15 dB)
信号矢量图,是指将信号I 路和Q 路波形以对应时间进行重组得到的符号轨迹,与信号的星座图类似,但相对于星座图而言,矢量图能够反映信号的相位信息,在矢量图上可以很明显地看出QPSK 和OQPSK 的区别。由于OQPSK 无180°的相位转移,其矢量图中不存在类似QPSK 矢量图中的符号轨迹,十分适合用于区分QPSK 信号。由于星座图中不包含相位变化信息,导致其难以对信号进行区分。
由于眼图和矢量图在不同层面反映当前调制信号的特性,本文选取信号I 路眼图、Q 路眼图和矢量图作为神经网络的输入数据,并通过构建多端卷积神经网络,实现信号的调制分类。
3 识别算法
3.1 多端卷积神经网络
卷积神经网络(CNN,convolution neural network)[11]作为一种特殊的人工神经网络,由于其良好的特征提取特性,近年来逐步应用于通信领域。其通过结合局部感知、权值共享、池化降采和非线性映射等对数据特征逐层提取并高度抽象,从而进行后续工程应用。卷积神经网络每一层由多个二维平面组成,称为卷积层。每个二维平面由卷积核和偏置构成,采用权值共享[11]来减少网络参数规模。经典的卷积核如拉普拉斯算子、反锐化掩模等,具有旋转不变性可以提高细节及边缘的可视性,从而实现定位。梯度类的卷积核如水平算子、垂直算子和Sobel 算子,在重要的变化方向可增强小台阶及其他细节的可见性。由于不同的卷积核能够实现不同的特征提取功能,卷积神经网络设置一系列可训练的核,通过对样本的学习理解,最终形成最适应该环境的特征提取核。
本文所设计的多端卷积神经网络结构如图2所示,对信号特征的提取主要分为3个阶段。第一阶段,卷积神经网络分别对I/Q 路眼图和矢量图进行7×7的卷积处理。而后对第一层网络输出的特征图进行批量标准化(BN,batch normalization)[12],从而保证每层神经网络输入特征图的动态范围统一。对批标准化后的数据进行最大池化(max pool)操作,以减少特征图尺寸。之后对I/Q 眼图所得到的特征图进行连接。第二阶段的特征提取过程中,为消除网络过深导致的退化现象以及使网络更快地收敛,本文采用了残差网络(ResNet,residual network)[13]结构中的ResNet-v1结构,基本结构如图3所示。经过第二阶段的特征提取,对各端特征图连接,进行第三阶段特征提取。由于初始图片经过卷积神经网络一系列的下采样,在第三阶段的批标准化后,直接对特征图进行全局最大抽样处理,以减少后续网络所需训练的参数。网络除输出层采用Softmax 激活函数外,其余各层皆采用ReLu 激活函数。网络优化过程中,采用Adam 算法进行网络参数的最优解求解。
3.2 训练数据集的生成
本节主要介绍训练样本集的生成,图4为本文样本库构造流程。为了使样本更具多样性,考虑到实际接收信号存在多方面因素的影响,样本产生过程中人为引入采样相偏、频偏相偏。在研究初期,为了更好地控制信号的质量,信号集利用Matlab平台产生。
图2 多端卷积神经网络结构
1)特定调制模式与随机比特数据
本文所需识别的调制类型集为{BPSK,QPSK,OQPSK,8PSK,16QAM,16APSK,32APSK,64QAM}。每次生成样本时从该集合内随机选取调制类型,并生成该调制类型所需的比特流数据。
图3 残差单元基本结构
图4 样本库构造流程
2)标准信号的生成
采用根升余弦成型滤波器形成标准样本,过采倍数为32,滚降系数为0.35。
3)随机采样相偏
考虑到实际信号采用过程中可能存在的定时偏差,因此在仿真信号过程中,人为引入定时偏差。定时偏差值在一定范围内随机取值,且单个样本在其持续时间内,定时偏差值一致。
4)随机频偏相偏
同样地,考虑到实际参数估计过程中对载频估计的不精确,在仿真信号过程中,人为引入频偏相偏。其取值的选取同采样相偏过程。
5)高斯信道
本文针对的是卫星通信系统,信道采用高斯信道。而后利用根升余弦滤波器进行匹配滤波,得到目标信号。
考虑到传统的眼图和矢量图都为二值图像,未将信号在某一位置的聚集程度进行完整的考虑。基于此,本文对传统的眼图和矢量图进行改进,将信号转化为基于灰度图像的眼图和矢量图,将信号在某一点的聚集程度反映在图像灰度值上。具体生成过程如下:为更好地反映信号的时序结构,本文选取4个符号为一组波形对眼图进行生成,信号采用32倍过采,每幅图片由800个符号构成。眼图横轴像素点与波形持续时间相对应,从而保证图片在横轴的连续性。为实现后续不同图片特征图能够更加方便地进行连接,对信号幅度在[-1.05,1.05]范围内进行4×32间隔的量化,每个像素点的值为落在该像素区域内样本点的个数。为使图像内细节更加突出,对图片进行如下操作
其中,Im0为原始图像,I1m 为增强后的图像,α为缩放因子。
3.3 算法识别流程
根据前面的分析,本文算法流程如下。
1)构建网络模型,利用预先制作好的训练样本对网络进行训练,当网络达到稳态时,保存网络。
2)对于目标测试信号,通过傅里叶变换进行载频粗估,并利用包络谱线估计出符号速率,用估计出的载频对信号进行下变频,根据符号速率计算方根升余弦函数进行匹配滤波。
3)若目标信号存在定时偏差,需提取信号在最佳采样位置处的样点值以保证眼图的张开程度,本文参考文献[14]中的非数据辅助的定时估计算法。具体计算式为
其中,L0为符号长度,N为过采倍数,T为采样周期,则为定时抽取后的序列。
4)对目标信号进行采样率变换,得到32倍过采基带数据。对处理好的数据进行归一化和分块处理,对分块完的数据进行眼图和矢量图的呈现。
5)利用所保存的网络对已进行预处理的信号进行调制识别,最终得到信号调制类别。
4 性能测试与分析
本节对调制识别性能进行仿真,待识别调制集为{BPSK,QPSK,OQPSK,8PSK,16QAM,16APSK,32APSK,64QAM}。如不做特殊说明,仿真条件为:符号随机均匀产生且统计独立,成型滤波器和匹配滤波器均为根余弦滤波器,滚降系数在0.2~0.35内随机选取,过采倍数为32,每个样本符号数为800。测试过程中,产生的信噪比范围为0~10 dB,间隔为1 dB,各信噪比下每类信号样本个数为1000。本文实验是在CPU 为Intel(R)Xeon(R)E5-2650 v4×2,GPU 为GTX1080×2,内存为64 GB DDR4的环境下进行的。本文中定义的调制识别性能指标为
4.1 模型总体识别性能
图5为各调制信号的在不同信噪比下的识别结果。从图5可以看出,本文算法在低信噪比下仍能取得较好的性能,64QAM 由于本身的复杂度,识别效果与低阶信号相比较差。低进制调制信号(BPSK、OQPSK)由于本身调制方式的特性,在眼图和矢量图中与其他信号的视觉特性有明显区分,在0 dB 条件下,识别效果仍能接近100%。从图5中还可以看出,圆形调制方式信号(8PSK、16APSK、32APSK)的识别性能好于QAM 调制方式信号。
图5 不同信噪比下各调制类型信号识别结果
4.2 含频偏下模型识别性能
考虑到实际中通过FFT 估计信号载频时误差较大,为了验证此种情况下的算法性能,本文将相对符号速率的归一化载频误差分为不同的范围。图6为信号在不同频偏条件下的识别结果。从图6可以看出,相对于无频偏下的识别性能,信号在有频偏情况下识别准确率有一定的降低。且随着频偏的范围的加大,算法性能也逐步下降,并且在大频偏的情况下,本文算法不再适用。如何求解在大频偏条件下利用深度学习技术实现调制识别也是本文的改进方向之一。
图6 不同频偏条件下的本文算法识别结果
4.3 识别性能对比
图7为本文算法和传统算法(文献[4]和文献[5])以及现有深度学习算法(文献[8]和文献[9])的识别性能对比,由于本文算法利用了信号的先验知识,且结合了深度学习算法强大的自学习能力,性能在一定程度上优于其他算法。
图7 不同算法识别率对比
表1为不同算法对目标信号进行识别的时间复杂度,实验结果为对3000个实验样本的统计平均。可以看出,传统方法由于人工提取特征存在指导性,样本生成过程和识别过程的时间复杂度均低于深度学习方法。但是得益于GPU 并行运算能力的提高,神经网络大部分运算都可以并行完成。利用计算开销换取计算速度,最终能够实现快速运算。总体可以看出,所有算法的运行时间都可以控制在毫秒级别,完全可以满足实时性处理的需求。基于深度学习的算法也能较快地完成任务且识别效果优于传统算法,具有较好的工业应用前景和研究价值。
4.4 网络参数对性能的影响
本节主要测试网络参数对本文算法性能的影响,主要考虑2个方面:输入样本与网络结构。在输入样本上,本文首先对二值图像识别效果和灰度图像识别效果进行对比,如图8所示,基于灰度图像的识别效果好于二值图像,低信噪比下灰度图像识别性能较二值图像好1 dB 左右。但总体来说,性能提升并不明显,产生该现象的因素可能是由于像素区域内样本数过于稀疏,导致不同像素之间差异不是很明显。如何改进眼图和矢量图的生成也是后期值得改进的方向。
图8 不同图像预处理方法下的算法识别率
像素区域内样本数过于稀疏,一方面是由产生眼图和矢量图的符号数决定的。符号数越多,像素区域内包含的样本数也就相对越多。图9为不同符号数N下算法的识别性能,符号数选取为200、400、800、1000。符号数的选取在一定程度上影响着算法性能,随着符号数的增多,模型整体识别率也在逐步上升。但从图9中可以看出,当符号数为800和1000时,性能提升不是很明显,最终本文选取符号数为800生成眼图和矢量图。
输入样本中,样本的尺寸同样对信号的识别产生影响。本文通过实验验证不同图片尺寸下算法的性能,图片的尺寸主要受到采样率影响(幅度量化精度同样影响图片尺寸,由于本文需保证图片为矩形,量化精度不能随意设定,因此本文暂不考虑量化的影响)。本文设置过采倍数Nsamp 为32、64、128进行实验,对应图片尺寸大小为128像素×128像素、256像素×256像素、512像素×512像素。实验结果如图10所示。从图10可以看出,当过采倍数为32与64时性能差异不大,而过采倍数为128的识别效果在低信噪比的情况下远劣于前两者,且过大的图像尺寸对网络训练造成极大的负担,最终本文选取过采倍数为32作为样本生成参数。
表1 不同算法时间复杂度对比
图9 符号数对算法识别性能的影响
图10 过采倍数对算法识别性能的影响
考虑网络结构对性能的影响时,本文主要考虑基于单输入端和多输入网络结构的性能进行对比,具体如图11所示。从图11可以看出,基于单路眼图的调制识别算法由于损失过多信号的调制信息,识别性能不理想。其中,I 路眼图识别性能较Q 路眼图有一定差距,这可能与调制方式中初相的设置有关(本文对BPSK 信号的初相设置为0,导致I路有眼图的呈现,Q 路无眼图的呈现)。基于矢量图的调制识别中,由于损失了信号的时序信息,在一定程度上劣于本文算法。通过实验最终证明了本文算法的可行性。
图11 单输入网络结构与多输入网络结构下的算法识别率
5 结束语
本文基于信号眼图和矢量图的表达形式,提出了多端卷积神经网络模型,并较好地解决了卫星幅相信号调制识别问题。实验结果表明,由于本文所提算法在一定程度上结合了通信信号的固有调制属性,性能上较其他基于深度学习算法进一步提高。且基于多端处理的思想能够在不同角度指导网络挖掘和融合信号的内在特征,在一定程度上降低了对网络自身要求。本文提供了一类在神经网络架构下,构造适合神经网络拓扑表达的信号表现形式的调制识别求解思路。该思路可以推广到其他通信信号处理的问题上,利用信号已有的先验认知,寻求一种能够更有利于神经网络学习的表达形式,最终实现更好的算法性能。