APP下载

基于CWD和残差收缩网络的调制方式识别方法

2021-11-10宋子豪彭岑昕李晓柏

系统工程与电子技术 2021年11期
关键词:时频信噪比卷积

宋子豪, 程 伟,*, 彭岑昕, 李晓柏

(1.空军预警学院预警情报系, 湖北 武汉 430019; 2.中国人民解放军95246部队, 广西 南宁 530001)

0 引 言

通信辐射源信号的调制方式识别是指在信号接收端对获取到的调制信号进行处理并识别其调制方式的技术,在非合作通信及电子对抗领域具有重要的研究意义。传统的调制方式识别方法可分为两类:基于似然比判决理论的识别方法和基于特征提取的识别方法[1]。基于似然比判决理论的识别方法计算复杂度及对先验知识依赖度较高,基于特征提取的识别方法存在某些特征提取困难及非高斯信道下所提取特征的准确性难以保证的问题[2]。

近年来,深度学习具有的自动学习样本深层特征的能力越来越受到调制方式识别领域研究者的关注,一些典型的深度学习方法已经被应用并取得了良好的效果。文献[3]首次提出将信号的同相/正交(in-phase/quadrature,IQ)信号合并输入卷积神经网络(convolutional neural network, CNN)进行通信信号的调制方式识别的方法,并建立了基准数据集。文献[4]将时域复信号分别直接输入多种类型的深度学习网络结构中,通过改变网络层数及层内参数,研究了各型网络的识别性能。文献[3-4]采用一维时域信号作为特征,信号受噪声影响损失了部分有效特征,使得识别准确率偏低。为了抑制噪声等干扰对识别性能的影响,提升识别性能,一些变换域上的统计特征也被应用于基于深度学习的调制方式识别方法中,如星座图[5]、时频分布矩阵[6-8]、双谱[9]等。文献[5]提取了二进制相移键控(binary phase shift keying,BPSK)、四进制振幅键控(4-order amplitude shift keying,4ASK)等8种类型调制信号的星座图特征,比较了将星座图、星座图灰度图、星座图的增强灰度图、三通道星座图分别输入AlexNet中的识别效果,在高斯信道下,信噪比为2 dB时,对8种信号的识别准确率达到了97.3%。文献[6]利用平滑伪Wigner-Ville分布和Born-Jordan分布得到时频图特征,再将其与瞬时特征结合,提出了一种基于CNN和融合特征的自动调制方式识别方案,在高斯信道下,该方案在-4 dB时对2ASK、4ASK等8种信号的识别准确率均超过88%。文献[9]将双谱和深度神经网络用于高斯信道下信号的调制方式识别中,0 dB时对常规脉冲(normal pulse,NP)、线性调频(linear frequency modulation,LFM)、BPSK、频移键控(frequncy shift keying,FSK)这4种信号的识别准确率达到了97%。文献[5-6,9]所提出方法在高斯信道下识别性能均优于将时域信号作为输入样本的深度学习方法,但是上述方法未对莱斯信道下信号的识别性能进行研究。文献[7-8]使用短时傅里叶变换(short time Fourier transform, STFT)将莱斯信道下的一维信号转换为二维时频谱图像,将其作为样本送入深度神经网络中。仿真结果表明,相对于时域信号作为输入样本的深度学习方法,上述方法在高信噪比时性能提升明显,而低信噪比时性能有待提高。

针对莱斯信道下传统识别方法特征提取准确性难以保证、深度学习方法在低信噪比下识别率较低的问题,本文提出了一种基于Choi-Williams分布(Choi-William distribution, CWD)和深度残差收缩网络(deep residual shrinkage network, DRSN)的通信辐射源信号调制方式识别方法,利用CWD将一维复信号变换为二维时频分布矩阵,获取更本质特征,通过残差网络、软阈值化提升低信噪比下的识别能力。

1 辐射源信号及信道模型

本文选用O’Shea于2016年建立的开源基准数据集RadioML2016.10a作为实验数据集[3],该数据通过GNUradio软件无线电平台生成,包含有11种调制信号;信道环境为混有高斯白噪声的莱斯信道;同一信噪比下各调制方式各有1 000个样本,信噪比范围为-20~18 dB,步进2 dB,共有220 000个样本;每个样本包含同相和正交分量,采样点数为128。

数据集信道模型为

(1)

2 数据预处理方法及网络描述

本文方法运用CWD相关理论对复信号进行时频变换,得到时频分布矩阵。利用Z-Score标准化方法对时频分布矩阵进行标准化,保证数据的可比性。本文运用的深度学习网络模型为添加软阈值化的DRSN。

2.1 CWD分布及标准化

傅里叶变换(Fourier transform, FT)是信号分析领域应用广泛的算法,但是其不能同时进行时间-频率局域性分析,也不适用于非平稳信号。短时FT(short time FT, STFT)可以同时获取信号的时频域特征,但是受测不准定理约束,时频分辨率有一定局限。针对莱斯信道下信号存在时延及多普勒频移的情况,Cohen类时频分析方法因为具有时移不变性和频移不变性,能在一定程度上规避二者对接收信号特征的影响,更适合对此类信号进行时频分析。

Cohen类时频分布可由模糊函数定义[11],即

Cx(t,Ω)=∬Ax(θ,τ)g(θ,τ)e-j(tθ+Ωτ)dτdθ

(2)

rx(t,τ)=x(t+τ/2)x*(t-τ/2)

(3)

(4)

式中:x(t)为某一复信号;(·)*表示取共轭;rx(t,τ)、Ax(θ,τ)分别是x(t)的瞬时自相关函数及模糊函数;g(θ,τ)是(θ,τ)平面上的核函数,其目的是为了抑制交叉项。给定不同的核函数,就可以产生不同的Cohen类时频分析方法。CWD的核函数为e-θ2τ2/σ,表达式[12]为

(5)

(6)

2.2 DRSN

为了解决多层CNN结构模型退化的问题,He提出了跳层连接的深度残差网络(residual networks, ResNets)[13]。DRSN作为ResNets的变体,最早用于故障振动信号的分类识别。由于在残差模块的基础上引入了软阈值化,其在含噪信号的分类识别上有着更好的效果[14]。

软阈值化是小波降噪算法中的核心步骤,在小波软阈值降噪算法中,往往需要经过选择小波基、分解信号得到小波系数和近似系数、选择固定阈值、估计小波系数等步骤达到数据降噪目的,而选取的固定阈值往往不适应于所有样本[15]。深度神经网络提供了解决这个问题的新方法,通过设置子网络获取当前层输出特征图各通道的阈值,随后将阈值输入至软阈值函数中,软阈值函数的输出值即为降噪后的各通道特征图数值。深度学习和软阈值的结合可以自适应获取阈值,消除噪声相关信息及重构特征,从而有利于分类任务性能的提升。软阈值函数[15]的表达式为

(7)

式中:din表示输入特征;y表示输出特征;τ表示阈值,是一个恒正数。深度残差收缩模块(deep residual shrinkage module, DRSM)如图1所示。

图1 DRSM结构

输入经过第l卷积层,通过批标准化(batch normalization, BN)、ReLU函数得到Al+1,将其作为第l+1卷积层的输入。在第l+1卷积层构造一个获取阈值的子网络,对第l+1卷积层的输出X完成取绝对值操作、全局均值量化得到均值参数β,β为一个一维向量。随后,经过两层全连接层,通过Sigmoid函数输出一组取值在0和1之间的缩放参数α,之后将缩放参数α与β对应项相乘,得到一组阈值τ,其维度为(C,1)。最终,每个特征图的通道将拥有独立的阈值。各通道阈值获取的具体过程表示为

(8)

(9)

τc=αcβc

(10)

(11)

Al+2=As+f(Al)

(12)

本文定义的DRSN结构及参数如图2所示。其中,Conv代表卷积层,S代表步进数;DRSM代表深度残差收缩模块,FCL代表全连接层;(128×128×30)代表上一层输出特征图的尺寸为128×128,通道数为30。输入样本经过1层卷积层、8层残差收缩模块及BN、ReLu函数处理后,多通道特征图最终展开为一维向量并输入到全连接层,随后通过Softmax函数得到调制方式识别结果,其中第一层卷积层的卷积核尺寸为5×5,DRSM块内卷积层尺寸为3×3。卷积层采用文献[13]提出的正态分布初始化方法以及l2正则化。利用添加l2正则化项的交叉熵函数计算网络损失值,以此作为网络性能指标[16],表达式为

图2 DRSN结构及参数

(13)

3 调制方式识别流程

调制方式识别的具体步骤如下。

步骤 1随机初始化DRSN,抽取训练集规定个数的样本输入网络进行训练。

步骤 2将网络最后一层得到的分类结果和实际类型比较,利用添加l2正则化项的交叉熵函数计算网络损失值,通过优化算法反向调节网络权值。

步骤 3在每轮训练开始之前,调取测试集损失值,以此为标准衡量网络性能。当其5轮之内未下降则中止训练。

步骤 4重复步骤2~步骤4,直到达到训练次数上限或满足提前中止训练条件,训练结束后保存权值输出分类模型。

步骤 5将验证集输入分类模型,得到分类结果。

4 仿真实验与结果分析

4.1 仿真实验条件

本文使用RadioML2016.10a数据集中八进制相移键控(8 phase frequency shift keying, 8PSK)、双边带幅度调制(double-sideband amplitude modulation, AM-DSB)、单边带幅度调制(single-sideband amplitude modulation, AM-SSB)、BPSK、连续相移键控(continuous phase frequency shift keying, CPFSK)、高斯频移键控(Gauss frequency shift keying, GFSK)、四脉冲振幅调制(4 pulse amplitude modulation, PAM4)、十六进制正交振幅调制(16 quadrature amplitude modulation, 16QAM)、六十四进制正交振幅调制(64 quadrature amplitude modulation, 64QAM)、正交相移键控(quadrature phase shift keying,QPSK)、宽带调频(wide band frequency modulation, WBFM)的11种信号样本作为研究对象,信噪比范围为-20~18 dB,各信噪比下每种调制方式样本数为1 000,按照0.6∶0.2∶0.2的比例划分训练集、测试集、验证集。本文采用文献[7]思路,分信噪比建立识别网络,单次训练输入的样本数为100,网络优化函数采用Adam算法[17]。迭代次数上限设置为200,为避免网络过拟合,在训练过程中设立早停机制,以测试集损失值为监测指标,当其5轮之内未下降则停止训练,输出分类模型。

本文利用Matlab 2020a软件进行信号CWD变换,利用Python及相关库进行标准化、样本划分,依托Tensorflow1.13.1、Keras2.2.4搭建网络并完成测试分析工作。本文实验硬件平台搭载Intel Core i5 10200H型CPU,内存为16 GB,显卡为Nvidia GTX2060 6 G,硬盘大小为512 GB。

4.2 不同信噪比下的调制方式识别性能仿真

设Nall为样本总数,Ncorr为分类结果正确的样本个数,定义总体识别准确率:

(14)

图3表示本文方法在不同信噪比下总体识别准确率。

图3 不同信噪比下的总体识别准确率

由图3可知,总体识别准确率随信噪比的提高而提高。得益于软阈值化和残差网络的优良表现,本文方法在低信噪比时表现良好。0 dB时,总体识别准确率达到了89.95%;0 dB以上时,总体识别准确率均超过91%。

以此为指标评判对不同调制方式的分类能力。图4为不同信噪比下各调制方式的召回率。

图4 各调制方式在不同信噪比下的召回率

由图3和图4可知,除AM-DSB、WBFM信号外,各调制方式召回率随信噪比的提高而提高。得益于软阈值化和残差网络的优良表现,本文方法在低信噪比时表现良好。0 dB时,对除AM-DSB、WB-FM信号外的其他类型调制信号召回率超过89%,总体识别准确率达到89.95%;0 dB以上时,对除AM-DSB、WBFM信号外的其他类型调制信号召回率均超过88%,总体识别准确率均超过91%。

不同信噪比条件下分类混淆矩阵如图5所示。由图4及图5可知,本文方法在区分WBFM和AM-DSB信号时出现困难,这是由于原始数据集中这两种调制方式的样本是由实际音频流生成,在这个过程中有一段音频流的中断期,导致这两种调制方式存在许多相似的样本,影响了识别的准确率。此外,图5结果显示,QAM类信号发生了少量样本的类内错判,这是由于QAM类信号相位模式差异细微,载波相位变换在每个周期内仅出现一次,使得双线性变换后部分时频图的相似度较高,区分度受到影响,但召回率仍保持在88%以上。

图5 不同信噪比条件下分类混淆矩阵

4.3 不同时频方法下的识别性能仿真

选取Cohen类时频分析方法中常用的Wigner-Ville分布(Wigner-Ville distribution, WVD)[18]、CWD、Zhao-Atlas-Mark分布(Zhao-Atlas-Marks distribution, ZAMD)[19]、谱图分布(spectrogram, SP)[11]作为时频变换方法,窗口大小均设置为21,分别得到维度为128×128的分布矩阵。将4种方法所得时频矩阵以及原始信号分别输入网络中进行训练,训练结束后利用验证集对比不同方法下的识别性能,如图6所示。

图6 不同时频方法下的总体识别准确率

由图6可知,在绝大多数信噪比下,时频分布矩阵作为输入的方法性能要优于将原始信号作为输入的方法。使用CWD作为时频分析方法得到的矩阵作为样本时,识别性能表现最优,而使用WVD获取的总体识别准确率最低。WVD虽然不受测不准原理限制,时频分辨率较高,但是其引入了交叉项干扰,从而对识别性能造成了严重影响。SP没有引入交叉项影响,但是其较低的时频分辨率对识别性能造成了负面影响。ZAMD可消弱交叉项干扰,使得低信噪比下的识别性能得以提升。但是当信噪比大于6 dB时,识别性能出现下滑。综合来看,CWD时频聚集度高,抑制交叉项表现好,相同条件下识别性能最优。

4.4 不同数据维度下的识别性能仿真

深度学习训练中常常利用降维减少训练时间,但数据降维同样存在着损失有效信息的风险。本节利用双三次插值方法对时频矩阵进行抽样降维,将维度由128×128分别降至64×64、32×32。将不同维度的时频分布矩阵输入至网络中进行训练,比较数据维度对性能的影响,如图7所示。

图7 不同样本维度下的总体识别准确率

图7表明,信噪比为-6 dB以上时,将未进行降维的矩阵输入网络的总体识别准确率均显著优于将降维后的矩阵作为样本的方法。这说明,降维导致的有效信息的损失,会使得模型总体识别准确率下滑,直接影响分类性能。

4.5 不同模块个数及模块内卷积核尺寸下的识别性能仿真

本实验主要探究残差模块个数及模块内卷积核尺寸对于分类性能的影响。首先,将时频分布矩阵预处理后作为输入样本,改变残差收缩模块的个数,对比残差收缩模块个数对识别性能的影响。将残差模块数量NUM分别设置为2、4、6、8、10。图8(a)显示了不同模块个数下的总体识别率表现。由图8(a)可知,当NUM为8时,识别性能达到最优。NUM为2或4时,网络深度不足,模型提取特征的能力受到限制,在0 dB时,总体识别准确率均低于83%。NUM为6时,总体识别准确率得到显著提升,但是识别性能低于NUM为8的方法。而把NUM提升为10时,网络复杂度过高,使得其在某些信噪比下出现过拟合,识别性能退化。

图8 不同模块个数及卷积核尺寸下的总体识别准确率

将NUM固定为8,改变块内卷积核尺寸KS, 将KS设为3、5、7,探究改变卷积核尺寸大小对识别性能的影响,如图8(b)所示。KS=3时,网络识别性能达到最优。当KS>3时,模型性能未见明显提升,信噪比大于10 dB时,总体识别准确率甚至出现小幅度下滑。这是由于输入特征图维度较低时,较大的卷积核不利于局部特征的提取,引起了网络退化。

4.6 不同网络架构下的识别性能仿真

将时频分布矩阵分别输入至模块数相同、块内卷积核尺寸一致的CNN、ResNets、DRSN进行训练。图9为3种不同网络结构的性能对比。表1为3种网络结构单批次训练所需时间及训练参数个数。本文所采用的DRSN相较于另外两种网络,训练参数更多,单批次训练时间更长,以增加系统复杂度和训练时间换取了更优的识别性能。得益于软阈值的加入,在-2~18 dB时,DRSN识别表现优于另外两种网络。

图9 不同网络架构下的总体识别准确率

表1 不同网络架构下单批次训练时间及训练参数个数

4.7 本文方法与其他文献识别性能对比

为了评估本文方法的性能,将本文所提出的方法与将IQ信号作为输入特征的方法进行对比。文献[4]运用CNN、密集卷积网络(dense convolutional network, DenseNet)、ResNets、卷积长短期记忆全连接深度神经网络(convolutional, long short-term memory, fully connected deep neural networks, CLDNN)等深度神经网络,提出了IQ-CNN、IQ-DenseNet、IQ-ResNets、IQ-CLDNN等多种方法。文献[20]将IQ信号输入至长短期记忆网络(long short-term memory, LSTM)、添加注意力机制的长短期记忆网络(LSTM-attention)中,提出了IQ-LSTM及IQ-LSTM-Attention方法。本文方法与复时域信号直接输入方法的总体识别准确率如图10(a)所示。可知,相较于将复时域信号直接输入的深度学习方法,本文方法的识别性能有较大提升,信噪比在-6~18 dB下总体识别准确率均高于其他文献方法。信噪比为-2 dB时,本文方法的总体识别准确率较其他方法提升了约7%,信噪比为18 dB时,本文方法的总体识别准确率较其他方法提升了约3%。

图10 本文方法与其他文献方法的总体识别准确率对比

将本文所提出的方法与将时频图等二维特征图作为输入特征的方法进行对比。文献[6]利用STFT、高斯滤波(Gaussian filter, GF)、模糊函数(ambiguity function,AF)及谱密度函数(spectral density function, SCF)等方法提取二维特征,提出了STFT-CNN、STFT-GF-CNN、AF-CNN、SCF-CNN等方法。文献[8]将利用STFT得到的时频特征作为特征向量,提出了基于复数CNN(complex CNN, CCNN)、双向LSTM(bi-directional LSTM, BiLSTM)的STFT-CCNN-LSTM方法。将本文所提出的方法与上述方法对比,如图10(b)所示。由10(b)可知,在信噪比大于-6 dB时,本文方法识别性能优于其他方法。在0 dB时,总体识别准确率较其他方法高约10%,在18 dB时,总体识别准确率较其他方法高3%以上。

5 结 论

本文提出了一种莱斯信道下基于CWD及DRSN的通信辐射源信号调制方式识别方法,该方法整合CWD、软阈值化、ResNets,分信噪比建立识别网络,实现了对基准数据集RadioML2016.10a中信号的有效识别。在0 dB时,对11类信号的总体识别准确率达到了89.95%;在2 dB及以上时,总体识别准确率均超过91%,优于其他同类深度学习算法。如何进一步建立考虑多载波信号在内的调制识别方法以及结合实测数据的应用将成为下一步的研究方向。

猜你喜欢

时频信噪比卷积
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于深度学习的无人机数据链信噪比估计算法
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
保持信噪比的相位分解反褶积方法研究
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
一种基于卷积神经网络的性别识别方法