一种多输入神经网络的调制识别方法
2021-05-10熊一谦
熊一谦,高 勇
(四川大学 电子信息学院,四川 成都 610065)
0 引言
在软件无线电系统中,信号的调制是必不可少的。为了能在接收端正确地解调信号,识别其调制类型是关键的一步。然而,随着无线通信技术的快速发展,日常使用的调制方法也在迅速增加。因此,如何准确地识别调制方式变得更具有挑战性。
传统的基于特征的调制识别算法可以通过数据预处理、特征提取和分类决策3个步骤来实现。特征提取可以从信号的各个方面入手,如瞬时振幅、相位、频率[1]、小波变换[2]、统计特征[3](如高阶矩和累积量)和循环累积量[4]等。近年来,信息熵在信号识别中得到了大量的应用。熵是用来度量信号分布的不确定性,表示信号的复杂程度。因此,信息熵为信号的调制识别提供了理论依据。文献[5]提取接收信号的多维熵特征,并与支持向量机结合,在不需要知道先验信息的条件下实现了对多种调制信号的识别。文献[6]提出一种基于熵云特征的调制识别算法,先提取信号的香农熵和指数熵特征,然后将熵理论和云模型理论有效地结合在一起,在低信噪比的环境下显著提高了信号识别效果。
在分类决策中,传统的分类器包括决策树、随机森林、多层感知和支持向量机。这些模型是不同特征提取算法和分类方法的组合,既需要专家知识,又需要人工设计,因此不可避免地会受到主观因素的影响,并且在低信噪比下不同类型信号的特征参数一般会交织在一起,使得传统的特征提取方法在低信噪比下识别率会不理想。
随着人工智能的发展,深度学习已被广泛用作调制识别的分类器,可以很好地解决在低信噪比下门限设定的问题。文献[7]利用卷积神经网络分别提取时域信号的多通道和分离通道特征,再利用融合特征实现不同信号的分类。文献[8]将接收到的信号进行预处理,得到包含同相分量和正交分量的复基带信号,作为卷积神经网络的输入,当信噪比为0 dB时,信号的平均识别准确率已达94.61%。文献[9]提出一种结合卷积神经网络(CNN)、长短期记忆(LSTM)网络和全连接网络(DNN)的新型网络,将时域、频域和自相关域的原始信号序列作为CNN的输入,实现了在低信噪比下对雷达信号的识别。
本文基于上述分析中提到的传统特征提取算法、多网络模型和融合特征的思想,将信号多方面的特征并行送入一个多输入网络模型中,再将多路输出特征依次融合,最后送入输出层,实现了在低信噪比下识别多种调制方式。
1 特征提取
1.1 信号预处理
预处理分为两步:先将接收到的信号进行小波降噪,再取其自相关函数。
1.1.1 小波降噪理论
小波变换能够分析出信号的细微变化,并且具有时域局部化和频域局部化的优势[10]。一般,信号的有效信息多集中在低频部分,而噪声通常在高频部分,小波阈值去噪技术利用分解后的小波高频系数对信号进行阈值处理,然后利用小波逆变换对信号进行重构,去除高频噪声[11]。
小波阈值去噪的主要步骤如下:
① 选择合适的小波基函数和分解层数对信号进行多尺度分解;
② 设计了阈值计算方法和阈值处理函数;
③ 利用步骤②得到的阈值和阈值处理函数对步骤①得到的小波系数进行限制;
④ 重构信号。
1.1.2 自相关分析
自相关函数可以表示信号在不同时刻的相关程度。假设接收到的信号表达式为:
x(t)=s(t)+n(t),
(1)
式中,s(t)为调制信号;n(t)为高斯白噪声。
则x(t)的自相关函数为:
R(τ)=E[x(t)x(t+τ)]=
E[(s(t)+n(t))(s(t+τ)+n(t+τ))]=
Rss(τ)+Rsn(τ)+Rns(τ)+Rnn(τ),
(2)
式中,Rss(τ)为调制信号自相关函数;Rsn(τ)为信号与噪声互相关函数;Rns(τ)为噪声与信号互相关函数;Rnn(τ)为噪声自相关函数。
由于调制信号和噪声是相互独立的。所以当τ不为0时,R(τ)≈Rss(τ)。
1.2 熵值特征
在信息论中,“熵”可以测量事物的不确定性,可以用来描述信号的复杂性特征,定量地描述信号所包含的内部信息特征。因此,熵特征可以用来提取调制信号复杂的内部特征。
常用的香农熵的表达式为:
(3)
1.2.1 奇异谱熵
经过预处理后的信号可以表示为:X=[x1,x2,…,xn],先截取X中的前M个元素作为重构矩阵的第1行,再截取X中的第2~M+1个元素作为第2行,以此类推得到最后一行[5]。则重构后的矩阵为:
(4)
对A矩阵进行奇异值分解得到奇异值:
{δi,1≤i≤N-M+1}。
1.2.2 功率谱熵和二次功率谱熵
(5)
二次功率谱熵是将预处理后的序列X取平方后代入式(3)中,再经过上述计算便可得二次功率谱熵,记为F3。
1.3 高阶累积量
假设一个零均值离散基带信号序列的表达式为:yk=ak+jbk。其p阶混合矩的定义为:
Mpq=E[yp-q(y*)q],
(6)
则yk的高阶累积量定义为[13]:
(7)
通过推导可得信号的高阶累积量(C21,C40,C61,C63)的理论值,如表1所示,其中E表示信号的能量[13]。
表1 信号高阶累积量理论值
表2 信号特征参数的理论值
2 多输入网络的设计
2.1 多输入网络模型
传统的特征提取算法的重点在于寻找具有良好分类特性的信号特征,但决策树分类器受噪声影响较大,十分依赖提取的信号特征。智能算法出现后,研究人员将BP神经网络、CNN、ResNet、LSTM等分类器与调制识别结合,在低信噪比下分类效果比传统的决策树好,解决了人工设置门限值所带来的误差。于是本文将传统的特征提取算法和智能算法结合,构建了一种多输入的神经网络,其整体网络结构如图1所示。
图1 多输入网络结构Fig.1 Structure of multi-input network
特征提取层由全连接网络、LSTM网络和残差模块组成,其中LSTM层神经元个数为128个;全连接网络包含2层,每层神经元个数为64个,网络中的激活函数为Relu函数,dropout值为0.5;残差模块的结构如图2所示,卷积层的卷积核大小为1×4、滤波器个数为128、步长为1×1。
图2 残差模块结构Fig.2 Structure of residual block
网络的运行步骤为先将4种输入数据送入网络,得到特征F1,F2,F3和F4;再将F3和F4拼接起来,送入一个残差模块,得到特征F5;再将F2和F5拼接起来,送入一个残差模块,得到特征F6;再将F1和F6拼接起来,最后再经过一个全连接网络后送入输出层。输出层使用Softmax回归模型对样本属于每个类别的概率进行估计。通过多次融合特征操作,实现了对调制信号的多种不同类型的数据进行特征提取,得到融合特征矢量,提升了分类性能。
2.2 长短期记忆网络
LSTM网络是RNN的一种特殊类型,主要由遗忘门、输入门、输出门和细胞状态4个部分组成[14],基本LSTM单元结构如图3所示。
图3 LSTM单元结构Fig.3 Structure of LSTM unit
由图3可以看出,ht-1是上一时刻LSTM的输出,ct-1是上一时刻的记忆单元,xt是此时刻的输入向量,f表示遗忘门,i表示输入门,o表示输出门。在遗忘门、输入门和输出门中,输出ft,it,ot的计算公式为[15]:
ft=σ(Wf[xt,ht-1]+bf),
it=σ(Wi[xt,ht-1]+bi),
ot=σ(Wo[xt,ht-1]+bo),
式中,σ为激活函数;W为权值向量;b为偏置向量。
由于独特的门结构设计,这些门结构使得LSTM存储器单元能够长时间存储和访问信息,从而解决了递归神经网络的梯度消失问题。
3 实验结果与分析
在实测数据集中,每个样本长度为500个I、Q采样点,码速率为500 Kb/s,采样率为2 MHz,成型滤波器系数为0.35。在每种信噪比下每类调制方式样本为10 000组,共90 000组样本,按照8∶2生成训练集和测试集。
实验环境如下:显卡为NVIDIA RTX 2080,处理器为Intel(R)Core(TM)i7-8700 CPU@3.2 GHz,内存为16 GB。软件环境:网络由tensorflow1.15.0框架搭建,开发语言为Python3.6。
待网络训练完成后,再使用NI USRP-2930采集以上9种调制类型的实测数据作为验证集,其中每种调制方式在每种信噪比下样本为1 000组,每个样本长度为500个I、Q采样点。实验结果如下,9种调制信号的平均识别准确率随SNR变化的曲线如图4所示。由图可知,当信噪比达到0 dB时,平均识别准确率可达93%;当信噪比达到2 dB时,平均识别准确率可达98%。
9种调制信号分别在各信噪比下的识别准确率如图5所示。由图可知,当信噪比达到1 dB时,9种调制信号的识别率全部达到90%。
为了进一步验证本算法提出的多输入网络的优越性,在使用相同信号数据的条件下,设计了另外3个模型。第1个模型将多输入网络中的残差模块改成全连接层;第2个模型将多输入网络的LSTM层改成CNN层;第3个模型将第2个模型中的残差模块改成全连接层。所有模型平均识别率的对比如图6所示。由此可见,多输入网络识别效果优于其他模型。
图4 各信噪比下9种信号平均识别准确率Fig.4 Average recognition rate of 9 types of signals under each SNR
图5 各调制信号在各信噪比下的识别准确率Fig.5 Recognition accuracy of each modulation signal under each SNR
图6 不同模型下信号平均识别准确率Fig.6 Average recognition accuracy of signals under different models
为了评估网络的识别性能,在相同数据集下,通过将文献[8]的算法与本文算法进行比较,其平均识别准确率和本文算法的对比如图7所示。由图7可以看出,本文算法的平均识别准确率均高于文献[8]的算法。
图7 不同算法信号平均识别准确率Fig.7 Average recognition accuracy of different algorithms
4 结束语
为了在低信噪比下同时识别低阶和高阶数字通信信号,提出了一种基于多输入网络的调制识别算法,利用信号的熵值特征、高阶累积量和预处理后的IQ数据作为网络的输入,在网络内部对不同输入数据提取的特征进行拼接,得到融合后的特征矢量,实现了对2FSK,4FSK,BPSK,QPSK,8PSK,8QAM,16QAM,32QAM,64QAM这9类数字通信信号的识别。当信噪比达到1 dB时,9种调制信号的识别率均在90%以上。下一步工作将考虑利用深度学习对调制方式和编码方式进行联合识别。