APP下载

基于残差时序卷积网络的水声通信信号模式识别

2024-02-21陈双双顾师嘉李娜娜吴玉泉

无线电工程 2024年2期
关键词:水声正确率残差

陈双双,顾师嘉,李娜娜,吴玉泉*

(1.中国海洋大学 电子工程学院,山东 青岛 266100;2.中国科学院软件研究所,北京 100190)

0 引言

非合作通信下的信号调制模式识别作为水声对抗领域的重要组成部分,逐渐成为研究热点。水声信道具有多途、频散、环境噪声高、信道带宽窄和多普勒频移大[1]等特点。特别是海洋中存在各种时间和空间尺度的海洋动力过程,引起了水体的非均匀性,加之海面的随机波动性和海底的不平整性等因素,均会对水中的声波传播造成影响,因此水声信道存在显著的空间差异和时间起伏,这些特性均对水声通信信号识别带来巨大挑战。

水声信号调制识别分类引起了人们的广泛关注和研究,一般调制识别分类方法分为2种:基于似然(LB)的方法和基于特征(FB)的方法。LB通过比较不同调制信号的似然函数来获得最佳结果,但是存在更多的调制信号类型时,LB方法的计算复杂度会很高。相比之下,FB可以在较低的计算复杂度下,分类更多类型的调制信号模式。FB分类系统包括2个主要部分:特征提取和识别子系统。在特征提取方面,传统方法需要提取大量特征,例如吴姚振等[2]结合了伽马通倒谱系数(GT)与DEMON的特征向量谱分析有效提高了目标分类的准确性和稳定性。陈蕙心等[3]基于高阶累积量和熵值联合特征的调制识别算法,提出了改进粒子群(PSO)算法,构造出改进粒子群优化支持向量机分类器(PSO-SVM)。杨柳等[4]利用双谱计算(频域)信号的双谱矩阵的算法,将最大内积值对应的调制方式作为待识别信号的调制方式,在高信噪比(Signal to Noise Ratio,SNR)条件下能达到90%以上的识别率。罗昕炜等[5]针对非平稳调制特点,利用希尔伯特-黄变换(HHT)时频特征数据自适应特性和高分辨率的时频分析能力以及数学形态滤波器(MMF)对信号的降噪性能,提出了一种利用希尔伯特-黄变换提取宽带幅度调制信号的调制特征方法(MH_ DEMON)方法。信号分类识别系统可使用如隐马尔可夫模型的手动提取特征方法,或者深度学习这种自动提取特征的方法。深度学习是近几年研究的热点,例如陆扬等[6]从侦收信号的维格纳-维尔分布(WVD)中提取特征向量,利用人工神经网络对特征向量进行分类,但在SNR较低的情况下识别正确率较低,Jiang等[7]提出了一种卷积神经网络双向长短时记忆具有对称结构依次提取信号的频域特征和时序特征,与经典的机器学习方法相比该算法在低SNR下具有较高的识别精度,所提出的调制识别方法在非合作通信中是有效的系统,但该网络的感受野较小会丢失信息,且模型复杂度高。姚晓辉等[8]采用卷积神经网络进行水声信号识别,仿真结果调制识别正确率可以达到85%,但该网络在计算卷积时后来的时序,会导致信号特征泄露从而影响正确率。

针对上述提到的传统方法需要特征较多和人工神经网络等模型特征丢失、模型复杂度高的问题,本文提出采用残差时序卷积网络(Residual Temporal Convolutional Network,ResTCN)模型进行水声信号识别分类。分别对双频移键控信号(2fsk)、双相移键控信号(2psk)、四频移键控信号(4fsk)、四相移键控信号(4psk)、连续波(cw)、直接序列扩频谱(dsss)、跳频扩频谱(fhss)、线性调频(lfm)和正交频分复用(ofdm)九类信号预处理后输入至ResTCN模型训练,实现在不同功率SNR情况下的水声通信信号分类识别。SNR在-10~10 dB的仿真测试集上,其识别准确率可达到95%,在海上试验数据上可达到93.5%。

1 水声信号调制模式识别

水声信号调制模式识别主要分为三部分,分别为水声信道以及通信模型的建立、特征参数的提取和信号调制模式分类识别,其流程如图1所示。

图1 调制模式识别流程Fig.1 Modulation mode identification flowchart

仿真信号采用Matlab仿真出不同的信号,并在BELHOP射线理论的基础上[9]建立瑞利衰落多径的水声信道模型,将通信模型与水声信道进行卷积加噪声得到接收端仿真信号。实验数据需要在发射端建立信号,然后进行试验,最后将接收端的数据进行截取,筛选有用信号。得到仿真信号或试验有用信号后,通过短时傅里叶变换(Short-Term Fourier Transform,STFT)对仿真信号进行预处理[10],最后将信号预处理的频域特征作为输入送至分类模型进行训练。

1.1 水声信号预处理

采用STFT进行信号的预处理,STFT是一个分析非平稳信号的工具,它表示信号的时率能量分布。

傅里叶变换一般用来分析分布参数不随时间发生变化的平稳信号。由于非平稳信号在短时间内可以看作是平稳信号,STFT正是利用这种逐段分析的思想,对信号先加一个窗函数,然后再对窗里的部分进行傅里叶变换,窗口随着时间进行移动,相当于把信号分段,最终把每个窗内的结果整体联系起来进行观察,从而得到非平稳信号的时频特征。根据此理论可得到连续信号x(t)的STFT公式[11]:

式中:g(t)表示窗函数,不同的窗函数可以得出不同的结果。

STFT原理简单、计算速度较快,非常适合分析信号频谱分量随时间变化比较慢的非平稳信号。由于窗函数的存在,不能同时满足时域和频域高精度要求。随着选取滑窗时间的变长,时域分辨率会逐渐降低;随着选取滑窗时间的变短,频域分辨率会逐渐降低。因此,当信号频谱随时间变化非常快时,应该选择时间窗口较小的窗函数,从而可以获得较高的时间分辨率;当信号频谱随时间变化相对平缓时,可以选择时间窗口较大的窗函数,从而获得较高的频谱分辨率[12]。

1.2 ResTCN

ResTCN[13]由基于卷积神经网络(CNN)[14]和全卷积网络(FCN)衍生的新网络模型TCN的基础上添加残差网络(ResNET)得到,可以看作是几个残差块的组合,模型结构如图2所示。加减模型层数较为简单,可以只改动参数,因此该模型是一个简单且容易理解的结构,它具有并行性、感受野灵活、梯度稳定和内存占有率低等优点,具体表现在:①它可以并行执行卷积,减少水声信号识别的时间;②可以通过层数、扩张因子和过滤器大小来调整感受野大小,感受野大抓取的特征信息更多;③TCN不像循环神经网络(RNN)在不同时间段共享参数,梯度更稳定;④内存需求低于长短时记忆网络(LSTM)和门控循环单元(GRU),其卷积内核在一个层中共享,内存使用低。ResTCN模型的残差模块中包含了TCN模型的主要结构,此结构分为一维全卷积、因果卷积和膨胀卷积。

图2 残差时序卷积网络结构Fig.2 Structure ResTCN

(1)一维全卷积

TCN引用一维FCN的结构[15],每一个隐藏层的输入输出的时间长度都相同,且用零进行填充来保证输入输出的长度一致,维持相同的时间步,因此每个时间的输入都有对应的输出,其结构如图3所示。

图3 一维全卷积结构Fig.3 1-D fully convolutional structure

引用一维FCN来预测序列的元素量级。卷积运算的层数越高,其感受野就越大,对特征的变化就会更加敏感。使用一维卷积代替全连接有助于构建网络的长期记忆。

(2) 因果卷积

为了保证未来的信息“泄露”至当前时刻,TCN采取因果卷积网络[16]。给定一个时间序列x0,x1,…,xt,…,xn,预测对应时刻的输出y0,y1,…,yt…,yn,在“t”时刻的输出yt只和“t”时刻以及"t”时刻之前的输入x0,x1,…,xt相关,与“未来”的xt+1,xt+2,…,xn无关。

因果卷积的操作如图4所示,每一层的时间步长“t”的输出只计算不晚于前一层时间步长“t”的区域。对于图4而言,卷积核大小k=3,可以看出对于一个2层网络而言,其感受野大小RF=5;对于图5而言,卷积核大小k=2,其感受野大小RF=5。

图4 普通卷积结构Fig.4 Common convolutional structure

图5 因果卷积结构Fig.5 Causal convolutional structure

(3)膨胀卷积

膨胀卷积又称为空洞卷积[17]。在不堆积更多层和更大卷积核的前提下,抓取更长的依赖关系。膨胀卷积是从距离t的d步处获得输入:xt-(k-1)d,xt-(k-2)d,…,xt-2d,xt-d,xt,其中k是卷积核大小。膨胀因子d会随着网络层数的增加,以2的指数增长,如图6所示,d分别为1、2、4。这样卷积网络就可以在比较少的层,获得很大的感受野。将因果卷积和膨胀卷积相结合,就可以得到如图6所示的膨胀因果卷积网络结构。

图6 膨胀因果卷积结构Fig.6 Dilated causal convolutional structure

图6为4层神经网络,其卷积核k=3,第一层是输入层,第二层的d为1,是常规的一维因果卷积,后面d随着层数翻倍,即添加了“空洞”,最上层的最后一个神经元共15个输入数据,可以观测到输入数据的全部特征。

TCN的稳定依赖于网络层数g、卷积核大小k和膨胀因子d,所以越深越大的网络感受野越大,TCN越稳定,膨胀卷积在网络层数一定的情况上增大了感受野,当需要追溯久远的信息时,网络层数不得不增加,随着网络深度的增加,会导致训练深层网络出现的问题,例如梯度爆炸、梯度弥散和网络退化。因此本模型加入了残差网络来杜绝此类问题的出现。

(4)残差模块

在输入是高维的情况下,此模型采用残差模块来增加卷积网络层数,避免网络出现训练深层的网络退化问题。解决网络退化实际上就是解决网络冗余层产生恒等映射问题,一般情况下,让网络的某层去学习恒等映射函数Y(x)=x较为困难,如果网络为Y(x)=F(x)+x,就可以用网络学习残差问题F(x)=Y(x)-x代替学习恒等映射问题,只要使F(x)=0,就可以构成Y(x)=x的恒等映射。一般在参数初始化时,权重参数较小,比较适合学习F(x)=0,所以拟合残差问题较为容易[16],其数学表达式为Y(x)=F(x)+x。

为了避免模型成为表达力不够的线性模型,在网络中加入了ReLU激活函数来添加非线性因素。此模型通过在每一个卷积层加入权重参数初始化来规范隐含层的输入解决梯度问题。通过在每个卷积层之后引入dropout正则化来防止模型出现过拟合问题。因此在每个残差块包含2层的膨胀因果卷积、权重归一化、ReLU激活和dropout正则化,其结构如图7所示。

图7 残差块结构Fig.7 Residual block structure

2 仿真结果分析

根据水声信道的特点采用BELLHOP模型进行水声信道仿真。仿真参数:海水深度为50 m,声源深度为10 m,接收器水平范围为5 km,海底粗糙度为0,海绵粗糙度为2,用来计算声速以及声速沿声线的导数的插值方法为C-线性插值,海表面以上为真空,水体之下介质类型为声学半空间。结合多种应用场合情况,信道可以被看作是缓慢时变的相干多途信道,即信道的介质和边界条件时不变,声源和接收器位置固定。若观察处理时间不是特别长,可以用时不变的滤波器来表示。它的信道冲激响应如图8所示,根据上述参数产生14条本征声线,且每条声线的幅度都产生了不同程度的降低,到达时间产生了不同程度的延迟,体现了水声信道的多途效应、时变效应和信号衰减等特点。

图8 BELLHOP浅海信道的冲激响应Fig.8 Impulse response of BELLHOP shallow sea channel

将仿真的发射端信号通过建立的水声信道模型,得到接收端信号,图9、图10以2psk、2fsk为例,2psk信号使用相位变化来体现码元变化,振幅和频率保持不变;2fsk信号有疏有密,其中疏的波形代表载波频率较低的,密的波形代表载波频率较高的。2种信号经过水声信道后波形包络无明显特点,波形疏密及相位变化都不明显,可以看出经过水声信道会隐藏信号原本的特征。提取信号的STFT,如图11、图12所示为在SNR为0 dB情况下信号2fsk、2psk的STFT波形,2fsk信号有2种载波频率可以明显地体现,2psk信号只有一种频率,可以将其2种信号区分,识别模型在此基础上提取图片特征进行识别,减轻了模型识别的困难。

(a)2psk信号时域波形

(a)2fsk信号时域波形

图11 2fsk信号的STFT波形Fig.11 STFT waveform of 2fsk signal

图12 2psk信号的STFT波形Fig.12 STFT waveform of 2psk signal

将9类信号数据集打好标签,每类1 000条按照7∶3的比例划分为训练集和测试集,在基于STFT和残差的情况下进行水声信号的调制识别。训练模型应用循环选取参数,最后画出loss图,选择收敛较好且正确率较高的模型,减少调参用时。图13~图16所示为信号分别在SNR为0、2、-3、-10 dB时模型训练的loss收敛和正确率的图像。本模型的参数设置分别为:初始学习率lr=0.001,一次训练所选取的样本数batch_size=512,训练次数100,隐藏层的层数17,卷积和的数量2 023,卷积核尺寸2。

图13 SNR=0 dB时的loss和正确率Fig.13 Loss and accuracy at SNR=0 dB

图15 SNR=-3 dB时的loss和正确率Fig.15 Loss and accuracy at SNR=-3 dB

图16 SNR=-10 dB时的loss和正确率Fig.16 Loss and accuracy at SNR=-10 dB

以SNR为2 dB时为例,不同卷积和的数量情况下的正确率如图17所示,可以看出在卷积和的数量为2 023时的识别效果最好。保持卷积和的数量一定,不同隐藏层层数情况下的正确率如图18所示,将其对比可以看出在隐藏层层数为17时的信号识别分类正确率最高。

图17 不同卷积和数量的正确率Fig.17 Accuracy for different convolutions and numbers

图18 不同隐藏层层数的正确率Fig.18 Accuracy for different numbers of hidden layers

SNR在-10~10 dB下9种信号每类信号3 900条进行测试,得到信号的混淆矩阵如图19所示,可以看出信号4psk被错误识别为2psk信号的情况较多,在低SNR的情况下,fhss信号会被识别为dsss信号,其他7种信号识别效果良好。

图19 ResTCN模型仿真信号的混淆矩阵Fig.19 Confusion matrix of ResTCN model simulation signal

综上所述,可以看出ResTCN模型选定适合的卷积和数量与隐藏层层数后,在仿真的测试集数据上识别正确率可以达到95%,在模型训练完后识别正确率比较稳定。

CNN[18]是包含卷积层和降采样层的深度神经网络模型,基本组成部分为卷积层和池化层,池化层与卷积层交替设置。神经网络的层与层之间利用局部空间相关性将相邻的每一层的神经元点与它相近的上层神经元点连接,卷积层的每一个卷积滤波器重复作用于整个输入层。为防止过拟合,采用的是池化层对数据进行降维。将水声通信信号的时频图输入至CNN,网络一次训练所取样本数batch_size为512,初始学习率lr设置为0.000 1,卷积核尺寸为5,训练次数epoch为1 000。以2 dB为例,可得到如图20和图21所示的收敛loss和正确率acc图。

图20 CNN模型在SNR=2 dB时的loss

图21 CNN模型在SNR=2 dB时的acc

SNR在-10~10 dB下将9种信号每类信号3 900条输入至CNN模型进行测试,得到信号的混淆矩阵如图22所示,2psk信号和4psk信号互相识别错误较多,dsss信号被错误识别为4psk和2psk信号。总体信号识别正确率约为89.8%,因此在仿真数据上,识别效果不如TCN模型,并且CNN模型需要较多的训练次数。

图22 CNN模型仿真信号的混淆矩阵Fig.22 Confusion matrix of CNN model simulation signal

3 海上试验结果分析

本模块使用海上试验数据进行训练和测试,本次海上试验数据来源于南海海域进行的海洋试验,试验当天海况较好。图23为海上试验示意。发射端与接收端船只处于动态漂浮,平均距离大约为2 n mile,海平面到换能器距离为15 m,水下接收阵列距离海平面5 m。

图23 海上试验示意Fig.23 Sea test

实验过程:将各种信号按照一定的格式串联,将其在发射端用换能器发送,在接收端采用水下接收阵列。将收集到的数据进行低通滤波、频域变换等预处理得到其STFT,图24~图27为海上试验数据的STFT,fhss信号跳变频率有多个,在STFT图上可以明显看出。2psk信号只有一个频率,二者的STFT从图上看有差距。与上述仿真的2psk信号相比,海上试验噪声的影响明显。信号2psk、4psk和cw频率都只有一个,这更加体现了识别模型的识别能力。

图24 2psk信号STFT

图25 fhss信号STFT

图26 cw信号STFT

图27 4psk信号STFT

将试验数据集每类各1 000条按照7∶3划分训练集和测试集,将测试集分别输入至训练好的ResTCN模型和CNN模型进行测试,得到其混淆矩阵如图28和图29所示。

图28 ResTCN模型试验信号的混淆矩阵Fig.28 Confusion matrix of ResTCN model test signal

图29 CNN模型试验信号的混淆矩阵Fig.29 Confusion matrix of CNN model test signal

综上结果,ResTCN模型对未进行降噪处理的试验数据的识别正确率为93.5%。在噪声的干扰下,fhss与dsss信号相似度较高,信号fhss会被错误识别为dsss,其他7种信号识别正确率较好。如上图CNN模型海上试验信号的混淆矩阵所示,对未进行降噪处理的试验数据的识别正确率为89.6%,信号4psk较多被错误识别为2psk,部分dsss信号和fhss信号被错误区分。相比较2种模型,本文所提的ResTCN在海上试验信号分类效果明显优于CNN模型。

4 结束语

提出的ResTCN模型,通过仿真实验和海上试验验证,模型在水声信号模式识别方面具有一定实用价值。由于海上试验平台噪声不稳定,所以识别结果与仿真结果存在一些差异。尤其是仿真实验低信噪比情况下信号2psk和4psk的分类,未进行降噪处理的海上试验情况下信号fhss与dsss的分类。由于在水声通信领域的数据集数量较小,需要对不同海域进行数据测试来训练分类器进行学习。

猜你喜欢

水声正确率残差
基于双向GRU与残差拟合的车辆跟驰建模
门诊分诊服务态度与正确率对护患关系的影响
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
认知水声通信系统中OFDM技术的应用
新型多功能水声应答器电子系统设计
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
FRFT在水声信道时延频移联合估计中的应用