APP下载

基于Stacked-TCN的空间混叠信号单通道盲源分离方法

2021-08-23赵孟晨姚秀娟董苏惠

系统工程与电子技术 2021年9期
关键词:掩模盲源单通道

赵孟晨,姚秀娟,王 静,董苏惠

(1.中国科学院国家空间科学中心,北京 100190;2.中国科学院大学电子电气与通信工程学院,北京 100049)

0 引 言

近年来,国内外的卫星星座组网计划发展迅速,星地通信、星间通信使得频谱拥挤进一步加剧,同频信号混叠干扰难以避免[1],空间通信电磁环境呈现时频混叠、空间交错,在现实空间通信环境中,鲁棒的信号处理通常需要自动信号分离[2-3]。在密集的星座互联网通信场景下,达到接收端的源信号可能是多个通道的混叠信号,而地面站观测通道数目有限,因此欠定盲源分离的应用场景极为常见。常规的二步法、稀疏特征表示法等欠定分离方法[4-6]在单通道条件下分离效果欠佳,单通道通信信号盲源分离问题亟待解决。

研究者提出了许多解决分离问题的方法。独立成分分析堆叠时域卷积网络(stacked time-domain convolutional network,Stacked-TCN)[7]在超定分离方面表现良好,但在欠定盲源分离场景下效果欠佳。基于聚类法的稀疏分量分析(sparse component analysis,SCA)[8]需要已知混合信号的数目。时-频掩模方法[9-12]提高了分离精确度,但存在幅度和相位解耦,短时傅里叶变换需要较高分辨率的频率分解窗,限制在低延迟系统中的适用性。非负矩阵分解(non-negative matrix factorization,NMF)[13-14]可以在时域进行分解,但在泛化为大数据的能力方面较弱。基于Kalman滤波[15]、LCL-FRESH滤波[16]、循环维纳滤波的单通道分离[17]计算复杂度高,实用效果有待提高。

随着大数据的发展和算力的提高,深度学习在时序信号处理如语音识别、语音分离[18-38]、通信信号调制识别[39]上取得了巨大成功,展示出了深度学习强大的特征提取和时序信号处理能力。然而,深度学习在通信信号处理上的应用多见于常规的调制识别与分类任务,在单通道通信信号分离等复杂任务上尚未涉足。

本文提出的通信信号单通道盲源分离方法,引入了数据驱动的深度学习方法,采用基于Stacked-TCN的全卷积时域分离网络(convolution time-domain audio separation network,Conv-TasNet)分离框架。首先,使用1-D卷积对混合通信信号提取编码特征表示,将其作为输入。然后,使用时域卷积网络,训练得到纯净信号源的深层特征掩模,将每个信号源的掩模与得到的混合信号编码特征做Hadamard乘积,可以得到源信号的编码特征表示。最后,再次使用1-D卷积,对得到的源信号特征进行解码,得到原始波形。训练的损失函数采用比例不变信噪比,以此度量掩模估计准确度和信号分离准确度。实验结果表明,该方法有效提高了单通道通信信号盲源分离精度,具有较好的噪声鲁棒性。

1 盲源分离数学模型

x(t)=As(t)+n(t)

(1)

式中:A为混合矩阵;m为源信号的个数;n为接收天线阵元个数。当n

单通道欠定盲源分离瞬时混合模型为

(2)

2 Gonv-TasNet

为了对通信信号的深层特征进行有效提取,以提高分离精度,本文采用以Stacked-TCN为基础的Conv-TasNet框架进行训练。序列信号的准确分离需要较长的时间窗口信息,即长时依赖性,而时域卷积网(time-domain convolutional network,TCN)在序列信号建模和处理上的优越性能,可以满足语音信号、通信信号等序列信号的长时依赖性建模。每个TCN为一个1-D单元块,如图1所示。Gonv-TasNet结构如图2所示。

图1 1-D单元块结构图Fig.1 Structure of 1-D unit block

图2 分离模块网络结构Fig.2 Network structure of separation block

2.1 混合信号编码特征表示

对一维混合通信源信号使用1-D卷积进行线性编码特征表示。其中,使用512组卷积核,生成混合信号的多维编码特征,将多维编码特征表示作为分离网络的输入:

xencoder=hencoder(x)=w1*x+b1

(3)

式中:hencoder(·)为卷积操作;w1和b1分别为卷积核的权重和偏置。

2.2 源信号掩模生成

步骤 1首先,进行层归一化。层归一化[40]是对一个中间层的所有神经元进行归一化,使其输入分布在训练过程保持一致,解决每次的梯度下降更新参数导致的内部协变量偏移问题,从而增强模型的泛化能力,同时避免了梯度消失和梯度爆炸。再使用1×1卷积作为瓶颈层,以减少特征通道的数目。

步骤 2随后,特征进入堆叠的TCN,每个堆叠块包含4个TCN,其卷积核为空洞卷积核[18]膨胀率依次增加,分别为1、2、4、8。不同膨胀率的卷积核,可以有效提取并融合多尺度的时序通信信号特征,充分对信号分离的长时依赖性进行建模。其中,每个1-D单元块采用深度可分离卷积。深度可分离卷积[41]是普通卷积在通道上的分解,将一个卷积核分裂为独立的深度卷积(depthwise,DW)和点向卷积(pointwise,PW),可以有效减少参数数量,运算成本和模型大小,用于构建轻量级网络[19]。1-D单元块的残差网络连接方式,可以防止随着网络层数加深导致的训练退化问题。此堆叠块进行3次重复连接,将每一次堆叠输出作为下一次的输入,进一步加深网络层数,提取源信号的深层本质特征。对通信信号进行不同窗口不同尺度和深度的特征提取,有效融合多层特征。

步骤 3通过带泄露的修正线性单元(Leaky ReLU)作为激活函数,由于其导数不存在零点,可以防止负区间中神经元不学习问题。然后,再次使用1×1卷积瓶颈层,恢复特征通道数量,经过sigmoid激活函数,训练获得两个源信号的时域掩模:

(4)

步骤 4混合信号的编码特征实际包含了两个源信号编码特征,每个源信号存在潜在的时域掩模[18],通过时域掩模可以提取每个源信号的编码特征。将得到的每个源信号的时域掩模分别与混合信号的编码特征表示相乘,得到两个通信源信号的特征编码:

ssep=xencoder∘smask

(5)

式中:∘表示Hadamard乘积。

2.3 源信号波形恢复

对分离得到的通信源信号特征编码,采用1-D卷积反变换,进行512维特征解码,得到一维时域波形:

s*=hdecoder(xsep)

(6)

式中:hdecoder(·)为解码器。

3 网络训练

衡量盲源分离性能的基本分离评价指标通常采用比例不变信噪比(scale-invariant signal to noise ratio,SISNR)[42]。SISNR衡量了信号与分离误差的比值关系,SISNR越高,表明分离误差越低,分离性能越好。计算之前将源信号和分离后的源信号标准化为零均值,确保尺度不变。

网络训练时一般采用梯度下降法,需要最小化损失函数,因此采用负的SISNR作为损失函数,如式(7)所示,保证端到端的训练使得损失最小,SISNR最大,以确保模型训练的准确性。

(7)

通过反向传播梯度下降算法,进行参数更新:

(8)

(9)

(10)

反向传播梯度下降算法对编码部分、掩膜部分和解码部分的参数θ={θencoder,θmask,θdecoder}更新。其中,编码器参数集、掩模参数集、解码器参数集分别为θencoder={w1,b1},θmask={w2,b2},θdecoder={w3,b3}。

4 实验与结果分析

实验包括两部分。第4.1节为混合信号在20 dB高信噪比下的分离实验,根据SISNR损失函数值,与NMF、ICA算法对比验证Stacked-TCN方法的分离性能。第4.2节为不同信噪比的混合信号的分离实验,验证Stacked-TCN方法的泛化性能与噪声鲁棒性。

4.1 实验条件

实验采用的硬件资源为Tesla k80 GPU,Intel Xeon E5 2.60 GHz CPU,深度学习框架为PyTorch1.4。所有实验均采用五折交叉验证。

如图3所示,实验流程分为两部分:数据生成与混合部分,信号分离部分。在数据生成与混合部分,通过软件定义无线电平台GNUradio[39]生成5种调制方式BPSK、8 PSK、QAM16、QAM64、PAM4的通信数据,采样率为1 MHz,码速率为125 Ksymbol/s。参照表1中已有研究成果[43-46],结合仿真平台的实际运行效率,选择的信噪比范围为5~20 dB,步长为2.5 dB。在仿真中,假定不同来源的混叠信号具有相同的频偏和定时偏差,本文重点讨论不同算法中信噪比对分离效果的影响。

图3 实验流程图Fig.3 Experimental flow chart

表1 单通道盲源分离算法比较Table 1 single-channel blind source separation algorithms

每类信号在每种信噪比下生成1 000条纯净数据信号,每条数据含L=32 768个采样点,即为32.768 ms,满足分离任务的长时依赖性需求。首先,对纯净信号的幅值进行标准化处理。然后,采用如式(1)所示的线性瞬时混合模型,进行信号混合。将5种不同调制方式的信号两两混合,得到10种混合方式的数据,在每种混合方式中,将同信噪比的信号进行混合。10种混合方式数据分别为BPSK_16QAM、8PSK_64QAM、8PSK_PAM4、64QAM_PAM4、BPSK_8PSK、BPSK_64QAM、BPSK_PAM4、8PSK_16QAM、16QAM_64QAM、16QAM_PAM4,作为混合数据集,共70 000条样本。

在分离部分,分为3个模块:1-D卷积编码模块、分离模块、1-D卷积解码模块。

4.2 实验1:信噪比为20 dB下的算法性能对比

实验目的:Stacked-TCN算法与ICA[7]、NMF[47]两种经典机器学习算法,TasNet[48]、Wave-U-Net[49]两种深度学习方法在高信噪比下(信噪比为20 dB)进行对比分离试验,验证在理想的低噪声信号传输情况下,不同算法的分离性能。5种算法的基本参数配置如表2所示。

表2 不同算法的参数配置Table 2 Parameter configuration for different algorithms

ICA[7]和NMF[47]作为传统机器学习方法,是盲源分离领域的两种经典的算法。ICA利用动态嵌入将单通道观测数据转化为多通道数据进行分离,在正定和超定分离上性能优越,在单通道欠定分离方面的分离精度欠佳。NMF根据Kullback-Leibler散度最小化计算信源的基本矩阵和系数矩阵,实现信号分离。此类传统算法相当于浅层模型,不提取信号深层特征。TasNet[48]和Wave-U-Net[49]作为两种深度学习分离方法,可以实现信号的单通道盲源分离。TasNet网络采用编解码与分离模块的三级结构,分离模块中每个块采用长短时记忆(long short-term memory,LSTM)网络,其大量参数显著增加了其计算成本。Wave-U-Net网络通过重复进行特征图的下采样和卷积来处理时间序列上下文,在不同时间尺度上组合高级和低级特征,卷积产生的每个特征映射以原始信号的采样率作为分辨率,内存消耗较高。Stacked-TCN方法在分离模块采用空洞卷积,参数量减少,与LSTM相比,下一步计算无需等待上一步输出。

实验结果如表3所示,可以看出,Stacked-TCN方法损失最低,为-16.05 dB,其次是Wave-U-Net网络,损失为-13.97 dB,第3是TasNet网络,损失为-2.55 dB,最后是ICA和NMF算法,损失分别为4.09 dB和7.93 dB。在单通道通信信号盲源分离任务中,3种深度学习方法在SISNR上的性能明显优于传统的ICA、NMF盲源分离算法,其中,Stack-TCN方法的分离性能最佳。该算法的损失与其他4种算法相比平均降低了14.93 dB。

图4给出了Stacked-TCN算法在信噪比为15 dB,随机选取200个点的情况下,10种混合信号的波形部分结果图。可以看出,分离结果与源信号具有高度吻合性。这是由于多层的Stacked-TCN充分利用了通信源信号的深层次特征,深度神经网络优秀的拟合能力在学习时域掩模上发挥了重要作用。同时,空洞卷积的不同时间窗口随层数递增,对通信时序信号的长时依赖性进行了建模,融合不同窗口长度特征。

表3 20 dB混合信号下不同算法的损失值Table 3 Loss value of different algorithms under 20 dB mixture signals dB

图4 分离信号波形图Fig.4 Separated signals waveform diagram

4.3 实验2:信噪比为5~20 dB时的对比实验

实验目的:在信噪比为5~20 dB范围内,进行对比分离试验,验证在不同噪声的传输情况下,Stacked-TCN算法的泛化性能与噪声鲁棒性。图5给出了随着混合信号信噪比增加,不同算法的损失结果变化:① 随着信噪比的增加,Stacked-TCN方法的分离性能随之呈现增加的趋势,分离准确度增加;② 3种深度学习方法在不同信噪比下,性能均优于两种机器学习算法ICA和NMF,即便在较低信噪比下,分离精度亦占优势,其中Stacked-TCN与Wave-U-Net效果最为突出,对于噪声干扰,鲁棒性较强;③ Wave-U-Net方法在8PSK_64QAM、64QAM_PAM4两种混合信号的分离中,分离效果优于Stacked-TCN,但在其他情况下,存在波动与不稳定性,而Stacked-TCN方法整体较为平稳,呈现较好的下降趋势。

图5 不同信噪比下的损失变化Fig.5 Loss change under different signal to noise ratios

这是由于NMF和ICA作为模型驱动的机器学习方法,本质上是浅层模型,适合样本小、模型精的任务。然而,单通道盲源分离作为先验知识极少的难点问题,浅层模型不足以刻画其本质特征,未能充分利用信号的深层特征与信息,在泛化为大数据能力上较弱,因此在单通道极端病态条件下,分离性能不佳。当任务复杂,无法用模型驱动的方法精确刻画时,数据驱动的深度学习方法可以弥补模型上的困难,从大量样本中学习到深层本质特征,具有强大的拟合能力,满足信号分离等任务的需求。因此,Stacked-TCN、Wave-U-Net、TasNet的分离效果优于ICA和NMF。其中,TasNet网络采用LSTM作为block,大量参数增加了计算成本,为保证合理的网络模型和计算速度,需控制block的数量,对时序信号的建模准确性不够,因此效果较差。Wave-U-Net网络通过重复进行特征图的下采样和卷积来处理时间序列上下文,效果较好,但存在波动。Stacked-TCN方法在分离模块采用空洞卷积和,参数量减少,同等网络模型大小,可以增加block的重复次数,同时深度可分离卷积保证了不同窗口尺度信息的融合,因此在3种深度学习方法中,其准确性和稳定性上最优。

此外,计算了Stacked-TCN时域掩模法与时-频域掩模法每帧的计算时间,如表4所示,大多数时-频域掩模方法的信号分离研究中,STFT的窗口长度至少为256点[9-12],因此本实验单帧时长取为 0.256 ms,其计算时间为1.24 ms,较长的时间窗和计算时间,使得系统最低时延增加。而Stacked-TCN时域掩模法在不降低分离准确度的前提下,单帧时长可降至0.032 ms,其计算时间仅为7.90×10-3ms,具有较低的系统最小延迟。时-频域掩模法要成功地从时-频表示中分离源信号,需要混合信号的高分辨率频率分解,这需要较长的STFT时间窗,该要求增加了系统的最小延迟,限制了其在实时及低延迟应用中的适用性,因此越来越多的研究开始转向时域方法[18-31]。

表4 处理每帧所用时间Table 4 Times per frame ms

表5给出了不同算法分离混合信号的速度,在单样本的分离速度方面,时域分离方法中,NMF>ICA>Wave-UNet>TasNet>Stacked-TCN,NMF和ICA算法运行较快,但未对信号充分建模,牺牲了分离准确度。Wave-UNet、TasNet、Stacked-TCN运行速度相当。由于样本的长时采样点在Stacked-TCN中得到了充分利用,使得分离性能提高。

表5 分离混合信号所用时间Table 5 Times of separation s

5 结 论

基于深度学习框架Stacked-TCN的单通道通信信号盲源分离,免去了繁杂的特征工程,具有良好的泛化性能,克服了ICA、NMF等传统机器学习方法的泛化大数据能力弱的缺陷,解决了单通道分离中可行解爆炸问题。分离模块采用深度可分离卷积,卷积核为空洞卷积,减少了参数量,在分离之前提取信号的多尺度窗口深层特征以学习源信号的掩模,与TasNet和Wave-U-Net网络相比,具有较小的网络规模和更优的分离性能。

实验结果表明,该方法能够用于常见调制方式的混合信号分离,其损失函数比其他4种方法降低了9.11~36.63 dB。其意义体现在以下3方面:① 在5 dB低信噪比下,具备良好的分离性能和噪声鲁棒性;② 在保证分离精度的同时,具有较短的单帧处理时长和较低的系统最小延迟;③ 通过与信号处理系统的结合,提高前端处理模块的混叠信号分离精度。

猜你喜欢

掩模盲源单通道
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于干扰重构和盲源分离的混合极化抗SMSP干扰
基于直写技术的微纳掩模制作技术研究进展*
掩模图像生成时阈值取值的合理性探讨
掩模位置误差对光刻投影物镜畸变的影响
基于扩频码周期性的单通道直扩通信半盲分离抗干扰算法
改进的互信息最小化非线性盲源分离算法
盲源分离技术在化探数据处理中的思考与探索
Cr光栅掩模对金属平板超透镜成像质量的影响
一种基于时频分析的欠定盲源分离算法