基于生成对抗网络的OFDM 信号生成
2023-12-06许思扬刘承享徐福琛刘光辉
陈 丽,许思扬,刘 芳,冯 奇,刘承享,徐福琛,田 淼,刘光辉*
(1.中国电子科技集团公司第五十四研究所 石家庄 050051;2.电子科技大学信息与通信工程学院 成都 611731)
引用数字信号自主生成是认知通信对抗领域的研究热点[1-2],即通过生成与敌方信号高度近似的数字信号,逃脱敌方设备的物理层认证[3],实现欺骗干扰。该技术在通信干扰、通信对抗以及电子战领域具有重要研究意义。
在传统的通信对抗中,面对未知的敌方信号,需要先进行信道和信号参数估计,再对信号进行跟踪式干扰,或在对敌方信号识别失败的情况下直接进行阻塞式干扰[4]。但随着通信和网络技术的发展进步,电磁信号呈现出多模式、多制式、智能化、高度自适应和快速捷变等特点。为满足不同通信场景的差异化需求,人们设计了多种复杂的无线通信协议。面对未知的复杂协议信号,传统干扰方法存在识别难、生成难的问题[1]。另外,使用传统方法针对不同的协议生成干扰信号时,需要不同的硬件实现,不仅存在巨大的硬件开销且缺少足够的灵活性和泛化能力。
在各类复杂协议信号的调制中,正交频分复用(OFDM)应用最为广泛,如移动通信的4G 及5G 通信[5-6]、数字视频广播(DVB)、无线局域网等均使用了OFDM 调制,但这些协议采用了不同的信号帧结构。为克服传统干扰方法在不同参数信号间迁移能力的不足,本文使用基于机器学习的算法实现复杂协议OFDM 信号的自主生成。
传统的机器学习生成模型,如高斯混合模型[7]、隐马尔可夫模型[8]、极大似然法等,依赖于对真实样本概率密度函数的先验假设,面对分布复杂的数据难以生成逼近真实样本的数据。作为目前在机器学习领域最热门的生成模型,生成对抗网络(generative adversarial networks, GAN)相较于上述传统生成类算法的最大优势在于不用对数据分布做任何假设[9],通过生成器和判别器的对抗性学习,可以自主学习真实样本的数据分布。GAN 已在语音信号增强、图像处理、音乐、视频生成等诸多领域取得成功。在这些应用中,GAN 生成的图片或数据具有较强的空间相关性。但OFDM 信号在时域具有类似噪声的特点,不利于特征提取和数据分布的拟合,直接将时域OFDM 信号作为GAN训练的真实样本可行性低。
在利用GAN 进行通信信号生成方面,文献[10]提出了基于条件GAN(conditional GAN, CGAN)的调幅(AM)信号和连续相位频移键控(CPFSK)信号的生成。但是该方案仅考虑了生成信号的时域波形与AM 和CPFSK 的波形的相似性,没有从载波频率、信号幅度等参数角度分析生成信号是否合理。文献[2]利用边界平衡GAN(boundary equilibrium GAN, BEGAN)实现了单载波BPSK 和8PSK 信号生成。文献[3,11]提出了基于GAN 的欺骗干扰信号生成模型,生成的信号可以绕过敌方物理层信号认证,有效降低了敌方接收机的分类准确率。文献[12]利用CGAN 模拟信道特性,生成了经过特定瞬时信道的时域信号。以上的信号生成方案都有效地生成了特定调制方式的单载波信号,但难以适用于多载波信号生成。目前针对多载波信号生成的研究比较少,文献[13]利用双向GAN(Bidirectional GAN,BIGAN)和CGAN将在不同信道条件下的OFDM 信号互相转换,但该方案仅考虑了信号的幅度分布,没有保证信号的调制方式,子载波结构不变。
为解决上述问题,本文利用GAN 实现OFDM信号生成,主要贡献如下。
1)为解决OFDM 信号时域类噪声、不容易提取特征的问题,在信号生成架构中用FFT 对OFDM时域信号进行预处理,得到时频二维图样。
2)为解决单判别器GAN 生成的信号难以同时满足复杂协议要求的子载波结构(传输数据的子载波和导频子载波的分布)和数据符号调制方式的问题,本文设计双判别器GAN 实现时频二维图样生成,双判别器分别学习信号的子载波结构和星座分布。
3)提出了适用于OFDM 信号生成的架构,该架构可以实现特定复杂协议下不同参数OFDM 复杂协议信号的生成。为在未来实现用统一架构生成更广泛的复杂协议干扰信号奠定了基础。
1 系统模型
OFDM 调制技术是多载波调制的一种,其将高速数据流转换成并行的低速子数据流并调制到每个子载波上进行传输,具有较好的抗多径衰落能力,是目前无线通信应用最为广泛的调制技术。OFDM 信号生成流程如图1 所示。首先,输入的比特流被映射到相移键控(PSK)或正交振幅调制(QAM)的星座点上,它是由星座平面上的同相分量和正交分量(IQ)组成的。然后,通过串/并转换将调制符号映射到并行的NFFT个数据流(用于传输数据的子载波)中。再将导频符号以梳状模式插入每个频域OFDM 符号。经过NFFT点快速傅里叶逆变换(IFFT)将得到的频域OFDM 符号转换为时域。为避免符号间干扰,在每一OFDM 符号前添加循环前缀(cyclic prefix, CP)。最终通过并串转换后得到OFDM 信号。
图1 系统模型
传统信号生成器发送的OFDM 信号s在受到无线信道中加性高斯白噪声(AWGN)的影响后被接收机接收。经过本文提出的基于GAN 的OFDM 信号生成系统处理后生成与输入信号高度相似的采样信号s′。
rs′与接收信号 相比, 携带不同信息但具有相同的子载波结构(传输数据的子载波和导频子载波的分布)和调制方式。
2 生成对抗网络算法基础
GAN 主要包含生成器和判别器两大模块,其一般架构如图2 所示[14]。
图2 GAN 一般架构
生成器的作用是生成尽可能逼近真实样本的数据,判别器的作用则是尽可能准确区分生成器生成样本与真实样本,并将判别结果反馈给生成器。生成器和判别器不断循环对抗,直至判别器无法正确区分生成样本与真实样本。常规GAN 的目标函数为:
式中,G表 示生成器;D表示判别器;x代表真实数据;z表示随机噪声。
常规GAN 存在训练困难的问题,如模式崩溃等,因此许多改进方案被提出。WGAN(Wasserstein GAN)[15]、带梯度惩罚的WGAN(WGAN gradient penalty, WGAN-GP)[16]、CGAN[17]、信息最大化GAN(information maximizing GAN, Info-GAN)[18]等通过改变常规GAN 的目标函数、增加输入条件等使GAN 有更好的学习能力、更快的收敛速度和更好的训练稳定性。
本文应用最小二乘生成对抗网络[19](least squares GAN, LSGAN),利用最小二乘损失函数惩罚距决策边界正确一侧很远的虚假样本,让LSGAN 生成器生成数据更接近真实样本,并且该目标函数具有最小皮尔逊χ2散度(Pearson χ2divergence),在训练时比常规GAN 有更好的稳定性。其目标函数为:
式中,a、b分别是虚假样本和真实样本的标签;c表示判别器判别样本真假的决策边界。
3 基于生成对抗网络的OFDM 信号生成方案
3.1 整体架构
本文提出的基于生成对抗网络的OFDM 信号生成系统如图3 所示。系统的输入为带噪声OFDM采样信号。在已知快速傅里叶变换(FFT)点数和CP 长度的条件下,将其进行串并转换后利用FFT将时域信号转换到频域。经过预处理后得到时频二维图样并将其作为真实样本输入本文提出的双判别器GAN 进行训练。训练完成后,将生成器生成的时频二维图样进行IFFT 和并串转换,即可得到与输入信号具有相同子载波结构和调制方式的OFDM时域采样信号。
图3 基于生成对抗网络的OFDM 信号生成系统
尽管本文的具体架构是针对OFDM 信号提出的,但面对其他未知的多载波信号时,如果可以使用其他的处理方法将时域信号转换为时频二维图样,仍然可以使用本文中提出的架构进行信号生成。
3.2 时频二维图样
基带OFDM 时域信号由若干正交子载波的时域序列叠加而来。根据中心极限定理,OFDM 时域信号服从均值为零的高斯分布[20],有类似噪声的特性,使用神经网络难以从中提取特征。而OFDM频域信号包含的特征更为明显,更利于神经网络的学习。
因此,为解决GAN 提取OFDM 信号时域特征困难的问题,本文首先对接收到的包含AWGN 的OFDM 时域信号r进行预处理。先将r进行串并转换并去掉CP 后,得到维度为NT×NFFT的矩阵R,其中NT为OFDM 符号数量,NFFT为FFT 点数。矩阵的每一行代表一个时域OFDM 符号。将矩阵R中的每一行进行FFT,将信号从时域变换到频域即得到时频二维矩阵,其中向量rˆi(1 ≤i≤NT)为 维度为NFFT×1的列向量。对所有的向量rˆi进行如下的归一化处理:
式中,‖ ·‖∞表 示向量无穷范数;j为虚数单位。归一化后矩阵中的每个元素的实部和虚部的取值范围为[0,1]。
提取矩阵Rnorm的每一个元素实部和虚部且分别组成新的时频二维矩阵 ℜ(Rnorm)和 ℑ(Rnorm)。以单通道灰度图像的形式存储上述矩阵并将其作为双判别器GAN 的训练样本x。由于r受到AWGN的影响,训练样本x中表示虚拟子载波的像素点幅度满足高斯分布。
本文以Wi-Fi 802.11a 协议中数据部分的OFDM信号为例,该信号经过上述预处理后得到的实部时频二维图样如图4 所示。其中,NT=100,NFFT=64。在64 个子载波中有48 个数据子载波,每个数据子载波上搭载了随机的QPSK 符号,在实部时频二维图样中为黑白交错的像素点;4 个搭载导频的子载波为白色;剩余的12 列为虚拟子载波,在图样中为灰色。
图4 时频二维图样(实部)
3.3 图样-星座双判别器GAN
若采用常规的单判别器GAN 对生成的时频二维图样进行训练,生成图样具有正确的子载波结构,即数据子载波、导频、虚拟子载波位置。但是,生成图样中表示数据符号的像素点幅度随机分布,而在真实图样中,数据符号的幅度分布在特定调制方式(BPSK/QPSK)下的星座点附近,生成信号的调制方式不满足协议中的规定。另外,生成器输出容易落入激活函数(Tanh)的饱和区,导致梯度难以回传。为了解决上述问题,本文在原有单判别器GAN 的基础上增加了判别器D2,用于区分生成图样与训练样本图样的幅度分布,一旦分布偏离真实样本,生成的时频图就被判别器D2判断为假。为了欺骗判别器D2,生成器生成的时频图的幅度分布会逼近真实样本,因此生成图样与训练样本图样具有相同的调制方式。同时生成图样的分布被限制在激活函数的非饱和区,梯度消失得以缓解。提出的双判别器GAN 结构如图5 所示。
图5 图样-星座双判别器GAN 网络结构
3.3.1 网络总体结构
为了判断时频二维图样中数据符号调制星座的分布的真假,判别器D2的输入分别为真实图样和生成图样的星座密度图[21]。生成星座密度图包含量化和统计的过程,若在GAN 训练过程中直接将时频二维图样转换为星座密度图会令梯度无法反向传播,使得判别器D2无法约束生成器。为了解决上述问题,本文提出了图样-星座转换网络,该网络是离线训练的,其功能是实现时频二维图样到星座密度图的转换。
经过验证,本文提出的图样-星座双判别器GAN 生成的图样在子载波结构和数据符号的星座分布上均与真实信号相同。
本文使用LSGAN 作为基网络。分别采用0、1 表示虚假样本和真实样本的标签,并且为使生成器生成样本尽可能真实,令判别器判别样本真假的决策边界为1。结合式(3)和式(4),双判别器的LSGAN 的目标函数定义如下:
式中,λ1和λ2分别表示图样判别器D1和星座判别器D2损失函数的权重。
3.3.2 图样-星座转化器
数据符号的调制方式体现在时频二维图样像素点的幅值分布中。但对于神经网络而言,难以直接学习到像素点的幅度分布。因此,本文统计像素点分布,并将分布信息转化为图像输出。
如图6 所示,时频二维图样转换为星座密度图包括以下步骤。
1)量化统计。本文将 [0,1]等分为n个量化区间,把时频二维图样第i行的NFFT个像素点的幅度用向量表示,每一行像素点幅度落在第k个量化区间的个数yi,k为:
式中,u(t)是单位阶跃函数。
2)归一化。将步骤1)得到的n维向量yi=[yi,1,yi,2,···,yi,n]T进行如下归一化:
3)拼接。将向量y˜i拼 接为维度为NT×n二维矩阵,该矩阵即为星座密度图。通过星座密度图可以清晰观察到时频二维图样中的幅度分布。
由于:
因此向量yi关 于xi的 梯度矩阵∂yi/∂xi中绝大部分元素为0,导致梯度回传困难,最终无法训练。
因此,为避免量化统计过程造成的梯度消失,本文采用自编码器(auto encoder, AE)进行时频二维图样到星座密度图的转换,并让AE 生成的星座密度图尽可能逼近信号实际的星座密度图。自编码器包括编码器和译码器两大模块,通过利用输入层与输出层之间的映射关系,可以对时频二维图样进行实现星座特征提取和星座特征输出,其中编码器用于提取数据分布特征,译码器用于数据分布特征的重构输出。本文使用卷积自编码器(CAE)[22]拟合时频二维图样到星座密度图的量化统计流程,即图5 中的图样-星座转化器,其损失函数如下:
式中,y˜i,k和Ci,k(x) 分 别为矩阵y˜和C(x)(图样星座转化器的输出)的第i行 第k列的元素。图样-星座转化器通过3 层卷积层提取时频二维图样上像素点的星座分布特征,利用4 层转置卷积层对特征进行重构输出,生成星座密度图,并使生成星座密度图与实际星座密度图均方误差(MSE)尽可能小。图样-星座转换器具体结构如图7 所示,对每个卷积层的输出都使用了批量归一化来限制网络各层输出的分布,令其位于激活函数的非饱和区[23],从而缓解了梯度消失。
图7 图样-星座转换网络结构
3.3.3 生成器结构
生成器由转置卷积和卷积神经网络构成,具体结构如图8 所示。在图样结构和星座数据双判别器作用下,将输入的随机噪声转化为逼近真实样本的时频二维图样。
图8 生成器结构
3.3.4 判别器结构
判别器由卷积神经网络构成,具体结构如图9所示。作用是尽可能正确区分输入的真实样本和生成样本,其中判别器D1为图样判别器,目的是区分生成时频二维图样和真实时频二维图样在子载波结构上的差别,判别器D2是星座判别器,目的是区分生成时频二维图样中数据符号星座分布和真实图样的数据符号星座分布。通过双判别器的制约,生成器生成样本将从子载波结构和数据分布两个方向逼近真实样本,使得生成信号与真实信号具有相同的子载波结构和调制方式。
图9 判别器结构
3.3.5 网络复杂度分析
本文中提出的双判别器GAN 网络结构主要由卷积神经网络和转置卷积神经网络组成。该网络的时间复杂度和空间复杂度是各个卷积层以及转置卷积层时间和空间复杂度的累加。
本文用输入一个样本,模型进行前项传播发生的浮点运算次数(floating point operations, FLOPs)来衡量时间复杂度。卷积层的时间复杂度由卷积核面积、输出特征图面积以及输入输出通道数决定。转置卷积层与卷积层相反,其时间复杂度与输入矩阵尺寸有关,与输出特征图面积无关[24]。同时,本文用模型的参数数量和各层的输出特征图占用的内存空间来衡量网络的空间复杂度。卷积层和转置卷积层的参数数量都与卷积核大小和输入输出通道数有关,而输出特征图占用的空间与输出特征图面积和输出通道数相关。本文使用pytorch 中的Thop库对图样-星座双判别器GAN 各个模块的时间复杂度和空间复杂度进行了统计,统计结果如表1 所示。根据统计结果,生成一个OFDM 信号样本所需的时间复杂度为1.78×109Flops,占用的内存空间为1.65×107B。
表1 图样-星座双判别器GAN 各个模块的时间和空间复杂度
4 实验与结果分析
为了验证本文提出的基于图样-星座双判别器GAN 的复杂协议OFDM 信号生成模型的有效性,选用Wi-Fi 802.11a PLCP 协议数据单元(PCLP Protocol Date Unit, PPDU)中的数据段作为真实信号进行信号生成实验。
数据段由OFDM 符号构成,子载波个数NFFT=64,其中搭载数据符号的子载波个数为48 个,分别位于第2~7,9~21,23~27,39~43,45~57 和59~64 个子载波;导频占据4 个子载波,分布在第8、22、44、58 个子载波;其余的12 个为虚拟子载波。信号带宽为20 MHz,每个OFDM 符号持续时间为 4 us, CP 长度为 0.8 us,在采样率为20 MHz 的情况下,一个OFDM 符号包含80 个采样点,其中CP 包含16 个采样点,调制方式为BPSK/QPSK,优化器为Adam。表2~表4 分别给出了仿真参数和模型训练所选用的超参数。
表2 仿真参数
表3 图样-星座转换网络训练超参数
表4 图样-星座双判别器GAN 训练超参数
本文将从时频二维图样和时域信号两个角度对生成信号进行评估,从而验证本文提出的OFDM信号生成模型的有效性。
4.1 时频二维图样分析
图10 给出了图样-星座双判别器GAN 和单判别器GAN 生成的时频二维图样对比。可以看到,单判别器GAN 和双判别器GAN 生成时频二维图样在子载波结构上一致,都满足Wi-Fi 802.11a PLCP 协议中的规定。生成的图样中第1 和第28~38 列为灰色,代表虚拟子载波;实部图样中第8、22、44 和58 列为白色,虚部图样中第8、22、44和58 列为灰色,对应导频符号所在的子载波;其余的48 列中黑色和白色的像素点随机排列,对应数据子载波。
图10 双判别器GAN 和单判别器GAN 生成的时频二维图样
图11 分别给出了单判别器GAN、双判别器GAN 生成图样和作为训练样本的真实时频二维图样的像素点幅度概率密度,左边为实部图,右边为虚部图。可以看到,单判别器GAN 生成图样数据符号幅度随机分布,不符合BPSK/QPSK 的调制方式要求。而双判别器GAN 生成图样的幅度分布与真实训练样本的幅度分布比较接近。这说明判别器D2的损失函数成功回传到了生成器,生成的时频图可以欺骗判别器D2。
图11 时频二维图样的幅度概率密度
表5 给出了时频二维图样与无噪声图样的MSE,具体计算如下。
表5 时频二维图样与无噪声图样的MSE
式中,xTheory是距离最近的有限字符集中的字符,虚拟子载波xTheory∈{0+0j}, 导频xTheory∈{1+0j}, BPSK 数据符号/xTheory/∈{ ±1+0j},QPSK数据符号。MSE 越小,表示两组数据间越接近,信号噪声越小。可以看出,相比真实图样,无论是单判别器还是双判别器GAN 生成图样都具有更大的噪声,但双判别器GAN 的MSE 与真实图样更接近,尤其是在SNR =10 dB 的情况下。
综上所述,本文提出双判别器结构在约束生成样本分布上优于单判别器,可以实现Wi-Fi 802.11a PLCP 协议OFDM 信号生成。
4.2 时域信号分析
对生成的时频二维图样的进行IFFT 和并串转换即可得到的时域OFDM 信号。图12 给出了双判别器GAN 生成的和真实的时域信号波形,图中蓝色曲线为生成波形,红色曲线为真实波形。根据对比,双判别器GAN 生成的OFDM 符号与Wi-Fi 802.11a PLCP 协议的数据段OFDM 符号都呈现近似噪声的特性。
5 结 束 语
本文提出了一种基于生成对抗网络的OFDM信号生成方案。首先针对OFDM 时域信号特征难以提取的问题,利用FFT 对时域信号预处理,得到了容易提取特征的时频二维图样作为GAN 训练样本。并且针对常规GAN 难以学习到图样中数据符号的星座分布的问题,提出了双判别器GAN。相比常规的单判别器GAN,双判别器GAN 同时约束图样和星座密度,令生成样本满足真实信号的子载波结构和调制方式。
本文对多载波信号生成进行了初步探索,但需要已知OFDM 符号周期等先验信息。在未来需要实现符号周期自主识别,以提高模型的实际应用能力。同时本文只考虑了AWGN 信道,在实际中截取的信号可能会受到多径信道的影响,因此进一步探索在多径信道下的信号生成方案是有必要的。