联合相位谱与幅度谱的时频图干扰检测和样式识别
2023-10-10李扬清陈章烜洪江涛宋沅隆高秋雅张志龙
李扬清,陈章烜,洪江涛,宋沅隆,高秋雅,张志龙
(1.中国电子科技集团公司第七研究所,广东 广州 510310;2.北京邮电大学,北京 100876)
0 引言
随着无线电技术的多元化,各种无线用频系统的应用日益广泛,随之而来的是电磁环境日益复杂,各种自然干扰和人为干扰严重影响着无线用频系统的有效性和可靠性[1]。采用无线频谱监测的手段,对干扰信号进行检测,并对干扰样式(包括单音、多音、窄带、宽带、扫频、突发等)进行识别,然后针对不同样式的干扰采取相应的信号分析和抗干扰策略,将有效提高用频过程的可靠性。因此干扰检测和干扰样式识别一直是干扰认知领域的研究热点[2,3]。
传统的干扰检测主要采用能量检测或矩阵分解的方法,干扰样式识别则主要是基于信号特征的识别分类。基于能量或矩阵分解的干扰检测在低干噪比条件下检测精度较低[4];基于特征分类的干扰样式识别则存在计算复杂度较高、可识别样式不多等问题[5]。近年来,随着深度学习技术被逐渐引入到无线电信号分析领域,其在信号识别方面的研究成果已获得了相比传统方法更优的精度和复杂度性能。基于深度学习的无线电信号分析识别方法按照数据输入主要分为两种:基于信号时域IQ 数据的方法[6,7]和基于信号变换域的方法[8,9]。例如,在文献[6]中,Quan Zhou 等人提出了能够学习无线电信号IQ 数据时间特性的Res-LSTM 深度模型,并引入Inception 模块,得到了Inception-LSTM 网络模型,在高信噪比条件下识别准确率达到了97.5%。在文献[9]中,Xiangyu Wu 等人通过将IQ 数据进行SPWVD 时频变换得到一种时频图,并利用卷积自编码器去噪,最后将去噪后的图像输入残差网络对调制信号进行识别和分类,在信噪比-2 dB 时达到了92.86%平均识别准确率。
虽然现有的变换域方法在特定数据集下获得了较好的识别性能,但其只利用了信号时频变换的幅度信息[9],未有效利用时频变换的相位信息,在进一步优化性能上存在瓶颈。考虑到语音识别领域已有研究通过联合利用语音信号的幅度和相位信息获得了很好语音识别效果。例如文献[10]从概率的角度提出了一种结合幅度谱和相位谱特征的算法,并推导出音高置信度度量,避免了倍频程误差和模糊估计,使得对语音的识别估计在低信噪比情况下依旧有效。而在无线电信号识别领域,信号相位同样是很具有辨识度的信息,将相位谱图与传统的幅度谱图相结合的时频图有望提升干扰检测与样式识别性能。
本文提出一种基于联合相位谱图与幅度谱图的时频图深度目标检测识别方法。在传统的时频幅度谱图的基础上,采用差分相位谱的三角变换来构建无相位跳变和相位模糊的相位谱图,并采用基于图像的深度目标检测网络模型YOLO-v5[11]对联合相位谱图与幅度谱图的时频图像进行训练、识别与检测。仿真实验结果表明,结合幅度谱图与相位谱图的图像目标检测深度模型能够很好地检测与识别干扰信号,相比于单纯的幅度谱检测方式获得了更高的目标检测准确率。
1 基于差分三角变换的相位谱图生成
图1 BPSK信号幅度谱伪彩图(左)和相位谱伪彩图(右)
考虑到目标信号部分与噪声部分相位的变化分布的不同,本文提出一种基于差分三角变换的相位谱图生成方法:首先在频率维度对原始相位谱P进行差分变换来增大目标信号与噪声在相位谱图上的区分度,然后对差分相位谱进行三角变换以消除-2π 与+2π 的弧度角跳变。数学上,差分三角变换后的相位谱可表示为
其中,△P为相位谱矩阵P在频率维度的一阶前向差分变换,cos(·) 和sin(·) 分别为三角余弦和正弦变换。BPSK 信号的变换后的相位谱示意图如图2 所示。由图2右图可见,变换后的相位谱消除了原相位谱中的相位跳变和相位模糊,修复后的相位谱显示出对称性纹理。
图2 BPSK差分变换后的相位谱伪彩图(左)和三角余弦变换后的相位谱伪彩图(右)
2 基于YOLO-v5的联合相位谱与幅度谱的干扰检测与样式识别
本文采用基于图像的深度目标检测网络对相位谱图M与幅度谱图Pcos,Psin构建的时频图像进行训练、识别与检测。
图像目标检测网络分为两大类:基于局部特征的方法(如Faster R-CNN[13])以及基于全局特征的方法(如YOLO[11,14])。基于局部特征的方法在检测精度上具有优势,但是检测流程复杂、计算开销大。基于全局特征的方法具有简单的计算流程,在检测精度和计算开销之间能够取得较好的平衡。
YOLO 是一种常用的基于全局特征的目标检测方法,该方法已经过多次改进[11,14-16],目前最新的YOLO-v5 方法在保持低计算开销的情况下检测性能已经超过Faster R-CNN等基于局部特征的方法。考虑到本文涉及的应用场景对算法的精度、适应性和实时性均具有较高要求[12,17],本论文选用YOLO-v5 作为图像目标检测网络。
YOLO-v5 网络的训练可以分为2 步:第1 步是卷积层负责从图像中提取描述性特征;第2 步的学习过程包括最小化一个多项的损失函数,其中的每项都体现了任意边界框预测的定位或分类的错误。本文采用在文献[18]中定义的广义交并比(gIoU)作为定位损失函数(box_loss),还引入了YOLO-v5 经典的分类损失(cls_loss)与置信度损失(obj_loss)来分别表示对目标分类的准确性与网络的置信度。最终,总体损失函数表示为所有平方误差项的加权和,在训练过程中调整权重以满足对特定目标的检测。YOLO-v5 网络架构如图3 所示。
图3 YOLO-v5网络架构图[19]
下面给出本文所提基于YOLO-v5 的联合相位谱图与幅度谱图的干扰检测和干扰样式识别算法的具体流程:
步骤1:对频谱感知设备采集到的时域IQ 信号s进行STFT 变换得到时频矩阵S;
步骤2:按式(1) 得到幅度谱和原始相位谱P,对幅度谱M进行归一化;
步骤3:按式(2) 得到差分三角变换后的相位谱Pcos,Psin;
步骤5:采用YOLO-v5 网络对样本库进行训练;
步骤6:将训练完成的YOLO-v5 网络模型用于新样本的推理,得到所识别干扰信号目标的边界框、预测类别以及置信度。
相应的联合相位谱+幅度谱的YOLO-v5 干扰检测和样式识别算法流程如图4 所示。
图4 联合相位谱+幅度谱的YOLO-v5干扰检测和样式识别算法流程图
3 仿真实验与分析
在本文的仿真实验中,首先通过仿真生成存在单音,多音,窄带(包括BPSK,QPSK,OQPSK,8PSK,16QAM,16APSK,2ASK,2FSK,DSB-AM,SSB-AM,FM 共11 种单载波调制信号),扫频(chirp 信号)共14 种干扰样式的IQ 复数信号样本[20]。具体来说,每个样本长度为214,样本中在时间和频率维度上随机存在2 个任意样式的干扰信号,信号能量比为3 dB,干噪比范围为[0 :2 :18] dB(噪声以能量较小干扰信号为参照)。对IQ 样本按照算法流程步骤1 至步骤4 处理得到时频图样本,其中STFT 选择的窗长为1 024,窗函数选用hamming 窗,FFT 点数为1 024,滑窗步长为128。最终构建的时频图样本库样本量为4 000,其中随机选择3 200 个样本作为训练样本,剩余800 个样本作为测试样本。
采用前文所提YOLO-v5 深度模型对幅度谱和相位谱对时频图样本库的训练样本进行训练后,对测试样本进行检测和识别。在仿真中选取YOLO-v5 中的YOLOv5s 轻量化模型,便于在计算资源紧缺的硬件上应用部署。YOLO-v5s 的backbone 基于pytorch 实现。仿真过程中,优化器采用SGD+momentum,以解决minibatch SGD 优化算法更新幅度摆动大的问题,同时使得网络的收敛速度更快。学习率调整策略使用余弦退火,初始学习率为0.01,最终学习率为0.000 1。采用warmup 预热训练3 轮,以提升训练稳定性,加快模型收敛速度。数据增强方面采用了平移,缩放,翻转,色彩空间调整和mosaic 数据增强法,以提升模型的鲁棒性和泛化能力,降低模型对图像的敏感度。训练的batchsize 为64,训练轮次为500 个epoch。以上仿真参数、训练及增强策略均依据yolo-v5(6.1 版)[11]中给出的推荐取值和策略,并经过仿真反复对比验证最终确定。此外,仿真实验采用X64 的硬件平台,CPU 为Intel 至强 Gold 6240(2.60 GHz),GPU 为Tesla V100 SXM2 32GB(CUDA 11.1)。
图5 为采用YOLO-v5s 深度模型分别对仅使用幅度谱样本集以及联合幅度谱和相位谱的样本集进行训练的过程中,验证置信度损失validation loss 随训练轮次(epoch)的变化曲线图。由图5 可知,本文所提的结合幅度与相位谱图作为输入的YOLO-v5s 模型的validation loss 随训练轮次增加而下降,然后趋于稳定并最终达到收敛,且收敛后与单幅度谱作为输入的YOLO-v5s 模型相比其validation loss 更低,表示YOLO-v5s 网络对所提结合幅度与相位谱图数据集的拟合效果更优,检测识别结果的置信度更高。
图5 训练loss随训练轮次的变化曲线图
图6 和图7 分别为采用YOLO-v5s 深度模型对仅使用幅度谱样本集,以及联合幅度谱和相位谱的样本集进行训练后,对测试样本进行检测识别测试得到的识别准确率度量指标(平均识别精度(mAP,mean Average Precision)和召回率(recall))的结果曲线。其中,识别精度=TP/(TP+FP),召回率=TP/(TP+FN),TP(True Positive)表示实际为正样本预测为正样本的数量,FP(False Positive)表示实际为负样本预测为正样本的数量,FN(False Negative)表示实际为正样本预测为负样本的数量。
图6 mAP随训练轮次的变化曲线图
图7 recall随训练轮次的变化曲线图
从图6 和图7 可知,本文所提的结合时频图与相位谱图作为输入的YOLO-v5s 识别精度,相对于只利用幅度谱图的识别精度更高。具体来说,幅度谱+相位谱收敛后的mAP 最终达到了86.466%,相对于单幅度谱80.554% 的mAP 有5.912% 的提升;幅度谱+相位谱收敛后的recall 最终达到了94.661%,相对于单幅度谱84.116% 的recall 有10.545% 的提升。这说明了引入相位谱图能有效提高干扰信号检测识别的准确率。
表1 对采用YOLO-v5s 模型对仅使用幅度谱样本集,以及联合幅度谱和相位谱的样本集进行训练后的干扰检测识别性能的相关指标结果进行对比。
表1 单幅度谱及联合幅度谱和相位谱的YOLO-v5s干扰检测识别性能指标对比
图8 为对测试样本集中具体的干扰样本进行干扰检测和样式识别的结果,得到所识别干扰信号目标的时间和频率边界框、预测信号类别以及置信度。在图8 的测试样本中,左图的样本同时存在时频重叠的QPSK 和DSB-AM 信号,右图的样本则同时存在时频重叠的2FSK 和16QAM 信号。QPSK(左图)和2FSK(右图)分别相对于DSB-AM(左图)和16QAM(右图)的信号能量比为3 dB,干噪比为0 dB(即QPSK 比噪声和2FSK 比噪声为0 dB)。
图8 测试样本干扰检测识别结果
从图8 的测试样本的检测识别结果可知,本文所提算法能够很好地将某一干扰信号在时频图中检测和识别出来,且对两两混叠的干扰信号也具有很好的检测与识别效果。具体来说,图8 中4 种干扰信号都能被有效检测和(时频维度上)定位,且信号样式均识别正确,DSB-AM、QPSK、2FSK 和16QAM 的识别置信度分别为96.78%、90.35%、92.43% 和85.20%。
此外,在复杂度方面,幅度谱图和相位谱图在对IQ信号进行STFT 变换时可以同时生成,并引入差分三角变换对相位谱图进行矩阵元素维度的直接处理。上述操作仅为深度目标检测网络的数据预处理过程。本文方法的复杂度主要来源于是检测网络的运行开销,这里直接使用YOLO-v5 网络进行检测,并不涉及网络结构的修改,因此本文所提的结合时频图与相位谱图作为输入的YOLO-v5识别方法和只利用幅度谱图的YOLO-v5 识别方法的计算复杂度均与YOLO-v5 网络的计算复杂度基本一致。
4 结束语
针对干扰认知领域中的干扰检测和干扰样式识别问题,本文提出了一种基于联合相位谱图与幅度谱图的时频图深度目标检测识别方法。该方法在传统的时频幅度谱图的基础上,新增加了基于差分三角变换的相位谱图,并采用基于图像的深度目标检测网络YOLO-v5 进行训练和推理。实验结果表明本方法能够很好地检测干扰和识别干扰样式,相比于单纯的幅度谱检测方式,提高了检测识别的准确率。