APP下载

基于PCA 联合K-Means聚类的雷达信号分选算法

2020-06-23翁永祥赵万磊郑志娟

舰船电子对抗 2020年2期
关键词:信噪比个数聚类

翁永祥,赵万磊,郑志娟

(中国电子科技集团公司第五十一研究所,上海201802)

0 引 言

雷达信号分选是指对侦察接收机截获到的密集信号流进行解耦合,形成脉冲描述字(PDW),并从中提取信息将PDW映射到不同辐射源。信号分选是后续电子对抗决策的基础,也是当前电子侦察系统中信号处理的核心部分[12]。随着新体制雷达技术的发展,其采取的复杂波形、参数捷变等技术导致当前战场电磁环境愈加复杂,已有文献显示,相对于20世纪70年代,当前电磁环境的信号流密度和信号波形种类都已呈现指数级的增长[3],在这种情况下,传统的基于直方图的信号分选算法已不能适应当前作战需求。

聚类分析作为统计学习理论中一种常用的非监督数据挖掘方法,具备计算简单、收敛速度快、易于实现等优点,逐渐被应用于复杂电磁环境下的信号分选,并取得了一定的成果。文献[4]针对噪声背景下的雷达信号分选问题,提出一种基于自组织特征映射神经网络的聚类方法,对捷变频雷达信号取得了较好的分选效果;文献[5]提出一种基于密度聚类(DBSCAN)的PDW数据二次分选方法,在一次分选结果的基础上进一步提取微弱雷达信号,并利用仿真数据验证了其有效性;文献[6]针对存在重频参差、信号交叠、局部脉冲丢失等复杂电磁环境信号分选问题,基于PRI估计变换提出一种联合数据场和聚类的雷达信号分选方法,具备运算效率高、对噪声不敏感等优点;文献[7]和文献[8]研究了K-Means算法在雷达信号分选领域的应用,针对K-Means算法存在的聚类数目需要预先设定问题,分别利用蚁群算法,数据场方法等对K-Means算法进行优化,自动确定聚类数目的同时能够获得较好的信号分选结果。上述分析都是假设接收到的雷达信号信噪比较高,而实际电磁环境较为复杂,接收到的雷达信号不可避免地会混杂着噪声分量,而噪声分量的存在会导致PDW数据中也存在随机噪声,从而影响随后的信号分选性能[9]。

本文在上述研究的基础上,针对K-Means算法存在聚类数目确定及对噪声数据敏感问题,提出一种基于主成分分析(PCA)模型[1011]联合K-Means算法的雷达信号分选方法,首先利用PCA算法将PDW投影至特征空间,然后在特征空间中根据特征值分布情况确定聚类个数的同时实现对PDW中存在噪声分量的抑制,最后利用K-Means算法将主分量个数作为聚类个数,并对噪声抑制后的数据进行聚类。基于仿真数据的试验结果表明,所提方法可以获得更高的正确分选性能,并且具备噪声稳健性。

1 PCA 联合K-Means聚类算法

1.1 K-Means算法原理

(1)设定聚类个数K;

(2)从数据集中任意选出K个样本作为初始的聚类中心,记为C i1,C i2,…,C iK,上标i表示当前的迭代次数;

(3)计算数据集中每个样本与当前聚类中心的距离,并将其分配至离它最近的聚类中心对应的子集中,得到K个子集,记为S i1,S i2,…,S iK,样本与聚类中心之间的距离定义如下:

(4)根据步骤(3)的聚类划分,按照下式计算当前划分下的聚类中心,其中n k为第k个子集中的样本数。如果聚类中心不再发生变化,即C i+1k=C ik,则迭代终止,此时的聚类结果即为误差平方和最小准则下的最优聚类,若Ci+1k≠C ik,转至步骤(3)重新进行子集划分:

从上述步骤可以看出,K-Means算法是根据预设的聚类数目K实现对数据的初始划分,在此基础上对初始划分进行优化,因此聚类数目K的确定对聚类结果影响很大,同时K-Means算法对噪声数据较为敏感[8,10]。在战场复杂电磁环境下,很难获取用于确定聚类数目K的先验信息,同时截获的PDW中必然存在一定的噪声,因此需要一种基于数据驱动的方法实现对聚类中心K的自适应确定,同时该方法要具备对噪声数据的鲁棒性。

1.2 PCA 模型

表1 仿真雷达参数表

根据所提方法的算法流程,此时可以得到式(8)所示观测数据矩阵,其中N=450。然后对3个参数向量标准化后分别进行PCA处理,滑窗长度W设置为15,得到的特征值谱如图1所示,可以看出经过PCA 处理后和三维参数向量呈现出一致的分布特性,即前3个特征值相对较大,第4个特征值以后急剧减小,根据式(5)计算得到大特征值个数均为3,即主分量个数K=3,与雷达个数一致。值得注意的是,在对和三维参数向量进行特征值分解时,并不能保证得到的特征值谱分布特性总是一致的,此时可以采用投票的方式确定最终的主分量个数K。

图1 归一化特征值谱图

在PCA分解的基础上,设置聚类个数为3,利用K-Means算法对450组噪声抑制后的脉冲数据和进行聚类,得到的结果如图2所示。采用正确分选率指标对结果进行定量分析,正确分选率为正确分选的脉冲数与总脉冲数的比值,表2给出了分选结果的混淆矩阵,其中“K-Means”表示采用传统K-Means方法进行聚类,初始聚类个数设置为2,3,4分别进行试验得到聚类结果,并将结果进行平均;“蚁群+K-Means”为文献[8]提出的利用蚁群算法优化K-Means的聚类方法。从图2和表2所示结果可以看出,所提方法对雷达C 的正确分选率可以达到100%,对雷达A 和雷达B的正确分选率均达到了98%,相对于另外2种方法,所提方法对每一部雷达都可以获得最优的分选性能。

图2 聚类结果

表2 分选结果混淆矩阵

为了评估所提方法在低信噪比条件下的分选性能,采取向观测数据加入高斯白噪声的方式构造不同的信噪比数据。图3给出了上述3种方法的正确分选率随信噪比的变化曲线,可以看出随着信噪比的降低,3种方法的分选性能都出现不同程度的下降,但是所提方法在不同信噪比条件下的分选性能均优于其它2种方法,特别是当信噪比高于15 d B时所提方法可获得超过85%的正确分类率,具备较高的噪声鲁棒性。图4、图5和图6分别给出了当信噪比为15 dB时,传统K-Means方法(K=3),蚁群+K-Means算法和所提方法的聚类结果,可以看出噪声的存在导致数据分布更加分散,在三维空间中的交叠较为严重,K-Means 方法和蚁群+KMeans方法没有进行噪声抑制处理,得到的分选结果相对较差。

图3 不同信噪比条件下的正确分选率

3 结束语

图4 信噪比为15 dB时K-Means的聚类结果

图5 信噪比为15 dB时蚁群+K-Means的聚类结果

图6 信噪比为15 dB时所提方法的聚类结果

随着电磁环境的愈加复杂,传统基于直方图和K-Means的聚类方法逐渐不能满足实际需要。本文在K-Means聚类方法的基础上,将PCA引入信号分选领域,提出一种基于PCA联合K-Means聚类的噪声稳健雷达信号分选方法,利用PCA对PDW数据进行噪声抑制处理并自动确定K-Means算法的初始类别数,然后利用K-Means对噪声抑制后的数据进行聚类。最后采用仿真数据对所提方法在不同信噪比条件下的分选性能进行验证,从实验结果可以看出,噪声的存在导致PDW分布特性发生变化,并影响最终的聚类结果,而PCA具备的噪声鲁棒特性,在实现噪声抑制的同时保持原始PDW的分布特性,从而可以在低信噪比条件下获得较好的正确分选结果。当然,该技术作为信号分选方法新的探索,在未来工程装备的成熟使用还需开展进一步研究。

猜你喜欢

信噪比个数聚类
一种傅里叶域海量数据高速谱聚类方法
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于知识图谱的k-modes文本聚类研究
基于经验分布函数快速收敛的信噪比估计器
怎样数出小正方体的个数
一种基于扩频信号的散射通信信噪比估计方法
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
最强大脑
想一想