基于数字信道化接收机的聚类分选算法
2017-06-05张勇强汤建龙
张勇强,汤建龙
(西安电子科技大学 电子信息攻防对抗与仿真技术教育部重点实验室,陕西西安 710071)
基础理论
基于数字信道化接收机的聚类分选算法
张勇强,汤建龙
(西安电子科技大学 电子信息攻防对抗与仿真技术教育部重点实验室,陕西西安 710071)
提出了一种适合数字信道化接收机的未知雷达辐射源聚类分选算法。该算法通过对数字信道化接收机产生的脉冲描述字(PDW)流融合预处理,对预处理后的PDW流进行网格密度聚类,获得雷达辐射源的初始分类结果后,利用累计差直方图法(CDIF)最优门限对虚警辐射源进行剔除,再合并处理生成辐射源描述字(EDW)。仿真结果表明,该算法能有效的用于数字信道化接收机的雷达信号分选。
雷达信号分选 ;数字信道化接收机 ;网格密度聚类
0 引 言
雷达辐射源信号分选是电子侦察处理的关键技术,信号分选的效果直接影响着雷达侦察系统的整体作战效能[1]。随着雷达技术的快速发展,雷达体制趋于多样化、复杂化、综合化,电子对抗所面临的电磁环境越来越复杂。目前雷达辐射源信号分选的准确性、实时性及可靠性均面临着严峻的挑战。
聚类分析实现脉冲序列去交错一直是雷达信号处理的重要方法,是一种无监督的学习方法。通过将数据集中的样本按一定的相似性度量和评价准则进行归并分类,聚类方法可发现数据集的内在组织结构,以便于人们更好地理解数据[2]。聚类算法一般分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法以及基于模型的方法等[3]。基于网格的聚类算法具有处理速度快,对数据对象的数目和输入顺序不敏感,可以处理任意类型的数据等优点[4],因此非常适合实时性要求高并且处理数据量大的雷达信号分选。
目前基于网格密度聚类的雷达信号分选存在的主要问题:(1)网格密度聚类算法数据源是利用设定的辐射源参数按一定的虚警率和漏警率直接生成PDW,未采用实际接收机所产生PDW,缺乏工程应用背景。(2)由于线性调频信号PDW的复杂性,聚类分选算法并没有将它到考虑其中。针对以上问题,本文提出了一种改进的基于网格密度聚类的分选算法,以数字信道化接收机所产生PDW流为源数据,充分利用载频(RF)、到达时间(TOA)、结束时间(TOE)、能量(E)等特征参数进行聚类,完成未知雷达辐射源的分选。该算法无需人为设定聚类数目,实现自动聚类,对聚类结果准确提取雷达辐射源EDW的各特征参数,算法复杂度低,抗噪声干扰能力强,聚类精度高,适合处理大规模的雷达侦察数据。
1 改进的网格密度聚类分选算法
1.1 数据的融合预处理
单频信号经过数字信道化会使其频谱扩展,会在其频率两侧信道上产生PDW。线性调频信号经过数字信道化会使其频谱所在的多个连续的信道上产生PDW。因此,在聚类之前有必要进行数据融合。融合预处理流程图如图1所示。
图1 融合预处理流程图
其中,时间是否相继,信道是否相邻,均在一定容差范围内满足条件即可。LFM代表线性调频信号。
数字信道化接收机所产生PDW包含{载频(RF)、到达时间(TOA)、结束时间(TOE)、能量(E)}四个特征参数。由于信道特性不理想,对于单载频信号,会出现多信道同时检测,融合准则为:
(1) 单信道检测:直接输出PDW。
(2) 同时两信道检测:RF进行插值处理,实现对信号频谱谱峰的精确定位,降低测频误差[5]。插值公式:
(1)
(2)
其中,rf为频率估计值,k0和k1为同时检测的两信道,X0和X1为各信道对应的的谱峰,fs为采样率,N为FFT宽度。
对于线性调频信号,多个相邻信道相继检测,相继检测指下一PDW的脉冲前沿时间小于当前PDW的脉冲结束时间,利用该特征合并PDW,记录其最低频率和最高频率。
融合预处理后,PDW格式{RF0、RF1、PW、TOA、FLAG、E},增加了一维特征参数标志位(FLAG),FLAG=1表示为单载频,FLAG=2表示为LFM。PW为脉冲宽度。RF0和RF1为线性调频信号的起始频率和截止频率,对于单载频信号,RF0=RF1。
1.2 网格密度聚类算法
1.2.1 网格密度结构
1.2.2 网格划分数ki和密度阈值Minpts
网格划分决定了网格尺寸,对聚类结果的准确性有重要影响。如果网格的尺寸太大,影响聚类准确性,如果网格的尺寸太小,网格单元数过多,会提高算法复杂度。采用网格划分的方式处理数据本质上是数据压缩,每一维划分数ki就代表了数据压缩的程度[6]。本文对第i维选择一个固定的分辨率resi及最小值Mini和最大值Maxi,则每一维的划分数Ki的选择:
(3)
密度阈值的作用是滤除混合在雷达脉冲信号中的噪声,减少噪声干扰。现有的网格聚类算法要求用户输入密度阈值来判定网格是否为高密度单元,密度阈值的不同可能会导致的聚类结果的不同[7]。本文借鉴平均密度思想,计算得到Minpts。
(4)
式中:G为生成的网格单元数目,deni为每个网格单元的网格密度,Max_den为生成的相交网格中的最大网格密度。
1.2.3 网格密度聚类主要步骤
预处理后数据作为待分选数据。对于单载频PDW集,选取特征参数:脉宽PW,载频RF,信道重复周期CRI构成三维待分选数据集S1,S1为若干个格式为{PW,RF,CRI}的单载频型PDW集合;对于线性调频PDW集,选取特征参数:脉宽PW,载频RF0,载频RF1构成三维待分选数据集S2,S2为若干个格式为{PW,RF0,RF1}的线性调频型PDW集合。对PDW集合S1和S2进行网格密度聚类。网格密度聚类算法流程图如图2所示。
图2 网格密度聚类流程图
1.3 聚类结果处理
1.3.1 聚类结果的选择剔除
融合预处理后的PDW流在进行网格密度聚类算法后,得到了辐射源描述字EDW。当PDW流是数字信道化接收机产生时,由于门限的选择,无论是何种类型的雷达信号,都会有相邻信道的PDW产生[8]。因此,在聚类结果中,可能会出现一些错误的聚类结果,有必要对错误结果进行剔除。
累计差值直方图(CDIF)是基于周期性的脉冲时间相关原理的一种传统脉冲重复周期(PRI)分选算法[9],通过累积各级差值直方图来估计原始脉冲序列中可能存在的PRI,并以此PRI进行脉冲搜索。CDIF的最优门限是:
α=k·(T/τ)
(5)
其中,k为可调系数,通常取 1.3.2 聚类结果合并处理 对于LFM聚类结果,在经过CDIF门限选择后,生成LFM型EDW。 对于单载频聚类结果,在经过CDIF门限选择后,需要进一步处理,将其分类为单载频信号、频率捷变信号、频率分集信号。 合并处理主要步骤: (1)取第一个EDW初始化Temp_EDW (3)取下一个未处理的EDW,重复步骤(2),直到所有的EDW融合结束 (4)生成最终的EDW。 1.4 分选算法的基本步骤 输入:数字信道化接收机产生的PDW流,PDW(RF,TOA,TOA,E)。 输出:聚类结果EDW。 (1)读入数据,对PDW流进行融合预处理,标记为LFM型PDW流和单载频型PDW流。 (2)对两种类型的PDW流进行网格密度聚类,生成初始聚类。 (3)对初始聚类结果进行处理,包括CDIF最优门限选择性剔除和合并处理。 (4)生成最终聚类结果EDW{信号类型、RF0~RF5、PW、PRI、Num_Of_Pulse}, Num_Of_Pulse代表总脉冲个数,信号类型主要有单载频信号,线性调频信号,频率捷变信号,频率分集信号。 为了验证该网格密度聚类分选算法适用于数字信道化接收机的雷达信号分选的可行性和有效性,以图3所示实验模型进行仿真分析。实验环境:Windows7, Inter Core i3 M390 2.67Ghz , 4G内存 , 仿真工具Matlab R2014a。 图3 实验模型 输入信号:包括空间中的6部雷达,其参数见表1,包括单载频信号,频率捷变信号,频率分集信号,线性调频信号以及重频参差信号。 数字信道化:采用基于STFT的数字信道化接收机仿真系统。数字信道化接收机系统的仿真参数:采样率为1280 MHz,FFT宽度256点,滑动长度为128点,汉宁窗,噪声功率0.1,仿真时长为20 ms。 数字信道化通过门限检测得到PDW流,每个PDW由四维参数组成{RF、TOA、TOE、E}组成,将PDW流进行信号分选。 信号分选:信号分选先采用 图1所示流程进行原始数据PDW流的融合预处理,再采用 图2所示流程进行网格密度聚类,获得初始聚类。最后,通过1.3节所述步骤对聚类结果选择性剔除和合并处理,生成最终的分选结果。 结果输出:画图显示信号分选结果。 表1 仿真实验辐射源类型及特征参数 图4 数据分布图 图5 PDW流聚类分选结果 原始数据分布如图4(a)所示,依据数字信道化的PDW流(RF,TOA,TOE,E)转换成(RF,CRI,PW)所得,其中CRI为信道重复周期,定义为同一信道的相邻PDW的TOA之差;PW为各PDW的TOA与TOE之差。由于数字信道化的影响,会产生相邻信道的PDW,并且信道的CRI和PW会出现一些有误的分布。分布图显示各信号参数交叠严重,利用传统的网格密度聚类无法有效的进行分选。因此对原始的PDW流有必要融合预处理,合并相邻信道,更新TOA和TOE,依据能量判断其类型为单载频或者线性调频,为下一步网格密度聚类做准备。预处理后数据分布图如图4(b)所示。 预处理之后的数据进行网格密度聚类,利用公式3得到每一维的划分数K,划分网格,利用公式4得到密度阈值Minpts=10。在获得初始聚类之后,利用CDIF在进行最优门限选择性剔除时k=0.4,采样时间T=20 ms。最后得到雷达信号聚类分选结果,如图5所示。 图5 (续) 辐射源辐射源1辐射源2辐射源3辐射源4辐射源5辐射源6理论脉冲数2001601003334450分选脉冲数199159993304250 依据仿真实验结果图5可知,本文提出的改进的基于网格密度聚类的分选算法对接收机产生的混合PDW流准确地进行了分选,生成各辐射源EDW,完成了未知雷达辐射源的分选要求。由表2可证明该聚类分选算法的有效性和可行性,目前可以分选的类型有具有参差特征的线性调频信号,单载频信号,频率捷变信号,频率分集信号。 本文将网格密度聚类算法用于实时性要求性较高的数字信道化接收机的雷达预分选之中,根据信道化后PDW流的特征,首先融合预处理,再利用聚类算法获得初始聚类,对初始聚类结果进行选择性剔除及合并处理后完成信号分选,得到未知雷达辐射源的EDW。仿真实验表明了算法应用于未知雷达辐射源分选的有效性和可行性,较好的满足了雷达辐射源分选的要求。进一步提高算法的运行效率,并将其他数据流挖掘算法进行结合,更好地应用到雷达信号分选领域,是下一步的研究内容。 [1] 何明浩.雷达对抗信息处理 [M] . 北京:清华大学出版社,2010:8-9. [2] 司锡才.现代电子战导论(下) [M].哈尔滨:哈尔滨工程大学出版社,2013:6-7 [3] 向娴.一种基于网格密度聚类的雷达信号分选 [J] .火控雷达技术,2010,39(4):67-72 [4] 邱保志.基于局部密度和动态生成网格的聚类算法 [J].计算机工程和设计,2010,31(2):385-387 [5] 汤建龙. 雷达信号到达角及相关参数估计研究 [D].西安电子科技大学 ,2004:23 - 24 [6] 陈维高. 基于改进网格聚类的动态雷达信号分选算法 [J]. 雷达与对抗,2012,32(4):30-32 [7] 邱保志. 基于网格熵的边界点检测算法[J].计算机应用,2008,28(3):21-24 [8] 赵国庆.雷达对抗原理 [M].西安电子科技大学出版社,2012:33-37 [9] Mardia H K.New techniques for the deinterleaving of repetitive Sequences.IEE Proceedings.Pt F.1989,136(4):149-154. Clustering Sorting Algorithm Based on Digital Channelized Receiver ZHANG Yong-qiang , TANG Jian-long (The Ministry Key Laboratory of Electronic Information Countermeasure and Simulation, Xidian Univ., Xi’an 710071, China) A clustering algorithm of unknown radar emitter sorting for digital channelized receivers is proposed. The algorithm preprocesses the PDW stream generated by the digital channelized receiver, clusters pre-processed PDW stream on grid and density, and acquires the initial classification results of radar emitter. Then using CDIF optimal threshold to eliminate false radiation source, And the EDW is finally generated after merging process.The simulation results show that the algorithm can be effectively used in radar signal sorting of digital channelized receiver. radar signal sorting ; digital channelized receiver ; grid density clustering 10.3969/j.issn.1673-5692.2016.02.008 2016-12-15 2017-02-20 TN971.+1 A 1673-5692(2017)02-143-06 张勇强 (1991—),男,甘肃人,硕士,主要研究方向为信息对抗技术; E-mail:zyq2021@126.com 汤建龙 (1978—),男,江西人,副教授,主要研究方向为信息对抗技术及相关的信号处理与仿真技术。2 仿真实验分析
3 结 语