基于雷达字建模的多功能雷达工作模式识别
2020-12-03孙闽红官友廉
贠 洁,孙闽红,官友廉
(1.杭州电子科技大学通信工程学院,浙江 杭州 310018;2.中国人民解放军75798部队,广东 汕头 515062)
0 引 言
雷达工作模式的识别是根据侦察接收的雷达信号估计出雷达的工作状态。雷达工作模式的正确识别不仅是威胁等级评估的重要依据,而且为后续干扰资源的合理分配提供支持,具有重要意义[1]。文献[2]利用脉冲描述字建立雷达信号特征库,使用证据理论实现对雷达工作模式的判定。文献[3]通过使用载频、脉宽、脉冲重复间隔、幅度对雷达信号进行脉冲组等级划分,并考虑漏脉冲和虚假脉冲的情况。文献[4-5]将雷达信号进行分层建模,将雷达的脉冲序列采用“字-短语”的分层结构进行划分。文献[6]采用相干处理间隔(Coherent Processing Interval, CPI)对雷达信号进行结构分层,使用过程神经网络对雷达工作模式进行识别。文献[7]提出一种基于随机句法引导翻译器的多功能雷达识别方法,对雷达信号建模的同时实现了对错误脉冲的校正。文献[8]提出一种改进的事件驱动的雷达字提取方法,在错误脉冲情况下建模准确率有所提高。文献[9]提出一种改进的多功能雷达字提取的方法,一定程度上降低了漏脉冲情况的提取雷达字错误率。
目前,雷达工作模式识别的方法主要存在两个问题,一是特征参数不足,导致识别效果不理想;二是考虑漏脉冲和虚假脉冲的相关研究不多,即使有相关方面的研究,其识别效果也有待进一步提高。针对这些不足,本文在常用的4个特征参数基础上,增加了4个特征参数,提出一种雷达信号“字-短语”模型建模的改进方法以进一步提高识别性能。
1 雷达信号建模
雷达信号可以类比为人类的语言,建立雷达语义模型。将单个脉冲作为脉冲层,将CPI作为雷达字,将包含多个CPI的脉冲串作为雷达短语,建立雷达信号“字-短语”模型。
1.1 雷达脉冲层建模
为了实现不同的工作模式,雷达信号的脉宽、脉冲重复间隔、占空比、信号带宽、调制方式均可能有多种变化[10]。数据率是雷达对整个威力范围完成一次探测所需时间的倒数,表征搜索雷达的工作速度[11],搜索和跟踪是雷达的两种基本工作方式,两者的主要差别为数据率的不同。在雷达信号出现漏脉冲和虚假脉冲时,寻找占空比的变化规律有助于对错误参数进行校正。而且,雷达在不同的工作模式下,产生不同调制方式和瞬时带宽的信号。因此,在现有研究常用的4个特征参数载频(Carry Frequency, CF)、脉宽(Pulse Width, PW)、脉冲重复间隔(Pulse Repetition Interval, PRI)、幅度(Pulse Amplitude, PA)基础上,本文增加4个特征参数占空比(Duty Cycle, DC)、调制方式(Pulse Modulation, PM)、数据率(Data Rate, DR)和瞬时带宽(Bandwidth, B)。对于截获的第i个脉冲,估计得到其特征参数,将雷达脉冲层建模为:
Pi=[fCFi,wPWi,tPRIi,cDCi,aPAi,mPMi,rDRi,bBi]
(1)
1.2 雷达字建模
雷达字建模的关键在于准确对雷达脉冲进行脉冲组的划分,即CPI划分,具体过程如下。
(1)确定起始脉冲与特征参数评估值。
首先,令参数n=1。假设截获脉冲串中的第n个脉冲为起始脉冲,若第n个脉冲后有连续N个脉冲的特征参数保持稳定并与之相同,则将第n个脉冲确定为起始脉冲。否则,令n=n+1,重新判断,直至找到起始脉冲为止。
确定起始脉冲后,取n+N个连续脉冲的各个特征参数的平均值作为CPI特征参数的评估值y。
(2)计算误差阈值与置信水平。
由于脉冲的特征参数值可能与真实值存在一定的误差,因此在进行脉冲组划分时,需引入误差阈值和脉冲置信水平对某脉冲是否属于脉冲组进行衡量。
设定脉冲特征参数的估计误差阈值Y为特征参数评估值y的k倍。即
Y=k×y0 (2) 式中,k为特征参数误差阈值的系数。脉冲置信水平需要根据Y来确定。第i维特征参数xi属于脉冲组的置信水平为: (3) 每一维特征参数进行置信水平计算之后,求出每个脉冲8维特征参数置信水平的加权平均值,得到最终的置信水平为: (4) 式中,wi为第i维特征参数的加权系数,按照特征参数的重要程度来设置wi,如果没有先验知识,可以全部设置为1。设置门限值为F0,若某一脉冲的置信水平F(xi)>F0,则认为该脉冲属于对应的CPI集合,否则该脉冲不属于对应的CPI集合,将其剔除。直至出现连续M个脉冲不属于这一CPI,则认为是下一个CPI的出现,重新开始划分。 在8个参数中,PRI和DC是根据2个脉冲之间的时间间隔计算得到的。当脉冲串中出现漏脉冲或者虚假脉冲错误脉冲情况时,这2个特征参数的值受到影响,导致脉冲的错误划分。因此,分别对这2种错误脉冲的情况进行参数修正。 (1)漏脉冲 漏脉冲情况影响的是漏掉脉冲的前一个脉冲的2个参数tPRI和cDC。对脉冲进行置信水平计算时,对于非连续脉冲,若出现除了这2个参数以外的其他参数都在误差阈值范围之内,可以初步判定此脉冲之后有可能出现漏脉冲。校正方法是对该脉冲特征参数误差阈值Y进行再次处理,将tPRI和cDC的误差阈值变为原来的m倍和1/m倍。 当m等于某个数mi时,tPRI和cDC在新的误差阈值计算出的误差范围内,可以确定该脉冲之后会出现漏脉冲,可通过mi确定漏掉的脉冲个数,实现对该错误脉冲参数的校正: (5) (2)虚假脉冲 当出现虚假脉冲的情况时,由于虚假脉冲的脉宽是不确定的,所以不容易确定受影响脉冲的特征参数阈值。校正方法是:对于非连续脉冲,若除了tPRI和cDC以外的其他参数都在误差范围之内,则计算此脉冲与下一个脉冲的tPRI之和t′PRI是否在误差范围之内,此脉冲的脉宽与t′PRI比值是否在cDC的误差范围之内,即 (6) 如果t′PRI和c′DC都在误差范围之内,则可以初步判定此脉冲之后可能出现虚假脉冲。再判断后一个脉冲的参数是否在误差范围内,若不在,则可以确定前一个脉冲的特征参数受到了虚假脉冲的影响,并可以确定正确脉冲的参数为t′PRI和c′DC,故对该脉冲的错误参数进行校正。 根据上述CPI划分的具体过程,将截获的脉冲串进行划分后,每一个CPI脉冲组可以仅用一组雷达特征参数表示。将第j个雷达字建模为: Wj=[Pj,Nj] (7) 式中,Nj为第j个雷达字所包含的雷达脉冲的个数。 将侦察截获的脉冲串按照上述雷达脉冲层、雷达字的建模过程,得到脉冲串中包含的多组雷达字。将特征参数一致的雷达字,用一个相同的符号表示,如英文字母。用符号表示的雷达字按顺序组合排列,得到第k个雷达短语为: Hk=[A,B,D,A,C] (8) 式中,不同的字母分别表示不同的雷达字。 通过对雷达脉冲的建模发现,雷达在不同工作模式下采用不同的雷达短语,而不同工作模式下的雷达短语是由不同组合的雷达字构成的。因此,寻找组成雷达短语的雷达字经常出现的组合规律,可以挖掘出雷达的工作模式。从大规模数据中挖掘数据之间隐含关系的过程被称为关联分析[12]。本文采用关联分析算法对雷达短语进行分析,进而挖掘识别出雷达的工作模式。 关联分析可以从大量的数据集中发现频繁项集和关联规则[13]。对于频繁项集和关联规则的表示,需要引入支持度和置信度[14]。本文采用Apriori关联算法[15]挖掘雷达的工作模式。Apriori关联算法对数据要求低,使用先验信息大大提高了频繁项集逐层产生的效率,而且其扩展性较好,可以并行计算。算法步骤如下。 (1)通过扫描数据库,累计每个项的计数,并收集满足最小支持度min_Sup项,找出频繁k项集的集合,将该项集记为Lk。 (2)使用Lk进行自连接,产生生成频繁项集k+1的候选集。然后进行剪枝,从候选集中找出频繁k+1项集的集合Lk+1。 (3)循环步骤2,直到不能找到频繁k项集为止。在找出的频繁项集中,计算置信度,保留置信度大于最小置信度min_Conf的强关联规则。 将截获的大量脉冲串按照第1节中的建模方法进行建模,得到大量雷达短语。将雷达字作为项,多个雷达短语作为事务库。使用Apriori关联算法对雷达工作模式进行识别,主要从雷达短语中关联出雷达字的频繁项集和强关联规则。若得到频繁项集,即得到雷达不同的工作模式: M1=[A,B,C],M2=[D,E,F],… (9) 挖掘出工作模式后,关联雷达库中不同工作模式下的参数信息,即可得到雷达在不同的工作模式下雷达字的组合规律。对之后所截获的脉冲串,只需通过第1节中的建模过程得到雷达短语,对比雷达短语中雷达字的组合规律,即可得到雷达当前的工作模式。 假设某多功能雷达具有搜索、跟踪、搜索加跟踪、制导4种工作模式,根据文献[3]中对雷达功能特点及参数特征的对比分析,得出多功能雷达在不同工作模式下的脉冲特征参数设置如表1所示。 表1 雷达不同模式下脉冲特征参数 使用MATLAB仿真产生每种工作模式100组脉冲串,假设雷达在每种工作模式下有多个工作周期,每个工作周期随机选择一种此模式下的CPI脉冲特征参数作为工作参数。考虑到雷达实际工作中存在各种工作模式之间进行实时切换的情况,所以产生100组不同工作模式之间切换的脉冲串。同时,实际工作中,雷达会受到噪声以及脉冲参数估计误差的影响,因此,所有参数设置了不同程度的估计误差。在这样的背景下,共产生500组脉冲串,每组脉冲串包含1 000个不同特征参数的脉冲。 实验一为了验证雷达信号建模的准确性,使用上述仿真产生的脉冲,根据第1节建模方法,设置式(2)中k的值为仿真产生数据的最大误差百分比,即为0.2。由于不同特征参数对雷达工作模式识别都有影响且影响程度在没有先验信息的情况下无法确定,因此将式(4)中wi全部设置为1。分别将500组脉冲串进行建模,得到雷达模型。定义模型准确率为P=n/N,n为拟合正确的脉冲数,N为截获的所有脉冲数。将500组脉冲进行100次Monte Carlo仿真,得到的模型准确率变化曲线如图1所示。图1中,不同线形分别代表不同的工作模式,其中“混合”表示雷达处于某两种状态转换情况下的模型准确率,“平均”表示一次实验中,雷达在所有工作模式下模型的平均准确率。 参数估计误差在10%以内,模型准确率随漏脉冲率变化的曲线如图1(a)所示;漏脉冲率为15%时,模型准确率随参数误差变化的曲线如图1(b)所示;参数估计误差在10%以内,模型准确率随虚假脉冲率变化的曲线如图1(c)所示;虚假脉冲率为15%时,模型准确率随参数误差变化的曲线如图1(d)所示。从图1可以看出:模型准确率随漏脉冲率、虚假脉冲率、误差百分比的提高逐渐下降。在漏脉冲情况下,当漏脉冲率为40%时,雷达字模型平均准确率仍可以达到99.2%以上,当误差范围增加到20%时,平均准确率仍可以达到92%以上。在虚假脉冲情况下,当虚假脉冲率为40%时,雷达字模型平均准确率仍可以达到99.7%以上,当误差范围增加到20%时,平均准确率仍可以达到99.2%以上。 图1 模型准确率变化曲线图 为了验证本文方法对雷达信号建模准确率的提升,分别采用本文方法与文献[3]中建模方法进行对比,得到结果如图2所示。从图2中可以看出,本文方法在漏脉冲率为40%时,模型平均准确率提高了8%左右,在虚假脉冲率为40%时,模型平均准确率提高了6%左右。这是因为,文献[3]只使用了常用的4个特征参数,而本文增加了4个特征参数,且在漏脉冲和虚假脉冲的情况下对错误参数进行及时校正,很大程度提高了模型的准确率。 图2 模型准确率对比图 实验二为了验证Apriori关联算法对雷达工作模式识别的有效性,使用漏脉冲率为40%、参数估计误差为10%以内的脉冲信号,进行100次Monte Carlo仿真。分别采用本文方法与文献[3]的方法对雷达脉冲串进行建模,将不同的CPI分别用字母A—M表示,得到雷达短语模型。在使用雷达短语进行关联分析时,算法中的最小支持度和置信度的设置需要根据一定的经验[16]。 实验中,设置最小支持度min_Sup=10%,对雷达短语模型进行工作模式识别,结果如表2所示。 表2 雷达工作模式识别结果 如表2中的第4类结果所示,采用本文方法得到频繁项集{G,H,I,J},根据雷达短语建模时字母所对应的脉冲特征参数,并关联雷达库中不同工作模式下的参数信息,可以得出雷达短语在包含G,H,I,J时,处于搜索加跟踪模式。当根据文献[3]方法得到频繁项集{G,H,I},{G,H,J},{H,I,J},对比可知,这3个频繁项集为雷达处于搜索加跟踪模式时所包含CPI集合的子集,不能代表所有处于搜索加跟踪模式时的情况。 设置最小置信度min_Conf=50%,寻找雷达短语的强关联规则。以表2中的前两类结果为例,频繁项集{K,L,M}和{D,E,F}强关联规则如表3所示。 表3 强关联规则置信度 % 由表3可以看出:出现一个雷达字后,出现另外2个雷达字的概率较高。同理可以得出其他几种类型下的强关联规则。对比得出本文所提出的方法建立的雷达模型经过关联分析得到的强关联规则置信度平均值高于文献[3]中方法得到的置信度平均值的6%。 由表2和表3可以看出,在相同的最小支持度和最小置信度下,本文方法对雷达工作模式的识别效果优于文献[3]中方法对雷达工作模式的识别效果。 本文对多功能雷达出现错误脉冲的情况进行分析,通过增加4个特征参数,提出雷达“字-短语”建模的改进方法,能准确描述雷达字、雷达短语的变换规律,并实现了对错误脉冲的校正,提高了模型准确率。同时将数据挖掘的Apriori算法运用到雷达工作模式识别研究中,实现对雷达工作模式识别性能的有效提高。但是,本文只讨论了4种典型的雷达工作模式的识别,由于现代雷达工作模式具有多样性,下一步将对更多的工作模式进行研究。1.3 雷达短语建模
2 雷达工作模式识别
2.1 关联分析
2.2 基于Apriori算法的雷达工作模式识别
3 仿真实验与分析
4 结束语