基于膜粒子群算法的雷达辐射源信号多目标特征选择方法研究
2020-12-18陈韬伟余益民
宋 楠,陈韬伟,赵 昆,余益民
(1.云南财经大学 信息学院,云南 昆明 650221;2.云南财经大学 信息中心,云南 昆明 650221)
在高维度的雷达辐射源信号识别中,脉内特征数据由于受多种因素的影响,不易发现具有重要影响的特征,其分选识别的处理速度和可靠性都大大降低[1].无论是传统的特征选择算法还是改进算法都是对原始项集中的每个项进行独立评估,计算每个项的权值,并按权值大小进行降序排序,根据给定阈值或给定数目选取权值最高的若干项,形成新的特征集,因此易融入主观性影响特征选择的质量[2].目前关于新体制雷达信号特征的研究工作,主要集中在基于时域、频域、时频域、调制域以及多种变换域等角度进行特征分析和细微特征的研究上,提出的雷达辐射源信号特征参数已达数十种[3].但在复杂体制雷达共存以及高密度信号环境下,随着融合特征维数不断增加或雷达辐射源信号经特征提取后的初始特征集维数可能变高,则特征之间必然存在信息冗余,分类的效果变差、特征无效的现象.因此需要采取有效的特征选择算法对信号特征进行分析,实现特征选择和优化.
特征选择本质上是一个组合优化问题[4-5].当特征维数过高时,穷举的方法难以在多项式时间内找到最优解.因此,许多学者利用贪婪搜索[6]或智能优化的方法搜索最优解,但通常是以单个目标作为优化对象,且带有较强主观性,从而影响特征选择的效果.粒子群算法作为典型的优化算法之一,通过速度和位置公式来更新粒子方向,由于具有易于理解和实现等优势,受到了科学与工程领域的广泛关注,但其搜索策略较为单一,导致算法很难获得 Pareto前沿且容易陷入局部最优和无限迭代,在全局搜索和收敛性方面还有一定的不足.针对上述的问题,本文引入膜粒子群多目标优化算法从多个角度评价特征子集的质量.在雷达辐射源信号脉内特征选择实验过程中,采用1阶差分自相关函数提取信号包络,利用样本间的距离构建相关度和冗余度作为目标适应度函数,以此考察特征子集的质量,有利于在非合作的点子对抗环境中无监督的完成特征子集的选取.
1 膜粒子群多目标优化算法的提出
图1中的膜结构由6层膜组成,最外层膜称为表层膜,它将细胞内部结构与外界环境隔开.不包含其他膜结构的称为基本膜,每个膜所包围的部分称为区域.多目标对象用大小写字母表示,常见的进化规则类型有多重集重写规则(例如d→dy,y→c)和运输规则等[1].膜结构可等价表示为:={V,T,C,μ,ω1,ω2,…,ωm,R1,R1,…,Rm}.
膜结构主要包括以下几点:
1)V是目标对象的字母表,其包含的元素为字符对象;
2)T⊆V是输出字母表;
3)C⊆V是催化剂;
4)μ是一个由m个膜组成的膜结构,各个膜及其所围的区域用标号集H表示H={1,2,3,…,m},其中m称为膜系统的度;
5)ωi∈V*(1≤i≤m)表示膜结构μ中区域i包含的对象多重集;
6)Ri(1≤i≤m)是关于膜系统和区域μ的进化规则的有限集.
2 膜粒子群多目标优化算法
粒子群算法(PSO)是1种解决多目标优化问题的群智能算法[5],具有结构简单、调整参数较少、鲁棒性好等特点,其优化问题的每一个解都被看作是搜索空间中的一只鸟,我们称之为“粒子”.每个粒子根据自己的最佳位置和全局粒子的最佳位置在n维空间内调整自己的方向和速度以搜索最优解.为避免粒子陷入局部最优和无限迭代,需平衡粒子的全局和局布搜索能力,因此在标准粒子群算法中引入了惯性权重的概念[4].鸟群中的鸟(即粒子)第t+1次飞行的速度和飞行后的位置根据如下公式确定:
Vt+1=ω×Vt+c1×rand()×(pBest-Xt)+c2×rand()×(gBest-Xt),
Xt+1=Xt+Vt+1.
(1)
Vt和Vt+1分别是第t和第t+1次飞行的速度;Xt和Xt+1分别是经过第t和t+1次飞行后粒子落在的位置;ω为惯性权重(inertia weight),描述粒子的惯性对当前速度的影响,其大小用来平衡局部和全局的搜索能力;c1和c2为个体最优和全局最优的学习因子;rand()是[0,1]上相互独立的随机数;pBest是该粒子历次飞行中“最好”的位置;gBest是种群中“最好”的粒子位置.经过多次迭代,种群中的粒子会逐渐向“更好”的位置飞行,最终求得最优解[16-17].
受膜系统功能和在分层结构中处理化合物方式的启发,结合粒子群算法提出基于膜结构的粒子群多目标优化算法(particle swarm multi-objective optimization algorithm based on membrane structure, PSOMM).PSOMM中采用具有层次结构的细胞型P系统,用字符对象表示优化问题的可行解,由字符对象组成的解集构成多重集.根据膜系统的分层结构,利用粒子群优化的个体最优和全局最优概念,在基本膜中采用粒子群算法实现多搜寻策略并行更新解[18-19],通过进化规则保持搜索解的多样性.在表层膜中,利用外部档案使用非支配解集和拥挤距离机制[20]提高非支配解的多样性和算法收敛速度,使解集近似于Pareto前沿.
3 算法在雷达辐射源信号特征选择中的应用
3.1 目标函数设计
利用相关度和冗余度定义一组最小化的目标函数,用以评价雷达辐射源信号特征子集的质量.其中相关度倾向保留所有与数据结构关联紧密的特征,而冗余度则会排除与已选特征相关度高的特征.二者作为膜粒子群算法的适应度函数.
相关度目标将采用熵度量指标,定义如下:
(2)
其中,N是雷达信号数据样本的个数,a是权重系数;Dij是样本i和样本j在x所表示的特征子集下的欧式距离,Da表示所有样本在全空间下欧式距离的平均值;Sij的取值归一化到[0,1].当选择的特征子集合理时,样本i和样本j若属于同类,则Sij的取值很小,反之越大.从而f1(x)选取最小值.
冗余度目标则利用相关系数,当相关系数绝对值越小,特征子集所包含的冗余越小,定义如下:
(3)
其中,nx表示雷达信号特征子集的个数;d是总的特征个数;xj和xk分别表示x中第j个和第k个元素的取值;bij表示第i个样本在第j个特征上的取值,baj表示所有样本在第j个特征上的均值.因此,在特征子集规模确定时,冗余度小的特征子集对应的目标函数值越小.
3.2 雷达辐射源信号多目标特征选择算法步骤
步骤1 将雷达辐射信号源的特征向量作为粒子(个体)随机平均分配至每个基本膜中.
步骤2 计算Pareto前沿点.根据相关度和冗余度目标函数计算雷达信号特征个体的适应度,并求出当前粒子的Pareto前沿点.
步骤3 初始化外部档案.当Pareto前沿点数量小于预设数值R时,直接将所有点存入外部档案中.若Pareto前沿点数量大于预设数值,根据公式(4)计算所有Pareto前沿点的拥挤距离,从拥挤距离最小的点开始逐一删除,直至备选存入外部档案的Pareto前沿点数量与预设数值相等.然后将这些前沿点存放在外部档案中.
(4)
步骤4 调用分裂规则创建基本膜.完成之前的准备工作后,表层膜内开始分裂生成M个基本膜.分裂基本膜数量M与外部档案的Pareto前沿点数量相等.然后将这些存档的Pareto前沿点作为该基本膜内种群的最优个体.最后,将其余各个粒子个体放入距离自身最近的Pareto前沿点所在基本膜中.
步骤5 基本膜内独立执行膜粒子群算法.各个基本膜内,以最先存入外部档案内的Pareto前沿点为种群“最优”个体,根据公式(1)计算新的个体速度和位置.并根据最新的位置重新计算适应度.
步骤6 溶解.完成各自的粒子群算法后,各个基本膜破裂,将新产生的粒子重新释放到表层膜内.
步骤7 计算前沿点,放入外部档案.计算步骤6中所有被释放到表层膜字符的Pareto前沿点.并将这些点存入外部档案中.
步骤8 计算非支配排序,更新外部档案.判断外部档案字符数量是否超出限制,如果超出限制,重新档案内所有字符的拥挤距离.从拥挤距离最小的点开始逐一删除,直至外部档案内字符数量与预设数值相等.
步骤9 迭代.判断当前状态是否满足结束循环的条件.如果不满足,则继续执行步骤4;如果满足,执行步骤10.
步骤10 输出外部存档内的所有粒子.最终得到的Pareto前沿点,通过Pareto前沿即可获得对应的特征子集,统计所有的特征子集所选中的次数,获得所有特征重要度排序.
4 实验结果分析
4.1 一阶差分自相关包络特征提取
由于雷达辐射源信号的时域波形分布宽广、随机性强,在复杂、密集的电磁环境下存在较大的不确定性,为了在时域上突出雷达信号的调制特征,能够识别更多的调制信号,本文采用文献[2]所提出的一阶差分运算方法,通过提取雷达信号的包络统计特征,既可保留差分后的包络差异,也可以使噪声得到很好的抑制.有关一阶差分自相关包络特征提取步骤如下:
假设雷达侦察机接收到的含噪声解析中频信号为.
x(m)=s(m)+n(m),1≤m≤N,
(5)
其中,n(m)为离散高斯白噪声,N为采样的脉冲宽度,s(m)雷达辐射源信号.
步骤1 计算雷达辐射源信号的瞬时自相关函数:
(6)
其中,k为相关时延,且k>0;A为信号幅度;f(m)和φ(m)分别为频率和相位调制函数;fs为采样频率.
步骤2 为解决噪声信号对区分调制特征的影响,更直观的阐述去噪过程,而不涉及具体的信号类型,采用以下的形式进行一阶差分自相关推导:
y(m)=x(m)-x(m-1),m=1,2,…N.
(7)
步骤3 对差分y(m)求出自相关函数Ry(k),对所有k存在:
(8)
Ry(k)=E{y*(m)y(m+k)}=
E{[x*(m)-x*(m-1)][x(m+k)-x(m+k-1)]}=
E{x*(m)x(m+k)-x*(m)x(m+k-1)-x*(m-1)x(m+k)+x*(m-1)x(m+k-1)}
由公式(6)和公式(7)可得出:
Ry(k)≈E{rs(m,k)-rs(m,k-1)-rs(m-1,k+1)+rs(m-1,k)}.
(9)
由公式(9)可见,差分自相关函数Ry(k)与频率、相位调制以及延迟k有关,因此Ry(k)的包络分量定义为:
U(k)=Re[Ry(k)]2+lm(Ry(k))2.
(10)
步骤4 利用基于距离的可分性判据对包络进行特征选择,从而得到最能表征信号调制特性的特征向量.
4.2 仿真实验
仿真实验采用的参数为:采样频率fs= 200 MHz、信号载频f0= 50 MHz;脉冲宽度PW= 10 us;相关时延k=[1,200]的常规雷达辐射源信号(CW)、线性调频信号(LFM)、非线性调频信号(NLFM)、二频率编码信号(BFSK)、二项编码信号(BPSK)、四项编码信号(QPSK)和多项编码信号(MPSK)提取差分自相关包络特征后,获得雷达辐射源信号包络特征序列.使信噪比SNR从 0 dB 每隔 1 dB 变化到 5 dB,在每一SNR下,每种信号各随机产生20个不同初相的样本,7种典型信号则组成了样本容量为840的数据集1;使SNR从 5 dB 每隔 5 dB 变化到 30 dB,在每一SNR下,每种信号各随机产生20个不同初相的样本,组成样本容量为840的数据集2.根据提取出的差分自相关包络特征,在特征集合延迟集合中选取出与其对应的二维和三维最强包络作为特征分量.
采用3.2所述的膜粒子群算法对雷达信号的包络进行多目标特征选择,获得对雷达信号的包络特征子集序列排序实验结果如下:
表1 算法对不同数据集所得到的维数重要性排序
图4和图5为选取前4个k值所对应的包络特征分别构成7种雷达信号的2维和3维特征分布图.由图4可知,膜粒子群算法多目标特征选择所提取的重要特征子集在信噪比SNR为 0 dB 至 5 dB 时,小部分信号之间有交叉重合,但多数信号的分选性较好.从图5中可知,特征子集在SNR=5 dB 以上表现出良好的可聚类性,信号之间明显可分,边界清晰无交叠,故可以简化分选器的设计,提高分选识别率,有利于工程应用.
最后采用传统的FCM聚类算法对信号特征子集(选取最重要的前5个)进行独立100次测试,算法获得的特征选择平均误识率如图6所示.在5维以上的特征子集中,误识率会随维度的降低而减小.当SNR变化为 0 dB 至 5 dB 时,特征子集维度为5的误识率最小;当SNR变化为 5 dB 至 200 dB 时,特征子集维度为3的误识率为7.61%,达到最小值.但在2维与3维中有小部分信号会重叠,误差率增大.总体来说,实验结果表明算法所提取的重要特征子集具有良好的可聚类性,平均误识率较低,分选识别率较高,验证了算法的可行性与准确性.
5 结语
针对于雷达辐射源信号特征选择方法中亟待解决的问题,本文提出了1种膜粒子群多目标优化算法.该算法利用膜系统的分层结构,在基本膜中采用粒子群算法实现多搜寻策略来更新解,并通过进化规则保持搜索解的多样性.采用相关度和冗余度两个目标函数优化数据对象,既可保留相关特征,又剔除了冗余特征,从而以多个角度评价雷达辐射源信号特征子集的质量,避免过早的陷入局部最优.
通过对雷达辐射源信号一阶差分自相关运算所提取出雷达包络统计特征数据集进行的仿真实验,验证了此特征选择算法的可行性和有效性.由于本文采用的是单层膜结构,在各个基本膜内分别采用粒子群算法寻优,也存在计算代价高和算法稳定性等方面的问题.因此,后续的研究将进一步对膜框架结构(固定简单或动态变化)和交流规则(运输,融合,分裂等)进行设计,充分考察膜算法的能力.