基于IA-SVM模型的混沌小信号检测方法
2020-07-14行鸿彦吴佳佳
孙 江,行鸿彦,吴佳佳
(1.南京信息工程大学气象灾害预报预警与评估协同创新中心,江苏 南京210044;2.南京信息工程大学江苏省气象探测与信息处理重点实验室,江苏 南京210044)
0 引言
海杂波[1]指的是海面雷达的后向散射回波,受到各种外部自然因素影响,如风、潮汐、浪涌等,其物理机理复杂多变,非高斯、非线性和非平稳特性显著,容易对雷达目标检测造成干扰。从雷达检测海平面目标的需求出发,进而开展对海杂波特性的研究。随着海浪机理以及海杂波特性研究的深入,研究人员发现海杂波存在混沌特性[2]。研究海杂波作背景噪声的微弱信号检测,对海平面小目标的识别与检测有着非常重要的理论以及实际应用意义。
针对混沌海杂波的复杂多变,非平稳性显著,基于可知统计特性的传统信号检测理论[3]无法完全适用,且海杂波混沌特性反馈不明显,存在适应范围局限的缺点,万普尼克提出的统计学习理论,采用的是统计学方法,在此理论基础上引出的支持向量机,成为了机器学习以及各个领域研究解决分类预测问题的新方案。支持向量机为混沌海杂波背景下的微弱信号检测提供了新方法新思路,对海平面小目标信号检测具有重大意义,备受国内外研究学者的关注和重视。国外学者Leung H于1993建立基于径向基函数的微弱信号检测模型[4],对海杂波数据进行了预测。1997年,Mukherjee将支持向量机应用到混沌时间序列的预测中来[5],促进了混沌序列的预测研究。2000年,Hennessey利用恒虚预警原理和RBF-CML预测器实现对海杂波中的小目标检测[6]。2008年,Kenshi Sakai提出了利用短非线性时间序列重构动力学法,研究确定性混沌[7],促进了相空间重构在信号检测领域的应用。2010年,Ataollah Ebrahim提出了基于SVM的分类器,验证高斯径向基函数核具有较好的性能,并结合粒子群算法优化SVM的参数[8]。在国内,2001年聂春燕,石要武提出了一种结合互相关检测和混沌特性的微弱信号检测方法[9],对混沌噪声实现有效抑制,同时具备时间域方法的优点。2005年,刘丁等人在分析当前混沌信号检测方法优缺点时,提出了一种基于李雅普诺夫指数计算混沌阀值的微弱信号检测方法[10],推进了微弱信号检测方法实用性的进程。2007年,徐伟在研究Lorenz系统作为混沌背景噪声时,引进神经网络方法检测微弱信号,实验证明了其有效性[11]。2010年,金天力在研究复杂非线性系统相空间重构理论时,提出了基于新型LS-SVM模型的海杂波背景微弱信号检测[12],与传统神经网络方法和LS-SVM相比,提高了预测精度和检测阀值,但是存在一定局限性。
惩罚系数、核函数和不敏感参数是影响支持向量机预测精度的主要参数,对它们进行参数的寻优优化能够显著提高支持向量机的性能。传统参数优化方法容易局部收敛,从而影响检测模型的检测性能。针对此问题,本文引入免疫算法[13]来优化支持向量机的参数,提出了基于免疫算法优化支持向量机(IA-SVM)的混沌小信号检测方法。
1 混沌相空间重构和支持向量机
1.1 混沌相空间重构
一般来说,时间序列主要是在时间域中进行的,但是对于混沌时间序列并不适用。混沌时间序列的研究理论基础是Takens提出的嵌入定理,他认为总可以从混沌时间序列中找到一个拓扑意义等价、高维的重构相空间,在这个相空间中进行混沌时间序列的研究处理。相空间重构[14]的基本思想就是任何系统中的任何分量的发展都离不开与其相互作用的其他分量,同样的是其他分量的发展信息也蕴藏在其演化过程中,因而只需考察一个分量,而相空间重构的关键参数就是嵌入维数和延迟时间[15],嵌入维DE和延迟时间τ的确定就成了重构的第一步。
上述两个参数的确定,分成两种研究方向:一种方向认为嵌入维DE与延迟时间τ是不相关的,即采用各自参数确定的方法确定参数值;另一种方向则认为嵌入维DE与延迟时间τ是相关的,通过确定嵌入窗宽τω=(DE-1)τ,利用嵌入维与延迟时间的相关性,确定两者的参数值,进而实现相空间重构。最近研究表明,嵌入窗宽对相空间重构的质量影响更大,即后一种方法重构相空间更优,经典求解嵌入窗宽的方法有C-C法[16]以及基于它的各类改进方法。假设混沌时间序列为x(n)=1,2,…,N,其重构空间上序列:Xi(n)={xi(n),xi(n+τ),…,x[n+(m-1)τ]}(i=1,2,…,M),由于描述混沌特征奇异吸引子的常用参数是关联维数,利用嵌入混沌序列的关联积分函数求解关联维:
(1)
式(1)中,C为关联积分函数,r为临界半径。
将待观测序列分成N个子序列,计算各个序列的统计量Si,再根据统计学原理列写所有序列统计量的均值方程:
(2)
结合关联指数饱和时的最小嵌入维以及统计学原理求解嵌入延时窗,即上述方程的第一个极小值对应的时间窗口,从而同时估计出延迟时间τ和嵌入窗宽τω。
重构的参数会直接影响相空间重构效果以及后续分析,所以本文采用C-C法求嵌入窗,得到嵌入维为5,时间延迟为1。
1.2 支持向量机
支持向量机[17]是一种二分类模型,其解决非线性分类问题的核心就是将低纬度的非线性样本空间通过核函数映射到高纬度空间线性化处理。混沌海杂波背景下的微弱信号检测就是在复杂的海杂波中进行非线性分析求解,其检测的基本思路为:
对于给定的训练数据集:
{(xi,yi)|i=1,2,…,l;xi∈Rn,yi∈R}
(3)
式(3)中,xi为微弱信号预测模型训练数据的n维输入,yi为目标信号预测的输出值,l为采集训练的样本个数。
回归估计函数为:
f(x)=ωTφ(x)+b
(4)
式(4)中,超平面的权值为ω,偏置常数量为b,φ(·)则是将输入的海杂波背景下微弱信号预测模型的训练样本和输出预测值之间的非线性关系转化为φ(x)与y之间的线性关系。
支持向量机的优化函数对目标值进行优化,得到下式:
(5)
约束条件:ωTφ(x)+b-yi=ξi
(6)
式(5)、式(6)中,C为支持向量机模型的惩罚系数,C>0;ξi为松弛变量,是数据允许偏离的间隔,在原目标的基础上要尽可能的小。采用典型求解约束条件下最值问题的方法——拉格朗日数乘法,得到支持向量机的回归模型为:
(7)
式(7)中,
为拉格朗日乘子,经文献[8]研究论证核函数K(xi,x)优先选用高斯径向基函数核:
(8)
支持向量机的主要参数有惩罚系数C、核函数参数σ以及不敏感损失参数ε,这三个参数值都会直接影响支持向量机的预测精度,其中惩罚系数C的取值直接影响支持向量机的泛化能力[18],适当的参数取值得到效果更优;核函数参数σ能够反映训练数据的分布特性,取值过大,会使得置信范围变大,反之亦然;而不敏感损失参数ε取较大为宜,此时回归函数较简单,计算较快,不过当ε大于某一值后,就会出现欠拟合。因此,为了提高支持向量机模型的预测精度,需要利用优化算法对其三个参数进行寻优,寻优算法多种多样,为了避免陷入局部最优,解决运算大、耗时长等问题,本文采用免疫优化算法。
2 基于IA-SVM模型的微弱信号检测方法
2.1 免疫算法
免疫算法[19]是一种借鉴生物免疫系统识别抗原的信息处理机制来解决实际工程应用问题的寻优算法,它是在遗传算法的基础上保留一定数量的较优解,增加克隆算子和克隆抑制算子,克隆算子是将经过免疫选择后的抗体进行复制,克隆抑制算子则是淘汰亲和度较低的抗体,保留亲和度较高的抗体,这样不仅提高了算法效率,而且得到优化的结果更好,避免出现陷入局部寻优。免疫算法具有寻优效率高、鲁棒性高、并行分布性等特点,已经在科学和工程领域得到应用,能够解决非线性优化问题、故障诊断、信号处理等,并取得了不错的效果。因此,本文用免疫算法来解决支持向量机参数寻优的问题。
2.2 免疫算法优化支持向量机模型
为了提高预测模型的检测信号的能力和预测精度,需要利用免疫算法对支持向量的参数进行优化。其中,将待预测信号作为免疫应答的抗原,将预测信号作为抗体,将均方根误差的倒数作为亲和度函数即寻优终止条件。免疫算法优化支持向量机[20]的具体步骤如下:
步骤1 预处理:采用经典C-C法进行相空间重构,将处理后的混沌时间序列作为支持向量机的输入序列。
步骤2 核函数选择:采用的是高斯径向基核函数见式(8)。
步骤3 初始化参数,创建初始种群:将待预测的实际信号作为抗原,预测信号作为抗体,设置支持向量机C、σ、ε各自参数范围分别为[0.1,100 000]、[0.01,100]、[0.01,10];设置免疫个体维数为3,免疫个体数目为NP,最大免疫代数为G,由于待优化的参数数量较少,所以采用二进制编码。
步骤4 亲和度计算:亲和度表征的是免疫细胞和抗原之间的结合强度,对应遗传算法中的适应度,结合抗原的同时使整个优化模型得到的均方根误差最小,将均方根误差的倒数定义为亲和度函数:
(9)
步骤5 算法寻优终止判断条件:判断算法是否满足终止条件,如果满足,则停止算法寻优,否则继续寻优。
步骤6 抗体浓度和激励度计算:抗体浓度的高低能够表明种群中抗体多样性的好坏,抗体浓度过高容易陷入局部寻优,即在局部可行解中寻优,不利于全局搜索,把抗体浓度定义为:
(10)
(11)
式(10)、式(11)中,N为种群规模,S代表抗体间的相似度,Fit(yi,yj)表示两抗体之间的亲和度,δs表示相似度阈值。
将激励度定义为抗体亲和度与抗体浓度代数形式,综合考虑两者间关系,用来表征抗体最终质量,计算方式为:
Simij(C,σ,ε)=a·Fitij(C,σ,ε)-
b·Denij(C,σ,ε)
(12)
式(12)中,a,b为计算参数,视实际情况确定。
步骤7 免疫处理:免疫处理主要包括免疫选择、克隆、变异以及克隆抑制。较遗传算法,增加克隆以及克隆抑制操作,目的是为了提高算法的搜索效率,改善算法的优化效果。
步骤8 种群刷新:将种群中激励度较低即质量较差的抗体替换成随机生成的新抗体,产生下一代抗体,继续重复步骤4,直至满足寻优终止条件结束寻优,得到优化效果最好的支持向量机参数。
步骤9 海杂波微弱信号预测:采用经免疫算法优化后的支持向量机参数进行训练,完成待测信号基于海杂波背景下的预测。
3 混沌海杂波背景的微弱信号检测仿真
为了验证IA-SVM预测模型的实用有效性,本文进行两组仿真实验:第一组实验采用Lorenz系统作为混沌背景噪声,加入瞬时和周期信号,研究分析预测模型的可行性;第二组实验则是采用实测海杂波数据作为混沌噪声背景,检验预测模型方法的有效性。分析预测信号的均方根误差,以此作为预测模型预测精度的衡量标准,检测信噪比用来判断预测模型的检测微弱信号能力。
3.1 实验一
Lorenz在研究模拟对流天气预测工作时发现:
(13)
式(13)中,设A=10,B=28,C=8/3,初始条件x=0,y=1,z=2,利用龙格库塔求解方程,设定求解步长为0.01,待系统完全进入混沌状态时,经相空间重构后,取处理后的2 000个点作为预测模型的仿真数据,前1 000个数据点作为训练样本集,后1 000个数据点作为预测验证集,通过对比不同预测模型下预测数据和实际数据均方误差和信噪比,验证IA-SVM模型的可行性以及优越性。利用经典C-C法求嵌入窗宽,进行相空间重构,推得嵌入维为5,时间延迟为1。
在预测集的第605~654个点处加入一定幅值的小信号,改变幅值大小构造信噪比不同的含噪信号,在保证模型预测稳定的前提下,探究模型的极限检测能力。经多次重复改变实验,决定加入幅值为0.000 05的微弱信号,并将其叠加到Lorenz混沌背景噪声中构成待预测信号,计算信噪比(SNR)为-104.174 3 dB,经归一化处理和求嵌入窗构建相空间后,进行IA-SVM模型的单步预测。
预测结果如图1所示,经免疫算法优化后的支持向量机参数C=825.67,σ=0.869 4,ε=0.045 1, 预测结果的均方根误差(RMSE)为0.000 146 3。从图2中可知,预测点n=605~654间的误差较大,这是因为较真实值该处加入了幅值为0.000 05的微弱瞬时信号,能够确定该处存在微弱信号,验证了该模型的可行性。通过不断改变加入微弱信号的幅值,减小幅值实现信噪比下降,在保证预测模型能够明显预测微弱信号的前提下,微弱信号幅值最小时对应的极限信噪比以及预测误差来反映模型检测能力。对比IA-SVM的预测模型与其他几种预测模型的检测能力,比较结果如表1所示。
图1 含瞬态信号的真实值与预测值Fig.1 Real and predicted values of transient signal
为了进一步说明提出方法的优越性,利用不断改变加入瞬时小信号的幅值从而改变信噪比,探究不同信噪比条件下本文提出方法和传统混沌算法的检测效果,做200次蒙特卡洛仿真实验,获得如图4所示的检测率对比图,定义检测率η=N1/N,其中N1为成功检测到微弱信号的次数,N为实验总次数。
图2 含瞬时信号的预测误差Fig.2 Prediction error with transient signal
通过对比图可以发现,本文算法检测性能较混沌算法有明显优势。在信噪比高于-20 dB时,两种算法均能较为准确地检测微弱信号的存在;然而当信噪比低于-20 dB时,传统混沌算法检测率陡降,检测性能大打折扣,检测率已经不能满足实际工程应用的要求,反观本文方法检测率稳定缓缓下降,即使信噪比达到-104.147 3 dB,本文检测率依然为83.2%,表明本文算法在较低信噪比下检测信号的有效性。
表1 混沌预测模型性能对比
紧接着进行周期信号的预测实验,重复上述实验步骤,将微弱瞬时信号更换成微弱周期信号,设定目标信号为:
s(n)=0.000 25sin(2πfn)
(14)
频率为0.031 8,信噪比达到-89.5 dB,得到优化后的参数C=93 580,σ=0.635 0,ε= 0.014 6,预测结果的均方根误差RMSE为0.000 091 8。通过观测含周期信号的预测误差如图4所示,不能确定微弱信号的位置,所以对误差幅度进行快速傅里叶变换,研究预测误差的频谱特性观察图5的误差频谱图,不难发现,在频率为0.031 8处频谱图出现显著峰值,能够确定微弱周期信号的存在,在其他频率时同样出现小锯齿,主要是因为整个预测模型本身存在误差以及在预测系统中所加的微弱瞬时信号和周期信号的干扰。
图3 瞬时小信号检测率比较图Fig.3 Comparison diagram of instantaneous small signal detection rate
图4 含周期信号的预测误差Fig.4 Prediction error with periodic signal
图5 含周期信号的预测误差频谱Fig.5 Prediction error spectrum with periodic signal
同样地,为了进一步验证本文方法检测周期小信号的检测性能,依旧选用目标信号,采样频率为100 Hz,在不同信噪比条件下比较两种检测方法的检测性能,同样地做200次蒙特卡洛仿真实验,得到如图6所示的检测性能对比图。
通过图6可以得到,本文算法的检测率高于混沌算法的检测率,在信噪比较高的情况下,二者的检测能力旗鼓相当,但是随着信噪比的降低,两种方法检测能力都有所下滑,不过本文提出的检测方法较混沌算法稳定,检测率缓缓下降,在信噪比低至-89.5 dB时,依旧能够保持85%以上的检测率。
图6 周期小信号检测率对比图Fig.6 Comparison diagram of detection rate of periodic small signal
3.2 实测海杂波数据选用IPIX雷达采集的数据
首先选用2 000个不含微弱目标信号的海杂波数据,选取前1 000个点作为训练样本集,后1 000个点作为预测验证集,并对这两组数据进行相空间重构和IA-SVM预测,得到优化后的支持向量机参数C=83 546,σ=0.088 1,ε=0.011 5,预测结果的均方根误差(RMSE)为0.000 623 8,较传统预测模型的检测精度得到明显提升(LS-SVM预测模型的均方根误差为0.013 7),预测结果如图7所示。然后进行含小目标的海杂波数据的实验,选用的是IPIX雷达54#海杂波距离目标单元,目标数据区间:主目标为8,次目标为7∶10,实验步骤和不含小目标的海杂波数据实验一样,得到支持向量机优化参数C=274 340,σ=0.107 7,ε=0.024 7,预测结果的均方根误差(RMSE)为0.000 259 9。通过观察预测结果的误差幅值图,同样无法直接确定微弱信号的位置,对其进行频谱分析得到图的误差频谱分析图,观察图显而易见,在归一化频率为0.014 42时出现明显峰值,即表明了IA-SVM预测模型检测到淹没在混沌海杂波噪声中的微弱信号,较传统预测模型有着明显优势,得益于支持向量机较好处理复杂非线性问题;较GA-SVM预测模型更加敏感,精度更高,得益于IA算法的搜索效率更高,寻优效果更好。
图7 海杂波背景下的预测值与真实值Fig.7 Predicted and true values in the background of sea clutter
图8 海杂波背景下的误差频谱Fig.8 Error spectrum in the background of sea clutter
4 结论
本文提出了基于免疫算法的优化支持向量机微弱信号检测方法。通过经典C-C法求嵌入窗宽度构建混沌序列相空间,利用免疫算法的寻优能力对支持向量机中影响预测精度的惩罚系数、核函数以及不敏感损失参数这三个参数进行优化,从而建立混沌时间序列的预测模型,从预测误差中检测混沌噪声背景中的微弱信号。仿真实验以Lorenz系统的混沌数据和实测雷达的海杂波作为背景噪声,分析IA-SVM模型预测信号信噪比和均方根误差,来判断模型预测性能效果,并与其他预测模型对比。利用免疫算法优化支持向量机参数的预测模型能够检测出淹没在混沌背景中的微弱信号,而且比常规使用的未优化支持向量机和传统的神经网络方法更快、精度更高,提高了预测模型的精度同时还避免了陷入局部极值,得益于支持向量机和免疫算法的优点。通过对比分析其他几种模型预测的均方根误差,在信噪比更高情形下的IA-SVM模型的预测误差更小,预测性能更好,更接近实际值。