基于One-Class SVM的机载塔康测距信息异常检测方法研究
2015-12-31李城梁
李城梁
(中国电子科技集团公司第二十研究所,西安 710068)
0 引言
单一的导航系统容易受本身技术体制的限制,例如:惯导系统的误差随时间累积,因而长时间工作难以保持高精度,卫星导航系统易受干扰,自主性差等,难以满足在未来战争环境的要求[1]。多源导航信息融合技术是解决以上问题的有效途径。战术空中导航系统,简称塔康(TACAN,Tactical Air Navigation System)具有测位、测距及信标识别功能,是航空导航体制中主要的无线电导航系统,是多源导航信息融合系统中重要的导航源之一[2]。然而,塔康测距的异常信息会直接影响多源导航信息融合系统的可靠性。因此,对塔康测距信息进行异常检测,为导航融合模式提供检测结果,可以作为调整或重构导航融合模式的依据,为多源导航信息融合提供数据保障。
传统传感器异常检测的大多数方法需要建立相应的异常状态模型,并需要提供特定样本所组成的训练数据集来训练,而且这些基于统计学的模型只是当样本数目趋向于无穷大时的理想极限特性[3]。现实应用中其观测样本通常是有限的,难以满足基于传统的统计方法的前提条件,以致测试误差较高。由于需要大量训练数据,计算代价过大,难以满足实时的在线检测。异常状态可以认为是在特征空间中与正常状态有偏离的现象,因而异常检测方法本质上就是识别非正常信息的方法。直接建立系统正常工作模型,并通过检测与正常特征的偏离程度来识别异常,这样免去了建立故障模型的难题,从而使问题大大简化。
本文介绍了一种基于One-Class SVM机载塔康测距信息异常检测方法。该方法在不使用异常状态类别的条件下,仅需要正常状态下的时域特征信息来训练One-Class SVM以获得检测模型,有效的提高了在工程应用中的可行性。首先,第1节中介绍了机载塔康测距信息特征提取的方法。第2节中介绍了采用One-Class SVM分类器的理论内容。第3节介绍本文提出的机载塔康测距信息异常检测方法的检测流程。第4节为实验验证。
1 机载塔康测距信息特征提取
1.1 时序列的预处理
多源导航信息融合系统中的惯导数据平稳、连续,可以作为其他导航传感器的异常检测基准进行特征提取。理想状态下,机载塔康测距信息的数据更新时刻和惯导数据更新时刻保持同步。则有:
用固定长度为K的滑动时间窗,其中滑动时间窗中,每新增一个最新的数据点的同时移去一个最旧的数据点。滑动时间窗分别截取Dins和Dtacan,则得到检测基准样本和机载塔康测量斜距样本。
1.2 用于异常检测的特征量提取
2 One-Class SVM分类算法
SchOlkopf提出的单类支持向量机是支持向量机的一种扩展[5],它利用样本集,通过非线性核函数映射K,在高维特征空间H中计算一个包含尽可能多样本的最小超球作为决策边界。这样的SVM是一个能描述样本密度分布的二值模型。设
其中S是样本集合的某个子集。
图1 One-Class SVM分类器原理示意图
如图1所示。其中a为超球体的圆心,R为超球体半径,σi>0对应于超球体外面的点。
包含所有训练样本的最小超球体的求解可以转化为以下凸优化问题:
定义Lagrange函数:
其中,C为惩罚系数,Λ={αi},对应的 Lagrange系数αi≥0,γi≥0(i=1,2,...,N)。将上式子分别对R和α求偏微分,并令其等于0,得到相关的优化方程:
引入高斯径向基核函数 (x,y)→K(x,y)即:
得到对应的优化方程:
根据KKT条件,大部分α为0,只有一小部
i分αi>0,与那些不为零的αi对应的样本点决定了超球体边界的构成,为此,将这些样本点称为支持对象。对于待定的状态数据z,它到球心的距离的平方为:
设任意一个支持对象xs,则球体半径的平方为:
依据式(15)可以判断z是否为正类样本:
3 基于One-Class SVM的机载塔康测距信息异常检测方法
图2 One-Class SVM的机载塔康测距信息异常检测方法流程图
如图2所示,基于One-Class SVM的机载塔康测距信息异常检测算法分为两个部分:训练阶段和在线检测阶段。
训练阶段:
(1)首先,将离线的惯导基准数据和机载塔康正常状态下的测距数据组成训练集,按照 1.1节介绍的方式将这两组是序列进行预处理。
(2)用1.2节介绍的方法构建训练样本的特征空间。
(3)用(2)中构建好的训练样本训练One-Class SVM分类器得到异常检测模型。
在线检测阶段:
(1)将在线的惯导基准数据和机载塔康测距数据按照1.1和1.2节中介绍的方法构建样本的特征空间。
(2)将在线得到的样本输入到已经训练好的异常检测模型中,最终得到异常检测结果。
4 实验验证
相互匹配的惯导数据和机载塔康正常状态下的测距数据从实验室模拟环境中得到,惯导位置精度0.8n mile/h,速度精度0.8m/s;其中,塔康测距精度300m,采样频率均为25Hz。训练阶段数据是以往飞行正常数据的综合。训练集的数据为模拟10次飞行,每次飞行时间为 20分钟,滑动时间窗长度为10,每次移动1个采样节拍,共计29910个训练样本。在测试样本中,另外模拟 10次飞行,每次飞行时间为10分钟,滑动时间窗长度为10,每次移动1个采样节拍。为验证噪声对检测方法的影响,试验中的塔康测距数据,分别加入均值为 0,方差为5,10,20的高斯白噪声,如图3~图5所示。通过特征选择将均值、方差、波形指标作为检测的特征量。
图3 噪声水平为N(0,5)时的机载塔康数据
图4 噪声水平为N(0,10)时的机载塔康数据
异常检测性能通过测试样本的检测概率进行评判,评判准则为:根据塔康测距精度,每组测试样本集中,在正常的机载塔康测距数据中随机添加200个跳变异常样本(在正常的机载塔康测距数据基础上添加大于150m的跳变幅值),每一次飞行的检测概率记为pi,pi=ni/Ni,ni为检测结果为该次飞行检测结果为正常的测试样本个数,Ni为该次飞行测试样本的总个数,i=1,2,…,10。检测概率P=average (pi)。
图5 噪声水平为N(0,20)时的机载塔康数据
三种高斯白噪声环境下的异常检测概率结果如图6所示。
图6 三种白噪声环境下的异常检测概率结果
从图 6中可以看出,N(0,5)情况下的检测概率为100%,在N(0,10)情况下为99.99%,N(0,20)在第10次试验中的检测概率最低,为97.97%,但10次试验平均后的结果仍大于99%。
实验结果表明,噪声水平在一定范围内变化时对异常检测性能有微弱的影响,但是可以满足该机载塔康测距信息异常检测方法能够满足实际应用。
5 总结
本文提出在多源导航信息融合系统的应用中,用One-Class SVM实现对机载塔康测距信息进行异常检测的方法,它借助于惯导基准数和机载塔康测距数据构建时域特征量,通过One-Class SVM获取机载塔康测距信息在正常状态下的模型,从而实现在线异常检测。仿真实验表明了此方法的可行性和有效性。
从实验结果中还可以看到,噪声水平对异常检测存在影响。如何进一步降低强噪声背景环境对异常检测性能的影响是在实际应用中需要解决的问题,也是今后研究的重点。
[1]何友等.多传感器信息融合及应用[M].北京:电子工业出版社,2000:129 -138.
[2]张忠兴,李晓明,张景伟等.无线电导航理论与系统[M].西安:陕西科学技术出版社,1998:1-8.
[3]Funt B V,Finlayson G D.Color Constant Color Indexing[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,17(5):522-529.
[4]钟秉林,黄仁.机械故障诊断学[M].北京:机械工业出版社,1997.
[5]Scholkopf B,Platt J C,Shawe-Taylor J,Smola A J,Willianmson R C.Estimating the support of a highdimension distribution[R].Technical Report MSR-TR-99-87,Microsoft Research,1999.