APP下载

复杂电磁环境下通信抗干扰的信息筛选算法

2013-11-09李其芳

指挥控制与仿真 2013年3期
关键词:概率模型高斯数据挖掘

李其芳

(陆军军官学院,安徽 合肥 230031)

军队若要具备信息系统的体系作战能力,就必须争夺制信息权。信息战争中,复杂电磁环境是信息化战场的基本特征。若想打赢信息化条件下的战争,就必须加速深入研究复杂电磁环境下的战场电磁环境问题,通信联络就是在这样的环境中展开的。随着新军事变革的不断推进,战争的形态已经发生了转化,信息为先导和主导。在这样的环境下,无疑对作为信息流通纽带、作战要素桥梁的战场通信提出了更高的要求。

信息化战场条件下的通信干扰主要可以分为人为有意干扰、人为无意干扰和环境自然干扰。人为有意干扰主要来自敌方有目的性的通信干扰,有可能是阻塞式干扰;无意干扰主要是己方通讯设备和一些民用设施发出的电磁波等造成的互扰;自然干扰主要有雷电,磁场等环境因素。通信装备要采用什么方法在如此大量的各种错综复杂的通信数据中筛选出有价值的信息提高通信联络效率,成为了本文研究的重点。

1 基本算法概述

目前数据挖掘的主要算法有信号处理法、关联规则法、神经网络法、粗糙集法、遗传算法、统计学法等。但是这些算法都有自身的特点,也存在着缺陷,例如传统的神经网络法,其组成的神经网络是非构造性的,每一部分的关联都比较大,只要有任何微小的改动都会改变整体的效果,使网络变得不稳定[1]。张钹院士和张铃教授在M-P神经元模型的基础上,提出一种称为构造性神经网络[2]的新型网络模型。覆盖算法属于该构造性神经网络学习算法,利用数据自身特点,有目的性地构建神经网络模型。神经网络以分层的形式构建,网络功能被分割成不同的、相对独立的模块。每个模块有独立解决整个问题其中一部分的能力,在学习阶段处理的数据也不相同。

首先网络结构中的各个模块比较简单,各模块的功能是处理整个问题其中的一部分,问题也相对容易,很难受到其他数据的影响,容易训练,相对简单的网络结构提高了网络的可靠性;其次,各个模块相对独立,可同时进行训练,效率高,便于在时间紧迫时快速计算;最后,硬件更易实现,构造若干简单的模块再将其连接起来比直接构建整个计算网络更容易,实现模块化。

构造性神经网络的主旨是将无限大的区域分为相对独立的有限区域,将学习问题通过非线性变换变为分区问题,将多区域复杂性问题进行简单化,可以实现多种类别样本的同时划分;将神经元的功能局部化,将非局部性的划分区域变换为局部性划分区域,因此其计算量少,速度快。

2 概率模型介绍

正定核函数是解算微分方程的一个非常有用的工具。Mercer定理[3]在其严格定义的基础上给出了正定核函数的特征分解。高斯核函数是一种普遍使用的核函数,因为高斯核函数对应的特征空间是无穷维的,有限的样本在该特征空间肯定是线性可分的。任何连续分布均可由等方差高斯密度的有限混合任意逼近。在近似的意义下,仅研究有限高斯混合密度就足够了。通过这种思想可以利用有限高斯混合密度为覆盖算法构建概率模型[4]。

设X1…,Xn是样本为n的独立分布随机样本,其中Xi是m维随机向量,其概率密度函数为f(x)。f(xi)可表示成:

其中,fj(xi)为观察值xi是第j分量时的条件概率密度函数。

若fj(x)为1维高斯分布,式(1)可表示为

3 覆盖算法概率模型的构造

设有n个m维样本,分成w类。首先利用基本覆盖算法求得覆盖组为

设覆盖第i类点的覆盖组为

对每个覆盖组取特征函数表示,但是这种表示不能反映样本在覆盖中的具体分布情况。若引入高斯函数[5](以覆盖的中心 aij为高斯核函数的均值,取半径为决策函数为

其中,βij是与各覆盖中样本点的密度有关的参数。

式(3)可理解为高斯函数的覆盖算法得到的决策函数。通过以上变换后,可以从概率的角度来思考、解决问题。式(3)是一个有限混合概率模型,因此可以利用最大似然的算法求得其参数。这样就以概率的角度解决了为函数确定参数的问题。下面本文将概率统计中的方法引入该计算网络的分类学习[8],即把覆盖算法与概率统计模型有机结合起来,为覆盖算法找到了全局优化的解决方法[9]。

4 基于覆盖算法概率模型的海量数据挖掘

假设给定w类分类的训练样本集K={K1,K2…,Kw},算法实现步骤如下:

首先,采用覆盖算法,求出各个覆盖组{C1,C2…,Cw}。在计算的过程中要注意对球形领域所覆盖点数的考察,在学习获得覆盖组的过程中主要就是对是否完全覆盖的反复考察和计算。具体计算程序如图1。

图1 学习获得覆盖组程序图

其次,以覆盖中心为高斯核函数均值,取半径为方差,对每一覆盖Cij引入高斯核函数。

最后,利用最大似然迭代EM算法进行最大似然拟合。

利用EM方法求解最大似然问题,难点是如何正确地选取混合模型分量个数的问题。这个问题可利用覆盖算法求得的覆盖,作为EM算法的迭代起始值,能够得到比较好地解决。因为利用覆盖算法求得的覆盖组,基本上已是次优的覆盖,在此基础上再利用EM算法进行迭代就能很快求到最优解。这也是对覆盖算法的概率模型进行改进的成功所在。

5 实验结果分析

该实验将基于覆盖算法的概率模型的信息筛选算法应用到短波无线电通信对抗侦察中的信息获取筛选部分[6],用来验证实际效果。

实验包含三个部分:1)信号接收机,将采集信号作为分析数据;2)训练采集信号的一部分作为样本,利用上述模型进行聚类分析;3)用另外部分的信号数据作为测试对比,用来检验该模型的信息筛选效果。

本实验利用某型号的短波接收机,控制其在20MHz至30MHz频段内,按照5MHz步进,按照从低到高循环进行不断的搜索,在本试验中以3min为一个周期,搜索到任何一频点,驻留短暂的时隙(例如75ms),此时从已经连接电脑的接收机的频率输出端采集信号并存入数据库或直接分析。接收机的中频输出频率设置270kHz,带宽设置为3kHz,采用带通采样的方式,采样频率设为25kHz。由于采集的数据是时域数据,不便于分析,在这里把采样的时域数据利用快速傅立叶变换转化为频域数据后存入数据库,经过一段时间所采集的样本达到所需要的数据量时再进行分析处理。利用前一部分被采集的数据作为训练样本,构造神经网络,再用另一部分作为测试样本,用于进行对比测试[7]。

图2是在20MHz至30MHz频段之间,连续十个小时的信号频占统计图,约200个数据点,横轴为频率,纵轴为时间,图中点的虚实代表该对应的频率和时间上信号的类别。实点表示环境中的杂波,虚点表示有用的信号。这样的模拟数据符合实际情况和环境需要。有用的信号淹没在其他电台信号、噪声干扰等,跳频信号频率不容易被提取。为了有效获取信息,对图2所示数据进行预处理,经算法处理,剔除干扰过滤噪声后,频率占用度如图3所示,绝大部分噪声被有效地滤除。

图2 接收信号频占图

图3 算法处理作的频占图

利用覆盖算法的概率模型得到的改进覆盖算法,并与原覆盖算法进行数据挖掘,信息筛选得到的对比结果如表1所示。

表1 不同方法实验结果表

从表1得出,利用改进覆盖算法对有用信息进行筛选,在过程中所用时间和正确率比原覆盖算法和核覆盖算法都有很大提高,这是由于改进的算法从整体出发,对所有测试样本都能到达最优化。

6 结束语

本文从海量数据挖掘的方向考虑,在神经元几何意义的基础上,介绍覆盖算法的原理以及经典算法;然后在覆盖算法的基础上,利用高斯函数的概率意义(高斯分布),为覆盖算法建立一个有限混合概率模型,提出了覆盖算法的概率模型,对覆盖算法进行改进,给出了一种新的算法,即基于覆盖算法的概率模型的海量数据挖掘算法;利用这种改进的算法组建神经网络,在保持计算复杂度不变的前提下,引入全局优化模型,扩大了覆盖算法的使用范围,提高了算法的精度,适合大规模数据挖掘。最后的实验验证了算法的实效性。此算法优化后,可应用于复杂电磁环境下的通信联络组织,用于将有价值的数据分离出来,提高了通信效率,增强了通信的有效性。

[1] 张铃,张钹.多层反馈神经网络的FP学习和综合算法[J].软件学报,1997,8(4):252-258.

[2] 张铃,张钹.人工神经网络理论及应用[M].杭州:科学技术出版社,1997年.

[3] 张莉.SVM与核方法研究[D].西安:西安电子科技大学,2002.

[4] 赵姝,张燕平,张媛,等.基于交叉覆盖算法的入侵检测[J].计算机工程与应用,2005(1):141-143.

[5] 张燕平,张铃,段震.构造性核覆盖算法在图像识别中的应用[J].中国图象图形学报,2004,9(11):1304-1308.

[6] 张旻,陈加兴.基于粒度计算和覆盖算法的信号样式识别[J].计算机工程与应用,2003(24):56-59.

[7] 王伦文,张铃,张旻.一种适合于无线电监测的数据挖掘技术[J].计算机工程与应用,2004(4):37-40.

[8] Heckman D.,Geiger D.,Chickering D.,Learning Bayesian Networks:the Combination of Knowledge and Statistical Data.Machine Learning[J].1995,20(3):197-243.

[9] Heckman D.,Mandani A.,Wellman M.,Real-World Applications of Bayesian Networks[J].Communications of the ACM,1995,8(3):38-45.

猜你喜欢

概率模型高斯数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
在精彩交汇中,理解两个概率模型
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
数学王子高斯
天才数学家——高斯
软件工程领域中的异常数据挖掘算法
一类概率模型的探究与应用
从自卑到自信 瑞恩·高斯林
经典品读:在概率计算中容易忽略的“等可能”