APP下载

一种面向协同感知的多传感器自适应管理方法

2017-09-12陆泽健秦永刚郭继光

中国电子科学研究院学报 2017年4期
关键词:自适应识别信息熵

陆泽健,刘 筱,秦永刚,潘 越,郭继光,黄 胜

(中国电子科学研究院,北京 100041)

一种面向协同感知的多传感器自适应管理方法

陆泽健,刘 筱,秦永刚,潘 越,郭继光,黄 胜

(中国电子科学研究院,北京 100041)

针对多特征目标综合识别中的传感器动态调度问题,本文提出一种面向协同感知的多传感器自适应管理方法。该方法在离线获取目标识别先验概率分布的基础上,首先利用多个管控周期的累积探测特征组合,基于贝叶斯推理实现对未知目标的在线识别,然后计算感知信息熵增益作为管控系统反馈输入,利用遗传优化算法实现多传感器-多目标的自适应分配。仿真结果表明,与随机分配算法相比,该方法识别效率提高了近21秒,有效提升了传感器网络对未知目标的动态感知能力。关键词: 识别;信息熵;自适应;传感器管理

0 引 言

现代预警探测网络系统中通常包含相控阵雷达、红外、光学、电子侦察、敌我识别/二次雷达、声呐等多种不同体制、不同类型的传感器。为充分发挥多源异构传感器资源的作用,需要加强对传感器网络的智能化管理,使其能够根据复杂多变的战场环境做出实时的决策,以获取作战指挥所需求的信息,满足情报保障的需求。多传感器自适应管理技术通过对传感器、战场环境的建模,建立起满足业务需求的优化目标,在有限传感器资源条件下,对传感器资源进行合理、科学的分配,最大化探测效能[1-3]。

在传感器网络探测过程中,目标检测、跟踪与识别是三个最重要的工作任务。当前,围绕多目标联合检测、协同跟踪需求,已有不少文献对传感器的管控方法和策略进行了研究[4]。然而,针对目标综合识别的传感器管控方法研究较少[5-7]。文献[5]基于假设检验的方法, 从理论上研究了目标识别中的传感器管理方法,并进行了多种方法的分析对比;文献[6]首次提出了一种基于分辨力的目标识别系统中的传感器管理方法,该方法从分辨力的角度出发,利用D-S证据理论对各传感器的探测结果进行综合决策;文献[7]在分析综合识别中目标优先级和传感器使用约束条件的基础上,建立了利用分辨力增益作为传感器资源管理优化准则的目标函数,提出了利用传感器混淆矩阵的预测分辨力增益计算方法。这些理论或者方法通过综合多个传感器在同一时刻的判决结果,在决策级别进行目标综合识别,依靠建立的优化目标函数实现传感器的自适应管理。这些研究大都在决策级别目标综合识别的基础上进行传感器优化管理,无法充分发挥多种类型传感器不同探测特征的最大效用;此外,由于战场环境的复杂性,两个传感器有可能会对同一个目标做出相反的判决,有可能会造成基于D-S证据理论的传感器自适应调度算法的失效。

图1 基于感知识别信息熵增量的多传感器管理流程

在多传感器网络中,不同体制、不同工作模式的传感器能够提供威胁目标不同特征的描述,通过综合多个特征的信息,能够产生比系统中任何一个传感器更有效、更精确的身份估计和判决。因此,在多传感器协同感知过程中,一方面需要综合多种不同的探测特征信息,使目标识别概率最大;另一方面,由于目标的独特性,不同的目标特征对目标身份识别的贡献度不一样,因此在多传感器管理过程中应该选择合适的传感器使探测目标特征最有利于识别。本文针对战场威胁目标多特征综合识别中的多传感器自适应管理问题,在多传感器特征级信息融合的基础上,建立了面向协同感知信息熵增益的传感器资源管理优化模型;在此基础上,采用遗传算法实现“传感器-目标”配对的问题;最后,通过设定综合识别场景, 对该方法的性能进行了仿真分析。

1 多传感器自适应管理模型

1.1 总体框架

本文提出的面向协同感知的多传感器自适应管理总体框架如图1所示。该框架包括离线学习和在线决策两部分。在离线学习部分,针对传感器网络历史探测数据,采用贝叶斯网络对探测目标进行统计分析,得到不同类型传感器对不同类型目标探测特征分布以及全特征模式下的传感器识别先验条件概率分布,作为目标识别在线决策的依据;在第k个管控周期的在线决策过程中,首先对k时刻之前的探测数据进行目标特征提取、离散化,得到已探测目标特征组合,然后对第k时刻分配的新传感器组合,结合传感器探测特征分布预测目标特征。已探测目标特征组合加上预测目标特征组合可以得到组合的部分目标特征组合,采用贝叶斯推理结合离散学习得到的先验条件概率分布表可以计算得出未知目标的综合识别概率。在此基础上,求解当前时刻传感器网络对未知目标的预测感知信息熵,与上时刻的感知信息熵比较,可以得到系统的感知信息熵增量。感知信息熵增量作为探测系统的反馈输入,在信息熵增量减小的情况下,通过智能优化算法重新优化分配传感器资源,动态生成传感器组合对未知目标进行感知,从而实现“感知-学习-决策-行动”的传感器管控闭环。

1.2 目标协同识别模型

本文采用贝叶斯网络推理技术对目标进行综合识别。贝叶斯网络推理主要应用贝叶斯推理算法以及贝叶斯网络的条件概率表,对识别目标的类型进行概率计算,取概率值最大的目标类型为目标所属类型。设传感器网络中出现的目标种类为S,对于探测目标可以分类到0,1,…S类别上,其中0表示信息不足未能区分目标。假设在某一个管控周期k,采用M部不同类型的传感器探测N个未识别目标,其观测特征向量值为Zk=(z1,z2,...,zn),则根据贝叶斯理论对目标的判决概率p(si|Zk)为:

(1)

式中,假设各个传感器的探测是相对独立的。其中p(zj|si)为目标探测的先验概率,p(si)是目标类型si出现的概率。p(zk)是测量值zk出现的先验概率。在贝叶斯准则下,目标类型判定的依据为:

(2)

1.3 目标特征提取及离散化

贝叶斯推理需要借助于贝叶斯网络的条件概率表,该概率表可以通过对传感器网络积累的大量历史探测数据离线学习得到,也可以由军事专家结合理论及实际工程经验给出。由于贝叶斯网络接受的数值都是离散的数值,而部分传感器提取的目标特征信息通常是连续的,因此需要将连续分布的特征数值模糊转换为离散的特征数值。例如,速度可以按照速度的大小模糊成为“快-中-慢”三个数值;RCS可以按照RCS期望的大小模糊成为“高-中-低”三个数值;红外特征可以按照目标辐射亮度的大小模糊成为“强-中-弱”三个数值。对于ESM、CSM,可以按照是否存在某个波段或波段组合进行离散化;对于敌我识别/二次雷达,得到应答则为1,否则为0。对于速度、RCS、红外等特征的划分,可结合各类型目标的特点和典型的数值来划分。

1.4 协同感知信息熵计算

传感器网络探测的目的就是与目标环境互相作用,以进一步减小目标环境的“不确定性”。这种不确定性可以通过信息熵来[8]描述。在多目标协同感知过程中,假设有M部传感器,未识别目标有N个,各传感器对目标的探测是互相独立的,则在k时刻系统感知信息熵为:

(3)

式中,Z1:k第1个管控周期到第k个管控周期传感器网络累积的目标特征组合。pi(s|Z1:k)是指在k个管控周期已知目标特征组合Z1:k的前提下,对第i个目标识别的贝叶斯判决概率。在实时探测过程中,传感器的信息在整个网络中是共享的,因此传感器网络的信息熵是动态变化的,即第k个管控周期的信息熵不仅仅包括当前的探测组合对目标的信息熵,也同样包括之前已探测目标特征对应的信息熵。则传感器网络每次探测目标的信息增量I定义为:

(4)

若Hk(p)=Hk-1(p),则Ik=0,表示传感器网络本次量测没有提供任何信息,在协同感知中表示没有新的特征量提供。若Hk(p)≠Hk-1(p),则Ik≠0,则说明传感器网络本次量测提供了新的信息。Ik越大,说明传感器网络的分类不确定性越大,对应的目标更需要传感器对它做进一步识别。协同感知信息熵增益可以作为传感器动态调度的判断依据之一。

2 基于遗传算法的传感器-目标分配算法

2.1 传感器-目标分配模型

多传感器协同感知就是要科学、合理的分配多个传感器去识别多个未知目标。假设传感器网络中包含M部传感器,待识别目标有N个。在探测过程中同一个目标可能由多个传感器来探测,则引入伪传感器的概念[9],即对于一个目标,可能分配的传感器组合为2M-1个。面向协同感知的传感器-目标分配模型如下式所示:

(5)

2.2 智能优化算法流程

由上一小节可以看出,传感器资源分配求解是一个组合爆炸的NP-hard问题。虽然传统的数学规划方法在理论上能得到最优解,但受到问题维数的制约往往不满足实际要求。本文采用遗传算法求解该问题。遗传算法包含适应度函数选择、基因编码、遗传操作(初始种群产生、选择、交叉、变异)等步骤。适应度函数采用公式(5)中的定义,则整个遗传算法具体步骤如下:

Step1:基因编码。基因编码操作是将待解决的问题的可行解进行数学量化,并转化为遗传过程中基因结构数学模型,以便进一步进行交叉、变异、选择等操作。假设待分配的传感器组合(包括真实传感器和伪传感器)为2M-1,对于由N个待识别的目标,每个目标选择一种传感器组合作为分配的结果,则编码形成的染色体串对应着一种传感器-目标分配方案,如下图所示:

图2 染色体编码示意图

其中Ri∈[1,2M-1]。

Step2:初始化种群。假设种群个体的数量设置为T,则随机生成T个染色体串,即产生含有T个个体的初始种群。对于每个染色体中的每一个基因,随机从[1,2M-1]之间选择一个数字作为初始化分配结果。

Step3:个体选择。选择根据适者生存的原则选择生成下一个个体方案的父本,以适应度为选择原则,选择出适应度大的分配方案直接传给下一代,淘汰适应度低的方案。采用轮盘赌选择方法对种群个体进行选择。

首先由适应度大小计算每种分配方案被选择的概率。记Si为T个个体中第i个个体的适应度,Ai为第i个个体被选中这一事件,则第i个方案被选择参与下一代种群的概率为

(6)

(7)

的第k个方案作为被选中方案,重复选择T次(同一个体可以多次被选中),选出下一代的T个个体。为满足遗传算法收敛的要求,保证最优个体能够被复制到下一代,应当将当代适应度最高的个体替换下一代个体中适应度最差的个体,以保证适应度最高的个体能够存活到下一代种群中。

Step4:交叉。在被选中用于繁殖下一代的个体中,以交叉概率pc随机不重复地从中间群体中选择两两个体对,等概率随机选择个体对中的基因交换位,对交换位前的基因进行交叉运算,交叉过程如图所示。

图3 染色体交叉示意图

Step5:变异。变异是在交叉后的个体中,以变异概率pm对所有个体的基因位进行变异运算,随机产生一个符合限制条件的数赋值给该位,生成子代群体。具体操作为,对于每个基因位,随机生成[0,1]上的数,将它与变异概率pm进行比较,如果随机生成的数小于变异概率,则在取值范围内随机生成一个值替换原基因位。变异生成新方案的过程如图3所示。

图4 染色体变异示意图

Step6:交叉概率和变异概率的动态选取。用不变的控制参数来控制遗传进化,很容易导致“早熟”,降低了算法的搜索效率。调整遗传算法控制参数较好的方法是动态自适应技术,其基本思想是使交叉概率pc和变异概率pm在进化过程中根据种群的实际情况,随机调整大小,具体做法为:当种群趋于收敛时,减小pc、增大pm,即降低交叉的概率,提高变异的概率,以保持种群的多样性,避免出现“早熟”;当种群个体发散时,增大pc、减小pm,即提高交叉的概率,降低变异的概率,使种群趋于收敛,提升算法的收敛速度。

利用“早熟”程度指标

(8)

(9)

3 仿真分析

假设在[100 km×100 km]的监视区域内部署6部传感器,包含1部测速雷达传感器,1部RCS特性测量雷达传感器,2部红外传感器,2部无线电侦察传感器,其中雷达传感器、红外传感器、无线电侦察传感器的探测距离分别为60 km、 65 km以及70 km。在某一时刻,有80批未知类型的目标从监视区域的某一侧沿着不同的方向同时进入监视区域,目标可能有4种类型A、B、C、D,每种类型目标的个数均为20个。每种类型目标的先验概率通过对历史探测数据进行贝叶斯网络统计分析得到。由于贝叶斯网络涉及到大量的统计分析计算,这里直接给出贝叶斯网络条件概率表,如表1所示。

根据当前测量的特征数据组合,经过贝叶斯推理之后计算得出当前目标的综合识别概率。当综合识别概率大于等于0.80时,目标被确认,之后不用再被识别。为简单起见,在整个仿真过程中,目标做二维的匀速运动。为形成对比,本文采用传感器随机分配算法进行参考分析。随机分配算法即在每个管控周期内,为每个目标随机的选择一个传感器组合,系统采用随机分配的传感器方案对目标进行探测。本文采用蒙特卡洛法对两种算法进行比较分析,蒙特卡洛仿真次数为100次,仿真周期为150 s,传感器的管控周期为5 s,得到两种算法的性能比较如表2所示。

表1 贝叶斯网络的先验条件概率分布表

表2 两种算法性能比较表

表中,算法平均运行时间反映了多传感器动态调度的时间;平均识别时间是指从仿真开始时刻到正确识别所有目标所需要的时间。从表中可以看出,尽管随机分配算法的运行时间远远小于本文算法的运行时间,但是本文算法的运行时间仅仅为0.16 s,远小于5 s的管控周期,因此能够满足传感器管控实时性的要求。在整个仿真周期内,两种算法都能够100%正确识别出新出现的80批目标,然而,随机分配算法平均用了63.95 s才能识别出全部的目标,而本文提出的面向协同感知的自适应管控算法仅仅用了42.65 s,识别时效性提高了近21 s。

表3给出了不同的特征组合感知信息熵的大小,从仿真结果可以看出,不同的目标特征对于未知目标识别的贡献度是不一样的。表中,对于目标1,当只有几何特征时,感知信息熵为-1.36,对应的识别概率分别为[0.07 0.15 0.69 0.09],此时还未能识别目标。随着特征组合逐渐增多,感知信息熵逐渐减小,说明目标识别的不确定性逐渐在下降,当采用几何+RCS+红外+ESM特征组合对目标进行识别时,对应的识别概率分别为[0.0015 0.0001 0.9943 0.0041],综合识别概率大大增加了。一般而言,特征组合越多,越有利于识别,但是部分情况下,某些特征反而会增大识别的不确定性,例如在对目标2识别的过程中,采用几何+RCS+红外特征组合对目标的感知信息熵为-0.69,但是增加了ESM信号特征之后,感知信息熵反而下降到了-0.78,说明ESM特征不利于识别,因此在传感器动态调度过程中,就不应该再调度ESM传感器对目标进行测量。

表3 不同目标特征对感知信息熵的贡献

3 结 语

在现代复杂多变的战场环境中,如何充分利用利用多种传感器探测的多种特征对未知目标进行尽早识别已经成为决定战争胜负的关键。从多传感器多目标多特征综合识别的角度出发,本文提出了一种面向协同感知的多传感器自适应管理方法,该方法利用贝叶斯网络通过离线学习和在线学习的方式得到多传感器特征级别协同感知概率,基于联合感知信息熵建立了目标协同识别到传感器动态管理的管控闭环,同时采用智能优化算法提升“多传感器-多目标”的分配效率。仿真结果表明,本文提出的面向协同感知的多传感器自适应管控方法能够极大提升整个传感器网络的识别时效性,从而为后续的预警、拦截、打击等作战指挥活动争取宝贵的时间。

[1] A.O Hero, D. Cochran. Sensor management: past, present, and future [J]. IEEE Sensors Journal, 2011, 11(12): 3064-3075.

[2] 刘先省, 石磊, 潘泉. 传感器管理及方法综述[J]. 电子学报, 2002,30(3):394-397.

[3] 罗开平, 姜维, 李一军. 传感器管理述评[J]. 电子学报,2010,38(8):1900-1907.

[4] 刘钦, 刘峥, 谢荣. 防空雷达网对多隐身目标的协同检测与跟踪[J],电子与信息学报, 2013,35(3):601-607.

[5] 杨秀珍, 何友, 鞠传文. 目标识别中的传感器管理方法[J]. 火力与指挥控制, 2005, 30(3): 8-13.

[6] 胡仁伟, 廖东平, 魏玺章. 基于分辨力的融合目标识别系统中的传感器管理方法研究[J].电光与控制, 2007,14(3):1-4.

[7] 卫杨勇, 徐世友, 辛玉林. 基于分辨力增益的综合识别传感器管理方法[J]. 电讯技术,2011,51(11):11-15.

[8] 刘先省, 申石磊, 潘泉. 基于信息熵的一种传感器管理方法[J]. 电子学报, 2000,28(9): 39-41.

[9] J.M Nash, optimal allocation of tracking resources[C]. Proceeding of IEEE conference on Decision and Control including the 16th Symposium on Adaptive Processes and A Special Symposium on Fuzzy Set Theory and Applications, New Orleans, LA, 1997:1177-1180.

An Adaptive Multi-sensor Management Method for Cooperative Perception

LU Ze-jian, LIU Xiao, QIN Yong-gang, PAN Yue, GUO Ji-guang, HUANG Sheng

(China Academy of Electronic and Information Technology, Beijing 100041, China)

An adaptive management method is proposed in this paper to address the problem of multi-sensor dispatching in the sense of multi-feature target recognition. The method firstly computes the prior probability distribution and then utilizes Bayesian inference to identify unknown targets based on detected feature combination from multiple detection periods. Perceptual information entropy gain is then calculated as the feedback of the dispatching system while genetic optimization algorithm is utilized to adaptively dispatch multi-sensor on line. Simulation results have shown that, compared with the random method, the identification efficiency can raise up almost 21 seconds via the proposed method, which effectively improves the dynamic perception capability of unknown targets.

identification; information entropy; adaptive; sensor management

10.3969/j.issn.1673-5692.2017.04.005

2017-05-25

2017-07-10

电子信息装备体系研究国防科技重点实验室基础研究项目(DXZT-JC-ZZ-2011-015)

陆泽健(1986—),男,广西人,工程师,主要研究方向为雷达组网,多传感器管理技术;

E-mail:lzj_bupt@163.com

刘 筱(1979—),男,湖南人,高级工程师,主要研究方向为综合电子信息系统总体设计,系统集成与信息处理;

秦永刚,(1983—),男,湖北人,工程师,主要研究方向为综合电子信息系统设计与系统集成;

潘 越(1984—),男,湖南人,高级工程师,主要研究方向为综合电子信息系统总体设计,系统集成与信息处理;

郭继光(1979—),男,黑龙江人,高级工程师,主要研究方向为综合电子信息系统总体设计,系统集成与信息处理;

黄 胜(1986—),男,河南人,工程师,主要研究方向为情报处理,大数据分析与数据挖掘。

TN391,TP273

A

1673-5692(2017)04-353-06

猜你喜欢

自适应识别信息熵
基于信息熵可信度的测试点选择方法研究
近似边界精度信息熵的属性约简
基于信息熵赋权法优化哮喘方醇提工艺
一种基于信息熵的雷达动态自适应选择跟踪方法
自适应的智能搬运路径规划算法
Ka频段卫星通信自适应抗雨衰控制系统设计
电子节气门非线性控制策略
多天线波束成形的MIMO-OFDM跨层自适应资源分配
青岛市中山公园园林树木易混淆品种识别
论犯罪危险人格的识别