分布式航迹融合系统评价指标体系优化
2020-07-14李月武刘长江胡建旺
李月武,刘长江,胡建旺,吉 兵
( 1.陆军工程大学石家庄校区,河北 石家庄 050000; 2.解放军31697部队,辽宁 大连 116104)
0 引言
数据融合技术越来越多地应用于包括C4ISR系统和各种武器平台在内的军事领域和许多民事领域[1]。但是对融合算法和系统性能的研究成果和应用效果的评估国内外研究都比较欠缺,主要原因是多传感器信息融合的处理过程是多层次多级别的,融合系统所汇集和处理的信息种类繁多,信息源之间关系复杂,使得客观、公正地评估融合系统成为该领域研究的重点和难点[2]。
目前针对分布式航迹融合系统的性能评估,虽然已有一些理论、方法研究及成果,但是针对不同的融合系统提出了不同的指标体系以及不同的评估系统,即使同一级别或层次,也有不同的评估度量指标,尚未形成一套标准的分布式航迹融合系统性能评价指标体系[3]。并且在目标跟踪与数据融合时可能出现虚警、丢点等情况,使得融合数据与真值数据无法一一对应[4],常用的精度指标位置均方根误差(position root mean square error, PRMSE)、速度误差、航向误差[5]等无法正确评价融合精度,需要提出新的精度指标对系统进行评估。
针对目前分布式航迹融合系统尚未形成一套标准的性能评价指标体系,以及常用精度指标存在的问题,对分布式航迹融合系统评价指标体系进行优化。
1 粗糙集理论
粗糙集理论是一种处理不精确、不确定和模糊知识的软计算工具[6-7]。本文采用粗糙集理论对初步构建的指标体系其进行约简优化,剔除冗余指标,并确定指标权重。下面简单介绍一下粗糙集理论、基于粗糙集等价关系的指标筛选模型以及属性重要性计算。
1.1 粗糙集属性约简理论
知识约简(knowledge reduction)是粗糙集理论的核心问题之一。所谓知识约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的信息,包括属性约简和对象约简(或规则约简),以使知识表示简化,下面介绍一下属性约简的基本概念。
1) 近似域
定义1 粗糙集就是论域U上的一个等价关系R,∀A⊆U,A的上、下近似集分别为:
(1)
(2)
2) 知识表达系统
定义2 知识表达系统,可以被看为一个关系数据表,它的形式化定义为:S=〈U,C,D,V,f〉,其中U为论域,C为条件属性,D为决策属性,C∪D=R是属性集合(等价关系集合),V=∪a∈AVa是全体属性集的集合,Va表示了属性a∈A的值域,f:U×A→V是一个映射,它指定U中的每个对象x的属性值,则这种数据表为称为知识表达系统。
3) 不可分辨关系
定义3 设S=〈U,A〉为一信息表,B⊆A,定义B在U上的不可分辨关系(等价关系)IND(B)为:
(3)
4) 知识约简
定义4 知识约简:对于给定的信息系统S和S中的一个等价关系族P⊆S,∀R∈P,若IND(P)=IND(P-{R})成立,则称R为P中不必要的,否则就是必要的。
1.2 基于粗糙集等价关系的指标筛选模型
根据指标体系的每一个指标,可以对评价对象进行一种划分,将评价对象划分为多个等价类,或根据多个指标所构成的指标集,得到一个等价关系。如式(3)所示,IND(R)即代表对应着指标集R的等价关系,对于
即等价关系IND(R)为所有其子集的等价关系的交集。
假定R是一个等价关系族,r∈R,若IND(R)=IND(R-{r}),则称r在指标集R中可被约去,为冗余指标,否则r为指标集R中绝对必要的,不可约去。若对于∀r∈R都是不可约去的,则称R是独立的等价关系族。若P=R-{r}是独立的,则P是R的一个约简,记为RED(R)。
基于粗糙集等价关系的指标筛选模型如下所示:
步骤1 记指标体系为C={ai},i=1,2,…,m,求IND(C);
步骤2 对i=1,2,…,m,依次求IND(C-{ai});
步骤3 若IND(C-{ai})=IND(C),则ai为指标体系C中可以约简的冗余指标;否则ai为不可约去的必要指标;
步骤4 得到筛选后的指标体系为RED(C)={ak|ak∈C,IND(C-{ak})≠INC(C)}。
1.3 属性重要性计算
粗糙集中属性重要性是指去掉某个指标后对系统分类情况的影响大小,反映了各个指标对整个指标体系的重要性,因此根据属性重要性可以得到指标权重。若去掉该属性相应的分类变化比较大,则说明该属性的重要性高,即指标权重大;反之,说明属性的重要性低,即指标权重小[7]。
假定一个信息系统为S=(U,A,V,f),P⊆A,U/IND(P)={x1,x2,…,xn},知识P的信息量为:
(4)
式(4)中,|Xi|为Xi元素个数。指标体系中不同指标所反映的信息量的大小不同,则指标r∈R在指标体系R中的重要性为:
SigR-{r}(r)=I(R)-I(R-{r})
(5)
由式(5)可以看出,由R删除r之后所引起的信息量变化的大小来表示指标r在指标体系R中的重要性。由此可得,若R={r1,r2,…,rn},则指标r∈R的权重为:
(6)
通过粗糙集属性重要性得出的指标权重是以实验数据为依据,对数据本身进行挖掘,从而找出事物间的内在规律,与层次分析法或专家凭经验得出的权重相比,粗糙集属性重要性得出的权重更具有客观性,提高了评价结果的真实性。
2 指标体系构建
融合系统评估整体状况的客观反映构成了指标体系,在进行融合系统性能评估时,依据不同的评估对象和评估目的,建立评价指标体系,体系是否科学合理,决定了评估工作成功与否[8]。
目前构建的指标体系基本是基于专家咨询或历史经验等方法,从不同研究角度建立相应的指标体系,并没有理论方法去指导设计指标体系,但大都依据全面性、客观性、独立性、层次性等原则。构建指标体系的步骤如图1所示。
本文通过分析评估对象,发现常用评价指标存在的问题,对指标进行优化,提出新的指标,并根据已有文献中指标体系整理总结初步构建指标体系,然后基于粗糙集属性约简理论对指标体系进行筛选优化,最终构建一套较为完整、合理的分布式航迹融合指标体系。
图1 构建指标体系流程Fig.1 Build an indicator system process
2.1 精度指标优化
2.1.1问题描述
常用的航迹融合精度指标基本包括位置误差、速度误差、航向误差等,计算方法基本是通过融合估计状态与真值状态进行比较,求得均方根误差。当目标状态一一对应时,PRMSE指标可以精确地反映融合系统的位置精度误差,但是在目标跟踪和数据融合时,由于环境变化、噪声干扰等问题容易出现虚警、漏警、丢点和野值的情况,并且由于跟踪中断和雷达重新编批的情况,此时融合估计状态与真值状态很难一一对应,无法使用传统的计算方法计算精度问题,常用的精度指标便不能正常评价融合系统的性能,需要对精度指标进行改进,使得新精度指标可以在任何情况下正确评价融合系统的精度问题。
当目标跟踪估计位置和真实位置不能一一对应时,将融合估计结果和真实目标状态看成两个集合进行测量,通过测量两个集合之间的差异来反映融合结果与真值之间的精度误差,不仅考虑距离误差,还考虑集合之间的势误差。测量集合距离的Hausdorff距离和Wasserstein距离[9]虽然可以度量两个集合之间的差异,但是前者对集合势误差不敏感,后者对集合势误差过于敏感。文献[10]提出的最优子模型分配距离(optimal subpattern assignment, OSPA)有效地弥补了两者缺点,但是经过实践研究发现OSPA距离也存在一定的局限性:若一个集合为空集时,另一个集合为非空集时,OSPA计算距离无法区分不同非空集合之间的不同;若两个集合距离误差为0,但集合势不同,当max(m,n)→时,OSPA距离为0,不能正确评价结果;对于虚警和漏警OSPA距离惩罚是不一样的。
针对OSPA距离存在的局限性,文献[11—12]提出了最佳基数线性分配(cardinalized optimal linear assignment,COLA)度量标准,有效解决了OSPA度量标准的局限性,并证明了其有效性。但将COLA度量标准作为精度指标还面临一个问题,由于截止距离的存在,COLA指标中的距离误差总小于或等于1,无法正常评价距离误差,本文对其做一定的改进,将改进后的度量标准作为精度指标评价,可以有效评价融合系统的精度问题。
2.1.2精度指标改进
假设真实状态估计和融合状态估计两个集合分别为X={x1,x2,…,xm}和Y={y1,y2,…,yn},则这两个集合之间的COLA距离定义为[11-12]:
若n≥m,则:
(7)
若n≤m,则:
(8)
COLA度量标准有效弥补了OSPA距离作为评价指标的不足之处:
1) 若一个集合为空集时,另一个集合为非空集,元素个数为n时,COLA计算距离为n1/p,可以有效测量不同非空集合的势误差;
2) 若两个集合距离误差为0,但集合势不同,当
max(m,n)→时,COLA计算距离为(n-m),可以有效评价两个集合之间的误差;
相比OSPA度量标准,COLA距离可以更加合理、准确地计算两个集合之间的差异,但是根据式(7)可以得:
(9)
由式(9)可以看出,其中距离误差始终小于或等于1,无法正常评价距离误差,因此本文将COLA距离改成如式(10)所示:
(10)
将改进后的COLA指标作为精度指标,若要评价位置误差,X,Y分别为两个状态的位置向量;若要评价速度误差,X,Y便为速度向量。融合COLA精度指标不仅考虑状态之间的距离误差,还考虑之间的势误差,可以更加合理有效地评价系统的精度问题。
2.2 初步指标体系
本文首先通过分析评估对象,发现已有指标体系中精度指标存在的问题,提出了新的精度指标,即融合COLA精度指标,然后根据已有文献[5,8,13-17]所提出的指标体系进行经验总结,并根据分布式航迹融合系统的特点和指标构建原则,初步构建指标体系如图2所示。
图2 初步构建指标体系Fig.2 Preliminary construction of the index system
初建的指标体系由两级指标构成,5个一级指标,22个二级指标,分别从系统处理能力、融合COLA精度、目标识别能力、航迹质量以及航迹相关度五个方面对系统进行性能评估,每个指标的具体定义以及计算方法现有文献已经给出,这里便不再详细介绍,重点研究指标体系约简。
2.3 指标体系确立
由于指标体系中指标数量过多,使得评估计算过于繁琐,因此本节通过对分布式航迹融合系统进行仿真实验,获得实验数据,根据粗糙集约简理论对初步构建的评价指标体系进行约简,剔除冗余指标,完成指标体系的构建。
2.3.1实验条件
根据粗糙集属性约简理论,通过设计相同的剧情对7种不同分布式航迹融合系统进行Monte Carlo实验,获得实验数据,使用基于粗糙集等价关系的指标筛选模型,对初步构建的指标体系进行筛选优化。实验数据如表1所示。
2.3.2实验结果
现以一级指标航迹质量为例进行指标约简。此评估指标体系中,各属性均为条件属性,不包含决策属性,因此是一个非决策系统,指标体系中各个指标属性值都是连续性属性,因此需要对指标数值进行离散化处理,以各属性的中间值为阈值对指标进行离散化,然后根据基于粗糙集等价关系的指标筛选模型进行指标约简,步骤如下:
1) 记指标体系C4={C41,C42,C43,C44,C45},论域U={U1,U2,U3,U4,U5,U6,U7},求得IND(C4)={{U1,U6},U2,U3,U4,U5,U7};
2) 依次求得:
IND(C4-C41)={{U1,U6},{U2,U4},U3,U5,U7},
IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
IND(C4-C43)={{U1,U6},U2,U3,{U4,U5},U7},
IND(C4-C44)={{U1,U3,U6},U2,{U4,U7},U5},IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7};
3) 由步骤2)求得的结果可知,IND(C4-C42)=IND(C4-C45)=IND(C4),则C42和C45为指标体系C中可以约简的冗余指标;
同理使用此模型对其他一级指标进行约简,可得其他一级指标的约简结果为:
则约简后的指标体系由5个一级指标和15个二级指标构成,指标体系如图3所示。
图3 融合系统性能评估指标体系Fig.3 Fusion system performance evaluation index system
2.4 权重计算
由于粗糙集属性重要性得出的权重更具有客观性,因此使用指标属性重要性对指标权重进行赋值,实现系统的综合评估。
以约简前的一级指标为例,对其二级指标进行权重计算。假定信息系统为S=(U,C4,V,f),步骤如下:
1) 首先计算指标的不可分辨关系,则
U/IND(C4)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C41)={{U1,U6},{U2,U4},{U3,U5},U7},
U/IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C43)={{U1,U6},{U2,U3},{U4,U5},U7},
U/IND(C4-C44)={{U1,U3,U6},{U4,U7},U2,U5},
U/IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7}。
2) 由式(4)计算指标体系中各个指标的信息量,I(C4)=40/49,I(C4-C41)=36/49,I(C4-C42)=40/49,I(C4-C43)=36/49,I(C4-C44)=34/49,I(C4-C45)=40/49;
3) 由式(5)计算各二级指标在一级指标航迹质量中的重要性,则sigC4-C41(C41)=4/49,sigC4-C42(C42)=0,sigC4-C43(C43)=4/49,sigC4-C44(C44)=6/49,sigC4-C45(C45)=0;
4) 由式(6)计算航迹质量指标中各二级指标的权重,为:w41=0.285 7,w42=0,w43=0.285 7,w44=0.428 6,w45=0 。
则约简前的航迹质量指标中二级指标的权重分别为w4=[0.285 7,0,0.285 7,0.428 6,0],同理,根据粗糙集属性重要性得其他一级指标中二级指标的权重分别为w1=[0.263 1,0.315 8,0,0.421 1],w2=[0.2,0.2,0.4,0.2],w3=[0.25,0.25,0.25,0.25],w5=[0.5,0.5,0,0,0]。
3 仿真实验
本实验通过设计剧情,使用本文构建的指标体系对甲乙两个分布式航迹融合系统进行Monte Carlo测试求得指标均值,并采用本文根据属性重要性计算的权重对两个系统进行综合评估,验证指标体系的有效性,其中甲融合系统最多处理100批目标,乙融合系统最多处理60批目标。
3.1 实验条件
假设有10批目标匀速直线运动,目标均以vx=100 m/s,vy=0 m/s的速度平行匀速直线运动,初值状态横坐标均为1 000 m,纵坐标分别为[1 000,2 000,3 000,4 000,5 000,6 000,7 000,8 000,9 000,1 000] m,目标轨迹如图4所示。
经对甲乙两个系统进行Monte Carlo测试后,得到的实验数据如表2所示。
图4 目标轨迹Fig.4 The target tracks
表2 实验数据2
3.2 评估计算
本节根据上小节由属性重要性得出较为客观的指标权重系统进行综合评价。
1) 计算各融合系统的指标归一化得分。根据指标越小越优型与越大越优型计算方法计算各指标得分S,计算方法参考文献[18],结果为:
S1=[1,0.2,0.76,0.51,0.37,0.14,0.5,0.31,0.24,0.49,0.58,0.1,0.24,0.1,0.38,0.45];
S2=[0,0.3,0.7,0.78,0.53,0.5,0.4,0.57,0.58,0.45,0.54,0.55,0.46,0.45,0.41,0.46]。
2) 计算指标权重。为简便起见视一级指标同等重要,即w=[0.2,0.2,0.2,0.2,0.2],则每个二级指标对分布式航迹融合系统的权重为[0.052 6,0.063 2,0.084 2,0.04,0.04,0.08,0.04,0.05,0.05,0.05,0.05,0.057 1,0.057 1,0.085 7,0.1,0.1]。
3) 综合评估。根据步骤1)和步骤2)计算的指标归一化得分和指标权重,综合评估得分E分别为:E1=0.387 6,E2=0.476 5,则根据评估值得出优劣次序为甲小于乙,则乙分布式航迹融合系统得分最高,综合性能最好。
通过仿真实验与评估计算表明,约简的评价指标体系可以客观、全面、有效地对分布式航迹融合系统进行评价,具有较强的适用性。
4 结论
本文对分布式航迹融合系统指标体系进行优化,使用最佳基数线性分配度量标准代替原有的精度指标,对精度指标进行优化,提出了融合COLA精度指标,并通过分析评估对象,依据构建原则初步构建评价指标体系,然后通过仿真实验获得的实验数据和粗糙集属性约简的性质对指标体系进行筛选,最终构建了一套较为完整、客观公正的评价指标体系。仿真实验结果表明,优化后的指标体系可以有效以及更加适用地评价分布式航迹融合系统性能。