基于证据异常度的水下多源信息预处理方法
2017-11-03,,,
, ,,
(中国电子科技集团公司第二十研究所 数据链技术重点实验室,西安 710068)
基于证据异常度的水下多源信息预处理方法
麻锐,唐政,赵露露,齐涛涛
(中国电子科技集团公司第二十研究所数据链技术重点实验室,西安710068)
Dempster-Shafer证据理论在水下多源目标识别领域有着广泛而重要的应用, 但经典的证据理论在融合高度冲突的证据时往往会导致一些反常理的结果, 如Zadeh冲突悖论;针对这一问题,综合考虑证据体之间的冲突程度和支持程度,提出一种证据异常度的概念并对原始证据集进行异常检测,基于检测结果对原始证据体进行权重分配,引入全集项,修正证据源;在保持Dempster组合规则不变的前提下,进行有效的证据预处理,实验仿真结果验证了算法的有效性;证明对证据体进行有效的修正,可以改进经典证据理论的缺点,达到更好的融合结果。
证据理论;证据异常度;证据预处理;数据融合
0 引言
水下目标识别系统在水下目标侦察、目标打击、海底考察和资源开发等领域得到了广泛的研究和应用。水下目标识别一般采用多个不同类型的传感器,通过不同传感器之间的信息互补,来达到精确识别目标的目的。然而因为水下环境恶劣和传感器节点在运动过程中姿态的变化,部分节点的传感器采集到的数据往往是不精确,不完整,甚至是受到严重干扰的,因此需要通过数据融合的方法来进行多源目标身份信息融合处理,以实现对水下目标的精确识别。
证据理论源于学者Dempster[1-2]在利用上、下限概率解决多值映射问题方面的探索,其学生Shafer[3]做了进一步的发展,形成了一套基于“证据”和“组合”来处理不确定性推理问题的数学方法。DS证据理论因能满足比概率论更弱的公理体系,针对不确定的、无先验知识的信息提供了有效的融合方法,在水下综合目标识别[4]、多传感器数据融合[5]、声场预测[6]、图像识别[7]等领域取得了广泛而重要的应用,因此,DS证据理论的优势非常适合水下目标综合识别。
随着研究和应用的深入,学者们发现DS证据理论也存在着很多值得研究改进的缺陷和问题。在利用证据理论中的Dempster组合公式进行证据组合,经常会出现一系列违反经验和直觉的结果[8-9],特别是那些待组合的证据高度冲突时。针对上述问题学者们进行了大量的研究,杨艺等[10]提出一种基于多准则排序融合的证据组合方法,崔家玮等[11]提出了一种新的Dempster组合规则的适用条件,汪永伟等[12]提出了一种基于冲突一致度与交并集动态调整的证据理论推理决策方法。目前主流的研究方向聚焦于对DS证据理论组合规则的优化和在组合前对证据体的提前修正。如果对组合规则进行修改,则会破坏Dempster组合规则的优势,将使其不再满足结合律和交换律。并且在现场的数据采集过程中,某一传感器采集的数据很可能受到恶劣环境、节点失效、自身精度等各种因素的影响,其采集的数据很可能严重影响最终多传感器融合的结果,因此在组合前提前对证据体进行修正,将是更加合理的方法。
针对上述问题,本文提出了一种基于证据异常度的加权型证据预处理算法,算法分为3个部分,第一部分提取并量化证据体之间的冲突程度和一致程度,并结合了证据与自身的冲突性与一致性。第二部分,综合证据之间的冲突程度与一致程度,提出了证据异常度的定义,即证据越异常,其可信度越低。第三部分,在证据融合之前,对证据集进行异常检测,基于异常检测的结果,对原始证据体进行权重分配,并给出最终的证据体修正公式。
本文第二部分介绍了经典证据理论的概念和问题,第三部分介绍了基于证据异常度的证据预处理方法,第四部分对算法进行了仿真实验,并给出了比较结果与分析。最后是全文的结论与总结。
1 证据理论及问题
该部分简要介绍证据理论的概念及其存在的问题。
1.1 证据理论基础
在DS证据理论中,所关注的任一命题都对应于辨识框架Θ的一个子集. 设辨识框架Θ={A1,A2,...,AN},N为命题的个数,若以下两式成立:
m(φ)=0
(1)
(2)
则称m:2Θ→[0,1]为Θ上的基本概率赋值(Basic probability assignment, BPA)。2Θ表示Θ的幂集, 即Θ的全体子集构成的集合,φ表示空集。对∀A⊂Θ,函数m(A)为基本置信度。
Dempster组合规则反映了证据的联合作用,设n个证据组合,证据集E={(E1,E2,...,En)} ,各证据体对应的BPA为m1,m2,...,mn,mi分配给Θ中命题Aj(j=1,2,...,N)的BPA为mi(Aj),则组合公式为:
(3)
1.2 证据组合中的反直观结果
目前,经典证据理论存在的最大问题是在处理强冲突的数据时存在的Zadeh悖论,例如在某次水下目标识别中有3个可能的目标(我方成员,敌方成员,中立成员),两个传感器证据源(W1,W2),传感器根据采集到的信号对目标敌我属性的可能性给出了自己的判断,采用Dempster组合规则后结果如表1所示。
表1 组合结果
可以看出,两个传感器系统输出的识别结果认为目标是敌方成员的可能性均非常低,然而融合后其置信度却为1,而分别被两个传感器系统认为很有可能的我方成员和中立成员,融合后置信度却被置0。冲突悖论存在的原因是经典的证据理论在融合强冲突的证据时将大部分的信任分配给了小可能性命题。Zadeh冲突悖论严重影响了DS证据理论算法在工程界的应用,因此需要对经典的DS证据理论算法进行改进。
2 基于证据异常度的预处理方法
正常情况下,证据之间是存在冲突的,在DS证据理论的概念中,当某个证据与证据集中其他证据的冲突项k较大时,说明该证据存在某种程度的异常,对融合结果的影响较大,其可信程度应该较低;在证据组合时应该赋予其较低的权重,反之,该证据对最终合成结果的影响较小,其可信程度应该较高,在证据组合时赋予其较高的权重。本文提出的算法将通过这种思想降低证据间的冲突,再用 Dempster组合规则对修正后的证据进行组合。
设辨识框架Θ={A1,A2,...,AN},N为命题个数,有n个证据进行组合,证据集E={E1,E2,...,En},各证据对应的BPA为m1,m2,...,mn,mi(i=1,2,...,n)分配给Θ中命题Aj(j=1,2,...,N)的BPA组成数据矩阵Bn×N:
(4)
定义1(冲突度) 证据Ei的冲突度定义为:
(5)
由公式(5)可知,CON(Ei)∈[0,1],其值越大,表明证据Ei与证据集的冲突越大,而其值越小,表明该证据与证据集的冲突越小。需要特别指出的是,证据与其自身也是存在冲突度的。
定义2(支持度) 证据Ei的支持度定义为:
(6)
同理,SUP(Ei)∈[0,1],其值越大,表明证据Ei与证据集越一致,反正,则其越不一致。同冲突度类似,证据与其自身也是存在支持度的。
为了综合考虑冲突度与支持度对融合结果的影响,设证据的异常度为R,则证据Ei的异常度Ri可表示为:
(7)
根据上述分析,异常度Ri和权重ωi应该符合如下关系:Ri∈[0,1],wi∈[0,1],wi随着Ri的增大而单调递减,且Ri较小时,证据的可信程度越大,wi应该缓慢减小,当Ri较大时,wi应该迅速减小至零。
根据上述性质,设证据的权重wi为:
wi=(1-Ri)eRi
(8)
证据权重wi的函数图像如图1所示
图1 权重ωi图像
由图1可知,证据权重的性质符合要求。因此,可对证据体使用加权的方式来进行有效的预处理,设证据Ei分配给各命题的原始BPA值为mi(Aj),则修正公式为:
(9)
公式(9)第二式的思想是将高冲突部分的信任分配给全集,从而避免将大部分信任分配给小概率命题。
因此,所提算法应用于水下目标综合识别的流程如下:
1)建立识别框架,根据专家经验和以往历史记录,建立系统识别框架Θ={A1,A2,...,AN},识别框架中的命题即对应于水下目标模式类。
2)构造证据,将水下不同传感器针对识别目标采集的数据分别作为证据体,建立证据体矩阵。
3)根据定义1和定义2计算每个证据的冲突度和支持度,并综合冲突度和支持度,计算每个证据的异常度。
4)根据证据体的异常度,对每个证据分配权重,根据证据体修正公式,修正证据源。
5)根据修正后的证据集,使用Dempster组合规则对多源信息进行融合处理,计算最终识别结果。
3 仿真实验及结果分析
为了验证所提算法的有效性,本文设计了两组数据进行实验,并与经典的DS证据理论算法进行比较。
3.1 实验1
经典的DS证据理论在处理高度冲突的证据信息时常常会引起一些反直观结果。因此,本文在实验1中采用与汪永伟等[12]相同的办法,选取10组数据集进行仿真实验,依次模拟冲突由低到高的过程,来观察所提算法和经典DS证据理论算法对于冲突变化的敏感性和鲁棒性。设识别框架Θ={A1,A2,A3},证据集E={E1,E2},其赋予命题的BPA值分别为m1(Aj),m2(Aj)。具体数据集见表2。
在该实验中,将组1~组10的证据体依次融合,图2为该证据集的冲突变化曲线,最终融合结果如图3~图6所示。
表2 实验1数据集
图2 冲突变化曲线 图3 m(A1)变化曲线
图4 m(A2)变化曲线 图5 m(A3)变化曲线
图6 m(A1,A2,A3)变化曲线
图2显示证据体之间冲突的大小在10组数据中依次增大,在第10组数据时接近于1,达到最大冲突。图3和图5是m(A1)和m(A3)在证据体依次融合时结果的变化曲线,可以看出随着冲突逐渐增大,DS证据理论算法的曲线会突然下降,幅度较大,即DS证据理论算法在强冲突的证据体融合时变化较大。而本文算法在冲突逐渐增大时,其结果曲线幅度变化较为缓慢。从图4中m(A2)结果的变化曲线可以看出,在第9组和第10组数据融合时,其冲突较大,DS证据理论算法发生了Zadeh悖论问题,原本置信度较小的A2命题其融合结果突然增大至1,其结果不符合常理。而本文算法受影响很小,其分配给A2的置信度值符合常识和直觉判断,结合图6来看,当两个证据几乎完全冲突时,当前的信息无法有效融合来识别目标,因此本文算法将冲突信任分配给了全集,表明当前两个完全冲突的证据融合无法得出有效信息,而DS证据理论算法,将两个证据中置信度都很小的A2命题的最终值赋1,完全违反了常识,产生了Zadeh冲突悖论。因此,通过实验1的结果可以看出,本文算法能够更好的处理强冲突证据体之间的融合问题。
3.2 实验2
为了证明所提算法的普遍性,编写Matlab程序随机产生了证据体,使用代码如图7所示。
图7 随机证据体生成代码
随机生成的20个证据体如表3所示。
表3 实验2数据集
在该实验中,使用第1组数据分别与其余19组数据依次融合,图8为该证据集的冲突变化曲线,最终融合结果如图9至12所示。
图8 冲突变化曲线 图9 m(A1)变化曲线
图10 m(A2)变化曲线 图11 m(A3)变化曲线
图12 m(A1,A2,A3)变化曲线
由图8可以看出,该随机数据集的冲突变化并不算剧烈,在此情况下,所提算法能够和DS证据理论算法保持一致的优良效果,且结合图8和图12可以看出,所提算法在冲突较高的点会相应的将一些冲突信任分配给全集,优化融合的效果。
通过两组不同性质的实验可以表明,所提算法在强冲突的数据集上可以有效避免反直观结果,而在冲突一般的数据集上,所提算法保持了经典DS证据理论算法的优势,其具有更好地多源数据融合能力。
3 结论
本文分析了经典的DS证据理论算法及其存在的问题,在综合考虑了证据体之间的冲突程度和一致程度的基础上,提出了证据异常度的概念,并基于此对原始证据体进行加权处理后融合。实验仿真结果表明,在冲突逐渐增大的数据集上,所提算法相对DS证据理论算法变化较为平缓,且在高冲突的数据集上避免了反直观结果,其融合结果更加符合常理,而在随机数据集上,所提算法保持了DS算法一贯的优势,因此,在水下复杂恶劣的环境中,当部分传感器节点失效或被干扰,采集的数据与其余传感器形成强冲突等问题时,所提算法能够有效解决这些问题,更好地应用于水下目标识别任务中。
[1]Dempster A P. Upper and lower probabilities induced by a multivalued mapping[J]. Annals of Mathematical Statistics, 1967, 38(2):325-339.
[2]Dempster A P. A Generalization of Bayesian Inference[J]. Journal of the Royal Statistical Society,2008, 30(30):73-104.
[3]Shafer G. A Mathematical Theory of Evidence[M]. Princeton: Princeton University Press, 1976.
[4]吴 亮, 彭 圆, 闫 祎. 基于Dempster-Shafer证据推理的水中目标多特征融合识别技术[J]. 计算机测量与控制, 2013, 21(9):2503-2505.
[5]邵俊宇, 向 超, 曹玉华, 等. 无人机远程故障测试与诊断技术研究[J]. 计算机测量与控制, 2015, 23(9): 2950-2953.
[6]Chen N, Yu D, Xia B. Evidence theory based analysis for the prediction of exterior acoustic field with epistemic uncertainties[J]. Engineering Analysis with Boundary Elements, 2015, 50: 402-411.
[7]朱 庆, 徐胜华, 韩 李. 基于D-S证据理论的彩色航空影像阴影提取方法[J]. 自动化学报, 2007, 33(6):588-595.
[8]Zadeh L A. Review of Shafer’s a mathematical theory of evidence[J]. AI Magazine, 1984, 5:81-83.
[9]韩德强, 杨 艺, 韩崇昭. DS证据理论研究进展及相关问题探讨[J]. 控制与决策, 2014, 29(1):1-11.
[10]杨 艺, 韩德强, 韩崇昭. 基于多准则排序融合的证据组合方法[J], 自动化学报, 2012, 38(5):823-831.
[11]崔家玮, 李弼程. 一种新的Dempster组合规则适用条件[J]. 计算机科学, 2014, 41(10):286-290.
[12]汪永伟, 赵荣彩, 常德显,等. 一种基于改进证据证据理论的推理决策方法[J]. 计算机科学, 2014, 41(12):24-29.
UnderwaterInformationPreprocessingMethodBasedonEvidenceAnomalyFactor
Ma Rui,Tang Zheng,Zhao Lulu,Qi Taotao
(No.20 Research Institute of CETC, Key Laboratory of Technology on Datalink, Xi′an 710068, China)
Dempster-Shafer evidence theory has been widely used in many strategic fields, such as underwater target recognition. But combination of the DS evidence theory always brings some paradoxical behaviors, e.g., the Zadeh paradox problem. Aim at this problem, overall consideration with the degree of conflict and the degree of support between evidence bodies is required. A definition called anomaly factor was proposed, which can be used to detect the abnormal evidence. The weight was assigned to multi-source evidences based on the detection results. Experiment results prove that the proposed method is effective, and it can get better results than the typical DS method.
evidence theory; anomaly factor of evidence; evidence preprocessing; data fusion
2016-12-14;
2017-01-11。
中国电子科技集团公司技术创新基金(KJ1401121)。
麻 锐(1991-),男,陕西西安人,硕士,助理工程师,主要从事信息融合,数据挖掘方向的研究。
1671-4598(2017)10-0247-04
10.16526/j.cnki.11-4762/tp.2017.10.063
TP391
A