一种改进的D-S 冲突证据合成方法*
2019-11-19徐孙庆耿俊豹魏曙寰韦可佳
徐孙庆,耿俊豹,魏曙寰,韦可佳
(1.解放军92493 部队60 分队,辽宁 葫芦岛 125000;2.海军工程大学动力工程学院,武汉 430033)
0 引言
Dempster[1-2]于1967 年提出的D-S 证据组合理论是比较有力的理论工具,它处理不确定信息融合的能力很强,可以处理由不知道所引起的不确定性。目前已经被广泛应用于图像处理、故障诊断、风险评估、技术状态评估、模式分类等领域。
D-S 证据理论的核心是证据合成规则[3]。但是在某些领域,特别是证据冲突时,合成过程的正则化处理会产生与直觉相反的结果,合成规则失效[4]。自从Zadeh[5]发表文章指出冲突悖论问题后,证据冲突一直是研究热点。目前,主要从两个方面对D-S 证据理论进行改进。一方面是对组合规则进行修改,这方面解决的主要是如何分配冲突的问题,包括以什么比例将冲突分配给哪些子集的问题[6]。文献[7]提出利用统一信度函数模型将全局冲突进行再分配。文献[8]则是提出基于局部冲突及冲突焦元间分配的方法。这些改进方法都是基于识别框架是封闭、完整的情况;倘若识别框架不完整时,便无法有效地处理证据冲突[9]。文献[10]认为得到一个有穷而且完备的识别框架在实际中不可能,因此,提出了开放识别框架的概念,利用可传递置信模型,将冲突分配给空集。另一方面是对证据源进行修改。这种改进方法的思路也主要有加权平均和证据折扣两种方法[11]。文献[12]提出将证据进行简单的平均修改模型就是属于比较经典的加权平均法,但是这种方法没有考虑到证据间的相关性。为了对证据相关性进行衡量,文献[13]提出了证据间距离函数的概念。文献[14]进一步阐述了证据的不确定性,将其在合成过程中加以考虑来确定权重,但没有对Dempster 规则进行进一步修正。
冲突证据的融合是一个亟待解决的问题,但是迄今为止还没有一个能够被学术界广泛接受的改进方法,现有的改进方法都或多或少地存在一些不足。针对目前改进方案的不足,为了使其具有更快的收敛性和精确性,本文利用Pignistic 概率距离衡量证据间的冲突程度;其次,为了更加高效地利用证据的全局信息,引进证据间相似度、支持度、确定度、决策度以及可信度来共同确定证据的权重,合理地分配冲突在各命题的比例;再次,对存在冲突的证据进行修正处理。最后,再利用统一信度函数模型对证据进行合成。
1 D-S 证据理论及不足
1.1 D-S 证据合成方法
设E1,E2是给定识别框架Θ 上的两个证据,m1,m2分别表示E1,E2的基本可信度分配,焦元分别为A1,…,Ai和B1,…,Bj,设
则,其合成规则为:
1.2 合成证据冲突问题
当证据存在冲突时,利用D-S 合成规则将无法很好地对证据进行融合,甚至会推导出与实际相矛盾的结果。
例1 假设识别框架Θ={A,B,C},给定的两个证据为:
根据合成规则,组合过程如表1 所示。
表1 D-S 组合规则运算表格
计算可得K=0.09+0.81+0.09=0.99,证据m1,m2高度冲突,分别支持A 和B,但合成结果为m(A)=(0)/(1-K)=0;m(B)=(0)/(1-K)=0;m(C)=(0.001)/(1-K)=1。融合后支持C,与常理不相符合,证据融合失效。
例2 假设识别框架Θ={A,B},给定的两个证据为:
根据组合规则得K=1*1+0*0=1,证据完全冲突,无法利用经典组合规则进行证据融合。
2 典型的改进方法
目前对D-S 证据理论的改进主要有两个思路,一个是从证据源模型进行改进,其代表方法是Yager 法。另一个是从合成规则进行改进,其代表方法是Murphy 法。
2.1 Yager 法
Yager 认为证据融合失效是由于组合规则的不足引起的,因此,假设识别框架是封闭的,将冲突部分全部分配给未知,其组合公式如下:
2.2 Murphy 法
Murphy 提出改进原始证据的方法以弥补D-S证据组合规则的不足。首先求出所有证据的基本概率分配值的算术平均,然后利用经典的D-S 组合规则进行n-1 次融合。该方法的计算过程如下:
3 一种新的证据合成方法
3.1 Pignistic 概率距离
目前用来表征证据冲突大小的主要有Pignistic概率距离、冲突率、Jousselme 距离、相关系数、相容系数等。根据文献[15]研究,Pignistic 概率距离在表征冲突方面更加优势,因此,本文选用Pignistic 概率距离表示证据冲突。
设m1,m2是同一识别框架Θ 下的两个基本可信函数,用BetPm1,BetPm2分别表示它们的Pignistic概率函数。则它们的Pignistic 概率距离如下:
为了简化计算过程,采用文献[16]公式进行计算:
相似度是与距离相反的概念,根据文献[13]定义,m1,m2的相似度表示为:
3.2 证据权重的确定
1)支持度
第i 个证据的支持度SD(i)定义为:
2)确定度
第i 个证据的确定度CD(i)定义为:
3)决策度
第i 个证据的决策度DD(i)定义为:
4)可信度
第i 个证据的可信度CRD(i)定义为:
记第i 个证据的权重为w(i),则第i 个证据的权重可以通过对可信度CRD(i)的正则化处理得到,为:
3.3 冲突证据的修正
通常情况下,当证据可靠时,各证据的权重相差不大,因此,可以利用上节得到的证据权重判断冲突证据。假设有l 条证据,则这些证据的平均权重为w=1/l。若证据的权重w≥1/l,则认为该证据可靠;若证据的权重w<1/l,则认为该证据不可靠,判定为冲突证据。利用折扣系数对冲突证据进行修正。
记第i 个证据的折扣系数为β(i),β(i)值如式(14):
利用折扣系数,对冲突证据做如下修正:
3.4 证据合成新公式
根据文献[7]提出的统一信度函数组合模型,有:
4 算例分析
为了验证本文所提的改进方法的有效性及优越性,采用算例与传统D-S 方法、Yager 方法、Murphy 方法进行对比计算。
例3 设识别框架为Θ={A,B,C},给定的5 条证据如下页表2 所示。根据上节所述求解过程,确定权重所需的各参数值如表3 所示。
不难看出,第3 条证据高度支持B,和其他证据相冲突。根据表3 计算得,第3 证据的权重w(3)=0.15 小于平均权重=1/l=0.2,属于冲突证据,需进行修正,与实际情况相符合。修正系数为β(3)=w(3)/=0.75,修正后的证据3 为:
?
表2 识别框架下的5 条证据
根据所提出的证据合成方法进行证据融合对比计算,融合结果如表4 所示。
表3 各参数值
表4 4 种方法的融合结果对比
从表4 可以看出,当合成过程包含冲突证据3时,经典D-S 方法无法有效融合证据。即使大部分证据支持A,但是由于冲突证据3 的存在,导致融合结果显示为支持B,与实际情况不相符合。同样地,Yager 法在融合冲突证据3 时也是支持B,直接判定m(A)=0,不能很好地处理冲突证据。随着后续证据的加入,m(A)值有所增大,但仍不能够很好判断出正确命题,而是将概率值分配给未知,增加了不确定性,未能判定出正确命题,融合结果过于保守。Murphy 法在处理证据3 时也出现了错误,以较大的概率值支持B,虽然后续能够较好地处理证据冲突,能够正确地判断命题,但概率值较低,一直到第5 个证据的加入才能较为明确地判定出正确命题。而本文的方法能够迅速得到正确的结果,即使在出现冲突证据3 时,仍能够以较大的概率值判定出正确命题。本文方法在有效地利用证据的支持度、可信度、决策度的基础上,能够更好地利用证据的全局信息,能够以更大把握选出正确命题。
为了更加直观地感受各组合方法的融合效果,各方法m(A)的融合结果如图1 所示。
图1 m(A)融合结果
从图中能够直观地看出,经典D-S 法失效,不能正确融合证据;Yager 法、Murphy 在融合证据3 时也均出现了错误;本文方法在合成证据3 时仍能够正确判断出正确命题,鲁棒性好,且在合成所有证据后以最高的概率值判断出正确命题。
5 结论
为了更好地解决D-S 冲突证据的融合问题,本文提出了一种改进的D-S 冲突证据组合方法。首先引进Pignistic 概率函数判定证据的冲突程度,并得到证据间的相似度;其次,引进证据间的支持度、确定度、决策度和可信度4 个参量来共同决定各证据的权重,以便能够更好地利用证据的全局信息。最后,通过算例与经典D-S 组合法、Yager 法和Murphy法进行对比分析,证明本文方法的有效性和可行性。
本文的方法对于多焦元命题的合成效果较好,对于单子集命题的合成结果较为保守,且默认识别框架是完整的,这些问题有待进一步研究。