基于直觉模糊折扣算子的异类数据融合方法

2021-01-26李双明

系统工程与电子技术 2021年2期

李双明, 关欣, 刘傲

(海军航空大学, 山东烟台 264001)

0 引言

信息的不确定性普遍存在于客观世界,主要体现为模糊性、未知性、不精确性及数据类型复杂等几个方面。模糊集理论和证据理论是处理不确定信息常用的理论工具,并且取得了许多的研究成果[1-3]。

模糊集[4]使用隶属度函数来刻画元素与集合之间的二元模糊关系[5],但对于复杂的信息描述则显得捉襟见肘,为此,1986年,保加利亚学者Atanassov教授提出了直觉模糊集的概念[6],经过40多年的发展,大家对直觉模糊集的信息测度、集成算子[7]、偏好关系等方面进行了深入研究,已经广泛应用在了聚类分析、模式识别、图像融合和属性决策等众多领域[8-11]。而这些应用中,研究最多的是直觉模糊集的距离度量[12-14],而对于直觉模糊数运算的应用较少。

证据理论[15-16]提供了描述未知信息和处理认知不确定信息的理论框架,克服了概率论在描述未知不确定信息的缺陷,把概率中的事件空间拓展了幂集空间,在风险评估、信息融合、故障诊断、态势评估等得到了应用。该理论主要包括信度函数、似然函数及组合规则,前者表示在特定证据下,决策者对假设或命题的支持程度,后者用来进行推理决策。但是证据理论要求满足两个独立条件:辨识框架中的元素必须互相独立,组合规则中的证据源必须相互独立。然而在实际的应用中,研究的对象及获得的证据并不总是相互独立的。在某些情况下,辨识框架中的信息是不完备的,组合规则不能处理不完备的基本信度赋值(basic belief assignment, BBA)。

混合数据类型包括实数、区间数、序列数、灰数、三角模糊数、直觉模糊数、模糊语言术语等,从数据融合的角度,又可以分为特征层数据[17-20]和决策层数据[21]或二者的混合数据[22]。由于传统决策方法在异构数据决策上的适用性受到限制,为此有两种解决思路:一是对传统决策方法进行改进,构建异类数据间的度量方法;二是将异构数据转化到同种数据类型,利用传统方法进行决策。这些方法的缺点是未能充分捕捉数据中蕴含的不确定信息。为此,结合直觉模糊集和证据理论的优点,以文献[23]中提到的信度生成方法为思路,本文对异类数据的融合开展研究。

1 直觉模糊数的折扣算子

1.1 预备知识

记X为有限非空集合,X上的直觉模糊集记为A={x,μA(x),vA(x)|x∈X},其中,μA:X→[0,1],vA:X→[0,1]分别称为x对X的隶属度和非隶属度函数,满足0≤μA(x)+vA(x)≤1。

Xu等[24]称直觉模糊对α=(μα,vα)为直觉模糊数,满足μα∈[0,1],vα∈[0,1],0≤μα+vα≤1。

模糊信息的比较法则是一个十分重要的概念,广泛被采用的是计分函数s(α)和精确函数h(α)，即

s(α)=μα-vα

(1)

h(α)=μα+vα

(2)

基于计分函数和精确函数,直觉模糊数α1和α2之间的比较法则描述如下。

(1) 如果s(α1)

(2) 如果s(α1)>s(α2),则α1>α2。

(3) 如果s(α1)=s(α2),则又可分为3种情况:

如果h(α1)

如果h(α1)>h(α2),则α1>α2；

如果h(α1)=h(α2),则α1=α2。

1.2 直觉模糊数折扣算子及合成法则

定义 1设两个直觉模糊数α=(μα,vα)和β=(μβ,vβ),对任意λ∈[0,1],那么直觉模糊数的折扣算子为

λα=(λμα,λvα+1-λ)

(3)

直觉模糊数的合成法则[25]为

α⊕β=(μα+μβ-μαμβ,vαvβ)

(4)

定义 1满足性质:

性质 1λα仍是一个直觉模糊数;

性质 2α⊕β仍是一个直觉模糊数;

性质 3α⊕β=α⊕β;

性质 4λ(α⊕β)≤λα⊕λβ;

性质 5(λ1⊕λ2)α≤λ1α⊕λ2α。

证明根据定义1,有μα≤1,vα≤1,且0≤μA(x)+vA(x)≤1,那么,λμα≤λ≤1,则λvα+1-λ≤λ+1-λ≤1,有

λμα+λvα+1-λ=
λ(μα+vα)+1-λ≤λ+1-λ=1

所以,性质1成立。

组合法则中的μα+μβ-μαμβ是一个t-模,当0≤μα≤1,0≤μβ≤1时,则0≤μα+μβ-μαμβ≤1成立,而0≤vαvβ≤1显然成立,对于

μα+μβ-μαμβ+νανβ≤
μα+μβ-μαμβ+(1-μα)(1-μβ)=1

成立,因此性质2成立。

性质3显然成立。

因为

λ(α⊕β)=λ(μα+μβ-μαμβ,vαvβ)=
(λμα+λμβ-λμαμβ,λvαvβ+1-λ)

则λ(α⊕β)的计分函数为

s1=λμα+λμβ-λμαμβ-λvαvβ-1+λ

因为

λα⊕λβ=(λμα,λvα+1-λ)⊕(λμβ,λvβ+1-λ)=
(λμα+λμβ-λ2μαμβ,
λ2vαvβ+λ(1-λ)(vα+vβ)+(1-λ)2)

则λ(α⊕β)的计分函数为

s2=λμα+λμβ-λ2μαμβ-λ2vαvβ-
λ(1-λ)(vα+vβ)-(1-λ)2

有

s2-s1=(λ-λ2)
(μαμβ+vαvβ-vα-vβ+1)≥0

因此,性质(4)成立。

同理可证性质(5)成立。

证毕

为表示方便,令Ω为所有直觉模糊数的集合,基于定义1,给出如下定义。

定义 2设有n个直觉模糊数αi(i=1,2,…,n),第i个直觉模糊数的权重为wi,映射IFWA满足:Ωn→Ω,有

IFWA(α1,α2,…,αn)=⊕i=1,2,…,nwiαi

(3)

则称IFWA为直觉模糊数的折扣加权算子。

2 异类数据的距离度量

定义 3实数与区间数的距离

(4)

定义 4区间数之间的距离

(5)

定义 5序列数之间的距离

(6)

定义 6序列数与区间数之间的距离

(7)

3 异类数据的多属性融合方法

3.1 问题描述

以目标识别问题为研究背景,首先对问题进行描述。

3.2 基于灰关联的系数矩阵

(8)

根据灰关联方法[14],计算待识别目标与数据库中目标在各特征属性上的灰关联系数为

(9)

ξl=[ξli(xlj,θij)]m×n

(10)

式(10)为典型的多属性决策问题的描述矩阵,矩阵中的元素都为效益型,即ξl中的元素值越大,选定为该目标的可能性就越大。

3.3 直觉模糊数的生成

第3.2节把目标识别问题转换成了一个多属性决策的问题,那么下面讲述如何把关联系数矩阵转换成直觉模糊数矩阵。

在多属性决策问题上,准则Cj上的评估向量sj=[S1j，S2j，…，Sij,…，SMj]T,其中Sij∈R,存在辨识框架Θ={A1,A2,…,AM},对于Θ中的任意焦元Ai,定义其正证据支持和负证据支持分别为

(11)

(12)

(13)

需要说明的是,称Supj(Ai)为Ai的正证据支持,表征在准则Cj上方案Ai优于其他方案的程度,称Infj(Ai)为Ai的负证据支持,表征在准则Cj上方案Ai劣于其他方案的程度。

构造每个备选方案Ai的直觉模糊数描述方式,其步骤如下:

步骤 1通过式(11)和式(12)计算每个备选方案Ai的证据支持Supj(Ai)和Infj(Ai);

步骤 3定义Ai的信任度,来表示命题“Ai比其竞争方案优”的证据支持,具体表示为

mij(Ai)=Belij(Ai)

将第3.2节中的关联系数矩阵通过本节中的方法,就可以得到以直觉模糊数表述的决策矩阵为

I=[αij]m×n

(14)

式中,αij=(μαij,ναij)。

3.4 属性权重

熵测度[26]是直觉模糊集测度的重要研究内容之一,本节从熵的角度研究属性权重的计算问题。

定义 7[27]设论域X={x1,x2,…,xn},A为X上的一个直觉模糊集,则A的直觉熵为

(15)

根据熵理论,如果某特征属性的熵越小,对决策者而言,就越能提供更多有用的信息,那么该特征属性分配的权重就应该越大,反之就应该越小,可计算各特征属性的权重[28]为

(16)

(17)

满足0≤Hk≤1。

3.5 多属性融合方法步骤

根据前面的内容,得到异类数据的多属性融合方法,具体步骤如下:

步骤 1将传感器获取的多属性异类目标参数分类形成测量矩阵;

步骤 2计算多属性目标属性值与目标数据库异类数据之间的距离;

步骤 3根据灰关联分析,形成多属性目标属性值与数据库的关联系数矩阵ξl;

步骤 4对关联系数矩阵进行信度的生成,得到BBA矩阵M=[mij(·)]m×n;

步骤 5将BBA矩阵转化成直觉模糊数描述矩阵I=[αij]m×n;

步骤 6进行折扣加权算子运算,得到融合后总的目标直觉模糊决策向量为

由于本文重点关注直觉模糊数的组合法则和异类数据的转化,步骤7中采用了简单的判决方法,当然也可以采用其他复杂的判决方法。

4 算例验证

4.1 多属性决策算例

分别以单属性决策算例和多属性决策算例,对本文中直觉模糊数组合法则进行比对验证。

(1) 单属性决策算例[29]

算例 1考虑效益型单属性Cj以及7个备选方案Ai(i=1,2,…,7),并有如下的得分向量Sj=[10,20,-5,0,100,-11,0]T,通过得分向量对7个备选方案进行排序。

按照得分数越大,方案越优的原则进行排序,很显然有如下的排列顺序:

A5>A2>A1>(A4～A7)>A3>A6

如果通过第3.3节中的方法,获得每个方案的证据后,用DS证据理论的组合规则进行排序的话,组合后的信度分配为

根据上述结果,只能判别方案A5是最优的,但无法区分其他方案。

用本文方法得到各方案的计分函数值为s1=0.312 5,s2=0.937 5,s3=-0.625,s4=-0.312 5,s5=1,s6=-1,s7=-0.312 5。

根据上述计分函数值,易得方案的排列顺序为A5>A2>A1>(A4～A7)>A3>A6。

可见,与得分排序的结果一至,证明本文所提的直觉模糊信息组合规则方法是可行的。

(2) 多属性决策算例[30]

算例 2设某一多属性决策问题,有5个备选方案Ai(i=1,2,…,5),每个方案有4个评价指标,且都为效益型属性,权重向量为w=[1/6,1/3,1/3,1/6],得分矩阵为

将本文方法与文献[23]中的BF-TOPSIS1～BF-TOPSIS3方法进行对比验证,以运行时间来衡量算法的复杂度,验证结果如表1所示。

表1 本文方法及BF-TOPSIS1/2/3的计算结果

从表1中的结果可知,在方案集{A1,A2,A3,A4,A5}和{A1,A2,A3,A4}上,本文的方法和BF-TOPSIS1/2/3的排序结果是一致的;在方案集{A1,A2,A3}上,本文的方法和BF-TOPSIS1/2的排序结果是一致的。本文算法复杂度显然要比BF-TOPSIS1～BF-TOPSIS 3方法低1个数量级;当随着方案集的规模增大时,BF-TOPSIS1～BF-TOPSIS3方法的运行时间呈现倍数增长的趋势,而本文方法所用时间较为稳定,说明本文方法为线性运算,而BF-TOPSIS方法为非线性运算,尤其对于BF-TOPSIS3来说,当方案集中的数量很大时,其运算时间会以数量级为单位增加,这是由其PCR6本身的复杂组合规则所决定的。

4.2 雷达辐射源识别算例

以雷达辐射源识别为应用对象,设数据库中存在5类雷达,分别为R1,R2,R3,R4和R5,每类雷达包括射频(radio frequency, RF)频率、脉冲重复周期(pulse repetition interval, PRI)、脉冲宽度(pulse width, PW)、相像系数(resemblance coefficient, CR)等4种特征属性,R1在每种特征属性上分别有2、3、2和2种工作模式,则R1共有24种工作模式,R2,R3,R4和R5分别有4×3×2×2=48,2×3×3×2=36,4×2×2×2=32和2×2×2×3=24种工作模式。每类雷达相应工作模式的取值范围如表2所示。设数据库中的属性值类型依次为区间数、序列数、区间数和实数。

表2 工作模式的数据取值范围

在数据库中的工作模式上叠加随机噪声,随机抽取产生待识别目标的特征属性值。设有3个待识别目标,目标A1的属性值类型依次为序列数、区间数、实数和区间数,目标A2的属性值类型依次为序列数、序列数、实数和区间数,目标A3的属性值类型依次区间数、序列数、区间数和序列数。

(1) 单次识别结果分析

选取待识别目标1/2/3的工作模式序号分别为132、67和160,根据本文方法,直觉模糊数按降序排列对应的工作模式分别为{132,125,131,126,116,…,108,107,105,106,103}, {66,67,65,68,57,59,69,…,14,13,22,18,21,17},{160,159,164,162,161,163,…,5,4,22,21,3,1,2},

按照排序结果,分别判决为R2类、R4类和R5类,各待识别目标直觉模糊数计分值的变化如图1所示。目标2的模式序号排列首个为66,而不是选定的模式67,为此将模式66、模式67和待识别目标的测量值列于表3。分析表3,模式66和模式67只在特征Cr上有细微的区别,其他3个特征上的数值相同,待识别模式在特征Cr上的测量值为区间数,本文的异类数据实质上为不确定数据,那么在这种情况下,是不能区分待识别模式的所属模式,故将模式判断为模式66也是正确的。

图1 待识别目标1～目标3的计分值变化曲线Fig.1 Score changing curve for unknown target 1～3

表3 已知模式和待识别模式的测量值比对

(2) 多次识别结果分析

进行1 000次蒙特卡罗实验,采用本文方法、BF-TOPSIS1方法、BF-TOPSIS2方法及BF-TOPSIS3方法,分别在本文权重计算方法、权重1(w1=[1/4,1/4,1/4,1/4]T)及权重2(w2=[1/2,1/8,1/4,1/8]T)上进行仿真,识别结果如表4所示,表4给出了类识别结果和工作模式识别结果的正确率。

表4 类别/工作模式识别结果的正确率

从表4可知,在工作模式识别上,BF-TOPSIS方法的识别率是非常低的,不能用于工作模式的识别。无论在类识别,还是工作模式识别上,本文方法的识别率都比较高。本文方法对不同权重,其识别率是不同的,在本文权重上其识别率是最高的,而BF-TOPSIS方法对权重的依赖性较小,尤其是BF-TOPSIS3方法,权重值的不同对识别结果影响较小,这是由PCR6本身对冲突规则组合的原理所决定的,然而其识别率是劣于本文方法的。

5 结论

本文从直觉模糊数的角度,对异类数据的多属性融合问题进行了研究,定义了新的直觉模糊数折扣算子,列出了相关的基本性质,并给出了证明过程,为多属性的信息融合提供了理论基础。定义了异类数据的距离测度,为实现异类数据之间的度量提供了理论基础。给出了将灰关联系数转成直觉模糊数的生成原理,并基于直觉模糊熵,提出了一种未知权重的计算方法。结合多属性决策算例和雷达辐射源识别算例,验证了所提方法的有效性。