多粒度概率粗糙集及其在目标识别中的应用*
2016-03-02李续武路艳丽侯学礼
张 鑫,李续武,路艳丽,侯学礼
(1 空军工程大学防空反导学院,西安 710051;2 西北工业集团有限公司,西安 710051)
多粒度概率粗糙集及其在目标识别中的应用*
张 鑫1,李续武1,路艳丽1,侯学礼2
(1 空军工程大学防空反导学院,西安 710051;2 西北工业集团有限公司,西安 710051)
针对传统多粒度粗糙集模型在反映问题的不完全性与统计特性方面的局限性,提出了多粒度概率粗糙集模型。首先,将概率粗糙集模型的思想与粒计算中多粒度空间描述问题的思想相结合,给出具有一般性的多粒度概率粗糙集模型的定义。同时,以正域及负域不变的原则定义了乐观多粒度概率粗糙集模型的属性约简。然后,基于Bayes最小风险理论对多粒度概率粗糙集模型中的参数进行确定。最后,将乐观多粒度概率粗糙集模型应用于弹道导弹目标识别问题中。
多粒度粗糙集;概率粗糙集;多粒度概率粗糙集;Bayes决策;目标识别
0 引言
粒计算[1]是当前计算智能领域中模拟人类的多粒度、分层次思维解决复杂问题的新方法。Pawlak经典粗糙集[2]模型以及该模型的许多拓展,都是建立在划分或者粒化的基础上,因此,粗糙集是粒计算的一个特例。从Pawlak粗糙集理论诞生至今,根据不同的需求已经发展了许多的粗糙集模型,例如变精度粗糙集[3]、模糊粗糙集[4]、直觉模糊粗糙集[5]。从粒计算观点[6-7]来看,Pawlak粗糙集在单个粒空间的基础上,用一对上下近似来刻画目标概念。为了模拟人类从多个粒空间描述问题的模式,我国学者提出了多粒度粗糙集模型[8-10]。
Pawlak经典粗糙集模型解决不确定性问题时基于信息的完全性,因此忽略了信息系统的不完全性和统计特性,对于不协调决策信息系统规则的提取具有很大的局限性。针对这一问题,学者们提出了概率型粗糙集模型[11]。然而,经典的概率型粗糙集模型仍建立于单粒度空间之上,因此文中从多粒度空间角度出发,并考虑到各粒度空间描述问题不完全相同的实际,对经典概率型粗糙集模型进行拓展,建立多粒度概率粗糙集模型。
1 预备知识
1.1 多粒度粗糙集模型
多粒度是粒计算理论中的核心概念,钱宇华、梁吉业基于多粒度的思想,将经典粗糙集中采用一个等价关系拓展为采用一族等价关系,进而从采用单个粒空间描述问题的方式拓展为采用多个粒空间描述问题的方式。一般来说,多粒度粗糙集模型存在两种形式,一种称为乐观多粒度粗糙集模型,另一种称为悲观多粒度粗糙集模型[9]。
定义1[8-9]在信息系统IS中,C1,C2,…,Cm是AT的m个条件属性集,对于∀X⊆U,定义X关于条件属性集C1,C2,…,Cm的乐观多粒度下近似和上近似分别为:
定义2[8-9]在信息系统IS中,C1,C2,…,Cm是AT的m个条件属性集,对于∀X⊆U,定义X关于条件属性集C1,C2,…,Cm的悲观多粒度下近似和上近似分别为:
由定义1和定义2可以看出,乐观多粒度下近似要求至少存在一个粒空间包含于目标概念,在决策过程中指的是:每个决策者根据自己的粒空间进行决策,而不反对其他决策者所给出的粒空间的决策;悲观多粒度下近似则要求所有粒空间都包含于目标概念,在决策过程中指的是:所有的决策者使用共同满意的方案进行决策。
1.2 概率粗糙集模型
经典粗糙集模型在处理不确定性问题时存在明显的局限性,对于不协调决策表的规则提取有很大的不足。针对这一问题,概率型粗糙集模型被提出。概率型粗糙集模型有4种基本模型,除概率(I)型[11]外还存在其他3种模型,文中仅从概率(I)型出发进行研究。
设U是有限对象构成的论域,AT=C∪D是非空有限的属性集合,等价关系R⊂C的等价类为[x]R,令P为定义在U的子集类构成的σ代数上的概率测度,则称三元组AP=(U,AT,P)为概率近似空间。U中的每个子集代表了一个随机事件。P(X|Y)表示事件Y发生下X出现的条件概率,也可理解为随机选择的对象在概念Y的描述下属于X的概率。
定义3[11]设0≤β<α≤1,对于任意X⊆U,定义X关于概率近似空间AP=(U,AT,P)依参数α,β的概率(I)型下近似和上近似分别为:
(3)
(4)
2 多粒度决策粗糙集
2.1 多粒度概率粗糙集模型
针对多粒度粗糙集模型对概念的不完全性以及统计特性描述时存在的局限性,结合概率粗糙集的特点,提出多粒度概率粗糙集模型。
定义4 令概率近似空间为AP=(U,AT,P),设向量α,β分别为α=(α1,α2,…,αm)T,β=(β1,β2,…,βm)T且满足0≤βi<αi≤1(i=1,2,…,m),C1,C2,…,Cm是AT的m个条件属性集,对于∀X⊆U,定义X关于条件属性集C1,C2,…,Cm的乐观多粒度概率(I)型下近似和上近似分别为:
∨P(X|[x]C2)≥α2∨…∨P(X|[x]Cm)≥αm}
(5)
∧P(X|[x]C2)>β2∧…∧P(X|[x]Cm)>βm}
(6)
(7)
(8)
(9)
定义5 令概率近似空间为AP=(U,AT,P),设向量α,β分别为α=(α1,α2,…,αm)T,β=(β1,β2,…,βm)T且满足0≤βi<αi≤1(i=1,2,…,m),C1,C2,…,Cm是AT的m个条件属性集,A⊆AT并且B1,B2,…,Bp是A的p(p (10) (11) (12) (13) 则称A为AT的乐观属性约简。 定义6 令概率近似空间为AP=(U,AT,P),设向量α,β分别为α=(α1,α2,…,αm)T,β=(β1,β2,…,βm)T且满足0≤βi<αi≤1(i=1,2,…,m),C1,C2,…,Cm是AT的m个条件属性集,对于∀X⊆U,定义X关于条件属性集C1,C2,…,Cm的悲观多粒度概率(I)型下近似和上近似分别为: ∧P(X|[x]C2)≥α2∧…∧P(X|[x]Cm)≥αm} (14) ∨P(X|[x]C2)>β2∨…∨P(X|[x]Cm)>βm} (15) (16) (17) (18) 2.2 多粒度决策粗糙集模型中阈值的确定 Bayes决策是通过Bayes先验概率分析思想构造的决策方法,其核心是利用事件发生的先验概率获得使风险最小的决策。以下基于Bayes最小风险决策的准则对多粒度概率粗糙集模型中的参数进行确定。 因此,在条件属性Ci下采取决策行为γP,γN,γB的期望损失分别为: (19) (20) (21) 根据贝叶斯最小风险决策准则,选择风险最小的行为,对于乐观多粒度概率粗糙集模型与悲观多粒度概率粗糙集模型可得如表1所示决策规则。 显然存在: P(X|[x]Ci)+P(~X|[x]Ci)=1 (22) 并且考虑到现实中接受正确事物的损失不大于延迟接受正确事物的损失且均小于拒绝正确事物的损失;同理,拒绝错误事物的损失不大于延迟拒绝错误事物的损失且均小于拒绝正确事物的损失。 因此, 表1 初始决策规则表 (23) 为获得更为简洁的表达方式,结合式(22)、式(23)将表1中决策规则P、N、B进行化简,化简后结果如表2所示。 表2 化简后决策规则 令αi、βi、ηi分别为: (24) (25) (26) 由于0≤βi<αi≤1(i=1,2,…,m),则: (27) (28) 因而0≤βi<ηi<αi≤1(i=1,2,…,m)成立。从而结合式(24)~式(26)对表2中决策规则P、N、B改写,结果如表3所示。 从表3可以看出,对于乐观多粒度决策粗糙集只要存在条件属性Ci下粒度空间使得P(X|[x]Ci)≥ 表3 改写后决策规则表 假设我方在弹道导弹中段探测到10批目标的目标群构成论域U,如表4所示。C1表示与球体相似参数,C2表示与二面角相似参数,C3表示与圆柱体相似参数,C4表示与水平偶极子相似参数,C5表示与左螺旋体相似参数,C6表示与右螺旋体相似参数。d=1表示弹头,d=2表示诱饵。 表4 目标决策信息表 为便于该粗糙集模型对决策信息表进行处理,需要对该表进行离散化处理。文中采用等间隔法对连续数据离散化。对于属性C1,记[0.117 2,0.136 4)中的数据为1,记[0.136 4,0.155 6)中的数据为2,记[0.155 6,0.174 8]中的数据为3,对其余属性做类似处理。离散化结果如表5所示。 表5 离散化的目标决策信息表 由于论域U在各属性子集下划分为: U/{C1}={{x1,x2,x3,x6,x9},{x4,x7},{x5,x8,x10}} (29) U/{C2}={{x1,x3},{x2,x4,x8},{x5,x6,x7,x9,x10}} (30) U/{C3}={{x1,x2,x6,x8,x10},{x3,x5,x9},{x4,x7}} (31) U/{C4}={{x1,x2,x3,x6,x8},{x4,x5,x7},{x9,x7}} (32) U/{C5}={{x1,x2,x3,x10},{x4,x6,x8,x9},{x5,x7}} (33) U/{C6}={{x1,x2,x3,x8},{x4,x5,x7,x10},{x6,x9}} (34) 因此乐观多粒度决策粗糙集模型正域、负域与边界域分别为: (35) (36) (37) 设ri为决策规则,则产生弹道导弹目标决策规则如表6所示。 表6 弹道导弹目标决策规则表 根据式(10)、式(11)乐观属性约简需满足的条件结合式(29)~式(34)经计算可得乐观属性约简为:{C1,C2}。删除表6中冗余属性,并删除重复数据项可得决策规则为: r1:(C1,2)∧(C2,3)→γP r2:(C1,2)∧(C2,2)→γB r3:(C1,1)∧(C2,2)→γN r4:(C1,3)∧(C2,1)→γN r5:(C1,2)∧(C2,1)→γN r6:(C1,1)∧(C2,1)→γN r7:(C1,3)∧(C2,2)→γN 当再次检测到有新的目标出现时,可将探测到该目标的属性值经离散化处理后,与以上规则进行匹配,从而采取相应的决策行为。例如有目标原始数据为(0.147 6,0.073 1,0.110 7,0.095 3,0.201 5,0.219 0),离散化后为(2,3,1,2,1,1),与规则r1:(C1,2)∧(C2,3)→γP匹配,因此决定对该目标采取决策行为γP。 多粒度粗糙集模型从粒计算的多粒度处理问题的思想出发来描述问题,使问题能够更加全面的展示出来;概率粗糙集模型能够充分利用信息的不完全性及概率特性。多粒度概率粗糙集模型具有多粒度粗糙集模型与概率粗糙集模型二者优点,能够更全面细致的反应问题。最后,将乐观多粒度概率粗糙集模型和悲观多粒度概率粗糙集模型的决策思想分别与Bayes最小风险决策理论相结合进而确定模型中的参数,实例证明该模型可应用于弹道导弹目标识别问题。 [1] 张清华, 王国雍, 肖雨. 粗糙集的近似集 [J]. 软件学报, 2012, 23(7): 1745-1759. [2] PAWLAK Z. Rough set theory and its applications to data analysis [J]. Cybernetics and Systems, 1998, 29(7): 661-688. [3] 陈昊, 杨俊安, 庄镇泉. 变精度粗糙集的属性核和最小属性约简算法 [J]. 计算机学报, 2012, 35(5): 1011-1017. [4] 王世强, 张登福, 毕笃彦, 等. 基于模糊粗糙集依赖度的两步属性约简方法 [J]. 北京工业大学学报, 2013, 39(6): 828-834. [5] 王学明, 舒兰. 基于直觉模糊相似关系下的粗糙集属性约简 [J]. 模糊系统与数学, 2012, 26(5): 185-190. [6] ZADEH L A. Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic [J]. Fuzzy Sets and Systems, 1997, 90(2): 111-127. [7] QIAN Y H, LIANG J Y, YAO Y Y, et al. MGRS: A multi-granulation rough set [J]. Information Sciences, 2010, 180(6): 949-970. [8] 张明, 程科, 杨习贝, 等. 基于加权粒度的多粒度粗糙集 [J]. 控制与决策, 2015, 30(2): 222-228. [9] 马睿, 刘文奇. 基于集值信息系统的多粒度粗糙集 [J]. 系统工程与电子技术, 2014, 36(5): 920-925. [10] 郭敏, 贾修一, 商琳. 基于模糊化的决策粗糙集属性约简和分类 [J]. 模式识别与人工智能, 2014, 27(8): 701-707. [11] 刘盾, 李天瑞, 李华雄. 粗糙集理论: 基于三支决策视角 [J]. 南京大学学报(自然科学版), 2013, 49(5): 574-581. [12] YAO Y Y. Decision-theoretic rough set models [C]//Rough sets and know lidge technolohy,second inter national conference,RSKT 2007,LNAI 4481,2007:1-12. Multigranulation Probabilistic Rough Sets and Its Application in Target Recognition ZHANG Xin1,LI Xuwu1,LU Yanli1,HOU Xueli2 (1 Air and Missile Defence College, Air Force Engineering University, Xi’an 710051, China; 2 Northwest Industries Group Co. Ltd, Xi’an 710051, China) In order to eliminate incompleteness and limitation in statistics of multi-granulation rough set, a multi-granulation rough set model was proposed by probabilistic rough set theory. First, probabilistic rough set theory was combined with multi-granulation theory and came up with the generalized definition about multi-granulation probabilistic rough set model. Abiding by the rules that positive region and negative region keep invariable, the attribute reduction for the optimistic model was defined. Then based on minimum Bayes expected risk decision theory, two parameters of multi-granulation probabilistic rough sets model were computed. Finally, the optimistic multi-granulation probabilistic rough sets model was applied to a case study of target recognition. multi-granulation rough set; probabilistic rough set; multi-granulation probabilistic rough set; Bayes decision theory; target recognition 2015-10-30基金项目:国家自然科学基金(61272011)资助 张鑫(1992-),男,内蒙古巴彦淖尔人,硕士研究生,研究方向:粗糙集与人工智能。 TP18 A3 目标识别应用实例
4 总 结