APP下载

变精度覆盖决策信息系统的约简

2014-07-07许晴媛李进金张燕兰

计算机工程与应用 2014年6期
关键词:李进约简粗糙集

许晴媛,李进金,张燕兰

1.闽南师范大学计算机科学与工程系,福建漳州 363000

2.闽南师范大学数学与信息科学学院,福建漳州 363000

变精度覆盖决策信息系统的约简

许晴媛1,李进金2,张燕兰1

1.闽南师范大学计算机科学与工程系,福建漳州 363000

2.闽南师范大学数学与信息科学学院,福建漳州 363000

把变精度方法引入到覆盖决策信息系统中,给出变精度覆盖下近似与变精度覆盖上近似的定义。进而讨论了变精度覆盖下近似与变精度覆盖上近似的若干性质及约简。分析了它们与覆盖分布约简、最大覆盖分布约简、覆盖下近似约简、覆盖上近似约简之间的关系。并给出实例进行说明。

变精度;覆盖;决策信息系统;约简

1 引言

由Pawlak创立的粗糙集理论[1-2]已被成功应用于决策信息系统的属性约简中[3-4]。然而Pawlak粗糙集模型中对象的分类是基于等价关系,分类过于苛刻,不利于大规模数据集合之上的知识发现,人们相继将Pawlak粗糙集进行了许多有意义的推广。其中变精度粗糙集模型和覆盖粗糙集模型是推广的两个主流方向。

变精度粗糙集理论是由Ziarko教授于1993年在文献[5]中提出,它在Pawlak粗糙集的基础上引进了一个参数α,并将其定义为错误分类率且α∈[0,0.5),即允许一定程度上错误分类的存在,所以变精度粗糙集理论能有效地处理带噪声的信息系统。后来,AN等人将α定义为正确分类率且α∈(0.5,1][6]。目前变精度粗糙集模型已经在很多领域得到了广泛的应用[7]。

覆盖粗糙集模型是由Zakowski教授于1983年在文献[8]提出。2003年,William Zhu和Feiyue Wang在覆盖粗糙集的基础上给出了约简的概念和方法[9]。文献[10-15]讨论了覆盖信息系统的约简理论。

本文把变精度粗糙集理论引入到覆盖决策信息系统中,采用参数α∈(0.5,1],给出X(X⊆U)的α覆盖下、上近似的定义;进而讨论了α覆盖下、上近似的若干性质及约简;最后讨论了它们与文献[14]中覆盖分布约简、最大覆盖分布约简、覆盖下近似约简、覆盖上近似约简之间的关系。这些结果进一步推广和深化了决策信息系统约简理论。

2 基本概念

为便于本文的讨论,下面先给出一些重要的有关概念。

定义1[10]设C={X1,X2,…,Xn}是U上的一个覆盖。∀x∈U,记(x)C=∩{Xj:Xj∈C,x∈Xj},Cov(C)={(x)C:x∈U},则Cov(C)也是U的一个覆盖,称Cov(C)为U的C诱导覆盖。

定义2[10]设ς={Ci:i=1,2,…,m}是论域U的一族覆盖,对于任意的x∈U,令▽ς(x)=∩{(x)Ci:i=1,2,…,m},则Cov(ς)={▽ς(x):x∈U}也是U的一个覆盖,称Cov(ς)为U的ς诱导覆盖。

定义3[10]设ς={Ci:i=1,2,…,m}是论域U的一族覆盖,D={d}是决策属性集,U/D={D1,D2,…,Dr}是U上的决策划分,称(U,ς,D)为覆盖决策信息系统。如果对于任意的x∈U,存在Dj∈U/D,使得▽ς(x)⊆Dj,则称(U,ς,D)为协调的覆盖决策信息系统,记作Cov(ς)≤U/D,否则称(U,ς,D)为不协调的覆盖决策信息系统。

定义4[16]设(U,ς,D)是覆盖决策信息系统,对于任意的x∈U,记:

则称μς(x)=(D(D1/▽ς(x)),D(D2/▽ς(x)),…,D(Dr/▽ς(x)))为U/D上的覆盖概率分布函数。记:

称mς(x)是不确定命题规则“若y∈▽ς(x),则y∈Dj0”的可信度。记:

为覆盖决策信息系统论域U上的关于覆盖族ς的最大决策分布函数。

3 变精度覆盖决策信息系统

定理1设(U,ς,D)是不协调的覆盖决策信息系统,β⊆ς。则α∈(0.5,1]时的α覆盖下近似与α覆盖上近似有以下性质:

4 变精度覆盖决策信息系统的约简

定义6设(U,ς,D)是不协调的覆盖决策信息系统,β⊆ς。记:

定理2设(U,ς,D)是不协调的覆盖决策信息系统,β⊆ς。记:

定理3设(U,ς,D)是不协调的覆盖决策信息系统,则有:

(1)覆盖分布协调集必为α覆盖下近似协调集;

(2)覆盖分布协调集必为α覆盖上近似协调集。

证明若β为覆盖分布协调集,则D(Dj/▽ς(x))= D(Dj/▽β(x))(j≤r,x∈U),于是D(Dj/▽ς(x))≥α等价于D(Dj/▽β(x))≥α,即(x)=(x)(x∈U),则β为α覆盖下近似协调集。同理可证β为α覆盖下近似协调集。

注1一般来讲,覆盖分布约简集未必是α覆盖下、上近似约简集,α覆盖下、上近似约简集也未必是覆盖分布约简集。以例2来说明。

例2(续例1)则

由于Cov(ς)≤U/D不成立,于是(U,ς,D)是不协调的覆盖决策信息系统。得到覆盖决策分布(见表1)。

表1 例2覆盖决策分布

由此可见ς是覆盖分布约简集。

取α=0.6,根据表1得表2(α覆盖下近似分布)和表3(α覆盖上近似分布)。

表2 例2α覆盖下近似分布

可见C2既是α覆盖下近似约简集,也是α覆盖上近似约简集。

表3 例2α覆盖上近似分布

定理4设(U,ς,D)是不协调的覆盖决策信息系统,β⊆ς。记:

若α0>0.5,则当α∈(0.5,α0]时,β是α覆盖下近似协调集,则β必为最大覆盖分布协调集。

定理5设(U,ς,D)是不协调的覆盖决策信息系统,β⊆ς。记:

则有:

(1)当α∈(1-λ0,1]时,若β是覆盖上近似协调集,则β必为α覆盖上近似协调集。

(2)当α∈(1-λβ,1]时,若β为α覆盖上近似协调集,则β必为覆盖上近似协调集。

(3)当α∈(1-λ0,1]时,β为α覆盖上近似约简集当且仅当β是覆盖上近似约简集。

(3)由(1)与(2)即可证明。

注2定理5条件不成立时,覆盖上近似协调集未必是α覆盖上近似协调集,α覆盖上近似协调集也未必是覆盖上近似协调集。

例3(续例2)由表1得表4。

可见{C1}是覆盖上近似协调集。而由表3(取α=0.6)知C1不是α覆盖上近似协调集。

5 结束语

本文给出变精度覆盖决策信息系统,讨论了α覆盖下、上近似的若干性质及约简;进而讨论了它们与文献[14]中覆盖分布约简、最大覆盖分布约简、覆盖下、上近似约简之间的关系。这些结果可看成是决策信息系统约简理论的进一步推广和深化。

[1]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.

[2]Pawlak Z.Rough sets:theoretical aspects of reasoning about data[M].Boston:Kluwer Academic Publishers,1991.

[3]张文修,梁怡,吴伟志.信息系统与知识发现[M].北京:科学出版社,2003.

[4]张文修,仇国芳.基于粗糙集的不确定决策[M].北京:清华大学出版社,2005.

[5]Ziarko W.Variable precision rough set model[J].Journal of Computer and System Science,1993,46(1):39-59.

[6]An A,Shan N,Chan C,et al.Discovering rules for waterdemand prediction:an enhanced rough-set approach[J].Engineering Applications in Artificial Intelligence,1996,9(6):645-653.

[7]陶志,许宝栋,汪定伟,等.基于变精度粗糙集理论的粗糙规则挖掘算法[J].信息与控制,2004,33(1):18-22.

[8]Zakowski W.Approximations in the space(U.II)[J].Demonstrati Mathematica,1983,16(1):761-769.

[9]Zhu W,Wang Feiyue.Reduction and axiomization of covering generalized rough sets[J].Information Science,2003,152(1):217-230.

[10]Chen Degang,Wang Changzhong,Hu Qinghua.A new approach to attribute reduction of consistent and inconsistent covering decision systems with covering rough sets[J].Information Sciences,2007,177:3500-3518.

[11]张亚军,王艳平,付上金.基于覆盖粗糙集理论中的约简与求核[J].模糊系统与数学,2007,21(6):152-156.

[12]Li Fei,Yin Yunqiang.Approaches to knowledge reduction of covering decision systems based on information theory[J].Information Sciences,2009,179:1694-1704.

[13]张燕兰,李进金.覆盖决策系统的相对约简[J].工程数学学报,2009,26(5):929-935.

[14]许晴媛,李进金,张燕兰.覆盖决策信息系统的约简[J].山东大学学报:理学版,2010,45(1):89-93.

[15]夏秀云,秦克云,田浩.协调覆盖决策信息系统下基于条件信息熵的属性约简[J].河南大学学报:自然科学版,2010,40(4):406-410.

[16]Lashin E F,Kozae A M,Abo Khadra A A,et al.Rough set theory for topological spaces[J].International Tournal of Approximate Reasoning,2005,40(1/2):35-43.

XU Qingyuan1,LI Jinjin2,ZHANG Yanlan1

1.Department of Computer Science and Engineering,Minnan Normal University,Zhangzhou,Fujian 363000,China
2.School of Mathematics,Minnan Normal University,Zhangzhou,Fujian 363000,China

The variable precision method is introduced into the covering decision information system.Definitions of the variable precision covering lower and upper approximations are given.Some properties and reductions of them are discussed. Their relationships with the covering distribution’s reduction,the largest covering distribution’s reduction and the covering lower and upper approximations’reduction are analyzed.Examples are given to illustrate the conclusions.

variable precision;covering;decision information system;reduction

A

TP18

10.3778/j.issn.1002-8331.1204-0350

XU Qingyuan,LI Jinjin,ZHANG Yanlan.Reductions of variable precision covering decision information system. Computer Engineering and Applications,2014,50(6):123-126.

国家自然科学基金(No.61379021,No.11301367,No.11061004,No.71140004);省属高校科研专项计划项目(No.JK2011031)。

许晴媛(1977—),女,副教授,研究领域为人工智能、粗糙集、不确定性理论;李进金(1960—),男,教授,博士生导师,研究领域为拓扑学、粗糙集、不确定性理论;张燕兰(1983—),女,博士生,讲师,研究领域为人工智能、粗糙集、不确定性理论。E-mail:xqyyuan871@163.com

2012-04-19

2012-07-19

1002-8331(2014)06-0123-04

CNKI网络优先出版:2012-08-08,http://www.cnki.net/kcms/detail/11.2127.TP.20120808.0938.008.html

猜你喜欢

李进约简粗糙集
Evolution of surfaces and mechanisms of contact electrification between metals and polymers
Dense coding capacity in correlated noisy channels with weak measurement*
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
常用辅助线在圆中的运用
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
把自己“吹”进监狱