APP下载

不完备信息系统中集对粗糙集模型

2019-09-10李桂秋田德路

科学导报·学术 2019年25期
关键词:粗糙集

李桂秋 田德路

摘  要:粗糙集在数据挖掘、知识发现、模式识别等领域的成功应用,使得粗糙集理论的研究有了很大的发展。但是由于对不精确属性值的处理过于简单化,阻碍了粗糙集理论在不完备信息系统中的进一步应用。论文对不精确属性值和已有的基于集对分析的粗糙集模型进行了分析,提出了广义联系度的概念,并以此为基础进一步完善了集对粗糙集理论,并且有力地说明了论文提出的广义集对粗糙集模型能在不完备信息系统中得到更好的应用。

关键词:粗糙集;不完备信息系统;集对分析;不精确属性值;广义联系度

1  引言

粗糙集理论[1,2,3]作为一种研究不精确信息系统的数学工具,自1982年波兰学者Pawlak提出至今在知识发现、模式识别、决策分析、数据挖掘等领域得到广泛的应用。Pawlak提出的粗糙集理论是基于完备信息系统,即每个样本对象的所有属性值都是精确的,但在现实中由于对数据测量的误差,対数据的遗漏以及数据获取的限制等原因,使得我们往往面临的是不完备信息系统,即可能存在部分对象的部分属性值不精确的情况。处理不完备信息系统,目前主要有两类方法:一类是间接处理方法,其特点是通过一定的方法(通常是基于概率统计)把不完备信息系统转化为完备信息系统,即数据补齐;另一类是直接处理方法,其特点是对经典粗糙集理论中的相关概念在不完备信息系统下进行适当扩充[4]。

导致属性值不精确的原因很多,所以我们遇见的不精确属性值也各种各样,各种不精确属性值在解决实际问题中所起的作用往往是不一样的,单一的处理这些不精确属性值往往得不到理想的结果。在这样的背景下,本文对不精确属性值进行了分类,并通过对已有的集对粗糙集模型的分析,进一步完善了集对粗糙集理论,使得集对粗糙集模型在处理大型的或者小型的不完备信息系统,以及空值较多或者空值较少的不完备信息系统时优越性都较好。

2  基本概念

定义1 四元数组 称为一个信息系统,其中 是对象的非空有限集合,称为论域; 是属性的非空有限集合, 是条件属性集合, 是决策属性集合,且 ; , 表示属性 的值域; 是一个信息函数,它为每个对象在每个属性上赋予一个信息值,即 , , 。若 ,则称信息系统为数据表,否则为决策表。若至少存在一个 , ,有 不精确,则称信息系统 为不完备的,否则称信息系统是完备的。

文献[5]中提到丢失型、遗漏型空值,这篇论文和文献[5]对空值有不同的见解。这篇论文给“空值”以另一个解释:“不精确属性值”。在不完备信息系统中,我们对不精确属性值根据其产生的原因对其进行分类:遗漏型不精确属性值,记为 ,其特点是存在于相应属性的属性值集合中,由于没有被记载而导致的不精确;变异型不精确属性值,以下称变异型属性值,记为 ,其特点是它不属于对应属性的属性值的集合,也就是说它与对应属性的属性值集合中的任一元素都有差异,由于对象在进化过程中产生了变异或者记载错误而导致的不精确;丢失型不精确属性值,记为?,其特点是在目前的条件下我们对对象的该属性值没有任何认识,比如一个病人不适合做某项仪器检查,在这个仪器下,我们可能检测不到病人患有任何疾病。这样我们对不精确属性值就有了一个新的认识。

现实中,遗漏型不精确属性值和丢失型不精确属性值对我们研究问题的意义是一样的。因为这两种属性值对我们来说都是没有任何记载的,所以在实际问题中我们把这两种不精确属性值同等处理都称为空白型属性值,记为 。

简单说明:在本文中,如果对象 在属性 下的属性值是变异型属性值,则记 ,这并不是说 在 下的属性值是 , 仅是变异型属性值的标记。

集对分析(SPA)是我国学者赵克勤于1989年正式提出用于研究两个集合相互关系的理论,其核心思想是把被研究的客观事物的确定性联系和不确定性联系作为一个确定不确定系统来分析和处理[6]。下面给出集对分析中的一个重要概念。

7  結论

论文对不精确属性值和已有的基于集对分析的粗糙集模型进行了分析,提出了广义联系度的概念,论文以此为基础进一步完善了集对粗糙集理论。 与 的广义集对相似关系以及对象 的广义  邻域中多个加权系数的使用,使得广义集对粗糙集模型处理问题比较灵活,通过调节加权系数  的值得到符合主观和客观要求的结果。有力地说明了广义集对粗糙集模型有更广泛的应用环境,能在不完备信息系统中得到更好的应用。下一步的工作是在广义集对粗集模型的基础上研究不完备信息系统的属性约简和规则提取问题,为实际应用奠定理论基础。

参考文献

[1]  Pawlak Z. Rough Set Theory and Its Application to Data Analysis[J]. Cybernetics and Systems,1998,29(9):661-668.

[2]  Pawlak Z,Busse J G,Slowinski R. et al,Rough Sets[J]. Communications of the ACM,1995,38(11):89-95.

[3]  Z. Pawlak,A. Skowron,Rough Sets:some extensions,Information Sciences,177(2007)28-40.

[4]  王国胤.Rough集理论在不完备信息系统中的扩充[J].计算机研究与发展,2002,39(10):1238-1243.

[5]  陈蓉素.不完备信息系统中的集对粗糙集模型分析[J].计算机工程与应用,2009,45(16):63-65.

[6]  黄兵,钟斌,周献中.改进集对粗集模型[J].计算机工程与应用,2004,18(9):82-84.

[7]  赵克勤.集对分析及其初步應用[M]. 杭州:浙江科学技术出版社,2000年3月第一版,15-16.

[8]  黄兵,等,基于集对分析的不完备信息系统粗糙集模型分析[J].计算机科学,2002.29(9.专刊):1-3.

[9]  邓毅雄,黄兆华.不完备信息系统的基于集对分析粗糙集模型[J].华东交通大学学报,Vol.22 No.2,Apr.,2005,100-103.

[10]  徐怡,李龙澍,李学俊.扩充的基于集对联系度的粗糙集模型[J] .Proceedings of the 26# Chinese Control Conference,July 26-31,2007,Zhangjiejia,Hunan,China 372-375.

[11]  陶志,戴慧君,张艳.不完备信息系统中集对粗集模型[J].计算机应用,2008,28(7):1684-1685,1691.

[12]  Li Wanqing,Ma Lihua,Meng Wenqing,Du Fengqiu. Analysis of Risk Decision of E-Commerce Project Based on Data Mining Of Rough Sets. International Conference on Computer Engineering and Applications. Gold Coast,Australia,January 17-19,2007,24-28.

[13]  Hrudaya Ku. Tripathy,B. K. Tripathy,and Pradip K. Das. An Intelligent Approach of Rough Set in Knowledge Discovery Databases. International Journal of Computer Science and Engineering 2,Winter 2008,45-48.

[14]  张文修,等,粗糙集理论与方法 [M]. 北京:科学出版社.2001.07.第一版,46.

作者简介:李桂秋,女,1984年生,山东菏泽人,硕士,主要研究领域为复杂系统建模、粗糙集理论及其应用等。

基金支持:广州市科技计划项目(No:201804010088),广东省普通高校特色创新类项目(No:2018KTSCX160),广东第二师范学院质量工程项目(No:2019jxtd01,2018zygxk16)。

猜你喜欢

粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
局部多粒度覆盖粗糙集
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
基于粗糙集的不完备信息系统增量式属性约简
优势直觉模糊粗糙集决策方法及其应用
基于键树的粗糙集属性约简算法
悲观的多覆盖模糊粗糙集
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用