APP下载

模糊粗糙集理论的简要概述

2019-09-10李星星

科学导报·学术 2019年35期
关键词:粗糙集模式识别

李星星

摘  要:在模式识别系统中,随着计算机技术和网络技术的飞速发展,使得各个行业领域的信息急剧增加。鉴于信息的不确定性,这里就涉及模糊的概念。 模糊粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具。

关键词:模式识别;模糊集;粗糙集

一、模糊粗糙集理论的引入

粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具,鉴于信息的不确定性,这里就涉及模糊的概念。模糊的概念来源于自然环境中各种模糊的现象。像“粗”与“细”二者定义,倘若得知某颗树的直径大约为15cm,那么很难明确其为“粗”或者“细”,因为“粗”与“细”这两个概念之间并没有一个明确的界限,这两个概念之间是具有模糊性的、是不精确的。

最早提出模糊性概念是在1965年,美国非常著名的控制论学者,加利福尼亚大学的L.A.扎德教授提出了模糊集(fuzzy sets)的概念以及谈到了用来表示模糊性概念的隶属函数,从此建立了模糊集理论,并探索了模糊性或者说是不确定性等问题的研究方法及策略,为后续模糊集理论的发展奠定了坚实的基础。近几十年以来,模糊集理论得到了飞速的发展。1982年,波兰数学家Z. Pawlak提出了粗糙集理论思想,该理论也是作为数据分析处理的一种工具。粗糙集理论涉及大量且十分好的处理技术,深层次地应用于信息处理、智能计算范畴。粗糙集理论主要作为一种用来处理不确定性、不一致性等一系列不完整信息而存在的有效手段,其不需要什么先验知识,能够直接将它用来分析和处理数据,以至于挖掘出隐藏的知识以及潜在的规律,广泛的应用于机器学习与数据挖掘范畴。

二、模糊粗糙集理论概述

粗糙集理论是一种用来处理不确定性信息的强有力的工具,其思想主要體现在某一集合中一组对象之间的不可分辨性,并且该理论广泛的应用于属性约简、数据压缩、数据挖掘、规则提取以及粒度计算领域。在数学范畴内,粗糙集所涉及的对象为集合;在编程范畴内,粗糙集所研究的对象则是一些特殊的矩阵;而在机器学习领域内,粗糙集所研究的对象则是一系列的决策表。在决策表中有条件属性(condition attribute)和决策属性(decision attribute),这些属性都是清晰、确定的,这些属性所对应的则是等价关系,在特征降维(属性约简)过程中,样本的属性值必须要经过离散化处理;然模糊集却说明着集合内子类边界的无界定性。模糊性则是精确性的一个相反的概念,在现实生活中,人们经常用模糊性的术语来表达自己的观点以及解决一些问题。在模糊集理论中的条件属性(condition attribute)和决策属性(decision attribute)均可以是模糊的,所对应的则是相似关系,在特征降维过程中,这些属性值并不需要离散,可以直接用来进行后续处理。将粗糙集和模糊集两者相结合,就有了模糊粗糙集的概念,既考虑了模糊集的粗糙近似,而且又用相似关系或者模糊划分来得到子集的近似。模糊粗糙集模型适用于样本关系和对象子集都是模糊近似的场合[1]。在模糊粗糙集模型中,我们可以用模糊等价关系(fuzzy equivalence relation)来进行聚类分析,最终可用于判别分类。接下来给出关于模糊粗糙集的几个重要定义:

定义1:若 为一个非空有限集合,R为 的一个二值关系矩阵,若R符合如下三个条件,即可认为R为集合 上的一个模糊等价关系。

(1)反身性:

(2)对称性:

(3)传递性:

定义2:假设U是一个论域,R是一个模糊等价关系,那么U上的模糊划分可表示为 ,其中, 是由模糊等价关系R和样本 所诱导的模糊等价类别(fuzzy equivalence class)。 意味着论域U被R划分, 则是基于模糊等价关系的模糊划分。

这与经典的Pawlak粗糙集模型不同。经典的Pawlak粗糙集模型中的等价关系则为易脆的等价关系(crisp equivalence relation),详细的情况见参考文献[2]。

三、模糊粗糙集理论的主要研究方向

目前,模糊粗糙集理论的研究方向主要是三个方面:

理论上,①利用抽象代数来研究粗糙集代数空间这种特殊的代数结构。②利用拓扑学描述粗糙空间。③还有就是研究粗糙集理论和其他软计算方法或者人工智能的方法相接合,例如和模糊理论、神经网络、支持向量机、遗传算法等。④针对经典粗糙集理论框架的局限性,拓宽粗糙集理论的框架,将建立在等价关系的经典粗糙集理论拓展到相似关系甚至一般关系上的粗糙集理论。

应用上,模糊粗糙集理论在许多领域得到了应用,①临床医疗诊断;②电力系统和其他工业过程故障诊断;③预测与控制;④模式识别与分类;⑤机器学习和数据挖掘;⑥图像处理;⑦其他。

算法上,一方面研究了模糊粗糙集理论属性约简算法和规则提取启发式算法,例如基于属性重要性、基于信息度量的启发式算法,另一方面研究和其他智能算法的结合,是当前国内外研究的一个热点之一。

参考文献

[1]  Wang C,Qi Y,Shao M,et al. A Fitting Model for Feature Selection With Fuzzy Rough Sets[J]. IEEE Transactions on Fuzzy Systems,2017,25(4):741-753.

[2]  Dubois D,Prade H. ROUGH FUZZY SETS AND FUZZY ROUGH SETS*[J]. International Journal of General Systems,1990,17(2-3):191-209.

猜你喜欢

粗糙集模式识别
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
基于MBP算法和深度学习的人脸识别
基于视频的带电作业中组合间隙的智能检测
基于粗集决策规则性质的研究
一种基于改进的层次分析法的教师教学质量评价模型
一种改进的ROUSTIDA数据填补方法
汽车外观造型创新设计遗传算法的应用
自动洁地机器人的设计
分布式光纤传感边坡工程检测设计
不确定性数学方法的比较研究