孔贺庆 张楠 岳晓冬 童向荣 于天佑
摘 要:现有的属性约简方法大部分关注决策系统中的所有决策类,而在实际决策过程中决策者往往仅关注决策系统中的一种或几种决策类。针对上述问题,提出基于多特定决策类的不完备决策系统正域约简的理论框架。首先,给出不完备决策系统单特定决策类正域约简的概念;第二,将单特定决策类正域约简推广到多特定决策类,构造了相应的差别矩阵及区分函数;第三,分析并证明了相关定理,提出基于差别矩阵的不完备决策系统多特定决策类正域约简算法(PRMDM);最后,选取4组UCI数据集进行实验。在数据集Teachingassistantevaluation、House、Connectionistbench和Cardiotocography上,基于差别矩阵的不完备决策系正域约简算法(PRDM)的平均约简长度分别为4.00、13.00、9.00和20.00,PRMDM算法(多特定决策类中决策类数目为2)的平均约简长度分别为3.00、8.00、8.00和18.00。实验结果验证了PRMDM算法的有效性。
Abstract: The existing attribute reduction algorithms mostly focus on all decision classes in decision systems, but in actual decision process, decision makers may only focus on one or several decision classes in the decision systems. To solve this problem, a theoretical framework of positive region preservation reduction based on multispecific decision classes in incomplete decision systems was proposed. Firstly, the positive region preservation reduction for single specific decision class in incomplete decision systems was defined. Secondly, the positive region preservation reduction for single specific decision class was extended to multispecific decision classes, and the corresponding discernibility matrix and function were constructed. Thirdly, with related theorems analyzed and proved, an algorithm of Positive region preservation Reduction for Multispecific decision classes reduction based on Discernibility Matrix in incomplete decision systems (PRMDM) was proposed. Finally, four UCI datasets were selected for experiments. On Teachingassistantevaluation, House, Connectionistbench and Cardiotocography dataset, the average reduction length of Positive region preservation Reduction based on Discernibility Matrix in incomplete decision systems (PRDM) algorithm is 4.00, 13.00, 9.00 and 20.00 respectively while that of the PRMDM algorithm (with decision classes in the multispecific decision classes is 2) is 3.00, 8.00, 8.00 and 18.00 respectively. The validity of PRMDM algorithm is verified by experimental results.
英文關键词Key words: rough set; incomplete decision system; multispecific decision classes; positive region preservation reduction; discernibility matrix
0 引言
在决策系统中,若决策系统中条件属性值存在缺失,则称该决策系统为不完备决策系统。在现实生活中,存在一定数量的不完备信息。目前,相关学者对不完备决策系统下的属性约简进行了大量的研究,并将经典Pawlak粗糙集模型进行推广,取得了一系列成果: 1998年,Kryszkiewicz[14]在不完备决策系统下引入广义决策保持约简,介绍了相关决策规则的提取,并提出了基于差别矩阵[15]的广义决策保持约简方法; 2002年,Liang等[16]基于粗糙熵提出不完备决策系统的知识约简的启发式算法。2003年,周献中等[17]100-104在不完备决策系统下提出分配约简; 2005年,黄兵等[17]52-56提出不完备决策系统的上下近似约简,并给出求解所有决策类约简的差别矩阵方法; 2010年,Qian等[18]基于极大相容块在不协调不完备决策系统下提出上下近似约简的概念,并构造了相应的差别矩阵;2014年,Shu等[19]在不完备决策系统下提出通过评估候选属性重要度快速求取属性约简的方法;2015年,Qian等[20]提出动态不完备决策系统下基于紧凑差别矩阵的特征选择方法。
在属性约简中,正域约简针对所有决策属性的决策类,约简结果保证了整个决策系统约简前后正域不变。在实际应用中,决策者往往仅关注于决策系统中的一种或几种决策类。例如,在医疗诊断中,多种症状构成条件属性集,不同类型的疾病构成不同的决策值,医生通常建议根据不同类型的疾病寻找不同的发病原因。2005年,Chen等[21]提出决策系统中局部约简的概念,与定义决策系统所有决策类的约简不同,局部约简只定义部分决策类的约简; 2017年,Yao等[22]在完备决策系统下定义了特定决策类的正域约简,提出特定决策类正域约简的判定定理,并讨论了特定决策类正域约简与所有决策类正域约简的关系; 2017年,Liu等[23]在完备系统下提出第l决策类约简和β约简的概念,并给出了基于差别矩阵的约简算法。
基于上述研究,文献[17]对不完备决策系统的所有决策类的约简进行了讨论,文献[22-23]在完备决策系统下对单特定决策类的正域约简进行了研究。由于在实际应用中存在大量的不完备数据,且决策者往往倾向于关注部分决策类,现有的不完备决策系统的正域约简方法针对上述情况讨论较少。另外,基于差别矩阵的约简方法可以求取所有约简,用户可以根据个人偏好选择具有自身偏好的约简,并且通过所有约简可以求取最短约简。为此,本文提出了基于多特定决策类的不完备决策系統正域约简的理论框架,当选取的多特定决策类中决策类数目为1时,基于多特定决策类的不完备决策系统正域约简退化为不完备决策系统单特定决策类的正域约简;当选取的多特定决策类为决策系统中所有决策类时,基于多特定决策类的不完备决策系统正域约简退化为不完备决策系统所有决策类的正域约简。首先,本文介绍了不完备决策系统的相关概念;然后,定义了不完备决策系统的多特定决策类的正域约简,构造了相应的差别矩阵及区分函数,提出了基于差别矩阵的不完备决策系统多特定决策类正域约简算法(Positive region preservation Reduction for Multispecific decision classes reduction based on Discernibility Matrix in incomplete decision systems, PRMDM);最后,实验验证了PRMDM算法的有效性。
3.1 约简结果对比
选取4组UCI数据集进行约简结果对比,约简结果如表3所示。其中,表3中“所有决策类约简”对应PRDM算法的约简结果,“单特定决策类约简”对应多特定决策类中决策数目为1时PRMDM算法的约简结果,“多特定决策类约简”对应多特定决策类中决策类数目为2 时PRMDM算法的约简结果。表4列出了约简数目及平均约简长度,其中,表4中“所有决策类约简”和“特定决策类约简”分别对应PRDM算法和PRMDM算法的约简数目和平均约简长度。
3.2 约简效率对比
4 结语
参考文献 (References)
