APP下载

横向拆分形势背景下的快速规则提取方法

2016-09-27温云霞王俊红

智能系统学报 2016年4期
关键词:集上背景形式

温云霞, 王俊红,2

(1. 山西大学 计算机与信息技术学院,山西 太原 030006; 2. 计算智能与中文信息处理教育部重点实验室,山西 太原 030006)



横向拆分形势背景下的快速规则提取方法

温云霞1, 王俊红1,2

(1. 山西大学 计算机与信息技术学院,山西 太原 030006; 2. 计算智能与中文信息处理教育部重点实验室,山西 太原 030006)

概念格是进行数据挖掘和规则提取的一种有效工具。目前已经提出的概念格上的规则提取方法大多是针对整个形式背景,得到的规则数目较多,规则集规模较大,且这种规则结构不便于两个规则集的合并。针对这个问题,本文提出一种伪规则的概念,并给出渐近式获取伪规则的方法;同时证明了通过伪规则集,用户可以根据自己的兴趣有选择地从伪规则集合中产生出所需的蕴含规则;提出了将两个伪规则集进行合并的方法,从而用户可以通过拆分合并的思想来获取规则集;最后通过实验分析验证了算法的有效性。

概念格; 形式背景; 子背景; 规则提取; 伪规则; 规则合并

中文引用格式:温云霞, 王俊红. 横向拆分形势背景下的快速规则提取方法[J]. 智能系统学报, 2016, 11(4): 526-533.

英文引用格式:WEN Yunxia, WANG Junhong. Research on a fast method for extracting rules based on horizontal splitting[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 526-533.

概念格[1-3]是数据分析和知识处理的一种有力工具,由Wille[1]在1982年提出。近年来获得了飞速的发展,概念格理论[2]已经被广泛地应用于软件工程、知识工程、数据挖掘和信息检索等领域。

在多源信息系统和数据分布式存储与并行处理中,数据都是分别存储和处理的。另一方面,在较大的形式背景下概念格构造的复杂度很高,一个可行的方法是把形式背景拆分成多个子形式背景[4-5],分别存储和处理。这种方法的思想是在每个子形式背景上构造概念格并通过子概念格的合并得到所需的概念格。概念格的分布式处理大大减少了概念格的构造复杂度,但对子概念格上获得的规则集之间的联系,以及不通过子概念格合并直接利用规则集融合产生新规则的研究还较少。

概念格表明了概念之间的泛化和例化关系,这种层次关系有利于规则提取[6-10]。在概念格的规则提取方面学者们进行了一定的研究,王志海等[6-7]提出了概念格上规则提取的一般算法和渐近式算法并研究了概念格与关联规则发现。针对不同的形式背景有不同的规则提取方法,如李金海等[8]提出的在决策形式背景上的规则提取。还有一些提取规则的改进方法,如梁吉业等[9]提出的基于概念格的规则产生集挖掘算法等。近来对概念格的研究也主要是围绕概念格的约简、缩小概念格的构造和规则提取的复杂度[11-23]。但上述规则提取方法,一方面大都是针对一个形式背景,且得到的规则集数量较多、规模较大。而用户有时可能只需要一部分感兴趣的规则信息,而从规模较大的规则集中找出这些感兴趣的规则信息也是一个难题。另一方面规则形式大都是文献[6]和文献[10]提出的规则形式,这种规则结构不便于两个规则集之间的合并研究。

针对上述问题,本文提出一种伪规则的概念,给出渐近式获取伪规则的方法。同时说明了通过伪规则集,用户可以得到原概念格上的蕴含规则。伪规则集的规模相对较小,其结构适于两个规则集的合并。用户可以根据自己的兴趣有选择地从伪规则集合中产生出所需的蕴含规则。在伪规则集的基础上,提出了将两个伪规则集进行合并的方法,通过此方法用户可以直接利用伪规则集得到范围更大的规则集。最后通过实验验证了该方法的有效性。

1 基本定义

1.1概念格

表1 形式背景

图1 L(U,{a,b,c,d,f,g,h,i},I)Fig.1 L(U,{a,b,c,d,f,g,h,i},I)

1.2规则提取

下面简要介绍由文献[6]提出的规则提取方法的主要依据定理,该方法的基本思想是依据其双亲节点即直接泛化的个数及形式来对格中每个节点生成其无冗余的所有规则。关于此方法的详细描述可参考文献[6]。

定理1[6]如果格中节点H=(X1,Y1)只有一个双亲节点M=(X2,Y2),则H所产生的规则前件只能为单个描述符,且∀p∈{Y1-Y2},都存在一条无冗余规则p→Y1-p。

定理2[6]如果格中节点H=(X1,Y1)具有d个双亲节点M1(X2,Y2),M2(X3,Y3),…,Md(Xd,Yd),则对于任意一个描述符p∈{Y1-(Y2∪Y3∪…∪Yd)},都存在一条规则p→Y1-p。

定理3[6]若果格中节点H=(X1,Y1)具有两个双亲节点M1(X2,Y2)和M2(X3,Y3),则对于每个元素∀p1∈{Y2-Y2∩Y3}和∀p2∈{Y3-Y2∩Y3},都存在一条规则p1p2→Y1-p1p2。

注:只有当‖X′‖>k时,才可能有前件至多为k个描述符的规则,并且规则前件的描述符个数至多为其双亲节点的数目。除了前件为单个描述符的规则之外,其他规则的形式与数目仅仅依赖于其双亲节点。

例1对图1用上述定理,获得的蕴含规则为b→a,g→a,d→abf,f→abd,bg→a,bh→ag,h→ag,c→agh,bc→agh,i→acgh。

1.3形式背景拆分思想

通过对形式背景的拆分,形成多个子背景,分别构造概念格,然后再将子概念格合并是概念格分布处理的中心思想。

目前对形式背景的拆分有纵向和横向之分,对应的有两种合并方法。横向拆分是指对象域相同,属性项不同的拆分。纵向拆分是指对象域不同,属性项相同的拆分。本文将采用横向拆分的方式。

2 伪规则及其渐近式提取

在一个形式背景上通过文献[6]提出的方法以及其他的一些改进方法所得到的规则数目较多,规模较大,其规则形式不便于两个规则集之间的合并操作。因此,我们提出一种新的规则形式及其渐近式提取方法。其基本思想是对格中每个节点生成与其直接关系的父节点之间的一种关系,包括属性集之间的关系和对象集之间的关系,并证明通过伪规则集可以推导出全部的蕴含规则。

2.1伪规则基本定义

注:上述伪规则不是真正的蕴含规则,是一种便于规则集合并和产生蕴含规则的一种规则形式。

定理4 由伪规则集可以推导出全部蕴含规则。

证明通过上述定理1~3可知,对于一个子节点,根据其父节点的数量采取不同的方法来获取蕴含规则。上述提出的伪规则是子节点与其直接父节点之间的一个关系。对于一个子节点找到与其直接相关的父亲节点对应的伪规则,运用定理1~3即可得到其对应的全部蕴含规则。

例如:图1所示格结构中获得的伪规则g(123)→ab(5)和b(123)→ag(4),由此伪规则可以得出子节点为abg,父亲节点为ab和ag。则通过定理2和定理3可以得到如下的蕴含规则:bg→a。

2.2伪规则的渐近式提取方法

采用基于对象的概念格渐近式构造思想,对每个新生成的节点产生其对应的伪规则。并对更新节点判断其对应的原伪规则是否已经失效,如失效不再记录。剩下的没有变更的节点规则全部原样进行记录。下面给出在已建好的格上提取规则的算法。该算法采用基于对象的渐近式构造思想,函数generaterule(N=(X,Y))生成节点之间的伪规则。

算法

输入已有的格L与规则集R,要追加的概念({x},f({x}));

输出更新后的格L′与规则集R。

BEGIN

R′←φ/*规则集合*/

FOR每个节点H=(X,X′)∈L

IFX′⊆f({x})THEN

把x加到X中,将节点H加入到Modify(记录更新节点)中

IFX′=f({x})THENcontinue;

ELSE

new=X′∩f({x}) /*生成新节点*/

IFnew∉LTHEN;

新增节点N=(X∪x,new)并加入

Modify中,增加边N→H;

FORModify中的每个节点M=(Xm,Ym)

IFYm⊆newTHEN加入边M→N,

IFM是H的双亲THEN

删去边M→H;

ENDFOR

ENDFOR

FOR每个规则p→q∈R

IFN的任意子节点N′=(Xn,Yn)

都有Yn≠p∪qTHEN

R′=R′∪p→q/*记录原来的规则*/

ENDFOR

R=R′/*记录新的规则集*/

END

Functiongeneraterule(N=(X,Y))

BEGIN

FORN的每个父亲节点F=(Xi,Yi)产生规则:Y/Yi(Xi)→Yi(Xi/X)

ENDFOR

END

3 伪规则集合并

概念格的构造一直是影响其应用的主要因素,文献[4]和文献[5]提出了拆分和合并的思想。将形式背景拆分成多个子形式背景,分别构造概念格并对其进行合并。但是,目前提出的合并都是针对子概念格的合并,而每个子概念格上都可以提取规则,因而可以将直接利用两个规则集进行合并,直接产生所需的规则信息。对于两个子规则集直接进行合并,相关研究还较少。下面提出通过伪规则集来实现两个规则的合并。

两个对应概念格上的伪规则集合并的主要思想是通过伪规则中包含的概念属性和对象信息,运用一定的合并原理来生成新的规则。在合并的过程中产生新的节点概念信息,记录新生概念信息。因此规则合并后也就得到了合并后的一个概念格的结构。合并规则依据的是概念格横向合并的思想,根据合并时新规则产生的信息来判断是否是新生成的规则,比较与原规则之间的关系来判断是否要更改原规则。因格中的节点在规则中既可以是前件也可以是后件,因此合并时只考虑其作为后件的情况,避免重复规则。

例如给定两个伪规则A(O1)→B(O2)和C(O3)→D(O4),则有如下合并规则:

定理5(O1∪O2)⊆(O3∪O4),则更新原有规则:A→BD。

证明因为节点C={(O1∪O2),B}对象集包含于节点C′={(O3∪O4),D}对象集,则节点C同样具有节点C′的属性,同时C的子节点也具有节点C′的属性,因此节点C及其子节点的属性变为{BD,ABD},则规则更新为A→BD。

实际操作中每次都记录更新节点(O1∪O2),以便后续合并处理重复的问题。

定理6 若有O1⊆(O3∪O4),O2⊄(O3∪O4),则更新原有规则:AD→B。

证明因为节点C={O1,(A∪B)}对象集包含于节点C′={(O3∪O4),D},而O2⊄(O3∪O4)即说明节点C的父亲节点的对象集并不包含于节点C′。因此只将C的属性变为{A∪D∪B},其父亲节点的属性不变,则原规则更新为AD→B。记录更新节点O1

定理7 (O1∪O2)∩(O3∪O4)≠φ,则生成new=(O1∪O2)∩(O3∪O4),是(O1∪O2)和(O3∪O4)与的子集,如果new在原概念格节点集中不存在,且(O3∪O4)与(O1∪O2)的所有子节点的交集都不是new,则生的规则有:BD/B→B,BD/D→D。

证明两个概念节点C={(O1∪O2),B}和C′={(O3∪O4),D}产生的新节点new={(O1∪O2)∩(O3∪O4),(B∪D)}是两个节点的子节点当原概念格节点中不存在此节点,因此依据伪规则生成方法,可以生成BD/B→B,BD/D→D。且(O3∪O4)与(O1∪O2)的所有子节点的交集都不是new,保证生成正确的规则。记录new。

定理8(O1∪O2)∩(O3∪O4)=φ,如果φ在原概念格节点集中不存在,则直接生成前者子节点与新节点之间的规则。

证明因为如果两规则的父节点与父节点的交集是空集,那么前者对应的子节点与后者父节点的交集也一定是空集,则记录ABD/AB→AB,ABD/D→D记录新节点φ。

注:在每个规则集中增加一个辅助规则,即内涵最大的节点自身生成一个辅助规则:Y→Y,保证在规则合并时可以访问到概念格中的每个节点。在合并的过程中会产生新的概念节点,也要对这些新产生的概念节点判断它们之间是否可以产生伪规则。同时判断更新节点与新生节点之间是否产生新的规则,可以防止重复地生成规则。

例2给定的形式背景如表1所示。图2和图3是对形式背景横向拆分每3个属性为一个子形式背景所对应的概念格。在图2上提取的伪规则集R1为:b(1235)→a(4),c(34)→a(125),c(3)→ab(125),b(3)→ac(4),abc(3)→abc(3)。图3对应的伪规则集R2为:h(234)→g(1),i(4)→gh(23),ghi(4)→ghi(4)。

图2 子概念格L(U,{a,b,c },l)Fig.2 Sub-concept lattice L(U,{a,b,c },I)

图3 子概念格L(U,{g,h,i},I)Fig.3 Sub-concept lattice L(U,{g,h,i},I)

合并过程如下:首先判断要加入的伪规则对应的节点信息是否已经存在,若存在不做任何操作。否则加入伪规则h(234)→g(1)到伪规则集R1上,遍历R1对应的所有概念节点信息,更新(1234,g)的属性信息为(1234,ag)。

1)与规则b(1235)→a(4)进行运算有12345∩1234=1234,对应的属性集为ag。则得到(1234,ag)是新生成的节点,产生的规则为g(1234)→a(5),因为与节点(1235,ab)没有包含关系,因此依然记录规则b(1235)→a(4)。

2)与规则c(34)→a(125)进行运算得到的节点与(1)相同,同时记录规则c(34)→ag(12)。

3)与规则b(3)→ac(4)进行运算,34⊂1234,更新规则b(3)→acg(4),记录更新节点(34,acg)。

4)与规则c(3)→ab(125)进行运算,因为节点3⊂1234,所以更新原来的规则cg(3)→ab(125),记录更新节点(3,abcg)。

5)与规则abc(3)→abc(3),3⊂1234,不产生新的节点,依然作为结尾节点,更新辅助规则abcg(3)→abcg(3)。

最后生成更新节点与新生节点之间的规则,以及新生节点与新生节点之间的规则,生成的规则如下:c(34)→ag(12),(b)中已经记录则不再记录。

加入h(234)→g(1)后得到的规则为:g(1234)→a(5),b(1235)→a(4),c(34)→ag(12),b(3)→acg(4),abcg(3)→abcg(3),cg(3)→ab(125)。将此伪规则集记录为R1,用于下次插入规则。

将R2中的规则按照上述的步骤加入R1,得到的规则集为:b(1235)→a(4),g(1234)→a(5),b(123)→ag(4),g(123)→ab(5),h(23)→abg(1),c(34)→agh(2),b(3)→acgh(4),h(234)→ag(1),b(23)→agh(4),i(4)→acgh(3),c(3)→abgh(2),i(φ)→abcgh(3),b(φ)→acghi(4)。由此伪规则集最终可以产生例1中的蕴含规则集。

图4 L(U,{a,b,c,g,h,i},I) Fig.4 L(U,{a,b,c,g,h,i},I)

4 实验结果及分析

上述规则合并方法我们已在Windows7环境下用MATLAB2013实现,并在UCI上的具有单值(二值)或可转换为单值,可数量化的Spect数据集、Mushroom数据集、Nursery数据集,和随机生成的数据集上进行了实验。在Mushshroom数据集上随机选定前10个属性和前180个对象,每30个对象为一组。在Spect数据集上随机选定前6个属性和前120个对象,每30个对象为一组。在Nursery数据集上随机选定前8个属性,前120个对象,每30个对象为一组。在随机生成的数据集上选定属性个数为15个,每个对象有5个属性,同样30个对象为一组。每次递增一组对象。对Mushroom数据集属性平均拆分为5份,每两个属性为一个拆分。同样对随机生成的数据集属性平均拆分成5份,每3个属性为一个拆分。对Spect数据集属性平分为3份,每2个属性为一个拆分。对Nursery数据集属性平分为4份,每2个属性为一个拆分。在这4个数据集上进行了测试并和文献[6]算法进行了对比,在4个测试集上两种方法的执行时间结果如下图5~8所示,两种方法获取规则数目的比较结果如图9~12。

图5 随机数据集上两种方法的执行时间Fig.5 Execution time of two methods on random data set

图6 Mushroom数据集上两种方法的执行时间Fig.6 Execution time of two methods on Mushroom data set

图7 Spect数据集上两种方法的执行时间Fig.7 Execution time of two methods on Spect data set

图9 随机数据集上两种方法获取的规则数目Fig.9 The number of rules obtained by two methods on random data set

图10 Mushroom数据集上两种方法获取的规则数目Fig.10 The number of rules obtained by two methods on Mushroom data set

图11 Spect数据集上两种方法获取的规则数目Fig.11 The number of rules obtained by two methods on Spect data set

图12 Nursery数据集上两种方法获取的规则数目Fig.12 The number of rules obtained by two methods on Nursery data set

在随机数据集上两种方法的执行时间及概念数如表2所示。

表2 随机数据集上两种生成规则方法时间对比

从表2中可以看出,利用伪规则集生成蕴含规则的方法所用时间较直接构造概念格生成蕴含规则明显减少。且时间的增长基本呈线性。在这个过程中避免了概念格的合并,降低了构造概念格的时间复杂度对规则获取的制约。

从图5~8中可以看出,本文算法执行时间低于文献[6]中的算法,且具有稳定性。在获取蕴含规则时间花销方面有一定的优势。

从图9~12中可以看出,本文算法所获取的伪规则的数目远小于文献[6]中算法所获取的规则数目,得到的伪规则集的规模较小,用户可以根据所需灵活地通过伪规则生成部分和全部的蕴含规则。在随机数据集以及Spect数据集上,获取的概念数与规则数对比如表3所示。

表3 随机数据集上蕴含规则与伪规则数的对比

表4 Spect数据集上蕴含规则与伪规则数的对比

从表3和表4中可以看出,当概念数量较多时,所获得的伪规则集的数量明显小于所获取的蕴含规则集的数量。在规模较小的 伪规则中,用户能够更好地选取感兴趣的属性并生成全部的蕴含规则。

6 结论

本文在横向拆分的形式背景下,对基于概念格的规则提取进行了研究。1)首先提出了伪规则的概念,并给出了伪规则的渐近式提取方法,证明了通过伪规则集可以生成全部的蕴含规则;2)本文基于伪规则形式,给出了伪规则合并的法则及快速规则获取方法,通过理论推理和实验验证说明了本文方法的有效性;3)本文所提的规则获取方法主要是针对于横向拆分的形式背景,但是对形式背景的拆分有多种拆分方式,对于不同的拆分方式下的规则获取是进一步需要研究的工作。

[1]GANTER B, WILLE R. Formal concept analysis: mathematical foundations[M]. Berlin Heidelberg: Springer-Verlag, 1999.

[2]WILLE R. Restructuring lattice theory: an approach based on Hierarchies of concepts[M]//RIVAL I. Ordered Sets. Netherlands: Springer, 1982: 445-470.

[3]胡可云, 陆玉昌, 石纯一. 概念格及其应用进展[J]. 清华大学学报: 自然科学版, 2000, 40(9): 77-81.

HU Keyun, LU Yuchang, SHI Chunyi. Advances in concept lattice and its application[J]. Journal of Tsinghua university: science & technology, 2004, 40(9): 77-81.

[4]李云, 刘宗田, 陈崚, 等. 多概念格的横向合并算法[J]. 电子学报, 2004, 32(11): 1849-1854.

LI Yun, LIU Zongtian, CHEN Ling, et al. Horizontal union algorithm of multiple concept lattices[J]. Acta electronica sinica, 2004, 32(11): 1849-1854.

[5]智慧来, 智东杰, 刘宗田. 概念格合并原理与算法[J]. 电子学报, 2010, 38(2): 455-459.

ZHI Huilai, ZHI Dongjie, LIU Zongtian. Theory and algorithm of concept lattice union[J]. Acta electronica sinica, 2010, 38(2): 455-459.

[6]王志海, 胡可云, 胡学钢, 等. 概念格上规则提取的一般算法与渐近式算法[J]. 计算机学报, 1999, 22(1): 66-70.

WANG Zhihai, HU Keyun, HU Xuegang, et al. General and incremental algorithms of rule extraction based on Concept lattice[J]. Chinese journal of computers, 1999, 22(1): 66-70.

[7]谢志鹏, 刘宗田. 概念格与关联规则发现[J]. 计算机研究与发展, 2000, 37(12): 1415-1421.

XIE Zhipeng, LIU Zongtian. Concept lattice and association rule discovery[J]. Journal of computer research & development, 2000, 37(12): 1415-1421.

[8]李金海, 吕跃进. 基于概念格的决策形式背景属性约简及规则提取[J]. 数学的实践与认识, 2009, 39(7): 182-188.

LI Jinhai, LV Yuejin. Attribute reduction and rules extraction in decision formal context based on concept lattice[J]. Mathematics in practice and theory, 2009, 39(7): 182-188.

[9]梁吉业, 王俊红. 基于概念格的规则产生集挖掘算法[J]. 计算机研究与展, 2004, 41(8): 1339-1344.

LIANG Jiye, WANG Junhong. An algorithm for extracting rule-generating sets based on Concept lattice[J]. Journal of computer research and development, 2004, 41(8): 1339-1344.

[10]GODIN R, MISSAOUI R. An incremental concept formation approach for learning from databases[J]. Theoretical computer science, 1994, 133(2): 387-419.

[11]李进金, 张燕兰, 吴伟志, 等. 形式背景与协调决策形式背景属性约简与概念格生成[J]. 计算机学报, 2014, 37(8): 1768-1774.

LI Jinjin, ZHANG Yanlan, WU Weizhi, et al. Attribute reduction for formal context and consistent decision formal context and Concept lattice generation[J]. Chinese journal of computers, 2014, 37(8): 1768-1774.

[12]MA Jianmin, LEUNG Y, ZHANG Wenxiu. Attribute reductions in object-oriented concept lattices[J]. International journal of machine learning and cybernetics, 2014, 5(5): 789-813.

[13]LI Jinhai, MEI Changlin, WANG Junhong, et al. Rule-preserved object compression in Formal decision contexts using concept lattices[J]. Knowledge-based systems, 2014, 71: 435-445.

[14]CORNEJO M E, MEDINA J, RAMíREZ-POUSSA E. Attribute reduction in multi-adjoint concept lattices[J]. Information sciences, 2015, 294: 41-56.

[15]TAN Anhui, LI Jinjin, LIN Guoping. Connections between covering-based rough sets and concept lattices[J]. International journal of approximate reasoning, 2015, 56(Part A): 43-58.

[16]张文修, 魏玲, 祁建军. 概念格的属性约简理论与方法[J]. 中国科学 E辑: 信息科学, 2005, 35(6): 628-639.

ZHANG Wenxiu, WEI Ling, QI Jianjun. Attribute reduction theory and approach to concept lattice[J]. Science in China series F: information sciences, 2005, 48(6): 713-726.

[17]张磊, 张宏莉, 殷丽华, 等. 概念格的属性渐减原理与算法研究[J]. 计算机研究与发展, 2013, 50(2): 248-259.

ZHANG Lei, ZHANG Hongli, YIN Lihua, et al. Theory and algorithms of attribute decrement for Concept lattice[J]. Journal of computer research and development, 2013, 50(2): 248-259.

[18]胡可云, 陆玉昌, 石纯一. 基于概念格的分类和关联规则的集成挖掘方法[J]. 软件学报, 2000, 11(11): 1478-1484.

HU Keyun, LU Yuchang, SHI Chunyi. An integrated mining approach for classification and association rule based on Concept lattice[J]. Journal of software, 2000, 11(11): 1478-1484.

[19]MAO Hua. Characterization and reduction of concept lattices through matroid theory[J]. Information sciences, 2014, 281: 338-354.

[20]YANG Yafeng. Parallel construction of variable precision concept lattice in fuzzy formal context[J]. AASRI Procedia, 2013, 5: 214-219.

[21]DíAZ-MORENO J C, MEDINA J. Using concept lattice theory to obtain the set of Solutions of multi-adjoint relation equations[J]. Information sciences, 2014, 266: 218-225.

[22]ISHIGURE H, MUTOH A, MATSUI T, et al. Concept lattice reduction using attribute inference[C]//Proceedings of the IEEE 4th Global Conference on Consumer Electronics. Osaka: IEEE, 2015: 108-111.

[23]CHEN Jinkun, LI Jinjin, LIN Yaojin, et al. Relations of reduction between covering generalized rough sets and Concept lattices[J]. Information sciences, 2015, 304: 16-27.

温云霞,女,1986年生,硕士研究生,主要研究方向为概念格与数据挖掘。

王俊红,女,1979年生,副教授,博士,硕士生导师,主要研究方向为粒计算、概念格与数据挖掘。

Research on a fast method for extracting rules based on horizontal splitting

WEN Yunxia1, WANG Junhong1,2

(1. School of Computer and Information Technology, Shanxi University, Taiyuan 030006, China; 2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, Taiyuan 030006, China)

The concept lattice is a valid tool for data mining and rule extraction. The methods of extracting rules from the concept lattice are based mainly on the whole formal context, but this results in a large number of rules and rule sets, and it is difficult to combine the rule sets subsets with the original structure. In this paper, the concept of a pseudo rule set and its incremental determination method is given; users can get the needed implication rules from the pseudo rule set, according to their interests. A method of combining two pseudo rule sets is then given. Users may therefore get their rule sets by dividing or combining these sets. The effectiveness of this method is proven through experiment analysis.

concept lattice; formal context; subcontext; extracting rules; pseudo rule; combination of the rule set

10.11992/tis.201606008

网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160808.0830.016.html

2016-06-02. 网络出版日期:2016-08-08.

国家自然科学基金项目(612022018,61303008).

王俊红. E-mail:wjhwjh@sxu.edu.cn.

TP18

A

1673-4785(2016)04-0526-08

猜你喜欢

集上背景形式
2022 年本刊可直接使用缩写形式的常用词汇
“新四化”背景下汽车NVH的发展趋势
GCD封闭集上的幂矩阵行列式间的整除性
《论持久战》的写作背景
黑洞背景知识
小议过去进行时
微型演讲:一种德育的新形式
R语言在统计学教学中的运用
搞定语法填空中的V—ing形式
师如明灯,清凉温润