APP下载

基于经典粗糙集约简方法的高层结构智能方案设计

2011-01-06张世忠段慧杰张世海

土木建筑工程信息技术 2011年2期
关键词:决策表约简粗糙集

张世忠 段慧杰 张世海

(南阳理工学院,南阳 473004)

基于经典粗糙集约简方法的高层结构智能方案设计

张世忠 段慧杰 张世海

(南阳理工学院,南阳 473004)

首先,介绍了经典粗糙集理论的9个基本概念及约简算法的分类,给出了基于经典粗糙集约简方法的结构方案设计思想与过程;其次,以高层结构实例为背景,给出了基于经典粗糙集理论约简算法的结构方案设计实例,为结构智能方案设计开拓了新的途径和方法。实践表明,与传统不精确性问题处理方法相比,利用粗糙集进行结构方案设计问题不确定信息处理,有着传统方法所不具有的优点。

高层建筑结构;智能方案设计;粗糙集;约简

1 引言

人们已建造的每一个高层结构实例均反映了相应历史时期各国工程技术专家,在千变万化设计方案及错综复杂技术经济与环境约束条件下,解决结构方案设计过程中所遇到的各种重大矛盾与问题时的思考、探索与实践,显然,这些工程实例信息是结构智能方案设计的重要资源[1]。但由于工程地震地质与周边环境及建筑方案特征等结构方案设计影响因素的随机性、人们知识的不完全性、不精确性等原因,使人们面临的工程实例信息存在各种不确定性,这种不确定性造成了具有相同描述信息的实例对象可能采用完全不同的结构方案。因此,在结构智能方案设计的诸多研究方法中,解决不确定和不完备性信息问题日益受到人们的重视。1982年波兰数学家 Paw lak提出的粗糙集理论,是一种刻画不完整、不精确和不确定性的新型数学工具[2,3],它能够较好地描述方案设计知识的不精确、不一致和不完整等各种不完备信息,发现属性间所隐含的依赖关系、约简冗余属性与对象、寻求最小属性子集以及生成方案设计决策规则,从而获取方案设计知识,以辅助决策和推理。本文将探索利用?基于经典粗糙集理论的约简方法来进行结构智能方案设计的方法和途径。

2 粗糙集的基本理论与概念

2.1 粗糙集理论的基本概念

定义 1等价类:设R是非空有限集合(论域)U上的等价关系,∀x∈U,定义[x]R={y∣yRx}为对象x关于R的等价类。其中,x称为等价类[x]R的代表元素。

定义 2不可分辨关系:给定一个论域 U和U上的一簇等价关系S,若φ≠P⊆S,∩P(P中所有等价关系的交集)仍然是U上的一个等价关系,称为P上的不可分辨关系,记为 IND(P)。不可分辨关系是经典粗糙集理论中最基本的概念,若

定义 3集合的下近似和上近似:给定知识库K=(U,S),其中U为论域,S为论域U上的等价关系簇,对 ∀X⊆U和论域 U上的一个等价关系R∈IND(K),可定义子集X关于知识R的下近似和上近似分别为

定义 4集合的边界域和正负域:称集合BNR(X)=R (X)-(X)为X的 R边界域;称POSR(X)=(X)为X的R正域;称NEGR(X)=U-(X)为X的R负域。显然,BNR(X)∈R (X),BNR(X)∩(X)=φ,即依据知识 R判断时,BNR(X)是不能明确判断是肯定属于X,也不能明确判断肯定不属于X的 U中元素所组成的集合;POSR(X)=(X)是由那些根据知识R判断肯定属于X的U中元素所组成的最大集合;R (X)是由那些根据知识R判断可能属于X的U中元素所组成的最小集合;NEGR(X)是即能明确判断肯定不属于X的对象组成的集合,即X ∩NEGR(X)= φ。

2.2 相对约简与相对核

定义 5知识的约简和核:给定一个知识库K=(U,S)和K中的一个等价关系簇P⊆ S,∀Q⊆P,若Q是独立的,且IND(Q)=IND(P),则称Q是等价关系簇P的一个约简,记为Q∈RED(P)。P中所有必要的知识组成的集合称为等价关系簇P的核,记为CORE(P),CORE(P)等于P的所有约简的交集。显然,核包含在知识的每一个约简之中,可作为所有约简的计算基础,是知识约简时不能消去的知识,否则将减弱知识的分类能力。

定义 6相对正域:P和Q是论域U上的等价关系,知识Q相对于知识P的正域(记为POSP(Q))定义为:

Q的P正域是U中所有据U/P的信息可以准确地划分到关系Q的等价类中去的对象集。

定义7知识的相对独立性:给定一个知识库K=(U,S)和K中的两个等价关系簇P,Q⊆S,∀R∈P,如有POSIND(P)(IND(Q))=POSIND(P-{R})(IND(Q)),则称R为P中Q不必要的,否则称R为P中Q必要的。为了简便,常用 POSP(Q)代替POSIND(P)(IND(Q))。

如对每一个R∈P,R为P中Q必要的,则称P为Q独立的,否则称P为Q依赖的或Q不独立的。同时,如果P是Q独立的,∀G⊆P,则G一定也是Q独立的。

定义 8知识的相对约简和相对核:给定两个等价关系簇P,Q⊆S,∀R∈P,∀G⊆P,若G是Q独立的,且POSG(Q)=POSP(Q),则称G是P的相对于Q的一个约简,记为 G∈REDQ(P),REDQ(P)是P的所有Q约简组成的集合,P的Q约简称为相对约简。P中所有Q必要的知识组成的集合称为等价关系簇P的Q核,记为COREQ(P),P的Q核称为相对核。

2.3 决策表与决策规则

定义 9决策表:形式上,称四元组DT=(U,A(A=C∪D),V,f)是一个决策表,其中,U={x1,x2,…,xn}为对象的非空有限集合,称为论域;C={a∣ a∈C}为条件属性集,每个 aj∈C(j∈[1 m])为C的一个简单属性;D={d∣d∈D}为决策属性集,且C∩ D= φ,C ≠ φ,D ≠ φ;V=∪Va(∀a∈C∪D)为信息函数 f的值域。

定义 10决策规则:设DT= (U,A(A=C∪D),V,f),C为条件属性集,D为决策属性集。令Xi和Yj分别代表U/C与U/D中的各个等价类,D es(Xi)和Des(Yj)分别为对Xi和 Yj描述,Des(Xi)= {(a,va)|f(x,a)=va,∀a∈C},Des(Yj)= {(a,va)|f(x,a)= va,∀a∈D}。决策规则定义为:rij:Des(Xi)→Des(Yj),Xi∩ Yj≠ 。规则确定性因子为 μ(XiYj)= ∣Xi∩ Yj∣ /∣ Xi∣,0< μ(Xi,Yj)≤1,μ(XiYj)=1时,rij是确定的,0< μ(Xi,Yj)<1时,rij是不确定的,μ(XiYj)反映了Xi中对象可分类到 Yj中比例。

3 基于经典粗糙集约简方法的高层结构方案设计

3.1 基于约简方法的结构方案设计思想

粗糙集是一种处理含糊性和不确定性的数学工具,它通常以决策表的形式来组织工程实例信息,其行代表工程实例样本,其列代表工程实例样本属性。粗糙集对知识的分类主要通过知识约简来实现,知识约简是指在保持原始决策表条件和决策属性间依赖关系不发生变化前提下,删除不相关冗余属性,提取最能反映系统特征的属性,使知识系统达到最简化。因一个决策表往往包含了大量的工程实例信息,其中的每一个样本都代表了一条基本决策规则,所有样本就构成了一个决策规则集,但这样的决策规则集对指导结构方案设计决策的应用价值较小,因其中的基本决策规则只机械地记录了一个样本的情况,不适用于其它新情况。故对结构方案设计来说,并不是决策表中所有的实例信息都是同等重要的,可通过对决策表的属性约简,从决策表条件属性中去掉不必要的冗余条件属性,获取对结构方案设计有重要影响的属性,据此获取更简捷和更高适应性的决策规则,以此即可指导结构方案设计,此即基于粗糙集约简算法的方案设计思想。

3.2 约简方法的分类

从决策表知识约简有无启发性的角度讲,可将决策表的属性约简分为盲目法和启发式算法[4]。常用的约简算法大多是启发式的添加算法,该类算法效率较高,能找到最优或次优的D约简。典型的约简算法主要有[5]:穷尽算法、Johnson贪梦算法、属性重要性的启发式算法、遗传算法、动态约简算法等。在实际应用中,应根据决策表的属性特征及各类算法的复杂度、问题求解成本等因素,来选择或构建合理实用的约简算法。本文将利用直观的经典粗糙集的约简概念进行高层结构方案设计的属性约简。

3.3 基于经典粗糙集约简的结构方案设计过程

基于经典粗糙集约简算法的结构方案设计过程主要包括:确定决策表并进行特征属性离散,确定决策属性 D的 C核,确定条件属性的 D约简,获取结构方案设计决策规则,据此进行方案设计等。

4 基于经典粗糙集约简方法的高层结构方案设计实例

4.1 决策表的确定与特征属性的离散化

为了减小计算工作量,本例选取文[6]表 1给出的 20个高层建筑实例信息中的 14个作为决策表,

表 1 高层建筑结构信息的决策表系统

并按文[7]中的方法对连续属性进行离散化处理,处理后的决策表见表 1。根据决策表DT=(U,A(A=C∪D),V,f)的定义可知,决策表的论域 U={xi}14,条件属性集为 C= {Ck}5= {主楼高度,地上层数,功能,设防烈度,场地类别}5;决策属性为D={d}={结构方案型式}。

4.2 确定决策属性 D的C核

1)确定U上关于属性{Ck}5的等价类

根据定义 1可确定出 U上关于属性{Ck}5的等价类U/Ck(k= [1 5]),其中,U/C5= {{x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x12,x13,x14}, {x11}},其它从略。

2)确定U上 IND(C)的等价类

由定义 2及 U/Ck(k= [1 5])可确定出:

3)确定U上关于等价关系D的等价类

财务管理的重要性决定了监督体制出现的必然性,监督工作是提高财务管理质量的重要方式之一。事业单位基本上都设立了相关的监督机制,但是在实际的操作中,监督机制所发挥的作用受到了各种因素的打压。事业单位虽然都有相应的监督机制,但是却没有单独建立监督部门,监督工作的进行往往由财务部门自己进行,使得监督工作难以顺利进行。例如,财务监管工作有两部分构成,内部的监管工作受到了人事关系和不同职能的影响,监督职能被淡化在所难免,因此,外部监管的角色变得更加重要。外部监管中有财政和审计部门的共同参与,两者之间需要保持良好的联系,对于事业单位的财务管理需要加强沟通。

4)确定D的 C正域

由公式(3)可确定出D的C正域:POSC(D)={x1,x2,x4,x5,x6,x8,x9,x10,x11,x12,x14}

5)确定C中的D不可省的关系

首先,对条件 C 分别删除 C1、C2、C3、C4、C5,以分别确定 U/(C-{Ck})。其中,U/IND(C-{C5})= {{x1},{x2},{x3,x7,x13},{x4},{x5},{x6},{x8},{x9},{x10},{x11},{x12},{x14}}。

表 2 高层建筑结构信息决策表系统(约简后)

其次,确定D的(C-{Ck})正域,并根据定义 7确定C中D不可省的关系。其中,POS(C-{C5})(D)={x1,x2,x4,x5, x6, x8,x9,x10,x11, x12, x14},故{C5}在C中相对于D是不必要的。同样可确定出{C1}、{C2}和{C3}在C中相对于D是必要的,{C4}在C中相对于D是不必要的。

6)确定决策表C的相对D核CORED(C)

根据定义 8可知,C中所有D必要的知识组成的集合为决策表等价关系簇C的D核,则可确定出CORED(C)= {C1,C2,C3}。

4.3 确定条件属性的 D约简

删除相对核中任意一个元素都会改变和削弱决策表分类能力,为获取决策表的相对约简,CORED(C)= {C1,C2,C3}是绝对必要的,属性{C4}和{C5}是不必要的,但不一定可以同时省略,为了获取决策表的所有约简,可考虑以下属性组合:P1= {C1,C2,C3},P2= {C1,C2,C3,C4},P3={C1,C2,C3,C5},P4= {C1,C2,C3,C4,C5},其中,由前述 5)可知,P4是D依赖的而不是D独立的,故P5不是C的D约简。以下判断P1-P3的独立性,若独立即为C的D约简。

1)判断P1的D独立性与约简性

因P1中的每一个元素都是不可省的,根据定义7知 P1= {C1,C2,C3}是 D独立的。同时,因POSP1(D)= {x1,x2,x4,x5,x6,x8,x9,x10,x11,x12,x14}=POSC(D),因此,根据P1是D独立的及POSP1(D)=POSC(D)成立这两个条件,即可由定义 8判断P1={C1,C2,C3}是 C的D约简。

2)判断P2的D独立性与约简性

POSP2(D)= {x1,x2,x4,x5,x6,x8,x9,x10,x11,x12,x14}=POSC(D),判断P2= {C1,C2,C3,C4}在C中相对于D的独立性如下:

首先,计算(P2-{Ck})(k∈[1 4])的等价类,其中,U/IND(P2-{C4})= {{{x1},{x2},{x3,x7,x13},{x4},{x5},{x6},{x8},{x9},{x10},{x11},{x12},{x14}}},其它从略。

其次,由公式 (3)计算(P2-{Ck})(k∈ [1 4])的 D正域,判断{Ck})(k∈ [1 4])的必要性。

POS(P2-{C1})(D)= {x5,x10}≠ POSP2(D),故{C1}在P2中相对于D是不可省的或必要的。同理可确定{C2}和{C3}在P2中相对于D是必要的,{C4}在P2中相对于D是不必要的。显然根据定义 7判断P2是D不独立的。

接着,根据 P2是 D依赖的及 POSP1(D)=POSC(D)这两个条件,即可由定义8判断P2不是决策表中C的D约简。同理可推证P3也不是决策表中C的D约简。

最后,通过上述分析,确定的C的D约简为P1={C1,C2,C3}。一个决策表一旦获得约简,就可通过在约简属性集上的属性及其属性值来构筑决策规则。

4.4 决策规则的提取

1)确定约简后的决策表

将原决策表 1中非约简属性 {C4,C5}所在的列删除即可确定出表 2所示约简后决策表。其中,U= {xi}14,C= {C1,C2,C3}= {主楼高度,地上层数,功能 }。

2)确定条件与决策属性等价类Xi和 Yj

粗糙集用“if…then…”规则的形式表示决策表中蕴含的知识。其中条件与决策属性等价类Xi和Yj分别为:

条件与决策属性的等价类 U/P1= {Xi}12和U/D= {Yj}7确定后,即可由定义 10按 if D es(Xi)thenDes(Yj)的形式构建决策规则。

3)确定决策规则 rij的确定性因子

由定义 10确定的确定性因子公式 μ(XiYj)即可分别计算出规则 rij:if Des(Xi)then Des(Yj)的确定性因子,并可根据 rij值的大小来衡量哪条规则的确定性更大。

4)确定决策规则 rij

根据决策规则的定义即可确定 rij及其相应的μ(XiYj),以下给出了其中的部分规则。

r104:if(主楼高度为 [104,124)m)且 (地上层数为 29-38)且(功能为办公楼)then(结构方案可采用砼框筒结构);μ(X10Y4)=1/1=1。

r33:if(主楼高度为 [84,104)m)且 (地上层数为 29-38)且(功能为旅馆)then(结构方案可采用砼筒中筒结构);μ(X3Y3)=1/3=0.33。

5)决策规则的评价

确定性决策规则与不确定决策规则都是大量工程实例中隐含的知识,合理地利用这些知识来指导方案设计,是保证设计质量的关键。但得到大量的规则是否合适,还需要经过领域专家的评价。基于上述筛选后的规则,即可进行相关结构方案设计的决策。对不确定规则可作参考或直接删除,或再加入其他条件属性进行进一步完善,μ=0时不能得到决策规则。

4.5 基于粗糙集属性约简的结构方案设计

利用基于经典粗糙集的约简算法获取结构方案设计的泛化决策规则,依据决策规则即可进行高层结构的方案设计。

5 结论

系统地分析了经典粗糙集理论的不可分辨关系、知识的相对约简、决策表与决策规则等 10个基本概念,给出了约简算法分类,探讨了基于经典粗糙集约简方法的方案设计思想与过程,为全面了解粗糙集理论和方法特征,并利用其进行结构方案优化设计奠定了基础;同时,以高层工程实例为背景,通过连续属性离散化处理、确定决策属性的核、确定条件属性的约简、决策规则的提取及据此进行结构方案设计等途径,给出了基于经典粗糙集理论属性约简算法的结构智能方案设计过程与方法,为结构智能方案设计开拓了新途径。实践表明,与其它处理不确定性问题的理论方法相比,基于经典粗糙集约简的方法,能从给定工程实例的属性描述集合直接出发,找出问题的内在规律,而不需要提供数据集合之外的任何先验知识,故其对问题不确定性的处理是比较客观的,利用粗糙集进行方案设计问题的不确定信息处理,有着传统方法所不具有的优点,且与它们具有很强的互补性。

[1]张世海.高层建筑结构智能方案设计方法研究[R].哈尔滨工业大学博士后研究报告,2009.

[2]Pawlak Z.Rough sets.International Journal of Co mputer and Infor mation Science[J].1982,11(5):341-356.

[3]张文修,吴伟业.粗糙集理论与方法[M].科学出版社,2001.

[4]苗夺谦,李道国.粗糙集理论、算法与应用[M].清华大学出版社,2008:24-81.

[5]安利平.基于粗糙集理论的多属性决策分析[M].科学出版社,2008:16-24.

[6]张世海,刘晓燕等.基于决策树的高层结构智能选型知识发现[J].哈尔滨工业大学学报,2005,37(4):451-454.

[7]ShihaiZhang,Shujun L iu,Jinping Ou,GuangyuanWang.C4.5-basedClassificationRulesMining ofH igh-rise Building SFI O[A].The 4rd InternationalConference onNatural Co mputation(ICNC'08)and The 5th International Conference on Fuzzy Syste ms and Knowledge D iscovery(FSKD'08)[C].Publishend by the IEEE Computer Soc-i ety Press, Los A lamitos,California Washington Tokyo.FSKD'2008(4):467-472.

High-rise Structure of Intelligent Scheme Design Based on Classical Rough Set Reduction Method

Zhang Shizhong,DuanH uijie,Zhang Shihai

(Nanyang Institute of Technology,Nanyang473004,China)

F irstly,the basic concepts of the 10 reduction algorithm and the classification of classical rough set theory is introduced,the structure scheme design processbased on classicalmethod of rough set reduction isgiven;Secondly,according to high-rise structure example,the structural designm ethod is given based on classical rough set reduction algorithm,it develops a new approach and method for the structure intelligent design.Practice shows that comparing w ith the traditional methods to treat the inaccuracy proble m,it has the advantages the traditional method does not have to use rough set to solve the structural design proble m sw ith uncertain info rm ation processing.

H igh-rise Structure;Structural Scheme Smart Opt im ization Design;Rough Se;t Reduction

TU973+.1

A

1674-7461(2011)02-0021-05

国家自然科学基金项目(61040031)及河南省重点科技攻关项目(082102210066)

张世忠(1970-),女,硕士。主要从事建筑结构设计理论与方法研究。

猜你喜欢

决策表约简粗糙集
基于决策表相容度和属性重要度的连续属性离散化算法*
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
正反转电机缺相保护功能的实现及决策表分析测试
两个域上的覆盖变精度粗糙集模型
一种改进的分布约简与最大分布约简求法