基于属性约简的混凝土抗冻性挖掘方法
2012-07-16张仕学
张仕学
( 毕节学院 数学与计算机科学学院,贵州 毕节 551700 )
粗糙集理论是一种比较新的数学工具,能处理不确定、不完整、不精确和不一致的信息,从中发现隐含知识,揭示潜在规律。属性约简则是在保持信息库分类能力不变的条件下,删除其中不相关或不重要的知识。张仕学[1]、郑滨[2]研究了属性约简算法及应用。
混凝土具有能抵御化学侵蚀、磨损、气候变化或任何其它破坏过程的能力,即当混凝土在暴露的环境中,能耐久保持其形态质量和使用功能,这称为混凝土的耐久性。其中,抗冻性是混凝土的耐久性的一个重要方面。混凝土的抗冻性是指混凝土试件成型后经过标准养护或同条件养护后,在规定的冻融条件下保持强度和外观完整性的能力。因此,研究混凝土的抗冻性对提高混凝土的耐久性有着积极的作用[3][4][5]。
1.粗糙集的基本概念
根据粗糙集关于信息处理的理论,给出如下定义。
定义 1 设S=(U,A)是一个信息系统,其中U={u1,u2,…,un}是有限非空集,称为论域,U中的元素称为属性;对于每个a∈A,有一个映射a:U→a(U),且a(U)={a(u)|u∈U}称为属性a的值域。如果A=C∪D,C∩D=Ø,则称信息系统(U,A)为一个决策表,其中C中的属性称为条件属性,D中的属性称为决策属性。
定义2 设S=(U,A,V,f)为一个信息系统,|U|=n,则S的区分矩阵M是一个n×n矩阵,其任一元素a(x,y)={a∈A|f(x,a)≠f(y,a)},即矩阵元素a(x,y)是区别对象x和y的所有属性的集合。
2.混凝土抗冻性的条件属性粗糙离散化
影响混凝土抗冻性的主要因素有外加济、含气量、骨料、水灰比和坍落度等。本文利用连续属性粗糙离散化、属性约简、属性值约简算法以及其改进算法,对混凝土的抗冻性进行决策挖掘和分析。表1是某工程质量检测机构对某个混凝土工程中的 16个检测点中关于混凝土抗冻性的检测结果。其中,条件属性集为 C={c1,c2,c3,c4,c5},c1到c5依次为外加济、含气量、骨料、水灰比和坍落度,它们分别反映了混凝土五方面的物理性质的检验结果;最后一个属性d是决策属性,值为1表示抗冻,0表示不抗冻。
利用动态聚类的离散化算法[6]对决策表1进行离散化(其中α取0.0001,β取0.2),得到粗糙离散化后的决策表,见表2。对混凝土抗冻决策表离散化结果(表2)进行初步约简,可得混凝土抗冻性决策表离散化并约简的结果,见表3,其中c3是冗余属性,被去掉了。
表1 混凝土抗冻性决策表
表2 混凝土抗冻性决策表自动聚类离散化结果表
表3 混凝土抗冻性决策表离散化并约简的结果表
3.混凝土抗冻性离散化结果的属性约简
属性约简是整个数据挖掘中的重要环节,现在用属性约简算法[7]对属性决策表 1的离散化结果表3进行属性约简。设决策表的区分矩阵为M,如图1所示。
相对D核是区分矩阵中所有单个元素组成的集合,即,
对于区分矩阵M中的所有取值为非空的集合元素cij,建立相应的析取逻辑表达式Lij如下:
合取范式L=L1.9∧L1.10∧…∧L8.16。
将L转换为析取范式得:c1∨c2∨c4∨c5。
因此,决策表的相对约简为REDC(D)= {c1,c2,c4,c5}。
图1 决策表的区分矩阵M
4.混凝土抗冻性规则挖掘
属性约简只是在一定程度上去掉了决策信息系统中的冗余信息。为了得到更精确的决策规则,还需要进一步对经过属性约简后的决策表进行属性值约简。
根据以上的属性约简结果REDC(D)={c1,c2,c4,c5},由于重复行之间存在冗余,因此重复行的数据可以去掉。去掉重复行后得到如表 4所示的混凝土抗冻性属性约简结果。
表4 混凝土抗冻性属性约简结果表
采用分辨矩阵的属性值约简算法:
第1步 首先根据表4构造分辨矩阵M如下:
第2步 由分辨矩阵M可得表4的属性约简为{c1,c4,c5},因此,又可以去掉属性 c2,可求得如下分辨矩阵M*:
第3步 根据分辨矩阵M*可算出属性值约简结果,如表5所示。
第4步 对表5再一次去掉其重复行,即得最终的属性值约简结果,如表6所示。
表6中的记录即是混凝土抗冻性决策表经过本文所介绍的基于粗糙集理论的数据挖掘方法所挖掘出来的决策规则。
由表1(混凝土抗冻性决策表)经过连续属性离散化、属性约简和属性值约简后得如表 6所示的挖掘结果。直观即可看出,表1中的属性c2(含气量)与c3(骨料)在挖掘过程中被去掉了,说明这两个属性对于混凝土的抗冻性影响不大,是冗余的。而属性c1(外加济)、c4(水灰比)和c5(坍落度)则是影响混凝土抗冻性的主要因素。这与实际检测的结果基本相符,说明本文所讨论的基于属性约简的混凝土抗冻性挖掘方法在混凝土的抗冻性挖掘中有一定的应用价值。
[1] 张仕学,丁晓明.基于粗糙集理论的软件项目质量管理研究[J].西南大学学报(自然科学版),2011,33(3):118-120.
[2] 郑滨,金永兴.基于属性约简的海事人为失误致因分析[J].上海海事大学学报,2010,31(1):91-94.
[3] 刘成玉.影响混凝土抗冻性的主要因素及改善措施[J].珠江现代建设,2009,4(2):13-16.
[4] 庞军,孟祥礼,王明辉.浅谈提高混凝土抗冻性的重要性[J].吉林交通科技,2008,(2):15-16.
[5] 温宝山,王兴庭,周明学.水工混凝土抗冻性能影响因素研究[J].东北水利水电,2010,(1):56-58.
[6] 苗夺谦,李道国.粗糙集理论、算法与应用[M].北京:清华大学出版社,2008:220-221,226-227.
[7] 张文修,吴伟志,梁吉业,李德玉.粗糙集理论与方法[M].北京:科学出版社,2001:12-16.