APP下载

决策区间概念格的粗糙控制规则挖掘模型与应用

2016-12-19孙爱玲张春英王立亚王志江

关键词:粗糙度区间背景

孙爱玲,张春英,王立亚,王志江

(华北理工大学 理学院, 河北 唐山 063009)



决策区间概念格的粗糙控制规则挖掘模型与应用

孙爱玲,张春英,王立亚,王志江

(华北理工大学 理学院, 河北 唐山 063009)

粗糙控制;决策区间概念格;属性离散化;决策规则挖掘

融合区间概念格的结构特征和粗糙控制规则的实际需求,将一般区间概念格改造为决策区间概念格,并构建基于决策区间概念格的粗糙控制规则挖掘模型,以实现粗糙控制中挖掘成本和控制效率的整体最优。首先,运用粗糙集理论对粗糙控制数据进行预处理,使其转化成布尔型的形式背景表,并构建符合粗糙控制实际的决策区间概念格;其次,构建了决策区间概念格的控制规则挖掘模型,并对冗余规则进行分析判断,形成最终的粗糙控制决策规则库。分析结果表明:模型在提高规则可靠性的前提下,实现了粗糙控制成本与效率的最优化目标;最后,将模型应用到水库调度的决策规则挖掘中,验证了模型的可行性与高效性。

0 引言

粗糙控制是应用粗糙集方法从控制行为的数据中获取控制规则,然后利用这些规则设计智能控制器从而实现对系统实施控制的过程,是一种新型的智能规则控制方法[1]。规则决定了控制者对控制行为做出的决策,因此,规则提取是智能控制中至关重要的环节,规则的精度直接影响着控制的效率和准确度。

本文将决策区间概念格应用到粗糙控制规则的挖掘过程中,以期实现规则挖掘成本、应用效率与可靠性的整体最优。首先,通过粗糙集的理论对数据进行离散化、归一、合并等处理,将原始的数据转化为布尔型的形式背景表,构建与粗糙控制实际背景相匹配的决策区间概念格;将决策区间概念格的控制规则挖掘算法应用到粗糙控制中,建立了基于决策区间概念格的粗糙控制模型,通过分析表明,模型实现了规则挖掘成本与效率的最优化目标,并通过实例验证了该模型设计的合理性。

1 决策区间概念格

1.1 基本概念

定义1 对于决策形式背景(U,C×D,R),RL(U,C×D,R)是其诱导的决策区间概念格,(M,N,Y)是RL(U,C×D,R)上的决策区间概念。设有区间[α,β](0αβ1)则α上界外延Mα、β下界外延Mβ分别为:Mα={x|x∈M,|f(x)∩Y/|Y|≥α,0α1}Mβ={x|x∈M,|f(x)∩Y/|Y|≥β,0αβ1}式中,C是条件属性集,D是决策属性集,Y是概念的内涵,其中Y=C′∪D′,C′⊆C,D′⊆D,若Y≠φ则D′≠φ,称C′为C的子条件属性集,D′为D的子决策属性集,f(x)是定义的算子,是集合Y中包含元素个数,即基数。Mα表示可能被Y中至少α×|Y|个内涵属性所覆盖的对象,Mβ表示可能被Y中至少β×|Y|个内涵属性所覆盖的对象。

定义 2 设形式背景(U,C×D,R),三元序偶(Mα,Mβ,Y)称为决策区间概念,其中,Y为内涵,由条件内涵和决策内涵两部分构成,是决策概念的描述;Mα为α上界外延;Mβ为β下界外延。

G1G2⟺C1⊇C2,如果不存在,使得G1G3G2,则G2是G1的父结点(直接前驱),G1是G2的子结点(直接后继)。

1.2 决策区间规则

1.3 决策区间概念格的构建

算法:决策区间概念格建格算法。

输入:决策形式背景(U,C×D,R)。

步骤:

(1)设定α、β,确定决策区间概念内涵,生成初始化的概念节点集G。

(2)确定α上界外延集Mα和β下界外延集Mβ。

(3)形成格结构。对节点集合G,按照前驱后继关系确定结点的层次及父子关系,根据父子节点的独特性质自下而上渐进式地生成决策区间概念格结构。

1.4 决策区间规则挖掘算法

在已设定的α、β参数值的前提下,对上述构建的决策区间概念格进行控制规则的挖掘,通过对参数值的调整,规则库不断更新优化,提取的规则更具高效性,从而为决策者提供更优的决策。具体描述如下:

算法:区间规则挖掘算法。

输出:决策区间规则。

(3)对规则集Diset的每一条规则,分别求其粗糙度和属性贡献度,根据粗糙度和属性贡献度的大小,判断精确性和可靠性,提取更优的规则,即去除冗余规则,得到最终的控制决策规则集Disset。

2 粗糙控制决策区间规则挖掘

2.1 模型设计

采用规则库中的最简决策规则来实现粗糙控制,实际上是在规则库中查询具有相同或者相似条件属性的决策规则,将其用于粗糙控制。运用决策区间概念格挖掘粗糙控制决策可得到一组决策区间规则,其挖掘模型如图1所示。

图1 决策规则获取流程

基于决策区间概念格的粗糙控制规则挖掘模型的最突出优点是在保证规则可靠性的同时,使规则库的规模与挖掘成本之间达到整体最优,其最优性取决于对区间参数的设置,区间参数决定了所构造的决策区间概念格的结构,进而影响着区间关联规则的数量和精确度。采用决策区间概念格的决策规则获取方法,实现了挖掘成本与效率的最优化。具体步骤如下:

第1步,原始数据采集与预处理,得到决策表。

(1)根据实际的粗糙控制背景,将观测量和控制量分别作为条件属性和决策属性。记录下调度人员对代表性状态采取的控制策略,形成原始决策表;

(2)工业控制中的数据在大部分情况下都是连续取值的,采用决策区间概念格进行控制规则挖掘时,必须将连续变量离散化。借助工业过程的背景知识进行离散化,并用数字标记各离散区间 ;

(3) 利用粗糙集理论的方法对数据进行约简、合并等处理,得到处理后的原始决策表。

第2步,构建布尔型的决策形式背景表。

(1)由上一步得到的初始决策表中各属性的出现情况,标记属性并构建属性集合,其中集合元素的下标为标记数字,例如把某一属性标记为A,表中出现的标记数字为2、3、4,则该属性集合为A={a2,a3,a4};

(2)由得到的相应属性集合,构建布尔型的决策形式背景表。

第3步,设定α、β,运用2.3的算法构建与实际粗糙控制背景相匹配的决策区间概念格。

第4步,运用2.4中的算法提取粗糙控制决策区间规则。

第5步,计算规则的粗糙度与属性贡献度,结合粗糙度与属性贡献度以及粗糙控制的实际成本去除冗余规则,以得到应用效率与可靠性整体最优的粗糙控制规则库。

在决策区间概念格构建的过程中,内涵由条件属性和决策属性共同构成,因此,提取出的规则意味着对于不同的规则采取相同的措施,都能达到预期的效果。也就是说,在能接受的范围内,对于同样的控制操作有了多重选择,提高了控制的高效性。将其应用于粗糙控制,可以根据具体的条件属性实现所需的成本来权衡各规则,最终获取最优控制规则。

2.2 模型分析

决策区间概念格外延是具备一定数量或比例的内涵中属性的对象集合,由此挖掘出的规则更具针对性,在规则提取后去除了冗余,提高了规则的可靠性和控制的高效性。传统的粗糙控制规则提取过程中,决策信息表的建立、连续量的离散化、决策表的完备化、决策规则的去离散化、决策规则的一致性等一系列问题的解决,时间复杂度较之更大,挖掘成本高。该模型在保证规则可靠性的前提下,提高了粗糙控制规则的挖掘精度和控制效率,达到了规则挖掘成本、应用效率与可靠性的整体最优。

3 应用实例

水库是一个复杂的系统,根据水库运行特点进行水库调度,使现有工程发挥最大效益,越来越受到重视。在本实例中,甲水电站是个以发电为主的前提下,发电与防洪同时并举的大型水电站,甲水电站上游的乙水电站对甲水电站的调度起到很大影响,对水库调度的决策规则进行挖掘,具体步骤如下:

(1)原始数据采集与预处理。

分析甲水电站的具体情况,将影响电站调度的主要因素所选取的观测量形成条件属性集,控制变量组成决策属性集。

取乙水电站放流量,甲、乙区间的自然径流状态组成条件属性集,一个控制变量水电站日平均发电量组成决策属性集,对其中的连续属性值进行离散化处理,具体过程如下:

条件属性:a-乙水电站放流量,b-区间自然径流状态,决策属性:d-水电站日平均发电量。

a—离散化的乙水电站放流量属性集表示范围(m3/s)

b—离散化的区间自然径流状态属性集表示范围

1-枯; 2-中; 3-丰;

d—离散化的水电站日平均发电量属性集表示范围(kWh/d)

对调度人员从1~6月份采取的调度措施进行记录并构成原始数据表,合并相同的决策,得到如表1所示的原始数据表。

表1 原始数据表

(2)构建水库调度的决策形式背景表。根据表1所示的数据进行属性的标记并构建属性集合,得到A={a2,a3,a4},B={b1,b2,b3},D={d2,d3,d4},其中属性下标表示表1中相应的属性编号。最终,得到决策形式背景表,如表2所示。

表2 决策形式背景表

(3)构造水库调度背景下的决策区间概念格。对表2所示的决策形式背景,设α=0.4,β=0.8,确定由条件属性和决策属性两部分组成的概念内涵,α上界外延Mα和β下界外延Mβ,根据定义得出如表3所示的决策区间概念。由文献[9]的构造算法得到如图2所示的决策区间概念格。

表3 决策区间概念

图2 水库调度的决策区间概念格

(4)根据决策区间概念格的决策规则挖掘算法提取水库调度的控制规则。

在设定α=0.4,β=0.8前提下,广度遍历决策区间概念格中所有的概念结点,由于决策概念结点的条件属性基数满足αβ,因此得到决策概念结点集合

Dcset={F3,F4,F5,F6,F11,F12,F14,F17,F18,F19,F21,F22,F25,F28,F30},根据集合中的每一个结点内涵生成相应的规则后,分别计算其粗糙度与属性贡献度,Diset中所有关联规则的粗糙度和属性贡献度如表4所示。

表4 决策区间规则

(5)水库调度的规则库构建与优化

根据粗糙度与属性贡献度,进行冗余规则的去除,例如,规则a2⟹d3与a3⟹d3相比,在属性贡献度相同的前提下,由于前者规则粗糙度比后者低,规则相对更精确,因此,后者可认为是冗余,由此操作,最终可得到规则集Disset。从粗糙控制实际意义下的成本考虑,进行二次冗余规则的去除,最终获取的规则组成的集合即为所要得到的粗糙控制规则库。在二次去除冗余规则时,例如,规则a2⟹d2与a3⟹d2,在粗糙度与属性贡献度都相同的前提下,条件属性a3跟a2相比,达到要求所需的成本相对较高,因此,后者规则被认为是冗余规则。经过二次冗余规则的去除,最终得到的规则组成的集合即为所要求的规则库。粗糙控制规则库为{a2⟹d2,b1⟹d2,a2b1⟹d2,a3b1⟹d2,a1⟹d3,b2⟹d3,a1b3⟹d3,a2b3⟹d3,a3b2⟹d3}随着参数的不断调整,规则库也在不断地发生变化,获取的规则精度更高,效率更大,实现了挖掘成本与效率的整体最优。

在水库调度实例中,对于提取出的规则,采取相同的决策,都可以达到同等的效果。因此,在粗糙控制实际应用中,可以根据各条件属性中成本需求、能源消耗等相关因素权衡各规则,从而获取最优控制规则。

4 结论

(1)本文提出了基于决策区间概念格理论的粗糙控制规则挖掘模型。从初始的数据预处理到以粗糙控制为背景的决策区间概念格的构造,再到决策控制规则的提取,对模型进行了详细的设计。模型分析总结了该模型的两大主要部分,构建概念格与规则挖掘,与传统的粗糙控制方法相比,突出了模型建立的可靠性与高效性,并通过实例进一步验证了模型的可行性。

(2)由于决策区间概念的外延是由区间参数α和β所决定的,区间参数的变化会影响区间概念和区间概念格结构,进而会对决策区间规则的数量和精确度产生影响。因此,如何通过参数优化来获得最优决策规则是后续要研究工作的重要内容。

[1]潘爱先,高赟.粗糙控制中面临的问题[J].中国海洋大学学报,2009,39(6):1315-1320.

[2]董威,王建辉,顾树生.基于可变精度粗糙集理论的规则获取算法[J].控制工程,2007,14(1):73-75.

[3]官礼和,王国胤,胡峰.一种基于属性序的决策规则挖掘算法[J].控制与决策,2012,27(2):313-316.

[4]黄加增.基于粗糙概念格的属性约简及规则获取[J].软件,2011,32(10):16-23.

[5]Liu Baoxiang,Hao Shasha. Optimal design of weigh for networks based on rough sets[C]. Lecture Note in Computer Science,2011,7030:521-528.

[6]James F.Peters, Andrzej Skowron, Zbigniew Suraj. An Application of Rough Set Methods in Control Design[J].Fundamenta Informaticae,2011,43(1): 269-290.

[7]Wang Haifang,Rong Yu,Wang Tao.Rough control for hot rolled laminar cooling[C].International Conference on Industrial Mechatronics and Automation,2010.

[8]刘保相,张春英. 一种新的概念格结构——区间概念格[J].计算机科学2012,39(8):273-277.

[9]张春英,王立亚. 基于属性集合幂集的区间概念格 的渐进式生成算法[J]. 计算机应用研究,2014,31(3):731-734.

Rough Control Rule Mining Model Based on Decision Interval Concept Lattice and Its Application

SUN Ai-ling, ZHANG Chun-ying, WANG Li-ya, WANG Zhi-jiang

(College of Science, North China University of Science and Technology, Tangshan Hebei 063009,China)

rough control; decision interval concept lattice; attribute discretization; decision rule mining

Fusing the structure feature of interval concept lattice and the actual needs of the rough control rules, the general interval concept lattice is transformed into decision interval concept lattice, and building a rules mining model of rough control based on decision interval concept lattice, in order to achieve the optimal overall in rough control mining cost and control efficiency. Firstly, The model preprocess the collected original data , which is transformed into the Boolean formal context form, and construct the decision interval concept lattice in rough control; secondly, establishing the control rules of decision interval concept lattice algorithm, and analyzing and judging the redundant rules, form a rough control association rule base in end. Analysis shows that under the premise of improving the reliability of the rules, the model has achieved the rough control optimization goal of its cost and efficiency. Finally, the model is applied to the reservoir scheduling of decision rules mining, verifying its feasibility and efficiency.

2095-2716(2016)01-0053-07

2015-10-27

2015-12-15

国家自然科学基金项目:(61370168,61472340)。

TP273+.4

A

猜你喜欢

粗糙度区间背景
青藏高原高寒草甸的空气动力学粗糙度特征
你学会“区间测速”了吗
“新四化”背景下汽车NVH的发展趋势
《论持久战》的写作背景
黑洞背景知识
全球经济将继续处于低速增长区间
冷冲模磨削表面粗糙度的加工试验与应用
高速铣削TB6钛合金切削力和表面粗糙度预测模型
基于BP神经网络的面齿轮齿面粗糙度研究
区间对象族的可镇定性分析