基于CBR的燃气工程设计项目知识检索方法研究
2016-12-16朱凯敏
朱凯敏 李 静
(1.中国市政工程西南设计研究总院有限公司,四川 成都 610081; 2.深圳市燃气集团股份有限公司,广东 深圳 518000)
基于CBR的燃气工程设计项目知识检索方法研究
朱凯敏1李 静2
(1.中国市政工程西南设计研究总院有限公司,四川 成都 610081; 2.深圳市燃气集团股份有限公司,广东 深圳 518000)
从燃气工程设计项目基于CBR的事例的表示、相似事例的检索两个环节,构建了项目知识检索的方法,探讨了采用AHP确定事例特征属性权值的技巧,使知识的检索更加科学有效。
项目知识检索,CBR系统,层次分析法,判断矩阵
进入知识经济时代,继劳动力、资本、土地之后,知识成为重要的生产要素。人类社会近三十年创造的知识已超过之前所创造的知识的总和[1],企业实施知识管理的重要性日渐凸显。对于知识密集型和人才密集型的工程勘察设计企业而言,知识更是企业的立足之本与核心竞争力所在。勘察设计企业最重要的工作成果是设计图纸和报告,其数量随业务的发展呈几何级增长。如何从数据海洋中检索到有效知识,是知识需求者参与知识共享的关键。
基于事例推理(Case-Based Reasoning,CBR)指的是利用旧的事例或经验来解决问题,评价方案,解释异常情况或理解新情况,是人工智能发展过程中涌现的一种推理模式。本文通过对燃气工程设计领域基于CBR的事例的表示、相似事例的检索两个环节的研究探索项目知识检索的路径。
1 项目事例的表示
事例的表示是CBR系统的基础,事例必须表示成一定的结构形式才能被检索。CBR事例的表示可简化为(问题的描述和结果的描述)两部分。问题的描述指事例发生时周围的环境状态和问题的具体内容,即事例的特征属性。CBR系统通常采用事例特征属性匹配方法,将事例问题的描述,表示为一系列事例特征属性的组合,通过事例特征属性之间的匹配关系来确定各特征属性的相似度,并经加权后计算综合相似性来检索事例。结果的描述是指描述问题求解的效果或者结论信息,具体指CBR匹配出的项目及其相关项目文件。
燃气工程事例特征属性通常由领域专家抽取,表1给出笔者推荐的特征属性。
表1 燃气工程设计项目事例特征属性
2 项目事例的检索
2.1 检索方法
项目事例的检索算法有最近邻法、归纳法、知识引导法、基于数据库技术的检索法等[2],其中最经典的最近邻法逐项计算目标事例与事例库中源事例的特征属性的相似度,然后依据预先确定的特征属性权值确定目标事例与源事例的综合相似度,并返回综合相似度超过阈值的源事例。最近邻法需要解决三个问题:事例综合相似度的度量;事例特征属性的相似度度量;科学确定事例特征属性的权重。
2.2 事例综合相似度的度量
最近邻法计算综合相似度有欧式距离(Euclidean)、海明距离(Hamming)、Kolodner距离等公式[3],本文采用Kolodner距离公式:
(1)
表2~表6给出了燃气工程设计项目的项目类型、气源类型、压力级制、项目阶段、项目区域五个字符型特征属性的推荐相似度矩阵。
表2 项目类型特征属性相似度取值表
表3 气源类型特征属性相似度取值表
(2)
其中,Maxfi和Minfi分别为事例库中第i个特征属性取值的上限和下限。
表4 压力级制特征属性相似度取值表
表5 项目阶段特征属性相似度取值表
表6 项目区域特征属性相似度取值表
2.4 事例特征属性权值ωi的确定
事例特征属性的权重可通过专家评价法、层次分析法、概率分析法等方法确定,其中第一种方式通常由领域专家给出或由用户自定义,带有明显的主观局限性,后两种方法较为科学和客观,本文采用层次分析法。
层次分析法(Analytic Hierarchy Process,简称AHP)是国外20世纪70年代提出的适用于结构较为复杂、决策准则较多而且难以量化的决策问题的一种系统分析方法。AHP在深入分析复杂决策问题的本质、影响因子及其内在关系的基础上,将影响决策的因素分解为目标层、准则层、方案层等若干层次,利用较少的定量信息实现决策的分析过程数学化,适用于解决无结构特性或多准则、多目标的复杂决策问题。关于AHP的关键技术,读者可查阅相关文献[4]。
1)建立层次结构模型。AHP方法确定事例特征属性权值的目标层是从事例库中检索与目标事例相似的源事例;准则层为各事例特征属性;方案层为事例库的各源事例。由于AHP方法仅用于确定事例特征属性的权值,因此本文仅关注目标层和准则层。建立的层次结构模型如图1所示。
2)建立判断矩阵。针对准则层上的因素C1,…,Cn,相关的目标层的因素是Ak,则可针对因素Ak,对所有的元素C1,…,Cn按表7的含义进行两两比较,得到数值cij。记矩阵Ak=(cij)n×n为因素C1,…,Cn相对于上一层因素Ak的判断矩阵,显然,cii=1,cij=1/cji(i,j=1,2,…,n)。
表7 cij含义表
在分析对比燃气工程设计项目的七个特征属性的基础上,对各特征属性的重要性进行两两比较,得到判断矩阵Ak=(cij)7×7,如表8所示。
表8 判断矩阵Ak
3)层次单排序。分析决策问题并建立相似事例匹配层次结构模型后,转入层次中权值计算的问题,即层次单排序和层次总排序。单排序是指依据判断矩阵计算与上一层次某因素有联系的本层次因素对前者而言重要性次序的权重的过程;总排序是确定某层所有因素对于总目标而言重要性次序的权重过程,此计算过程是从最高层到最低层依次进行的。由于本文模型只关注目标层和准则层,因此其层次单排序的结果也就是层次总排序的结果,通过层次单排序即可得出表征燃气工程设计项目七个特征属性重要性次序的权值。
根据判断矩阵计算对于目标层Ak而言准则层C1,…,Cn的权重,其计算可转化为求解判断矩阵的特征向量与最大特征根的过程。对任意判断矩阵Ak,若有Akω=λmaxω,称λmax为Ak的最大特征根,ω=(ω1,…,ωn)T为Ak的特征向量,ω1,…,ωn即为因素C1,…,Cn对于目标层Ak按重要程度的一个排序,即权重。
特征向量与最大特征根可以通过线性代数的方法进行求解,也可采用和积法或方根法[5]等近似方法计算。经计算判断矩阵的最大特征根λmax=7.529,判断矩阵的特征向量ω=(0.375,0.132,0.106,0.024,0.076,0.245,0.042)T,换言之,燃气工程设计项目的七个特征属性的权值分别为0.375,0.132,0.106,0.024,0.076,0.245和0.042。
4)一致性检验。为避免在构造判断矩阵时出现判断上的不一致性,需要利用一致性指标按下述步骤进行检验,作为度量判断矩阵偏离一致性的程度。
a.计算一致性指标CI(Consistency Index):
(3)
b.查找相应同阶平均随机一致性指标RI,表9给出了1阶~16阶的平均随机一致性指标RI。
c.计算一致性比例CR(Consistency Ratio):
CR=CI/RI
(4)
当CR≤0.1时,认为判断矩阵的一致性令人满意,否则需要调整判断矩阵。
由式(3),式(4)分别计算出CI=0.088,CR=0.067。由于CR<0.1,判定判断矩阵的一致性是令人满意的,由此判断本文建立的数学模型是合理的。
表9 平均随机一致性指标RI[6]
3 结语
本文通过对基于CBR系统的项目事例的表示、相似事例的检索两个关键环节的研究为企业构建知识检索的路径,实现从事例库中检索出与目标事例相似的源事例。在相似事例度量环节,采用Kolodner距离公式计算目标事例与源事例的综合相似度,并采用AHP确定事例特征属性的权重值,使取值更客观和科学。
[1] 赵燕茹.科技进步与经济发展[J].黑龙江社会科学,1998(2):16-17.
[2] 李晓辉,刘妍秀.基于实例推理机制(CBR)综述[J].长春大学学报,2006,16(4):68-70.
[3] 吴 锋.基于AHP和CBR技术的注射模智能报价方法研究[D].杭州:浙江大学,2008.
[4] 胡运权,郭耀煌.运筹学教程[M].第3版.北京:清华大学出版社,2007:422-433.
[5] 陈 珽.决策分析[M].北京:科学出版社,1987:179-183.
[6] 焦树锋.AHP法中平均随机一致性指标的算法及MATLAB实现[J].太原师范大学学报(自然科学版),2006,5(4):45-47.
Knowledge retrieval method of gas engineering design projects based on CBR
Zhu Kaimin1Li Jing2
(1.Southwest Municipal Engineering Design and Research Institute of China, Chengdu 610081, China;2.ShenzhenGasGroupCo.,Ltd,Shenzhen518000,China)
Projects knowledge retrieval method is introduced in the aspects of cases representation and similar cases retrieval of gas engineering design projects based on CBR, and AHP is used to determine weights of cases feature attributes, to ensure the knowledge retrieval to be more scientific and effective.
project knowledge retrieval, CBR, AHP, judgment matrix
1009-6825(2016)30-0238-03
2016-08-17
朱凯敏(1986- ),男,工程师,注册公用设备工程师(动力),IPMP(Level C); 李 静(1987- ),女,工程师
G257.36
A