APP下载

支持生物激励设计的跨领域知识元聚类方法

2017-06-28彭颖红

河北科技大学学报 2017年3期
关键词:语义检索聚类

沈 健,胡 洁,马 进,彭颖红

(上海交通大学机械与动力工程学院,上海 200240)

支持生物激励设计的跨领域知识元聚类方法

沈 健,胡 洁,马 进,彭颖红

(上海交通大学机械与动力工程学院,上海 200240)

为了解决现有生物激励设计过程存在的跨领域知识获取难的问题,提出了面向生物激励设计的基于功能特征语义相关性的功能语义聚类和基于环境特征约束适应性的环境约束聚类组成的两阶段知识元聚类算法。将生物激励设计过程跨领域实例知识检索问题转化为对离散的生物领域或工程领域知识元的聚类检索。根据跨领域术语知识表示的不同确定跨领域检索功能词,执行基于功能特征语义相关性的功能语义的一阶段聚类,结合生物领域功能与环境特征约束间的相关性,完成基于不同类型环境特征约束的二阶段聚类。一方面,将模糊理论与模糊数学引入知识元聚类算法中,提出基于模糊隶属度函数的语义相似度计算方法,实现了基于功能关键字的语义聚类;另一方面,将FCM聚类算法引入到知识元聚类过程中,结合给出的不同类型环境特征约束相似性算法,提出了AFCM算法,实现了基于环境特征约束适应性的环境约束聚类。最后,开发了相应的原型系统,并且以视觉假体装置设计为例进行测试。结果表明,聚类时间和准确率得到极大改善,聚类效率得到显著提升。该算法有效地避免了跨领域知识分布的离散性,减少了设计过程中研究对象的数量,能够合理地获取已有设计知识,为深入研究奠定了基础。

知识工程;生物激励设计;知识元;知识聚类;知识获取

生物激励设计是知识驱动系统化的设计方法,旨在通过对自然现象或生物系统的研究和模仿,建立系统化的跨领域知识类推方法,为工程领域的问题求解和技术创新提供灵感和启发。根据设计过程中知识流动方向的不同,现有的生物激励设计方法包括解驱动生物激励设计和问题驱动生物激励设计。解驱动创新设计利用生物领域已知的原理性知识,通过构建功能模型并以此为桥梁对工程领域进行知识建模、知识检索、知识融合和类推重用,从而获得满意的工程领域物理解方案。问题驱动创新设计从给定工程领域设计问题出发,经由设计问题分析、功能模型构建、设计功能与生物领域原理解的功能映射构建,并将生物领域解方案移植到工程领域,获得一组满足产品功能需求的原理解[1]。

生物领域激励源的获取是生物激励设计的先决条件,作为生物激励设计的前提,其对后续的设计活动及设计质量有着决定性的影响。生物领域实例获取旨在从工程领域问题描述出发,从生物领域寻求与工程问题相对应的类比实例,为工程领域的问题求解提供设计灵感。

目前系统化的生物领域实例获取方法主要分为基于专家咨询的方法和基于结构化知识库的方法。基于专家咨询的实例获取通过咨询领域专家,利用其专业知识、相关经验获取相关的生物实例并对其进行判断分析的一种方法。WANG等[2]分析了章鱼皮肤颜色改变的机理,即通过收缩和扩张肌肉使不同数量光通过以改变皮肤颜色快速伪装成环境颜色的状态模型,利用电场控制一种聚合物内的张力在工程领域实现了对这一功能的模拟,开辟了柔性显示器研究的新方向。德国FESTO公司[3]对仿生学设计进行了深入研究,模拟生物形态及功能激励,研发了仿生企鹅、仿生海鸥、仿生大象鼻子和可奔跑的袋鼠机器人等。虽然专家咨询方法在生物领域实例获取中得到了大量的应用,然而该类方法过于依赖专家的个人经验及其偶发的对自然现象的研究和模仿,随机性和盲目性较大,专家数量较少的情况下难以系统化的推广应用。ZHANG等[4]基于SBF模型构建了生物领域知识本体,并基于该本体模型开发了DANE原型系统,建立了生物领域实例本体关联模型。TINSLEY等[5]采用基于功能的生物知识建模构建生物功能知识库,实现了将自然中功能原理转化为工程系统的过程。仿生实验室(Biomimicry Institute)搜集整理了仿生设计相关的学术文献,开发了基于网络的AskNature[6],搭建了基于功能索引的生物知识库框架,通过世界各地仿生爱好者对其知识库进行不断丰富和充实,该网站已拥有数以万条的生物领域实例知识。为了解决以上方法检索效率低的问题,CHAKRABARTI等[7]结合SAPphIRE模型提出内部聚类和外部聚类相结合的算法。HABERLAND等[8]提出基于约束框架的聚类检索方式。GOEL等[9]提出基于解驱动模型关键字的聚类算法。然而以上知识获取方法返回的非结构化实例知识模型描述性不强、应用较难,且对跨领域知识检索研究不足。

为了解决以上生物激励设计激励源获取过程存在的问题,基于上海交通大学胡洁教授等提出的功能知识元建模方法[10],本文将生物激励设计过程跨领域实例知识检索问题转化为对离散的生物领域或工程领域知识元的聚类检索。根据跨领域术语知识表示的不同确定跨领域检索功能词,执行基于功能特征语义相关性的功能语义的一阶段聚类,结合生物领域功能与环境特征约束间的相关性完成基于不同类型环境特征约束的二阶段聚类。

1 检索功能词选定

在跨领域知识表示中往往采用不同的专业术语来表示同一功能或者同一术语在不同领域具有不同的含义。例如:生物领域术语“Bear(生育)”和工程领域术语“Manufacture(制造)”具有相同的功能,都可以用来表示产生新事物功能。 术语“Seal”在工程领域含义为元件的“密封”功能(Prevent leakage),而在生物领域其指代哺乳动物“海豹”(Animal)。生物领域知识元聚类目的在于将具有相似功能和环境特征的知识元聚为一类,知识重用过程能够实现根据设计需求获取隶属度最大的类簇,并以此作为研究对象来激励工程领域解方案的生成。但是自然语言对生物领域知识表示以及跨领域知识聚类的特点导致难以在聚类检索初期确定检索关键词,功能词选定过程如图1所示。

图1 生物领域功能词选定及相关知识元聚类簇获取过程Fig.1 Retrieval process of the related biological CFBS knowledge cell cluster

第1步,给定生物领域初始功能动词来描述设计需求并进行检索。

分析设计需求,选定一个与设计需求功能最相关的功能动词来表示设计需求所抽取的功能,对知识元库进行检索,获取相关知识元。若无检索结果返回,则从标准动词表中选用该功能动词的同义词扩大检索范围重复检索过程,直到有检索结果返回。对检索获取的相关知识元进行标注,总结与该动词共同出现的高频名词集合,并按照出现频率进行排序。

第2步,根据检索结果对初始功能动词进行校正,并重复检索过程。

判断获取的相关知识元是否满足设计需求,否则根据高频名词排序重新检索知识元库获取与其相关的功能动词集合,根据动词集合确定能够更恰当地描述设计需求的功能动词并对初始功能动词进行校正,利用校正后的功能动词重复检索过程,获取该功能动词的相关知识元集合。

第3步,确定输入输出流及环境约束,获取隶属度最大的聚类簇。

对相关知识元集合进行分析,确定设计需求相关的输入输出流和环境约束。利用校正后的功能动词和输入输出流参与到生物领域知识元聚类过程。

图2 功能语义模型Fig.2 Semantic model in functional semantic clustering

2 生物领域知识元聚类方法

2.1 一阶段聚类

基于功能特征语义相关性的功能语义聚类,功能特征语义相关性是功能词之间语义相似程度的空间度量。功能语义模型的要素包括根节点和叶节点、节点深度和宽度、相邻节点间的隶属关系,如图2所示。

(1)

步骤2:层次相关节点间关联强度定义节点Tsub(n)为节点Tn子节点,d(Tsub(n))为从根节点NT到子节点Tsub(n)的深度,则该相邻节点间关联强度为

(2)

被比较功能词间隶属关系影响功能词间语义相关度。定义相邻节点隶属关系权重为same-to(μs=1)>synonymous-of(μm)>is-a(μi),根据经验设定:μm=0.86,μi=0.64。

(3)

(4)

步骤3:根据知识元功能知识表示中的作用分别赋予功能动词(ωV=0.5)和输入输出流相同权重(ωF=1-ωV=0.5),则复合语义相关度表达式为

(5)

其中,r∈[0,1]为基于IC功能词间语义相似度权值,考虑到基于ND和IC的语义相似度可靠性及实验结果,r取值为[0.85,0.95]。

2.2 二阶段聚类

生物环境与生物体之间相互影响、相互作用。在自然界中,不同的甚至在进化树上相距甚远的生物,若生物环境相同或趋于一致,会产生相同的功能或近似的相态结构来适应环境,这种现象被称为趋同进化。在自然界中这种现象比比皆是: 在海洋环境中,哺乳动物鲸鱼、海豹等进化出和鱼类相似的结构“鳍”来实现在水中前进的功能(如图3 a)—图3 d)),并具有相似的体型来减少游动过程中水产生的阻力。为获取外界信息,节肢动物(例如,昆虫)等进化出和哺乳动物(例如,人类)等具有相同功能的器官。

图3 生物环境对生物功能的影响Fig.3 Environmental effect on the biological function evolution

在自然界中同一物种为了适应不同的生物环境向着具有不同功能的方向进化,这种现象被称为趋异进化。例如:沙漠环境中的蜥蜴-魔蜥(如图3 e))进化出厚重的鳞甲以防止水分散失;森林环境中的树栖蜥蜴-斑飞蜥(如图3 f))进化出翼膜实现了滑翔功能;河湖环境中的蜥蜴-蛇怪蜥(如图3 g))具有水上漂的功能以穿越水域;热带雨林环境中的蜥蜴-变色龙(如图3 h))能够改变身体颜色以躲避天敌。趋同进化现象和趋异进化现象直观地反映了生物的功能结构与其周围的环境息息相关。

环境特征约束是由一系列特征参数组成,其相似度算法框架如图4所示。

图4 环境特征约束相似度计算框架Fig.4 Schema of similarity calculation for environment feature constrains

将FCM聚类算法引入到知识元聚类过程中,结合给出的不同类型环境特征约束相似性算法,提出了AFCM算法,实现了基于环境特征约束适应性的环境约束聚类。在模糊聚类过程中,AFCM对应的目标函数为

(6)

其中:Ci为第i个模糊聚类簇;v为设置聚类簇数;uij为第j(j=1, 2, …,k)个知识元对第i个类簇的隶属度;Dij为第j个知识元与第i个聚类簇Ci间的距离。

根据模糊集合中隶属度定义可知,隶属度函数需满足条件:

(7)

知识元集合最佳聚类应使目标函数Z(Ph,C1,C2,…,Cv)取最小值,即:

min{Z(Ph,C1,C2,…,Cv), s.t.U} 。

在该目标函数寻优问题中,引入拉格朗日乘数,最终推导为

(8)

(9)

在计算Dij时,采用环境特征约束综合相似度计算结果及对应隶属度进行计算,聚类簇间距离计算公式定义为

(10)

图5 描述设计需求的功能动名词确定过程Fig.5 Flow chart of finding the proper keywords to describe design requirements

3 聚类实例

对恢复盲人视觉感受的假体装置的研究一直是社会关注的热点。已有的视觉假体装置按照视觉信息传递通路和原理的不同划分为视网膜假体[11]、视皮层假体[12]和视神经假体[13]。经过分析正常眼球工作机制可知,人眼视觉系统由基本视觉和调节清晰度与视角的控制功能组成,大脑通过处理视觉信号进行分析并做出反应。视觉假体装置设计需求功能模型表示为视觉信号采集→视觉信号转化→视觉信号传输→视觉信号编码→编码信号传输→编码信息控制。本实例通过对工程领域设计需求进行表达,将视觉假体装置设计参考范围进行扩大,跨领域检索自然界中其他生物视觉信号采集功能所对应的结构和策略,为视觉假体装置提供必要的设计激励和参考。其跨领域功能关键词选定过程如图5所示。

根据层次分析法利用Santy提出的1~9标度方法对环境特征约束各指标权重进行计算,可得环境特征约束:“Motion,Eye Type,Illumination Intensity,Sight distance,Angular field of view”对应的权重为{wm,we,wi,ws,wa}={0.342, 0.381, 0.039, 0.175, 0.063}。针对环境特征约束:Motion,Eye type,Illumination intensity,Sight distance,Angular field of view对一阶聚类后产生的16个样本进行模糊聚类,实验过程中设置迭代终止阈值ε=0.000 1,最大迭代次数r=25,分别考察不同聚类簇数情况下目标函数变化趋势及对应的隶属度,如图6所示。聚类迭代过程中目标函数变化趋势如图7所示。

图6 环境约束聚类结果(v=2)Fig.6 Environmental constraints based clustering (v=2)

图7 目标函数变化趋势(v=2)Fig.7 Objective function value chart(v=2)

当聚类簇数设为v=2时,聚类结果所对应隶属函数中,两列分别为聚类簇C1和C2,行向量分别代表从7~22的知识元集合,其交叉点对应值即为该行对应知识元隶属于其所对应聚类簇的隶属度。

仿照以上实例,将聚类簇数分别设定为v=1~16时,其对应的目标函数变化趋势如图8所示,用聚类树对模糊聚类结果表示如图9所示。

图8 聚类目标函数变化趋势Fig.8 Cluster objective function value chart

图9 AFCM聚类过程对应的聚类树Fig.9 Cluster tree of AFCM clustering

经综合考虑以上聚类结果及对比,确定将生物知识元集合划分为5类,并将聚类结果输出,聚类集合分别为C1={7, 8, 13, 17, 18},C2={9, 12, 14, 16, 19, 20},C3={10, 11},C4={15}和C5={21, 22},其聚类结果如图10所示。

图10 输出的聚类结果(v=5)Fig.10 Output clustering results (v=5)

分析图10中聚类结果可知(以视觉功能为例),聚类集合C1和C5中通过Camera eye来执行视觉信号采集并采用肌肉牵引眼球转动来扩大信号采集范围,并将信号传递到视觉中枢进行视觉信号处理,构成视觉通路形成视觉,集合C1生活在水生环境中,因水的折射率与眼球内透明介质折射率相近,光线难以通过折射进入眼球并汇聚到眼球后部感光部位,于是进化出球形且可以前后移动而非集合C5中扁平的可以改变曲率的晶状体来实现成像及调节成像距离的功能。将层次聚类中聚类簇距离计算引入FCM算法中并提出了AFCM,与K-means和层次聚类进行对比,其聚类时间和准确率如图11所示。

图11 不同聚类方法间聚类效率对比Fig.11 Comparision of different clustering methods’ clustering efficiency

从图11可以得出,AFCM算法聚类平均准确率高于K-means和层次聚类算法,不同聚类方法间最高差值达到26%,分析其原因主要为AFCM算法克服了硬聚类算法在聚类过程中非此即彼的缺点,更符合生物领域知识表示模糊性等特点。而在聚类时间上由于AFCM继承了FCM聚类算法中隶属函数求解过程,虽然在样本数据较少时其计算复杂度相对较高,但对诸如生物领域或工程领域知识元聚类的小样本聚类过程影响并不明显。因此,本文针对生物领域和工程领域知识元知识表示特点提出的AFCM聚类算法完全满足知识元聚类检索需要。

4 结 语

已有的生物激励设计方法在生物实例知识获取上具有偶然性大、效率低、难以重用等特点,导致所获取的实例知识实用性较差,同时缺乏对跨领域知识获取的研究。为了解决以上问题,本文在已有的知识元模型基础上,对领域实例进行离散化为功能模块,通过执行基于功能特征语义相关性的功能语义的一阶段聚类和基于不同类型环境特征约束的二阶段聚类,将功能相近、内容相关的知识元进行聚类,作为生物激励设计过程知识类推的基础。以视觉假体装置为例,根据其聚类输出结果可知,聚类时间和准确率得到极大改善,聚类效率得到显著提升。

/References:

[1] NAGEL J K. Systematic Design of Biologically-Inspired Engineering Solutions[D]. Harrisonburg:James Madison University, 2010.

[2] WANG Q M, GOSSWEILER G R, CRAIG S L, et al. Cephalopod-inspired design of electro-mechano-chemically responsive elastomers for on-demand fluorescent patterning[J]. Nature Communications, 2014(5):4899-4906.

[3] FESTO. Bionics Ants [DB/OL]. https://www.festo.com/bionic,2015.

[4] ZHANG D Q, CHEN S C, PAN Z S, et al. Kernel based fuzzy clustering incorporating spatial constraints for image segmentation[C]// 2003 International Conference on Conference Machine Learning and Cybernetics.[S.l.]: IEEE, 2003:2189-2192.

[5] TINSLEY A, MIDHA P, NAGEL R, et al. Exploring the use of functional models as a foundation for biomimetic conceptual design[J]. American Society of Mechanical Engineers, 2007:79-92.

[6] Ask Nature.A Project of the Biomimicry Institute [DB/OL]. http://asknature.org, 2008-2016.

[7] CHAKRABARTI A. Supporting analogical transfer in biologically inspired design[J]. Biologically Inspired Design, 2014:201-220.

[8] HABERLAND M, KIM S. On extracting design principles from biology: I. Method-General answers to high-level design questions for bioinspired robots[J]. Bioinspiration & Biomimetics, 2015, 10(1):016010.

[9] GOEL A K, VATTAM S, WILTGEN B, et al. Information-processing theories of biologically inspired design [C] //Biologically Inspired Design. London: Springer London, 2014: 127-152.

[10]MA J, HU J, FENG J F, et al. Constrained FBS knowledge cell model, representation, and applications for conceptual design[J]. ARCHIVE Proceedings of the Institution of Mechanical Engineers Part C Journal of Mechanical Engineering Science 7989-1996(vols 203-210), 2015, 230(11):1-14.

[11]COUZIN-FRANKEL J. Second chapter[J]. Science, 2016, 353:983-985.

[12]NORMANN R A, MAYNARD E M, ROUSCHE P J, et al. A neural interface for a cortical vision prosthesis[J]. Vision Research, 1999, 39(15):2577-2587.

[13]LI Menghui, YAN Yan, WU Kaijie, et al. Penetrative optic nerve-based visual prosthesis research[C]//Artificial Vision. [S.l.]:Springer International Publishing, 2017: 165-176.

[14]麻广林,李彦,黄振勇,等. 进化驱动型产品创新设计方法研究[J]. 计算机集成制造系统,2009,15(5):849-857. MA Guanglin,LI Yan,HUANG Zhenyong,et al.Product innovative design method based on evolution-drive model[J]. Computer Integrated Manufacturing Systems, 2009,15(5):849-857.

[15]CHAKRABARTI A, SHU L H. Biologically inspired design[J]. CIRP Annals - Manufacturing Technology, 2011, 60(2):673-693.

[16] HU Jie, XIA Peng, GU Chaochen, et al. Recognition of similar objects using simulated prosthetic vision[J]. Artificial Organs, 2014, 38(2): 159-167.

[17] ZHU Guoniu, HU Jie, QI Jin, et al. An integrated feature selection and cluster analysis techniques for case-based reasoning[J]. Engineering Applications of Artificial Intelligence, 2015, 39: 14-22.

[18]PATIL C G, PATIL S S. Use of Porter stemming algorithm and SVM for emotion extraction from news headlines[J]. International Journal of Electronics, Communication and Soft Computing Science and Engineering (IJECSCSE), 2013, 2(7): 9-13.

Cross domain knowledge cell clustering method for biologically inspired design

SHEN Jian, HU Jie, MA Jin, PENG Yinghong

(School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China)

To tackle the problem existing in the process of cross-domain knowledge acquisition in biologically inspired design, a functional semantic clustering based on functional feature semantic correlation and an environment-based clustering based on environment-constrained adaptability for biologically inspired design are proposed. On the one hand, the fuzzy theory and fuzzy mathematics are introduced into the knowledge cell clustering algorithm, and the semantic similarity calculation method based on the fuzzy membership function is proposed to realize the semantic clustering based on the functional keywords. On the other hand, an AFCM algorithm is proposed by introducing the FCM clustering algorithm into the knowledge cell clustering process, and combining the provided different types of environmental feature constraints similarity algorithm, the environment constra-ined clustering based on the adaptability of environmental feature constraints is achieved. Finally, the corresponding prototype system is developed, and the visual prosthesis device design is tested. The results show that the clustering time and accuracy are greatly improved and the clustering efficiency is improved significantly. The algorithm avoids effectively the discreteness of cross domain knowledge distribution, reduces the number of the research objects during the design process, and can acquire reasonably the existing design knowledge, which establishes a basis for further study.

knowledge based engineering; biologically inspired design; knowledge cell; knowledge clustering; knowledge acquisition

1008-1542(2017)03-0229-08

10.7535/hbkd.2017yx03003

2016-12-22;

2017-03-04;责任编辑:陈书欣

国家自然科学基金(51475288,51305260,51605302);科技部创新方法专项项目(2015IM010100)

沈 健(1995—),男,江西九江人,硕士研究生,主要从事生物激励设计方面的研究。

胡 洁教授。E-mail: hujie@sjtu.edu.cn

TP389.1

A

沈 健,胡 洁,马 进,等.支持生物激励设计的跨领域知识元聚类方法[J].河北科技大学学报,2017,38(3):229-236. SHEN Jian, HU Jie, MA Jin,et al.Cross domain knowledge cell clustering method for biologically inspired design[J].Journal of Hebei University of Science and Technology,2017,38(3):229-236.

猜你喜欢

语义检索聚类
语言与语义
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
专利检索中“语义”的表现
基于Spark平台的K-means聚类算法改进及并行化实现
“吃+NP”的语义生成机制研究
基于改进的遗传算法的模糊聚类算法
国际标准检索