APP下载

基于本体的航天领域知识组织方法

2018-05-16北京航天自动控制研究所

航天工业管理 2018年4期
关键词:术语本体定义

/北京航天自动控制研究所

随着科技的进步,航天领域产生、存在着大量的信息,如文档、代码、案例、多媒体等。如何管理这些信息并使之为正常的工作服务就成为了现实中面临的一个问题。为了解决该问题,知识组织应运而生,它的目标是管理相关领域的信息,并分析总结成为知识,以便满足工作人员的需要。知识组织的主要任务是要对企业级的知识资源进行全面和充分的开发以及有效的利用,充分获取、生产、传播和保存,利用集体智慧实现知识创新,获取行业竞争优势。因为传统的知识组织方法缺乏统一的知识模型,容易造成用户的误解,而存储形式的不同也不利于知识的共享和交流,影响了查全率和查准率。为了解决这些问题,将本体引入知识组织中,基于本体的知识组织是提高知识共享性、互操作性、可维护性和可复用性的一个有效途径。

一、知识本体的概念与作用

从知识的角度来看,本体是一种概念组或词汇表的理论,可用作构建处理系统的构建模块,是一种具有代表性的词汇表形式。本体是用来捕获相关领域的知识,提供该领域知识的共同理解,确定领域内共同认可的词汇(术语),并给出这些词汇(术语)间相互关系的明确定义。本体被广泛应用于知识表示、知识共享、知识集成、知识复用和知识管理等领域。

1.本体的层次划分

本体研究层次图(见图1),展示了关于本体研究与开发的不同层次的工作。其中,顶层本体(又称为通用本体)主要研究通用的概念,如时间、空间、事物、事件、对象、行为等,其完全独立于特定的问题或领域,可以在很大范围内共享;领域本体则研究与一个特定领域有关的术语或词汇,如航天、导弹、军事等;任务本体是定义通用任务或推理活动,如需求、设计等。领域本体和任务本体可以引用顶层本体中定义的词汇来描述自身的词汇。应用本体描述特定的应用,其既可以引用涉及特定的领域本体中的概念,又可以引用出现在任务本体中的概念。

2.本体的建模语言

1999年Perez等人提出了构建本体的5个最基本的建模基元,即类或概念、关系、函数、公理、实例,它们能够准确地刻画所描述的对象。

类或概念——从语义上讲,表示的是对象的集合。一般采用框架结构进行定义,包括概念的名称,以及与其它概念之间的关系集合,并用自然语言对概念进行描述。

图1 本体研究层次图

关系——在领域中概念之间的交互作用。从语义上讲,关系对应于对象元组的集合。

函数——一类特殊的关系。函数的重要特性是关系的前n-1个元素可以唯一确定第n个元素。

公理——表示永远成立的声明。

实例——代表元素。从语义上讲,实例表示的就是对象。

3.本体的构建准则

目前,本体构建技术还不能实现完全自动化构建本体,主要还是依靠手工构建或半自动生成一些本体。因此,依据一定准则构建本体十分必要,它可以使本体构建过程更加规范,构建效率更高、质量更好。但由于本体构建过程在各个领域和不同工程中各不相同,所以到目前为止,还没有一套统一标准的本体构建方法。而1995年Gruber提出的本体构建5条准则是最有影响的,即:

清晰性——本体应该能有效地传达其中所定义的术语的含义。

一致性——本体必须是一致的,即由本体得出的推论与原有的定义是相容的,不能产生矛盾和冲突。

可扩展性——本体在设计时不仅要使用领域内公认的词汇,同时还要考虑可能的应用任务范围,使得本体的表达能被单调地扩展。

编码偏好程度最小——概念应该在知识层次上说明,而不应依赖于特定的符号层次的编码。

最小本体承诺——对待建模对象给出尽可能少的约束。

以上5条准则在使用过程中需要进行权衡,难以全部满足。

二、基于本体的航天知识组织

1.本体的构建与存储

当前,构建知识本体的工作主要依靠手工编辑,没有实现工程化,每个本体开发组都有自己的原则、设计标准和定义方法。然而,知识本体的构建直接影响着知识组织的结果,以及用户获取知识的体验。因此,选用合适的知识本体构建方法非常重要。

目前,美国、欧洲等多个本体开发组织分别提出了自己的本体构建方法,如英国爱丁堡大学开发的专门用来创建企业本体的“骨架法”,加拿大多伦多大学从TOVE项目中总结出来的TOVE企业建模法,西班牙马德里理工大学提出的Methontology本体建模方法等。

(1)“骨架法”

建立在企业本体基础之上,是相关商业企业间术语和定义的集合,该方法只提供开发本体的指导方针,“骨架法”流程如图2所示。

确定本体应用的目的和范围。根据所研究的领域或任务建立相应的领域本体或过程本体,领域越大,所建本体越大,因此需限制研究的范围。

图2 “骨架法”流程图

本体分析。定义本体所有术语的意义及其之间的关系。此步骤需领域专家的参与,对该领域越了解,所建本体就越完善。

本体的表示。一般用语义模型表示本体。

本体的评价。建立本体的评价标准是清晰性、一致性、完整性、可扩展性。清晰性就是本体中的术语应被无歧义的定义;一致性指的是术语之间关系逻辑应一致;完整性是指本体中的概念及关系应是完整的,包括该领域内所有概念,但很难达到,还需不断完善;可扩展性是指本体应用能够扩展,在该领域不断发展时能加入新的概念。

本体的建立。对本体按以上标准进行检验,符合要求的以文件形式存放,否则转本体分析阶段。

(2)TOVE企业建模法

该方法由多伦多大学企业集成实验室研制,用于构造多伦多虚拟企业本体工程,使用一阶逻辑进行集成。TOVE本体包括企业设计本体、工程本体、计划本体和服务本体,其流程如图3所示。

设计动机。定义直接可能的应用和所有解决方案,提供潜在的非形式化的对象和关系的语义表示。

非形式化的能力问题。能力问题作为约束条件,包括能解决什么问题及如何解决,这里的问题用术语表示,答案用公理和形式化定义回答。由于是在没有形式化的本体之前进行的,所以叫非形式化的能力问题。

术语的形式化。从非形式化能力问题中提取非形式化的术语,然后用本体形式化语言进行定义。

形式化的能力问题。一旦能力问题脱离了非形式化,本体术语已定义,则能力问题便自然形式化。

形式化公理。术语定义所遵循的公理用一阶谓词逻辑表示,包括定义的语义或解释。

完全理论。说明问题的解决方案必须是完全的。

图3 TOVE方法流程图

(3)Methontology本体建模法

该方法由马德里理工大学人工智能实验室提出,分为管理、开发和维护3个不同的阶段。其中,管理阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题;维护阶段包括知识获取、系统集成、评价、文档说明、配置管理。

通过这3种方法的分析对比可知,“骨架法”更适合作为航天知识本体的构建方法。

2.航天知识本体的组织方式

知识本体的组织是构建知识系统的重要手段,其目的是为了加强知识检索和促进知识的增长。对于本体知识系统而言,关键是建立知识本体的体系结构。其中,概念体系和属性体系是构建本体体系结构的2个重要组成部分。此外,描述领域概念的一些典型关系对于刻画概念及属性之间的关联具有无法替代的作用。在构建属性分类体系时,往往需要参照这些存在于领域之中的固有关系。

三、知识本体的进化及融合

1.知识本体的进化

现实世界无时无刻不在改变,知识本体的含义、层次关系、存在方式也应向前发展,而且用户需求也在不断改变。因此,要让本体与时俱进,并根据外部知识源的变化作出及时的调整,实现本体的动态进化。

本体进化是指在现有本体基础上,依照一定的理论、方法和规则,根据外部的应用需求,对现有本体的数据结构、概念及概念间关系进行不断丰富、完善、更新、改进及评估的过程和方法。知识本体进化的基本框架如图4所示。

数据发现。在数据源中发现潜在的新信息,数据源的格式有多种,可以是非结构化的数据,如文档、多媒体,也可以是结构化的数据,如文本、Excel等。对于不同格式的数据,处理方式也不同:文档使用信息抽取、本体学习技术处理;其它外部本体则将其转换成与知识本体语言相兼容的本体。

数据确认。经过“信息发现”所发现的潜在信息,可以通过使用一系列的启发式规则(如所抽取的术语的长度)来实现数据确认,尤其是从文档中发现的新信息。对于结构化的数据(文本、Excel)则无需确认,因为结构化的数据已经过明确良好的定义。

本体进化。在所抽取的术语和进化本体中的概念之间建立正确的关系,这些关系是通过搜索多个背景知识源鉴别出来的。进化本体中相应的变化将被直接执行并记录。

确认进化。对本体实施变化后会引起本体的不一致和不连贯,并且由于存在多个数据源,在本体进化过程中也可能产生数据复制,这样就会产生冲突知识,所以可以采用人工干预或者自动推理技术来解决。

进化管理。在本体进化以及进化本体对依赖本体的变化传播过程中,赋予本体管理者一定程度的控制权,主要负责记录、跟踪本体变化,找出并解决本体进化过程中未解决的问题。

2.知识本体的融合

根据成熟的研究结论,多领域知识融合方法主要可以分为基于规则的知识融合方法、基于分类的知识融合方法、基于估算的知识融合方法3类,它们共同构成了知识融合的基础方法,如图5所示。

无论采取哪一种方法,以知识融合本身来说,都可以将知识融合作为对信息的一种处理过程。即采用综合利用自然语言处理、语义分析、统计分析等技术方法对多领域知识信息进行多层次和多维度检测、关联、估计、组合、分析的知识融合,目的是对知识对象的结构和内涵进行优化,为用户的需求提供更有效的知识信息。

图4 知识本体进化基本框架

图5 知识融合方法

航空航天领域拥有大量的显性知识和隐性知识,需要进行有针对性的发掘、收集和整理。通过对知识组织方式进行控索,对知识本体的构建与存储、知识本体的组织方式、知识本体的进化过程和多领域知识融合一般架构进行研究,在对比流行的知识本体构建方法后,选取了“骨架法”的知识本体构造方法,并提出知识本体进化的一般流程,进而提出知识融合的架构设计。基于本体的知识组织研究是一个极其深入的课题,包括本体进化过程中的学习、智能化,知识融合过程中的学习训练,需要不断完善融合算法,因此仍有许多内容需要进一步深入研究。▲

猜你喜欢

术语本体定义
继齐韵往昔,以今声开来——思考自五音戏主奏乐器的演变、本体及延伸
眼睛是“本体”
严昊:不定义终点 一直在路上
定义“风格”
贸易术语修改适用问题探讨
修辞学的重大定义
专题
Care about the virtue moral education
教你正确用(十七)