APP下载

基于本体的数字化船舶碰撞案例库设计与构建

2018-05-02魏震方耿利川

许昌学院学报 2018年4期
关键词:案例库本体检索

魏震方,耿利川,陈 峰

(1.中国人民解放军海军陆战学院,广东 广州 510430;2.许昌学院 城乡规划与园林学院,河南 许昌 461000;3.中国人民解放军75833部队,广东 广州 510510)

船舶碰撞案例库的应用有着非常广泛的现实意义.比如:支持航海人员的训练学习,服务航海事故的司法鉴定,以及应用在基于案例推理(Case-Based Reasoning, CBR)的船舶避碰决策系统的案例检索等[1].但是关于船舶碰撞案例库设计与构建领域的研究成果目前仍显欠缺,工程化应用范围有待进一步提高.

当前在工程实践领域,船舶碰撞案例的描述、设计及构建等方面存在很大差异,尤其是语义上的不明确与异构,因此实际应用中难以根据动态过程来实现相似检索和知识发现,很难查找和抽取有用的信息,给船舶碰撞案例的高效利用带来了障碍.基于此,迫切需要设计和实现一种能够最大限度共享上述资源的碰撞案例库,实现快捷准确的相似检索与知识发现,高效服务于船舶碰撞案例的各项具体应用.近几年来,本体技术已经成为国内外研究热点,基于本体的CBR系统研究成果颇丰.但是,将本体引入到船舶碰撞案例库建设领域的研究鲜有出现,其工程化应用成功的案例则更少.英国利物浦理工大学研究的避碰专家系统、东京商船大学练习船“汐路丸”上的避碰决策系统等都是将神经网络、遗传算法和模糊数学先后引入到船舶避碰的研究当中,多采用传统的数据库技术进行案例库结构设计、信息检索,公开文献鲜见将本体与基于案例推理的方法应用在船舶碰撞案例建设领域.

本研究设计基于本体的数字化船舶碰撞案例库,对船舶碰撞案例进行形式化、规范化的描述,进而构建标准化的集成案例库,实现对海量船舶碰撞案例信息的高效管理和便捷共享.研究成果对于指导航海实践、培养训练航海人员以及海事审判的借鉴参考等方面具有重要的现实意义.

1 基于本体的数字化船舶碰撞案例库

1.1 系统架构设计

基于本体的数字化船舶避碰案例库构建的工程实践是建立在对国内外典型本体系统、本体构建方法以及相关描述语言和构建工具研究实验的基础上.在构建方法上,参考IDEF5方法和七步法,兼顾与国外IEEE标准顶层本体SUMO的复用和嫁接;在构建方式上采取了基于现有知识源构建船舶避碰案例领域知识,以自动 (或半自动)方式构造本体,并结合领域专家知识共同建立可快速检索、高效利用的案例知识库.

在系统架构上,基于本体的船舶碰撞案例库系统分为数据层、本体层和知识服务层,并设有本体索引服务器[2],系统架构如图1所示.数据层规范了船舶避碰案例元数据的描述和表示,将分布式数据资源、不同数据模型、数据格式等资源进行封装,提供统一的数据访问接口.

图1 基于本体的数字化船舶碰撞案例库系统逻辑结构图

本体层定义了本体模块、描述逻辑模块、描述逻辑封装模块、本体注册/注销模块、本体与数据间的映射模块、本体查询模块,通过本体模块对封装好的数据进行语义描述定义;描述逻辑封装模块则将不同的本体描述语言定义的本体统一转换为逻辑描述定义语言相同的本体.通过本体与数据间的映射模块实现用户描述语义到底层数据的访问;本体查询模块为上层提供本体访问服务,通过知识服务层可以查询本体及其概念、角色定义,概念间关系;本体注册/注销模块通过向本体索引服务器注册本地资源,并提供其描述信息:包括本体所涉及的领域、提供者的信息、访问的方式和权限等,对外提供资源访问;他可以将资源描述更新信息发送到本体索引服务器,也可以注销本体信息,取消资源访问服务.

知识服务层定义了本体的目录管理模块、本体间映射模块、本体集成模块、 查询转换模块、损失评价模块、用户查询处理模块和本体封装模块.用户的查询请求经由用户查询处理模块接收,进而通过本体目录管理模块查找能够满足用户要求的本体资源.如果由于本体异构性使查询到的本体不能满足要求,则通过本体间映射模块将用户需求迁移到其他本体资源查询,这期间也将通过查询转换模块实现新迁移到的本体资源所有的词汇组成表达式能够表达用户查询请求.损失评价模块则对这次查询转换损失的信息量进行评估.本体封装模块则将用户查询请求进行封装传送给本体层,当然本体层的查询结果也通过本体封装模块返回到知识服务层.

本体索引服务器管理本体注册/注销模块、本体查询模块、本体目录管理模块、本体间映射模块、本体集成模块.服务器是实体存在的,而本体层和知识服务层则是在虚拟环境中定义的.

1.2 系统设计的重难点

基于本体的数字化船舶避碰案例库设计,抽取船舶碰撞案例的基本特征、数据模型作为体系的基本功能模块.依据CBR 推理周期“4R”(Retrieve、Reuse、Revise 和 Retain),具体研究:船舶碰撞案例库资源获取问题、船舶避碰案例库元数据的描述和表示方法、船舶碰撞案例推理分析、基于本体的案例修正和保留等内容;根据本体、数据源在集成整合过程中遇到的异构性问题,将重点研究解决:本体间映射问题、本体集成问题、本体与数据间的映射问题;并且将对本体集成和案例检索过程中的相似度计算算法进行深入研究,以期提高相似度计算的执行效率和精度.分项表述如下:

1.2.1 船舶避碰案例库元数据的描述和表示

本研究在数据层规范了船舶避碰案例元数据的描述和表示.将案例所包含的数据信息分为静态信息、动态信息和结论信息.其中案例概要、环境信息等可归为静态信息;船舶碰撞过程信息,随时序不断变化的运动要素、会遇状态、避碰行动等相关信息可归为动态信息;事故后果、责任认定及处罚可归为结论信息.案例库依据其“会遇水域”、“船舶类型”、“会遇局面”等特征项进行分类,并细化案例库为多个子案例库.

1.2.2 基于本体的船舶避碰案例表示

本体可以构建形式化的概念模型,其建模描述语言和开发工具都发展比较成熟,使用本体表示的案例,检索和修改也比较容易,可降低维护成本.基于本体的船舶避碰案例表示通过逻辑描述语言对案例结构、案例实例、船舶避碰案例相关知识进行定义.将船舶避碰案例定义为三元组[3],

Case=.

其中D为船舶避碰案例的结构定义集合,C为案例对象库,K为船舶避碰案例相关知识集合.

根据描述逻辑知识库定义,本体可定义为一个三元组,由概念公理集合(TBox)、个体断言公理集合(ABox)和角色公理集合(RBox)三部分组成,其中角色公理集(RBox)是一个可能为空的有限语句集.TBox表示案例结构定义和领域中的通用知识,ABox表示具体的案例,将领域知识和案例库统一组织在本体中,形成了一致的案例组织模型.通过本体构建工具的推理机对本体进行一致性检查,简化本体维护过程.

1.2.3 船舶碰撞案例库资源获取问题

基于本体的船舶碰撞案例库资源的获取主要涉及如何在海量的数据资源中进行选择,如何借助领域专家和计算机交互式沟通等方式获取资料,并对其进行建模,建立该领域的概念、概念之间的关系、领域实例、领域规则、公理等;通过选择逻辑表达能力强的本体建模语言构建本体,进而选择良好的本体开发工具和支持环境实现对基于本体的数字化船舶避碰案例库构建.

1.2.4 本体间映射问题

不同部门间可能采用不同的描述语言对同一个资源定义本体.同一个资源,不同的部门可能用不同的词汇表述;或者同一词汇,在不同部门对应不同的资源.因此,异构性是本体的固有属性,并且本体本身并不能协调这种异构性.

简单地说,本体映射就是给定两个本体O1和O2,对于其中一个本体中的每个本体元素(概念、属性或关系),可以从另一个本体中找到与之相对应的本体元素,使两者在语义上具有相同或相似的含义,反之亦如此.

根据本体元素的不同,将本体映射分为概念映射、关系映射和实例映射.也可以根据映射函数的不同,而将本体映射分为一对一映射、一对多映射、多对一映射和多对多映射等类型.

1.2.5 本体集成问题

领域本体构造是一项极其复杂的系统工程,采用半自动本体获取方法,以结构化(关系数据库、知识库)、半结构化(Web 表格、XML 文件)和无结构(文本文件)材料为船舶碰撞案例库获取来源,经过预处理和学习过程,通过领域专家的确认,获得适用的领域本体,缓解本体知识获取瓶颈[4].进而将船舶碰撞案例领域内存在的几个本体集成在一起,消除重叠的和不协调的部分.

1.2.6 本体与数据间的映射问题

不同的资源拥有者可能采用不同的本体描述语言对自己的数据资源进行本体定义,通过描述逻辑封装功能将用具体语言描述的本体转换成采用描述逻辑定义的具有相同语义内容的本体.进而通过描述逻辑本体与底层数据的映射实现本体到数据的映射,实际上就是建立描述逻辑系统中概念和角色的外延.映射对于封装不同数据源在结构上的异构性至关重要,使用户仅关心本体所描述的语义内容,而不用考虑底层数据的真实结构.

1.3 系统设计的特色

系统通过对大量典型的船舶碰撞案例进行研究,构建数字化的船舶碰撞案例库,实现不同部门间在分布式环境下资源动态的、跨平台的共享和信息检索.

构建基于本体的船舶碰撞案例库就是在浩如烟海的数据资源中进行选择,借助领域专家和计算机交互式沟通等方式获取资料,并对其进行建模,建立该领域的概念、概念之间的关系、领域实例、领域规则、公理等;通过选择逻辑表达能力强的本体建模语言构建本体,进而选择良好的本体开发工具和支持环境实现对基于本体的数字化船舶避碰案例库构建.

一是在案例检索中实现本体集成相似度计算.在本体集成过程中,涉及到语义相似度计算,例如文档资源和研究领域之间的相似度计算;在案例检索时涉及到案例相似度计算,包括局部相似度计算和整体相似度计算.

语义相似度的计算主要从概念词汇和关系词汇两方面进行计算,而概念相似度的计算不仅仅涉及概念自身的语义,还包括概念的属性和关系等概念描述信息.

在案例相似度计算中,局部相似度计算根据案例的特征值类型进行相似度计算,最后根据各特征的计算权重进行整体相似度计算.通过对相似度计算算法的研究,提高相似度计算的执行效率和精度,实现基于本体的案例检索.

二是实现基于本体的案例修正和保留.例修正一直是CBR中的难点,也是本项目研究探索的难点之一.基于本体的船舶碰撞案例检索通过将新案例和旧案例进行相似度计算,判断案例修正和保留结果.如果旧案例与新案例相差很大,不能直接作为结果指导应用,则对旧案例进行修正.如果新案例与旧案例相似度小于阈值,则进行保留,充实到案例库中.案例的推理是一个不断积累的过程,随着案例库中的案例不断增多,案例推理解决问题的能力也将不断增强.

2 结束语

本文集中在船舶碰撞案例库的元数据描述和表示方法,本体、数据源在集成整合过程中遇到的异构性问题,本体集成和案例检索过程中的相似度计算算法的执行效率和精度问题.其在船舶碰撞案例库建设领域的应用,解决了传统CBR系统的不足,为实现不同部门间,在分布式环境下资源动态的、跨平台的共享和信息检索提供了可能.

参考文献:

[1] 卢小校,吴 唏,施平安.数字化船舶碰撞案例库构建[C].海洋船舶避碰论文集,2005.

[2] 黄 河,程 勇,史忠植,等.语义Web中开放知识服务体系的研究[J].计算机工程,2006(11):58-60.

[3] 陈 英, 徐 罡, 顾国昌.一种本体和上下文知识集成化的数据挖掘方法[J].软件学报,2007(18):2 507-2 515.

[4] 程 勇.基于本体的不确定性知识管理研究[D].北京:中国科学院,2005.

猜你喜欢

案例库本体检索
心血管外科教学案例库的建设及应用研究
国内首个海事司法案例库正式上线
眼睛是“本体”
基于实践应用的基坑工程设计案例库建设研究
化工原理课程思政案例库建设初探
基于本体的机械产品工艺知识表示
专利检索中“语义”的表现
专题
Care about the virtue moral education
国际标准检索