APP下载

试论图数据库本体存储方法的比较

2020-03-25程玉娟方俊伟赖涵

科学与信息化 2020年1期
关键词:存储本体

程玉娟 方俊伟 赖涵

摘 要 本体作为知识图谱的核心内容,以图结构的形式描述知识,随着知识量的不断扩大以及知识之间关联性的增加,本体中概念之间的图结构也越来越复杂,这给数据库的存储能力和表示能力带来了很大的挑战。图数据库具有天然的图结构,可以很好地与本体的逻辑结构形成映射关系。本文从本体内容完整性的角度,对比分析了目前常见的9种图数据库本体存储方法,实验结果显示目前的方法还无法满足完整的本体内容导入。

关键词 本体;图数据库;存储

1 本体存储相关研究

本体内容的导入需要考虑复杂的映射规则。实名类、实例、对象属性关系、数据属性关系是本体最核心、最基础的内容,任何本体存储方法都必须满足这四者的存储需求。在图数据库中存储本体,研究者通常将实名类、实例映射为节点,对象属性关系、数据属性关系映射为边[1-4],也有研究者将对象属性关系映射为节点,然后通过定义域、值域边来连接两端的节点[5],对于多元函数关系我们需要一些特殊的处理方法,目前研究尚少;对于公理,它表示永真的语义信息,类公理、实例公理我们只需要通过公理边连接头尾实体[1,5],对于描述属性关系之间语义信息的公理,一种方法是属性关系作为边的情况下,属性公理映射为边的属性[6],另外一种是属性关系作为节点的情况下,属性公理作为边连接两個属性关系节点[7];对于匿名类,它在描述公理时候产生,用于丰富实名类的信息,有的情况下可以直接忽略匿名类的存储,需要存储匿名类可以根据本体描述的需求生成匿名节点,以子图的形式来存储整个匿名节点的信息[8-9];对于规则,它用于扩展知识描述范围,可以结合公理信息推理出新的概念之间关系[4]。

2 实验与分析

本次实验比较了9种图数据库本体存储方法,具体是将本体按照这些方法分别存入到图数据库,从本题要素存储完整性的角度对比和分析它们。这9种方法来自于文献:[1-9]。

实验中对本体操作的编程语言为java,实验环境为:

(1)操作系统:ubuntu 16.04;

(2)CPU:Intel Core i5-7300HQ CPU 2.50GHz

(3)内存:8.00 GB

(4)图数据库:Neo4J 3.4.0

实验结果:

本文将本体拆解为实体、关系、公理、规则四个方面讨论存储的完整性,其中,实体又分为实名类、匿名类、实例,关系分为对象属性关系、数据属性关系、函数关系;公理分为类公理、实例公理、属性公理。表1展示了9种方法的本体各要素存储情况。由其可知,目前的图数据库本体存储方法,尚无法满足完整的本体内容导入,特别是对于匿名类、多元函数以及规则的存储实现。纳入比较的9种方法种,graphDB[11]和stardog[12]在完整性方面是相对最好的,stardog支持除规则外的本体内容导入,graphDB基本可以满足本体的完整导入。

在实验中我们还发现,这两种方法在匿名类的处理上,相对于本体,会生成更多的匿名节点,这些冗余信息事实上是可以避免的;对于多元函数的处理也不是很清晰;对于规则的处理,graphDB目前只能满足基本的规则。

3 结论与展望

本文从本体内容完整性的角度,对比分析了常见的9种图数据库本体存储方法。实验表明,目前的方法还无法满足完整的本体内容导入,特别是对于匿名类、多元函数以及规则的存储实现。

在未来的研究中,我们会提出一种基于Neo4j来实现本体内容的完整存储。该方法旨在利用图数据库中节点、边来标识本体中的类、实例、关系和公理,利用节点、边组合的子图形式来标识匿名类、函数关系等内容,利用数据库存储过程实现本体的规则实现。通过本体到属性图模型的映射,在保证语义信息不丢失的情况下,减少冗余信息。

参考文献

[1] 张慧,侯霞,李宁. 本体存储方法研究[J].北京信息科技大学学报,2016,(3):59-63.

[2] 何向武. 大数据中RDF语义数据存储优化探讨[J].计算机应用与软件,2015,(4):44-47,61.

[3] 项灵辉,顾进广,吴钢. 基于图数据库的RDF数据分布式存储[J] .计算机应用与软件,2014,44(11):148-156.

[4] 康杰华,罗章璇. 基于图形数据库Neo4j的RDF数据存储研究[J].信息技术,2015,(6):115-117.

[5] 王红,张青青,蔡伟伟,等. 基于Neo4j的领域本体存储方法研究[J].计算机应用研究,2017,(8):2404-2407.

[6] Bouhali R , Laurent A . Exploiting RDF Open Data Using NoSQL Graph Databases [J]. AIAI, 2015,(9):179.

[7] Faming Gong,Yuhui MaID,Wenjuan Gong.Neo4j graph database realizes efficient storage performance of oilfield ontology[J]. PLoS ONE,2018,(9):123.

作者简介

程玉娟(1990-),女,学历:硕士,专任教师,现就职单位:武汉铁路职业技术学院铁道机车车辆学院,研究方向:软件工程、需求工程、人工智能等。

方俊伟(1995-),学历:硕士,现就职单位:武汉大学计算机学院,研究方向:知识图谱、软件工程等。

赖涵(1981-),男,学历:博士,讲师,现就职单位:重庆工商大学计算机科学与信息工程学院,研究方向:需求工程、云计算、软件工程等。

猜你喜欢

存储本体
水果连连看
眼睛是“本体”
一种采暖散热器的散热管安装改进结构
一种新型水平移动式折叠手术床
档案管理中电子文件的存储探究
云计算与虚拟化
Care about the virtue moral education