APP下载

云南种子植物特有属领域本体构建及其推理

2017-03-09庞雪彭琳陆国泉保峻嵘

湖北农业科学 2017年1期
关键词:推理

庞雪++彭琳++陆国泉++保峻嵘

摘要:针对目前云南种子植物特有属信息资源数据格式多样、集成整合不足、检索效率低等问题,提出使用基于本体查询推理的解决方法。利用本体编辑器Protégé,采用七步法构建云南省种子植物特有属领域本体,构建云南种子植物特有属领域本体的推理规则,并综合运用Jena和SPARQL实现基于规则的本体推理查询。通过对云南省种子植物特有属领域本体实例的测试,得出潜在的语义查询结果,为相关领域语义信息检索提供一种新方法和思路。

关键词:种子植物特有属;领域本体;Jena;查询;推理

中图分类号:TP18 文献标识码:A 文章编号:0439-8114(2017)01-0149-04

DOI:10.14088/j.cnki.issn0439-8114.2017.01.038

Construction and Reasoning of Domain Ontology of Yunnan Endemic Genera of Seed

PANG Xue1,PENG Lin1,LU Guo-quan1,BAO Jun-rong2

(1.School Key Laboratory of Agricultural Information Technology in Yunnan/Yunnan Agricultural University, Kunming 650201,China;

2.Yunnan Information Technology Development Center,Kunming 650228,China)

Abstract: According to Yunnan spermatophyte endemic genus resource various data formats, deficient integration, low retrieval efficiency and other issues, a method based ontology query reasoning was proposed. Using seven steps to build Domain Ontology of Yunnan Endemic Genera of Seed with protégé. The reasoning rules of Domain-specific ontology was built and based on this reasoning and queries of ontology with Jena and sparql were achieved. It get the potential semantic query results through the tests to Domain Ontology of Yunnan Endemic Genera of Seed. It provides a new method for other agriculture area terminology information retrieval.

Key words: genera of seed;domain ontology;jena;query;reasoning

目前,随着本体被广泛应用于语义网等领域,本体构建及其推理也成为热点研究之一。利用植物形态对植物进行辨别的研究和应用已经得到发展。例如,基于几何参数方法的植物建模方法、基于植物图像的建模方法、基于生物学机理与环境控制的建模方法[1]。各种方法仍有其自身的适用范围和局限性。但这些方法无法实现基于语义的查询推理。本体理论和推理为辨别云南种子植物特有属研究提供了一种新的途径。

随着对本体和语义推理等相关技术的深入的研究,现在可以提供基于语义的智能检索和推理方案。它开发定义了完整的类概念和类间的组织关系,在语义层次上实现了智能推理。宗南苏等[2]对鳜鱼疾病诊断语义推理进行了研究,黄风华等[3]对基于Jena的台风灾害领域本体模型进行了研究,王红等[4]基于本体的民航应急决策知识表达与推理方法进行了研究。这些研究为本体的构建和基于本体的推理提供了理论基础。本研究将本体理论与语义推理引入到云南种子植物特有属领域,建立云南种子植物特有属领域本体,分析其概念之间的关系,并在此领域本体的基础上,实现基于Jena的领域本体解析,并利用Jena的推理机制进行本体推理,添加自定义推理规则,实现基于植物形态结构特征的云南植物特有属的辨别,实现了基于语义的信息查询以及在此层次上的信息共享和交互,为建立云南种子植物特有属语义信息检索系统提供参考。

1 推理机的相关概念

目前,常用的推理机有Pellet、Jess、FaCT++、Racer、Jena等。Jena是由惠普实验室开发的Java开发工具包,用于Semantic Web(语义网)中的应用程序开发;Jena是开源的,在其安装包中有Jena的完整代码,并且它还提供了DIG接口,是类似于数据库中ODBC接口,它允许后台使用不同的推理引擎,所以Pellet、FaCT++、Racer推理机也可以在Jena中使用[5]。Jena框架主要包括:①以RDF/XML、三元组形式读写RDF,Jena中有相应的函数和接口用于对RDF、RDFS、OWL等格式的数据集的查询推理解析和持续存储[2];②RDFS、OWL、DAML+OIL等本體的操作,即对本体的操作解析;③利用数据库保存数据;④查询模型,Jena2提供了ARQ查询引擎,它支持SPARQL、RDQL查询语言,也可以对模型的查询有很好的支持,而且常用的关系型数据库可以与Jena中的查询引擎相关联,这使得在进行查询时能够达到更高的效率;⑤基于规则的推理,Jena2支持基于规则的推理,推理机制支持将推理器(Inference reasoners)导入Jena,创建模型时将推理器与模型关联以实现推理。Jena的主要推理类型有类间关系推理、类和实例关系推理、基于属性的推理三种类型[6]。

2 云种子植物特有属领域本体的构建

依据特有属领域的特点,主要利用领域本体中的核心概念与关系构成来进行本体的构建。这样既保证了特有属领域本体结构简单、实用性强,又有利于今后对于该领域本体的扩展。参考了现有的相关本体及一些相关的技术资料,以《云南植物志》和《中国植物志》为基础,对云南种子植物特有属领域本体的术语进行提取。将概念分为类属(Member-of)和组成(Part-of)关系,将本体中的概念抽象成图的结点(Vertex),将概念间的关系抽象成节点间的连接(Link),本体结构如图1所示。

本研究采用Owl语言描述本体,利用斯坦福大学Stanford Medical Informatics开发的一个开放源码的本体编辑器Protégé完成对云南种子植物特有属领域本体的建模,包括对类定义、类间关系的定义、属性的定义、添加实例等,如图2所示。

3 Jena在语义查询推理中的应用

3.1 Jena在本体查询中的应用

Jena框架包括一个本体子系统(Ontology Subsystem),如图3所示,它提供的API允许处理基于RDF的本体数据,即它支持OWL、DAML+OIL和RDFS。本体API与推理子系统结合可以从特定本体中提取信息[7]。

Ontology Model作为Ontology子系统处理的基本对象,使用者可以对以不同结构存储的Ontology数据进行读取,并且还可以对Ontology的类、属性和实例等元素进行操作、处理和一致性检查。通过方法函数获得本体中类、类间关系、属性等信息,并对类和属性等进行增删改查的操作。本体模型(OntModel)是对Jena RDF模型的扩展,它的功能是处理本体数据。基于Jena的本体处理方法第一步就是要建立一个本体模型,然后通过本体模型中所定义的方法函数对模型进行操作,例如获取模型本体中的信息、对本体属性实例进行操作以及将本体的表示输出到磁盘文件等。在所有的操作之前要使用函数ModelFactory.createOntologyModel()创建内存模型ontModel,再用函数FileInputStream()读入.owl文件,用createClass()函数增加新的类,函数listClasses()可以得到本体中已经有的类,函数listSuperClasses()显示当前父类,函数listSubClasses()显示当前子类,函数listDeclaredProperties()显示当前类所有属性。类、对象属性、数据属性查询实现如图4所示。实例的解析函数listSubjectsWithProperty()读取实例individual,如图5所示。

3.2 Jena在本体推理中的应用

3.2.1 Jena推理原理 本研究的推理方法是利用Jean包中的通用规则推理机制,如图6所示,外加以自定义规则来实现基于本体更好的推理。模型对象(InfGraph)是整个推理机制的核心部分,在进行推理之前,首要就是创建一个本体模型并读入OWL描述的信息资源,输入的信息资源包括基本数据模型资源,数据格式可以是RDF、XML或是OWL,然后在模型工厂(Model Factory)中注册并创建推理机(Reasoner),这其中也包括基于自定义规则的推理机;下一步要将推理机和该领域本体绑定在一起,得到一个模型对象。最后,借助本体应用程序接口或模型API对已建立的模型对象进行操作和处理,通过自定义规则对本体模型进行推理,所得的推理结果是基于描述逻辑的[3,8]。它是针对本体特点定义的默认通用的推理规则,用于检查类的可满足性以及属性的传递、互逆、不相交性等。但是只有这些通用的规则是不能实现基于本体的推理的。在云南种子植物特有属领域本体推理过程中,为了能根据植物外形描述准确判别出植物所属属名,可以制定自己的规则。

3.2.2 推理规则的确定 云南种子植物特有属领域本体推理模型的实现主要是由推理规则和推理程序组成。通过自定义的推理规则对通用规则进行补充,可以更好地实现对该本领域本体的推理。本研究以野茼蒿属和罂粟莲花属为例创建规则。在《云南植物志》中,有关这两种属的部分描述如下:野茼蒿,瘦果狭圆柱形,赤红色,具肋,被毛;冠毛长8~12 mm,白色;罂粟莲花,瘦果长约1.2 cm,稍扁,密被长柔毛。花葶近无毛,圆柱形,粗2~6 mm。可以看出瘦果是两种属都具有的部分,冠毛只有野茼蒿有,花葶只有罂粟莲花有,所以根据此特点,自定义查询规则如下:

Rule1:(?x rdf:type 特有属),(?y isPartOf ?x),(?y instance of 冠毛),(?z instance of 瘦果),(?z isPartOf ?x)-->(?x isMemberOf 野茼蒿属)。

Rule2:(?x rdf:type 特有属),(?b isPartOf ?x),(?b instance of 花葶),(?c isPartOf ?x),(?c instance of 瘦果)-->(?x isMemberOf 罂粟莲花属)。

对上面两个规则进行说明,二者是互补的,都是为了判断这种植物到底是野茼蒿属还是罂粟莲花属。规则一,如果x是特有属的一种,y是属于x的部分,y还是冠毛的一个实例,z也是属于x的一部分,z还是瘦果的一个实例,那么就可以判断出x是野茼蒿属的一员;规则二,如果x是特有属的一种,b是属于x的部分,b还是花葶的一个实例,c也是x的一部分,并且c是瘦果的一个实例,那么可以判断出x就是罂粟莲花属的一员。

3.2.3 领域本体推理的实现 通过Jena推理机和上节中的推理规则,发现其中的隐含关系,主要代码如下:

//推理規则

String rule =" rdfs: ( ?x rdf:type 特有属) ,( ?y isPartOf ?x),(?y instanceOf 冠毛),(?z isPartOf ?x ),(?z instanceOf 瘦果) -> ( ?x isMemberOf 野茼蒿属) "+" rdfs: ( ?x rdf:type 特有属) ,( ?b isPartOf ?x),(?b instanceOf 花葶),(?c isPartOf ?x ),(?c instanceOf 瘦果) -> ( ?x isMemberOf 罂粟莲花属)";

// 创建特定的推理机:以创建OWL层次的推理机

Reasoner reasoner= ReasonerRegistry.getOWLMicroReasoner();

// 获取推理模型

Model infModel = ModelFactory.createInfModel(reasoner,ModelFactory.createDefaultModel());

在进行查询时,使用W3C制定和推荐的RDF查询语言SPARQL进行查询,SPARQL是基于自然语言理解的本体查询语言,构建相应的查询三元组,与基于关键词的查询方法而言,提高了查全率和查准率,推理结果如图7所示。

4 小结

本研究將本体理论本体推理引入到云南种子植物特有属的判别当中,详细讨论了本体建模和推理机制在云南种子植物特有属领域本体中的应用,建立了云南种子植物特有属领域本体,并讨论了Jena在本体解析当中的使用;采用Jena推理引擎并自定义推理规则,实现了基于云南种子植物特有属领域本体的推理。相比于其他方法,解决了基于语义的查询推理问题,为建立云南种子植物特有属语义信息检索系统提供参考。由于领域本体和规则需要不断的完善和添加,推理还需要不断的改进。在查询方面还应继续增加语义范围,增加同义词库等,针对上述问题今后还需进一步研究。

参考文献:

[1] 陈冬丽,苏礼楷,柳 薇.一种基于本体和特征综合推理的植物建模方法[J].华南师范大学学报(自然科学版),2010(2):45-29.

[2] 宗南苏,郑业鲁,钱 平.基于SWRL的鳜鱼疾病诊断知识表示与语义推理实现[J].情报学报,2010,29(3):414-421.

[3] 黄风华,宴路明.基于Jena的台风灾害领域本体模型推理[J].计算机应用,2013,33(3):771-775,779.

[4] 王 红,杨 璇,王 静,等.基于本体民航应急决策知识表达与推理方法研究[J].计算机工程与科学,2011,33(4):129-133.

[5] 田 宏,马鹏云.基于Jena的城市交通领域本体推理和查询方法[J].计算机应用与软件,2011(8):57-59.

[6] CRANEFIELD S,PAN J.Bridging the gap between the model-driven architecture and ontology engineering[J].International Journal of Human-computer Studies,2007,65(7):595-609.

[7] 向 阳,王 敏,马 强.基于Jena的本体构建方法研究[J].计算机工程,2007,33(14):59-61.

[8] 金保华,林 青,付中举,等.基于SWRL的应急案例库的知识表示及推理方法研究[J].科学技术与工程,2012,12(33):9049-9057.

猜你喜欢

推理
也谈高中英语教学中的阅读技巧
提高农村学生学习几何的能力探索
初中数学课堂反例的应用
《唐人街探案》:异域奇观下的喜剧推理实验