APP下载

基于本体的校园地图智能检索系统的研究

2014-01-16张志鹏马金平靳小青

电子设计工程 2014年6期
关键词:饭卡充值本体

张志鹏,马金平,靳小青

(青岛大学 管理科学与工程系,山东 青岛 266071)

本体作为语义检索的技术,近年来得到了广泛的应用。例如,文献[1]提出了一种基于语义网的个性化酒店查询系统,该系统通过建立酒店领域的本体,提出了基于对数据库查询和知识推理的混合查询方法,大大提高了用户检索的准确性。文献[2]对足球领域进行了本体设计,该文献把基于关键词的查询界面作为最友好的用户查询界面,并提出了基于关键词的查询接口和语义网技术相结合的语义搜索系统,使该系统解决了语义网的三大问题,即可用性、可扩展性和信息检索的有效性。文献[3]中用到了语义标注的方法实现对信息的提取。文献[4]提出了一种通过使用语义技术标注地图中的位置和地点来实现对信息的描述和检索的方法,文中运用语义标注技术对地图添加元数据,并通过WordNet对词语进行语义上的匹配,使用户可以更加精准的检索到地图中的信息。

针对已有文献研究的不足,本文提出了基于领域本体的校园地图智能信息检索模型,并构建了校园地图领域的本体,实现了基于本体的校园地图领域的智能信息检索系统。该模型利用领域本体在概念上丰富的语义关系,形成了一定的推理关系,并通过对校园地图领域全方位的元数据层次的信息进行语义标注,使系统内的信息可以与领域本体相对应,进而增加不同信息之间的耦合度,使基于本体的智能检索成为了可能。测试结果表明,该模型能够在一定程度上提高信息检索的查准率和查全率。

1 基于本体的校园地图智能检索模型

基于本体的校园地图智能检索模型如图1所示,其基本的设计思路为:

1)对校园地图领域的本体进行全方位的设计,利用当前比较成熟的本体构建软件完成对校园地图领域本体的构建,并通过计算机可以理解的语言对设计出的本体进行知识表示。

2)将校园地图领域的本体对应于校园地图中所涉及到的领域概念进行语义标注,建立校园地图与本体概念之间的关联。

通过图1可看出,本体设计与构建和语义标注构成了该模型的主体部分,将程序接口、用户图形化界面和数据库密切的联系在一起,按照该模型框架,可以实现系统的开发。

1.1 本体构建

本体的构建是模型实现的关键和基础,本体构建质量的高低与用户进行信息检索准确度和全面性密切相关,因此本体的构建需要精确到某个具体的领域。

图1 基于本体的校园地图智能检索模型Fig.1 Campus map intelligent retrieval system based on ontology

在对校园地图领域本体的构建上,首先设立“校园”类为最顶层类,然后在该类下设立一系列相关的子类,其中包括“地名”类,“人物”类,“事件”类,“时间”类等。 各个类分别有他们的属性,比如“地名”类可以具有“坐标”、“相应的事件”和“对应的人物”等属性;这些类下面也分为各种子类,比如“地名” 类可以包括 “超市”、“教室”、“办公楼”、“食堂”、“街道”和“宿舍楼”等子类。类与类、属性与属性之间可以分别具有相互等价、相互包含或者相互推理等多种语义关系。在实施校园地图领域某个具体应用时,需要将这些类和属性以及类和属性之间的关系进行细化,这样不仅有利于该应用的顺利实现,同时也有利于提高基于校园领域内不同检索应用之间本体的可共用性。

通过Protégé软件完成对不同应用之间校园领域本体的构建工作。Protégé是目前中国最为流行的本体编辑工具,它不仅是一个可以支持中文的本体编辑工具,同时也支持OWL本体语言。Protégé是一个免费和开源的本体编辑平台,它基于java语言开发,能很好的将编程语言同本体技术联系在一起,为基于本体的校园地图智能检索模型的实现提供了一个良好的平台。

1.2 本体的知识表示方法

在本体构建完成之后,需要将校园领域本体转化为计算机可以理解的语言,以便于通过编程的方法来实现系统。本体的知识表示方法经过不断的发展,其中以OWL语言最为成熟。OWL语言不仅对本体语言的描述能力更加丰富,同时又具有权衡表达能力和有效的推理支持能力,使得对本体知识的描述更加充分。文献[5]通过使用OWL语言技术来完成了用不同国家的语言对酒的描述。OWL语言语法丰富,它有3种不同的前缀,下面以owlx前缀为例用不同国家的语言来完成对酒的描述。

<owlx:Classowl:name=”wine” owlx:complete=”false”>

<owlx:Annotation>

<owlx:Labelxml:lang=”en”>wine</owlx:Label>

<owlx:Labelxml:lang=”zh-cn”>酒</owlx:Label>

</owlx:Annotation>

<owlx:Classowl:name=”&food;PotableLiquid”/>

</owlx:Class>

基于本体的校园智能检索模型采用OWL本体语言完成了对领域本体的知识表示,并在系统的实施中采用OWL语法中最为常用的owl前缀进行编码。

1.3 语义标注

语义标注是指在领域本体的基础上向文档添加规范化知识的表示过程[6]。目前语义标注的方法主要分为人工语义标注(即交互性语义标注)和自动语义标注。人工语义标注主要是通过人根据领域本体的概念集和内容结构建立起RDF或者HTML等标记语言的语义数据。人工语义标注比较繁琐,工作量巨大,但可以获得较准确的语义信息。对于小规模的语义系统,人工语义标注相对于自动语义标注更加容易实现。自动语义标注主要是利用一个预先创建的本体来作为指导而自动完成语义标注过程。虽然现在的自动语义标注技术相当成熟,但是这种标注方法需要限定到某一具体的领域,才能保证标注的精度,同时还有必要的人工审查。

基于本体的校园地图智能检索模型是在校园内实现的小型系统,因此采用人工语义标注的方法效率更高。对系统进行语义标注能够把地图上的物理坐标和本体的概念相互关联,使得用户检索时不仅能够检索出相关的信息,同时也能精确检索出该信息在地图中对应的位置。

2 模型的系统实现

本系统是在Eclipse软件平台下采用Apache+Java+Mysql组合开发完成。其中Java采用JDK1.6版本,并应用了Swing可视化开发组件,其图形化界面如图2所示。系统所用到的地图图片可以通过百度地图、谷歌地图或者高德地图等应用获得。同时采用Protégé本体开发软件完成对本体的构建,并利用WordNet语义词典进行本体概念上的匹配。

2.1 本体构建实例

在完成对A大学校园智能检索系统图形化界面开发后,下面以用户使用本系统搜索“在A大学就餐”为例,建立相关的领域本体。对于在校园里面就餐来说,首先会考虑的是校园内部的餐厅和校园里的小饭店,而校园里面的超市和小卖部同样也会提供就餐的服务;餐厅和食堂有相同的意思,他们都是提供食物的地方;食物包含零食,而超市和小卖铺也都提供零食。因此,以在“A大学就餐”为例,构建的本体为:将就餐这一动词作为食物的一个属性;就餐和吃饭作为等价属性;零食作为食物的子类,并将餐厅、食堂、饭店、超市和小卖部分别定义为食物和零食的父类。同时,在学校餐厅里就餐需要使用校园的饭卡并进行充值,因此定义了饭卡充值处这个类,将饭卡充值作为它的属性。类本身具有多种属性,本实例中没有把与就餐语义相关度很小的属性列举出来。该实例模型中类和属性之间的关系如图3所示。

各个类和属性之间的关联形成了一定的推理关系,其中食物作为饭店和餐厅的子类,餐厅和食堂定义为等价类,因此食物也就是食堂的子类;零食作为超市和食物的子类,把这两个类联到了一起;超市和小卖铺也定义为等价类,即在推理到超市的同时也就推理到了小卖铺;饭卡充值被定义为就餐和餐厅的交叉属性,即在餐厅就餐的时候才可以使用到饭卡,而饭卡充值又是饭卡充值处的属性,因此,就餐与饭卡充值处也具有一定的语义相关性。

图2 系统的图形化界面Fig.2 Graphical interface of system

图3 A大学本体领域一个实例模型Fig.3 An Instance Model of A University on Ontology

2.2 本体知识表示

通过OWL语言将上面构建的本体实例表示成计算机可以理解的语言。下面是部分主要的OWL语言代码:

命名空间的创建:

<?xml version=”1.0” encoding=”GB2312”?>

<rdf:RDF

xmlns =”http://www.qduedu.cn/A 大学 #”

xmlns:A大学=”http://www.qduedu.cn/A大学#”

xmlns:owl=” http://www.w3.org/2002/07/owl#”

xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”

xmlns:rdfs=” http://www.w3.org/2000/01/rdf-schema#”

xmlns:xsd=” http://www.w3.org/2000/10/XMLSchema#”>

类的创建和类之间关系的表示:

<owl:Class rdf:ID=”餐厅”/>

<owl:Class rdf:ID=”饭店”/>

<owl:Class rdf:ID=”食物”>

<rdfs:subClassOf rdf:resource=”&A 大学;餐厅”/>

</owl:Class>

<owl:Class rdf:ID=”食堂”>

<owl:equivalentClass rdf:resource=”&A 大学;餐厅”/>

</owl:Class>

<owl:Class rdf:about=”&A 大学;食物”>

<rdfs:subClassOf rdf:resource=”&A 大学;饭店”/>

</owl:Class>

<owl:Class rdf:ID=”超市”/>

<owl:Class rdf:ID=”小卖铺”>

<owl:equivalentClass rdf:resource=”&A 大学;超市”/>

</owl:Class>

<owl:Class rdf:ID=”零食”>

<rdfs:subClassOf rdf:resource=”&A 大学;超市”/>

</owl:Class>

<owl:Class rdf:about=”&A 大学;零食”>

<owl:subClassOf rdf:resource=”&A 大学;食物”/>

</owl:Class>

<owl:Class rdf:ID=”饭卡充值处”/>

类所具有的属性的表示:

<owl:ObjectProperty rdf:ID=”就餐”>

<rdfs:domain rdf:resource=”&A 大学;食物”>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:ID=”吃饭”>

<owl:equivalentProperty rdf:resource=”&A 大学;就餐”/>

</owl:Property>

<owl ObjectProperty rdf:ID=”饭卡充值”>

<owl:subClassOf rdf:resource=”&A 大学;饭卡充值处”/>

</owl:ObjectProperty>

<owl ObjectProperty rdf:ID=”饭卡充值”>

<owl:intersectionOf rdf:parseType=”Collection”>

<owl:ObjectProperty rdf:about=” &A 大学;就餐”>

<owl:Class rdf:about=”&A 大学;餐厅”>

</owl:intersectionOf>

</owl:ObjectProperty>

<owl ObjectProperty rdf:ID=”饭卡充值”>

<owl:intersectionOf rdf:parseType=”Collection”>

<owl:ObjectProperty rdf:about=”&A大学;饭卡充值处”>

<owl:Restriction>

<owl:Class rdf:about=”&A 大学;餐厅”>

<owl:minCardinality rdf:datatype = ”&xsd;nonNegativeInteger”>

1

</owl:minCardinality>

</owl:Restriction>

</owl:intersectionOf>

</owl:ObjectProperty>

上述OWL代码把基于本体的校园地图智能检索系统中一个具体应用小实例的各个类和属性之间的关系通过计算机可以理解的语言表示了出来,<owl:subClassOf>属性用于定义类和子类的关系,<owl:equivalentClass>属性是定义两个类为等价类,<owl:intersectionOf>属性是定义了饭卡充值是餐厅和就餐的交叉属性,<owl:Restriction>用来定义匿名类,匿名类是通过对其属性的约束来定义的,对应于描述逻辑中通过存在约束、全称约束和关系的基数约束等构造子的概念。本应用实例中<owl:Restriction>属性定义了饭卡充值必须限定在某个餐厅中充值。

3 系统应用效果评估

在完成对系统的建立之后,以搜索 “在A大学就餐”为例,分别在百度搜索引擎、百度地图应用和基于本体的校园地图智能检索系统中进行测试,其结果如表1所示。

通过表1可以看出:在百度搜索引擎、百度地图应用和基于本体的校园地图智能检索系统中分别检索“在A大学就餐”的结果可以看出搜索引擎和地图导航应用在查询时都是基于关键词字面匹配的信息检索,它们无法从语义上判别用户输入的信息,其返回的结果与用户输入的内容相关性很小。而基于本体的校园地图智能检索系统却能很好的解决用户输入信息语义化的问题,能够从本体上进行信息查询,同时其返回的结果都能够在地图的相应位置上有所显示,大大的提高了用户的查全率和查准率。

表1 系统测试结果对比表Tab.1 Comparison of system test results

4 结束语

针对用户在使用像百度这样的通用搜索引擎查询大学校园内部的建筑设施信息时遇到的问题,提出了基于本体的校园地图智能检索模型,运用java编程语言实现了基本的图形化界面和软件功能,并通过使用本体技术和语义标注的方法开发了一个大学校园地图的智能检索系统。该系统不仅实现了基于语义的信息检索,同时也使信息对应的物理位置能够显示在地图中,提高了用户信息检索的查全率和查准率。在以后的工作中,还应该对校园领域的本体做进一步的扩展和优化,以增加系统的应用范围和完善系统的功能。

[1]Yoo*D.Hybrid query processing for personalized information retrieval on the Semantic Web[J].Knowledge-Based Systems,2012(27):211-218.

[2]Kara S,Alan O,Sabuncu O,et al.An ontology-based retrieval system using semantic indexing[J].Information Systems,2012(37):294-305.

[3]Etzioni O,Cafarella M J,Downey D,et al.Unsupervised named-entity extraction fromthe web:an experimental study[J].Artificial Intelligence,2005,165(1):91-134.

[4]Amalanathana A,Sb S,Mb S.Semantic annotations for customizing geographical maps based on WordNet[J].Procedia Technology,2012(4):375-383.

[5]Baader F,Horrocks I,Sattler U.Description Logics as Ontology Languages for the Semantic Web[C]//Festschrift in honor of JörgSiekmann, Lecture Notesin Artificial Intelligence.Springer-Verlag,2003:228-248.

[6]荆涛,左万利,孙吉贵,等.中文网页语义标注:由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231.JING Tao,ZUO Wang,SUN Jig-ui,et al.Semantic annotation of Chineseweb pages:fromsentencesto RDFrepresentations[J].Journal of Computer Research and Development,2008,45(7):1221-1231.

猜你喜欢

饭卡充值本体
只打一个菜
眼睛是“本体”
浪漫的开始
奇妙的智商充值店
充值
基于本体的机械产品工艺知识表示
基于NFC的ETC卡空中充值服务应用系统实现
“偷偷”充饭卡,爱心更圆满
ETC网上充值平台介绍与分析
100多块啊