APP下载

基于邯郸市的旅游本体构建研究

2020-11-10张宇飞李腾贾东立

电脑知识与技术 2020年27期
关键词:旅游

张宇飞 李腾 贾东立

摘要:针对旅游领域信息过载、语义异构的问题,该文以“邯郸市”为例研究了旅游本体构建工作。首先将本体的概念进行了介绍、将几种目前比较具有代表性的本体描述语言和本体构建做出了研究和对比;然后选择参考医学领域运用较多的“七步法”、采用斯坦福大学医学院开发的Protege本体编辑软件,经过旅游领域内类(Classes)的定义、类之间层级关系和各类具体属性的定义以及为各个类添加实例几个步骤,完成了邯郸市旅游本体构建。文章通过本体技术将旅游信息进行合理的整合,完善地解决了语义异构问题,极大地提高了搜索效率。

关键词:旅游;本体构建;七步法;Protege

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2020)27-0238-03

开放科学(资源服务)标识码(OSID):

1 背景

随着信息时代的到来,人们的生活方式逐步发生着翻天覆地的变化。就旅游领域来讲,海量的网络资源可以向游客提供多方面关于景区的数据,这在方便游客掌握景区信息的同时也强有力地推动着旅游业的蓬勃发展。然而,目前的市场情况却是由于搜索引擎和旅游类垂直网站种类繁多,其中提供的信息又无法做到精确及统一,进而导致了信息过载、语义异构等问题不断浮出水面。对此本文提出关键的解决方案,即构建完整的旅游本体[1]。

本文不仅从本体的概念、描述本体的语言和构建本体的方法几方面对本体技术进行了知识层面的介绍,还参考“七步法”、选择Prot696本体编辑软件,以“邯郸市”为例构建了邯郸市旅游领域的本体,实现了本体技术从知识层面向实际应用层面的延展。本文对于邯郸市旅游领域本体构建的基本流程如下,首先对旅游领域中的景区、地址、餐饮、住宿、等级五大父类以及各父类的下级子类进行定义,然后将各类的重要属性和类与类之间的关键关系进行描述和定义,最后为添加实例步骤,确保为每一个类都添加至少一个具体实例,使旅游领域本体的构建工作得以顺利完成。

2 本体技术的研究

2.1本体的概念

本体( Ontology) -词是在17世纪首次出现的,在哲学领域表示对现实世界中的客观事物进行的描述。随着时代的迅速发展,本体概念不再局限于哲学范畴,从20世纪90年代开始,信息科学领域的学者不断对其进行研究与应用。然而该领域的不同专家对于“本体”给出了多个版本的定义,其中认可度较高的是格鲁伯( Gruber)教授提出的观点[2],即“本体论是对概念化的精确描述,用于描述事物的本质”。

对于本体的表示形式,最常见的是被表示成{C,R,P,C,I)的五元组形式[3],现将各要素的具体含义解释如下。

1)概念( Concept),或称为类(Class):在客观世界中,任何事物都可以定义成一个类。比如在旅游领域可以将旅游景区作为一个类,也可以将景区所在的地区作为一个类。

2)关系( Relation):用于连接两种类,表示类与类之间的相互联系。比如京娘湖位于武安市,其中京娘湖属于景区类,武安市属于地区类,那么“位于”即景区类与地区类之间的关系。

3)属性( Property):任何一类事物都有它自身的特征,属性即用于描述事物的这些具体特征。比如景区的属性有景区名称、景区的建立时间等等。

4)约束( Constraint):用于在本体构建时,对于事物属性的取值范围、取值类型以及对实例选取的一些限制条件。比如对于景区门票这一属性,必须限制为数字类型并且其单位规定为‘元。

5)实例(Individuals):表示每个类中包含的具体对象,每个实例都拥有其所属类的所有属性和关系。例如京娘湖、丛台公园都是景区类的实例,武安市、丛台区都是地区类的实例。

2.2 本体的描述语言

随着各领域对本体技术不断深入地研究,其描述语言的种类也在持续增多。目前受到广泛认可的有基于谓词逻辑和基于Web的两种语言[4]。其中,第一类描述语言中比较有代表性的有Cycl、LOOM、Ontolingua和OCML等;第二类描述语言中比较有代表性有SHOE、OWL、RDFS和XOL等。在王向前學者的文献[5]中不仅给出了这些本体描述语言的具体解释,还从主要元素(概念、多元关系、函数、过程、实例、公理、产生式规则、形式语义)的有无、推理机制的是否可自动分类、有无单调性、限制性检验的有无、是否可实现多重继承、错误处理等特征进行了多方面对比。但是通过优缺点结果分析,得出了一条结论,内容为‘目前还没有一种语言可以在本体描述和知识推理方面均做到完美表达。所以需要使用者在应用前着重对比与评估,根据需求选择最合适以及高效的那一种描述语言。

2.3 本体的构建方法

除了本体的描述语言外,对于本体的构建方法也是多种多样的。现将各领域使用较频繁的TOVE法、骨架法、KACTUS法、七步法[6]和循环获取法做出介绍:Tove法的关键在于逻辑模型的构建;骨架法的关键是在流程导向的构建;而KACTUS法和七步法的关键在于知识本体的构建;最后的循环获取法顾名思义关键在于循环,该方法可以与其他方法结合使用,以利于构建结果更加优化。

对以上五种本体的构建方法进行多方面的比较[7],结果如下:就应用领域而言,TOVE法和骨架法更适合企业;KACTUS法更适合网络;七步法主要应用在医学领域;循环获取法则凭借其特有的优势可以在多领域得到有效运用。就构建方式而言,TOVE法和骨架法的构建方式均为人工形式,七步法和循环获取法均为半自动形式,而KACTUS法的构建方式是不确定的。在演进方面,除了循环获取法外其他四种方法均不支持演进的。根据各方法的详细程度,将以上五种构建方法由低向高排序为骨架法、TOVE法、KACTUS法、七步法和循环获取法。就成熟度而言,七步法是几种方法中最成熟的一个。综上,每个方法都有其自身的优缺点,也有比较适合的应用领域,在本体构建时可以通过几种方法结合使用,使各方法可以做到扬长避短,达到最优效果。

3 邯郸市旅游本体的构建

根据旅游领域的自身特点,以及第二章对于本体在应用方面的分析,本文选择结合“七步法”与文献[8]中给出的“六步法”对邯郸市旅游本体进行构建[9],选择使用界面简洁友好、可扩展、功能强大的Protege本体编辑软件实现该构建工作。

3.1邯郸市旅游本体的构建过程

1)确定本体领域及范畴:本文确定构建旅游领域的本体,并将“邯郸市”作为具体研究范围。

2)列出重要术语:对于旅游,文章从尽可能做到住、食、游、行面面俱到的初心出发,前期通过线上线下两种方式对游客在旅游中最关心的几类问题进行了探讨和研究,总结出的专业术语有:景区、酒店、餐饮、特产、文化、星级、地址、游戏等。

3)定义类及其中的层级关系:通过对邯郸市内的景区以及景区周边进行详细调研和评估后,将邯郸市旅游本体定义了景区、住宿、等级、餐饮、地区五大父类,各父类又有下级子类,比如景区父类分为游乐场所、自然风光、休闲广场等子类,地区父类包含丛台区、涉县、武安市、魏县等子类,餐饮父子下小吃街、特色饭馆、快餐子类,住宿父类下有酒店、宾馆、民俗子类。具体内容见图1本体部分类层级图。

4)定义类的属性:表示某类对象的具体特征。其中景区类的属性有景区的面积、门票、海拔、建造时间、开放时间和景区别称;餐饮类的属性有餐厅的地理位置、联系方式和菜品的种类、价格;地区类的属性有地区的名称、邮编;住宿类的属性有房间的价格、楼层数、客房的面积以及住宿地与景区的距离。在图2属性信息图中展示了本文中所有类的属性信息。

5)定义类的关系:表示个体与个体之间,或者类与类之间的联系,本文包括父類与子类的关系inherit;景区与地理位置之间的关系locate和与之相反意义的关系located;景区与等级之间的关系grade。类的关系信息描述见图3本体关系图。

6)添加实例:在Protege软件中的Individuals by class界面通过Instance命令为每个类添加了至少一个有代表性的实例,使本体构建更加完整。

3.2 邯郸市旅游本体的构建结果

经过以上步骤的处理,对于邯郸市旅游领域的可视化本体结果如图4本体构建结果图所示,图4展示了本文描述的所有类、关系、属性和实例。图中的矩形代表类以及实例,其中前面带有黄色圆形的矩形框代表各个实体类,带有紫色菱形的矩形框代表为各个类添加的具体实例。图中带箭头的连接线代表关系,其中蓝色连接线代表父类与子类之间的上下级关系;紫色连接线代表某类包含的具体实例;黄色连接线代表景区与其所属等级之间的关系;橙色连接代表景区与其所在地址之间的关系。

4 结束语

本文主要以“邯郸市”为例研究了旅游领域本体的建构问题。经过严密的调研和评估,首先明确了景区、住宿、等级、餐饮、地区五大父类,又根据“邯郸市”的具体旅游特征将各父类下分了自然风光、小吃街、民宿、酒店等子类。然后从百科类网站(百度百科、互动百科)和旅游类垂直网站(携程网、去哪儿网)中采集了文中各类实体的属性、抽取了类与类之间的关系,对旅游本体进行形式化的描述,再为各个类添加实例对象,最终完成了邯郸市旅游领域本体的构建工作。但是经过本次对于邯郸市旅游本体的构建,也发现目前市面仍缺少特别完善、专门适用旅游领域的本体构建方法、工具等。在此期望本文可以对旅游领域的本体技术的优化有所贡献,也期待经过更多学者不断地研究与探索可以使该技术拥有更广泛以及有意义的应用。

参考文献:

[1]赵硕,诸云强,宋佳,等.全要素旅游本体研究与模块化构建[J].地理与地理信息科学,2020,36(3): 10-17.

[2]袁军.黔南民族特色文化资源元数据与领域知识本体构建[J].电脑知识与技术,2019,15(11): 216-218.

[3]马旭明,王海荣.本体构建方法与应用[J].信息与电脑(理论版),2018(5): 33-35,38.

[4]任飞亮,沈继坤,孙宾宾,等.从文本中构建领域本体技术综述[J].计算机学报,2019,42(3): 654-676.

[5]王向前,张宝隆,李慧宗.本体研究综述[J].情报杂志,2016,35(6): 163-170.

[6]郝培豪+安保警务知识图谱构建研究[D].北京:中国人民公安大学,2019.

[7]余凡.领域本体构建方法及实证研究[D].武汉:武汉大学, 2013.

[8]戚利娜.基于张家界的旅游本体构建研究[J].科技创新与应用,2018(28): 76-78.

[9]闫晓鹏.基于山东省的旅游本体构建研究[J].信息技术与信息化,2019(9): 178-180.

【通联编辑:谢媛媛】

作者简介:张宇飞(1995-),女,河北唐山人,硕士,研究方向为自然语言处理;李腾(1994-),男,河南安阳人,硕士,研究方向为信息安全;贾东立(1972-),男,河北邯郸人,副教授,博士,主要研究方向为智能信息处理。

猜你喜欢

旅游
我们一起“云旅游”
旅游惊魂
一起去旅游
自己去旅游
旅游助脱贫 同步奔小康
以茶为媒 促旅游开发
从旅游看人的自我超越
出国旅游的42个表达
户外旅游十件贴身带