回族传统节日本体的构建方法研究
2018-04-09马旭明王海荣
马旭明 王海荣
摘 要 针对宁夏地区回汉混居而引发的多节日问题,以及现有事件本体模型不能充分表达和节日相关的人、事、物等之间丰富的语义关系等问题。本文提出了FEOM(Festival-oriented Event Ontology Model,面向节日的事件本体模型)和宁夏地区回族传统节日领域本体的构建方法-六步法,在此基础之上,构建了宁夏地区回族传统节日领域本体。该领域本体的构建不仅证实了FEOM的合理性和六步法的可行性,也体现了本体技术广泛的应用前景。
【关键词】本体的构建 面向节日的事件本体模型 推理机 语义 Web本体语言
1 概述
回族是我国人口较多的一个少数民族,主要集居在宁夏回族自治区。目前有关回族传统节日的记载更多的来源于一些传统的存储介质,利用本体论的思想将这些分散的、非结构化的数据进行整合,且以一种友好的方式展现给互联网用户,从而帮助用户了解回族传统节日,进而了解回族文化,这对于中国这个多民族国家来讲显得尤为重要。
事件本体是一种面向事件的知识表达方法,是一种领域本体,用来描述事件的本体模型有很多,国外有EO(Event Ontology)、SEM(Simple Event Ontology)、LODE(Linking Open Descriptions of Events)、F-Model(F)、CIDOC-CRM、ABC,国内主要有刘宗田教授的面向事件的本体模型LEO、基于本体的新闻事件模型NOEM。节日是由节日当天以人为中心的各个子事件构成,由于其具有领域特殊性,一方面子事件种类繁多,另一方面每个子事件之间还具有一定的语义关系。本文在SEM的基础之上提出了FEOM(Festival-oriented Event Ontology Model),该模型更适合用来表示回族传统节日知识。
一般来讲,有两种常见的本体构建方式:一种是依靠本体专家手工构建,另一种则是在一些机器学习方法的帮助下采用自动或半自动的方法进行构建。目前采用人工构建的方法中,具有代表性的有骨架法、TOVE法、IDEF5法、METHONEOLOGY法,而采用半自动构建的方法有七步法、五步循环法、循环获取法。本文在七步法的基础之上提出了适合回族传统节日领域本体构建的六步法,再借助Protégé本体开发工具来完成回族传统节日本体的构建。
2 相关概念与术语定义
2.1 基本概念与术语定义
本体是共享概念模型的明确的形式化规范说明。本体的形式化定义为一个五元组{C,R,HR,Rel,A},其中C为本体中概念的集合,R为关系的集合,HR表示概念间的层次关系,Rel表示概念间的非层次关系,A为公理。
為了形成对宁夏地区回族传统节日领域知识的统一认识,下面对和事件相关的几个核心类进行了明确的定义。
定义1 事件(Event):指所有发生了的事情,大到历史事件,小到神话传说。
定义2 参与者(Actor):指主动或者被动参与事件的实体,可以是有生命或无生命的,也可以是物质或非物质的。
定义3 地点(Place):指事件发生的场所,不一定非得是现实存在的地方。
定义4 时间(Time):是事件所发生事件的一种表示符号,不一定需要确切的时间戳。
2.2 宁夏地区回族传统节日领域本体构建方法
在众多本体构建方法中具有代表性的有骨架法、TOVE法、IDEF5法、METHONEOLOGY法、七步法、五步循环法、循环获取法。本文在七步法的基础之上提出了一种适合宁夏地区回族传统节日领域本体构建的方法,即六步法:
(1)确定本体描述的领域并设置“能力问题”。文中本体所要描述的是和宁夏地区回族传统节日相关的知识。而“能力问题”是指该本体所能够回答的问题。
(2)列举宁夏地区回族传统节日领域内重要的概念。文中主要借助百度百科、《中国穆斯林的礼仪礼俗文化》等来获取和规范相应的概念,并对列出的概念进行分析获取它们之间的语义关系。
(3)定义类和类之间的层次结构。从列出的概念中选出那些具有一般性的且表示一类术语的集合的概念作为本体的类,并建立类之间的层次关系。
(4)定义属性。包括表示实例和实例之间关系的对象属性以及描述实例取值的数据属性。
(5)创建实例。将回族传统节日领域内具有不可再分性的对象作为实例添加给相应的类,再结合步骤
(4)完善实例间的语义关系。
(6)本体的检测。利用推理机和推理规则在该本体上获取新的知识,试图回答步骤(1)中所设置的“能力问题”。
3 宁夏地区回族传统节日领域知识分析
3.1 宁夏地区回族传统节日知识分类体系
构建宁夏地区回族传统节日领域本体的前提是根据该领域的知识特征对其分类,这是一项复杂的科学认识活动,旨在通过领域细分建立知识的分类体系。根据宁夏地区回族传统节日领域知识的特征,再结合FEOM模型将该领域内的知识按照事件(Event)、参与者(Actor)、地点(Place)、时间(Time)进行分类,图1为古尔邦节知识分类层次结构图。
3.2 基于FEOM的宁夏地区回族传统节日领域本体类和属性的定义
宁夏地区回族传统节日的知识分类从各个角度分别表示了和节日相关的各个事件、参与者、地点以及时间,但是,知识分类仅仅是将回族传统节日相关的知识进行了选取和归类,还不能表现出各个概念之间的关系。而本体是对传统节日领域知识的共享概念模型进行明确的形式化规范说明,它描述了领域中重要的概念以及它们之间的关系。
SEM是一个以事件为中心的本体模型,该模型适用于多个领域,像文化遗产、地理和多媒体等。主要描述了和事件相关的人、物、地点以及时间之间复杂的关系,共有17个类和24个属性。而节日也是由节日当天的一系列事件构成,但节日除了有事件的特性之外还有其自己的特性,比如节日当天的美食、着装等。故将SEM的部分类和属性进行了取舍和添加,如图2所示。属性方面也做了较大的调整,如图2所示。
4 宁夏地区回族传统节日领域本体构建
4.1 本体表示语言
目前国际上主要的本体描述语言有RDF、RDFS、DAML+OIL、OWL等,它们都是基于RDF发展起来的,其中OWL是W3C的推荐标准,目前最新的版本是OWL2。OWL提供了三种表达能力递增的子语言:OWL Lite、OWL DL、OWL Full,分别用于特定的实现者和用户团体。考虑到语言的表达能力和推理能力,选用OWL Lite作为回族传统节日领域本体的描述语言。本文截取以下代码来简要说明OWL Lite的语义描述与表达。
[6]Lagoze C,Hunter J.The ABC Ontology and Model[C].International Conference on Dublin Core and Metadata Applications.National Institute of Informatics,Tokyo,Japan,2001:160-176.
[7]刘宗田,黄美丽,周文等.面向事件的本体研究[J].计算机科学,2009,36(11):189-192.
[8]王伟,赵东岩.中文新闻事件本体建模与自动扩充[J].计算机工程与科学,2012,34(04):171-176.
[9]余凡.领域本体构建方法及实证研究[M].武汉大学出版社,2015.
[10]胡兆芹.本体与知识组织[M].中国文史出版社,2014.
[11]Ye Y,Yang D,Jiang Z,et al. Ontology-based semantic models for supply chain management[J].International Journal of Advanced Manufacturing Technology,2008,37(11-12):1250-1260.
[12]李恒杰,李军权,李明.领域本体建模方法研究[J].计算机工程与设计,2008,29(02):381-384.
[13]Noy N F,Mcguiness D L.A Guide to Creating Your First Ontology[J]. Stanford University,2001(02):14.
[14]Maedche A,Staab S.Ontology Learning for the Semantic Web[M].Ontology learning for the semantic Web.Kluwer Academic Publishers,2002:72-79.
[15]Volz R,Maedche A.Extracting a domain-specific ontology from a corporate intranet[C].The Workshop on Learning Language in Logic and the,Conference on Computational Natural Language Learning. Association for Computational Linguistics,2000:167-175.
[16]Studer R,Benjamins V R,Fensel D. Knowledge engineering:principles and methods.Data Knowl Eng 25(1-2):161-197[J].Data & Knowledge Engineering, 1998,25(1-2):161-197.
作者簡介
马旭明(1986-),男,宁夏回族自治区石嘴山市人。硕士研究生在读,工程师+讲师。研究方向为语义Web数据模糊查询。
王海荣(1976-),女,宁夏回族自治区银川市人。博士研究生,副教授。研究方向为大数据与知识工程。
作者单位
北方民族大学计算机科学与工程学院 宁夏回族自治区银川市 750000