APP下载

基于网络环境下中文叙词表本体知识表示的研究

2013-04-29全红

决策与信息·中旬刊 2013年7期
关键词:词表本体文档

全红

本文从本体知识表示基础上出发,采用OWL描述本体知识,阐述了OWL语言的描述叙词表的方法及其本体转化的过程,为中文叙词表的网络化和智能化发展提供了技术上的参考.

基于OWL语言描述网络叙词表的方法

由于互联网的发展,出现了像谷歌、百度等大型网络搜索引擎,可以通过日志标注来获取用户检索用词的种类频次,叙词表由叙词及叙词之间关系组成,采用参考符号显示并清楚的区分间叙词间基本语义关系,习惯上主要分为3种:①等同关系(Equivalence Relationship)又称同一关系、用代关系,指含义相同或相近的叙词与非叙词之间的关系;②等级关系(Hierarchical Relationship),包含属种、整部和多层级关系;③相关关系(Associative Relationship),又称类缘关系,表示一个概念与另一个概念相关。通过“、代、属、分、族、参(分别以汉语拼音字母首字Y、D、S、F、Z、C表示)”示叙词关系。其中,“Y、D”表示同一关系“S、F”等级关系,“Z”表示一组词中最大的族首词,“C”表示相关关系。在OWL语言中,用类、个体与属性等关系语句描述实体间的关系,用OWL描述叙词间的关系,与(汉表)的叙词关系表示有很多相似的地方和相应的语句。如图1所示。

(三)相关关系的OWL描述

基于OWL语言网络环境下本体知识表示

中文敘词表作为一种规范化词表,在信息结构化检索中起到准确匹配的作用。但同现有的本体相比,中文叙词表更多的面向人而不是面向计算机构建,没有采用计算机形式化语言表述,因而限制其发展。我国专家利用一些本体加以利用构建新的的本体,以寻求语义网环境下的新的发展[4]。

在OWL知识表示中,首先需要对信息资源和知识资源进行面向对象,抽取对象概念以及他们之间的关系,然后遵循OWL知识表示的语法要求,建立对应的抽类(包括概念、属性、关系等),并将这些类存放在一个OWL类型声明文档中,然后再定义这些类的实例,放到另一个OWL知识文档。有这些OWL文档构成知识库。

基于OWL环境下网络叙词表本体转化

当前,本体是图书情报领域的研究热点。英美两国以对其受控词表的编制标准进行了修订等;2005年,美国国家信息标准组织NISO发布了Z39.19的四版Z39.19-2005,而同年英国标准协会(British Standards Instiution,BSI)也发布了BS5723的升级版本。说明国外在这方面的研究已取得了第三阶段,而我国中文叙词表电子化网络化的发展整体水平方面还比较薄弱。总结OWL描述的网络叙词表的本体转换的步骤。

本体重在概念及其关系的体现,其内在的关系规则在表达不同词之间的等同、从属和相关关系的同时,也提供一种推理的机制。因此,应充分利用叙词表进行本体的构建,将叙词表转化为本体等在网络时代知识组织系统中发挥作用。

(一)准备阶段

主要任务是分析叙词表,叙词表的概念模型作为本体转换的背景知识的分析,概念模型和数字模型之间的关系的分析。

(二)类和属性确定

从叙词表到OWL的语义转换规范,只有这样才能充分利用现有词表资源进行OWL描述,缩短工作时间,减轻劳动效率。通过一系列准备步骤可以通过建立通用的转化规则映射表来实现。

(三)描述阶段

按照前面步骤中确定的关系、类、属性和语法、语义对照表进行表示和描述。

在转化过程中应该遵循以下规则:使用基于XML的数据类型;尽量保持原始命名;尽量和叙词表的原始结构保持相近;不要转化一些与语义无关的命令信息,避免信息过量。

(作者单位:新疆石河子大学图书馆)

猜你喜欢

词表本体文档
Abstracts and Key Words
有人一声不吭向你扔了个文档
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
对姜夔自度曲音乐本体的现代解读
基于RI码计算的Word复制文档鉴别
叙词表与其他词表的互操作标准
《我应该感到自豪才对》的本体性教学内容及启示
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
Care about the virtue moral education
国外叙词表的应用与发展趋势探讨*