知识元表示方法研究
2015-09-08高国伟王亚杰李永先
高国伟 王亚杰 李永先
[摘要]随着数据和信息的日益增长,找到恰当的知识已成为真正的挑战和急待解决的任务。如何表示知识元则是实现知识检索的关键问题,这一问题一直困扰着人们从数据检索、信息检索向知识检索跨越。本文在对现有知识元表示研究评述的基础上,提出了“概念、关系、问题”三元组的知识元表示方法,介绍了该方法的特点,并分别对概念、关系、问题表示进行了形式化描述,最后通过应用实例证明了该表示方法的有效性和实用性。
[关键词]知识检索;知识元;知识元表示;知识库
DOI:10.3969/j.issn.1038-0821.2015.03.003
[中图分类号]G302 [文献标识码]A [文章编号]1008-0821(2015)03-0015-04
知识元的表示是一个符号化和形式化的过程,如何构建相应的知识元形式化描述方法和知操作方法是实现知识检索的关键问题。随着知识管理领域的不断发展,众多学者提出不同的知识元表示方法,并在知识元研究领域取得了一定进展。文献[2]提出用树结构来组织和表示知识元;文献[3]采用了框架表示法,利用二元组标记知识元;文献[4]采用面向对象法,利用三元组表示数值型知识元的结构;文献[5]采用基于本体的知识表示方法建立文本知识元的抽取实验提出了四层知识元模型;文献[6]采用谓词逻辑表示法,利用五元组来表示知识元的结构;文献[7]采用产生式表示法,利用六元组表示数值型知识元;文献[8-9]定义了一个七元组知识元模型:KE:=(id,T,CT,st,tc,title,did);文献[10]抽象地给出了一系列关于模型和知识的概念,进而提出了模型知识元的概念;文献[11]给出面向非常规突发事件演化分析的知识元表示模型;文献[12]通过不同层次模型参数与知识元属性之间的映射,实现通过模型组合网络进行模型组合。
以上研究为知识元表示方法提供了很好的研究思路和方法,但仍存在以下问题:(1)二元组、三元组表示方法局限于文本知识元的表示及建构,仅侧重于对知识元客体的描述,忽略了对知识元之间关系的表达;(2)四元组、六元组、七元组的表示方法,使得知识元的结构化程度日益增高的同时,表达方式显得冗长,知识元之间关系的描述工作量大,造成推理不完备的隐患;也增加了计算机对自然语言处理的难度,造成在实际的中文文本知识元抽取过程中,计算机对语义内容的误解,使得知识元抽取的准确率下降,造成文本结构的破坏。
本文借鉴本体论和认识论,从客观知识世界本原角度出发,从实体和关系层面约束知识元,进而对这些约束的知识元进行分析,在模型知识元的基础上,进行相应扩展,提出了“概念、关系、问题”的知识元表示方法。该表示方法主要揭示了知识元属性间约束,以及知识元之间的关系,对知识元的粒度性做出形式化的描述,从根本上提高了计算机对文本知识元抽取的准确率。endprint