论知识表示
2014-08-08马创新
基金项目:本文系江苏高校重点研究基地重大项目“先秦文献词汇知识挖掘”(项目编号:2010JDXM023)的研究成果之一。
作者简介:马创新(1980-),男,博士研究生,研究方向:知识组织与计算语言学。·理论探索·
〔摘要〕知识必须具有适当的表示形式才能便于使用,为了探索适合于人类和计算机使用的知识表示方法,文章首先分析了知识表示的完整过程,探讨知识表示的方法体系,然后介绍了几种主要的知识表示方法,并且构建了知识表示方法的评价框架,利用该框架从认知层面、本体层面和实现层面对几种主要的知识表示方法进行考察。
〔关键词〕知识表示;方法;体系;比较研究
DOI:10.3969/j.issn.1008-0821.2014.03.005
〔中图分类号〕TP311〔文献标识码〕A〔文章编号〕1008-0821(2014)03-0021-04
The Research of Knowledge RepresentationMa Chuangxin
(College of Liberal Arts,Nanjing Normal University,Nanjing 210097,China)
〔Abstract〕Knowledge must have appropriate representation as to facilitate the use of human and computer.In order to explore the methods of knowledge representation suitable for humans and computers,this article first analysed the complete process of knowledge representation and discussed the methodology of knowledge representation.Then it introduced several main methods of knowledge representation.And it built a knowledge representation framework for evaluation,and estimated several main methods of knowledge representation from the cognitive level,the ontology level and the implementation level by the framework.
〔Keywords〕knowledge representation;method;system;comparative study
知识表示是知识组织的基础和前提,知识重组、知识聚类、知识存检、知识编辑、知识布局和知识监控等其他知识组织方式都要建立在知识表示的基础上[1]。知识表示方法能够影响到知识在使用过程中的完备性、共享性和有效性。对于同一知识,人们可以采用不同的方法来表示,也会因此产生不同的表示效果。
1知识表示的完整过程
从一般意义上讲,知识表示就是为描述世界所做的一组约定,是知识的符号化、形式化或模型化;从计算机科学的角度来看,知识表示是研究计算机表示知识的可行性、有效性的一般方法,是把人类知识表示成机器能处理的数据结构和系统控制结构的策略[2-3]。
一个完整知识表示过程是:首先是设计者针对各种类型的问题设计多种知识表示方法;然后表示方法的使用者选用合适的表示方法表示某类知识;最后知识的使用者使用或者学习经过表示方法处理后的知识。所以,知识表示的客体就是知识;知识表示的主体包括3类:表示方法的设计者、表示方法的使用者、知识的使用者。具体来说,知识表示的主体主要指的是人(个人或集体),有时也可能是计算机。
知识表示的过程如图1所示。图1中的“知识Ⅰ”是指隐性知识或者使用其他表示方法表示的显性知识;“知识Ⅱ”是指使用该种知识表示方法表示后的显性知识。“知识Ⅰ”与“知识Ⅱ”的深层结构一致,只是表示形式不同。所以,知识表示的过程就是把隐性知识转化为显性知识的过程,或者是把知识由一种表示形式转化成另一种表示形式的过程。
2知识表示的方法体系
狭义的知识表示方法专指计算机科学领域使用的知识表示方法,指的是各种不同的适合于机器处理的、形式化
图1知识表示的完整过程〖〗
的知识模型;广义的知识表示方法是指人类所使用的用来表示知识的所有方法,既包括逻辑、框架、语义网络等替代表示方法,也包括图形、图像、声音等直接表示方法。为了能够在开阔的视野下对知识表示方法做全面分析,在本文中,如果没有特别强调,所提到的知识表示方法都是广义的。
人类社会在进化过程中不断地创造新的知识,同时也在不断地探索新的知识表示方法。在计算机诞生之前的几千年里,人们都是在探索面向人类使用、理解和学习的知识表示方法,比如图像、文字和语言等,这些表示方法是人类集体智慧的结晶,并且被人们普遍接受和使用;在计算机诞生之后,人们开始探索面向计算机处理的知识表示方法,比如:产生式、逻辑、框架、面向对象等等,这些方法是领域专家们创造出来的研究成果,通常被应用于特定的领域。所以,可以把知识表示方法先分为“面向人的知识表示方法”和“面向计算机的知识表示方法”两大类。图2展示了知识表示方法体系。
图2知识表示方法体系
面向人的知识表示方法主要有图形、图像、地图以及语言符号系统、其他符号系统等。图形采取与自然世界一致、直接或拟真的方式表示知识,与符号相比,更符合人类的心理认知特点。语言符号系统一般由语音符号系统和文字符号系统组成,但是世界也有一些语言只有语音符号系统,而没有文字符号系统。由于语言符号具有二义性和模糊性,虽然人类的智能能够理解用语言符号表示的知识,但是无法满足计算机精确表达的要求,不适合在当今的计算机上处理。
面向计算机的知识表示方法并不是伴随着计算机的诞生凭空出现的,它是以面向人的知识表示方法为基础,再结合计算机处理知识的特殊要求,本着“必须能够被计算机接受”这个先决条件,由领域专家们创造的。面向计算机处理的知识表示方法又可以再分为直接表示法和间接表示法。直接表示可以视为外部表示,它强调表示与被表示实体间具有结构相似性,如图形、地图等;间接表示可以视为与计算机处理数据的方式相一致的内部表示,它主要是以符号系统为基础设计的形式化表示方法,用符号替代被表示实体,间接表示法可以是结构化的,如框架、语义网络、面向对象、本体等,也可以是非结构化的,如产生式、逻辑等等。
根据所表示知识的作用类型,间接表示方法又可以相应地分为陈述性知识的表示方法、过程性知识的表示方法和控制性知识的表示方法3种。陈述性知识的表示方法有一阶谓词逻辑、框架结构、语义网络等方法;过程性知识的表示方法有模式调用程序、产生式规则、逻辑表示法等;控制性知识的表示方法有状态空间搜索算法、问题归约法、约束传播法等[4]。
endprint
长期以来,由于间接表示法能够满足计算机符号化、形式化、模型化和精确化的要求,所以它得到了充分的发展。而直接表示法描述知识的范围相对受限,难以表示定量知识,并且直接表示的知识具有很强的领域相关性,计算机难以处理,所以从计算机产生之后的较长时间里,直接表示法没能得到长足的发展。然而,近些年来,在人工智能关于知识表示方法的研究中,关于知识的直接表示方式的研究正日益受到重视,因为许多智能行为的知识的表示形式就是对直接的知觉经验进行记忆的结果,抽象的符号化表示不利于某些智能行为在知识获取和知识应用间的知识表示水平上的衔接,符号主义的思想不能延伸到以语言为代表的高层抽象思维之外的认知层次上去,符号主义只适合表示结构化的知识[5]。总之,面向计算机处理的知识表示方法是以面向人的知识表示方法为基础,再考虑到计算机的可实现性而设计的。
3面向计算机的知识表示方法
31几种常用的方法
面向计算机处理的知识表示方法是知识工程师对领域知识的事实和关系的一种模型化,迄今为止,已经有多种知识表示方法得到了深入的研究。接下来,分别介绍这些方法的特征和优缺点,并进行综合分析和比较。
311状态空间表示法
状态空间表示法是人工智能中最基本的形式化方法,它源于早期的问题求解系统和博弈程序。它本身并不是一种知识表示形式,而是利用它在问题的各种可能状态集合中做出有效的选择,从而表示问题的结构[6]。状态空间表示法求解问题的一般步骤是:先定义一个状态空间,它包含相关对象的各种可能的排序;再规定一个或多个属于此空间的开始状态和目标状态;然后规定一组规则,用来描述可采取的操作或算子;将非形式化的问题描述转换成形式描述,画出描述问题的状态图;再分析哪些特征对求解问题影响最大,用规则和相应的控制策略去遍历问题空间;最后选择最佳技术去求解待解问题,找出从开始状态到目标状态的某条路径[7]。搜索状态空间时,可以使用数据驱动的向前搜索法,也可以使用目标驱动的向后搜索法。向前搜索是从开始状态出发,寻找到达目标状态的路径;向后搜索是从目标状态出发,逆向搜索到达开始状态的路径。
312谓词逻辑表示法
人类智能的一个杰出方面是人类具有逻辑思维能力,人工智能先驱者所追求的一个主要目标就是使机器也具有这种能力。在人工智能中,无论是逻辑主义、还是认知主义和工程主义,都认为任何思想和概念都要加以形式化表达,这就需要采用一种形式化语言。最方便的还是采用数理逻辑中的符号语言,它是一种类自然语言的形式语言[8]。谓词逻辑表示法就是指各种基于形式逻辑的知识表示方法,利用它可以表示事物的状态、属性、概念、因果关系等。如“张三在2号房间内”可以描述成:INROOM(ZHANGSAN,room2)。使用逻辑法表示知识,需要将以自然语言描述的知识通过引入谓词、函数来加以形式描述,获得有关的逻辑公式,进而以机器内部代码表示[3]。
313产生式表示法
产生式系统依据人类大脑记忆模式中的各种知识之间的因果关系,用“IF THEN”的规则形式捕获人类问题求解的行为特征,并通过认知-行动循环过程求解问题。
一个产生式系统的基本结构包括全局数据库、规则库和控制系统3个主要部分。全局数据库也称为工作存储器、上下文等,它是数据的集合,是用来存放与求解问题有关的各种当前信息的数据结构。规则库是作用在全局数据库上的一些规则的集合,相当于系统的知识库,它采用“IF〈前件〉THEN〈后件〉”的形式,来表达求解问题所需要的知识。控制系统是负责选择规则的决策系统,对应着的是控制性知识,任务是对规则集与事实库的匹配过程进行控制,决定问题求解过程的推理线路。
314语义网络知识表示
语义网络是由JRQuillian在他的博士论文中作为人类联想记忆的一个显式心理学模型提出的。他认为,在处理自然语言词义理解问题时,必须把语义放在首位,词义只有在它所处的上下文环境中才能准确把握。西蒙在1970年正式提出了语义网络这个概念,并将其应用于自然语言理解系统。语义网络不同于语义网,语义网络是一种知识表示方法,而语义网是由万维网的延伸,语义网通过加入可以被计算机“理解”的语义,使得对文本含义的理解不再是人的专利,计算机同样可以完成相同的工作。
语义网络由一组节点和若干条有向弧线构成。带有标识的节点表示各种事物、概念、事件、动作、属性和状态等,它可划分为实例结点和类结点两类;结点之间的有向弧表示结点之间的语义联系。也可以把语义网络看作是由多个语义基元用相应的语义联系关联在一起的,一个语义基元可用三元组“(结点1,弧,结点2)”表示。弧具有方向、标注或权重,表明两个结点之间联系的具体信息。常用的语义关系有类属关系、包含关系、属性关系、位置关系等等。
315框架表示法
框架表示法是基于框架理论的结构化知识表示方法。框架理论是由MMinsky于1975年提出,该理论认为,人们在遇到一个新事物时,常使用从过去经验中积累起来的知识,由于过去的经验是由多个具体事例、事件组成,人们无法记住所有细节,对于各种事物的认识都是以一种类似于框架的结构形式予以存储。当遇到一个新事物时,就从记忆中找出一个合适的框架,并把新的数据加入到这种结构中从而形成一个具体的实例框架。
每个框架都有一个框架名,框架由一组用于描述框架各方面具体属性的槽组成,每个槽又有槽名和对应的填充值。在复杂框架中,槽下面还可以有多个侧面,每个侧面又有取值,用以对槽做进一步说明。
316面向对象表示法
面向对象方法是一种混合型的知识表示模式,它依据面向对象的程序设计原则将产生式、框架等多种知识表示方法混合在一起来解决知识表示的问题。面向对象理论认为,传统的程序设计语言是以数据和数据结构为中心,借助复杂算法操纵数据来求解。实际上,客观世界的问题都是由实体与实体之间的相互关系构成,人们在分析问题时,习惯于把问题分解为一些对象以及对象之间的组合和联系。显然传统程序语言的方法与人们认识客观世界的思维习惯相去甚远。面向对象理论提出了“对象”概念,程序设计者可以按照问题空间中实体的丰富特征定义对象,这种方法比较自然地反映了人们思考问题的方式。
可以用四元组“对象∷=〈ID,DS,MS,MI〉”表示一个对象的形式定义,对象是由该对象的标识符ID,数据结构DS,方法集合MS和消息接口MI所组成。一个复杂对象可以由多个简单的对象组成,对象的外部接口以对象协议的形式提供。面向对象方法强调封闭性和模块性,把对象的外部定义和对象的内部实现分开,对象的设计者与对象的使用者分开,使用者无须知道对象内部细节,只需要知道对象协议中的消息便可访问该对象[8]。
317本体表示法
“本体”概念最初存在于哲学领域,在哲学中把本体定义为“对世界上客观存在物的系统地描述。”[9]后来人工智能领域引入了本体论,在人工智能领域,对于本体这一概念存在着多种解释,引用最为广泛的是WNBorst博士提出的“本体是共享概念模型的形式化规范说明。”[10]作为一种结构化的知识表示方法,本体能够把某个领域抽象表达为一组概念和概念之间的关系。本体概念的规范性以及良好的概念层次结构和对逻辑推理的支持,使其能够获取领域中本质的概念结构。本体还能够展示领域中丰富的语义关系,并且可以保证语义的一致性。
endprint
用本体来表示知识的主要目的是统一应用领域的概念,实现某种程度的知识共享和重用。本体能够克服不同领域环境中各异的词汇表、方法、表示和工具产生的障碍,通过采用共识的方法来概念化领域,并用某种语言使之清晰,以获得共享理解。由于本体在知识表示方面具有多方面优势,所以它在语义WEB、信息抽取、信息交换和专家系统等领域得到广泛应用[11]。
32知识表示方法的比较与评价
国内外研究者对于知识表示方法的评价标准进行过深入研究,比如:Winston[12]认为好的知识表示规范应具有以下特征:①能清晰提示出重要的知识。②能提示事实之间的自然约束属性。③完备地高效地表示所有需求。④可理解的和可计算的。⑤可压缩的。
何绍华等[13]在前人研究的基础上构建了一个比较和评估各种知识表示方法的框架,该框架有表示充分性、表示属性、支持的推理方法、推理属性共4个维度,然后使用该框架对逻辑、语义网络、产生式规则和框架等四种知识表示方法进行了比较。
刘建炜等[14]根据结构层次把决策支持系统(DSS)分为表示应用层、逻辑层、执行层等3个层面,然后在每个层面针对性的构建一些指标来比较和评价各种知识表示方法,最终得到知识表示方法评价的框架体系,该框架的表示应用层主要关注表示是否充分,逻辑层关注的是各方法的推理充分性和软件本身的操作方便性,执行层关注的是计算机可实现性和实现的高效性。然后使用该框架对逻辑、产生式、语义网络、框架、面向对象、XML、本体等7种知识表示方法进行了比较。
知识表示的表示观可以分为认识论、本体论和知识工程论等3个种,对于知识表示方法的评价,也可以从认知层面、本体层面和实现层面等3个层面进行考察,认知层面主要从使用者角度评价知识表示方法的性能,本体层面关注表示方法对知识本身的处理方式,实现层面关注表示方法在计算机中实现时的效能。
在笔者所提出的评价框架中,认知层面有两个比较点:①自然性,知识表示方法应该符合人类思考问题的日常模式,同时又能便于计算机处理。②可理解性,知识表示方法应该易于学习,使用者不需要耗费大量时间就能掌握用法。本体层面有5个比较点:①可表示知识的类型,一般来说,能够表示的知识类型越多越好。②表示粒度。表示粒度是指知识存储和表示空间的规模,知识表示方法应该允许针对不同的问题领域调整表示粒度[13]。③完备性。表示方法应该能够完备地、高效地表示解决问题所需要的知识。④模块性。⑤结构性。实现层面有3个比较点:①实现难易度。②计算效率,表示方法在计算机系统内实现空间和时间的高效性。③推理能力,包括支持多种推理方法,使用不同推理方法所得到的结果要一致。应用该评价框架对几种常用知识表示方法进行评价,评价结果见表1。
表1几种常用知识表示方法的比较
知识表示
方法认知层面本体层面实现层面自然性可理解性可表示
知识类型表示粒度完备性模块性结构性实现
难易度计算效率推理能力逻辑很好很好陈述型一般差很好差容易差差产生式很好很好过程型、
控制型一般一般很好一般容易差一般语义网络很好好陈述型一般一般差很好一般一般〖〗一般框架很好好兼有好好好好一般很好一般面向对象很好好兼有很好好很好很好一般很好好本体很好一般兼有很好很好好好较复杂很好很好
通过表1可以看出,相对于其他方法,本体方法难以学习和理解,实现起来也比较复杂,但是它可表示的知识范围比较广,具备很好的完备性,计算效率和推理能力也比较高。
4关于知识表示研究的几点思考
(1)在当今这个大数据时代,网络上存在海量信息,并且大部分信息是使用面向人的知识表示方法表示的,使用人工把这么多信息转化为用面向机器的知识表示方法表示的知识是不可能实现的。而在传统的知识表示研究中,把面向机器的知识表示与面向人的知识表示研究分隔开来的,重点研究面向机器的知识表示方法。在当今的时代背景下,将来的研究重点会放在两类知识表示方法的自动转换上来,使机器能够处理使用面向人的知识表示方法所表示的知识,知识表示方法的转化由机器内部自动完成。比如一个使用自然文字符号系统表示的事件,通过信息抽取技术自动抽取其中的实体和关系,再填入框架模板的糟中,会形成适合计算机处理的知识模型。
(2)知识表示研究属于多学科交叉的研究领域,牵涉到人工智能、计算机科学、神经生理学、认知科学等多个学科领域,每一次知识表示研究的突破性进展也与这些学科的创新紧密相关,比如:知识表示中面
向对象方法的产生与计算机科学中面向对象程序设计方法的出现有密切关系;本体方法的兴起与语义网的提出紧密相关。
(3)现实中存在的知识类型复杂,单一的知识表示方法显然不能满足需求,多种知识表示方法的混合使用能够解决这一问题[15]。随着学科的发展,将来必定会产生新的性能更好的面向计算机的知识表示方法。但是,知识表示研究的最终目标是不断缩小计算机与人类之间在知识表示和理解上的鸿沟,使计算机也能够使用面向人的知识表示方法,直接理解和使用人类的知识。
参考文献
[1]蒋永福,李景正.论知识组织方法[J].中国图书馆学报,2001,(1):3-7.
[2]王珏,袁小红,石纯一,等.关于知识表示的讨论[J].计算机学报,1995,(3):212-224.
[3]徐宝祥,叶培华.知识表示的方法研究[J].情报科学,2007,(5):690-694.
[4]史忠植,杨至成,方健梅.知识工程[J].计算机学报,1986,(4):241-248.
[5]Dretske F.Knowledge and the flow of information[M].Cambridge:MIT Press,1981.
[6]杨志保,胡久清.论知识表示方法[J].计算机科学,1984,(4):17-24.
[7]敖志刚.人工智能及专家系统[M].北京:机械工业出版社,2010,(7):24-30.
[8]吴泉源,刘江宁.人工智能与专家系统[M].长沙:国防科技大学出版社,1999:56.
[9]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.
[10]BorstW N.Construction of Engineering Ontologies for Knowledge Sharing and Reuse[D].Enschede: University of Twente,1997.
[11]马创新,陈小荷.基于学科本体的训诂学知识组织体系初步构建[J].图书情报工作,2013,57(12):118-122.
[12]Winston p H.Artificial intelligence[M].New York Addison-Wesley,1992.
[13]何绍华,王非.知识表示规范比较研究[J].情报理论与实践,2007,(1):8-10.
[14]刘建炜,燕路峰.知识表示方法比较[J].计算机系统应用,2010,(3):242-246.
[15]马创新,陈小荷,曲维光.经典古籍注疏文献的知识网络研究与设计[J].图书情报工作,2013,57(9):124-128.
(本文责任编辑:马卓)
endprint
用本体来表示知识的主要目的是统一应用领域的概念,实现某种程度的知识共享和重用。本体能够克服不同领域环境中各异的词汇表、方法、表示和工具产生的障碍,通过采用共识的方法来概念化领域,并用某种语言使之清晰,以获得共享理解。由于本体在知识表示方面具有多方面优势,所以它在语义WEB、信息抽取、信息交换和专家系统等领域得到广泛应用[11]。
32知识表示方法的比较与评价
国内外研究者对于知识表示方法的评价标准进行过深入研究,比如:Winston[12]认为好的知识表示规范应具有以下特征:①能清晰提示出重要的知识。②能提示事实之间的自然约束属性。③完备地高效地表示所有需求。④可理解的和可计算的。⑤可压缩的。
何绍华等[13]在前人研究的基础上构建了一个比较和评估各种知识表示方法的框架,该框架有表示充分性、表示属性、支持的推理方法、推理属性共4个维度,然后使用该框架对逻辑、语义网络、产生式规则和框架等四种知识表示方法进行了比较。
刘建炜等[14]根据结构层次把决策支持系统(DSS)分为表示应用层、逻辑层、执行层等3个层面,然后在每个层面针对性的构建一些指标来比较和评价各种知识表示方法,最终得到知识表示方法评价的框架体系,该框架的表示应用层主要关注表示是否充分,逻辑层关注的是各方法的推理充分性和软件本身的操作方便性,执行层关注的是计算机可实现性和实现的高效性。然后使用该框架对逻辑、产生式、语义网络、框架、面向对象、XML、本体等7种知识表示方法进行了比较。
知识表示的表示观可以分为认识论、本体论和知识工程论等3个种,对于知识表示方法的评价,也可以从认知层面、本体层面和实现层面等3个层面进行考察,认知层面主要从使用者角度评价知识表示方法的性能,本体层面关注表示方法对知识本身的处理方式,实现层面关注表示方法在计算机中实现时的效能。
在笔者所提出的评价框架中,认知层面有两个比较点:①自然性,知识表示方法应该符合人类思考问题的日常模式,同时又能便于计算机处理。②可理解性,知识表示方法应该易于学习,使用者不需要耗费大量时间就能掌握用法。本体层面有5个比较点:①可表示知识的类型,一般来说,能够表示的知识类型越多越好。②表示粒度。表示粒度是指知识存储和表示空间的规模,知识表示方法应该允许针对不同的问题领域调整表示粒度[13]。③完备性。表示方法应该能够完备地、高效地表示解决问题所需要的知识。④模块性。⑤结构性。实现层面有3个比较点:①实现难易度。②计算效率,表示方法在计算机系统内实现空间和时间的高效性。③推理能力,包括支持多种推理方法,使用不同推理方法所得到的结果要一致。应用该评价框架对几种常用知识表示方法进行评价,评价结果见表1。
表1几种常用知识表示方法的比较
知识表示
方法认知层面本体层面实现层面自然性可理解性可表示
知识类型表示粒度完备性模块性结构性实现
难易度计算效率推理能力逻辑很好很好陈述型一般差很好差容易差差产生式很好很好过程型、
控制型一般一般很好一般容易差一般语义网络很好好陈述型一般一般差很好一般一般〖〗一般框架很好好兼有好好好好一般很好一般面向对象很好好兼有很好好很好很好一般很好好本体很好一般兼有很好很好好好较复杂很好很好
通过表1可以看出,相对于其他方法,本体方法难以学习和理解,实现起来也比较复杂,但是它可表示的知识范围比较广,具备很好的完备性,计算效率和推理能力也比较高。
4关于知识表示研究的几点思考
(1)在当今这个大数据时代,网络上存在海量信息,并且大部分信息是使用面向人的知识表示方法表示的,使用人工把这么多信息转化为用面向机器的知识表示方法表示的知识是不可能实现的。而在传统的知识表示研究中,把面向机器的知识表示与面向人的知识表示研究分隔开来的,重点研究面向机器的知识表示方法。在当今的时代背景下,将来的研究重点会放在两类知识表示方法的自动转换上来,使机器能够处理使用面向人的知识表示方法所表示的知识,知识表示方法的转化由机器内部自动完成。比如一个使用自然文字符号系统表示的事件,通过信息抽取技术自动抽取其中的实体和关系,再填入框架模板的糟中,会形成适合计算机处理的知识模型。
(2)知识表示研究属于多学科交叉的研究领域,牵涉到人工智能、计算机科学、神经生理学、认知科学等多个学科领域,每一次知识表示研究的突破性进展也与这些学科的创新紧密相关,比如:知识表示中面
向对象方法的产生与计算机科学中面向对象程序设计方法的出现有密切关系;本体方法的兴起与语义网的提出紧密相关。
(3)现实中存在的知识类型复杂,单一的知识表示方法显然不能满足需求,多种知识表示方法的混合使用能够解决这一问题[15]。随着学科的发展,将来必定会产生新的性能更好的面向计算机的知识表示方法。但是,知识表示研究的最终目标是不断缩小计算机与人类之间在知识表示和理解上的鸿沟,使计算机也能够使用面向人的知识表示方法,直接理解和使用人类的知识。
参考文献
[1]蒋永福,李景正.论知识组织方法[J].中国图书馆学报,2001,(1):3-7.
[2]王珏,袁小红,石纯一,等.关于知识表示的讨论[J].计算机学报,1995,(3):212-224.
[3]徐宝祥,叶培华.知识表示的方法研究[J].情报科学,2007,(5):690-694.
[4]史忠植,杨至成,方健梅.知识工程[J].计算机学报,1986,(4):241-248.
[5]Dretske F.Knowledge and the flow of information[M].Cambridge:MIT Press,1981.
[6]杨志保,胡久清.论知识表示方法[J].计算机科学,1984,(4):17-24.
[7]敖志刚.人工智能及专家系统[M].北京:机械工业出版社,2010,(7):24-30.
[8]吴泉源,刘江宁.人工智能与专家系统[M].长沙:国防科技大学出版社,1999:56.
[9]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.
[10]BorstW N.Construction of Engineering Ontologies for Knowledge Sharing and Reuse[D].Enschede: University of Twente,1997.
[11]马创新,陈小荷.基于学科本体的训诂学知识组织体系初步构建[J].图书情报工作,2013,57(12):118-122.
[12]Winston p H.Artificial intelligence[M].New York Addison-Wesley,1992.
[13]何绍华,王非.知识表示规范比较研究[J].情报理论与实践,2007,(1):8-10.
[14]刘建炜,燕路峰.知识表示方法比较[J].计算机系统应用,2010,(3):242-246.
[15]马创新,陈小荷,曲维光.经典古籍注疏文献的知识网络研究与设计[J].图书情报工作,2013,57(9):124-128.
(本文责任编辑:马卓)
endprint
用本体来表示知识的主要目的是统一应用领域的概念,实现某种程度的知识共享和重用。本体能够克服不同领域环境中各异的词汇表、方法、表示和工具产生的障碍,通过采用共识的方法来概念化领域,并用某种语言使之清晰,以获得共享理解。由于本体在知识表示方面具有多方面优势,所以它在语义WEB、信息抽取、信息交换和专家系统等领域得到广泛应用[11]。
32知识表示方法的比较与评价
国内外研究者对于知识表示方法的评价标准进行过深入研究,比如:Winston[12]认为好的知识表示规范应具有以下特征:①能清晰提示出重要的知识。②能提示事实之间的自然约束属性。③完备地高效地表示所有需求。④可理解的和可计算的。⑤可压缩的。
何绍华等[13]在前人研究的基础上构建了一个比较和评估各种知识表示方法的框架,该框架有表示充分性、表示属性、支持的推理方法、推理属性共4个维度,然后使用该框架对逻辑、语义网络、产生式规则和框架等四种知识表示方法进行了比较。
刘建炜等[14]根据结构层次把决策支持系统(DSS)分为表示应用层、逻辑层、执行层等3个层面,然后在每个层面针对性的构建一些指标来比较和评价各种知识表示方法,最终得到知识表示方法评价的框架体系,该框架的表示应用层主要关注表示是否充分,逻辑层关注的是各方法的推理充分性和软件本身的操作方便性,执行层关注的是计算机可实现性和实现的高效性。然后使用该框架对逻辑、产生式、语义网络、框架、面向对象、XML、本体等7种知识表示方法进行了比较。
知识表示的表示观可以分为认识论、本体论和知识工程论等3个种,对于知识表示方法的评价,也可以从认知层面、本体层面和实现层面等3个层面进行考察,认知层面主要从使用者角度评价知识表示方法的性能,本体层面关注表示方法对知识本身的处理方式,实现层面关注表示方法在计算机中实现时的效能。
在笔者所提出的评价框架中,认知层面有两个比较点:①自然性,知识表示方法应该符合人类思考问题的日常模式,同时又能便于计算机处理。②可理解性,知识表示方法应该易于学习,使用者不需要耗费大量时间就能掌握用法。本体层面有5个比较点:①可表示知识的类型,一般来说,能够表示的知识类型越多越好。②表示粒度。表示粒度是指知识存储和表示空间的规模,知识表示方法应该允许针对不同的问题领域调整表示粒度[13]。③完备性。表示方法应该能够完备地、高效地表示解决问题所需要的知识。④模块性。⑤结构性。实现层面有3个比较点:①实现难易度。②计算效率,表示方法在计算机系统内实现空间和时间的高效性。③推理能力,包括支持多种推理方法,使用不同推理方法所得到的结果要一致。应用该评价框架对几种常用知识表示方法进行评价,评价结果见表1。
表1几种常用知识表示方法的比较
知识表示
方法认知层面本体层面实现层面自然性可理解性可表示
知识类型表示粒度完备性模块性结构性实现
难易度计算效率推理能力逻辑很好很好陈述型一般差很好差容易差差产生式很好很好过程型、
控制型一般一般很好一般容易差一般语义网络很好好陈述型一般一般差很好一般一般〖〗一般框架很好好兼有好好好好一般很好一般面向对象很好好兼有很好好很好很好一般很好好本体很好一般兼有很好很好好好较复杂很好很好
通过表1可以看出,相对于其他方法,本体方法难以学习和理解,实现起来也比较复杂,但是它可表示的知识范围比较广,具备很好的完备性,计算效率和推理能力也比较高。
4关于知识表示研究的几点思考
(1)在当今这个大数据时代,网络上存在海量信息,并且大部分信息是使用面向人的知识表示方法表示的,使用人工把这么多信息转化为用面向机器的知识表示方法表示的知识是不可能实现的。而在传统的知识表示研究中,把面向机器的知识表示与面向人的知识表示研究分隔开来的,重点研究面向机器的知识表示方法。在当今的时代背景下,将来的研究重点会放在两类知识表示方法的自动转换上来,使机器能够处理使用面向人的知识表示方法所表示的知识,知识表示方法的转化由机器内部自动完成。比如一个使用自然文字符号系统表示的事件,通过信息抽取技术自动抽取其中的实体和关系,再填入框架模板的糟中,会形成适合计算机处理的知识模型。
(2)知识表示研究属于多学科交叉的研究领域,牵涉到人工智能、计算机科学、神经生理学、认知科学等多个学科领域,每一次知识表示研究的突破性进展也与这些学科的创新紧密相关,比如:知识表示中面
向对象方法的产生与计算机科学中面向对象程序设计方法的出现有密切关系;本体方法的兴起与语义网的提出紧密相关。
(3)现实中存在的知识类型复杂,单一的知识表示方法显然不能满足需求,多种知识表示方法的混合使用能够解决这一问题[15]。随着学科的发展,将来必定会产生新的性能更好的面向计算机的知识表示方法。但是,知识表示研究的最终目标是不断缩小计算机与人类之间在知识表示和理解上的鸿沟,使计算机也能够使用面向人的知识表示方法,直接理解和使用人类的知识。
参考文献
[1]蒋永福,李景正.论知识组织方法[J].中国图书馆学报,2001,(1):3-7.
[2]王珏,袁小红,石纯一,等.关于知识表示的讨论[J].计算机学报,1995,(3):212-224.
[3]徐宝祥,叶培华.知识表示的方法研究[J].情报科学,2007,(5):690-694.
[4]史忠植,杨至成,方健梅.知识工程[J].计算机学报,1986,(4):241-248.
[5]Dretske F.Knowledge and the flow of information[M].Cambridge:MIT Press,1981.
[6]杨志保,胡久清.论知识表示方法[J].计算机科学,1984,(4):17-24.
[7]敖志刚.人工智能及专家系统[M].北京:机械工业出版社,2010,(7):24-30.
[8]吴泉源,刘江宁.人工智能与专家系统[M].长沙:国防科技大学出版社,1999:56.
[9]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.
[10]BorstW N.Construction of Engineering Ontologies for Knowledge Sharing and Reuse[D].Enschede: University of Twente,1997.
[11]马创新,陈小荷.基于学科本体的训诂学知识组织体系初步构建[J].图书情报工作,2013,57(12):118-122.
[12]Winston p H.Artificial intelligence[M].New York Addison-Wesley,1992.
[13]何绍华,王非.知识表示规范比较研究[J].情报理论与实践,2007,(1):8-10.
[14]刘建炜,燕路峰.知识表示方法比较[J].计算机系统应用,2010,(3):242-246.
[15]马创新,陈小荷,曲维光.经典古籍注疏文献的知识网络研究与设计[J].图书情报工作,2013,57(9):124-128.
(本文责任编辑:马卓)
endprint