语义网的体系结构与服务功能
2010-12-31权赟
权赟
(西安欧亚学院信息工程学院,陕西 西安 710065)
1 前言
现今的国际互联网是一个有利于人们相互交流、合作的强大工具。它以HTML的页面方式向人们提供了大量的信息,人们可以很容易理解网页上的信息。但是由于这种易于人类理解、交流的设计目的,也就造成了网页上的内容设计成为专供人类浏览的,而不是供计算机理解和处理的工具。所以,国际互联网应该不单单只是使人类来理解,而且应该让机器来理解网页上的内容。为了满足这种要求,使计算机按照可靠的方法来处理网页中的语义,智能地理解网页内容和进行操作,人们就开始研究和开发新一代的国际互联网--语义网。语义网是一个由大量计算机可以理解的数据所构成的一个分布式的体系结构,在这个体系结构中,数据之间的关系按照特定的术语表达,计算机能够通过这些术语得到数据的含义,同时这些术语之间又形成一种复杂的网络联系,计算机在数据含义的基础上利用这种联系应用逻辑来进行推理,从而实现机器对信息的智能自动处理,解决像现在的网页功能单调、搜索引擎智能化程度低等问题。从功能上看,语义网是一个能够理解人类信息的智能网络。
2 语义网的基本概念
万维网创始人Tim.Berner-Lee对语义网做了如下的描述:语义网不是一个孤立的,全新的万维网,而是对当前的国际互联网的扩展,语义网上的信息具有良好的含义,使计算机之间以及人类能够彼此合作。根据上面的描述,我们可以给语义网做出如下定义:计算机可以理解信息含义的下一代万维网,称之为语义网。
语义网中的信息和知识要求是从众多的提供者以多种多样的方式来提供,而且这些知识和信息能够被各种应用或Web服务实现共同理解,并且按照一定的逻辑规则进行处理。所以语义网上的信息和知识要有创建上的分散性,同时又要有应用上的通用性。
3 语义网的体系结构
互联网的创始人Tim.Berners-Lee在2000年提出了语义网的体系结构。下面我们对这个结构从底层到高层,逐层简单介绍每个部分的概念和功能。
在其体系结构中,第一层是Unicode和URI,它是整个语义网的基础,Unicode(统一编码)处理资源的编码,URI(统一资源定位器)负责标识资源;第二层是XML+名空间+XML模式,用于表示数据的内容和结构;第三层是RDF+RDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。第二、三、四层是语义Web的关键层,用于表示网络信息的语义,也是现在语义网研究的热点所在。因为两个系统可能采用不同的标识符表示同一概念,也可能用一个标识符表示不同的含义,程序若要在两个数据库之间进行信息的比较和合并,就必须了解某些标识符表示的是否是同一事物。对这个问题的一个解决方法就是本体论(Ontology)。本体是概念化的显式说明,它是对现实世界事物的抽象建模,包括分类和一套推理规则。分类定义对象的类别及其之间的关系,使我们能够表达实体之间的大量关系,而根据推理规则,程序可以进行自动推理。简单地说,就是在不同的系统间定义一本字典或者度量表,使它们对实体及其之间的关系达成共识,以便交流和共享。
4 语义网能带给我们的新服务
现今的互联网上充斥着海量信息,传统的HTML表示信息的方法使得信息搜索面临种种困境。现在的搜索引擎大多采用关键字搜索方法,耗时而且不准确,垃圾信息太多。语义网能带给我们全新的搜索方法,能帮助我们高效地找到所需要地准确信息。在企业内部信息处理中,我们可以利用基于Ontology的学习系统将企业的内部信息转化成为一个庞大的,分类别的,有规则的知识库。这样我们就能使企业积累的这些信息服务于企业的日常运作,消除知识壁垒和知识盲区,提高员工的个人素质,从而达到提升整个企业的运行效率。在今后的互联网服务中,用户关心的是服务的具体结果和服务质量,而不是具体的服务过程。通过将语义网和Web Service结合起来,可以使得Web Service被机器理解,从而自动执行,对用户透明。同时这种服务能被Agent自动处理,实现Web Service之间的自动交互。
总的来说,有了大量富含语义信息的网页,就好像有了一个巨大的全球互联的数据库。有了语义信息的帮助,人们开发出的软件代理A-gent程序的智能和自动化将大大提高,它们从不同的资源中收集网页内容,搜索和处理信息并和其他程序交换信息,真正发挥语义网的力量。当出现更多的机器、可处理的网页内容和服务(包括更多的代理)时,通过代理之间的信息交换和协同工作,信息处理的效率将呈指数级增长,能更好地满足用户的需求。
[1]http://www.xml.com/pub/a/98/10/guide0.html
[2]http://www.w3.org/TR/2000/REC-xml-20001006
[3]Grigoris Antoniou and Frank van Harmelen《A Semantic Web Primer》
[4]http://www.chinakm.com