APP下载

基于XML面向集成的知识管理系统平台

2009-07-13邱志军

现代情报 2009年4期
关键词:知识管理

邱志军 邓 勇

〔摘 要〕传统的知识管理工具、系统往往只侧重知识管理的某一个方面,难以形成一个集成化的整体知识解决方案。本文提出了一种新的基于XML的面向集成的知识管理系统,该系统能够通过集成现有的各种知识管理工具构建符合实际需求的知识管理平台。通过XML相关技术将知识的获取、存储、交流、展示等集成到一个统一的体系当中,同时在知识管理的各个环节提供相应的XML文档接口用于集成现有的知识管理工具。

〔关键词〕知识管理;知识管理系统;XML;面向集成

〔中图分类号〕G35 〔文献标识码〕B 〔文章编号〕1008-0821(2009)04-0210-04

XML-based Integrating-Oriented Knowledge Management System PlatformQiu Zhijun1,2Deng Yong2

(1.Graduate School of the Chinese Academy of Sciences,Beijing 100049,China;

2.Chengdu Branch,National Science Library of Chinese Academy of Sciences,Beijing 100049,China)

〔Abstract〕Traditional knowledge management tools and system often only focus on one special aspect,so it餾 difficult to integrate them into a whole knowledge solution.This paper proposes the concept of XML-based integrating-oriented knowledge management system.This system can integrate kinds of existing knowledge management tools to construct knowledge management platform on demand.Thanks to XML relative skills,it餾 possible to integrate knowledge acquisition,storage,communication,and display into a union architecture.

〔Key words〕knowledge management;XML;Integrating-Oriented

1 知识管理系统

知识管理是通过一组问答序列,即解决方案的集合寻找和识别与问题有关的关键性信息,并将这些信息进行提取,形成对某一问题的专门知识,作为决策的依据。知识库是企业知识管理系统的核心,它按照一定的知识表示方法,如基于规则的知识表示、基于逻辑的知识表示、基于语意网络的知识表示等,集中存放关于企业内部各专业领域的知识和与企业有关的外部环境的相关知识。

知识库管理系统是管理知识库的一组软件,包括知识发现获取系统、知识储存分类系统和知识创新利用系统,主要实现企业知识的获取、储存、分类、搜索等功能。知识可分为外显知识和内隐知识。在知识库管理系统中,企业的外显知识主要来源于业务数据仓库,是由企业信息管理系统收集、传递、储存、加工、维护和使用的数据或文件等信息,也有部分来源于知识专家的总结、归纳及知识管理人员由知识互动系统中的提取。企业的内隐知识则主要来源于知识互动系统。

对于知识管理系统(KMS)目前还没有统一的定义,学者各自基于其对知识管理的认识提出了一系列的不同观点,大体上可以分为两种观点:(1)技术与工具观,(2)系统观。技术与工具观认为KMS是实现知识管理的工具、知识管理技术或知识管理系统软件,或上述几项的集合,也可以称之为狭义的知识管理系统观。系统观将系统的观点引入知识管理的研究中,认为KMS不仅仅是工具、技术和软件等的集合,而是将知识管理的几个要素如:技术、企业文化、人和知识运动的过程等集成考虑的综合系统,也可称之为广义的知识管理系统观。

2 XML和XML Schema

XML(eXtensible Markup Language)意为可扩展标记语言,它包含了一组定义语义标记的规则,可以定义特定领域内标记语言的语法结构。作为元标记语言,XML允许开发者生成自己需要的标记,这就使得标记的含义可以很灵活,可以满足不同开发者的需求。XML Schema则是W3C XML模式工作组创建的模式语言,是当前创建特定领域内标记的两种主要方式之一。

Schema与XML是紧耦合的,用于协作完成具有一定语义表示能力的结构化的XML文档,二者之间的关系如图1所示。图中,XML规范定义了用于描述标记语言必须遵循的元语法结构,它描述的是底层语法结构的规则。如何区分标记和内容,如何将属性附加到元素上之类的规则,而不是描述这些标记、元素和属性是什么或者它们的含义是什么。Schema规范则主要用于描述XML文档中的标记、元素和属性是什么,或者它们的含义是什么以及必须遵循什么样的约束等,即用Schema模式语言描写的模式文档(一个模式文档即定义了特定领域的一种具体标记语言,又可称为词汇表或XML应用)定义了可用在XML文档中的元素、属性、实体和标记的表示方法,以及这些内容之间可能的相互关系,它描述的是一种语义结构。同时,书写模式文档本身的元语法结构遵循的是XML规范,即模式文档本身也是一个XML文档,只是该XML文档所用的标记是由Schema模式规范定义的而已。

3 基于XML的面向集成知识管理框架

3.1 国内外研究

国内学者李克胐在2001年提出了一种基于XML的知识管理系统模型。该模型由智能代理、多文档转化接口、内容管理、知识发布与共享工作流协同、决策支持、XML与数据库接口、知识管理数据库8部分构成。基于XML的知识管理系统与其他知识管理系统相比,具有如下优势:统一、良好的文档结构;易于统一存储,便于分类管理;采用Web浏览器;通过XML在Web上实现知识发布与共享;具有基于元数据的快速搜索,检索效率高的特点;能较好地实现异构系统的传递;具有技术上的先进性,代表未来的发展方向。由于基于XML知识管理系统的这一系列优点,国内外学者、研究人员对基于XML知识管理系统的研究日益深入。

在国内,比较有代表性的是中国科学院计算技术研究所智能科学实验室研制的知识管理系统KMSphere。KMSphere系统主要采用OWL、RDF、语义网等XML技术作为知识的表达、存储、展现基础,并提供通过本体的相应推理机制,从现有信息、文献中自动挖掘出相关知识的机制,大大简化了知识本体的构建。

在国外,早在2000年初,德国GMD-IPSI(德国国家信息技术研究中心集成出版和信息系统研究所)的研究小组,联合西班牙、法国、奥地利等国的研究机构,开发了XML-KM(IST-12030)系统。图2就是经过了简化的XML-KM(IST-12030)系统结构。可以看出,信息的采集(集成)、知识的发现和抽取、知识的发布,3个层次较为分明地体现在系统中。该结构基本概括了以XML为基础的知识管理系统的主要内容,因此在业界有着一定的影响,在一段时间以来成为研发知识管理系统的重要参考。

最近几年,由于XML技术的发展、成熟,涌现出一批成功的商用XML知识管理系统(主要针对企业用户)。国外的有,加拿大的IXIASOFT公司在北美市场推出的相关知识管理产品,美国IPEDO公司在美国和亚太地区推出的KCP(知识协同平台)产品,国内的产品中,较有代表性的有长沙麓谷数码科技公司的基于 XML的企业协同工作与知识管理平台。图3显示了当前商用XML知识管理系统的基本框架。

这些商用基于XML知识管理系统的特点主要有:(1)异构数据源的集成:通过各种适配器集成各种数据源。(3)知识建模和整理加工:应用在XML数据库基础上的知识建模和知识发现过程,大量应用了XML相关技术、规范。(3)企业级应用的中间件组件库。(4)基于XML的门户系统:一个企业或单位的XML知识管理系统的统一对外窗口就是门户(Portal)系统,门户中集成了各种形式的知识展现形式。本文关注XML知识管理系统对外围应用的集成,为构建可适应性知识管理平台提供保证。

3.2 基于XML面向集成的知识管理系统

知识管理的核心在于知识表示和知识库的创建,通过对当前基于XML知识管理系统的调研,可以发现它们都存在一个集中的知识库和一个统一的知识表示形式。本文创新性的提出构建一个知识管理框架,用以集成现有应用,如Xwiki这样的wiki系统,这样新的系统在获得稳定性的同时能够随知识管理的需求不断扩展。面向集成的知识管理系统只需要关注知识管理的核心功能——知识表示、知识库,并通过提供XML文档形式的集成入口提供外围系统集成。

3.2.1 基于XML的知识表示

在XML中,数据对象使用元素描述,而数据对象的属性可以描述为元素的子元素或元素的属性。XML文档由若干个元素构成,数据间的关系通过父元素与子元素的嵌套形式体现。在基于XML的知识表示过程中,采用XML的DTD来定义一个知识表示方法的语法系统,通过定制XML应用来解释实例化的知识表示文档(图4)。

3.2.2 基于XML数据库的知识库

近两年来,随着XML数据库技术的不断发展和成熟,基于XML的知识管理系统的研发和推广日益深入。知识管理中初始文档大多是半结构化和非结构化的文档,例如Word格式、E-mail、Web页等,而对于半结构化的知识表示,XML是一种很好的描述语言。在对知识管理系统中的知识进行表示时,一方面要考虑用户的习惯和差异性,另一方面要考虑到知识源的多样性和对已有系统的利用。而XML技术的诸多特点适用于知识管理系统中知识的表达、集成与传播,为分布、异构的软硬件环境下的知识管理提供了一个全新的思路。在知识利用过程中,通过维护数据字典和XML解析程序把特定标签所标注的内容解析出来,以“标签”+“内容”的格式表示出具体的知识内容。知识表示是构建知识库的关键,知识表示方法选取得合适与否不仅关系到知识库中知识的有效存贮,而且也直接影响着系统的知识推理效率和对新知识的获取能力,图5中给出了基于XML的知识库的创建过程。

3.2.3 基于XML的知识集成

在对知识管理系统中的知识进行表示时,一方面要考虑用户的习惯和差异性,另一方面要考虑到知识源的多样性和对已有系统的利用。而XML技术的诸多特点适用于知识管理系统中知识的表达、集成与传播,为分布、异构的软硬件环境下的知识管理提供了一个全新的思路。因此,一个面形集成的知识管理系统的核心在于建立一个统一的基于XML的知识表示,和通过各种适配器将各种来源的数据统一转化成特定模式并构建出一个中央知识库。图6给出了基于XML的知识集成过程:

3.3 系统总体架构方案

在解决了底层的知识表示、和知识库的构建问题后,本论文提出一个更高层的系统总体架构形式。如图7所示,新的系统架构将主要包括以下4个模块:

(1)知识集成模块设计

(2)知识存储(知识库)模块设计

(3)知识表示模块设计

(4)上层应用基础接口API

在集成层我们采用了灵活的注册数据源提供模式,只要针对特定的数据源格式做相应的适配即可实现知识的有效集成,同时由于遵循一致的知识表示形式,使得知识的利用也极为方便。

4 在面向集成知识管理系统中集成常见的Web2.0工具范例Web2.0是涵盖Blog(博客,包含声音、文字、图像、视频、让个人成为主体)、Wiki(维基)、RSS(简易聚合)、Tag(分类分众标签)、Social Bookmark(网摘)、SNS(社会性网络系统)等应用元素以及XML-RPC、Web Service、开放式APIs(开放式应用程序接口)、Folksonomy等技术范式,围绕用户参与、共享与协同而实现的新一代互联网模式。本论文选取开源wiki系统Xwiki为集成研究示例。

Wiki指一种超文本系统。这种超文本系统支持面向社群的协作式写作,同时也包括一组支持这种写作的辅助工具。我们可以在Web的基础上对Wiki文本进行浏览、创建、更改,而且创建、更改、发布的代价远比HTML文本要小;同时Wiki系统还支持面向社群的协作式写作,为协作式写作提供必要帮助;最后,Wiki的写作者自然构成了一个社群,Wiki系统为这个社群提供简单的交流工具。与其它超文本系统相比,Wiki有使用方便及开放的特点,所以Wiki系统可以帮助我们在一个社群内共享某领域的知识。XWiki是一个强大的Java开源的Wiki引擎。它支持一些受欢迎的特性如:(1)内容管理;(2)版本控制;(3)全文本搜索;(4)RSS输出与显示外部的RSS feeds;(5)提供XML/RPC的API;(6)WYSIWYG HTML编辑器等。

由于Xwiki提供RSS输出功能,因此我们可以很容易的将Xwiki集成到我们的知识管理系统中。如图8所示,通过构建适当的XSLT转换程序我们就能将采集到的RSS装换成系统内部的基于特定XML Schema的知识表示形式,然后存储到XML知识库实现Xwiki数据源的集成。

5 结 语

本论文通过基于XML的知识表示的核心概念,实现了一个知识管理的基础平台,该平台仅关注知识管理中最核心的知识表示和知识存储功能。通过给该平台提供一个统一的数据源适配集成层,实现平台同各种外围数据源的有效集成。最后本文给出了一个集成Xwiki系统的集成范例。面向集成使得我们能够从特定领域的细节中解脱出来,为构建一个通用的知识管理框架提供了基础。同时,由于框

架本身的抽象性,系统获得了更大的适应性,能够适应各种特殊的复杂应用环境。

参考文献

[1]邱均平,段宇锋.论知识管理与信息管理[J].中国图书馆学报,1999,(6):12-18.

[2]王珏,袁小红,等.关于知识表示的讨论[J].计算机学报,1995,18(3):212-224.

[3]吴胜,刘玉.基于XML知识管理的研究[J].福建电脑,2003,(11):9-11.

[4]鲍军鹏,等.基于XML的知识融合与知识库组织[J].计算机工程,2003,29(3):56-57.

[5]鄢珞青.知识库的知识表达方式探讨[J].情报杂志,2003,(4):63-64.

猜你喜欢

知识管理
基于知识管理的高校图书馆管理创新
提升企业知识管理能力 增强企业的强劲发展态势